Студопедия

КАТЕГОРИИ:


Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748)

Теоретичні відомості та практичні вказівки




Мета

Факторний аналіз

Комп`ютерний практикум

Ознайомитися і опанувати методику проведення факторного аналізу за допомогою системи STATISTICA з використанням модулю “Факторний аналіз”.

Головними цілями факторного аналізу є скорочення числа змінних (редукція даних) та визначення структури взаємозв'язків між змінними, тобто класифікація змінних.

Тому факторний аналіз використовується або як метод скорочення даних або як метод класифікації.

Приклад для виконання заснований на вигаданих даних, що відносяться до вивчення задоволеності життям. Припустимо, що опитування було направлене 100 випадково вибраним дорослим. Опитування містило 10 пунктів, призначених для визначення задоволеності на роботі, задоволеності своїм хобі, задоволеності домашнім життям і загальної задоволеністю в інших сферах життя. Відповіді на питання були введені в комп'ютер і промасштабовані таким чином, щоб середнє для всіх пунктів стало рівним приблизно 100.

Для виконання завдання знадобиться файл Factor.sta. Відкрити цей файл можна за допомогою опції Файл - Відкрити; Нижче наводиться роздруківка змінних цього файлу

Мета аналізу. Метою аналізу є вивчення співвідношень між задоволеністю в різних сферах діяльності. Зокрема, бажано вивчити питання про кількість факторів, "ховаються" за різними областями діяльності та їх значимість.

Вибір аналізу. Виберіть Факторний аналіз у меню Аналіз - Багатомірний розвідувальний аналіз для відображення стартовою панелі модуля Факторний аналіз. Натисніть на кнопку Змінні на стартовій панелі (див. нижче) і виберіть всі 10 змінних в цьому файлі.

Інші функції. Для виконання стандартного факторного аналізу в цьому діалоговому вікні є все необхідне. Для отримання короткого огляду інших команд, доступних з стартовою панелі, ви можете вибрати в якості вхідного файлу кореляційну матрицю (використовуючи поле Файл даних). В поле Видалення ПД ви можете вибрати порядкове або попарне виключення або підстановка середнього для пропущених даних.

 

Задайте метод виділення факторів. Натиснемо тепер кнопку OK, щоб перейти до наступного діалогового вікна з назвою Задайте метод виділення факторів. За допомогою цього вікна діалогу ви зможете переглянути описові статистики, виконати множинний регресійний аналіз, вибрати метод виділення факторів, вибрати максимальне число факторів, мінімальні власні значення, а також інші дії, пов'язані з специфіці методів виділення факторів. А тепер перейдемо у вкладку Описові.

 

Перегляд описових статистик. Тепер натисніть на кнопку Переглянути кор. / Середні / ст.откл. в цьому вікні для того, щоб відкрити вікно Перегляд описових статистик.

Тепер ви можете розглянути описові статистики графічно або за допомогою таблиць результатів.

 

 

Обчислення кореляційної матриці. Натисніть на кнопку Кореляції у вкладці Додатково для того, щоб відобразити таблицю результатів з кореляціями.

Всі кореляції в цій таблиці результатів позитивні, а деякі кореляції мають значну величину. Наприклад, змінні Hobby_1 і Miscel_1 коррелірованни на рівні 0.90. Деякі кореляції (наприклад, кореляції між задоволеністю на роботі і задоволеністю будинку) здаються порівняно малими. Це виглядає так, наче матриця має деяку виразну структуру.

 

Метод виділення. Тепер натиснемо кнопку Скасування в діалоговому вікні Перегляд описових статистик для того, щоб повернутися в діалогове вікно Задайте метод виділення факторів. Ви можете зробити вибір з декількох методів виділення у вкладці Додатково (див. вкладку Додатково діалогового вікна Задайте метод виділення факторів для опису кожного методу, а також Вступний огляд з описом методу Головних компонент і методу Головних чинників). У цьому прикладі за умовчанням приймається метод Головних компонент, поле Макс. число чинників містить значення 10 (максимальне число факторів у цьому прикладі) і поле Мін. прив. значення містить 0 (мінімальне значення для цієї команди).

Теорія. Аналіз головних компонент приклад, в якому дві корельовані змінні об'єднані в один фактор, показує головну ідею факторного аналізу або, більш точно, аналізу головних компонент. Якщо приклад з двома змінними поширити на більше число змінних, то обчислення стають складніше, однак основний принцип представлення двох або більше залежних змінних одним фактором залишається в силі.

 

Для продовження аналізу натисніть кнопку OK.

 

 

Ви можете переглянути результати факторного аналізу у вікні діалогу Результати факторного аналізу. Спочатку виберіть вкладку пояснена дисперсія.

Відображення власних значень. натиснемо на кнопку Власні значення, щоб отримати таблицю з власними значеннями, відсотком загальної дисперсії, накопиченими власними значеннями і накопиченими відсотками.

Теорія. При повторних ітераціях ви виділяєте чинники з все меншою і меншою дисперсією. Для простоти викладу вважаємо, що зазвичай робота починається з матриці, в якій дисперсії всіх змінних рівні 1.0. Тому загальна дисперсія дорівнює числу змінних. Наприклад, якщо ви маєте 10 змінних, кожна з яких має дисперсію 1, то найбільша мінливість, яка потенційно може бути виділена, дорівнює 10 раз по 1. Припустимо, що при вивченні ступеня задоволеності життям ви включили 10 пунктів для вимірювання різних аспектів задоволеності домашньої життям і роботою.

Як видно з таблиці, власне значення для першого фактора одно 6.118369; тобто частка дисперсії, пояснена першим чинником дорівнює приблизно 61.2%. Зауважимо, що ці значення випадково опинилися тут легко порівнянними, так як аналізу піддаються 10 змінних, і тому сума всіх власних значень виявляється рівною 10. Другий фактор включає в себе близько 18% дисперсії. Інші фактори містять не більше 5% загальної дісперсіі.

Теорія. Вибор числа факторів. Як тільки отримано інформацію про те, скільки дисперсії виділив кожен фактор, ви можете повернутися до питання про те, скільки чинників слід залишити.

Критерій Кайзера: Спочатку ви можете відібрати тільки фактори, з власними значеннями, більшими 1. По суті, це означає, що якщо фактор не виділяє дисперсію, еквівалентну, принаймні, дисперсії однієї змінної, то він опускається. Цей критерій, ймовірно, найбільш широко використовуваним.

Критерій кам'янистій осипи: Критерій кам'янистій осипи є графічним методом. Ви можете зобразити власні значення, представлені в таблиці раніше, у вигляді простого графіка. Кеттела запропонував знайти таке місце на графіку, де спадання власних значень зліва направо максимально уповільнюється. Передбачається, що праворуч від цієї точки знаходиться лише "факторіальна осип" - "осип" є геологічним терміном, що позначає уламки гірських порід, що скупчуються в нижній частині скелястого схилу.

Відповідно до критерію Кайзера, ви повинні залишити чинники з власними значеннями великими 1. З наведеної вище таблиці випливає, що критерій призводить до вибору двох факторів.

Критерій кам'янистій осипи. Тепер натисніть на кнопку Графік кам'янистій осипи, щоб отримати графік власних значень з метою застосування критерію осипи Кеттела (Cattell, 1966). Графік, представлений нижче, був доповнений відрізками, що з'єднують сусідні власні значення, щоб зробити критерій більш наочним. Кеттела (Cattell) стверджує, грунтуючись на методі Монте-Карло, що точка, де безперервне падіння власних значень сповільнюється і після якої рівень інших власних значень відображає тільки випадковий "шум". На графіку, наведеному нижче, ця точка може відповідати фактору 2 або 3 (як показано стрілками). Тому випробуйте обидва рішення і подивіться, яке з них дає більш адекватну картину.

Тепер розглянемо факторні навантаження.

Факторні навантаження. Факторні навантаження можна інтерпретувати як кореляції між факторами і змінними. Тому вони представляють найбільш важливу інформацію, на якій грунтується інтерпретація факторів. Спочатку подивимося на (неповернутие) факторні навантаження для всіх десяти факторів. У вкладці Навантаження діалогового вікна Результати факторного аналізу в поле Обертання факторів задамо значення без обертання і натиснемо на кнопку Факторні навантаження для відображення таблиці навантажень.

Теорія. Обертання факторної структури. Ви можете зобразити факторні навантаження у вигляді діаграми розсіювання. На цій діаграмі кожна мінлива представлена крапкою. Можна повернути осі в будь-якому напрямку без зміни відносного положення точок, а проте дійсні координати точок, тобто факторні навантаження, повинні, без сумніву, змінюватися. Якщо ви побудуєте діаграму для цього прикладу, то побачите, що якщо повернути осі відносно початку координат на 45 градусів, то можна досягти чіткого уявлення про навантаження, що визначають змінні: задоволеність на роботі і вдома.

Методи обертання. Існують різні методи обертання факторів. Метою цих методів є отримання зрозумілою (інтерпретується) матриці навантажень, тобто факторів, які ясно відзначені високими навантаженнями для деяких змінних і низькими - для інших. Цю загальну модель іноді називають простою структурою (більше формальне визначення можна знайти в стандартних підручниках). Типовими методами обертання є стратегії варімакс, квартімакс, і еквімакс.

Згадаймо, що виділення факторів відбувалося таким чином, що наступні фактори включали в себе все меншу і меншу дисперсію. Тому не дивно, що перший фактор має найвищу навантаження. Зазначимо, що знаки факторних навантажень мають значення лише для того, щоб показати, що змінні з протилежними навантаженнями на один і той же фактор взаємодіють з цим фактором протилежним чином. Однак ви можете помножити все навантаження в стовпці на -1 і звернути знаки. У всьому іншому результати виявляться незмінними.

Обертання факторного рішення. Дійсна орієнтація факторів у факторному просторі довільна, і всяке обертання факторів відтворює кореляції так само добре, як і інші обертання. Отже, здається природним повернути фактори таким чином, щоб вибрати найпростішу для інтерпретації факторну структуру. Фактично, термін проста структура був придуманий і визначено Терстоуном (Thurstone, 1947) головним чином для опису умов, коли фактори відзначені високими навантаженнями на деякі змінні і низькими - для інших, а також коли є кілька великих перехресних навантажень, тобто є кілька змінних з суттєвими навантаженнями на більш ніж один фактор. Найбільш стандартними обчислювальними методами обертання для отримання простої структури є метод обертання варімакс, запропонований Кайзером (Kaiser, 1958). Іншими методами, запропонованими Харманом (Harman, 1967), є методи квартімакс, біквартімакс і еквімакс (див. Harman, 1967).

 

 

Вибір обертання. Спочатку розглянемо кількість факторів, яке ви бажаєте залишити для обертання та інтерпретації. Раніше було вирішено, що найбільш правдоподібним і прийнятним числом факторів є два, однак на основі критерію осипи було вирішено враховувати також і рішення з трьома факторами. Натисніть на кнопку Відмінити для того, щоб повернутися у вікно діалогу Задайте метод виділення факторів, і змініть поле Максимальне число факторів у вкладці Швидкий з 10 на 3, потім натисніть кнопку OK для того, щоб продовжити аналіз.

 

 

Тепер виконаємо обертання за методом варімакс. У вкладці Навантаження діалогового вікна Результати факторного аналізу в поле Обертання факторів встановіть значення варімакс вихідних.

Нажмем кнопку Факторные нагрузки для отображения в таблице результатов получаемых факторных нагрузок.

Відображення рішення при обертанні трьох факторів. У таблиці наведені істотні навантаження на перший фактор для всіх змінних, крім відносяться до будинку. Фактор 2 має досить значні навантаження для всіх змінних, крім змінних пов'язаних з задоволеністю на роботі. Фактор 3 має тільки одну значне навантаження для змінної Home_1. Той факт, що на третій фактор надає високу навантаження тільки одна змінна, наводить на думку, а чи не може вийти такий же хороший результат без третього фактора?

 

 

Огляд рішення при обертанні двох факторів. Знову натисніть на кнопку Відмінити у вікні діалогу Результати факторного аналізу для того, щоб повернутися до діалогового вікна Задайте метод виділення факторів. Змініть поле Максимальне число факторів у вкладці Швидкий з 3 до 2 і натисніть кнопку OK для того, щоб перейти в діалогове вікно Результати факторного аналізу. У вкладці Навантаження в поле Обертання факторів встановіть значення варімакс вихідних і натисніть кнопку Факторні навантаження.

Фактор 1, як видно з таблиці, має найвищі навантаження для змінних, що відносяться до задоволеності роботою. Найменші навантаження він має для змінних, що відносяться до задоволеності будинком. Інші навантаження беруть проміжні значення. Фактор 2 має найвищі навантаження для змінних, пов'язаних з задоволеністю будинку, нижчі навантаження - для задоволеності на роботі середні навантаження для інших змінних.

 

Інтерпретація рішення для двухфакторного обертання. Чи можна інтерпретувати цю модель? Все виглядає так, наче два фактори найкраще ідентифікувати як фактор задоволення роботою (фактор 1) і як фактор задоволення домашньої життям (фактор 2). Задоволення своїм хобі і різними іншими аспектами життя здається відносяться до обох факторів. Ця модель передбачає в деякому сенсі, що задоволеність роботою і домашньої життям згідно з цією вибіркою можуть бути незалежними один від одного, але обидва дають вклад в задоволення хобі та іншими сторонами життя.

Діаграма рішення, заснованого на обертанні двох факторів. Для отримання діаграми розсіювання двох факторів натисніть на кнопку 2М графік навантажень у вкладці Навантаження діалогового вікна Результати факторного аналізу. Діаграма, показана нижче, просто показує два навантаження для кожної змінної. Зауважимо, що діаграма розсіювання добре ілюструє два незалежних фактора і 4 змінних (Hobby_1, Hobby_2, Miscel_1, Miscel_2) з перехресними навантаженнями.

Тепер подивимося, наскільки добре може бути відтворена спостерігається коваріаційна матриця по двофакторної рішенням.

 

Відтворена і залишкова кореляційна матриця. Натисніть на кнопку Відтворені і залишкові кореляції у вкладці пояснена дисперсія, для того щоб отримати дві таблиці з відтвореною кореляційної матрицею і матрицею залишкових кореляцій (спостережуваних мінус відтворених кореляцій).

Входи в таблиці залишкових кореляцій можуть бути інтерпретовані як "сума" кореляцій, за які не можуть відповідати два отримані фактора. Звичайно, діагональні елементи матриці містять стандартне відхилення, за яке не можуть бути відповідальні ці чинники і які дорівнюють квадратному кореню з одиниця мінус відповідні спільності для двох факторів (згадаємо, що спільністю змінної є дисперсія, яка може бути пояснена обраним числом факторів). Якщо ви ретельно розглянете цю матрицю, то зможете побачити, що тут фактично немає залишкових кореляцій, великих 0.1 або менші -0.1 (насправді тільки мала кількість з них близько до цієї величини). Додамо до цього, що перші два фактори включають близько 79% загальної дисперсії (див. накопичений% власних значень в таблиці результатів).

 

"Секрет" вдалого прикладу. Приклад, який ви тільки що вивчили, насправді дає рішення двухфакторной завдання, близьке до ідеального. Воно визначає більшу частину дисперсії, має розумну інтерпретацію і відтворює кореляційну матрицю з помірними відхиленнями (залишковими кореляціями). Насправді реальні дані рідко дозволяють отримати таке просте рішення, і насправді це фіктивне безліч даних було отримано за допомогою генератора випадкових чисел з нормальним розподілом, доступного в системі. Спеціальним чином в дані були "введені" два ортогональних (незалежних) фактора, за якими були згенеровані кореляції між змінними. Цей приклад факторного аналізу відтворює два чинники такими, як вони і були, (тобто фактор задоволеності роботою і фактор задоволеності домашньої життям). Таким чином, якби явище (а не штучні, як у прикладі, дані) містило ці два чинники, то ви, виділивши їх, могли б дещо дізнатися про прихованою або латентною структурі явища.

 

Інші результати. Перш, ніж зробити остаточний висновок, дамо короткі коментарі до інших результатів.

 

Спільності. Для отримання спільнот рішення натисніть на кнопку Спільності у вкладці пояснена дисперсія діалогового вікна Результати факторного аналізу. Згадаймо, що спільність змінної - це частка дисперсії, яка може бути відтворена при заданому числі факторів. Обертання факторного простору не впливає на величину спільності. Дуже низькі спільності для однієї або двох змінних (з багатьох в аналізі) можуть вказувати на те, що ці змінні не дуже добре пояснені моделлю.

 

 

Коефіцієнти значень. Коефіцієнти факторів можуть бути використані для обчислення значень факторів для кожного спостереження. Самі коефіцієнти представляє зазвичай малий інтерес, проте факторні значення корисні при проведенні подальшого аналізу. Для відображення коефіцієнтів натисніть кнопку Коефіцієнти значень факторів у вкладці Значення діалогового вікна Результати факторного аналізу.

 

 

Значення факторів. Факторні значення можуть розглядатися як поточні значення для кожного опитуваного респондента (тобто для кожного спостереження вихідної таблиці даних). Кнопка Значення факторів у вкладці Значення діалогового вікна Результати факторного аналізу дозволяє обчислити факторні значення. Ці значення можна зберегти для подальшого натисканням кнопки Зберегти значення.

 

 

Заключний коментар. Факторний аналіз - це непроста процедура. Кожен, хто постійно використовує факторний аналіз з багатьма (наприклад, 50 або більше) змінними, міг бачити безліч прикладів "патологічного поведінки", таких, як: негативні власні значення і не інтерпретуються рішення, особливі матриці і т.д. Якщо ви цікавитеся застосуванням факторного аналізу для визначення або значущих чинників при великому числі змінних, вам слід ретельно вивчити будь детальне керівництво (наприклад, книгу Хармана (Harman, 1968)). Таким чином, так як багато критичних рішення в факторному аналізі за своєю природою суб'єктивні (число факторів, метод обертання, інтерпретація навантажень), будьте готові до того, що потрібно деякий досвід, перш ніж ви відчуєте себе впевненим у ньому. Модуль Факторний аналіз був розроблений спеціально для того, щоб зробити легким для користувача інтерактивне перемикання між різною кількістю чинників, обертаннями і т.д., так щоб випробувати і порівняти різні рішення.




Поделиться с друзьями:


Дата добавления: 2015-05-24; Просмотров: 1283; Нарушение авторских прав?; Мы поможем в написании вашей работы!


Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет



studopedia.su - Студопедия (2013 - 2024) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление




Генерация страницы за: 0.041 сек.