Критерій фішера і приватний критерій фішера для рівняння множинної регресії. Критерій φ* - кутове перетворення Фішера

)

Розрахунок критерію φ*

1. Визначити ті значення ознаки, які будуть критерієм для поділу піддослідних на тих, у кого є ефект і тих, у кого немає ефекту. Якщо ознака вимірюється кількісно, ​​використовувати критерій для пошуку оптимальної точки поділу.

2. Накреслити чотириклітинну (синонім: чотирипольна) таблицю із двох стовпців та двох рядків. Перший стовпець - "є ефект"; другий стовпець - "немає ефекту"; перший рядок зверху – 1 група (вибірка); другий рядок – 2 група (вибірка).

4. Підрахувати кількість піддослідних у першій вибірці, у яких "немає ефекту", і занести це число у праву верхню комірку таблиці. Підрахувати суму по двох верхніх осередках. Вона має збігатися з кількістю випробуваних у першій групі.

6. Підрахувати кількість піддослідних у другій вибірці, у яких "немає ефекту", і занести це число в правий нижній осередок таблиці. Підрахувати суму за двома нижніми осередками. Вона має збігатися з кількістю випробуваних у другій групі (вибірці).

7. Визначити відсоткові частки піддослідних, які мають "ефект", шляхом віднесення їх кількості до загальної кількостівипробуваних у цій групі (вибірці). Записати отримані відсоткові частки відповідно в лівій верхній і лівій нижній комірках таблиці в дужках, щоб не переплутати їх з абсолютними значеннями.

8. Перевірити, чи не дорівнює одна із зіставлюваних відсоткових часток нулю. Якщо це так, спробувати змінити це, зрушивши точку поділу груп у той чи інший бік. Якщо це неможливо або небажано, відмовитись від критерію φ* та використовувати критерій χ2.

9. Визначити за Табл. XII Додатки 1 величини кутів φ для кожної зі зіставних процентних часток.

де: φ1 - кут, що відповідає більшій відсотковій частці;

φ2 - кут, що відповідає меншій процентній частці;

N1 - кількість спостережень у вибірці 1;

N2 - кількість спостережень у вибірці 2.

11. Зіставити отримане значення φ* з критичними значеннями: φ* ≤1,64 (р<0,05) и φ* ≤2,31 (р<0,01).

Якщо φ*емп ≤φ*кр. H0 відкидається.

При необхідності визначити точний рівень значущості отриманого φ*емп Табл. XIII Додатки 1.

Даний метод описаний у багатьох посібниках (Плохінський Н.А., 1970; Гублер Е.В., 1978; Івантер Е.В., Коросов А.В., 1992 та ін.) Цей опис спирається на той варіант методу, який був розроблено та викладено Є.В. Гублером.

Призначення критерію φ*

Критерій Фішера призначений для зіставлення двох вибірок за частотою зустрічальності цікавого дослідника ефекту (показника). Чим він більший, тим вірогідніша різниця.

Опис критерію

Критерій оцінює достовірність відмінностей між тими відсотковими частками двох вибірок, у яких зареєстрований цікавий для нас ефект (показник). Образно кажучи, ми порівнюємо між собою 2 найкращі шматки, вирізані з 2-х пирогів, і вирішуємо, який із них справді більше.

Суть кутового перетворення Фішера полягає у переведенні відсоткових часток у величини центрального кута, що вимірюється в радіанах. Більшій відсотковій частці буде відповідати більший кут ф, а меншій частці - менший кут, але співвідношення тут не лінійні:

де Р – відсоткова частка, виражена у частках одиниці (див. рис. 5.1).

У разі збільшення розбіжності між кутами φ 1 та φ 2 та збільшення чисельності вибірок значення критерію зростає. Чим більша величина φ* , тим ймовірніше, що відмінності достовірні.

Гіпотези

H 0 : Частка осіб, у яких проявляється досліджуваний ефект, вибірці 1 не більше, ніж у вибірці 2.

H 1 : Частка осіб, у яких проявляється досліджуваний ефект, у вибірці 1 більша, ніж у вибірці 2.

Графічне уявлення критерію φ*

Метод кутового перетворення дещо абстрактніший, ніж інші критерії.

Формула, якої дотримується Е. В. Гублер при підрахунку значень φ, передбачає, що 100% становлять кут φ=3,142, тобто округлену величину π=3,14159... Це дозволяє нам уявити зіставляються вибірки у вигляді двох півколів, кожен з яких символізує 100% чисельності своєї вибірки. Відсоткові частки піддослідних з "ефектом" будуть представлені як сектори, утворені центральними кутами. Рис. 5.2 представлені два півкола, що ілюструють Приклад 1. У першій вибірці 60% випробуваних вирішили завдання. Цій відсотковій частці відповідає кут =1,772. У другій вибірці 40% піддослідних вирішили завдання. Цій відсотковій частці відповідає кут =1,369.

Критерій φ* дозволяє визначити, чи справді один із кутів статистично достовірно перевершує інший при даних обсягах вибірок.

Обмеження критерію φ*

1. Жодна з порівнянних часток не повинна дорівнювати нулю. Формально немає перешкод для застосування методу у випадках, коли частка спостережень в одній з вибірок дорівнює 0. Однак у цих випадках результат може виявитися невиправдано завищеним (Гублер Е.В., 1978, с. 86).

2. Верхній межа в критерії відсутня - вибірки можуть бути як завгодно великими.

Нижній межа - 2 спостереження в одній із вибірок. Однак повинні дотримуватися такі співвідношення у кількості двох вибірок:

а) якщо в одній вибірці всього 2 спостереження, то в другій має бути не менше ніж 30:

б) якщо в одній із вибірок всього 3 спостереження, то в другій має бути не менше 7:

в) якщо в одній із вибірок всього 4 спостереження, то в другій має бути не менше 5:

г) заn 1 , n 2 ≥ 5 можливі будь-які зіставлення.

У принципі можливе і зіставлення вибірок, що не відповідають цій умові, наприклад, із співвідношеннямn 1 =2, n 2 = 15, але у випадках не вдасться виявити достовірних відмінностей.

Інших обмежень критерію φ* немає.

Розглянемо кілька прикладів, що ілюструють можливостікритерію φ*.

Приклад 1: зіставлення вибірок за ознакою, що якісно визначається.

Приклад 2: зіставлення вибірок за кількісно вимірюваною ознакою.

Приклад 3: зіставлення вибірок і за рівнем, і розподілом ознаки.

Приклад 4: використання критерію φ* у поєднанні з критеріємX Колмогорова-Смирнова з метою досягнення максимально точного результату.

Приклад 1 - зіставлення вибірок за якісно визначеною ознакою

В даному варіанті використання критерію ми порівнюємо відсоток піддослідних в одній вибірці, що характеризуються якістю, з відсотком піддослідних в іншій вибірці, що характеризуються тією ж якістю.

Припустимо, нас цікавить, чи розрізняються дві групи студентів щодо успішності вирішення нового експериментального завдання. У першій групі з 20 чоловік з нею впоралися 12 осіб, а в другій вибірці з 25 осіб - 10. У першому випадку відсоткова частка вирішили завдання становитиме 12/20 · 100% = 60%, а в другій 10/25 · 100% = 40%. Чи вірно розрізняються ці відсоткові частки при данихn 1 іn 2 ?

Здавалося б, і "на око" можна визначити, що 60% значно вищі за 40%. Однак насправді ці відмінності за данимиn 1 , n 2 недостовірні.

Перевіримо це. Оскільки нас цікавить факт розв'язання задачі, вважатимемо "ефектом" успіх у вирішенні експериментальної задачі, а відсутністю ефекту - невдачу в її розв'язанні.

Сформулюємо гіпотези.

H 0 : Частка осіб,що впоралися із завданням, у першій групі не більше, ніж у другій групі.

H 1 : Частка осіб, що впоралися із завданням, у першій групі більше, ніж у другій групі

Тепер побудуємо так звану чотириклітинну, або чотирипольну таблицю, яка фактично є таблицею емпіричних частот за двома значеннями ознаки: "є ефект" - "немає ефекту".

Таблиця 5.1

Чотириклітинна таблиця для розрахунку критерію при зіставленні двох груп піддослідних по відсотковій частці вирішили завдання.

Групи

"Є ефект": завдання вирішено

"Немає ефекту": завдання не вирішене

Суми

Кількість

випробуваних

% частка

Кількість

випробуваних

% частка

1 група

(60%)

(40%)

2 група

(40%)

(60%)

Суми

У чотириклітинній таблиці, як правило, зверху розмічаються стовпці "Є ефект" і "Немає ефекту", а зліва - рядки "1 група" і "2 група". Беруть участь у зіставленнях, власне, лише поля (комірки) А і В, тобто відсоткові частки по стовпцю "Є ефект".

По Табл.XIIДодатки 1 визначаємо величини φ, що відповідають процентним часткам у кожній із груп.

Тепер підрахуємо емпіричне значення φ* за формулою:

де φ 1 - кут, що відповідає більшій % частці;

φ 2 - кут, що відповідає меншій % частці;

n 1 - кількість спостережень у вибірці 1;

n 2 - кількість спостережень у вибірці 2.

В даному випадку:

По Табл.XIIIДодатки 1 визначаємо, якому рівню значущості відповідає? емп=1,34:

р = 0,09

Можна встановити і критичні значення φ*, що відповідають прийнятим у психології рівням статистичної значимості:

Побудуємо "вісь значущості".

Отримане емпіричне значення φ* знаходиться у зоні незначущості.

Відповідь: H 0 приймається. Частка осіб, що впоралися із завданням,впершій групі не більше, ніж у другій групі.

Можна лише поспівчувати досліднику, який вважає суттєвими відмінності 20% і навіть 10%, не перевіривши їх достовірність за допомогою критерію φ*. У разі, наприклад, достовірними були лише відмінності щонайменше ніж 24,3%.

Схоже, що при зіставленні двох вибірок за якоюсь якісною ознакою критерій може нас швидше засмутити, ніж порадувати. Те, що здавалося суттєвим, зі статистичної точки зору може таким не виявитися.

Набагато більше можливостей порадувати дослідника з'являється у критерію Фішера тоді, коли ми зіставляємо дві вибірки за кількісно виміряними ознаками і можемо варіювати ефект.

Приклад 2 - зіставлення двох вибірок за кількісно вимірюваною ознакою

У даному варіанті використання критерію ми порівнюємо відсоток випробуваних в одній вибірці, які досягають певного рівня значення ознаки, з відсотком випробуваних, які досягають цього рівня в іншій вибірці.

У дослідженні Г. А. Тлегенової (1990) з 70 юнаків - учнів ПТУ у віці від 14 до 16 років було відібрано за результатами обстеження за Фрайбурзьким особистісним опитувальником 10 випробуваних з високим показником за шкалою Агресивності та 11 випробуваних з 11 випробуваних. Необхідно визначити, чи відрізняються групи агресивних та неагресивних юнаків за показником відстані, яку вони спонтанно обирають у розмові з однокурсником. Дані Г. А. Тлегенової представлені в Табл. 5.2. Можна зауважити, що агресивні юнаки частіше обирають відстань у 50см або навіть менше, тоді як неагресивні юнаки частіше вибирають відстань, що перевищує 50 см.

Тепер ми можемо розглядати відстань у 50 см як критичну і вважати, що якщо обрана віддалена відстань менша або дорівнює 50 см, то "ефект є", а якщо обрана відстань більше 50 см, то "ефекту немає". Ми, що у групі агресивних юнаків ефект спостерігається 7 з 10, т. е. в 70% випадків, а групи неагресивних юнаків - в 2 з 11, т. е. в 18,2% випадків. Ці відсоткові частки можна порівняти методом φ* , щоб встановити достовірність відмінностей з-поміж них.

Таблиця 5.2

Показники відстані (в см), що обирається агресивними та неагресивними юнаками у розмові з однокурсником (за даними Г.А. Тлегенової, 1990)

Група 1: юнаки з високими показниками за шкалою агресивностіFPI- R (n 1 =10)

Група 2: юнаки з низькими значеннями за шкалою агресивностіFPI- R (n 2 =11)

d(c м )

% частка

d(c M )

% частка

ефект"

d≤50 см

18,2%

"Ні

ефекту"

d>50см

80 QO

81,8%

Суми

100%

100%

Середні

5б:о

77.3

Сформулюємо гіпотези.

H 0 d 50 см, у групі агресивних юнаків не більше, ніж у групі неагресивних юнаків.

H 1 : Частка осіб, які обирають дистанцію.d50 см, у групі агресивних юнаків більше, ніж у групі неагресивних юнаків. Тепер збудуємо так звану чотириклітинну таблицю.

Таблиця 53

Чотириклітинна таблиця для розрахунку критерію φ* при зіставленні агресивних груп (nf=10) та неагресивних юнаків (п2=11)

Групи

"Є ефект": d≤50

"Немає ефекту". d>50

Суми

Кількість піддослідних

(% Частка)

Кількість піддослідних

(% Частка)

1 група - агресивні юнаки

(70%)

(30%)

2 група – неагресивні юнаки

(180%)

(81,8%)

Сума

По Табл.XIIДодатки 1 визначаємо величини φ, відповідні процентним часткам "ефекту" у кожній із груп.

Отримане емпіричне значення φ* знаходиться у зоні значущості.

Відповідь: H 0 відкидається. ПриймаєтьсяH 1 . Частка осіб, які обирають дистанцію в розмові меншу або рівну 50 см, в групі агресивних юнаків більша, ніж у групі неагресивних юнаків.

На підставі отриманого результату ми можемо зробити висновок, що агресивніші юнаки частіше вибирають відстань менше півметра, тоді як неагресивні юнаки частіше вибирають більшу, ніж півметра, відстань. Ми бачимо, що агресивні юнаки спілкуються фактично на межі інтимної (0-46 см) та особистої зони (від 46 см). Ми пам'ятаємо, однак, що інтимна відстань між партнерами є прерогативою не лише близьких добрих стосунків, а йірукопашного бою (HallE. T., 1959).

Приклад 3 - зіставлення вибірок і за рівнем, і розподілом ознаки.

У цьому варіанті використання критерію ми спочатку можемо перевірити, чи відрізняються групи за рівнем будь-якої ознаки, а потім порівняти розподіл ознаки у двох вибірках. Таке завдання може бути актуальним при аналізі відмінностей у діапазонах або формі розподілу оцінок, які отримують випробувані за якоюсь новою методикою.

У дослідженні Р. Т. Чиркіна (1995) вперше використовувався опитувальник, спрямований на виявлення тенденції до витіснення з пам'яті фактів, імен, намірів та способів дії, зумовленого особистими, сімейними та професійними комплексами. Опитувальник було створено за участю Є. В. Сидоренка на основі матеріалів книги 3. Фрейда "Психопатологія повсякденного життя". Вибірка з 50 студентів Педагогічного інституту, які не перебувають у шлюбі, не мають дітей віком від 17 до 20 років, була обстежена за допомогою даного опитувальника, а також методики Менестера-Кошика для виявлення інтенсивності відчуття власної недостатності,або"комплексу неповноцінності" (ManasterG. J., CorsiniR. J., 1982).

Результати обстеження представлені у Табл. 5.4.

Чи можна стверджувати, що між показником енергії витіснення, що діагностується за допомогою опитувальника, та показниками інтенсивності, відчуття власної недостатності існують якісь значущі співвідношення?

Таблиця 5.4

Показники інтенсивності відчуття власної недостатності у групах студентів із високою (nj=18) та низькою (п2=24) енергією витіснення

Група 1: енергія витіснення від 19 до 31 бала (n 1 =181

Група 2: енергія витіснення від 7 до 13 балів (n 2 =24)

0; 0; 0; 0; 0

20; 20

30; 30; 30; 30; 30; 30; 30

50; 50

60; 60

0; 0

5; 5; 5; 5

10; 10; 10; 10; 10; 10

15; 15

20; 20; 20; 20

30; 30; 30; 30; 30; 30

Суми

Середні

26,11

15,42

Незважаючи на те, що середня величина групи з більш енергійним витісненням вище, в ній спостерігаються також і 5 нульових значень. Якщо порівняти гістограми розподілу оцінок у двох вибірках, між ними виявляється разючий контраст (Рис. 5.3).

Для порівняння двох розподілів ми могли б застосувати критерійχ 2 або критерійλ , але для цього нам довелося б укрупнювати розряди, а крім того, в обох вибіркахn <30.

Критерій φ* дозволить нам перевірити спостерігається на графіку ефект розбіжності двох розподілів, якщо ми умовимося вважати, що "ефект є", якщо показник почуття недостатності набуває або дуже низьких (0), або, навпаки, дуже високих значень (S30), і що "ефекту немає", якщо показник почуття недостатності набуває середніх значень, від 5 до 25.

Сформулюємо гіпотези.

H 0 : Крайні значення показника недостатності (або 0, або 30 і більше) у групі з більш енергійним витісненням зустрічаються не частіше, ніж у групі з менш енергійним витісненням.

H 1 : Крайні значення показника недостатності (або 0, або 30 і більше) у групі з більш енергійним витісненням зустрічаються частіше, ніж у групі з менш енергійним витісненням.

Створимо чотириклітинну таблицю, зручну для подальшого розрахунку критерію *.

Таблиця 5.5

Чотириклітинна таблиця для розрахунку критерію φ*при зіставленні груп з більшою та меншою енергією витіснення за співвідношенням показників недостатності

Групи

"Є ефект": показник недостатності дорівнює 0 або >30

"Немає ефекту": показник недостатності від 5 до 25

Суми

(88,9%)

(11,1%)

(33,3%)

(66,7%)

Суми

По Табл.XIIДодатки 1 визначимо величини ф, відповідні зіставним процентним часткам:

Підрахуємо емпіричне значення φ*:

Критичні значення φ* за будь-якихn 1 , n 2 Як ми пам'ятаємо з попереднього прикладу, складають:

Табл.XIIIДодатки 1 дозволяє нам і точніше визначити рівень значущості отриманого результату: р<0,001.

Відповідь: H 0 відкидається. ПриймаєтьсяH 1 . Крайні значення показника недостатності (або 0, або 30 і більше) у групі з більшою енергією витіснення зустрічаються частіше, ніж у групі з меншою енергією витіснення.

Отже, випробувані з більшою енергією витіснення можуть мати як дуже високі (30 і більше), так і дуже низькі (нульові) показники відчуття власної недостатності. Можна припустити, що вони витісняють і свою незадоволеність, і у життєвому успіху. Ці припущення потребують подальшої перевірки.

Отриманий результат, незалежно від його інтерпретації, підтверджує можливості критерію в оцінці відмінностей у формі розподілу ознаки у двох вибірках.

У початковій вибірці було 50 осіб, але 8 з них було виключено з розгляду як середній бал за показником анергії витіснення (14-15). Показники інтенсивності почуття недостатності вони теж середні: 6 значень по 20 балів і 2 значення по 25 балів.

У сильних здібностях критерію φ* можна переконатися, підтвердивши зовсім іншу гіпотезу при аналізі матеріалів даного прикладу. Ми можемо довести, наприклад, що в групі з більшою енергією витіснення показник недостатності все ж таки вищий, незважаючи на парадоксальність його розподілу в цій групі.

Сформулюємо нові гіпотези.

H 0 Найбільш високі значення показника недостатності (30 і більше) у групі з більшою енергією витіснення зустрічаються не частіше, ніж у групі з меншою енергією витіснення.

H 1 : Найбільш високі значення показника недостатності (30 і більше) у групі з більшою енергією витіснення зустрічаються частіше, ніж у групі з меншою енергією витіснення. Побудуємо чотирипольну таблицю, використовуючи дані Табл. 5.4.

Таблиця 5.6

Чотириклітинна таблиця для розрахунку критерію φ* при зіставленні груп з більшою та меншою енергією витіснення за рівнем показника недостатності

Групи

"Є ефект"* показник недостатності більший або дорівнює 30

"Немає ефекту": показник недостатності менший 30

Суми

1 група - з більшою енергією витіснення

(61,1%)

(38.9%)

2 група – з меншою енергією витіснення

(25.0%)

(75.0%)

Суми

По Табл.XIIIДодатки 1 визначаємо, що це результат відповідає рівню значимості р=0,008.

Відповідь: Але відкидається. ПриймаєтьсяHj: Найбільш високі показники недостатності (30 і більше балів) у групізбільшою енергією витіснення зустрічаються частіше, ніж у групі з меншою енергією витіснення (р=0,008).

Отже, нам вдалося довести і те, щовгрупізбільш енергійним витісненням переважають крайні значення показника недостатності, і те, що більших своїх значень цей показникдосягаєсаме у цій групі.

Тепер ми могли б спробувати довести, що у групі з більшою енергією витіснення частіше трапляються й нижчі значення показника недостатності, незважаючи на те, що середня величинав цій групі більше (26,11 проти 15,42 у групіз меншим витісненням).

Сформулюємо гіпотези.

H 0 : Найнижчі показники недостатності (нульові) у групі.з більшою енергією витіснення зустрічаються не частіше, ніж у групіз меншою енергією витіснення.

H 1 : Найнижчі показники недостатності (нульові) зустрічаються.в групі з більшою енергією витіснення частіше, ніж у групіз менш енергійним витісненням. Згрупуємо дані у нову чотириклітинну таблицю.

Таблиця 5.7

Чотириклітинна таблиця для зіставлення груп з різною енергією витіснення за частотою нульових значень показника недостатності

Групи

"Є ефект": показник недостатності дорівнює 0

"Немає ефекту" недостатності

показник не дорівнює 0

Суми

1 група - з більшою енергією витіснення

(27,8%)

(72,2%)

1 група - з меншою енергією витіснення

(8,3%)

(91,7%)

Суми

Визначаємо величини φ та підраховуємо значення φ*:

Відповідь: H 0 відкидається. Найнижчі показники недостатності (нульові) у групі з більшою енергією витіснення зустрічаються частіше, ніж у групі з меншою енергією витіснення (р<0,05).

У сумі одержані результати можуть розглядатися як свідчення часткового збігу понять комплексу у З.Фрейда та А.Адлера.

Істотно при цьому, що між показником енергії витіснення та показником інтенсивності відчуття власної недостатності загалом за вибіркою отримано позитивний лінійний кореляційний зв'язок (р=+0,491, р<0,01). Как мы можем убедиться, применение критерия φ* позволяет проникнуть в более тонкие и содержательно значимые соотношения между этими двумя показателями.

Приклад 4 - використання критерію φ* у поєднанні з критерієм λ Колмогорова-Смирнова з метою досягнення максимального точногорезультату

Якщо вибірки зіставляються за будь-якими кількісно виміряними показниками, постає проблема виявлення тієї точки розподілу, яка може використовуватися як критична при поділі всіх піддослідних на тих, у кого є ефект і тих, у кого немає ефекту.

У принципі точку, за якою ми розділили б групу на підгрупи, де є ефект і немає ефекту, можна вибрати довільно. Нас може цікавити будь-який ефект і, отже, ми можемо розділити обидві вибірки на дві частини в будь-якій точці, аби це мало якийсь сенс.

Для того, щоб максимально підвищити потужність критерію φ*, потрібно, однак, вибрати точку, в якій відмінності між двома групами, що зіставляються, є найбільшими. Точніше ми зможемо зробити це за допомогою алгоритму розрахунку критеріюλ , що дозволяє виявити точку максимальної розбіжності між двома вибірками.

Можливість поєднання критеріїв φ* таλ описано Є.В. Гублером (1978, с. 85-88). Спробуємо використати цей спосіб у вирішенні наступного завдання.

У спільному дослідженні М.А. Курочкіна, Є.В. Сидоренко та Ю.А. Чуракова (1992) у Великій Британії проводилося опитування англійських загальнопрактикуючих лікарів двох категорій: а) лікарі, які підтримали медичну реформу і вже перетворили свої приймальні на фондотримаючі організації з власним бюджетом; б) лікарі, чиї приймальні, як і раніше, не мають власних фондів і повністю забезпечуються державним бюджетом. Опитувальники були розіслані вибірці з 200 лікарів, репрезентативної стосовно генеральної сукупності англійських лікарів за представленістю осіб різної статі, віку, стажу та місця роботи – у великих містах чи провінції.

Відповіді на опитувальник надіслали 78 лікарів, з них 50 працюючих у приймальнях із фондами та 28 – із приймальних без фондів. Кожен із лікарів мав прогнозувати, якою буде частка прийомних із фондами наступного, 1993 року. На це запитання відповіли лише 70 лікарів із 78, які надіслали відповіді. Розподіл їх прогнозів представлено Табл. 5.8 окремо для групи лікарів із фондами та групи лікарів без фондів.

Чи різняться якимось чином прогнози лікарів із фондами та лікарів без фондів?

Таблиця 5.8

Розподіл прогнозів лікарів, що практикують практику, про те, якою буде частка прийомних з фондами в 1993 році.

Прогнозована частка

приймальних з фондами

лікарями з фондом (n 1 =45)

лікарями без фонду (n 2 =25)

Суми

1. від 0 до 20%

4

5

9

2. від 21 до 40%

15

І

26

3. від 41 до 60%

18

5

23

4. від 61 до 80%

7

4

І

5. від 81 до 100%

1

0

1

Суми

45

25

70

Визначимо точку максимальної розбіжності між двома розподілами відповідей Алгоритму 15 з п. 4.3 (див. табл. 5.9).

Таблиця 5.9

Розрахунок максимальної різниці накопичених частостей у розподілах прогнозів лікарів двох груп

Прогнозована частка приймалень із фондами (%)

Емпіричні частоти вибору цієї категорії відповіді

Емпіричні частоти

Накопичені емпіричні частоти

Різниця (d)

лікарями з фондом(n 1 =45)

лікарями без фонду (n 2 =25)

f* е 1

f* a2

f* е1

f* а1

1. від 0 до 20%

2. від 21 до 40%

3. від 41 до 60%

4. від 61 до 80%

5. від 81 до 100%

4

15

18

7

1

5

11

5

4

0

0,089 0,333 0,400 0,156 0,022

0,200 0,440 0,200 0,160 0

0,089 0,422 0,822 0,978 1,000

0,200

0,640

0,840

1,000

1,000

0111

0,218 0,018 0,022

0

Максимальна виявлена ​​між двома накопиченими емпіричними частостями різниця становить0,218.

Ця різниця виявляється накопиченою у другій категорії прогнозу. Спробуємо використовувати верхню межу цієї категорії як критерій для поділу обох вибірок на підгрупу, де є ефект і підгрупу, де немає ефекту. Вважатимемо, що "ефект є", якщо даний лікар прогнозує від 41 до 100% прийомних з фондами в1993 року, і що "ефекту немає", якщо даний лікар прогнозує від 0 до 40% приймалень з фондами1993 року. Ми об'єднуємо категорії прогнозу 1 та 2, з одного боку, та категорії прогнозу 3, 4 та 5, з іншого. Отриманий розподіл прогнозів подано в Табл. 5.10.

Таблиця 5.10

Розподіл прогнозів у лікарів з фондами та лікарів без фондів

Прогнозована частка приймалень із фондами(%1

Емпіричні частоти вибору цієї категорії прогнозу

Суми

лікарями з фондом(n 1 =45)

лікарями без фонду(n 2 =25)

1. від 0 до 40%

19

16

35

2. від 41 до 100%

26

9

35

Суми

45

25

70

Отриману таблицю (табл. 5.10) ми можемо використовувати, перевіряючи різні гіпотези шляхом зіставлення будь-яких двох її осередків. Ми пам'ятаємо, що це так звана чотириклітинна або чотирипольна таблиця.

У цьому випадку нас цікавить, чи дійсно лікарі, які вже мають фонди, прогнозують більший розмах цього руху в майбутньому, ніж лікарі, які не мають фондів. Тому ми умовно вважаємо, що "ефект є", коли прогноз потрапляє до категорії від 41 до 100%. Для спрощення розрахунків нам необхідно тепер повернути таблицю на 90°, обертаючи її за годинниковою стрілкою. Можна зробити це навіть буквально, повернувши книгу разом із таблицею. Тепер ми можемо перейти до робочої таблиці до розрахунку критерію φ* - кутового перетворення Фішера.

Таблиця 5.11

Чотириклітинна таблиця для підрахунку критерію φ* Фішера для виявлення відмінностей у прогнозах двох груп загальнопрактикуючих лікарів

Група

Є ефект-прогноз від 41 до 100%

Немає ефекту -прогноз від 0 до 40%

Усього

Iгрупа – лікарі, які взяли фонд

26 (57.8%)

19 (42.2%)

45

IIгрупа - лікарі, які не взяли фонду

9 (36.0%)

16 (64.0%)

25

Усього

35

35

70

Сформулюємо гіпотези.

H 0 : Частка осіб,прогнозують поширення фондів на 41%-100% всіх лікарських прийомних, групи лікарів з фондами не більше, ніж у групі лікарів без фондів.

H 1 : Частка осіб, які прогнозують поширення фондів на 41%-100% усіх прийомних, у групі лікарів із фондами більша, ніж у групі лікарів без фондів.

Визначаємо величини φ 1 та φ 2 по ТаблиціXIIдодатки 1. Нагадаємо, що φ 1 - це завжди кут, що відповідає більшій відсотковій частці.

Тепер визначимо емпіричне значення критерію?

По Табл.XIIIДодатки 1 визначаємо, якому рівню значимості відповідає ця величина: р = 0,039.

З тієї ж таблиці Додатка 1 можна визначити критичні значення критерію φ*:

Відповідь: Але відкидається (р = 0,039). Частка осіб, які прогнозують поширення фондів на41-100 % всіх прийомних, у групі лікарів, які взяли фонд, перевищує цю частку у групі лікарів, які не взяли фонду.

Іншими словами, лікарі, які вже працюють у своїх прийомних на окремому бюджеті, прогнозують ширше поширення цієї практики в поточному році, ніж лікарі, які поки що не погодилися перейти на самостійний бюджет. Інтерпретації цього результату є багатозначними. Наприклад, можна припустити, що лікарі кожної з груп підсвідомо вважають свою поведінку більш типовою. Це може означати також, що лікарі, які перейшли на самостійний бюджет, схильні перебільшувати розмах цього руху, оскільки їм потрібно виправдати своє рішення. Виявлені відмінності можуть означати і щось таке, що зовсім виходить за межі поставлених у дослідженні питань. Наприклад, що активність лікарів, які працюють на самостійному бюджеті, сприяє загостренню відмінностей у позиціях обох груп. Вони виявили велику активність, коли погодилися взяти фонди, вони виявили велику активність, коли взяли на себе працю відповісти на поштовий опитувальник; вони виявляють більшу активність, коли прогнозують більшу активність інших лікарів у отриманні фондів.

Так чи інакше ми можемо бути впевнені, що виявлений рівень статистичних відмінностей - максимально можливий для цих реальних даних. Ми встановили за допомогою критеріюλ точку максимальної розбіжності між двома розподілами і у цій точці розділили вибірки на частини.

Ваша оцінка.

Функція ФІШЕР виконує повернення перетворення Фішера для аргументів X. Це перетворення будує функцію, яка має нормальний, а не асиметричний розподіл. Використовується функція ФІШЕР, щоб перевірити гіпотезу за допомогою коефіцієнта кореляції.

Опис роботи функції ФІШЕР в Excel

При роботі з цією функцією необхідно встановити значення змінної. Відразу варто зазначити, що існують деякі ситуації, за яких дана функція не видаватиме результатів. Це можливо, якщо змінна:

  • не є числом. У такій ситуації функція ФІШЕР здійснить повернення значення помилки #ЗНАЧ!;
  • має значення або менше -1, або більше 1. В даному випадку функція ФІШЕР поверне значення помилки #КІЛЬКІСТЬ!.

Рівняння, яке використовується для математичного опису функції ФІШЕР, має вигляд:

Z"=1/2*ln(1+x)/(1-x)

Розглянемо застосування цієї функції на 3-х конкретних прикладах.



Оцінка взаємозв'язку прибутку та витрат за функцією ФІШЕР

Приклад 1. Використовуючи дані активності комерційних організацій, потрібно зробити оцінку зв'язку прибутку Y (млн крб.) і витрат X (млн крб.), що використовуються розробки продукції (наведені у таблиці 1).

Таблиця 1 - Вихідні дані:

XY
1 210 000 000,00 ₽95 000 000,00 ₽
2 1 068 000 000,00 ₽76 000 000,00 ₽
3 1 005 000 000,00 ₽78 000 000,00 ₽
4 610 000 000,00 ₽89 000 000,00 ₽
5 768 000 000,00 ₽77 000 000,00 ₽
6 799 000 000,00 ₽85 000 000,00 ₽

Схема вирішення таких завдань виглядає так:

  1. Розраховується лінійний коефіцієнткореляції r xy;
  2. Перевіряється значимість лінійного коефіцієнта кореляції з урахуванням t-критерію Стьюдента. При цьому висувається та перевіряється гіпотеза про рівність коефіцієнта кореляції нулю. Під час перевірки цієї гіпотези використовується t-статистика. Якщо гіпотеза підтверджується, t-статистика має розподіл Стьюдента. Якщо розрахункове значення t р > t кр, то гіпотеза відкидається, що свідчить про значущість лінійного коефіцієнта кореляції, отже, і статистичної суттєвості залежності між Х і Y;
  3. Визначається інтервальна оцінка статистично значимого лінійного коефіцієнта кореляції.
  4. Визначається інтервальна оцінка лінійного коефіцієнта кореляції на основі зворотного z-перетворення Фішера;
  5. Розраховується стандартна помилка лінійного коефіцієнта кореляції.

Результати вирішення цієї задачі з функціями, що застосовуються в пакеті Excel наведені на малюнку 1.


Малюнок 1 – Приклад розрахунків.

№ п/пнайменування показникаФормула розрахунку
1 Коефіцієнт кореляції=КОРРЕЛ(B2:B7;C2:C7)
2 Розрахункове значення t-критерію tp=ABS(C8)/КОРІНЬ(1-СТУПЕНЬ(C8;2))*КОРІНЬ(6-2)
3 Табличне значення t-критерію=СТЬЮДРАСПОБР(0,05;4)
4 Табличне значення стандартного нормального розподілу zy=НОРМСТОБР((0,95+1)/2)
5 Значення перетворення Фішера z’=ФІШЕР(C8)
6 Ліва інтервальна оцінка для z=C12-C11*КОРІНЬ(1/(6-3))
7 Права інтервальна оцінка для z=C12+C11*КОРІНЬ(1/(6-3))
8 Ліва інтервальна оцінка для rxy=ФІШЕРОБР(C13)
9 Права інтервальна оцінка для rxy=ФІШЕРОБР(C14)
10 Стандартне відхилення для rxy=КОРІНЬ((1-C8^2)/4)

Таким чином, з ймовірністю 0,95 лінійний коефіцієнт кореляції укладено в інтервалі від (-0,386) до (-0,990) з стандартною помилкою 0,205.

Перевірка статистичної значущості регресії за функцією FРАСПОБР

Приклад 2. Здійснити перевірку статистичної значущості рівняння множинної регресіїза допомогою F-критерію Фішера, зробити висновки.

Для перевірки значущості рівняння в цілому висунемо гіпотезу Н 0 про статистичній незначущості коефіцієнта детермінації та протилежну їй гіпотезу Н 1 про статистичну значущість коефіцієнта детермінації:

Н 1: R 2 ≠ 0.

Перевіримо гіпотези за допомогою F-критерію Фішера. Показники наведені у таблиці 2.

Таблиця 2 - Вихідні дані

Для цього використовуємо в Excel функцію:

FРОЗКЛАД (α;p;n-p-1)

  • α – ймовірність, пов'язана з цим розподілом;
  • p і n – чисельник та знаменник ступенів свободи, відповідно.

Знаючи, що α = 0,05, p = 2 і n = 53, отримуємо наступне значення для F крит (див. рисунок 2).


Рисунок 2 – Приклад розрахунків.

Отже можна сказати, що F расч > F крит. Через війну приймається гіпотеза Н 1 про статистичної значимості коефіцієнта детермінації.

Розрахунок величини показника кореляції в Excel

Приклад 3. Використовуючи дані 23 підприємств: X - ціна товару А, тис. крб.; Y - прибуток торговельного підприємства, млн. руб, провадиться вивчення їх залежності. Оцінка регресійної моделі дала наступне: ∑(yi-yx) 2 = 50 000; ∑(yi-yср) 2 = 130000. Який показник кореляції можна визначити за цими даними? Розрахуйте величину показника кореляції та, використовуючи критерій Фішера, зробіть висновок про якість моделі регресії.

Визначимо F критий з виразу:

F розрахунки = R 2 /23 * (1-R 2)

де R – коефіцієнт детермінації, що дорівнює 0,67.

Отже, розрахункове значення F расч = 46.

Для визначення F крит використовуємо розподіл Фішера (див. рисунок 3).


Рисунок 3 – Приклад розрахунків.

Отже, отримана оцінка рівняння регресії надійна.

Значимість рівняння множинної регресії в цілому, так само як і в парній регресії, оцінюється за допомогою критерію Фішера:

, (2.22)

де
- Факторна сума квадратів на один ступінь свободи;
– залишкова сума квадратів однією ступінь свободи;
- Коефіцієнт (індекс) множинної детермінації;
- Число параметрів при змінних лінійної регресіїзбігається з числом включених у модель факторів); - Число спостережень.

Оцінюється значущість як рівняння загалом, а й чинника, додатково включеного в регресійну модель. Необхідність такої оцінки пов'язана з тим, що не кожен фактор, який увійшов до моделі, може суттєво збільшувати частку поясненої варіації результативної ознаки. Крім того, за наявності моделі декількох факторів вони можуть вводитися в модель в різній послідовності. Зважаючи на кореляцію між факторами значущість одного і того ж фактора може бути різною залежно від послідовності його введення в модель. Мірою для оцінки включення фактора в модель служить приватний
-Критерій, тобто. .

Приватний
-Критерій побудований на порівнянні приросту факторної дисперсії, обумовленого впливом додатково включеного фактора, з залишковою дисперсією на один ступінь свободи за регресійною моделлю в цілому. У загальному виглядідля фактора приватний
-Критерій визначиться як

, (2.23)

де
- Коефіцієнт множинної детермінації для моделі з повним набором факторів,
- Той самий показник, але без включення в модель фактора ,- Число спостережень,
- Число параметрів в моделі (без вільного члена).

Фактичне значення приватного
-критерія порівнюється з табличним при рівні значимості
та числі ступенів свободи: 1 та
. Якщо фактичне значення перевищує
, то додаткове включенняфактор А у модель статистично виправдано і коефіцієнт чистої регресії при факторі статистично значущий. Якщо ж фактичне значення менше табличного, то додаткове включення до моделі фактора істотно не збільшує частку поясненої варіації ознаки , отже, недоцільно його включення до моделі; коефіцієнт регресії при даному факторіу цьому випадку статистично незначимий.

Для двофакторного рівняння приватні
-критерії мають вигляд:

,
. (2.23а)

За допомогою приватного
-критерію можна перевірити значущість всіх коефіцієнтів регресії у припущенні, що кожен відповідний фактор вводився в рівняння множинної регресії останнім.

-Критерій студента для рівняння множинної регресії.

Приватний
-Критерій оцінює значимість коефіцієнтів чистої регресії Знаючи величину , можна визначити і -Критерій для коефіцієнта регресії при -му факторі, , а саме:

. (2.24)

Оцінка значимості коефіцієнтів чистої регресії за -критерію Стьюдента може бути проведена і без розрахунку приватних
-Критеріїв. В цьому випадку, як і в парній регресії, для кожного фактора використовується формула:

, (2.25)

де - Коефіцієнт чистої регресії при факторі ,- Середня квадратична (стандартна) помилка коефіцієнта регресії .

Для рівняння множинної регресії середня квадратична помилка коефіцієнта регресії може бути визначена за такою формулою:

, (2.26)

де ,- Середнє квадратичне відхилення для ознаки ,
- Коефіцієнт детермінації для рівняння множинної регресії,
- Коефіцієнт детермінації для залежності фактора з усіма іншими факторами рівняння множинної регресії;
- Число ступенів свободи для залишкової суми квадратів відхилень.

Як бачимо, щоб скористатися цією формулою, необхідні матриця міжфакторної кореляції та розрахунок за нею відповідних коефіцієнтів детермінації
. Так, для рівняння
оцінка значимості коефіцієнтів регресії ,,передбачає розрахунок трьох міжфакторних коефіцієнтів детермінації:
,
,
.

Взаємозв'язок показників приватного коефіцієнта кореляції, приватного
-критерія та -Крітерія Стьюдента для коефіцієнтів чистої регресії може використовуватися в процедурі відбору факторів. Відсів факторів при побудові рівняння регресії методом виключення практично можна здійснювати не лише за приватними коефіцієнтами кореляції, виключаючи на кожному кроці фактор із найменшим незначним значенням приватного коефіцієнта кореляції, але й за величинами і . Приватний
-Критерій широко використовується і при побудові моделі методом включення змінних та кроковим регресійним методом.

Для порівняння двох нормально розподілених сукупностей, які не мають відмінностей у середніх вибіркових значеннях, але є різниця в дисперсіях, використовують критерій Фішера. Фактичний критерій розраховують за такою формулою:

де в чисельнику стоїть більше значення вибіркової дисперсії, а знаменнику - менше. Для висновку про достовірність різниці між вибірками використовують ОСНОВНИЙ ПРИНЦИП перевірки статистичних гіпотез Критичні точки для
містяться у таблиці. Нульову гіпотезу відкидають, якщо фактично встановлена ​​величина
перевершить або виявиться рівною критичному (стандартному) значенню
цієї величини для прийнятого рівня значущості та числа ступенів свободи k 1 = n велика -1 ; k 2 = n менша -1 .

П р і м е р: щодо впливу деякого препарату на швидкість проростання насіння було встановлено, що у експериментальної партії насіння і контролі середня швидкість проростання однакова, але є різниця у дисперсіях.
=1250,
=417. Обсяги вибірок однакові та дорівнюють 20.

=2,12. Отже, нульова гіпотеза відкидається.

Кореляційна залежність. Коефіцієнт кореляції та її властивості. Рівняння регресії.

ЗАВДАННЯкореляційного аналізу зводиться до:

    Встановлення напряму та форми зв'язку між ознаками;

    Вимірювання її тісноти.

Функціональною називається однозначна залежність між змінними величинами, коли певному значенню однієї (незалежної) змінної х , що називається аргументом, відповідає певне значення іншої (залежної) змінної у , Яка називається функцією. ( приклад: залежність швидкості хімічної реакції від температури; залежність сили тяжіння від мас тіл, що притягуються, і відстані між ними).

Кореляційної називається залежність між змінними, що мають статистистичний характер, коли певному значенню однієї ознаки (що розглядається як незалежна змінна) відповідає цілий ряд числових значень іншої ознаки. ( приклад: зв'язок між урожаєм та кількістю опадів; між зростанням та вагою і т.д.).

Поле кореляції є безліч точок, координати яких рівні отриманим на досвіді парам значень змінних х і у .

По виду кореляційного поля можна судити про наявність або відсутність зв'язку та його тип.



Зв'язок називається позитивною якщо при збільшенні однієї змінної збільшується інша змінна.

Зв'язок називається негативною якщо при збільшенні однієї змінної зменшується інша змінна.

Зв'язок називається лінійної якщо її можна в аналітичному вигляді подати як
.

Показником тісноти зв'язку є коефіцієнт кореляції . Емпіричний коефіцієнт кореляції визначається виразом:

Коефіцієнт кореляції лежить у межах від -1 до 1 та характеризує ступінь близькості між величинами x і y . Якщо:


Кореляційну залежність між ознаками можна описувати різними способами. Зокрема будь-яка форма зв'язку може бути виражена рівнянням загального виду
. Рівняння виду
і
називаються регресією . Рівняння прямої регресії у на х в загальному випадкуможна записати у вигляді

Рівняння прямої регресії х на у у загальному випадку виглядає як

Найбільш ймовірні значення коефіцієнтів аі в, зі dможуть бути обчислені, наприклад, під час використання методу найменших квадратів.



Схожі статті

2024 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.