Критерій φ * - Кутове перетворення Фішера. Функція фішер у excel та приклади її роботи

Критерій Фішера

Критерій Фішера застосовується під час перевірки гіпотези про рівність дисперсій двох генеральних сукупностей, розподілених за нормальним законом. Він є параметричним критерієм.

F-критерій Фішера називають дисперсійним ставленням, оскільки він формується як відношення двох порівнюваних незміщених оцінок дисперсій.

Нехай у результаті спостережень отримано дві вибірки. За ними обчислені дисперсії та , що мають і степенів свободи. Вважатимемо, що перша вибірка взята з генеральної сукупності з дисперсією , а друга – із генеральної сукупності з дисперсією . Висувається нульова гіпотеза про рівність двох дисперсій, тобто. H 0:
або . Для того, щоб відкинути цю гіпотезу, потрібно довести значущість відмінності при заданому рівні значущості.
.

Значення критерію обчислюється за такою формулою:

Очевидно, що при рівності дисперсій величина критерію дорівнюватиме одиниці. В інших випадках вона буде більшою (меншою) одиниці.

Критерій має розподіл Фішера
. Критерій Фішера – двосторонній критерій і нульова гіпотеза
відкидається на користь альтернативної
якщо. тут , де
– обсяг першої та другої вибірки відповідно.

У системі STATISTICA реалізовано односторонній критерій Фішера, тобто. як завжди беруть максимальну дисперсію. У цьому випадку нульова гіпотеза відкидається на користь альтернативи, якщо.

приклад

Нехай поставлене завдання порівняти ефективність навчання двох груп студентів. Рівень успішності – характеризує рівень управління процесом навчання, а дисперсія – якість управління навчанням, ступінь організованості процесу навчання. Обидва показники є незалежними і в загальному випадкумають розглядатися спільно. Рівень успішності (математичне очікування) кожної групи студентів характеризується середніми арифметичними. і , а якість характеризується відповідними вибірковими дисперсіями оцінок: і . Оцінюючи рівня поточної успішності виявилося, що він однаковий в обох учнів: = = 4,0. Вибіркові дисперсії:
і
. Числа ступенів свободи, що відповідають цим оцінкам:
і
. Звідси встановлення відмінностей у ефективності навчання ми можемо скористатися стабільністю успішності, тобто. перевіримо гіпотезу.

Обчислимо
(у чисельнику має бути велика дисперсія), . За таблицями ( STATISTICA – ProbabilityDistributionCalculator) знаходимо, яке менше обчисленого, отже нульова гіпотеза має бути відкинута на користь альтернативи. Цей висновок може задовольнити дослідника, оскільки його цікавить справжня величина відносини
(У нас у чисельнику завжди велика дисперсія). При перевірці одностороннього критерію отримаємо , Що менше обчисленого вище значення. Отже, нульова гіпотеза має бути відкинута на користь альтернативи.

Критерій Фішера у програмі STATISTICA у середовищі Windows

Для прикладу перевірки гіпотези (критерій Фішера) використовуємо (створюємо) файл із двома змінними (fisher.sta):

Мал. 1. Таблиця з двома незалежними змінними

Щоб перевірити гіпотезу необхідно у базовій статистиці ( BasicStatisticsandTables) вибрати перевірку по Стьюденту для незалежних змінних. ( t-test, independent, by variables).

Мал. 2. Перевірка параметричних гіпотез

Після вибору змінних та натискання на клавішу Summaryпроводиться підрахунок значень середньоквадратичних відхилень та критерію Фішера. Окрім цього визначається рівень значущості p, у якому відмінність несуттєво.

Мал. 3. Результати перевірки гіпотези (F-критерій)

Використовуючи ProbabilityCalculatorі задавши значення параметрів, можна побудувати графік розподілу Фішера з позначкою обчисленого значення.

Мал. 4. Область прийняття (відхилення) гіпотези (F-критерій)

Джерела.

Перевірка гіпотез про відносини двох дисперсій

URL: /tryphonov3/terms3/testdi.htm

Лекція 6. :8080/resources/math/mop/lections/lection_6.htm

F – критерій Фішера

URL: /home/portal/applications/Multivariatadvisor/F-Fisheer/F-Fisheer.htm

Теорія та практика імовірнісно-статистичних досліджень.

URL: /active/referats/read/doc-3663-1.html

F – критерій Фішера

Значимість рівняння множинної регресії в цілому, так само як і в парній регресії, оцінюється за допомогою критерію Фішера:

, (2.22)

де
- Факторна сума квадратів на один ступінь свободи;
– залишкова сума квадратів однією ступінь свободи;
- Коефіцієнт (індекс) множинної детермінації;
- Число параметрів при змінних (у лінійної регресіїзбігається з числом включених у модель факторів); - Число спостережень.

Оцінюється значущість як рівняння загалом, а й чинника, додатково включеного в регресійну модель. Необхідність такої оцінки пов'язана з тим, що не кожен фактор, який увійшов до моделі, може суттєво збільшувати частку поясненої варіації результативної ознаки. Крім того, за наявності моделі декількох факторів вони можуть вводитися в модель в різній послідовності. Зважаючи на кореляцію між факторами значущість одного і того ж фактора може бути різною залежно від послідовності його введення в модель. Мірою для оцінки включення фактора в модель служить приватний
-Критерій, тобто. .

Приватний
-Критерій побудований на порівнянні приросту факторної дисперсії, обумовленого впливом додатково включеного фактора, з залишковою дисперсією на один ступінь свободи за регресійною моделлю в цілому. У загальному виглядідля фактора приватний
-Критерій визначиться як

, (2.23)

де
- Коефіцієнт множинної детермінації для моделі з повним набором факторів,
- Той самий показник, але без включення в модель фактора ,- Число спостережень,
- Число параметрів в моделі (без вільного члена).

Фактичне значення
-критерія порівнюється з табличним при рівні значимості
та числі ступенів свободи: 1 та
. Якщо фактичне значення перевищує
, то додаткове включенняфактор А у модель статистично виправдано і коефіцієнт чистої регресії при факторі статистично значущий. Якщо ж фактичне значення менше табличного, то додаткове включення до моделі фактора істотно не збільшує частку поясненої варіації ознаки , отже, недоцільно його включення до моделі; коефіцієнт регресії при даному факторіу цьому випадку статистично незначимий.

Для двофакторного рівняння приватні
-Критерії мають вигляд:

,
. (2.23а)

За допомогою приватного
-критерію можна перевірити значущість всіх коефіцієнтів регресії у припущенні, що кожен відповідний фактор вводився в рівняння множинної регресії останнім.

-Критерій студента для рівняння множинної регресії.

Приватний
-Критерій оцінює важливість коефіцієнтів чистої регресії. Знаючи величину , можна визначити і -Критерій для коефіцієнта регресії при -му факторі, , а саме:

. (2.24)

Оцінка значимості коефіцієнтів чистої регресії за -критерію Стьюдента може бути проведена і без розрахунку приватних
-Критеріїв. В цьому випадку, як і в парній регресії, для кожного фактора використовується формула:

, (2.25)

де - Коефіцієнт чистої регресії при факторі ,- Середня квадратична (стандартна) помилка коефіцієнта регресії .

Для рівняння множинної регресіїсередня квадратична помилка коефіцієнта регресії може бути визначена за такою формулою:

, (2.26)

де ,- Середнє квадратичне відхилення для ознаки ,
- Коефіцієнт детермінації для рівняння множинної регресії,
- Коефіцієнт детермінації для залежності фактора з усіма іншими факторами рівняння множинної регресії;
- Число ступенів свободи для залишкової суми квадратів відхилень.

Як бачимо, щоб скористатися цією формулою, необхідні матриця міжфакторної кореляції та розрахунок за нею відповідних коефіцієнтів детермінації
. Так, для рівняння
оцінка значущості коефіцієнтів регресії ,,передбачає розрахунок трьох міжфакторних коефіцієнтів детермінації:
,
,
.

Взаємозв'язок показників приватного коефіцієнта кореляції, приватного
-критерія та -Крітерія Стьюдента для коефіцієнтів чистої регресії може використовуватися в процедурі відбору факторів. Відсів факторів при побудові рівняння регресії методом виключення практично можна здійснювати не лише за приватними коефіцієнтами кореляції, виключаючи на кожному кроці фактор із найменшим незначним значенням приватного коефіцієнта кореляції, але й за величинами і . Приватний
-Критерій широко використовується і при побудові моделі методом включення змінних та кроковим регресійним методом.

Для порівняння двох нормально розподілених сукупностей, які не мають відмінностей у середніх вибіркових значеннях, але є різниця в дисперсіях, використовують критерій Фішера. Фактичний критерій розраховують за такою формулою:

де в чисельнику стоїть більше значення вибіркової дисперсії, а знаменнику - менше. Для висновку про достовірність різниці між вибірками використовують ОСНОВНИЙ ПРИНЦИП перевірки статистичних гіпотез Критичні точки для
містяться у таблиці. Нульову гіпотезу відкидають, якщо фактично встановлена величина
перевершить або виявиться рівною критичному (стандартному) значенню
цієї величини для прийнятого рівня значущості  та числа ступенів свободи k 1 = n велика -1 ; k 2 = n менша -1 .

П р і м е р: щодо впливу деякого препарату на швидкість проростання насіння було встановлено, що у експериментальної партії насіння і контролі середня швидкість проростання однакова, але є різниця у дисперсіях.
=1250,
=417. Обсяги вибірок однакові та дорівнюють 20.

=2,12. Отже, нульова гіпотеза відкидається.

Кореляційна залежність. Коефіцієнт кореляції та її властивості. Рівняння регресії.

ЗАВДАННЯкореляційного аналізу зводиться до:

Встановлення напряму та форми зв'язку між ознаками;

Вимірювання її тісноти.

Функціональною називається однозначна залежність між змінними величинами, коли певному значенню однієї (незалежної) змінної х , що називається аргументом, відповідає певне значення іншої (залежної) змінної у , що називається функцією. ( приклад: залежність швидкості хімічної реакції від температури; залежність сили тяжіння від мас тіл, що притягуються, і відстані між ними).

Кореляційної називається залежність між змінними, що мають статистистичний характер, коли певному значенню однієї ознаки (що розглядається як незалежна змінна) відповідає цілий ряд числових значень іншої ознаки. ( приклад: зв'язок між урожаєм та кількістю опадів; між зростанням та вагою і т.д.).

Поле кореляції є безліч точок, координати яких дорівнюють отриманим на досвіді парам значень змінних х і у .

По виду кореляційного поля можна судити про наявність або відсутність зв'язку та його тип.

Зв'язок називається позитивною якщо при збільшенні однієї змінної збільшується інша змінна.

Зв'язок називається негативною якщо при збільшенні однієї змінної зменшується інша змінна.

Зв'язок називається лінійної якщо її можна в аналітичному вигляді подати як
.

Показником тісноти зв'язку є коефіцієнт кореляції . Емпіричний коефіцієнт кореляції визначається виразом:

Коефіцієнт кореляції лежить у межах від -1 до 1 та характеризує ступінь близькості між величинами x і y . Якщо:

Кореляційну залежність між ознаками можна описувати різними способами. Зокрема будь-яка форма зв'язку може бути виражена рівнянням загального виду
. Рівняння виду
і
називаються регресією . Рівняння прямої регресії у на х у загальному випадку можна записати у вигляді

Рівняння прямої регресії х на у у загальному випадку виглядає як

Найбільш ймовірні значення коефіцієнтів аі в, зі dможуть бути обчислені, наприклад, під час використання методу найменших квадратів.

)

Розрахунок критерію φ*

1. Визначити ті значення ознаки, які будуть критерієм для поділу піддослідних на тих, у кого є ефект і тих, у кого немає ефекту. Якщо ознака вимірюється кількісно, використовувати критерій для пошуку оптимальної точки поділу.

2. Накреслити чотириклітинну (синонім: чотирипольна) таблицю із двох стовпців та двох рядків. Перший стовпець - "є ефект"; другий стовпець - "немає ефекту"; перший рядок зверху – 1 група (вибірка); другий рядок – 2 група (вибірка).

4. Підрахувати кількість піддослідних у першій вибірці, у яких "немає ефекту", і занести це число у праву верхню комірку таблиці. Підрахувати суму по двох верхніх осередках. Вона має збігатися з кількістю випробуваних у першій групі.

6. Підрахувати кількість піддослідних у другій вибірці, у яких "немає ефекту", і занести це число в правий нижній осередок таблиці. Підрахувати суму за двома нижніми осередками. Вона має збігатися з кількістю випробуваних у другій групі (вибірці).

7. Визначити відсоткові частки піддослідних, які мають "ефект", шляхом віднесення їх кількості до загальної кількостівипробуваних у цій групі (вибірці). Записати отримані відсоткові частки відповідно в лівому верхньому і лівому нижньому осередках таблиці в дужках, щоб не переплутати їх з абсолютними значеннями.

8. Перевірити, чи не дорівнює одна із зіставлюваних відсоткових часток нулю. Якщо це так, спробувати змінити це, зрушивши точку поділу груп у той чи інший бік. Якщо це неможливо або небажано, відмовитись від критерію φ* та використовувати критерій χ2.

9. Визначити за Табл. XII Додатки 1 величини кутів φ для кожної зі зіставних процентних часток.

де: φ1 - кут, що відповідає більшій відсотковій частці;

φ2 - кут, що відповідає меншій процентній частці;

N1 - кількість спостережень у вибірці 1;

N2 - кількість спостережень у вибірці 2.

11. Зіставити отримане значення φ* з критичними значеннями: φ* ≤1,64 (р<0,05) и φ* ≤2,31 (р<0,01).

Якщо φ*емп ≤φ*кр. H0 відкидається.

При необхідності визначити точний рівень значущості отриманого φ*емп Табл. XIII Додатки 1.

Даний метод описаний у багатьох посібниках (Плохінський Н.А., 1970; Гублер Е.В., 1978; Івантер Е.В., Коросов А.В., 1992 та ін.) Цей опис спирається на той варіант методу, який був розроблено та викладено Є.В. Гублером.

Призначення критерію φ*

Критерій Фішера призначений для зіставлення двох вибірок за частотою зустрічальності цікавого дослідника ефекту (показника). Чим він більший, тим вірогідніша різниця.

Опис критерію

Критерій оцінює достовірність відмінностей між тими відсотковими частками двох вибірок, у яких зареєстрований цікавий для нас ефект (показник). Образно кажучи, ми порівнюємо між собою 2 найкращі шматки, вирізані з 2-х пирогів, і вирішуємо, який із них справді більше.

Суть кутового перетворення Фішера полягає у переведенні відсоткових часток у величини центрального кута, що вимірюється в радіанах. Більшій відсотковій частці буде відповідати більший кут ф, а меншій частці - менший кут, але співвідношення тут не лінійні:

де Р – відсоткова частка, виражена у частках одиниці (див. рис. 5.1).

У разі збільшення розбіжності між кутами φ 1 та φ 2 та збільшення чисельності вибірок значення критерію зростає. Чим більша величина φ* , тим ймовірніше, що відмінності достовірні.

Гіпотези

H 0 : Частка осіб, у яких проявляється досліджуваний ефект, вибірці 1 не більше, ніж у вибірці 2.

H 1 : Частка осіб, у яких проявляється досліджуваний ефект, у вибірці 1 більша, ніж у вибірці 2.

Графічне уявлення критерію φ*

Метод кутового перетворення дещо абстрактніший, ніж інші критерії.

Формула, якої дотримується Е. В. Гублер при підрахунку значень φ, передбачає, що 100% становлять кут φ=3,142, тобто округлену величину π=3,14159... Це дозволяє нам уявити зіставляються вибірки у вигляді двох півколів, кожен з символізує 100% чисельності своєї вибірки. Відсоткові частки піддослідних з "ефектом" будуть представлені як сектори, утворені центральними кутами. Рис. 5.2 представлені два півкола, що ілюструють Приклад 1. У першій вибірці 60% випробуваних вирішили завдання. Цій відсотковій частці відповідає кут =1,772. У другій вибірці 40% піддослідних вирішили завдання. Цій відсотковій частці відповідає кут =1,369.

Критерій φ* дозволяє визначити, чи справді один із кутів статистично достовірно перевершує інший при даних обсягах вибірок.

Обмеження критерію φ*

1. Жодна з порівнянних часток не повинна дорівнювати нулю. Формально немає перешкод для застосування методу у випадках, коли частка спостережень в одній з вибірок дорівнює 0. Однак у цих випадках результат може виявитися невиправдано завищеним (Гублер Е.В., 1978, с. 86).

2. Верхній межа в критерії відсутня - вибірки можуть бути як завгодно великими.

Нижній межа - 2 спостереження в одній із вибірок. Однак повинні дотримуватися такі співвідношення у кількості двох вибірок:

а) якщо в одній вибірці всього 2 спостереження, то в другій має бути не менше ніж 30:

б) якщо в одній із вибірок всього 3 спостереження, то в другій має бути не менше 7:

в) якщо в одній із вибірок всього 4 спостереження, то в другій має бути не менше 5:

г) заn 1 , n 2 ≥ 5 можливі будь-які зіставлення.

У принципі можливе і зіставлення вибірок, що не відповідають цій умові, наприклад, із співвідношеннямn 1 =2, n 2 = 15, але у випадках не вдасться виявити достовірних відмінностей.

Інших обмежень критерію φ* немає.

Розглянемо кілька прикладів, що ілюструють можливостікритерію φ*.

Приклад 1: зіставлення вибірок за ознакою, що якісно визначається.

Приклад 2: зіставлення вибірок за кількісно вимірюваною ознакою.

Приклад 3: зіставлення вибірок і за рівнем, і розподілом ознаки.

Приклад 4: використання критерію φ* у поєднанні з критеріємX Колмогорова-Смирнова з метою досягнення максимально точного результату.

Приклад 1 - зіставлення вибірок за якісно визначеною ознакою

В даному варіанті використання критерію ми порівнюємо відсоток піддослідних в одній вибірці, що характеризуються якістю, з відсотком піддослідних в іншій вибірці, що характеризуються тією ж якістю.

Припустимо, нас цікавить, чи розрізняються дві групи студентів щодо успішності вирішення нового експериментального завдання. У першій групі з 20 чоловік з нею впоралися 12 осіб, а в другій вибірці з 25 осіб - 10. У першому випадку відсоткова частка вирішили завдання становитиме 12/20 · 100% = 60%, а в другій 10/25 · 100% = 40%. Чи вірно розрізняються ці відсоткові частки при данихn 1 іn 2 ?

Здавалося б, і "на око" можна визначити, що 60% значно вищі за 40%. Однак насправді ці відмінності за данимиn 1 , n 2 недостовірні.

Перевіримо це. Оскільки нас цікавить факт розв'язання задачі, вважатимемо "ефектом" успіх у вирішенні експериментальної задачі, а відсутністю ефекту - невдачу в її розв'язанні.

Сформулюємо гіпотези.

H 0 : Частка осіб,що впоралися із завданням, у першій групі не більше, ніж у другій групі.

H 1 : Частка осіб, що впоралися із завданням, у першій групі більше, ніж у другій групі

Тепер побудуємо так звану чотириклітинну, або чотирипольну таблицю, яка фактично є таблицею емпіричних частот за двома значеннями ознаки: "є ефект" - "немає ефекту".

Таблиця 5.1

Чотириклітинна таблиця для розрахунку критерію при зіставленні двох груп піддослідних по відсотковій частці вирішили завдання.

Групи	"Є ефект": завдання вирішено		"Немає ефекту": завдання не вирішене		Суми
	Кількість випробуваних	% частка	Кількість випробуваних	% частка
1 група		(60%)		(40%)
2 група		(40%)		(60%)
Суми

У чотириклітинній таблиці, як правило, зверху розмічаються стовпці "Є ефект" і "Немає ефекту", а зліва - рядки "1 група" і "2 група". Беруть участь у зіставленнях, власне, лише поля (комірки) А і В, тобто відсоткові частки по стовпцю "Є ефект".

По Табл.XIIДодатки 1 визначаємо величини φ, що відповідають процентним часткам у кожній із груп.

Тепер підрахуємо емпіричне значення φ* за формулою:

де φ 1 - кут, що відповідає більшій % частці;

φ 2 - кут, що відповідає меншій % частці;

n 1 - кількість спостережень у вибірці 1;

n 2 - кількість спостережень у вибірці 2.

В даному випадку:

По Табл.XIIIДодаток 1 визначаємо, якому рівню значимості відповідає φ* емп=1,34:

р = 0,09

Можна встановити і критичні значення φ*, що відповідають прийнятим у психології рівням статистичної значущості:

Побудуємо "вісь значущості".

Отримане емпіричне значення φ* знаходиться у зоні незначущості.

Відповідь: H 0 приймається. Частка осіб, які впоралися із завданням,впершій групі не більше, ніж у другій групі.

Можна лише поспівчувати досліднику, який вважає суттєвими відмінності 20% і навіть 10%, не перевіривши їх достовірність з допомогою критерію φ*. У разі, наприклад, достовірними були лише відмінності щонайменше ніж 24,3%.

Схоже, що при зіставленні двох вибірок за якоюсь якісною ознакою критерій може нас швидше засмутити, ніж порадувати. Те, що здавалося суттєвим, зі статистичної точки зору може таким не виявитися.

Набагато більше можливостей порадувати дослідника з'являється у критерію Фішера тоді, коли ми зіставляємо дві вибірки за кількісно виміряними ознаками і можемо варіювати ефект.

Приклад 2 - зіставлення двох вибірок за кількісно вимірюваною ознакою

В даному варіанті використання критерію ми порівнюємо відсоток піддослідних в одній вибірці, які досягають певного рівня значення ознаки, з відсотком піддослідних, що досягають цього рівня в іншій вибірці.

У дослідженні Г. А. Тлегенової (1990) з 70 юнаків - учнів ПТУ у віці від 14 до 16 років було відібрано за результатами обстеження за Фрайбурзьким особистісним опитувальником 10 випробуваних з високим показником за шкалою Агресивності та 11 випробуваних з 11 випробуваних. Необхідно визначити, чи відрізняються групи агресивних та неагресивних юнаків за показником відстані, яку вони спонтанно обирають у розмові з однокурсником. Дані Г. А. Тлегенової представлені в Табл. 5.2. Можна зауважити, що агресивні юнаки частіше обирають відстань у 50см або навіть менше, тоді як неагресивні юнаки частіше вибирають відстань, що перевищує 50 см.

Тепер ми можемо розглядати відстань у 50 см як критичну і вважати, що якщо обрана віддалена відстань менша або дорівнює 50 см, то "ефект є", а якщо обрана відстань більше 50 см, то "ефекту немає". Ми, що у групі агресивних юнаків ефект спостерігається 7 з 10, т. е. в 70% випадків, а групи неагресивних юнаків - в 2 з 11, т. е. в 18,2% випадків. Ці відсоткові частки можна порівняти методом φ* , щоб встановити достовірність відмінностей з-поміж них.

Таблиця 5.2

Показники відстані (в см), що обирається агресивними та неагресивними юнаками у розмові з однокурсником (за даними Г.А. Тлегенової, 1990)

	Група 1: юнаки з високими показниками за шкалою агресивностіFPI- R (n 1 =10)		Група 2: юнаки з низькими значеннями за шкалою агресивностіFPI- R (n 2 =11)
	d(c м )	% частка	d(c M )	% частка
"Є ефект" d≤50 см


				18,2%




"Ні ефекту" d>50см





	80 QO			81,8%




Суми		100%		100%
Середні	5б:о		77.3

Сформулюємо гіпотези.

H 0 d ≤ 50 см, у групі агресивних юнаків не більше, ніж у групі неагресивних юнаків.

H 1 : Частка осіб, які обирають дистанцію.d≤ 50 см, у групі агресивних юнаків більше, ніж у групі неагресивних юнаків. Тепер збудуємо так звану чотириклітинну таблицю.

Таблиця 53

Чотириклітинна таблиця для розрахунку критерію φ* при зіставленні агресивних груп (nf=10) та неагресивних юнаків (п2=11)

Групи	"Є ефект": d≤50		"Немає ефекту". d>50		Суми
Групи	Кількість піддослідних	(% Частка)	Кількість піддослідних	(% Частка)	Суми
1 група - агресивні юнаки		(70%)		(30%)
2 група – неагресивні юнаки		(180%)		(81,8%)
Сума

По Табл.XIIДодатки 1 визначаємо величини φ, відповідні процентним часткам "ефекту" у кожній із груп.

Отримане емпіричне значення φ* знаходиться у зоні значущості.

Відповідь: H 0 відкидається. ПриймаєтьсяH 1 . Частка осіб, які обирають дистанцію в розмові меншу або рівну 50 см, в групі агресивних юнаків більша, ніж у групі неагресивних юнаків.

На підставі отриманого результату ми можемо зробити висновок, що агресивніші юнаки частіше вибирають відстань менше півметра, тоді як неагресивні юнаки частіше вибирають більшу, ніж півметра, відстань. Ми бачимо, що агресивні юнаки спілкуються фактично на межі інтимної (0-46 см) та особистої зони (від 46 см). Ми пам'ятаємо, однак, що інтимна відстань між партнерами є прерогативою не лише близьких добрих стосунків, а йірукопашного бою (HallE. T., 1959).

Приклад 3 - зіставлення вибірок і за рівнем, і розподілом ознаки.

У цьому варіанті використання критерію ми спочатку можемо перевірити, чи відрізняються групи за рівнем будь-якої ознаки, а потім порівняти розподіл ознаки у двох вибірках. Таке завдання може бути актуальним при аналізі відмінностей у діапазонах або формі розподілу оцінок, які отримують випробувані за якоюсь новою методикою.

У дослідженні Р. Т. Чиркіна (1995) вперше використовувався опитувальник, спрямований на виявлення тенденції до витіснення з пам'яті фактів, імен, намірів та способів дії, зумовленого особистими, сімейними та професійними комплексами. Опитувальник було створено за участю Є. В. Сидоренка на основі матеріалів книги 3. Фрейда "Психопатологія повсякденного життя". Вибірка з 50 студентів Педагогічного інституту, які не перебувають у шлюбі, не мають дітей віком від 17 до 20 років, була обстежена за допомогою даного опитувальника, а також методики Менестера-Кошика для виявлення інтенсивності відчуття власної недостатності,або"комплексу неповноцінності" (ManasterG. J., CorsiniR. J., 1982).

Результати обстеження представлені у Табл. 5.4.

Чи можна стверджувати, що між показником енергії витіснення, що діагностується за допомогою опитувальника, та показниками інтенсивності, відчуття власної недостатності існують якісь значущі співвідношення?

Таблиця 5.4

Показники інтенсивності відчуття власної недостатності у групах студентів із високою (nj=18) та низькою (п2=24) енергією витіснення

Група 1: енергія витіснення від 19 до 31 бала (n 1 =181

Група 2: енергія витіснення від 7 до 13 балів (n 2 =24)

0; 0; 0; 0; 0

20; 20

30; 30; 30; 30; 30; 30; 30

50; 50

60; 60

0; 0

5; 5; 5; 5

10; 10; 10; 10; 10; 10

15; 15

20; 20; 20; 20

30; 30; 30; 30; 30; 30

Суми

Середні

26,11

15,42

Незважаючи на те, що середня величина групи з більш енергійним витісненням вище, в ній спостерігаються також і 5 нульових значень. Якщо порівняти гістограми розподілу оцінок у двох вибірках, між ними виявляється разючий контраст (Рис. 5.3).

Для порівняння двох розподілів ми могли б застосувати критерійχ 2 або критерійλ , але для цього нам довелося б укрупнювати розряди, а крім того, в обох вибіркахn <30.

Критерій φ* дозволить нам перевірити спостерігається на графіку ефект розбіжності двох розподілів, якщо ми умовимося вважати, що "ефект є", якщо показник почуття недостатності набуває або дуже низьких (0), або, навпаки, дуже високих значень (S30), і що "ефекту немає", якщо показник почуття недостатності набуває середніх значень, від 5 до 25.

Сформулюємо гіпотези.

H 0 : Крайні значення показника недостатності (або 0, або 30 і більше) у групі з більш енергійним витісненням зустрічаються не частіше, ніж у групі з менш енергійним витісненням.

H 1 : Крайні значення показника недостатності (або 0, або 30 і більше) у групі з більш енергійним витісненням зустрічаються частіше, ніж у групі з менш енергійним витісненням.

Створимо чотириклітинну таблицю, зручну для подальшого розрахунку критерію *.

Таблиця 5.5

Чотириклітинна таблиця для розрахунку критерію φ*при зіставленні груп з більшою та меншою енергією витіснення за співвідношенням показників недостатності

Групи	"Є ефект": показник недостатності дорівнює 0 або >30		"Немає ефекту": показник недостатності від 5 до 25		Суми
		(88,9%)		(11,1%)
		(33,3%)		(66,7%)
Суми

По Табл.XIIДодатки 1 визначимо величини ф, відповідні зіставним процентним часткам:

Підрахуємо емпіричне значення φ*:

Критичні значення φ* за будь-якихn 1 , n 2 Як ми пам'ятаємо з попереднього прикладу, складають:

Табл.XIIIДодатки 1 дозволяє нам і точніше визначити рівень значущості отриманого результату: р<0,001.

Відповідь: H 0 відкидається. ПриймаєтьсяH 1 . Крайні значення показника недостатності (або 0, або 30 і більше) у групі з більшою енергією витіснення зустрічаються частіше, ніж у групі з меншою енергією витіснення.

Отже, випробувані з більшою енергією витіснення можуть мати як дуже високі (30 і більше), так і дуже низькі (нульові) показники відчуття власної недостатності. Можна припустити, що вони витісняють і свою незадоволеність, і у життєвому успіху. Ці припущення потребують подальшої перевірки.

Отриманий результат, незалежно від його інтерпретації, підтверджує можливості критерію в оцінці відмінностей у формі розподілу ознаки у двох вибірках.

У початковій вибірці було 50 осіб, але 8 з них було виключено з розгляду як середній бал за показником анергії витіснення (14-15). Показники інтенсивності почуття недостатності вони теж середні: 6 значень по 20 балів і 2 значення по 25 балів.

У сильних здібностях критерію φ* можна переконатися, підтвердивши зовсім іншу гіпотезу при аналізі матеріалів даного прикладу. Ми можемо довести, наприклад, що в групі з більшою енергією витіснення показник недостатності все ж таки вищий, незважаючи на парадоксальність його розподілу в цій групі.

Сформулюємо нові гіпотези.

H 0 Найбільш високі значення показника недостатності (30 і більше) у групі з більшою енергією витіснення зустрічаються не частіше, ніж у групі з меншою енергією витіснення.

H 1 : Найбільш високі значення показника недостатності (30 і більше) у групі з більшою енергією витіснення зустрічаються частіше, ніж у групі з меншою енергією витіснення. Побудуємо чотирипольну таблицю, використовуючи дані Табл. 5.4.

Таблиця 5.6

Чотириклітинна таблиця для розрахунку критерію φ* при зіставленні груп з більшою та меншою енергією витіснення за рівнем показника недостатності

Групи	"Є ефект"* показник недостатності більший або дорівнює 30		"Немає ефекту": показник недостатності менший 30		Суми
1 група - з більшою енергією витіснення		(61,1%)		(38.9%)
2 група – з меншою енергією витіснення		(25.0%)		(75.0%)
Суми

По Табл.XIIIДодатки 1 визначаємо, що це результат відповідає рівню значимості р=0,008.

Відповідь: Але відкидається. ПриймаєтьсяHj: Найбільш високі показники недостатності (30 і більше балів) у групізбільшою енергією витіснення зустрічаються частіше, ніж у групі з меншою енергією витіснення (р=0,008).

Отже, нам вдалося довести і те, щовгрупізбільш енергійним витісненням переважають крайні значення показника недостатності, і те, що більших своїх значень цей показникдосягаєсаме у цій групі.

Тепер ми могли б спробувати довести, що у групі з більшою енергією витіснення частіше трапляються й нижчі значення показника недостатності, незважаючи на те, що середня величинав цій групі більше (26,11 проти 15,42 у групіз меншим витісненням).

Сформулюємо гіпотези.

H 0 : Найнижчі показники недостатності (нульові) у групі.з більшою енергією витіснення зустрічаються не частіше, ніж у групіз меншою енергією витіснення.

H 1 : Найнижчі показники недостатності (нульові) зустрічаються.в групі з більшою енергією витіснення частіше, ніж у групіз менш енергійним витісненням. Згрупуємо дані у нову чотириклітинну таблицю.

Таблиця 5.7

Чотириклітинна таблиця для зіставлення груп з різною енергією витіснення за частотою нульових значень показника недостатності

Групи	"Є ефект": показник недостатності дорівнює 0		"Немає ефекту" недостатності	показник не дорівнює 0	Суми
1 група - з більшою енергією витіснення		(27,8%)		(72,2%)
1 група - з меншою енергією витіснення		(8,3%)		(91,7%)
Суми

Визначаємо величини φ та підраховуємо значення φ*:

Відповідь: H 0 відкидається. Найнижчі показники недостатності (нульові) у групі з більшою енергією витіснення зустрічаються частіше, ніж у групі з меншою енергією витіснення (р<0,05).

У сумі одержані результати можуть розглядатися як свідчення часткового збігу понять комплексу у З.Фрейда та А.Адлера.

Істотно при цьому, що між показником енергії витіснення та показником інтенсивності відчуття власної недостатності загалом за вибіркою отримано позитивний лінійний кореляційний зв'язок (р=+0,491, р<0,01). Как мы можем убедиться, применение критерия φ* позволяет проникнуть в более тонкие и содержательно значимые соотношения между этими двумя показателями.

Приклад 4 - використання критерію φ* у поєднанні з критерієм λ Колмогорова-Смирнова з метою максимального досягнення точногорезультату

Якщо вибірки зіставляються за будь-якими кількісно виміряними показниками, постає проблема виявлення тієї точки розподілу, яка може використовуватися як критична при поділі всіх піддослідних на тих, у кого є ефект і тих, у кого немає ефекту.

У принципі точку, за якою ми розділили б групу на підгрупи, де є ефект і немає ефекту, можна вибрати довільно. Нас може цікавити будь-який ефект і, отже, ми можемо розділити обидві вибірки на дві частини в будь-якій точці, аби це мало якийсь сенс.

Для того, щоб максимально підвищити потужність критерію φ*, потрібно, однак, вибрати точку, в якій відмінності між двома групами, що зіставляються, є найбільшими. Точніше ми зможемо зробити це за допомогою алгоритму розрахунку критеріюλ , що дозволяє виявити точку максимальної розбіжності між двома вибірками.

Можливість поєднання критеріїв φ* таλ описано Є.В. Гублером (1978, с. 85-88). Спробуємо використати цей спосіб у вирішенні наступного завдання.

У спільному дослідженні М.А. Курочкіна, Є.В. Сидоренко та Ю.А. Чуракова (1992) у Великій Британії проводилося опитування англійських загальнопрактикуючих лікарів двох категорій: а) лікарі, які підтримали медичну реформу і вже перетворили свої приймальні на фондотримаючі організації з власним бюджетом; б) лікарі, чиї приймальні, як і раніше, не мають власних фондів і повністю забезпечуються державним бюджетом. Опитувальники були розіслані вибірці з 200 лікарів, репрезентативної стосовно генеральної сукупності англійських лікарів за представленістю осіб різної статі, віку, стажу та місця роботи – у великих містах чи провінції.

Відповіді на опитувальник надіслали 78 лікарів, з них 50 працюючих у приймальнях із фондами та 28 – із приймальних без фондів. Кожен із лікарів мав прогнозувати, якою буде частка прийомних із фондами наступного, 1993 року. На це запитання відповіли лише 70 лікарів із 78, які надіслали відповіді. Розподіл їх прогнозів представлено Табл. 5.8 окремо для групи лікарів із фондами та групи лікарів без фондів.

Чи різняться якимось чином прогнози лікарів із фондами та лікарів без фондів?

Таблиця 5.8

Розподіл прогнозів лікарів, що практикують практику, про те, якою буде частка прийомних з фондами в 1993 році.

Прогнозована частка
приймальних з фондами	лікарями з фондом (n 1 =45)	лікарями без фонду (n 2 =25)	Суми
1. від 0 до 20%	4	5	9
2. від 21 до 40%	15	І	26
3. від 41 до 60%	18	5	23
4. від 61 до 80%	7	4	І
5. від 81 до 100%	1	0	1
Суми	45	25	70

Визначимо точку максимальної розбіжності між двома розподілами відповідей Алгоритму 15 з п. 4.3 (див. табл. 5.9).

Таблиця 5.9

Розрахунок максимальної різниці накопичених частостей у розподілах прогнозів лікарів двох груп

Прогнозована частка приймалень із фондами (%)

Емпіричні частоти вибору цієї категорії відповіді

Емпіричні частоти

Накопичені емпіричні частоти

Різниця (d)

лікарями з фондом(n 1 =45)

лікарями без фонду (n 2 =25)

f* е 1

f* a2

∑f* е1

∑f* а1

1. від 0 до 20%

2. від 21 до 40%

3. від 41 до 60%

4. від 61 до 80%

5. від 81 до 100%

0,089 0,333 0,400 0,156 0,022

0,200 0,440 0,200 0,160 0

0,089 0,422 0,822 0,978 1,000

0,200

0,640

0,840

1,000

0111

0,218 0,018 0,022

Максимальна виявлена між двома накопиченими емпіричними частостями різниця становить0,218.

Ця різниця виявляється накопиченою у другій категорії прогнозу. Спробуємо використовувати верхню межу цієї категорії як критерій для поділу обох вибірок на підгрупу, де є ефект і підгрупу, де немає ефекту. Вважатимемо, що "ефект є", якщо даний лікар прогнозує від 41 до 100% прийомних з фондами в1993 року, і що "ефекту немає", якщо даний лікар прогнозує від 0 до 40% приймалень з фондами1993 року. Ми об'єднуємо категорії прогнозу 1 та 2, з одного боку, та категорії прогнозу 3, 4 та 5, з іншого. Отриманий розподіл прогнозів подано в Табл. 5.10.

Таблиця 5.10

Розподіл прогнозів у лікарів з фондами та лікарів без фондів

Прогнозована частка приймальних з фондами (%1	Емпіричні частоти вибору цієї категорії прогнозу		Суми
Прогнозована частка приймальних з фондами (%1	лікарями з фондом(n 1 =45)	лікарями без фонду(n 2 =25)	Суми
1. від 0 до 40%	19	16	35
2. від 41 до 100%	26	9	35
Суми	45	25	70

Отриману таблицю (табл. 5.10) ми можемо використовувати, перевіряючи різні гіпотези шляхом зіставлення будь-яких двох її осередків. Ми пам'ятаємо, що це так звана чотириклітинна або чотирипольна таблиця.

У цьому випадку нас цікавить, чи дійсно лікарі, які вже мають фонди, прогнозують більший розмах цього руху в майбутньому, ніж лікарі, які не мають фондів. Тому ми умовно вважаємо, що "ефект є", коли прогноз потрапляє до категорії від 41 до 100%. Для спрощення розрахунків нам необхідно тепер повернути таблицю на 90°, обертаючи її за годинниковою стрілкою. Можна зробити це навіть буквально, повернувши книгу разом із таблицею. Тепер ми можемо перейти до робочої таблиці до розрахунку критерію φ* - кутового перетворення Фішера.

Таблиця 5.11

Чотириклітинна таблиця для підрахунку критерію φ* Фішера для виявлення відмінностей у прогнозах двох груп загальнопрактикуючих лікарів

Група	Є ефект-прогноз від 41 до 100%	Немає ефекту -прогноз від 0 до 40%	Усього
Iгрупа – лікарі, які взяли фонд	26 (57.8%)	19 (42.2%)	45
IIгрупа - лікарі, які не взяли фонду	9 (36.0%)	16 (64.0%)	25
Усього	35	35	70

Сформулюємо гіпотези.

H 0 : Частка осіб,прогнозують поширення фондів на 41%-100% всіх лікарських прийомних, групи лікарів з фондами не більше, ніж у групі лікарів без фондів.

H 1 : Частка осіб, які прогнозують розповсюдження фондів на 41%-100% усіх прийомних, у групі лікарів із фондами більша, ніж у групі лікарів без фондів.

Визначаємо величини φ 1 та φ 2 по ТаблиціXIIдодатки 1. Нагадаємо, що φ 1 - це завжди кут, що відповідає більшій відсотковій частці.

Тепер визначимо емпіричне значення критерію?

По Табл.XIIIДодатки 1 визначаємо, якому рівню значимості відповідає ця величина: р = 0,039.

З тієї ж таблиці Додатка 1 можна визначити критичні значення критерію φ*:

Відповідь: Але відкидається (р = 0,039). Частка осіб, які прогнозують поширення фондів на41-100 % всіх прийомних, у групі лікарів, які взяли фонд, перевищує цю частку у групі лікарів, які не взяли фонду.

Іншими словами, лікарі, які вже працюють у своїх прийомних на окремому бюджеті, прогнозують ширше поширення цієї практики в поточному році, ніж лікарі, які поки що не погодилися перейти на самостійний бюджет. Інтерпретації цього результату є багатозначними. Наприклад, можна припустити, що лікарі кожної з груп підсвідомо вважають свою поведінку більш типовою. Це може означати також, що лікарі, які перейшли на самостійний бюджет, схильні перебільшувати розмах цього руху, оскільки їм потрібно виправдати своє рішення. Виявлені відмінності можуть означати і щось таке, що зовсім виходить за межі поставлених у дослідженні питань. Наприклад, що активність лікарів, які працюють на самостійному бюджеті, сприяє загостренню відмінностей у позиціях обох груп. Вони виявили велику активність, коли погодилися взяти фонди; вони виявили велику активність, коли взяли на себе працю відповісти на поштовий опитувальник; вони виявляють більшу активність, коли прогнозують більшу активність інших лікарів у отриманні фондів.

Так чи інакше ми можемо бути впевнені, що виявлений рівень статистичних відмінностей - максимально можливий для цих реальних даних. Ми встановили за допомогою критеріюλ точку максимальної розбіжності між двома розподілами і у цій точці розділили вибірки на частини.

Ваша оцінка.

Схожі статті

Обговорюють:

Форшмак із оселедця з морквою та плавленим сиром:Форшмак із оселедця та плавлених сирків підійде для обіднього перекушування та...
ВВП – що це таке простими словами:ВВП - Валовий внутрішній продукт - один із основних макроекономічних...
Що змусило Миколи II зректися престолу:З зреченням імператора від престолу впала і династія Романових. Навіщо цар...
Що завадило врятувати "титанік":Костянтин Богданов, оглядач РИА Новости "Титанік" тонув аж ніяк не в...