Критичний розподіл студента. Розподіл t-критерію Стьюдента для перевірки гіпотези про середню та розрахунку довірчого інтервалу в MS Excel

Одним із найвідоміших статистичних інструментів є критерій Стьюдента. Він використовується для вимірювання статистичної значимостірізних парних величин. Microsoft Excelмає спеціальну функцію для розрахунку даного показника. Давайте дізнаємося, як розрахувати критерій Стьюдента в Екселі.

Проте, спочатку давайте все-таки з'ясуємо, що є критерій Стьюдента загалом. Цей показник застосовується для перевірки рівності середніх значень двох вибірок. Тобто він визначає достовірність відмінностей між двома групами даних. При цьому для визначення цього критерію використовується цілий набір методів. Показник можна розраховувати з урахуванням одностороннього чи двостороннього розподілу.

Розрахунок показника в Excel

Тепер перейдемо безпосередньо до питання, як розрахувати цей показник у Екселі. Його можна зробити через функцію СТЬЮДЕНТ.ТЕСТ. У версіях Excel 2007 року і раніше вона називалася ТТЕСТ. Втім, її залишили і в пізніших версіях з метою сумісності, але в них таки рекомендується використовувати більш сучасну. СТЬЮДЕНТ.ТЕСТ. Цю функціюможна використовувати трьома способами, про які детально йтиметься нижче.

Спосіб 1: Майстер функцій

Найпростіше проводити обчислення цього показника через Майстер функцій.


Виконується розрахунок, а результат виводиться на екран у заздалегідь виділену комірку.

Спосіб 2: робота із вкладкою «Формули»

функцію СТЬЮДЕНТ.ТЕСТможна також викликати шляхом переходу у вкладку Формулиза допомогою спеціальної кнопки на стрічці.


Спосіб 3: ручне введення

Формулу СТЬЮДЕНТ.ТЕСТтакож можна ввести вручну в будь-яку комірку на аркуші або рядок функцій. Її синтаксичний вигляд виглядає так:

СТЬЮДЕНТ.ТЕСТ (Масив1; Масив2; Хвости; Тип)

Що означає кожен із аргументів, було розглянуто при розборі першого способу. Ці значення і слід підставляти на цю функцію.

Після того, як дані введені, тиснемо кнопку Enterдля виведення результату на екран.

Як бачимо, визначається критерій Стьюдента в Excel дуже просто і швидко. Головне, користувач, який проводить обчислення, повинен розуміти, що він є і які вводяться дані за що відповідають. Безпосередній розрахунок програма виконує сама.

У яких випадках можна використати t-критерій Стьюдента?

Для застосування t-критерію Стьюдента необхідно, щоб вихідні дані мали нормальний розподіл . У разі застосування двовибіркового критерію для незалежних вибірок також необхідне дотримання умови рівності (гомоскедастичності) дисперсій.

При недотриманні цих умов при порівнянні середніх вибіркових повинні використовуватися аналогічні методи непараметричної статистики, серед яких найбільш відомими є U-критерій Манна - Вітні(як двовибірковий критерій для незалежних вибірок), а також критерій знаківі критерій Вілкоксону(Використовуються у випадках залежних вибірок).

Для порівняння середніх величин t-критерій Стьюдента розраховується за такою формулою:

де М 1- середня арифметична першої порівнюваної сукупності (групи), М 2- середня арифметична другої порівнюваної сукупності (групи), m 1 - середня помилкапершої середньої арифметичної, m 2- Середня помилка другої середньої арифметичної.

Як інтерпретувати значення t-критерію Стьюдента?

Отримане значення t-критерію Стьюдента необхідно правильно інтерпретувати. Для цього нам необхідно знати кількість досліджуваних у кожній групі (n1 і n2). Знаходимо кількість ступенів свободи fза наступною формулою:

f = (n 1 + n 2) - 2

Після цього визначаємо критичне значення t-критерію Стьюдента для необхідного рівня значущості (наприклад, p=0,05) та при даному числі ступенів свободи fза таблицею ( див. нижче).

Порівнюємо критичне та розраховане значення критерію:

· Якщо розраховане значення t-критерію Стьюдента одно чи більшекритичного, знайденого за таблицею, робимо висновок про статистичну значущість відмінностей між порівнюваними величинами.

· Якщо значення розрахованого t-критерію Стьюдента меншетабличного, отже відмінності порівнюваних величин статистично не значущі.

Приклад розрахунку t-критерію Стьюдента

Для вивчення ефективності нового препарату заліза було обрано дві групи пацієнтів із анемією. У першій групі пацієнти протягом двох тижнів отримували новий препарат, а у другій групі – отримували плацебо. Після цього було проведено вимірювання рівня гемоглобіну у периферичній крові. У першій групі середній рівень гемоглобіну становив 115,4±1,2 г/л, а у другій – 103,7±2,3 г/л (дані представлені у форматі M±m), порівнювані сукупності мають нормальний розподіл. У цьому чисельність першої групи становила 34, а другий - 40 пацієнтів. Необхідно зробити висновок про статистичну значущість отриманих відмінностей та ефективність нового препарату заліза.

Рішення:Для оцінки значущості відмінностей використовуємо t-критерій Стьюдента, що розраховується як різниця середніх значень, поділена на суму квадратів помилок:

Після виконання розрахунків значення t-критерію виявилося рівним 4,51. Знаходимо число ступенів свободи як (34 + 40) – 2 = 72. Порівнюємо отримане значення t-критерію Стьюдента 4,51 з критичним при р = 0,05 значенням, зазначеним у таблиці: 1,993. Так як розраховане значення критерію більше критичного, робимо висновок про те, що відмінності, що спостерігаються, статистично значущі (рівень значущості р<0,05).

Розподіл Фішера – це розподіл випадкової величини

де випадкові величини Х 1і Х 2незалежні та мають розподіли хі – квадрат із числом ступенів свободи k 1і k 2відповідно. При цьому пара (k 1, k 2)– пара «чисел ступенів свободи» розподілу Фішера, а саме, k 1– число ступенів свободи чисельника, а k 2- Число ступенів свободи знаменника. Розподіл випадкової величини Fназвано на честь великого англійського статистика Р. Фішера (1890-1962), який активно використовував його у своїх роботах.

Розподіл Фішера використовують під час перевірки гіпотез про адекватність моделі в регресійному аналізі, про рівність дисперсій та інших завданнях прикладної статистики.

Таблиця критичних значень Стьюдента.

Початок форми

Число ступенів свободи, f Значення t-критерію Стьюдента при p=0.05
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.040
2.037
2.035
2.032
2.030
2.028
2.026
2.024
40-41 2.021
42-43 2.018
44-45 2.015
46-47 2.013
48-49 2.011
50-51 2.009
52-53 2.007
54-55 2.005
56-57 2.003
58-59 2.002
60-61 2.000
62-63 1.999
64-65 1.998
66-67 1.997
68-69 1.995
70-71 1.994
72-73 1.993
74-75 1.993
76-77 1.992
78-79 1.991
80-89 1.990
90-99 1.987
100-119 1.984
120-139 1.980
140-159 1.977
160-179 1.975
180-199 1.973
1.972
1.960

Метод дозволяє перевірити гіпотезу про те, що середні значення двох генеральних сукупностей, з яких вилучені порівнювані залежнівибірки, що відрізняються один від одного. Допущення залежності найчастіше означає, що ознака виміряний на одній і тій же вибірці двічі, наприклад, до дії та після нього. У загальному випадку кожному представнику однієї вибірки поставлений у відповідність представник з іншої вибірки (вони попарно об'єднані) так, що два ряди даних позитивно корелюють один з одним. Більш слабкі види залежності вибірок: вибірка 1 – чоловіки, вибірка 2 – їхні дружини; вибірка 1 - однорічні діти, вибірка 2 складена з близнюків дітей вибірки 1, і т.д.

Перевірювана статистична гіпотеза,як і в попередньому випадку, Н 0: М 1 = М 2(Середні значення у вибірках 1 і 2 рівні). При її відхиленні приймається альтернативна гіпотеза про те, що М 1більш-менш) М2.

Вихідні припущеннядля статистичної перевірки:

□ кожному представнику однієї вибірки (з однієї генеральної сукупності) поставлено у відповідність представник іншої вибірки (з іншої генеральної сукупності);

□ дані двох вибірок позитивно корелюють (утворюють пари);

□ розподіл ознаки, що вивчається, і в тій і іншій вибірці відповідає нормальному закону.

Структура вихідних даних:є по два значення ознаки, що вивчається, для кожного об'єкта (для кожної пари).

Обмеження:розподіл ознаки і в тій, і в іншій вибірці має суттєво не відрізнятися від нормального; дані двох вимірів, що відповідають тій та іншій вибірці, позитивно корелюють.

Альтернативи:критерій Т-Вілкоксона, якщо розподіл хоча б для однієї вибірки суттєво відрізняється від нормального; критерій t-Стьюдента для незалежних вибірок – якщо дані для двох вибірок не корелюють позитивно.

Формуладля емпіричного значення критерію t-Стьюдента відбиває той факт, що одиницею аналізу відмінностей є різниця (зсув)значень ознаки кожної пари спостережень. Відповідно, для кожної з N пар значень ознаки спочатку обчислюється різниця d i = х 1 i - x 2 i.

(3) де M d - Середня різниця значень; d – стандартне відхилення різниць.

Приклад розрахунку:

Припустимо, під час перевірки ефективності тренінгу кожному з 8 членів групи ставилося питання «Наскільки часто твоя думка збігаєтеся з думкою групи?». - Двічі, до і після тренінгу. Для відповідей використовувалася 10-бальна шкала: 1 – ніколи, 5 – у половині випадків, 10 – завжди. Перевірялася гіпотеза у тому, що результаті тренінгу самооцінка конформізму (прагнення бути як інші групи) учасників зросте (α = 0,05). Складемо таблицю для проміжних обчислень (таблиця 3).

Таблиця 3

Середня арифметична для різниці M d = (-6) / 8 = -0,75. Віднімемо це значення кожного d (передостанній стовпець таблиці).

Формула для стандартного відхилення відрізняється лише тим, що замість Х у ній фігурує d.Підставляємо всі потрібні значення, отримуємо

d = = 0,886.

Шаг 1. Обчислюємо емпіричне значення критерію за формулою (3): середня різниця M d= -0,75; стандартне відхилення σ d = 0,886; t е = 2,39; df = 7.

Крок 2. Визначаємо за таблицею критичних значень критерію t-Стьюдента рівень значущості. Для df = 7 емпіричне значення знаходиться між критичними для р = 0,05 та р - 0,01. Отже, р< 0,05.

df Р
0,05 0,01 0,001
2,365 3,499 5,408

Крок 3. Приймаємо статистичне рішення та формулюємо висновок. Статистична гіпотеза про рівність середніх значень відхиляється. Висновок: показник самооцінки конформізму учасників після тренінгу збільшився статистично достовірно (на рівні значимості р< 0,05).

До параметричних методів відноситься і порівняння дисперсій двох вибірок за критерієм F-фішера.Іноді цей метод призводить до цінних змістових висновків, а у разі порівняння середніх для незалежних вибірок порівняння дисперсій є обов'язковоюпроцедурою.

Для обчислення F емппотрібно знайти відношення дисперсій двох вибірок, причому так, щоб більша за величиною дисперсія знаходилася б у чисельнику, а менша знаменника.

Порівняння дисперсій. Метод дозволяє перевірити гіпотезу про те, що дисперсії двох генеральних сукупностей, з яких вилучені порівнювані вибірки, відрізняються одна від одної. Перевірювана статистична гіпотеза Н 0: σ 1 2 = σ 2 2 (дисперсія у вибірці 1 дорівнює дисперсії у вибірці 2). При її відхиленні приймається альтернативна гіпотеза про те, що одна дисперсія більша за іншу.

Вихідні припущення: дві вибірки вилучаються випадково з різних генеральних сукупностей з нормальним розподілом ознаки, що вивчається.

Структура вихідних даних:ознака, що вивчається, виміряний у об'єктів (випробуваних), кожен з яких належить до однієї з двох порівнюваних вибірок.

Обмеження:Розподіл ознаки і в тій, і в іншій вибірці суттєво не відрізняються від нормального.

Альтернатива методу:критерій Лівена (Levene"sTest), застосування якого не вимагає перевірки припущення про нормальність (використовується в програмі SPSS).

Формуладля емпіричного значення критерію F-фішера:

(4)

де σ 1 2 - велика дисперсія, a σ 2 2-менша дисперсія. Так як заздалегідь не відомо, яка дисперсія більша, то для визначення р-уровня застосовується Таблиця критичних значень для ненаправлених альтернатив.Якщо F е > F Kpдля відповідної кількості ступенів свободи, то р < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Приклад розрахунку:

Дітям давалися звичайні арифметичні завдання, після чого одній випадково обраній половині учнів повідомляли, що не витримали випробування, іншим - зворотне. Потім у кожної дитини запитували, скільки секунд їй потрібно було б вирішити аналогічне завдання. Експериментатор обчислював різницю між такою дитиною часом і результатом виконаного завдання (в сек.). Очікувалося, що повідомлення про невдачу викличе деяку неадекватність самооцінки дитини. Перевірювана гіпотеза (на рівні α = 0,005) полягала в тому, що дисперсія сукупності самооцінок не залежить від повідомлень про удачу або невдачу (Н 0: 1 2 = 2 2).

Були отримані такі дані:


К а г 1. Обчислимо емпіричне значення критерію та числа ступенів свободи за формулами (4):

Крок 2. За таблицею критичних значень критерію f-фішера для ненаправленихальтернатив знаходимо критичне значення для df чисел = 11; df знам= 11. Проте критичне значення є лише для df чисел= 10 і df знам = 12. Більше ступенів свободи брати не можна, тому беремо критичне значення для df чисел= 10: Для р = 0,05 F Kp = 3,526; для р = 0,01 F Kp = 5,418.

Крок 3. Прийняття статистичного рішення та змістовний висновок. Оскільки емпіричне значення перевищує критичне значення для р= 0,01 (і тим паче - для р = 0,05), то в даному випадку р< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (р< 0,01). Отже, після повідомлення про невдачу неадекватність самооцінки вища, ніж після повідомлення про удачу.

/ практикум-статистика / довідкові матеріали / значення t-критерію студента

Значенняt -критерія Стьюдента при рівні значимості 0,10, 0,05 та 0,01

ν - Ступеня свободи варіації

Стандартні значення критерію Стьюдента

Число ступенів свободи

рівні значимості

Число ступенів свободи

рівні значимості

Таблиця XI

Стандартні значення критерію Фішера, які використовуються для оцінки достовірності відмінностей між двома вибірками

Ступені свободи

Рівень значущості

Ступені свободи

Рівень значущості

t-Критерій Стьюдента

t-критерій Стьюдента- загальна назва класу методів статистичної перевірки гіпотез (статистичних критеріїв), заснованих на розподілі Стьюдента. Найчастіші випадки застосування t-критерію пов'язані з перевіркою рівності середніх значень у двох вибірках.

t-Статистика будується зазвичай за наступним загальним принципом: у чисельнику випадкова величина з нульовим математичним очікуванням (при виконанні нульової гіпотези), а в знаменнику - вибіркове стандартне відхилення цієї випадкової величини, одержуване як квадратний корінь з незмішеної оцінки дисперсії.

Історія

Цей критерій був розроблений Вільямом Держсетом для оцінки якості пива в компанії Гіннес. У зв'язку з зобов'язаннями перед компанією з нерозголошення комерційної таємниці (керівництво Гіннесса вважало таке використання статистичного апарату у роботі), стаття Госсета вийшла 1908 року у журналі «Біометрика» під псевдонімом «Student» (Студент).

Вимоги до даних

Для цього критерію необхідно, щоб вихідні дані мали нормальний розподіл. У разі застосування двовибіркового критерію для незалежних вибірок також потрібне дотримання умови рівності дисперсій. Існують, однак, альтернативи критерію Стьюдента для ситуації з нерівними дисперсіями.

Вимога нормальності розподілу даних є необхідною для точного t (\displaystyle t)-тесту. Проте, навіть за інших розподілах даних можливе використання t (\displaystyle t) -статистики. У багатьох випадках ця статистика асимптотично має стандартний нормальний розподіл - N(0,1) (\displaystyle N(0,1)), тому можна використовувати квантил цього розподілу. Однак, часто навіть у цьому випадку використовують квантил не стандартного нормального розподілу, а відповідного розподілу Стьюдента, як у точному t (\displaystyle t)-тесті. Асимптотично вони еквівалентні, проте на малих вибірках довірчі інтервали розподілу Стьюдента ширші та надійніші.

Одновибірковий t-критерій

Застосовується для перевірки нульової гіпотези H 0: E (X) = m (\displaystyle H_(0):E(X)=m) про рівність математичного очікування E (X) (\displaystyle E(X)) деякого відомого значення m ( \displaystyle m) .

Очевидно, при виконанні нульової гіпотези E (X) = m (displaystyle E ((overline (X))) = m). З урахуванням передбачуваної незалежності спостережень V (X) = σ 2 / n (displaystyle V ((overline (X))) = sigma ^ (2) / n). Використовуючи незміщену оцінку дисперсії s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^(n )(X_(t)-(\overline (X)))^(2)/(n-1)) отримуємо наступну t-статистику:

t = X − m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

При нульовій гіпотезі розподіл цієї статистики t(n-1) (\displaystyle t(n-1)). Отже, у разі перевищення значення статистики за абсолютною величиною критичного значення даного розподілу (при заданому рівні значущості) нульова гіпотеза відкидається.

Двовибірковий t-критерій для незалежних вибірок

Нехай є дві незалежні вибірки обсягами n 1 , n 2 (\displaystyle n_(1)~,~n_(2)) нормально розподілених випадкових величин X 1 , X 2 (\displaystyle X_(1),~X_(2)) . Необхідно перевірити за вибірковими даними нульову гіпотезу рівності математичних очікувань цих випадкових величин H 0: M 1 = M 2 (displaystyle H_(0):~M_(1)=M_(2)) .

Розглянемо різницю вибіркових середніх Δ = X 1 - X 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Очевидно, якщо нульова гіпотеза виконана E(Δ) = M 1 − M 2 = 0 (displaystyle E(Delta)=M_(1)-M_(2)=0) . Дисперсія цієї різниці дорівнює виходячи з незалежності вибірок: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1)^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Тоді використовуючи незміщену оцінку дисперсії s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (displaystyle s^(2)=(\frac (\sum _(t=1)^(n)( X_(t)-(\overline (X)))^(2))(n-1))) отримуємо незміщену оцінку дисперсії різниці вибіркових середніх: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2) ))). Отже, t-статистика для перевірки нульової гіпотези дорівнює

T = X ? 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2))))) ))

Ця статистика при справедливості нульової гіпотези має розподіл t (d f) (\displaystyle t(df)) , де d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1)+s_(2) )^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+(s_(2) )^(2)/n_(2))^(2)/(n_(2)-1))))

Випадок однакової дисперсії

Якщо дисперсії вибірок передбачаються однаковими, то

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1)))) frac (1)(n_(2)))\right))

Тоді t-статистика дорівнює:

T = X 1 - X 2 s X 1 n 1 + 1 n 2 , s X = (n 1 - 1) s 1 2 + (n 2 - 1) displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1))(n_(1) )))+(\frac (1)(n_(2)))))))~~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ (2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2)))))

Ця статистика має розподіл t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2))

Двовибірковий t-критерій для залежних вибірок

Для обчислення емпіричного значення t (\displaystyle t) -критерію в ситуації перевірки гіпотези про відмінності між двома залежними вибірками (наприклад, двома пробами того самого тесту з тимчасовим інтервалом) застосовується наступна формула:

T = M d s d / n (\displaystyle t=(\frac (M_(d))(s_(d)/(\sqrt (n)))))

де M d (\displaystyle M_(d)) - середня різниця значень, s d (\displaystyle s_(d)) - стандартне відхилення різниць, а n - кількість спостережень

Ця статистика має розподіл t(n−1) (\displaystyle t(n-1)).

Перевірка лінійного обмеження на параметри лінійної регресії

За допомогою t-тесту можна перевірити довільне (одне) лінійне обмеження на параметри лінійної регресії, оціненої звичайним методом найменших квадратів. Нехай необхідно перевірити гіпотезу H 0: c T b = a (displaystyle H_(0):c^(T)b=a) . Очевидно, при виконанні нульової гіпотези E (c T b ^ − a) = c T E (b ^) − a = 0 (displaystyle E(c^(T)(hat(b))-a)=c^( T)E((hat(b)))-a=0) . Тут використано властивість незміщеності МНК-оцінок параметрів моделі E(b^) = b(displaystyle E((hat(b)))=b). Крім того, V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c (\displaystyle V(c^(T)(\hat(b))-a )=c^(T)V((\hat(b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Використовуючи замість невідомої дисперсії, її незміщену оцінку s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) отримуємо наступну t-статистику:

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\hat(b))-a)(s(\sqrt (c^(T)) (X^(T)X)^(-1)c)))))

Ця статистика під час виконання нульової гіпотези має розподіл t (n − k) (\displaystyle t(n-k)) , тому якщо значення статистики вище критичного, то нульова гіпотеза про лінійне обмеження відхиляється.

Перевірка гіпотез про коефіцієнт лінійної регресії

Приватним випадком лінійного обмеження є перевірка гіпотези про рівність коефіцієнта b j (displaystyle b_(j)) регресії деякому значенню a (displaystyle a). У цьому випадку відповідна t-статистика дорівнює:

T = b ^ j − a s b ^ j (\displaystyle t=(\frac ((\hat(b))_(j)-a)(s_((\hat(b))_(j)))))

де s b ^ j (displaystyle s_((hat(b))_(j))) - стандартна помилка оцінки коефіцієнта - квадратний корінь з відповідного діагонального елемента коварійної матриці оцінок коефіцієнтів.

При справедливості нульової гіпотези розподіл цієї статистики - t(n-k) (\displaystyle t(n-k)). Якщо значення статистики за абсолютною величиною вище критичного значення, то відмінність коефіцієнта від a (\displaystyle a) є статистично значущим (невипадковим), інакше - незначним (випадковим, тобто справжній коефіцієнт ймовірно дорівнює або дуже близький до гаданого значення a (\) displaystyle a))

Зауваження

Одновибірковий тест для математичних очікувань можна звести до перевірки лінійного обмеження параметри лінійної регресії. В одновибірковому тесті це регресія на константу. Тому s 2 (\displaystyle s^(2)) регресії і є вибіркова оцінка дисперсії досліджуваної випадкової величини, матриця X T X (\displaystyle X^(T)X) дорівнює n (\displaystyle n) , а оцінка «коефіцієнта» моделі дорівнює вибірковому середньому. Звідси й одержуємо вираз для t-статистики, наведений вище для загального випадку.

Аналогічно можна показати, що двовибірковий тест за рівності дисперсій вибірок також зводиться до перевірки лінійних обмежень. У двовибірковому тесті це «регресія» на константу та фіктивну змінну, що ідентифікує підвибірку в залежності від значення (0 або 1): y = a + b D (displaystyle y = a + bD) . Гіпотеза про рівність математичних очікувань вибірок може бути сформульована як гіпотеза про рівність коефіцієнта цієї моделі нулю. Можна показати, що відповідна t-статистика для перевірки цієї гіпотези дорівнює t-статистиці, що наведена для двовибіркового тесту.

Також до перевірки лінійного обмеження можна звести і у разі різних дисперсій. У цьому випадку дисперсія помилок моделі набуває двох значень. Виходячи з цього можна отримати t-статистику, аналогічну наведеної для двовибіркового тесту.

Непараметричні аналоги

Аналогом двовибіркового критерію для незалежних вибірок є U-критерій Манна – Уітні. Для ситуації із залежними вибірками аналогами є критерій знаків та T-критерій Вілкоксону.

Література

Студент.Побічна error of a mean. // Biometrika. 1908. №6 (1). P. 1-25.

Посилання

Про критерії перевірки гіпотез про однорідність середніх на сайті Новосибірського державного технічного університету

Перевірка статистичної гіпотези дозволяє зробити суворий висновок про характеристики генеральної сукупності з урахуванням вибіркових даних. Гіпотези бувають різні. Одна з них – це гіпотеза про середнє (математичне очікування). Суть її в тому, щоб на основі наявної вибірки зробити коректний висновок про те, де може або не може знаходиться генеральна середня (точну правду ми ніколи не дізнаємося, але можемо звузити коло пошуку).

Загальний підхід у перевірці гіпотез описаний, тому одразу до справи. Припустимо для початку, що вибірку вилучено з нормальної сукупності випадкових величин Xз генеральною середньою μ та дисперсією σ 2(Знаю-знаю, що так не буває, але не треба мене перебивати!). Середня арифметична із цієї вибірки, очевидно, сама є випадковою величиною. Якщо витягти багато таких вибірок і порахувати за ними середні, то вони також матимуть з математичним очікуванням μ і

Тоді випадкова величина

Виникає питання: чи генеральна середня з ймовірністю 95% перебуватиме в межах ±1,96. s x̅. Іншими словами, чи є розподіл випадкових величин

еквівалентними.

Вперше це питання було поставлено (і вирішено) одним хіміком, який працював на пивній фабриці Гіннеса у Дубліні (Ірландія). Хіміка звали Вільям Сілі Госсет і він брав проби пива щодо хімічного аналізу. У якийсь момент, мабуть, Вільяма почали мучити сумніви щодо розподілу середніх. Воно виходило трохи більш розмазаним, ніж має бути у нормального розподілу.

Зібравши математичне обґрунтування та розрахувавши значення функції виявленого ним розподілу, хімік з Дубліна Вільям Госсет написав замітку, яка була опублікована в березневому випуску 1908 журналу «Біометрика» (головний редактор – Карл Пірсон). Т.к. Гіннес суворо заборонив видавати секрети пивоваріння, Держсет підписався псевдонімом Стьюдент.

Незважаючи на те, що К. Пірсон вже винайшов розподіл, все-таки загальне уявлення про нормальність ще домінувало. Ніхто не збирався думати, що розподіл вибіркових оцінок може бути нормальним. Тому стаття У. Держсету залишилася практично не поміченою та забутою. І лише Рональд Фішер гідно оцінив відкриття Держсету. Фішер використав новий розподіл у своїх роботах і дав йому назву t-розподіл Стьюдента. Критерій для перевірки гіпотез, відповідно, став t-критерієм Стьюдента. Так відбулася «революція» в статистиці, яка зробила крок в епоху аналізу вибіркових даних. Це був короткий екскурс до історії.

Подивимося, що міг побачити У. Госсет. Згенеруємо 20 тисяч нормальних вибірок із 6-ти спостережень із середньою ( ) 50 та середньоквадратичним відхиленням ( σ ) 10. Потім нормуємо вибіркові середні, використовуючи генеральну дисперсію:

20 тисяч середніх, що вийшло, згрупуємо в інтервали довжиною 0,1 і підрахуємо частоти. Зобразимо на діаграмі фактичний (Norm) та теоретичний (ENorm) розподіл частот середніх вибіркових.

Крапки (спостерігаються частоти) практично збігаються з лінією (теоретичними частотами). Воно й зрозуміло, адже дані взяті з однієї й тієї ж генеральної сукупності, а відмінності – це лише помилки вибірки.

Проведемо новий експеримент. Нормуємо середні, використовуючи вибіркову дисперсію.

Знову підрахуємо частоти та нанесемо їх на діаграму у вигляді точок, залишивши для порівняння лінію стандартного нормального розподілу. Позначимо емпіричне частоти середніх, скажімо, через букву t.

Видно, що розподіли цього разу не дуже й збігаються. Близькі, так, але не однакові. Хвости стали «важчими».

Держсет-Стьюдент не мав останньої версії MS Excel, але саме цей ефект він і помітив. Чому так виходить? Пояснення у тому, що випадкова величина

залежить не тільки від помилки вибірки (числителя), а й від стандартної середньої помилки (знаменника), яка також є випадковою величиною.

Давайте трохи розберемося, який розподіл має бути такої випадкової величини. Спочатку доведеться щось згадати (або дізнатися) з математичної статистики. Є така теорема Фішера, яка говорить, що у вибірці з нормального розподілу:

1. середня та вибіркова дисперсія s 2є незалежними величинами;

2. співвідношення вибіркової та генеральної дисперсії, помножене на кількість ступенів свободи, має розподіл χ 2(Хі-квадрат) з такою ж кількістю ступенів свободи, тобто.

де k– кількість ступенів свободи (англійською degrees of freedom (d.f.))

На цьому законі ґрунтується безліч інших результатів у статистиці нормальних моделей.

Повернемося до розподілу середньої. Розділимо чисельник та знаменник виразу

на σ X̅. Отримаємо

Чисельник – це стандартна нормальна випадкова величина (позначимо ξ (Ксі)). Знаменник висловимо з теореми Фішера.

Тоді вихідний вираз набуде вигляду

Це і є у загальному вигляді (стюдентове ставлення). Вивести функцію його розподілу можна безпосередньо, т.к. розподіли обох випадкових величин у цьому виразі відомі. Залишимо це задоволення математикам.

Функція t-розподілу Стьюдента має досить складну розуміння формулу, тому немає сенсу її розбирати. Все одно їй не користується, т.к. ймовірності наведені у спеціальних таблицях розподілу Стьюдента (іноді називають таблицями коефіцієнтів Стьюдента), або забиті у формули ПЕОМ.

Отже, озброївшись новими знаннями, ви зможете зрозуміти офіційне визначення розподілу Стьюдента.
Випадковою величиною, що підпорядковується розподілу Стьюдента з kступенями свободи, називається відношення незалежних випадкових величин

де ξ розподілено за стандартним нормальним законом, а χ 2 kпідпорядковується розподілу χ 2 c kступенями свободи.

Таким чином, формула критерію Стьюдента для середньої арифметичної

Є окремий випадок студентового відношення

З формули та визначення випливає, що розподіл т-критерію Стьюдента залежить лише від кількості ступенів свободи.

При k> 30 t-критерій практично відрізняється від стандартного нормального розподілу.

На відміну від хі-квадрат, t-критерій може бути одно- та двостороннім. Зазвичай користуються двостороннім, припускаючи, що відхилення може відбуватися обидві сторони від середньої. Але якщо умова завдання допускає відхилення лише у бік, то розумно застосовувати односторонній критерій. Від цього збільшується потужність, т.к. при фіксованому рівні значущості критичне значення трохи наближається до нуля.

Умови застосування t-критерію Стьюдента

Незважаючи на те, що відкриття Стьюдента свого часу здійснило переворот у статистиці, t-критерій все ж таки досить сильно обмежений у можливостях застосування, т.к. сам собою походить з припущення про нормальному розподілі вихідних даних. Якщо дані є нормальними (що зазвичай і буває), те й t-критерій не матиме розподілу Стьюдента. Однак через дію центральної граничної теореми середня навіть у ненормальних даних швидко набуває дзвоноподібної форми розподілу.

Розглянемо, наприклад, дані, що мають виражений скіс вправо, як у розподілу хі-квадрат з 5-ма ступенями свободи.

Тепер створимо 20 тисяч вибірок і спостерігатиме, як змінюється розподіл середніх залежно від їхнього обсягу.

Відмінність досить помітна в малих вибірках до 15-20 спостережень. Але далі воно стрімко зникає. Отже, ненормальність розподілу – це, звісно, ​​погано, але некритично.

Найбільше t-критерій «боїться» викидів, тобто. аномальних відхилень. Візьмемо 20 тис. нормальних вибірок по 15 спостережень і частину їх додамо по одному випадковому викиду.

Картина виходить невтішна. Фактичні частоти середніх дуже відрізняються від теоретичних. Використання t-розподілу у такій ситуації стає вельми ризикованою витівкою.

Отже, в не дуже малих вибірках (від 15 спостережень) t-критерій щодо стійкий до ненормального розподілу вихідних даних. А ось викиди в даних сильно спотворюють розподіл t-критерію, що, у свою чергу, може призвести до помилок статистичного висновку, тому аномальних спостережень слід позбутися. Часто з вибірки видаляють усі значення, що виходять за межі ±2 стандартних відхилень від середньої.

Приклад перевірки гіпотези про математичне очікування за допомогою t-критерію Стьюдента в MS Excel

У Excel є кілька функцій, пов'язаних із t-розподілом. Розглянемо їх.

Стюдент.Расп - "класичне" лівосторонній t-розподіл Стьюдента. На вхід подається значення t-критерію, кількість ступенів свободи та опція (0 або 1), що визначає, що потрібно розрахувати: густина або значення функції. На виході отримуємо, відповідно, щільність або ймовірність того, що випадкова величина виявиться меншою за вказаний в аргументі t-критерію.

СТЬЮДЕНТ.РАСП.2Х – двосторонній розподіл. Як аргумент подається абсолютне значення (за модулем) t-критерію та кількість ступенів свободи. На виході отримуємо можливість отримати таке чи ще більше значення t-критерію, тобто. фактичний рівень важливості (p-level).

СТЬЮДЕНТ.РАСП.ПХ - правосторонній t-розподіл. Так, 1-СТЬЮДЕНТ.РАСП(2;5;1) = СТЬЮДЕНТ.РАСП.ПХ(2;5) = 0,05097. Якщо t-критерій позитивний, то ймовірність – це p-level.

СТЬЮДЕНТ.ОБР – використовується для розрахунку лівостороннього зворотного значення t-розподілу. Як аргумент подається ймовірність та кількість ступенів свободи. На виході отримуємо відповідне цій ймовірності значення t-критерію. Відлік імовірності йде ліворуч. Тому для лівого хвоста потрібен сам рівень значущості α , а для правого α .

СТЬЮДЕНТ.ОБР.2Х – зворотне значення для двостороннього розподілу Стьюдента, тобто. значення t-критерію (за модулем). Також на вхід подається рівень значущості α . Тільки цього разу відлік ведеться з двох сторін одночасно, тому ймовірність розподіляється на два хвости. Так, СТЬЮДЕНТ.ОБР(1-0,025;5) = СТЬЮДЕНТ.ОБР.2Х(0,05;5) = 2,57058

СТЬЮДЕНТ.ТЕСТ – функція перевірки гіпотези про рівність математичних очікувань у двох вибірках. Замінює купу розрахунків, т.к. достатньо вказати лише два діапазони з даними та ще пару параметрів. На виході отримаємо p-level.

ДОВЕРИТ.СТЬЮДЕНТ – розрахунок довірчого інтервалу середньої з урахуванням t-розподілу.

Розглянемо такий навчальний приклад. На підприємстві фасують цемент у мішки по 50 кг. Через випадковість в окремо взятому мішку допускається деяке відхилення від очікуваної маси, але генеральна середня повинна залишатися 50кг. У відділі контролю якості випадково зважили 9 мішків і отримали такі результати: середня маса ( ) Склала 50,3кг, середньоквадратичне відхилення ( s) - 0,5 кг.

Чи узгоджується отриманий результат із нульовою гіпотезою у тому, що генеральна середня дорівнює 50кг? Іншими словами, чи можна отримати такий результат з чистого випадку, якщо обладнання працює справно і видає середнє наповнення 50 кг? Якщо гіпотеза не буде відхилена, то отримана відмінність вписується в діапазон випадкових коливань, якщо гіпотеза буде відхилена, то, швидше за все, в налаштуваннях апарата, що заповнює мішки, стався збій. Потрібна його перевірка та налаштування.

Коротка умова у загальноприйнятих позначках виглядає так.

H 0: μ = 50 кг

H 1: μ ≠ 50 кг

Є підстави припустити, що розподіл заповнюваності мішків підкоряються нормальному розподілу (чи не сильно від нього відрізняється). Отже, для перевірки гіпотези про математичне очікування можна використовувати t-критерій Стьюдента. Випадкові відхилення можуть відбуватися у будь-який бік, отже потрібен двосторонній t-критерій.

Спочатку застосуємо допотопні засоби: ручний розрахунок t-критерію та порівняння його з критичним табличним значенням. Розрахунковий t-критерій:

Тепер визначимо, чи отримується отримане число за критичний рівень при рівні значущості α = 0,05. Скористаємося таблицею t-розподілу Стьюдента (є у будь-якому підручнику зі статистики).

Стовпцями йде ймовірність правої частини розподілу, рядками – число ступенів свободи. Нас цікавить двосторонній t-критерій з рівнем значущості 0,05, що рівнозначно t-значенню половини рівня значимості праворуч: 1 — 0,05/2 = 0,975. Кількість ступенів свободи – обсяг вибірки мінус 1, тобто. 9 - 1 = 8. На перетині знаходимо табличне значення t-критерію - 2,306. Якби ми використовували стандартний нормальний розподіл, то критичною точкою було б значення 1,96, а тут вона більша, т.к. t-розподіл на невеликих вибірках має більш плескатий вигляд.

Порівнюємо фактичне (1,8) та табличне значення (2.306). Розрахунковий критерій виявився меншим за табличний. Отже, наявні дані не суперечать гіпотезі H 0 у тому, що генеральна середня дорівнює 50 кг (але й доводять її). Це все, що ми можемо дізнатися, використовуючи таблиці. Можна, звичайно, ще p-level спробувати знайти, але він буде наближеним. Як правило, саме p-level використовується для перевірки гіпотез. Тому далі переходимо до Excel.

Готовий функції для розрахунку t-критерію в Excel немає. Але це і не страшно, адже формула t-критерію Стьюдента досить проста і її можна легко спорудити прямо в осередку Excel.

Отримали ті ж 1,8. Знайдемо спочатку критичне значення. Альфа беремо 0,05, критерій двосторонній. Потрібна функція зворотного значення t-розподілу для двосторонньої гіпотези СТЬЮДЕНТ.ОБР.2Х.

Отримане значення відсікає критичну область. Спостерігається t-критерій до неї не потрапляє, тому гіпотеза не відхиляється.

Однак це той самий спосіб перевірки гіпотези за допомогою табличного значення. Більш інформативно розрахувати p-level, тобто. ймовірність отримати спостерігається чи ще більше відхилення від середньої 50кг, якщо ця гіпотеза вірна. Потрібна функція розподілу Стьюдента для двосторонньої гіпотези СТЬЮДЕНТ.РАСП.2Х.

P-level дорівнює 0,1096, що більше допустимого рівня значущості 0,05 – гіпотезу не відхиляємо. Але тепер можна судити про міру доказу. P-level виявився досить близьким до того рівня, коли гіпотеза відхиляється, але це наводить різні думки. Наприклад, що вибірка виявилася надто малою для виявлення значущого відхилення.

Нехай через деякий час відділ контролю знову вирішив перевірити, як витримується стандарт заповнення мішків. На цей раз для більшої надійності було відібрано не 9, а 25 мішків. Інтуїтивно зрозуміло, що розкид середньої зменшиться, а отже, і шансів знайти збій у системі стає більше.

Припустимо, були отримані ті ж значення середньої та стандартного відхилення за вибіркою, що і вперше (50,3 та 0,5 відповідно). Розрахуємо t-критерій.


Критичне значення для 24-х ступенів свободи та α = 0,05 становить 2,064. На малюнку нижче видно, що t-критерій потрапляє до області відхилення гіпотези.

Можна дійти невтішного висновку у тому, що з довірчою ймовірністю понад 95% генеральна середня відрізняється від 50кг. Для більшої переконливості подивимося на p-level (останній рядок таблиці). Імовірність отримати середню з таким або ще більшим відхиленням від 50, якщо гіпотеза вірна, становить 0,0062, або 0,62%, що при одноразовому вимірі практично неможливо. Загалом гіпотезу відхиляємо, як малоймовірну.

Розрахунок довірчого інтервалу за допомогою t-розподілу Стьюдента

З перевіркою гіпотез тісно пов'язаний ще один статистичний метод – розрахунок довірчих інтервалів. Якщо отриманий інтервал потрапляє значення, відповідне нульової гіпотезі, це рівнозначно тому, що нульова гіпотеза не відхиляється. В іншому випадку гіпотеза відхиляється з відповідною довірчою ймовірністю. У деяких випадках аналітики взагалі не перевіряють гіпотез у класичному вигляді, а розраховують лише довірчі інтервали. Такий підхід дозволяє отримати ще більше корисної інформації.

Розрахуємо довірчі інтервали для середньої при 9 та 25 спостереженнях. Для цього скористаємося функцією Excel ДОВІР.СТЬЮДЕНТ. Тут, хоч як це дивно, все досить просто. У аргументах функції слід зазначити лише рівень значимості α , стандартне відхилення щодо вибірки та розмір вибірки. На виході отримаємо півширину довірчого інтервалу, тобто значення, яке потрібно відкласти по обидва боки від середньої. Провівши розрахунки та намалювавши наочну діаграму, отримаємо наступне.

Як видно, при вибірці 9 спостережень значення 50 потрапляє в довірчий інтервал (гіпотеза не відхиляється), а при 25 спостереженнях не потрапляє (гіпотеза відхиляється). При цьому в експерименті з 25 мішками можна стверджувати, що з ймовірністю 97,5% генеральна середня перевищує 50,1 кг (нижня межа довірчого інтервалу дорівнює 50,094кг). А це є досить цінна інформація.

Таким чином, ми вирішили одне й те саме завдання трьома способами:

1. Стародавнім підходом, порівнюючи розрахункове та табличне значення t-критерію
2. Більш сучасним розрахувавши p-level, додавши ступінь впевненості при відхиленні гіпотези.
3. Ще більш інформативним, розрахувавши довірчий інтервал та отримавши мінімальне значення генеральної середньої.

Важливо, що t-критерій належить до параметричним методам, т.к. заснований на нормальному розподілі (у нього два параметри: середнє та дисперсія). Тому для його успішного застосування важлива хоча б приблизна нормальність вихідних даних та відсутність викидів.

Насамкінець пропоную подивитися відеоролик про те, як проводити розрахунки, пов'язані з t-критерієм Стьюдента в Excel.

t-критерій Стьюдента – загальна назва для класу методів статистичної перевірки гіпотез (статистичних критеріїв), заснованих на розподілі Стьюдента. Найчастіші випадки застосування t-критерію пов'язані з перевіркою рівності середніх значень у двох вибірках.

1. Історія розробки t-критерію

Цей критерій був розроблений Вільямом Держсетомдля оцінки якості пива в компанії Гіннес. У зв'язку з зобов'язаннями перед компанією щодо нерозголошення комерційної таємниці, стаття Держсету вийшла 1908 року в журналі «Біометрика» під псевдонімом «Student» (Студент).

2. Навіщо використовується t-критерій Стьюдента?

t-критерій Стьюдента використовується визначення статистичної значимості відмінностей середніх величин. Може застосовуватись як у випадках порівняння незалежних вибірок ( наприклад, групи хворих на цукровий діабет та групи здорових), і при порівнянні пов'язаних сукупностей ( наприклад, середня частота пульсу в тих самих пацієнтів до і після прийому антиаритмічного препарату).

3. У яких випадках можна використовувати t-критерій Стьюдента?

Для застосування t-критерію Стьюдента необхідно, щоб вихідні дані мали нормальний розподіл. У разі застосування двовибіркового критерію для незалежних вибірок також необхідне дотримання умови рівності (гомоскедастичності) дисперсій.

При недотриманні цих умов при порівнянні середніх вибіркових повинні використовуватися аналогічні методи непараметричної статистики, серед яких найбільш відомими є U-критерій Манна - Вітні(як двовибірковий критерій для незалежних вибірок), а також критерій знаківі критерій Вілкоксону(Використовуються у випадках залежних вибірок).

4. Як розрахувати t-критерій Стьюдента?

Для порівняння середніх величин t-критерій Стьюдента розраховується за такою формулою:

де М 1- середня арифметична першої порівнюваної сукупності (групи), М 2- середня арифметична другої порівнюваної сукупності (групи), m 1- середня помилка першої середньої арифметичної, m 2- Середня помилка другої середньої арифметичної.

5. Як інтерпретувати значення t-критерію Стьюдента?

Отримане значення t-критерію Стьюдента необхідно правильно інтерпретувати. Для цього нам необхідно знати кількість досліджуваних у кожній групі (n1 і n2). Знаходимо кількість ступенів свободи fза наступною формулою:

f = (n 1 + n 2) - 2

Після цього визначаємо критичне значення t-критерію Стьюдента для необхідного рівня значущості (наприклад, p=0,05) та при даному числі ступенів свободи fза таблицею ( див. нижче).

Порівнюємо критичне та розраховане значення критерію:

  • Якщо розраховане значення t-критерію Стьюдента одно чи більшекритичного, знайденого за таблицею, робимо висновок про статистичну значущість відмінностей між порівнюваними величинами.
  • Якщо значення розрахованого t-критерію Стьюдента меншетабличного, отже відмінності порівнюваних величин статистично не значущі.

6. Приклад розрахунку t-критерію Стьюдента

Для вивчення ефективності нового препарату заліза було обрано дві групи пацієнтів із анемією. У першій групі пацієнти протягом двох тижнів отримували новий препарат, а у другій групі – отримували плацебо. Після цього було проведено вимірювання рівня гемоглобіну у периферичній крові. У першій групі середній рівень гемоглобіну становив 115,4±1,2 г/л, а у другій – 103,7±2,3 г/л (дані представлені у форматі M±m), порівнювані сукупності мають нормальний розподіл. У цьому чисельність першої групи становила 34, а другий - 40 пацієнтів. Необхідно зробити висновок про статистичну значущість отриманих відмінностей та ефективність нового препарату заліза.

Рішення:Для оцінки значущості відмінностей використовуємо t-критерій Стьюдента, що розраховується як різниця середніх значень, поділена на суму квадратів помилок:

Після виконання розрахунків значення t-критерію виявилося рівним 4,51. Знаходимо число ступенів свободи як (34 + 40) – 2 = 72. Порівнюємо отримане значення t-критерію Стьюдента 4,51 з критичним при р = 0,05 значенням, зазначеним у таблиці: 1,993. Так як розраховане значення критерію більше критичного, робимо висновок про те, що відмінності, що спостерігаються, статистично значущі (рівень значущості р<0,05).

Схожі статті

2023 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.