Оюутны шүүмжлэлийн хуваарилалт. MS Excel-ийн дундаж утгын талаархи таамаглалыг шалгах, итгэх интервалыг тооцоолох оюутны t-тестийн тархалт

Хамгийн алдартай статистик хэрэгслүүдийн нэг бол Оюутны t тест юм. Үүнийг хэмжихэд ашигладаг статистикийн ач холбогдолянз бүрийн хосолсон хэмжээ. Microsoft Excelтооцоолох тусгай функцтэй энэ үзүүлэлт. Excel дээр Оюутны t тестийг хэрхэн тооцоолох талаар сурцгаая.

Гэхдээ эхлээд Оюутны t-тест ерөнхийдөө юу болохыг олж мэдье. Энэ үзүүлэлтийг хоёр дээжийн дундаж утгуудын тэгш байдлыг шалгахад ашигладаг. Өөрөөр хэлбэл, энэ нь хоёр бүлгийн өгөгдлийн ялгааны ач холбогдлыг тодорхойлдог. Үүний зэрэгцээ энэ шалгуурыг тодорхойлохын тулд бүхэл бүтэн аргуудыг ашигладаг. Шалгуур үзүүлэлтийг нэг талт эсвэл хоёр талт хуваарилалтыг харгалзан тооцоолж болно.

Excel дээр үзүүлэлтийг тооцоолох

Одоо Excel дээр энэ үзүүлэлтийг хэрхэн тооцоолох вэ гэсэн асуулт руу шууд шилжье. Үүнийг функцээр дамжуулан хийж болно ОЮУТНЫ ТЕСТ. Excel-ийн 2007 болон өмнөх хувилбаруудад үүнийг нэрлэсэн ТЕСТ. Гэсэн хэдий ч энэ нь нийцтэй байх үүднээс дараагийн хувилбаруудад үлдсэн боловч илүү орчин үеийн хувилбарыг ашиглахыг зөвлөж байна - ОЮУТНЫ ТЕСТ. Энэ функцгурван аргаар ашиглаж болох бөгөөд үүнийг доор дэлгэрэнгүй авч үзэх болно.

Арга 1: Функцийн мастер

Энэ үзүүлэлтийг тооцоолох хамгийн хялбар арга бол Function Wizard юм.


Тооцооллыг хийж, үр дүн нь дэлгэцэн дээр урьдчилан сонгосон нүдэнд харагдана.

Арга 2: Томъёо табтай ажиллах

Чиг үүрэг ОЮУТНЫ ТЕСТтаб руу орж дуудаж болно "Томъёо"туузан дээрх тусгай товчлуурыг ашиглан.


Арга 3: Гараар оруулах

Томъёо ОЮУТНЫ ТЕСТТа мөн үүнийг ажлын хуудасны аль ч нүд эсвэл функцийн мөрөнд гараар оруулж болно. Түүний синтакс хэлбэр нь дараах байдалтай байна.

СУРАГЧ.ТУРШ(Масив1,Массив2,Сүүл,Төрөл)

Эхний аргыг шинжлэхдээ аргумент бүр нь юу гэсэн үг болохыг харгалзан үзсэн. Эдгээр утгыг энэ функцэд орлуулах ёстой.

Өгөгдлийг оруулсны дараа товчийг дарна уу Оруулна ууүр дүнг дэлгэц дээр харуулах.

Таны харж байгаагаар Оюутны тестийг Excel дээр тооцоолох нь маш энгийн бөгөөд хурдан юм. Хамгийн гол нь тооцооллыг хийж буй хэрэглэгч өөрийгөө юу болохыг, ямар өгөгдөлд оруулах үүрэгтэйг ойлгох ёстой. Програм нь шууд тооцоог өөрөө хийдэг.

Оюутны t тестийг ямар тохиолдолд ашиглаж болох вэ?

Оюутны t тестийг хэрэглэхийн тулд анхны өгөгдөлтэй байх шаардлагатай хэвийн тархалт . Бие даасан дээжийн хувьд хоёр түүврийн шалгуурыг хэрэглэх тохиолдолд нөхцөлийг хангах шаардлагатай. хэлбэлзлийн тэгш байдал (гомоскедастик)..

Хэрэв эдгээр нөхцөл хангагдаагүй бол түүврийн хэрэгслийг харьцуулахдаа ижил төстэй аргыг хэрэглэнэ. параметрийн бус статистик, тэдгээрийн хамгийн алдартай нь юм Mann-Whitney U тест(бие даасан дээжийн хоёр түүвэр туршилтын хувьд) болон тэмдгийн шалгуурТэгээд Вилкоксоны тест(хамааралтай түүврийн тохиолдолд хэрэглэнэ).

Дундаж утгыг харьцуулахын тулд Оюутны t тестийг дараах томъёогоор тооцоолно.

Хаана М 1- эхний харьцуулсан хүн амын (бүлэг) арифметик дундаж; М 2- хоёр дахь харьцуулсан хүн амын (бүлэг) арифметик дундаж; м 1 - дундаж алдааанхны арифметик дундаж, м 2- хоёр дахь арифметик дундажийн дундаж алдаа.

Оюутны t-тестийн утгыг хэрхэн тайлбарлах вэ?

Үүссэн Оюутны t-тестийн утгыг зөв тайлбарлах ёстой. Үүнийг хийхийн тулд бид бүлэг тус бүрийн хичээлийн тоог (n 1 ба n 2) мэдэх хэрэгтэй. Эрх чөлөөний зэрэглэлийн тоог олох едараах томъёоны дагуу:

f = (n 1 + n 2) - 2

Үүний дараа бид Оюутны t-тестийн чухал утгыг шаардлагатай ач холбогдлын түвшин (жишээ нь, p = 0.05) болон өгөгдсөн тооны эрх чөлөөний градусын хувьд тодорхойлдог. ехүснэгтийн дагуу ( доороос үзнэ үү).

Бид шалгуур үзүүлэлтийн чухал ба тооцоолсон утгыг харьцуулж үздэг.

· Оюутны t тестийн тооцоолсон утга бол тэнцүү буюу түүнээс дээшХүснэгтээс олж авсан чухал ач холбогдолтой, харьцуулсан утгуудын хоорондын ялгаа нь статистикийн хувьд чухал ач холбогдолтой гэж бид дүгнэж байна.

· Хэрэв тооцоолсон Оюутны t тестийн утга багахүснэгт хэлбэртэй бөгөөд энэ нь харьцуулсан утгуудын хоорондын ялгаа нь статистик ач холбогдолгүй гэсэн үг юм.

Оюутны t-тестийг тооцоолох жишээ

Шинэ төмрийн бэлдмэлийн үр нөлөөг судлахын тулд цус багадалттай хоёр бүлгийн өвчтөнүүдийг сонгосон. Эхний бүлэгт өвчтөнүүд хоёр долоо хоногийн турш шинэ эм, хоёрдугаар бүлэгт плацебо хүлээн авсан. Үүний дараа захын цусан дахь гемоглобины түвшинг хэмжсэн. Эхний бүлэгт гемоглобины дундаж түвшин 115.4±1.2 г/л, хоёрдугаар бүлэгт 103.7±2.3 г/л байна (өгөгдлийг форматаар үзүүлэв. М±м), харьцуулж буй популяци нь хэвийн тархалттай байна. Эхний бүлгийн тоо 34, хоёрдугаарт 40 өвчтөн байна. Олж авсан ялгааны статистикийн ач холбогдол, шинэ төмрийн бэлдмэлийн үр нөлөөний талаар дүгнэлт хийх шаардлагатай байна.

Шийдэл:Ялгаатай байдлын ач холбогдлыг үнэлэхийн тулд бид дундаж утгын зөрүүг квадрат алдааны нийлбэрт хуваасан оюутны t тестийг ашигладаг.

Тооцооллыг хийсний дараа t-тестийн утга 4.51 болсон. Бид эрх чөлөөний зэрэглэлийн тоог (34 + 40) - 2 = 72 гэж олно. Үр дүнд нь Оюутны t-туршилтын 4.51 утгыг хүснэгтэд заасан p = 0.05 дахь чухал утгатай харьцуулна: 1.993. Шалгуурын тооцоолсон утга нь эгзэгтэй утгаас их байгаа тул ажиглагдсан ялгаа нь статистикийн ач холбогдолтой гэж дүгнэж байна (чухал байдлын түвшин p<0,05).

Фишерийн тархалт нь санамсаргүй хэмжигдэхүүний тархалт юм

санамсаргүй хэмжигдэхүүнүүд хаана байна X 1Тэгээд X 2бие даасан бөгөөд эрх чөлөөний зэрэгтэй хи-квадрат тархалттай байна k 1Тэгээд k 2тус тус. Үүний зэрэгцээ хосууд (k 1 , k 2)- Фишерийн тархалтын хос "эрх чөлөөний зэрэг", тухайлбал, k 1нь тоологчийн эрх чөлөөний зэрэглэлийн тоо бөгөөд k 2– хуваагчийн эрх чөлөөний зэрэглэлийн тоо. Санамсаргүй хэмжигдэхүүний тархалт Фбүтээлдээ идэвхтэй ашигласан Английн агуу статистикч Р.Фишерийн (1890-1962) нэрээр нэрлэгдсэн.

Фишерийн тархалтыг регрессийн шинжилгээ, дисперсийн тэгш байдал болон хэрэглээний статистикийн бусад асуудлуудад загварын хангалттай байдлын талаархи таамаглалыг шалгахад ашигладаг.

Оюутны чухал утгын хүснэгт.

Маягтын эхлэл

Эрх чөлөөний зэрэглэлийн тоо, f Оюутны t-тестийн утга p=0.05
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.040
2.037
2.035
2.032
2.030
2.028
2.026
2.024
40-41 2.021
42-43 2.018
44-45 2.015
46-47 2.013
48-49 2.011
50-51 2.009
52-53 2.007
54-55 2.005
56-57 2.003
58-59 2.002
60-61 2.000
62-63 1.999
64-65 1.998
66-67 1.997
68-69 1.995
70-71 1.994
72-73 1.993
74-75 1.993
76-77 1.992
78-79 1.991
80-89 1.990
90-99 1.987
100-119 1.984
120-139 1.980
140-159 1.977
160-179 1.975
180-199 1.973
1.972
1.960

Энэ арга нь харьцуулсан популяцийн хоёр ерөнхий популяцийн дундаж утгыг гаргаж авдаг гэсэн таамаглалыг шалгах боломжийг танд олгоно. хамааралтайдээжүүд бие биенээсээ ялгаатай. Хараат байдлын таамаглал нь ихэвчлэн нэг дээж дээр шинж чанарыг хоёр удаа, жишээлбэл, интервенц хийхээс өмнө болон дараа нь хэмждэг гэсэн үг юм. Ерөнхий тохиолдолд нэг түүврийн төлөөлөгч бүрт өөр түүврийн төлөөлөгч (тэдгээрийг хос хосоор нь нэгтгэсэн) томилсон бөгөөд ингэснээр хоёр өгөгдлийн цуврал нь хоорондоо эерэг хамааралтай байна. Түүврийн хамаарлын сул төрлүүд: түүвэр 1 - нөхөр, 2 түүвэр - тэдний эхнэр; түүвэр 1 - нэг настай хүүхдүүд, түүвэр 2 нь 1-р түүврийн хүүхдүүдийн ихэр гэх мэт.

Турших боломжтой статистик таамаглал,өмнөх тохиолдлын адил H 0: М 1 = М 2(1 ба 2-р түүврийн дундаж утгууд ижил байна) Хэрэв үүнийг үгүйсгэвэл өөр таамаглалыг хүлээн авна М 1илүү бага) М 2.

Анхны таамаглалстатистик туршилтын хувьд:

□ нэг түүврийн төлөөлөгч бүр (нэг ерөнхий популяциас) өөр түүврийн төлөөлөгчтэй (өөр ерөнхий популяциас) холбоотой байх;

□ хоёр дээжийн өгөгдөл эерэг хамааралтай (хос маягт);

□ 2 түүвэр дэх судлагдсан шинж чанарын тархалт нь хэвийн хуультай тохирч байна.

Эх сурвалжийн өгөгдлийн бүтэц:Объект бүрийн хувьд судлагдсан шинж чанарын хоёр утга байдаг (хос бүрийн хувьд).

Хязгаарлалт:хоёр дээж дэх шинж чанарын тархалт хэвийн хэмжээнээс эрс ялгаатай байх ёсгүй; хоёр түүвэрт тохирох хоёр хэмжилтийн өгөгдөл нь эерэг хамааралтай байна.

Хувилбарууд: Wilcoxon T-тест, хэрэв дор хаяж нэг дээжийн тархалт хэвийн хэмжээнээс эрс ялгаатай бол; t-Бие даасан түүвэрт зориулсан оюутны тест - хэрэв хоёр түүврийн өгөгдөл эерэг хамааралгүй бол.

ТомъёоУчир нь Оюутны t тестийн эмпирик үнэ цэнэ нь ялгаатай байдлын шинжилгээний нэгж нь болохыг харуулж байна ялгаа (ээлж)ажиглалтын хос бүрийн онцлог шинж чанарууд. Үүний дагуу N хос шинж чанарын утгуудын хувьд эхлээд зөрүүг тооцоолно d i = x 1 i - x 2 i.

(3) энд M d – утгын дундаж зөрүү; σ d – зөрүүний стандарт хазайлт.

Тооцооллын жишээ:

Сургалтын үр нөлөөг шалгах явцад бүлгийн 8 гишүүн тус бүрээс “Таны санал бодол бүлгийн санал бодолтой хэр зэрэг давхцаж байна вэ?” гэсэн асуултыг тавьсан гэж бодъё. - бэлтгэлийн өмнө болон дараа хоёр удаа. Хариултуудад 10 онооны хэмжүүр ашигласан: 1 - хэзээ ч, 5 - хагас, 10 - үргэлж. Сургалтын үр дүнд оролцогчдын өөрийгөө үнэлэх үнэлэмж (бүлэгт бусадтай адил байх хүсэл) нэмэгдэнэ (α = 0.05) гэсэн таамаглалыг шалгасан. Завсрын тооцооллын хүснэгтийг байгуулъя (Хүснэгт 3).

Хүснэгт 3

M d = (-6)/8= -0.75 ялгааны арифметик дундаж. Энэ утгыг d бүрээс хасна (хүснэгтийн эцсийн багана).

Стандарт хазайлтын томъёо нь зөвхөн X-ийн оронд d гарч ирснээр ялгаатай байна. Бид шаардлагатай бүх утгыг орлуулж, бид үүнийг авна.

σ d = = 0.886.

Алхам 1. Шалгуурын эмпирик утгыг (3) томъёогоор тооцоолно: дундаж зөрүү Md= -0.75; стандарт хэлбэлзэл σ d = 0,886; t e = 2,39; df = 7.

Алхам 2. t-Оюутны шалгуурын эгзэгтэй утгуудын хүснэгтийг ашиглан бид ач холбогдлын p түвшинг тодорхойлно. df = 7-ийн хувьд эмпирик утга нь p = 0.05 ба p - 0.01-ийн чухал утгуудын хооронд байна. Тиймээс х< 0,05.

df Р
0,05 0,01 0,001
2,365 3,499 5,408

Алхам 3. Бид статистикийн шийдвэр гаргаж, дүгнэлт гаргадаг. Хөрөнгийн тэгш байдлын статистик таамаглалыг үгүйсгэв. Дүгнэлт: Сургалтын дараа оролцогчдын тохирлын бие даасан үнэлгээний үзүүлэлт статистикийн хувьд мэдэгдэхүйц нэмэгдсэн. (ач холбогдлын түвшинд х< 0,05).

Параметрийн аргууд орно шалгуурын дагуу хоёр түүврийн дисперсийн харьцуулалт Ф-Фишер.Заримдаа энэ арга нь үнэ цэнэтэй ач холбогдолтой дүгнэлтэд хүргэдэг бөгөөд бие даасан түүврийн хэрэгслийг харьцуулах тохиолдолд хэлбэлзлийг харьцуулах явдал юм. заавал байх ёстойжурам.

Тооцоолохын тулд F emта хоёр түүврийн дисперсийн харьцааг олох хэрэгтэй бөгөөд ингэснээр их дисперс нь тоологч хэсэгт, бага нь хуваарьт байна.

Өөрчлөлтийн харьцуулалт. Энэ арга нь харьцуулсан түүврийг авсан хоёр популяцийн хэлбэлзэл нь бие биенээсээ ялгаатай гэсэн таамаглалыг шалгах боломжийг олгодог. Туршилтын статистик таамаглал H 0: σ 1 2 = σ 2 2 (1-р түүврийн дисперс нь 2-р түүврийн дисперстэй тэнцүү). Хэрэв няцаагдсан бол нэг дисперс нөгөөгөөсөө их байна гэсэн өөр таамаглалыг хүлээн зөвшөөрнө.

Анхны таамаглал: судалж буй шинж чанарын хэвийн тархалттай өөр өөр популяциас санамсаргүй байдлаар хоёр дээж авсан.

Эх сурвалжийн өгөгдлийн бүтэц:судалж буй шинж чанарыг объектууд (субъектууд) -аар хэмждэг бөгөөд тус бүр нь харьцуулж буй хоёр дээжийн аль нэгэнд хамаарна.

Хязгаарлалт:Хоёр дээж дэх шинж чанарын тархалт нь ердийнхөөс тийм ч их ялгаатай биш юм.

Альтернатив арга:Левенийн тест, ашиглахад хэвийн байдлын таамаглалыг шалгах шаардлагагүй (SPSS програмд ​​ашигладаг).

ТомъёоФишерийн F тестийн эмпирик утгын хувьд:

(4)

хаана σ 1 2 - том тархалт, σ 2 2 - бага тархалт. Аль тархалт их байх нь тодорхойгүй байгаа тул p-түвшинг тодорхойлохын тулд үүнийг ашиглана Чиглэлгүй хувилбаруудын чухал утгуудын хүснэгт.Хэрэв F e > F Kpдараа нь эрх чөлөөний зэрэглэлийн харгалзах тооны хувьд Р < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Тооцооллын жишээ:

Хүүхдүүдэд арифметикийн байнгын бодлого өгч, дараа нь санамсаргүй түүврийн аргаар сонгогдсон сурагчдын нэг тал нь шалгалтанд тэнцээгүй, үлдсэн хэсэгт нь эсрэгээр нь хариулсан. Дараа нь хүүхэд бүрээс ижил төстэй асуудлыг шийдвэрлэхэд хэдэн секунд шаардагдахыг асуусан. Туршилт хийгч нь хүүхэд дуудсан цаг болон гүйцэтгэсэн даалгаврын үр дүнгийн хоорондох зөрүүг тооцоолсон (секундэд). Амжилтгүй болсон тухай мессеж нь хүүхдийн өөрийгөө үнэлэх үнэлэмжийг бага зэрэг бууруулна гэж таамаглаж байсан. Шалгагдаж буй таамаглал (α = 0.005 түвшинд) нийт өөрийгөө үнэлэх үнэлэмжийн хэлбэлзэл нь амжилт эсвэл бүтэлгүйтлийн тайлангаас хамаардаггүй (H 0: σ 1 2 = σ 2 2).

Дараах өгөгдлийг олж авлаа.


Алхам 1. (4) томъёог ашиглан шалгуурын эмпирик үнэ цэнэ ба эрх чөлөөний зэрэглэлийн тоог тооцоол.

Алхам 2. Фишерийн f-шалгуурын чухал утгуудын хүснэгтийн дагуу чиглүүлээгүйөөр сонголтуудын хувьд бид чухал утгыг олдог df дугаар = 11; df мэднэ= 11. Гэхдээ зөвхөн эгзэгтэй утга байна df дугаар= 10 ба df мэдэх = 12. Илүү олон тооны эрх чөлөөний зэрэг авах боломжгүй тул бид чухал утгыг авдаг df дугаар= 10: Учир нь Р = 0,05 F Kp = 3.526; Учир нь Р = 0,01 F Kp = 5,418.

Алхам 3. Статистикийн шийдвэр, утга учиртай дүгнэлт гаргах. Эмпирик утга нь эгзэгтэй утгаас давсан тул Р= 0.01 (мөн үүнээс ч илүү p = 0.05), дараа нь энэ тохиолдолд х< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (Р< 0.01). Тиймээс бүтэлгүйтлийн тухай мессежийн дараа өөрийгөө үнэлэх чадваргүй болох нь амжилтын тухай мессежээс илүү өндөр байдаг.

/ практик статистик / лавлах материал / оюутны t тестийн утга

Утгат -Оюутны t тест 0.10, 0.05, 0.01-ийн ач холбогдлын түвшинд.

ν - өөрчлөлтийн эрх чөлөөний зэрэг

Стандарт оюутны t-тестийн утгууд

Эрх чөлөөний зэрэглэлийн тоо

Ач холбогдолын түвшин

Эрх чөлөөний зэрэглэлийн тоо

Ач холбогдолын түвшин

Хүснэгт XI

Хоёр дээжийн ялгааны ач холбогдлыг үнэлэхэд ашигладаг стандарт Фишер тестийн утгууд

Эрх чөлөөний зэрэг

Ач холбогдолын түвшин

Эрх чөлөөний зэрэг

Ач холбогдолын түвшин

Оюутны t-тест

Оюутны t-тест- Оюутны тархалтад суурилсан таамаглалыг (статистикийн тест) статистик шалгах аргуудын ангиллын ерөнхий нэр. t-тестийн хамгийн түгээмэл хэрэглээ нь хоёр түүврийн дундаж утгуудын тэгш байдлыг шалгах явдал юм.

т-статистикийг ихэвчлэн дараах ерөнхий зарчмын дагуу байгуулдаг: тоологч нь 0 математикийн хүлээлттэй санамсаргүй хэмжигдэхүүн (хэрэв тэг таамаглал хангагдсан бол), хуваагч нь энэ санамсаргүй хэмжигдэхүүний түүврийн стандарт хазайлтыг квадрат язгуур болгон олж авдаг. холимог бус хэлбэлзлийн тооцоо.

Өгүүллэг

Энэхүү шалгуурыг Уильям Госсетт Гиннесийн компанийн шар айрагны чанарыг үнэлэх зорилгоор боловсруулсан. Худалдааны нууцыг задруулахгүй байх талаар компанийн өмнө хүлээсэн үүргүүдтэй холбогдуулан (Гиннесийн удирдлага ажилдаа статистикийн аппарат ашигладаг гэж үзсэн) Госсетийн нийтлэлийг 1908 онд Биометрик сэтгүүлд "Оюутан" гэсэн нууц нэрээр нийтлүүлсэн.

Өгөгдлийн шаардлага

Энэ шалгуурыг хэрэгжүүлэхийн тулд анхны өгөгдөл нь хэвийн тархалттай байх шаардлагатай. Бие даасан дээжийн хувьд хоёр түүврийн туршилтыг ашиглах тохиолдолд мөн ялгааны тэгш байдлын нөхцлийг дагаж мөрдөх шаардлагатай. Гэсэн хэдий ч тэгш бус хэлбэлзэлтэй нөхцөл байдлын хувьд Оюутны t тестээс өөр хувилбарууд байдаг.

Мэдээллийн хэвийн тархалтын шаардлага нь үнэн зөв t (\displaystyle t) -тест хийхэд зайлшгүй шаардлагатай. Гэсэн хэдий ч бусад өгөгдлийн хуваарилалттай ч гэсэн t (\displaystyle t) -статистикийг ашиглах боломжтой. Ихэнх тохиолдолд энэ статистик нь асимптотоор стандарт хэвийн тархалттай байдаг - N (0, 1) (\displaystyle N(0,1)) , тиймээс энэ тархалтын квантилуудыг ашиглаж болно. Гэсэн хэдий ч энэ тохиолдолд ч гэсэн квантилуудыг ихэвчлэн стандарт хэвийн тархалтын бус харин яг t (\displaystyle t) тестийн нэгэн адил харгалзах Оюутны тархалтыг ашигладаг. Эдгээр нь асимптотын хувьд тэнцүү боловч жижиг түүврийн хувьд Оюутны тархалтын итгэлийн интервалууд илүү өргөн бөгөөд найдвартай байдаг.

Нэг дээжийн t-тест

H 0: E (X) = m (\displaystyle H_(0):E(X)=m) математикийн хүлээлт E (X) (\displaystyle E(X))-ийн тэгш байдлын талаарх тэг таамаглалыг шалгахад ашигладаг. зарим мэдэгдэж буй утга m ( \displaystyle m) .

Мэдээжийн хэрэг, тэг таамаглал хангагдсан бол E (X ¯) = m (\displaystyle E((\overline (X)))=m) . Ажиглалтын бие даасан байдлыг харгалзан үзээд V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) . Хязгааргүй дисперсийн тооцоог ашиглан s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) бид дараах t-статистикийг олж авна.

t = X ¯ − m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

Тэг таамаглалын дагуу энэ статистикийн тархалт нь t (n − 1) (\displaystyle t(n-1)) байна. Үүний үр дүнд, хэрэв статистикийн үнэмлэхүй утга нь өгөгдсөн тархалтын (өгөгдсөн ач холбогдлын түвшинд) эгзэгтэй утгаас давсан бол тэг таамаглалыг үгүйсгэдэг.

Бие даасан дээжинд зориулсан хоёр дээжийн t-тест

Х 1, X 2 (\displaystyle X_(1),~X_(2) хэвийн тархсан санамсаргүй хэмжигдэхүүний n 1, n 2 (\displaystyle n_(1)~,~n_(2)) хоёр бие даасан түүвэр байг. )). Эдгээр санамсаргүй хэмжигдэхүүнүүдийн математик хүлээлтийн тэгш байдлын тэг таамаглалыг түүвэр өгөгдлийг ашиглан H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) шалгах шаардлагатай.

Түүврийн утгуудын хоорондын ялгааг авч үзье Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) . Мэдээжийн хэрэг, хэрэв тэг таамаглал үнэн бол E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) . Түүврийн бие даасан байдалд үндэслэн энэ зөрүүний дисперс тэнцүү байна: V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1) )^(2))( n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))) . Дараа нь шударга бус дисперсийн тооцоог ашиглан s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n)) ( X_(t)-(\overline (X)))^(2))(n-1))) бид түүврийн дундаж хоорондын зөрүүний дисперсийн бодит үнэлгээг олж авна: s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1))))+(\frac (s_(2)^( 2))(n_(2) ))) . Тиймээс тэг таамаглалыг шалгах t-статистик нь байна

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^(2))(n_(2))))) ))

Хэрэв тэг таамаглал үнэн бол энэ статистик нь t (d f) (\displaystyle t(df)) тархалттай, энд d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n) 1) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1)) +s_(2 )^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+ (s_(2)^(2)/n_(2))^(2)/(n_(2)-1))))

Тэнцүү дисперсийн тохиолдол

Хэрэв түүврийн дисперсүүд тэнцүү гэж үзвэл

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Дельта)=\сигма ^(2)\зүүн((\frac (1)(n_(1)))+(\ frac (1)(n_(2)))\баруун))

Дараа нь t-статистик нь:

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 (\ displaystyle t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1)(n_(1) )))+(\frac (1)(n_(2))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1)^ ( 2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2))))

Энэ статистик нь тархалттай t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2))

Хамааралтай түүврийн хоёр түүвэрт t-тест

Хоёр хамааралтай түүврийн (жишээлбэл, цаг хугацааны интервалтай ижил туршилтын хоёр дээж) хоорондын зөрүүний талаарх таамаглалыг шалгах нөхцөл байдалд t (\displaystyle t) -шалгуурын эмпирик утгыг тооцоолохын тулд дараахь томъёог ашиглана.

T = M d s d / n (\ displaystyle t=(\ frac (M_(d))(s_(d)/(\sqrt (n)))))

Энд M d (\displaystyle M_(d)) нь утгуудын дундаж зөрүү, s d (\displaystyle s_(d)) нь ялгааны стандарт хазайлт, n нь ажиглалтын тоо юм.

Энэ статистик нь t (n − 1) (\displaystyle t(n-1)) тархалттай байна.

Шугаман регрессийн параметрүүд дээр шугаман хязгаарлалтыг турших

Мөн t-тест нь энгийн хамгийн бага квадратуудаар үнэлэгдсэн шугаман регрессийн параметрүүд дээр дурын (ганц) шугаман хязгаарлалтыг шалгаж болно. H 0 таамаглалыг шалгах шаардлагатай байг: c T b = a (\displaystyle H_(0):c^(T)b=a) . Мэдээжийн хэрэг, тэг таамаг биелэгдвэл E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)= c^( T)E((\малгай (б)))-a=0) . Энд бид E (b ^) = b (\displaystyle E((\hat (b))))=b) загварын параметрүүдийн хамгийн бага квадратын үнэлгээний шинж чанарыг ашигладаг. Үүнээс гадна V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c (\displaystyle V(c^(T)(\hat (b))-a) )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) . Үл мэдэгдэх дисперсийн оронд түүний шударга бус үнэлгээг ашиглан s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) бид дараах t-статистикийг олж авна.

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\малгай (b))-a)(s(\sqrt (c^(T)) (X^(T)X)^(-1)c)))))

Энэ статистик нь тэг таамаглал хангагдсан үед t (n − k) (\displaystyle t(n-k)) тархалттай байх тул хэрэв статистикийн утга нь критик утгаас өндөр байвал шугаман хязгаарлалтын тэг таамаглал болно. татгалзсан байна.

Шугаман регрессийн коэффициентийн талаархи таамаглалыг шалгах

Шугаман хязгаарлалтын онцгой тохиолдол нь регрессийн коэффициент b j (\displaystyle b_(j)) нь тодорхой утгатай a (\displaystyle a) тэнцүү гэсэн таамаглалыг шалгах явдал юм. Энэ тохиолдолд харгалзах t-статистик нь:

T = b ^ j − a s b ^ j (\ displaystyle t = (\ frac ((\ малгай (б)) _ (j) - a) (s_ ((\ малгай (б)) _ (j)})))

Энд s b ^ j (\displaystyle s_((\hat (b))_(j))) нь коэффициентийн тооцооны стандарт алдаа - коэффициентийн тооцооллын ковариацын матрицын харгалзах диагональ элементийн квадрат язгуур.

Хэрэв тэг таамаглал үнэн бол энэ статистикийн тархалт t (n − k) (\displaystyle t(n-k)) байна. Хэрэв статистикийн үнэмлэхүй утга нь эгзэгтэй утгаас өндөр байвал коэффициент ба a (\displaystyle a) хоорондын зөрүү нь статистикийн хувьд чухал (санамсаргүй бус), өөрөөр хэлбэл ач холбогдолгүй (санамсаргүй, өөрөөр хэлбэл жинхэнэ коэффициент нь a (\ дэлгэцийн хэв маяг a))-ийн тооцоолсон утгатай тэнцүү эсвэл маш ойрхон байж магадгүй

Сэтгэгдэл

Математикийн хүлээлтэд зориулсан нэг түүвэр тестийг шугаман регрессийн параметрүүд дээр шугаман хязгаарлалтыг турших болгон бууруулж болно. Нэг түүвэр тестийн хувьд энэ нь тогтмол дээр "регресс" юм. Иймд регрессийн s 2 (\displaystyle s^(2)) нь судалж буй санамсаргүй хэмжигдэхүүний дисперсийн түүврийн тооцоо бөгөөд X T X (\displaystyle X^(T)X) матриц нь n (\displaystyle n)-тэй тэнцүү байна. ) , мөн загварын “коэффицент”-ийн үнэлгээ нь түүврийн дундажтай тэнцүү байна. Эндээс бид ерөнхий тохиолдлын хувьд дээр өгөгдсөн t-статистикийн илэрхийлэлийг олж авна.

Үүний нэгэн адил түүврийн зөрүүтэй хоёр түүвэр тест нь шугаман хязгаарлалтыг турших хүртэл бууруулж байгааг харуулж болно. Хоёр түүврийн тестийн хувьд энэ нь тогтмол ба "регресс" ба дамми хувьсагчийн утгаас (0 эсвэл 1) хамаарч дэд түүврийг тодорхойлох явдал юм: y = a + b D (\displaystyle y=a+bD) . Түүврийн математикийн хүлээлтийн тэгш байдлын тухай таамаглалыг энэ загварын b коэффициентийн тэгтэй тэнцүү байх таамаглал болгон томъёолж болно. Энэ таамаглалыг шалгахад тохиромжтой t-статистик нь хоёр түүврийн тестийн t-статистиктай тэнцүү болохыг харуулж болно.

Үүнийг мөн өөр өөр тархалтын үед шугаман хязгаарлалтыг шалгахад багасгаж болно. Энэ тохиолдолд загварын алдааны хэлбэлзэл нь хоёр утгыг авна. Эндээс та хоёр түүврийн тестийн өгөгдсөнтэй төстэй t-статистикийг олж авч болно.

Параметрийн бус аналогууд

Бие даасан дээжийн хоёр сорьцын аналог нь Манн-Уитни У тест юм. Хамааралтай дээжийн нөхцөл байдлын хувьд аналог нь тэмдгийн тест ба Вилкоксон Т-тест юм

Уран зохиол

Оюутан.Дундажын магадлалын алдаа. // Биометрика. 1908. No 6 (1). P. 1-25.

Холбоосууд

Новосибирскийн Улсын Техникийн Их Сургуулийн вэбсайт дээрх хэрэгслийн нэгэн төрлийн байдлын талаархи таамаглалыг шалгах шалгуурын талаар

Статистикийн таамаглалыг шалгах нь түүврийн өгөгдөл дээр үндэслэн популяцийн шинж чанарын талаар хүчтэй дүгнэлт гаргах боломжийг олгодог. Янз бүрийн таамаглал байдаг. Тэдний нэг нь дундаж (математикийн хүлээлт) тухай таамаглал юм. Үүний мөн чанар нь зөвхөн байгаа түүвэр дээр үндэслэн ерөнхий дундаж хаана байрлаж болох, эсвэл хаана байх талаар зөв дүгнэлт гаргах явдал юм (бид яг үнэнийг хэзээ ч мэдэхгүй, гэхдээ бид хайлтыг нарийсгаж болно).

Таамаглалыг шалгах ерөнхий арга барилыг тодорхойлсон тул шууд гол зүйлдээ орцгооё. Юуны өмнө түүврийг санамсаргүй хэмжигдэхүүний хэвийн олонлогоос авсан гэж үзье Xерөнхий дундажтай μ болон хэлбэлзэл σ 2(Би мэднэ, ийм зүйл болохгүй гэдгийг би мэдэж байна, гэхдээ намайг битгий таслаарай!). Энэ түүврийн арифметик дундаж нь өөрөө санамсаргүй хэмжигдэхүүн болох нь ойлгомжтой. Хэрэв та ийм олон түүврийг гаргаж аваад дундаж утгыг нь тооцвол тэд бас математикийн хүлээлттэй болно μ Тэгээд

Дараа нь санамсаргүй хэмжигдэхүүн

Асуулт гарч ирнэ: 95% магадлалтай ерөнхий дундаж нь ±1.96 дотор байх уу? s x̅. Өөрөөр хэлбэл санамсаргүй хэмжигдэхүүний тархалт юм

тэнцүү.

Энэ асуултыг Дублин (Ирланд) дахь Гиннесийн шар айрагны үйлдвэрт ажиллаж байсан химич анх тавьсан (мөн шийдсэн). Уг химичийг Виллиам Сили Госсетт гэдэг бөгөөд химийн шинжилгээнд зориулж шар айрагны дээж авчээ. Хэзээ нэгэн цагт Уильям дундаж дүнгийн хуваарилалтын талаар тодорхойгүй эргэлзээнээсээ болж зовж шаналж эхэлсэн бололтой. Энэ нь ердийн хуваарилалтаас арай илүү түрхсэн байсан.

Математик үндэслэлийг цуглуулж, нээсэн тархалтын функцийн утгыг тооцоолсны дараа Дублиний химич Уильям Госсет Биометрикс сэтгүүлийн 1908 оны 3-р сарын дугаарт хэвлэгдсэн тэмдэглэл бичжээ (ерөнхий редактор - Карл Пирсон). Учир нь Гиннес нь Оюутны нууц нэрээр гарын үсэг зурсан шар айраг исгэх нууцыг өгөхийг хатуу хориглов.

К.Пирсон тархалтыг аль хэдийн зохион бүтээсэн ч хэвийн байдлын ерөнхий санаа давамгайлсан хэвээр байна. Түүврийн онооны хуваарилалт хэвийн биш байж магадгүй гэж хэн ч бодохгүй байсан. Тиймээс В.Госсетийн нийтлэл бараг анзаарагдахгүй, мартагдсан хэвээр байв. Госсетийн нээлтийг зөвхөн Рональд Фишер л үнэлэв. Фишер шинэ түгээлтийг ажилдаа ашиглаж, түүнд нэр өгсөн Оюутны t хуваарилалт. Үүний дагуу таамаглалыг шалгах шалгуур болсон Оюутны t-тест. Түүврийн мэдээлэлд дүн шинжилгээ хийх эрин үе рүү шилжсэн статистикт “хувьсгал” ийнхүү өрнөсөн юм. Энэ бол түүхэнд хийсэн богино хэмжээний аялал байв.

В.Госсет юу харж болохыг харцгаая. 6 ажиглалтаас дунджаар 20 мянган хэвийн дээж гаргацгаая ( ) 50 ба стандарт хазайлт ( σ ) 10. Дараа нь хэрэглэж байгаа түүврийн хэрэгслийг хэвийн болгоно ерөнхий ялгаа:

Бид үүссэн 20 мянган дундаж утгыг 0.1 урттай интервалд бүлэглэж, давтамжийг тооцоолно. Диаграмм дээр түүврийн хэрэгслийн бодит (Норм) ба онолын (ENorm) давтамжийн тархалтыг дүрсэлцгээе.

Цэгүүд (ажиглагдсан давтамжууд) нь шугамтай (онолын давтамж) бараг давхцдаг. Энэ нь ойлгомжтой, учир нь өгөгдлийг ижил нийтлэг хүн амаас авсан бөгөөд ялгаа нь зөвхөн түүвэрлэлтийн алдаа юм.

Шинэ туршилт хийцгээе. Бид дундаж утгыг ашиглан хэвийн болгодог түүврийн зөрүү.

Давтамжуудыг дахин тоолж, харьцуулах стандарт хэвийн тархалтын шугамыг үлдээж цэг хэлбэрээр диаграмм дээр зуръя. Дундажуудын эмпирик давтамжийг үсгээр тэмдэглэе т.

Энэ удаагийн хуваарилалт төдийлөн давхцахгүй байгаа нь харагдаж байна. Хаах, тийм, гэхдээ адилхан биш. Сүүл нь илүү "хүнд" болсон.

Gosset-Student-д MS Excel-ийн хамгийн сүүлийн хувилбар байхгүй байсан ч энэ нь түүний анзаарсан нөлөө юм. Яагаад ийм зүйл болдог вэ? Тайлбар нь санамсаргүй хэмжигдэхүүн юм

нь зөвхөн түүвэрлэлтийн алдаанаас (тоологч) төдийгүй, мөн санамсаргүй хэмжигдэхүүн болох дундаж (хүлээн авагч) стандарт алдаанаас хамаарна.

Ийм санамсаргүй хэмжигдэхүүн ямар тархалттай байх ёстойг бага зэрэг харцгаая. Эхлээд та математикийн статистикаас ямар нэг зүйлийг санах (эсвэл сурах) хэрэгтэй болно. Фишерийн теорем байдаг бөгөөд энэ нь ердийн тархалтын түүвэрт:

1. дунд болон түүврийн зөрүү с 2бие даасан хэмжигдэхүүнүүд;

2. түүврийн болон популяцийн дисперсийн харьцааг эрх чөлөөний зэрэгтэй үржүүлсэн харьцаа нь тархалттай байна. χ 2(хи-квадрат) ижил тооны эрх чөлөөний зэрэгтэй, i.e.

Хаана к– эрх чөлөөний зэрэглэлийн тоо (англи хэлээр эрх чөлөөний зэрэг (d.f.))

Ердийн загваруудын статистикийн бусад олон үр дүн энэ хуульд үндэслэсэн болно.

Дундажын тархалт руу буцъя. Илэрхийллийн тоо ба хуваагчийг хуваа

дээр σ X̅. Бид авдаг

Тоолуур нь стандарт хэвийн санамсаргүй хэмжигдэхүүн юм (бид үүнийг тэмдэглэнэ ξ (xi)). Фишерийн теоремоос хуваагчийг илэрхийлье.

Дараа нь анхны илэрхийлэл нь хэлбэрийг авна

Энэ бол ерөнхий хэлбэрээр (Оюутны харилцаа) юм. Та түүний түгээлтийн функцийг шууд гаргаж болно, учир нь Энэ илэрхийлэл дэх санамсаргүй хэмжигдэхүүний аль алиных нь тархалтыг мэддэг. Энэ таашаалыг математикчдад үлдээе.

Оюутны t-тархалтын функц нь ойлгоход нэлээд төвөгтэй томьёотой тул дүн шинжилгээ хийх нь утгагүй юм. Хэн ч үүнийг ашигладаггүй, учир нь ... магадлалыг Оюутны тархалтын тусгай хүснэгтэд (заримдаа Оюутны коэффициентийн хүснэгт гэж нэрлэдэг) өгөгдсөн, эсвэл PC-ийн томъёонд оруулсан болно.

Тиймээс та энэхүү шинэ мэдлэгээр зэвсэглэснээр Оюутны хуваарилалтын албан ёсны тодорхойлолтыг ойлгож чадна.
Оюутны тархалтад хамаарах санамсаргүй хэмжигдэхүүн кэрх чөлөөний зэрэг нь бие даасан санамсаргүй хэмжигдэхүүнүүдийн харьцаа юм

Хаана ξ стандарт хэвийн хуулийн дагуу хуваарилагдсан, мөн χ 2 кхуваарилалтыг дагаж мөрддөг χ 2в кэрх чөлөөний зэрэг.

Ийнхүү Оюутны t арифметик дундажийг шалгах томьёо

Оюутны харилцааны онцгой тохиолдол байдаг

Томъёо, тодорхойлолтоос харахад Оюутны t-тестийн тархалт нь зөвхөн эрх чөлөөний зэрэглэлийн тооноос хамаарна.

At к> 30 t-тест нь стандарт хэвийн тархалтаас бараг ялгаатай биш юм.

Хи квадратаас ялгаатай нь t-тест нь нэг эсвэл хоёр сүүлтэй байж болно. Дунджаас хоёр чиглэлд хазайлт үүсч болно гэж үзвэл ихэвчлэн хоёр талыг ашигладаг. Гэхдээ асуудлын нөхцөл нь зөвхөн нэг чиглэлд хазайхыг зөвшөөрдөг бол нэг талын шалгуурыг ашиглах нь үндэслэлтэй юм. Энэ нь хүчийг бага зэрэг нэмэгдүүлдэг, учир нь... Тогтмол ач холбогдлын түвшинд эгзэгтэй утга нь тэг рүү бага зэрэг ойртдог.

Student's t-test ашиглах нөхцөл

Оюутны нээлт нэгэн зэрэг статистикийг өөрчилсөн хэдий ч t-тест нь хэрэглэх боломжоороо нэлээд хязгаарлагдмал хэвээр байгаа тул өөрөө анхны өгөгдлийн хэвийн тархалт гэсэн таамаглалаас үүдэлтэй. Хэрэв өгөгдөл хэвийн биш бол (энэ нь ихэвчлэн тохиолддог) t-тест нь Оюутны тархалтгүй болно. Гэсэн хэдий ч төвлөрсөн хязгаарын теоремын үйл ажиллагааны улмаас хэвийн бус өгөгдлийн дундаж нь хурдан хонх хэлбэртэй тархалтыг олж авдаг.

Жишээлбэл, 5 градусын эрх чөлөө бүхий хи-квадрат тархалт гэх мэт баруун тийшээ хүчтэй хазайсан өгөгдлийг авч үзье.

Одоо 20 мянган дээж үүсгэж, тэдгээрийн эзлэхүүнээс хамааран дундаж үзүүлэлтүүдийн тархалт хэрхэн өөрчлөгдөж байгааг ажиглацгаая.

15-20 ажиглалтын жижиг дээжүүдэд ялгаа нь мэдэгдэхүйц юм. Гэхдээ дараа нь хурдан алга болдог. Тиймээс хэвийн бус тархалт нь мэдээжийн хэрэг сайн биш боловч чухал биш юм.

Хамгийн гол нь t-тест нь хэт давсан үзүүлэлтээс "айдаг", өөрөөр хэлбэл. хэвийн бус хазайлт. Тус бүрдээ 15 ажиглалтын 20 мянган хэвийн дээж авч, заримд нь нэг санамсаргүй хэтийн үзүүлэлтийг нэмье.

Зураг нь бүрхэг болж хувирав. Дундаж үзүүлэлтүүдийн бодит давтамж нь онолын давтамжаас эрс ялгаатай. Ийм нөхцөлд t-тараалтыг ашиглах нь маш эрсдэлтэй ажил болж хувирдаг.

Тиймээс тийм ч жижиг биш дээжүүдэд (15 ажиглалтаас) t-тест нь анхны өгөгдлийн хэвийн бус тархалтад харьцангуй тэсвэртэй байдаг. Гэвч өгөгдлийн үл хамаарах үзүүлэлтүүд нь t-тестийн тархалтыг ихээхэн гажуудуулж, улмаар статистикийн дүгнэлтэд алдаа гаргахад хүргэдэг тул хэвийн бус ажиглалтыг арилгах хэрэгтэй. Ихэнхдээ дунджаас ±2 стандарт хазайлтад багтсан бүх утгыг дээжээс хасдаг.

Математикийн хүлээлтийн талаарх таамаглалыг MS Excel программ дээр Оюутны t-тест ашиглан шалгах жишээ

Excel нь t тархалттай холбоотой хэд хэдэн функцтэй. Тэднийг харцгаая.

STUDENT.DIST – “сонгодог” зүүн талын Оюутны t-тараалт. Оролт нь t-шалгуурын утга, эрх чөлөөний зэрэглэлийн тоо, нягтрал эсвэл функцийн утга гэсэн зүйлийг тооцоолох шаардлагатайг тодорхойлдог сонголт (0 эсвэл 1) юм. Гаралтын үр дүнд бид санамсаргүй хэмжигдэхүүн нь аргументад заасан t-шалгуураас бага байх нягтрал эсвэл магадлалыг олж авдаг.

STUDENT.DIST.2X – хоёр талын хуваарилалт. Аргумент нь t-тестийн үнэмлэхүй утга (модуль) ба эрх чөлөөний зэрэглэлийн тоо юм. Үүний үр дүнд бид ижил эсвэл бүр илүү их t-шалгуурын утгыг олж авах магадлалыг олж авдаг. бодит ач холбогдлын түвшин (p-түвшин).

STUDENT.DIST.PH – баруун талын t тархалт. Тэгэхээр 1-ОЮУТАН.ДИСТ(2;5;1) = ОЮУТАН.ДИСТ.PH(2;5) = 0.05097. Хэрэв t-тест эерэг байвал гарах магадлал нь p-түвшин болно.

STUDENT.INR – t тархалтын зүүн талын урвуу утгыг тооцоолоход ашигладаг. Аргумент нь магадлал ба эрх чөлөөний зэрэглэлийн тоо юм. Гаралт дээр бид энэ магадлалд тохирох t-шалгуурын утгыг олж авна. Магадлалын тоо зүүн талд байна. Тиймээс зүүн сүүл нь өөрөө ач холбогдлын түвшинг шаарддаг α , барууны хувьд 1 - α .

STUDENT.OBR.2X – хоёр талт Оюутны тархалтын урвуу утга, өөрөөр хэлбэл. t-туршилтын утга (модуль). Ач холбогдлын түвшинг мөн оролтод оруулсан болно α . Зөвхөн энэ удаад тооллогыг хоёр талаас нэгэн зэрэг хийх тул магадлалыг хоёр сүүлт хуваана. Тэгэхээр ОЮУТАН.АРВ(1-0.025;5) = ОЮУТАН.АРВ.2Х(0.05;5) = 2.57058

STUDENT.TEST нь хоёр түүврийн математикийн хүлээлтийн тэгш байдлын талаарх таамаглалыг шалгах функц юм. Олон тооны тооцооллыг орлуулдаг, учир нь Зөвхөн хоёр мужийг өгөгдөл болон хэд хэдэн параметрээр зааж өгөхөд хангалттай. Гаралт нь p түвшний байна.

ИТГЭЛ.СУРАГЧ – t тархалтыг харгалзан дундажийн итгэлийн интервалыг тооцоолох.

Энэ сургалтын жишээг авч үзье. ААН-д цементийг 50 кг-аар савлаж байна. Санамсаргүй байдлаас шалтгаалан нэг уутанд хүлээгдэж буй массаас зарим хазайлтыг зөвшөөрдөг боловч ерөнхий дундаж нь 50 кг хэвээр байх ёстой. Чанарын хяналтын хэлтэс санамсаргүй байдлаар 9 уутыг жинлэж дараах үр дүнг авсан: дундаж жин ( ) 50.3 кг, стандарт хазайлт ( с) - 0.5 кг.

Энэ үр дүн нь ерөнхий дундаж нь 50 кг гэсэн тэг таамаглалтай нийцэж байна уу? Өөрөөр хэлбэл, тоног төхөөрөмж хэвийн ажиллаж, дунджаар 50 кг дүүргэлт хийвэл санамсаргүй байдлаар ийм үр дүнд хүрэх боломжтой юу? Хэрэв таамаглалыг үгүйсгээгүй бол үүссэн ялгаа нь санамсаргүй хэлбэлзлийн мужид багтах боловч хэрэв таамаглал няцаагдсан бол уутыг дүүргэх машины тохиргоонд гэмтэл гарсан байх магадлалтай. Үүнийг шалгаж, тохируулах шаардлагатай.

Нийтээр хүлээн зөвшөөрөгдсөн тэмдэглэгээний богино нөхцөл нь иймэрхүү харагдаж байна.

H0: μ = 50 кг

H1: μ ≠ 50 кг

Цүнх дүүргэлтийн хуваарилалт нь ердийн хуваарилалтын дагуу (эсвэл түүнээс нэг их ялгаатай биш) гэж үзэх үндэслэл бий. Энэ нь математикийн хүлээлтийн талаарх таамаглалыг шалгахын тулд та Оюутны t-тестийг ашиглаж болно гэсэн үг юм. Санамсаргүй хазайлт аль ч чиглэлд тохиолдож болох бөгөөд энэ нь хоёр талт t-тест шаардлагатай гэсэн үг юм.

Нэгдүгээрт, бид antideluluian хэрэгслийг ашиглана: t-шалгуурыг гараар тооцоолж, хүснэгтийн чухал утгатай харьцуулах. Тооцоолсон t-тест:

Одоо гарсан тоо нь ач холбогдлын түвшний эгзэгтэй түвшнээс давсан эсэхийг тодорхойлъё α = 0.05. Оюутны t хуваарилалтын хүснэгтийг ашиглацгаая (статистикийн ямар ч сурах бичигт байдаг).

Баганууд нь тархалтын баруун талын магадлалыг, мөр нь эрх чөлөөний зэрэглэлийн тоог харуулдаг. Бид 0.05-ын ач холбогдлын түвшинтэй хоёр сүүлт t-тестийг сонирхож байгаа бөгөөд энэ нь баруун талын ач холбогдлын түвшний хагасын t-утгатай тэнцэх болно: 1 - 0.05/2 = 0.975. Эрх чөлөөний зэрэглэлийн тоо нь түүврийн хэмжээ хасах 1, i.e. 9 - 1 = 8. Уулзвар дээр бид t-туршилтын хүснэгтийн утгыг олно - 2.306. Хэрэв бид стандарт хэвийн тархалтыг ашигласан бол эгзэгтэй цэг нь 1.96 байх болно, гэхдээ энд илүү том байна, учир нь Жижиг дээж дэх t-тархалт нь илүү хавтгай хэлбэртэй байдаг.

Бодит (1.8) болон хүснэгтийн утгыг (2.306) харьцуулж үзье. Тооцоолсон шалгуур нь хүснэгтэд үзүүлсэнээс бага байна. Тиймээс, байгаа өгөгдөл нь ерөнхий дундаж нь 50 кг гэсэн H 0 таамаглалтай зөрчилддөггүй (гэхдээ үүнийг батлахгүй). Хүснэгтийг ашиглан бид үүнийг л сурч чадна. Мэдээжийн хэрэг та p-түвшинг олохыг оролдож болно, гэхдээ энэ нь ойролцоогоор байх болно. Дүрмээр бол энэ нь таамаглалыг шалгахад хэрэглэгддэг p түвшин юм. Тиймээс бид Excel рүү шилжинэ.

Excel дээр t тестийг тооцоолох бэлэн функц байхгүй байна. Гэхдээ энэ нь аймшигтай биш, учир нь Оюутны t-тестийн томъёо нь маш энгийн бөгөөд Excel-ийн нүдэнд амархан бүтээгддэг.

Бид ижил 1.8 оноо авсан. Эхлээд эгзэгтэй утгыг олъё. Бид альфа 0.05-ыг авдаг, шалгуур нь хоёр сүүлтэй. STUDENT.OBR.2X хоёр талт таамаглалд урвуу t-тархалтын функц хэрэгтэй.

Үүссэн утга нь чухал бүсийг таслана. Ажиглагдсан t-тест үүнд ордоггүй тул таамаглалыг үгүйсгэхгүй.

Гэхдээ энэ нь хүснэгтийн утгыг ашиглан таамаглалыг шалгахтай ижил арга юм. Энэ нь p-түвшинг тооцоолоход илүү мэдээлэлтэй байх болно, i.e. Хэрэв энэ таамаглал зөв бол дунджаар 50 кг-аас ажиглагдсан эсвэл түүнээс дээш хазайлтыг олж авах магадлал. STUDENT.DIST.2X гэсэн хоёр талт таамаглалд Оюутны хуваарилалтын функц хэрэгтэй болно.

P-түвшин нь 0.1096 бөгөөд энэ нь 0.05-ийн зөвшөөрөгдөх ач холбогдлын түвшингээс их байна - бид таамаглалыг үгүйсгэхгүй. Харин одоо бид нотлох баримтын түвшинг шүүж чадна. P-түвшин нь таамаглалыг няцаах үеийн түвшинд нэлээд дөхөж очсон бөгөөд энэ нь янз бүрийн бодолд хүргэдэг. Жишээлбэл, түүвэр нь мэдэгдэхүйц хазайлтыг илрүүлэхэд хэтэрхий бага байсан.

Хэсэг хугацааны дараа уут дүүргэх стандартыг хэрхэн хангаж байгааг шалгахаар хяналтын хэлтэст дахин шийднэ үү. Энэ удаад илүү найдвартай байхын тулд 9 биш, 25 уут сонгосон. Дундажын тархалт буурах нь ойлгомжтой бөгөөд ингэснээр системд алдаа гарах магадлал нэмэгддэг.

Түүврийн дундаж ба стандарт хазайлтын утгыг анх удаа (50.3 ба 0.5 тус тус) авсан гэж үзье. t тестийг тооцоолъё.


Эрх чөлөөний 24 градус ба α = 0.05-ийн чухал утга нь 2.064 байна. Доорх зураг нь t-тест нь таамаглалыг үгүйсгэх хязгаарт багтаж байгааг харуулж байна.

95% -иас дээш итгэлтэй байх магадлалтай бол ерөнхий дундаж нь 50 кг-аас ялгаатай гэж бид дүгнэж болно. Илүү итгэлтэй байхын тулд p-түвшинг (хүснэгтийн сүүлчийн мөр) харцгаая. Хэрэв таамаглал зөв бол 50-аас ижил буюу түүнээс дээш хазайлттай дундажийг авах магадлал 0.0062 буюу 0.62% байдаг бөгөөд энэ нь нэг хэмжилтээр бараг боломжгүй юм. Ерөнхийдөө бид таамаглалыг магадлал багатай гэж үгүйсгэдэг.

Оюутны t-тархалтыг ашиглан итгэлийн интервалыг тооцоолох

Өөр нэг статистик арга нь таамаглалыг шалгахтай нягт холбоотой байдаг. итгэлцлийн интервалын тооцоо. Хэрэв үүссэн интервал нь тэг таамаглалд тохирох утгыг агуулж байвал энэ нь тэг таамаглалыг үгүйсгээгүйтэй тэнцүү байна. Үгүй бол таамаглалыг харгалзах итгэлийн түвшинд үгүйсгэнэ. Зарим тохиолдолд шинжээчид таамаглалыг сонгодог хэлбэрээр огт шалгадаггүй, харин зөвхөн итгэлийн интервалыг тооцдог. Энэ арга нь танд илүү хэрэгтэй мэдээллийг гаргаж авах боломжийг олгодог.

9 ба 25 ажиглалтын дундаж утгын итгэлцлийн интервалыг тооцоолъё. Үүний тулд бид Excel-ийн CONFIDENT.STUDENT функцийг ашиглана. Энд, хачирхалтай нь, бүх зүйл маш энгийн. Функцийн аргументууд нь зөвхөн ач холбогдлын түвшинг зааж өгөх ёстой α , түүврийн стандарт хазайлт ба түүврийн хэмжээ. Гаралтын үед бид итгэлцлийн интервалын хагас өргөнийг, өөрөөр хэлбэл дундаж утгыг хоёр талд байрлуулах шаардлагатай утгыг авдаг. Тооцооллыг хийж, харааны диаграммыг зурсны дараа бид дараахь зүйлийг олж авна.

Таны харж байгаагаар түүврийн 9 ажиглалтын хувьд 50-ийн утга нь итгэлцлийн интервалд (таамаглалыг үгүйсгээгүй), 25 ажиглалтад итгэх интервалд багтахгүй (таамаглалыг үгүйсгэдэг). Түүнээс гадна 25 ууттай туршилтаар 97.5% магадлалтайгаар ерөнхий дундаж нь 50.1 кг-аас хэтэрсэн гэж хэлж болно (итгэлийн интервалын доод хязгаар нь 50.094 кг). Мөн энэ бол маш үнэ цэнэтэй мэдээлэл юм.

Тиймээс бид ижил асуудлыг гурван аргаар шийдсэн.

1. Эртний аргыг ашиглан t тестийн тооцоолсон болон хүснэгтийн утгыг харьцуулах
2. Таамаглалыг няцаахдаа итгэлийн түвшинг нэмж p-түвшинг тооцоолсноор илүү орчин үеийн.
3. Итгэлийн интервалыг тооцоолж, ерөнхий дундажийн хамгийн бага утгыг олж авснаар бүр илүү мэдээлэлтэй болно.

Т-тест нь параметрийн аргуудыг хэлдэг гэдгийг санах нь чухал, учир нь нь хэвийн тархалт дээр суурилдаг (энэ нь дундаж ба дисперс гэсэн хоёр параметртэй). Тиймээс үүнийг амжилттай ашиглахын тулд наад зах нь анхны өгөгдлийн ойролцоогоор хэвийн байдал, хэт давсан үзүүлэлт байхгүй байх нь чухал юм.

Эцэст нь би Excel-ийн Оюутны t-тесттэй холбоотой тооцооллыг хэрхэн хийх талаар видео үзэхийг санал болгож байна.

​ Оюутны t-тест нь Оюутны тархалт дээр суурилсан таамаглалыг (статистикийн тест) статистик шалгах аргуудын ерөнхий нэр юм. t-тестийн хамгийн түгээмэл хэрэглээ нь хоёр түүврийн дундаж утгуудын тэгш байдлыг шалгах явдал юм.

1. t-тестийн хөгжлийн түүх

Энэ шалгуурыг боловсруулсан Уильям ГоссеттГиннесийн компанид шар айрагны чанарыг үнэлэх. Худалдааны нууцыг задруулахгүй байх талаар компанийн өмнө хүлээсэн үүргийн улмаас Госсетийн нийтлэл 1908 онд Биометрик сэтгүүлд "Оюутан" гэсэн нууц нэрээр хэвлэгджээ.

2. Оюутны t-тестийг юунд ашигладаг вэ?

Оюутны t тестийг дундаж утгын ялгааны статистик ач холбогдлыг тодорхойлоход ашигладаг. Бие даасан дээжийг харьцуулах тохиолдолд хоёуланг нь ашиглаж болно ( жишээлбэл, чихрийн шижингийн бүлэг, эрүүл бүлгүүд) болон холбогдох популяцийг харьцуулах үед ( жишээлбэл, хэм алдагдалын эсрэг эм хэрэглэхээс өмнө болон дараа нь ижил өвчтөнд зүрхний дундаж цохилт).

3. Оюутны t-тестийг ямар тохиолдолд ашиглаж болох вэ?

Оюутны t тестийг хэрэглэхийн тулд анхны өгөгдөлтэй байх шаардлагатай хэвийн тархалт. Бие даасан дээжийн хувьд хоёр түүврийн шалгуурыг хэрэглэх тохиолдолд нөхцөлийг хангах шаардлагатай. хэлбэлзлийн тэгш байдал (гомоскедастик)..

Хэрэв эдгээр нөхцөл хангагдаагүй бол түүврийн хэрэгслийг харьцуулахдаа ижил төстэй аргыг хэрэглэнэ. параметрийн бус статистик, тэдгээрийн хамгийн алдартай нь юм Mann-Whitney U тест(бие даасан дээжийн хоёр түүвэр туршилтын хувьд) болон тэмдгийн шалгуурТэгээд Вилкоксоны тест(хамааралтай түүврийн тохиолдолд хэрэглэнэ).

4. Оюутны t тестийг хэрхэн тооцох вэ?

Дундаж утгыг харьцуулахын тулд Оюутны t тестийг дараах томъёогоор тооцоолно.

Хаана М 1- эхний харьцуулсан хүн амын (бүлэг) арифметик дундаж; М 2- хоёр дахь харьцуулсан хүн амын (бүлэг) арифметик дундаж; м 1- эхний арифметик дундажийн дундаж алдаа; м 2- хоёр дахь арифметик дундажийн дундаж алдаа.

5. Оюутны t-тестийн утгыг хэрхэн тайлбарлах вэ?

Үүссэн Оюутны t-тестийн утгыг зөв тайлбарлах ёстой. Үүнийг хийхийн тулд бид бүлэг тус бүрийн хичээлийн тоог (n 1 ба n 2) мэдэх хэрэгтэй. Эрх чөлөөний зэрэглэлийн тоог олох едараах томъёоны дагуу:

f = (n 1 + n 2) - 2

Үүний дараа бид Оюутны t-тестийн чухал утгыг шаардлагатай ач холбогдлын түвшин (жишээ нь, p = 0.05) болон өгөгдсөн тооны эрх чөлөөний градусын хувьд тодорхойлдог. ехүснэгтийн дагуу ( доороос үзнэ үү).

Бид шалгуур үзүүлэлтийн чухал ба тооцоолсон утгыг харьцуулж үздэг.

  • Хэрэв Оюутны t тестийн тооцоолсон утга тэнцүү буюу түүнээс дээшХүснэгтээс олж авсан чухал ач холбогдолтой, харьцуулсан утгуудын хоорондын ялгаа нь статистикийн хувьд чухал ач холбогдолтой гэж бид дүгнэж байна.
  • Хэрэв тооцоолсон Оюутны t тестийн утга багахүснэгт хэлбэртэй бөгөөд энэ нь харьцуулсан утгуудын хоорондын ялгаа нь статистик ач холбогдолгүй гэсэн үг юм.

6. Оюутны t тестийг тооцоолох жишээ

Шинэ төмрийн бэлдмэлийн үр нөлөөг судлахын тулд цус багадалттай хоёр бүлгийн өвчтөнүүдийг сонгосон. Эхний бүлэгт өвчтөнүүд хоёр долоо хоногийн турш шинэ эм, хоёрдугаар бүлэгт плацебо хүлээн авсан. Үүний дараа захын цусан дахь гемоглобины түвшинг хэмжсэн. Эхний бүлэгт гемоглобины дундаж түвшин 115.4±1.2 г/л, хоёрдугаар бүлэгт 103.7±2.3 г/л байна (өгөгдлийг форматаар үзүүлэв. М±м), харьцуулж буй популяци нь хэвийн тархалттай байна. Эхний бүлгийн тоо 34, хоёрдугаарт 40 өвчтөн байна. Олж авсан ялгааны статистикийн ач холбогдол, шинэ төмрийн бэлдмэлийн үр нөлөөний талаар дүгнэлт хийх шаардлагатай байна.

Шийдэл:Ялгаатай байдлын ач холбогдлыг үнэлэхийн тулд бид дундаж утгын зөрүүг квадрат алдааны нийлбэрт хуваасан оюутны t тестийг ашигладаг.

Тооцооллыг хийсний дараа t-тестийн утга 4.51 болсон. Бид эрх чөлөөний зэрэглэлийн тоог (34 + 40) - 2 = 72 гэж олно. Үр дүнд нь Оюутны t-туршилтын 4.51 утгыг хүснэгтэд заасан p = 0.05 дахь чухал утгатай харьцуулна: 1.993. Шалгуурын тооцоолсон утга нь эгзэгтэй утгаас их байгаа тул ажиглагдсан ялгаа нь статистикийн ач холбогдолтой гэж дүгнэж байна (чухал байдлын түвшин p<0,05).



Үүнтэй төстэй нийтлэлүүд

2024 parki48.ru. Бид хүрээ байшин барьж байна. Ландшафтын дизайн. Барилга. Суурь.