Пирсоны сайн чанарын тест. Пирсоны шалгуур. Хэвийн тархалтын таамаглалыг шалгах

Пирсоны χ2 тест нь бодит үр дүн (судалгааны үр дүнд илэрсэн) эсвэл үр дүнгийн хоорондох ялгааны ач холбогдлыг үнэлэх боломжийг олгодог параметрийн бус арга юм. чанарын шинж чанарангилал тус бүрт хамаарах түүвэр, тэг таамаглал үнэн бол судлагдсан бүлгүүдэд хүлээж болох онолын тоо. Энгийнээр хэлбэл, энэ арга нь тооцоолох боломжийг олгодог статистикийн ач холбогдолхоёр ба түүнээс дээш ялгаа харьцангуй үзүүлэлтүүд(давтамж, хувьцаа).

1. χ 2 шалгуурын хөгжлийн түүх

Болзошгүй байдлын хүснэгтэд дүн шинжилгээ хийх хи-квадрат тестийг 1900 онд Английн математикч, статистикч, биологич, философич, шинжлэх ухааныг үндэслэгч боловсруулж, санал болгосон. математик статистикмөн биометрийг үндэслэгчдийн нэг Карл Пирсон(1857-1936).

2. Пирсоны χ 2 шалгуурыг юунд ашигладаг вэ?

Шинжилгээнд хи-квадрат тестийг ашиглаж болно гэнэтийн хүснэгтүүдэрсдэлт хүчин зүйл байгаа эсэхээс хамааран үр дүнгийн давтамжийн талаархи мэдээллийг агуулсан. Жишээлбэл, дөрвөн талбарын болзошгүй ослын хүснэгтдараах байдлаар:

Египетээс гарсан нь (1) Гарц байхгүй (0) Нийт
Эрсдлийн хүчин зүйл байдаг (1) А Б A+B
Эрсдлийн хүчин зүйл байхгүй (0) C Д C+D
Нийт A+C B+D A+B+C+D

Ийм гэнэтийн хүснэгтийг хэрхэн бөглөх вэ? Нэг жижиг жишээг авч үзье.

Артерийн гипертензи үүсэх эрсдэлд тамхи татах нөлөөллийн судалгаа хийгдэж байна. Үүний тулд хоёр бүлгийн субьектийг сонгосон - эхнийх нь өдөрт дор хаяж 1 хайрцаг тамхи татдаг 70 хүн, хоёрдугаарт - ижил насны 80 тамхи татдаггүй. Эхний бүлэгт 40 хүн цусны даралт ихсэлттэй байсан. Хоёрдугаарт - артерийн гипертензи 32 хүнд ажиглагдсан. Үүний дагуу тамхичдын бүлэгт цусны даралт хэвийн 30 хүн (70 - 40 = 30), тамхи татдаггүй хүмүүсийн бүлэгт 48 (80 - 32 = 48) байна.

Бид дөрвөн талбарын болзошгүй нөхцөл байдлын хүснэгтийг анхны өгөгдлөөр бөглөнө.

Үүссэн болзошгүй нөхцөл байдлын хүснэгтэд мөр бүр нь тодорхой бүлэг субъектуудтай тохирч байна. Багана - артерийн гипертензитэй эсвэл хэвийн байгаа хүмүүсийн тоог харуулна цусны даралт.

Судлаачийн хувьд тулгамдаж буй асуудал бол: тамхи татдаг болон татдаггүй хүмүүсийн дунд цусны даралт ихсэх давтамжийн хооронд статистикийн хувьд мэдэгдэхүйц ялгаа байдаг уу? Та энэ асуултад Пирсоны хи-квадрат тестийг тооцоолж, үр дүнгийн утгыг чухал утгатай харьцуулж хариулж болно.

3. Пирсоны хи-квадрат тестийг ашиглах нөхцөл, хязгаарлалт

  1. Харьцуулж болох үзүүлэлтүүдийг хэмжинэ нэрлэсэн масштаб(жишээлбэл, өвчтөний хүйс - эрэгтэй эсвэл эмэгтэй) эсвэл дотор дараалал(жишээ нь, зэрэг артерийн гипертензи, энэ нь 0-ээс 3 хүртэлх утгыг авна).
  2. Энэ аргаХүчин зүйл ба үр дүн нь хоёртын хувьсагч байх үед зөвхөн дөрвөн талбарын хүснэгтэд дүн шинжилгээ хийх боломжийг олгодоггүй, өөрөөр хэлбэл тэдгээр нь зөвхөн хоёр боломжит утгатай байдаг (жишээлбэл, эрэгтэй эсвэл эмэгтэй хүн, тодорхой өвчин байгаа эсэх). түүхэнд ...). Пирсоны хи-квадрат тестийг хүчин зүйл ба (эсвэл) үр дүн нь гурав ба түүнээс дээш утгыг авсан тохиолдолд олон талбарт хүснэгтэд дүн шинжилгээ хийх тохиолдолд ашиглаж болно.
  3. Тохиромжтой бүлгүүд нь бие даасан байх ёстой, өөрөөр хэлбэл ажиглалтын өмнөх ба дараа нь харьцуулахдаа хи-квадрат тестийг ашиглах ёсгүй. МакНемарын тест(холбоотой хоёр популяцийг харьцуулах үед) эсвэл тооцоолсон Q-test Cochran(гурав ба түүнээс дээш бүлгийг харьцуулах тохиолдолд).
  4. Дөрвөн талбарт хүснэгтэд дүн шинжилгээ хийх үед хүлээгдэж буй утгууднүд тус бүр дор хаяж 10 байх ёстой. Дор хаяж нэг нүдэнд хүлээгдэж буй үзэгдэл 5-аас 9 хүртэлх утгыг авсан тохиолдолд хи-квадрат тестийг тооцоолох шаардлагатай. Yates засвартай. Хэрэв дор хаяж нэг нүдэнд хүлээгдэж буй үзэгдэл 5-аас бага байвал шинжилгээг ашиглах ёстой Фишерийн нарийн тест.
  5. Олон талбарт хүснэгтэд дүн шинжилгээ хийх тохиолдолд хүлээгдэж буй ажиглалтын тоо нь нүдний 20% -иас дээш 5-аас багагүй байх ёстой.

4. Пирсоны хи-квадрат тестийг хэрхэн тооцох вэ?

Хи-квадрат тестийг тооцоолохын тулд та дараахь зүйлийг хийх ёстой.

Энэ алгоритм нь дөрвөн талбар болон олон талбарт хүснэгтэд тохиромжтой.

5. Пирсоны хи-квадрат тестийн утгыг хэрхэн тайлбарлах вэ?

χ 2 шалгуурын олж авсан утга нь эгзэгтэй хэмжээнээс их байвал судлагдсан эрсдэлийн хүчин зүйл болон үр дүнгийн хооронд зохих ач холбогдлын түвшинд статистик хамааралтай байна гэж бид дүгнэж байна.

6. Пирсоны хи-квадрат тестийг тооцоолох жишээ

Дээрх хүснэгтийн дагуу артерийн гипертензийн өвчлөлд тамхи татах хүчин зүйлийн нөлөөллийн статистик ач холбогдлыг тодорхойлъё.

  1. Бид нүд бүрийн хүлээгдэж буй утгыг тооцоолно.
  2. Пирсоны хи-квадрат тестийн утгыг ол:

    χ 2 \u003d (40-33.6) 2 / 33.6 + (30-36.4) 2 / 36.4 + (32-38.4) 2 / 38.4 + (48-41.6) 2 / 41.6 \u003d 4.396.

  3. Эрх чөлөөний зэрэглэлийн тоо f = (2-1)*(2-1) = 1. Бид хүснэгтээс Пирсоны хи-квадрат тестийн критик утгыг олдог бөгөөд энэ нь ач холбогдлын түвшинд p=0.05 ба эрх чөлөөний зэрэглэлийн тоо 1, 3.841.
  4. Бид хи-квадрат тестийн олж авсан утгыг чухал үзүүлэлттэй харьцуулж үздэг: 4.396 > 3.841, иймээс артерийн гипертензийн өвчлөл нь тамхи татах эсэхээс хамаарал нь статистик ач холбогдолтой юм. Энэ харилцааны ач холбогдлын түвшин p-тэй тохирч байна<0.05.
χ 2 шалгуурын зорилго - Пирсоны шалгуур χ 2 нь хоёр зорилгоор ашиглагддаг: 1) шинж чанарын эмпирик тархалтыг онолын шинжтэй харьцуулах - жигд, хэвийн эсвэл бусад; 2) ижил шинж чанарын хоёр, гурав ба түүнээс дээш эмпирик тархалтыг харьцуулах. Шалгуурын тодорхойлолт χ 2 шалгуур нь эмпирик ба онолын тархалтад ижил давтамжтай эсвэл хоёр ба түүнээс дээш эмпирик тархалтад шинж тэмдгийн өөр өөр утгууд тохиолддог уу гэсэн асуултад хариулдаг. Аргын давуу тал нь нэрсийн масштабаас эхлээд ямар ч масштабаар танилцуулсан шинж чанаруудын тархалтыг харьцуулах боломжийг олгодог. Альтернатив хуваарилалтын хамгийн энгийн тохиолдолд "тийм - үгүй", "гэрлэлтийг зөвшөөрсөн - гэрлэлтийг зөвшөөрөөгүй", "асуудлыг шийдсэн - асуудлыг шийдээгүй" гэх мэт, бид аль хэдийн χ 2 шалгуурыг хэрэглэж болно. Харьцуулж болох хоёр тархалтын хоорондох зөрүү их байх тусам эмпирик утга нь χ 2 их байх болно. χ 2 - Пирсоны шалгуурыг автоматаар тооцоолох χ 2 - Пирсоны шалгуурыг автоматаар тооцоолохын тулд хоёр алхам хийх шаардлагатай: 1-р алхам. Эмпирик тархалтын тоог зааж өгөх (1-ээс 10 хүртэл); Алхам 2. Эмпирик давтамжийг хүснэгтэд оруулна уу; Алхам 3. Хариултаа аваарай.

Пирсоны шалгуурын давуу тал нь түүний түгээмэл байдал юм: үүнийг янз бүрийн тархалтын хуулиудын талаархи таамаглалыг шалгахад ашиглаж болно.

1. Хэвийн тархалтын таамаглалыг шалгах.

Хангалттай том хэмжээтэй дээж ав Пмаш олон янзын хувилбарын утгатай. Боловсруулахад тав тухтай байхын тулд бид интервалыг хувилбарын утгуудын хамгийн багаас хамгийн том хүртэл хуваана. стэнцүү хэсгүүд байх ба интервал бүрт хамаарах сонголтуудын утгууд нь интервалын дундыг зааж буй тоотой ойролцоогоор тэнцүү байна гэж бид таамаглах болно. Интервал бүрд орсон сонголтуудын тоог тоолсны дараа бид бүлэглэсэн түүврийг хийх болно.

сонголтууд ……….. X 1 X 2 … х с

давтамж …………. П 1 П 2 … н с ,

хаана x iинтервалуудын дунд цэгүүдийн утгууд ба n iнь багтсан сонголтуудын тоо юм би th интервал (эмпирик давтамж).



Хүлээн авсан өгөгдөл дээр үндэслэн түүврийн дундаж болон түүврийн стандарт хазайлтыг тооцоолох боломжтой σ Б. Нийт хүн ам хэвийн хуулийн дагуу тархсан гэсэн таамаглалыг параметрүүдээр шалгая М(X) = , Д(X) =. Дараа нь та эзлэхүүний дээжээс тооны тоог олох боломжтой П, энэ таамаглалын дагуу интервал бүрт байх ёстой (өөрөөр хэлбэл онолын давтамж). Үүнийг хийхийн тулд Лаплас функцийн утгуудын хүснэгтийг ашиглан бид цохих магадлалыг олно би-р интервал:

,

хаана a iболон б би- хил би-р интервал. Үүссэн магадлалыг түүврийн хэмжээ n-ээр үржүүлээд бид онолын давтамжийг олно. p i =n p i.Бидний зорилго бол мэдээжийн хэрэг өөр хоорондоо ялгаатай эмпирик болон онолын давтамжийг харьцуулж, эдгээр ялгаа нь ач холбогдолгүй, судалж буй санамсаргүй хэмжигдэхүүний хэвийн тархалтын таамаглалыг үгүйсгэхгүй, эсвэл тийм үү гэдгийг олж мэдэх явдал юм. Энэ таамаглалтай зөрчилдөж байгаа нь том юм. Үүний тулд санамсаргүй хэмжигдэхүүн хэлбэрээр шалгуурыг ашигладаг

. (20.1)

Үүний утга нь тодорхой байна: эмпирик давтамжийн онолын давтамжаас харгалзах онолын давтамжаас хазайсан квадратууд болох хэсгүүдийг нэгтгэн дүгнэв. Нийт хүн амын бодит тархалтын хуулиас үл хамааран санамсаргүй хэмжигдэхүүний (20.1) тархалтын хууль нь эрх чөлөөний зэрэгтэй тархалтын хууль (12-р лекцийг үз) рүү чиглэдэг болохыг баталж болно. k = s - 1 – r, хаана rнь түүврийн өгөгдлөөр тооцоолсон тооцоолсон тархалтын параметрүүдийн тоо юм. Хэвийн тархалт нь хоёр параметрээр тодорхойлогддог тул k = s - 3. Сонгосон шалгуурын хувьд нөхцөлөөр тодорхойлогдсон баруун гар талын чухал бүсийг байгуулна

(20.2)

хаана α - ач холбогдлын түвшин. Тиймээс эгзэгтэй мужийг тэгш бус байдлаар өгнө ба таамаглалыг хүлээн авах талбар нь .

Тиймээс тэг таамаглалыг шалгах Х 0: популяци хэвийн тархсан - та түүврээс шалгуур үзүүлэлтийн ажиглагдсан утгыг тооцоолох хэрэгтэй.

, (20.1`)

χ 2 тархалтын эгзэгтэй цэгүүдийн хүснэгтийн дагуу α ба 2-ын мэдэгдэж буй утгуудыг ашиглан эгзэгтэй цэгийг ол. k = s - 3. Хэрэв - тэг таамаглалыг хүлээн зөвшөөрч, татгалзвал.

2. Нэг жигд тархалтын таамаглалыг шалгах.

Таамагласан нягтрал бүхий нийт хүн амын жигд тархалтын таамаглалыг шалгахын тулд Пирсон тестийг ашиглахдаа

боломжтой дээжээс утгыг тооцоолсны дараа параметрүүдийг тооцоолох шаардлагатай аболон бтомъёоны дагуу:

хаана а*болон б*- тооцоолол аболон б. Үнэхээр жигд хуваарилалтын төлөө М(X) = , , тодорхойлох системийг хаанаас авах боломжтой а*болон б*: , шийдэл нь илэрхийллүүд (20.3).

Дараа нь тэгж тооцвол , та томъёог ашиглан онолын давтамжийг олох боломжтой

Энд снь дээжийг хуваах интервалын тоо юм.

Пирсоны шалгуурын ажиглагдсан утгыг (20.1`) томъёогоор, эгзэгтэй утгыг эрх чөлөөний зэрэглэлийн тоог харгалзан хүснэгтээс тооцно. k = s - 3. Үүний дараа эгзэгтэй бүсийн хил хязгаарыг хэвийн тархалтын таамаглалыг шалгахтай адил тодорхойлно.

3. Экспоненциал тархалтын талаарх таамаглалыг шалгах.

Энэ тохиолдолд одоо байгаа дээжийг ижил урттай интервалд хуваахдаа бид бие биенээсээ ижил зайд байгаа сонголтуудын дарааллыг авч үзэх болно (бид үүнд хамаарах бүх сонголтууд гэж үздэг. би-р интервал, дунд нь давхцаж буй утгыг авна), тэдгээрийн харгалзах давтамжийг авна n i(түүний сонголтуудын тоо би- th интервал). Бид эдгээр өгөгдлүүдээс тооцоолж, параметрийн тооцооллыг авдаг λ үнэ цэнэ. Дараа нь онолын давтамжийг томъёогоор тооцоолно

Дараа нь эрх чөлөөний зэрэглэлийн тоог харгалзан Пирсоны шалгуурын ажиглагдсан ба чухал утгыг харьцуулна. k = s - 2.

Өмнө нь нийт хүн амын тархалтын хуулийг мэддэг гэж үздэг таамаглалуудыг авч үзсэн. Одоо санал болгож буй үл мэдэгдэх тархалтын хуулийн талаархи таамаглалуудыг шалгая, өөрөөр хэлбэл хүн ам нь мэдэгдэж буй хуулийн дагуу тархсан гэсэн тэг таамаглалыг шалгах болно. Ийм таамаглалыг шалгах статистик тестийг ихэвчлэн нэрлэдэг зөвшөөрлийн шалгуур.

Тохиромжтой байдлын шалгуурүл мэдэгдэх тархалтын санал болгож буй хуулийн таамаглалыг шалгах шалгуур гэж нэрлэдэг. Энэ нь эмпирик ба онолын хуваарилалтын зөрүүг тоон хэмжүүр юм.

Гол ажил.Эмпирик тархалт (түүвэр) өгөгдсөн. Онолын тархалтын төрлийн талаар таамаглал дэвшүүлж (таамаглал дэвшүүлж) санал болгож буй таамаглалыг өгөгдсөн ач холбогдлын α түвшинд туршиж үзээрэй.

Гол асуудлын шийдэл нь хоёр хэсгээс бүрдэнэ.

1. Таамаглал дэвшүүлэх.

2. Өгөгдсөн ач холбогдлын түвшинд таамаглалыг шалгах.

Эдгээр хэсгүүдийг нарийвчлан авч үзье.

1. Таамаглалыг сонгохОлон өнцөгт эсвэл давтамжийн гистограм ашиглан онолын тархалтын төрлийг ярих нь тохиромжтой. Эмпирик олон өнцөгтийг (эсвэл гистограмм) мэдэгдэж буй тархалтын хуулиудтай харьцуулж, хамгийн тохиромжтойг нь сонгоно.

Хамгийн чухал хуваарилалтын хуулиудын графикууд энд байна.

Эмпирик тархалтын хуулиудын жишээг зурагт үзүүлэв.



(а) тохиолдолд хэвийн тархалтын таамаглал дэвшүүлсэн бол (б) жигд тархалтын таамаглал, (в) тохиолдолд Пуассоны тархалтын таамаглал.

Онолын тархалтын талаархи таамаглал дэвшүүлэх үндэс нь шинж чанарын өөрчлөлтийн мөн чанарын тухай онолын үндэслэл байж болно. Жишээлбэл, Ляпуновын теоремын нөхцлийн биелэлт нь хэвийн тархалтын тухай таамаглал дэвшүүлэх боломжийг бидэнд олгодог. Дундаж ба дисперсийн тэгш байдал нь Пуассоны тархалтын таамаглалд хүргэдэг.

Практикт бид ихэвчлэн хэвийн тархалттай тулгардаг тул бидний асуудалд зөвхөн хэвийн тархалтын таамаглалыг шалгах хэрэгтэй.

Таамаглалыг шалгахОнолын тархалтын тухай асуултад хариулдаг: онолын болон эмпирик тархалтын зөрүүг санамсаргүй, ач холбогдолгүй гэж үзэж болох уу, тодорхой объектуудын түүврийн санамсаргүй байдлаар тайлбарлаж болох уу, эсвэл энэ зөрүү нь тархалтын хооронд мэдэгдэхүйц зөрүүтэй байгааг харуулж байна уу. Шалгах янз бүрийн аргууд байдаг (биеийн тамирын шалгуур) - c 2 (хи-квадрат), Колмогоров, Романовский болон бусад.

Пирсоны шалгуур.

Пирсоны шалгуурын давуу тал нь түүний түгээмэл байдал юм: үүнийг янз бүрийн тархалтын хуулиудын талаархи таамаглалыг шалгахад ашиглаж болно.

1. Хэвийн тархалтын таамаглалыг шалгах.Хангалттай том хэмжээтэй дээж ав Пмаш олон янзын хувилбарын утгатай. Боловсруулахад тав тухтай байхын тулд бид интервалыг хувилбарын утгуудын хамгийн багаас хамгийн том хүртэл хуваана. стэнцүү хэсгүүд байх ба интервал бүрт хамаарах сонголтуудын утгууд нь интервалын дундыг зааж буй тоотой ойролцоогоор тэнцүү байна гэж бид таамаглах болно. Интервал бүрд орсон сонголтуудын тоог тоолсны дараа бид бүлэглэсэн түүврийг хийх болно.

сонголтууд ……….. X 1 X 2 … х с

давтамж …………. П 1 П 2 … н с ,

хаана x iинтервалуудын дунд цэгүүдийн утгууд ба n iнь багтсан сонголтуудын тоо юм би th интервал (эмпирик давтамж). Хүлээн авсан өгөгдөл дээр үндэслэн түүврийн дундаж болон түүврийн стандарт хазайлтыг тооцоолох боломжтой σ Б. Нийт хүн ам хэвийн хуулийн дагуу тархсан гэсэн таамаглалыг параметрүүдээр шалгая М(X) = , Д(X) =. Дараа нь та эзлэхүүний дээжээс тооны тоог олох боломжтой П, энэ таамаглалын дагуу интервал бүрт байх ёстой (өөрөөр хэлбэл онолын давтамж). Үүнийг хийхийн тулд Лаплас функцийн утгуудын хүснэгтийг ашиглан бид цохих магадлалыг олно би-р интервал:

,

хаана a iболон б би- хил би-р интервал. Үүссэн магадлалыг түүврийн хэмжээ n-ээр үржүүлээд бид онолын давтамжийг олно. p i =n p i.Бидний зорилго бол мэдээжийн хэрэг өөр хоорондоо ялгаатай эмпирик болон онолын давтамжийг харьцуулж, эдгээр ялгаа нь ач холбогдолгүй, судалж буй санамсаргүй хэмжигдэхүүний хэвийн тархалтын таамаглалыг үгүйсгэхгүй, эсвэл тийм үү гэдгийг олж мэдэх явдал юм. Энэ таамаглалтай зөрчилдөж байгаа нь том юм. Үүний тулд санамсаргүй хэмжигдэхүүн хэлбэрээр шалгуурыг ашигладаг

. (7)

Үүний утга нь тодорхой байна: эмпирик давтамжийн онолын давтамжаас харгалзах онолын давтамжаас хазайсан квадратууд болох хэсгүүдийг нэгтгэн дүгнэв. Нийт хүн амын бодит тархалтын хуулиас үл хамааран санамсаргүй хэмжигдэхүүний (7) тархалтын хууль нь эрх чөлөөний зэрэгтэй тархалтын хууль руу чиглэдэг болохыг баталж болно. k = s - 1 – r, хаана rнь түүврийн өгөгдлөөр тооцоолсон тооцоолсон тархалтын параметрүүдийн тоо юм. Хэвийн тархалт нь хоёр параметрээр тодорхойлогддог тул k = s - 3. Сонгосон шалгуурын хувьд нөхцөлөөр тодорхойлогдсон баруун гар талын чухал бүсийг байгуулна

(8)

хаана α - ач холбогдлын түвшин. Тиймээс эгзэгтэй мужийг тэгш бус байдлаар өгнө ба таамаглалыг хүлээн авах талбар нь юм .

Тиймээс тэг таамаглалыг шалгах Х 0: популяци хэвийн тархсан - та түүврээс шалгуур үзүүлэлтийн ажиглагдсан утгыг тооцоолох хэрэгтэй.

, (7`)

χ 2 тархалтын эгзэгтэй цэгүүдийн хүснэгтийн дагуу α ба 2-ын мэдэгдэж буй утгуудыг ашиглан эгзэгтэй цэгийг ол. k = s - 3. Хэрэв - тэг таамаглалыг хүлээн зөвшөөрч, татгалзвал.

Жишээ.Барааны эрэлтийн судалгааны үр дүнг хүснэгтэд үзүүлэв.

Тархалтын төрлийн талаар таамаглал дэвшүүлж, ач холбогдлын түвшинд a=0.01-ээр шалгана.

I. Таамаглал.

Эмпирик тархалтын төрлийг харуулахын тулд бид гистограммыг байгуулдаг


120 160 180 200 220 280

Гистограммын хэлбэрээр нийт хүн амд судлагдсан шинж чанарын тархалтын хэвийн хуулийн талаар таамаглал дэвшүүлж болно.

II. Санал болгож буй хэвийн тархалтын таамаглалыг Пирсоны сайн чанарын тест ашиглан шалгацгаая.

1. Тооцоолох , s B. Сонголт болгон интервалуудын төгсгөлийн арифметик дундажийг авна уу.

2. Интервалуудыг ол (Z i ; Z i+1): ; .

Эхний интервалын зүүн төгсгөлд (-¥), сүүлчийн интервалын баруун төгсгөлд (+¥) тэмдэглэе. Үр дүнг хүснэгтэд үзүүлэв. дөрөв.

3. Онолын магадлал P i ба онолын давтамжийг ол (Хүснэгт 4-ийг үз).

Хүснэгт 4

би Интервалын хил хязгаар Ф(Z i) Ф(Z i+1) P i \u003d Ф (Z i + 1) - Ф (Z i)
x i x i+1 З и Zi+1
-1,14 -0,5 -0,3729 0,1271 6,36
-1,14 -0,52 -0,3729 -0,1985 0,1744 8,72
-0,52 0,11 -0,1985 0,0438 0,2423 12,12
0,11 0,73 0,0438 0,2673 0,2235 11,18
0,73 0,2673 0,5 0,2327 11,64

4. Эмпирик болон онолын давтамжийг харьцуулж үзье. Үүний тулд:

a) Пирсоны шалгуурын ажиглагдсан утгыг тооцоолох.

Тооцооллыг 5-р хүснэгтэд үзүүлэв.

Хүснэгт 5

би
6,36 -1,36 1,8496 0,291
8,72 1,28 1,6384 0,188
12,12 1,88 3,5344 0,292
11,18 0,82 0,6724 0,060
11,64 -2,64 6,9696 0,599
С

б) өгөгдсөн ач холбогдлын түвшинд a=0.01 болон чөлөөт байдлын зэрэглэлийн тоогоор c 2-ын эгзэгтэй тархалтын цэгүүдийн хүснэгтийн дагуу k=m–3=5–3=2 критик цэгийг олно; бидэнд байгаа .

Харьцуулах c. . Тиймээс нийт хүн амын судлагдсан шинж чанарын хэвийн тархалтын таамаглалыг үгүйсгэх үндэслэл байхгүй. Тэдгээр. эмпирик болон онолын давтамж хоорондын зөрүү нь ач холбогдолгүй (санамсаргүй). ◄

Сэтгэгдэл.Цөөн эмпирик давтамж агуулсан интервалууд (n i<5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формуле K=m-3 следует в качестве m принять число оставшихся после объединения интервалов.

Жишээ. 24 хувилбарын түүвэр дээр үндэслэн нийт хүн амын хэвийн тархалтын талаарх таамаглал дэвшүүлсэн. Өгөгдсөн утгуудын ач холбогдлын түвшинд Пирсоны тестийг ашиглах нь \u003d (34, 35, 36, 37, 38) дараахь зүйлийг заана: а) таамаглалыг үгүйсгэх шалтгаан байхгүй хамгийн том; б) таамаглалыг үгүйсгэх ёстой хамгийн бага утга.

Эрх чөлөөний зэрэглэлийн тоог дараах томъёогоор олъё.

энд түүврийн бүлгүүдийн тоо (сонголт), тархалтын параметрийн тоо.

Хэвийн тархалт нь 2 параметртэй ( ба ) тул бид авна

Чухал тархалтын цэгүүдийн хүснэгтийн дагуу өгөгдсөн ач холбогдлын түвшин, эрх чөлөөний зэрэглэлийн тоогоор бид эгзэгтэй цэгийг тодорхойлно.

А) тохиолдолд 34 ба 35-тай тэнцүү утгуудын хувьд хэвийн тархалтын таамаглалыг үгүйсгэх шалтгаан байхгүй, учир нь . Мөн эдгээр үнэт зүйлсийн хамгийн том нь.

b) тохиолдолд 36, 37, 38 утгуудын хувьд таамаглалыг үгүйсгэдэг, учир нь . Тэдний хамгийн жижиг нь .◄

2. Нэг жигд тархалтын таамаглалыг шалгах. Таамагласан нягтрал бүхий нийт хүн амын жигд тархалтын таамаглалыг шалгахын тулд Пирсон тестийг ашиглахдаа

боломжтой дээжээс утгыг тооцоолсны дараа параметрүүдийг тооцоолох шаардлагатай аболон бтомъёоны дагуу:

хаана а*болон б*- тооцоолол аболон б. Үнэхээр жигд хуваарилалтын төлөө М(X) = , , тодорхойлох системийг хаанаас авах боломжтой а*болон б*: , тэдгээрийн шийдэл нь илэрхийллүүд (9).

Дараа нь тэгж тооцвол , та томъёог ашиглан онолын давтамжийг олох боломжтой

Энд снь дээжийг хуваах интервалын тоо юм.

Пирсоны шалгуурын ажиглагдсан утгыг (7`) томъёогоор, эгзэгтэй утгыг эрх чөлөөний зэрэглэлийн тоог харгалзан хүснэгтээс тооцно. k = s - 3. Үүний дараа эгзэгтэй бүсийн хил хязгаарыг хэвийн тархалтын таамаглалыг шалгахтай адил тодорхойлно.

3. Экспоненциал тархалтын талаарх таамаглалыг шалгах.Энэ тохиолдолд одоо байгаа дээжийг ижил урттай интервалд хуваахдаа бид бие биенээсээ ижил зайд байгаа сонголтуудын дарааллыг авч үзэх болно (бид үүнд хамаарах бүх сонголтууд гэж үздэг. би-р интервал, дунд нь давхцаж буй утгыг авна), тэдгээрийн харгалзах давтамжийг авна n i(түүний сонголтуудын тоо би- th интервал). Бид эдгээр өгөгдлүүдээс тооцоолж, параметрийн тооцооллыг авдаг λ үнэ цэнэ. Дараа нь онолын давтамжийг томъёогоор тооцоолно

Дараа нь эрх чөлөөний зэрэглэлийн тоог харгалзан Пирсоны шалгуурын ажиглагдсан ба чухал утгыг харьцуулна. k = s - 2.

ODAҮл мэдэгдэх тархалтын санал болгож буй хуулийн талаарх таамаглалыг шалгах шалгуурыг сайн чанарын шалгуур гэж нэрлэдэг.

Тохиромжтой байдлын хэд хэдэн шалгуур байдаг: $\chi ^2$ (хи-квадрат) К.Пирсон, Колмогоров, Смирнов болон бусад.

Ихэвчлэн онолын болон эмпирик давтамжууд өөр өөр байдаг. Зөрчлийн тохиолдол нь санамсаргүй биш байж болох бөгөөд энэ нь таамаглалыг зөв сонгоогүй гэсэн үг юм. Пирсоны шалгуур нь асуултанд хариулдаг боловч аливаа шалгуурын нэгэн адил энэ нь юу ч нотлохгүй, зөвхөн ажиглалтын өгөгдөлтэй санал нийлэх эсвэл санал нийлэхгүй байгаагаа л хүлээн зөвшөөрөгдсөн ач холбогдлын түвшинд тогтоодог.

ODAҮйл явдлыг бараг боломжгүй гэж үзэх хангалттай бага магадлалыг ач холбогдлын түвшин гэж нэрлэдэг.

Практикт 0.01-0.05 хооронд ач холбогдлын түвшинг авах нь түгээмэл байдаг бөгөөд $\альфа =0.05$ нь $5 ( \% ) $ ач холбогдлын түвшин юм.

Таамаглалыг шалгах шалгуур болгон бид \begin(equation) \label ( eq1 ) \chi ^2=\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) \ утгыг авна. qquad (1) \ төгсгөл( тэгшитгэл)

энд $n_i -$ дээжээс авсан эмпирик давтамжууд, $n_i" -$ онолын хувьд олдсон давтамжууд.

$n\to \infty $-ын хувьд санамсаргүй хэмжигдэхүүний ( 1 ) тархалтын хууль нь нийт хүн амын тархалтын хуулиас үл хамааран $\chi ^2$ ( хи-квадрат ) хууль руу чиглэдэг болох нь батлагдсан. $k$ эрх чөлөөний зэрэг.

ODAЭрх чөлөөний зэрэглэлийн тоог $k=S-1-r$ тэгшитгэлээр олно, $S-$ нь интервалын бүлгийн тоо, $r-$ нь параметрийн тоо юм.

1) жигд тархалт: $r=2, k=S-3 $

2) хэвийн тархалт: $r=2, k=S-3 $

3) экспоненциал тархалт: $r=1, k=S-2$.

дүрэм . Пирсоны шалгуураар таамаглалыг шалгах.

  1. Таамаглалыг шалгахын тулд онолын давтамжийг тооцож $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $-г ол.
  2. Түгээх чухал цэгүүдийн хүснэгтийн дагуу $\chi ^2$, $\chi _ ( cr ) ^2 (( \alpha ,k ))$ нь өгөгдсөн ач холбогдлын түвшин $\alpha $ болон градусын тоогоор олно. эрх чөлөө $k$.
  3. Хэрэв $\chi _ ( obs ) ^2<\chi _ { кр } ^2 $ то нет оснований отвергать гипотезу, если не выполняется данное условие - то отвергают.

СэтгэгдэлТооцооллыг хянахын тулд $\chi ^2$ томъёог $\chi _ ( obs ) ^2 =\sum ( \frac ( n_i^2 ) ( n_i" ) -n ) $ хэлбэрээр ашиглана.

Нэг төрлийн тархалтын таамаглалыг шалгах

$X$-ийн жигд тархалтын нягтын функц нь $f(x)=\frac ( 1 ) ( b-a ) x\in \left[ ( a,b )\right]$ хэлбэртэй байна.

Тасралтгүй санамсаргүй хэмжигдэхүүн $\альфа $-ын ач холбогдлын түвшинд жигд тархсан гэсэн таамаглалыг шалгахын тулд дараахь зүйлийг хийх шаардлагатай.

1) Өгөгдсөн эмпирик тархалтаас $\overline ( x_b ) $ болон $\sigma _b =\sqrt ( D_b ) $ гэсэн түүврийн дундаж утгыг ол. $a$ ба $b$ параметрүүдийг тооцоолсноор хэмжигдэхүүнүүдийг авна

$a = \overline x _b -\sqrt 3 \sigma _b $, $b = \overline x _b +\sqrt 3 \sigma _b $

2) $X$ санамсаргүй хэмжигдэхүүн $(( x_i ,x_ ( i+1 ) ))$ хэсэгчилсэн интервалд орох магадлалыг $ P_i =P(( x_i) томъёогоор ол.

3) $n_i" =np_i $ томъёог ашиглан онолын (тэнцүүлэх) давтамжийг ол.

4) $\chi ^2$ хүснэгтээс $k=S-3$ эрх чөлөөний зэрэглэлийн тоо, ач холбогдлын түвшинг $\альфа =0.05$ гэж үзвэл бид $\chi _ ( cr ) ^2 $-г олно. $\alpha $ ба $k$, $\chi _ ( cr ) ^2 (( \alpha,k ))$ өгөгдсөн.

5) $\chi _ ( obs ) ^2 =\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $ томьёог ашиглан $n_i нь $ эмпирик давтамж юм, бид ажиглагдсан зүйлийг олно. утга $\ chi _ ( obs ) ^2 $.

6) Хэрэв $\chi _ ( obs ) ^2<\chi _ { кр } ^2 -$ нет оснований, отвергать гипотезу.

Таамаглалыг өөрсдийн жишээн дээр туршиж үзье.

1) $\overline x _b =13.00\,\,\sigma _b =\sqrt ( D_b ) = 6.51$

2) $a=13.00-\sqrt 3 \cdot 6.51=13.00-1.732\cdot 6.51=1.72468$

$b=13.00+1.732\cdot 6.51=24.27532$

$b-a=24.27532-1.72468=22.55064$

3) $P_i =P((x_i

$P_2 =((3

$P_3 =((7

$P_4 =((11

$P_5 =((15

$P_6 =((19

Нэг төрлийн тархалтын үед интервалын урт ижил байвал $P_i -$ ижил байна.

4) $n_i" =np_i $-г ол.

5) $\sum ( \frac ( (( n_i -n_i" ))^2 ) ( n_i" ) ) $-г олоод $\chi _ ( obs ) ^2 $-г ол.

Бүх олж авсан утгыг хүснэгтэд оруулъя

\эхлэх(массив) ( |l|l|l|l|l|l|l| ) \hline i& n_i & n_i" =np_i & n_i -n_i" & (( n_i -n_i"))^2& \frac ( (( n_i -n_i")^2 ) ( n_i" ) & Хяналт~ \frac ( n_i^2 ) ( n_i" ) \\ \hline 1& 1& 4.43438& -3.43438& 11.7950& 2.659820& 2.659828&5 \\ 5\\\ 4.43438& 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 3& 3& 4.43438& -1.43438& 2.05744& 0.471463& 2.0296 \\ \hline 4& 3& 4 .43438& -1.43438& 2.05744& 0.471463& 2.0296 \\ \hline 5& 6& 4.43438& 1.56562& 2.45117& 0.552765& 8.11838 \\ \hline 6& 6& 4.43438& 1.562 45117& 0.552765& 8.11838 \\ \hline & & & s &chi = 1 \\ ob ^ _ \ нийлбэр & & s & чи) ^ 1 \ 2 . 2 =\нийлбэр ( \frac ( n_i^2 ) ( n_i" ) -n ) =3.63985 \\ \hline \end(массив)

$\chi _ ( cr ) ^2 (( 0.05.3 ))=7.8$

$\chi _ ( obs ) ^2<\chi _ { кр } ^2 =3,26<7,8$

Дүгнэлттаамаглалыг үгүйсгэх ямар ч шалтгаан байхгүй.

Интервалын өргөн нь:

Xmax - нийлбэр дэх бүлэглэх шинж чанарын хамгийн их утга.
Xmin - бүлэглэх функцийн хамгийн бага утга.
Бүлгийн хил хязгаарыг тодорхойлъё.

Бүлгийн дугаарДоод шугамДээд хил
1 43 45.83
2 45.83 48.66
3 48.66 51.49
4 51.49 54.32
5 54.32 57.15
6 57.15 60

Ижил шинж чанарын утга нь хоёр зэргэлдээ (өмнөх ба дараагийн) бүлгийн дээд ба доод хилийн үүрэг гүйцэтгэдэг.
Цувралын утга бүрийн хувьд бид тодорхой интервалд хэдэн удаа орохыг тооцоолно. Үүнийг хийхийн тулд цувралыг өсөх дарааллаар эрэмбэлэх хэрэгтэй.
43 43 - 45.83 1
48.5 45.83 - 48.66 1
49 48.66 - 51.49 1
49 48.66 - 51.49 2
49.5 48.66 - 51.49 3
50 48.66 - 51.49 4
50 48.66 - 51.49 5
50.5 48.66 - 51.49 6
51.5 51.49 - 54.32 1
51.5 51.49 - 54.32 2
52 51.49 - 54.32 3
52 51.49 - 54.32 4
52 51.49 - 54.32 5
52 51.49 - 54.32 6
52 51.49 - 54.32 7
52 51.49 - 54.32 8
52 51.49 - 54.32 9
52.5 51.49 - 54.32 10
52.5 51.49 - 54.32 11
53 51.49 - 54.32 12
53 51.49 - 54.32 13
53 51.49 - 54.32 14
53.5 51.49 - 54.32 15
54 51.49 - 54.32 16
54 51.49 - 54.32 17
54 51.49 - 54.32 18
54.5 54.32 - 57.15 1
54.5 54.32 - 57.15 2
55.5 54.32 - 57.15 3
57 54.32 - 57.15 4
57.5 57.15 - 59.98 1
57.5 57.15 - 59.98 2
58 57.15 - 59.98 3
58 57.15 - 59.98 4
58.5 57.15 - 59.98 5
60 57.15 - 59.98 6

Бүлэглэлийн үр дүнг хүснэгт хэлбэрээр үзүүлнэ.
Бүлгүүдхүн амын тооДавтамж f би
43 - 45.83 1 1
45.83 - 48.66 2 1
48.66 - 51.49 3,4,5,6,7,8 6
51.49 - 54.32 9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26 18
54.32 - 57.15 27,28,29,30 4
57.15 - 59.98 31,32,33,34,35,36 6

Шалгуур үзүүлэлтийг тооцоолох хүснэгт.
Бүлгүүдx iТоо хэмжээ, fix i * f iХуримтлагдсан давтамж, С|x - x cf |*f(x - x sr) 2 *fДавтамж, f i / n
43 - 45.83 44.42 1 44.42 1 8.88 78.91 0.0278
45.83 - 48.66 47.25 1 47.25 2 6.05 36.64 0.0278
48.66 - 51.49 50.08 6 300.45 8 19.34 62.33 0.17
51.49 - 54.32 52.91 18 952.29 26 7.07 2.78 0.5
54.32 - 57.15 55.74 4 222.94 30 9.75 23.75 0.11
57.15 - 59.98 58.57 6 351.39 36 31.6 166.44 0.17
36 1918.73 82.7 370.86 1

Түгээлтийн цувралыг үнэлэхийн тулд бид дараах үзүүлэлтүүдийг олно.
Түгээх төвийн хэмжигдэхүүн.
жигнэсэн дундаж


Загвар
Горим нь тухайн популяцийн нэгж дэх шинж чанарын хамгийн түгээмэл утга юм.

Энд x 0 нь модаль интервалын эхлэл; h нь интервалын утга; f 2 -модаль интервалд тохирох давтамж; f 1 - урьдчилсан давтамж; f 3 - постмодаль давтамж.
Энэ интервал нь хамгийн их тоог эзэлдэг тул бид 51.49-ийг интервалын эхлэл болгон сонгосон.

Цувралын хамгийн нийтлэг утга нь 52.8 байна
Медиан
Медиан нь дээжийг хоёр хэсэгт хуваадаг: тал хувь нь медианаас бага, хагас нь илүү байна.
Интервалын тархалтын цувралд та зөвхөн горим эсвэл медиан байрлах интервалыг нэн даруй зааж өгч болно. Медиан нь мужын дундах сонголттой тохирч байна. Дундаж нь интервал 51.49 - 54.32, учир нь энэ интервалд хуримтлагдсан давтамж S нь медиан тооноос их байна (эхний интервалыг медиан гэж нэрлэдэг бөгөөд хуримтлагдсан давтамж S нь нийт давтамжийн нийлбэрийн талаас давсан байдаг).


Ийнхүү хүн амын 50% нь 53.06-аас бага байх болно
Өөрчлөлтийн үзүүлэлтүүд.
Үнэмлэхүй өөрчлөлтийн хувь хэмжээ.
Өөрчлөлтийн хүрээ нь үндсэн цувралын шинж чанарын хамгийн их ба хамгийн бага утгуудын хоорондох зөрүү юм.
R = X max - X min
R = 60 - 43 = 17
Дундаж шугаман хазайлт- судлагдсан хүн амын бүх нэгжийн ялгааг харгалзан үзэх зорилгоор тооцоолсон.


Цувралын утга бүр нь нөгөөгөөсөө 2.3-аас ихгүй ялгаатай байна
Тархалт- түүний дундаж утгын эргэн тойронд тархалтын хэмжүүрийг тодорхойлдог (тархалтын хэмжүүр, өөрөөр хэлбэл дунджаас хазайх).


Вариацын шударга бус үнэлэгчхэлбэлзлийн тогтмол тооцоолол юм.


Стандарт хэлбэлзэл.

Цувралын утга тус бүр нь 53.3-ын дундаж утгаас 3.21-ээс ихгүй ялгаатай байна.
Стандарт хазайлтыг тооцоолох.

Өөрчлөлтийн харьцангуй хэмжигдэхүүн.
Өөрчлөлтийн харьцангуй үзүүлэлтүүдэд: хэлбэлзлийн коэффициент, шугаман хэлбэлзлийн коэффициент, харьцангуй шугаман хазайлт орно.
Өөрчлөлтийн коэффициент- популяцийн утгын харьцангуй тархалтын хэмжүүр: энэ хэмжигдэхүүний дундаж утгын хэдэн хувь нь түүний дундаж тархалтыг харуулдаг.

v ≤ 30% тул популяци нь нэгэн төрлийн, хэлбэлзэл сул байна. Хүлээн авсан үр дүнд итгэж болно.
Шугаман хэлбэлзлийн коэффициентэсвэл Харьцангуй шугаман хазайлт- үнэмлэхүй хазайлтын тэмдгийн дундаж утгын дундаж утгаас эзлэх хувь хэмжээг тодорхойлдог.

Түгээлтийн төрлийн талаархи таамаглалыг шалгах.
1. Х тархсан гэсэн таамаглалыг шалгая ердийн хуульПирсоны сайн чанарын тестийг ашиглан.

Энд p i нь таамаглалын хуулийн дагуу тархсан санамсаргүй хэмжигдэхүүний i-р интервалд орох магадлал юм.
p i магадлалыг тооцоолохын тулд бид Лаплас функцийн томъёо болон хүснэгтийг ашиглана

хаана
s = 3.21, xav = 53.3
Онолын (хүлээгдэж буй) давтамж нь n i = np i, энд n = 36
Бүлгийн интервалуудАжиглагдсан давтамж n ix 1 \u003d (x i - x cf) / сx 2 \u003d (x i + 1 - x cf) / сФ(x 1)Ф(x 2)i-р интервалд хүрэх магадлал, p i \u003d Ф (x 2) - Ф (x 1)Хүлээгдэж буй давтамж, 36p iPearson статистикийн нөхцөл, К и
43 - 45.83 1 -3.16 -2.29 -0.5 -0.49 0.01 0.36 1.14
45.83 - 48.66 1 -2.29 -1.42 -0.49 -0.42 0.0657 2.37 0.79
48.66 - 51.49 6 -1.42 -0.56 -0.42 -0.21 0.21 7.61 0.34
51.49 - 54.32 18 -0.56 0.31 -0.21 0.13 0.34 12.16 2.8
54.32 - 57.15 4 0.31 1.18 0.13 0.38 0.26 9.27 3
57.15 - 59.98 6 1.18 2.06 0.38 0.48 0.0973 3.5 1.78
36 9.84

Чухал бүсийн хил хязгаарыг тодорхойлъё. Пирсоны статистик нь эмпирик ба онолын тархалтын ялгааг хэмждэг тул түүний ажигласан K obs утга их байх тусам үндсэн таамаглалын эсрэг аргумент илүү хүчтэй болно.
Тиймээс энэ статистикийн чухал бүс нь үргэлж баруун гартай байдаг :)
Үүнтэй төстэй нийтлэлүүд

2022 parki48.ru. Бид хүрээ байшин барьж байна. Тохижилт. Барилга. Суурь.