Статистикийн ач холбогдол нь юу вэ. Эмнэлгийн статистикийн үндсэн нэр томьёо, ойлголтууд

Статистикийн ач холбогдлын түвшин нь чухал үзүүлэлт, хүлээн авсан (урьдчилан таамагласан) өгөгдлийн нарийвчлал, үнэнд итгэх итгэлийн түвшинг тусгасан болно. Энэ үзэл баримтлалыг өргөнөөр ашигладаг янз бүрийн талбарууд: барихаас социологийн судалгаа, шинжлэх ухааны таамаглалыг статистикийн аргаар шалгах.

Тодорхойлолт

Статистикийн ач холбогдлын түвшин (эсвэл статистикийн ач холбогдолтой үр дүн) нь судлагдсан үзүүлэлтүүдийн санамсаргүй тохиолдлын магадлалыг харуулдаг. Үзэгдлийн ерөнхий статистик ач холбогдол нь p-утга (p-түвшин)-ээр илэрхийлэгдэнэ. Аливаа туршилт, ажиглалтын явцад олж авсан өгөгдөл нь түүвэрлэлтийн алдаанаас болж үүссэн байх магадлалтай. Энэ нь ялангуяа социологийн хувьд үнэн юм.

Өөрөөр хэлбэл, санамсаргүй тохиолдох магадлал нь маш бага эсвэл хэт туйлширдаг үнэ цэнэ нь статистикийн хувьд чухал юм. Энэ нөхцөлд хамгийн туйл бол статистикийн тэг таамаглалаас хазайх зэрэг юм (олж авсан түүврийн өгөгдөлтэй нийцэж байгаа эсэхийг шалгасан таамаглал). Шинжлэх ухааны практикт ач холбогдлын түвшинг өгөгдөл цуглуулахаас өмнө сонгодог бөгөөд дүрмээр бол түүний коэффициент 0.05 (5%) байна. Чухал ач холбогдолтой системүүдийн хувьд тодорхой утгууд, энэ үзүүлэлт 0.01 (1%) буюу түүнээс бага байж болно.

Суурь

Ач холбогдлын түвшний тухай ойлголтыг Английн статистикч, генетикч Рональд Фишер 1925 онд статистикийн таамаглалыг шалгах аргачлалыг боловсруулж байх үед нэвтрүүлсэн. Аливаа үйл явцыг шинжлэхэд тодорхой үзэгдлийн тодорхой магадлал байдаг. "Хэмжилтийн алдаа" гэсэн ойлголтод хамаарах магадлалын бага (эсвэл тодорхой бус) хувьтай ажиллахад хүндрэл гардаг.

Туршилтад хангалттай бус статистик тоо баримттай ажиллахдаа эрдэмтэд бага утгатай ажиллахаас "урьдчилан сэргийлдэг" тэг таамаглалын асуудалтай тулгарсан. Фишер ийм системд үйл явдлын магадлалыг 5% (0.05) -аар тодорхойлохыг санал болгосон бөгөөд энэ нь тооцоололд тэг таамаглалыг үгүйсгэх боломжийг олгодог.

Тогтмол коэффициентийг нэвтрүүлэх

1933 онд Жерзигийн эрдэмтэдНейманн, Эгон Пирсон нар өөрсдийн нийтлэлдээ тодорхой ач холбогдлын түвшинг урьдчилан тогтоохыг зөвлөж байна (мэдээлэл цуглуулахаас өмнө). Эдгээр дүрмүүдийг ашигласан жишээ сонгуулийн үеэр тодорхой харагдаж байна. Нэг нь олны танил, нөгөө нь төдийлөн танигдаагүй хоёр нэр дэвшигч байна гэж бодъё. Нэгдүгээр нэр дэвшигч сонгуульд ялах нь ойлгомжтой, хоёрдугаарт орох магадлал тэглэх хандлагатай байна. Хүсэл эрмэлзэл - гэхдээ тэгш бус: давагдашгүй хүчин зүйл, сенсаацтай мэдээлэл, гэнэтийн шийдвэрүүдЭнэ нь таамагласан сонгуулийн үр дүнг өөрчилж магадгүй юм.

Нейман, Пирсон нар Фишерийн санал болгож буй 0.05 (α тэмдгээр тэмдэглэсэн) ач холбогдлын түвшин нь хамгийн тохиромжтой гэдэгтэй санал нэгджээ. Гэсэн хэдий ч Фишер өөрөө 1956 онд энэ үнэ цэнийг тогтоохыг эсэргүүцсэн. Тэрээр α-ийн түвшинг тодорхой нөхцөл байдалд тохируулан тогтоох ёстой гэж үзсэн. Жишээ нь бөөмийн физикт 0.01 байна.

p-утга

P-утга гэдэг нэр томъёог анх 1960 онд Браунли ашигласан. P-түвшин (p-утга) нь үр дүнгийн үнэнтэй урвуу хамааралтай үзүүлэлт юм. Хамгийн өндөр p-утга нь хувьсагчдын хоорондын түүврийн хамааралд итгэх итгэлийн хамгийн бага түвшинтэй тохирч байна.

Энэ утга нь үр дүнг тайлбарлахтай холбоотой алдаа гарах магадлалыг илэрхийлдэг. p-утга = 0.05 (1/20) гэж үзье. Энэ нь түүвэрт олдсон хувьсагчдын хоорондын хамаарал нь түүврийн санамсаргүй шинж чанар болох таван хувийн магадлалыг харуулж байна. Өөрөөр хэлбэл, хэрэв энэ хамаарал байхгүй бол 20 дахь судалгаа бүрт ижил төстэй туршилтуудыг давтан хийснээр хувьсагчдын хооронд ижил эсвэл илүү их хамааралтай байх болно. Ихэнхдээ p-түвшинг алдааны түвшний "маржин" гэж үздэг.

Дашрамд хэлэхэд, p-утга нь тусгаагүй байж магадгүй юм жинхэнэ донтолтхувьсагчдын хооронд, гэхдээ зөвхөн таамаглал доторх зарим дундаж утгыг харуулдаг. Ялангуяа өгөгдлийн эцсийн дүн шинжилгээ нь сонгосон утгуудаас хамаарна өгөгдсөн коэффициент. p-түвшин = 0.05 бол зарим үр дүн гарах бөгөөд 0.01-тэй тэнцүү коэффициенттэй бол бусад.

Статистикийн таамаглалыг шалгах

Таамаглалыг шалгахдаа статистикийн ач холбогдлын түвшин онцгой чухал байдаг. Жишээлбэл, хоёр сүүлт туршилтыг тооцоолохдоо татгалзсан талбайг түүвэрлэлтийн тархалтын хоёр төгсгөлд (тэг координаттай харьцуулахад) тэнцүү хувааж, олж авсан өгөгдлийн үнэнийг тооцоолно.

Тодорхой үйл явцыг (үзэгдэл) хянахдаа шинэ статистик мэдээлэл нь өмнөх утгуудтай харьцуулахад бага өөрчлөлтийг харуулж байна гэж бодъё. Үүний зэрэгцээ үр дүнгийн зөрүү нь бага, тодорхой биш боловч судалгаанд чухал ач холбогдолтой юм. Мэргэжилтэн бэрхшээлтэй тулгардаг: өөрчлөлтүүд үнэхээр тохиолддог уу эсвэл түүвэрлэлтийн алдаа (хэмжилтийн алдаа) байна уу?

Энэ тохиолдолд тэг таамаглалыг хэрэгжүүлэх буюу няцаах (бүх зүйлийг алдаа гэж бичнэ, эсвэл системийн өөрчлөлтийг амжилттай гэж хүлээн зөвшөөрнө). Асуудлыг шийдвэрлэх үйл явц нь нийт статистикийн ач холбогдол (p-утга) болон ач холбогдлын түвшний (α) харьцаанд суурилдаг. Хэрэв p түвшний< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Ашигласан утгууд

Ач холбогдлын түвшин нь дүн шинжилгээ хийсэн материалаас хамаарна. Практикт дараах тогтмол утгуудыг ашигладаг.

  • α = 0.1 (эсвэл 10%);
  • α = 0.05 (эсвэл 5%);
  • α = 0.01 (эсвэл 1%);
  • α = 0.001 (эсвэл 0.1%).

Тооцоолол илүү нарийвчлалтай байх тусам α коэффициент бага байх болно. Мэдээжийн хэрэг, физик, хими, эм зүй, генетикийн статистикийн таамаглал нь улс төрийн шинжлэх ухаан, социологиос илүү нарийвчлал шаарддаг.

Тодорхой газар нутагт ач холбогдлын босго

Бөөмийн физик, үйлдвэрлэл зэрэг өндөр нарийвчлалтай салбарт статистикийн ач холбогдлыг стандарт хазайлтын харьцаа (сигма коэффицентээр тэмдэглэсэн - σ) гэж ихэвчлэн илэрхийлдэг. хэвийн тархалтмагадлал (Гаусын тархалт). σ нь тодорхой хэмжигдэхүүний утгын тархалтыг тодорхойлдог статистик үзүүлэлт юм. математикийн хүлээлт. Үйл явдлын магадлалыг зурахад ашигладаг.

Мэдлэгийн салбараас хамааран σ коэффициент нь ихээхэн ялгаатай байдаг. Жишээлбэл, Хиггс бозоны оршин тогтнохыг урьдчилан таамаглах үед σ параметр нь тавтай тэнцүү (σ=5) бөгөөд энэ нь p-утга=1/3.5 сая талбайтай тохирч байна.

Үр ашиг

α ба p-утга коэффициентүүд нь яг шинж чанар биш гэдгийг анхаарч үзэх хэрэгтэй. Судалж буй үзэгдлийн статистикийн ач холбогдлын түвшин ямар ч байсан энэ нь таамаглалыг хүлээн зөвшөөрөх болзолгүй үндэслэл биш юм. Жишээлбэл, илүү бага үнэ цэнэα, таамаглал нь чухал байх магадлал өндөр байна. Гэсэн хэдий ч алдаа гарах эрсдэлтэй бөгөөд энэ нь судалгааны статистик хүчийг (ач холбогдол) бууруулдаг.

Зөвхөн статистикийн ач холбогдолтой үр дүнд анхаарлаа төвлөрүүлдэг судлаачид алдаатай дүгнэлт хийж болно. Үүний зэрэгцээ тэдний ажлыг давхар шалгахад хэцүү байдаг, учир нь тэд таамаглалуудыг ашигладаг (үнэндээ эдгээр нь α ба p-утгийн утга юм). Тиймээс статистикийн ач холбогдлыг тооцоолохын зэрэгцээ өөр нэг үзүүлэлт болох статистикийн үр нөлөөний хэмжээг тодорхойлохыг үргэлж зөвлөж байна. Үр нөлөөний хэмжээ нь нөлөөллийн хүчийг тоон хэмжүүр юм.

Судалгаа нь ихэвчлэн зарим нэг таамаглалаас эхэлдэг бөгөөд баримтыг оролцуулан баталгаажуулахыг шаарддаг. Энэхүү таамаглал - таамаглал нь объектын тодорхой багц дахь үзэгдэл эсвэл шинж чанаруудын холболттой холбоотой томъёолдог.

Баримт дээр ийм таамаглалыг шалгахын тулд тэдгээрийн тээвэрлэгчдийн харгалзах шинж чанарыг хэмжих шаардлагатай. Гэхдээ бүх өсвөр насныхны түрэмгий байдлыг хэмжих боломжгүй байдаг шиг бүх эмэгтэй, эрэгтэй хүмүүсийн түгшүүрийг хэмжих боломжгүй юм. Тиймээс судалгаа хийхдээ тэдгээр нь зөвхөн холбогдох популяцийн харьцангуй цөөн тооны төлөөлөгчдөөр хязгаарлагддаг.

Хүн ам- энэ бол судалгааны таамаглал дэвшүүлсэн объектуудын бүхэл бүтэн багц юм.

Жишээлбэл, бүх эрчүүд; эсвэл бүх эмэгтэйчүүд; эсвэл хотын бүх оршин суугчид. Судалгааны үр дүнд үндэслэн судлаачийн дүгнэлт гаргах гэж буй нийт хүн ам нь цөөн, илүү даруухан байж болно, жишээлбэл, тухайн сургуулийн нэгдүгээр ангийн бүх хүүхдүүд.

Тиймээс, хүн амын тоо нь хязгааргүй биш ч, дүрмээр бол тасралтгүй судалгаа хийх боломжгүй олон тооны боломжит сэдвүүд юм.

Түүвэр эсвэл түүвэр популяци- энэ бол тусгайлан сонгосон тооны хязгаарлагдмал объектуудын бүлэг (сэтгэл судлалд - субъект, хариулагч). хүн амшинж чанарыг нь судлах. Үүний дагуу түүвэр дээрх ерөнхий популяцийн шинж чанарыг судлах гэж нэрлэдэг сонгомол судалгаа. Бараг бүх сэтгэл зүйн судалгаасонгомол шинж чанартай бөгөөд тэдгээрийн дүгнэлт нь нийт хүн амд хамаарна.

Тиймээс, таамаглал дэвшүүлж, харгалзах ерөнхий популяци тогтоосны дараа судлаач түүврийг зохион байгуулах асуудалтай тулгардаг. Түүвэр нь түүврийн судалгааны дүгнэлтийг нэгтгэх үндэслэлтэй байх ёстой - ерөнхий байдал, тэдгээрийг нийт хүн амд хуваарилах. Судалгааны дүгнэлтийн бодит байдлын гол шалгууруудЭдгээр нь түүврийн төлөөлөл ба (эмпирик) үр дүнгийн статистик хүчин төгөлдөр байдал юм.

Жишээ төлөөлөх байдал- өөрөөр хэлбэл түүний төлөөлөх чанар нь түүврийн судалгаанд хамрагдсан үзэгдлүүдийг ерөнхий популяцид хувьсах байдлын үүднээс бүрэн дүүрэн илэрхийлэх чадвар юм.

Мэдээжийн хэрэг, зөвхөн нийт хүн ам л судалж буй үзэгдлийн бүх хүрээ, хувьсах нюансын бүрэн дүр зургийг өгч чадна. Тиймээс төлөөлөх чадвар нь түүврийн хязгаарлагдмал хэмжээгээр үргэлж хязгаарлагддаг. Судалгааны үр дүнг нэгтгэх хил хязгаарыг тодорхойлох гол шалгуур нь түүврийн төлөөлөл юм. Гэсэн хэдий ч судлаачид хангалттай төлөөлөх түүврийг авах боломжийг олгодог арга техникүүд байдаг (Эдгээр аргуудыг "Туршилтын сэтгэл судлал" курст судалдаг).


Эхний бөгөөд гол арга бол энгийн санамсаргүй (санамсаргүй) сонголт юм. Энэ нь хүн амын гишүүн бүр түүвэрт хамрагдах тэгш боломжийг хангах явдал юм. Санамсаргүй сонголт нь нийт хүн амын хамгийн олон янзын төлөөлөгчдийн түүвэрт орох боломжийг олгодог. Үүний зэрэгцээ сонгон шалгаруулалтад ямар нэгэн тогтмол байдлыг арилгахын тулд тусгай арга хэмжээ авдаг. Энэ нь эцэст нь түүвэрт судлагдсан өмчийг бүхэлд нь биш юмаа гэхэд аль болох олон янзаар харуулах болно гэж найдаж байна.

Төлөөлөгч байдлыг хангах хоёр дахь арга бол давхрагатай санамсаргүй сонголт буюу нийт хүн амын шинж чанарын дагуу сонгох явдал юм. Энэ нь судалж буй хөрөнгийн хувьсах чанарт нөлөөлж болох шинж чанаруудыг (энэ нь хүйс, орлогын түвшин, боловсрол гэх мэт) урьдчилсан байдлаар тодорхойлох явдал юм. Дараа нь нийт хүн амын дунд эдгээр чанараараа ялгаатай бүлгүүдийн (давхарга) тооны хувийн харьцааг тодорхойлж, түүвэр дэх харгалзах бүлгүүдийн ижил хувийн харьцааг өгнө. Цаашилбал, түүврийн дэд бүлэг бүрт субъектуудыг энгийн санамсаргүй сонголтын зарчмын дагуу сонгоно.

Статистикийн хүчин төгөлдөр байдал,эсвэл статистикийн ач холбогдол, судалгааны үр дүнг статистик дүгнэлтийн аргыг ашиглан тодорхойлно.

Судалгааны үр дүнгээс тодорхой дүгнэлт гарган шийдвэр гаргахдаа алдаа гаргахгүй байх даатгалд хамрагдсан уу? Мэдээж үгүй. Эцсийн эцэст бидний шийдвэрүүд нь түүвэр популяцийн судалгааны үр дүн, түүнчлэн бидний сэтгэлзүйн мэдлэгийн түвшинд тулгуурладаг. Бид алдаанаас бүрэн ангид байдаггүй. Статистикийн хувьд ийм алдаа нь 1000 тохиолдлын нэгээс илүүгүй тохиолдолд (алдааны магадлал α = 0.001 эсвэл холбогдох утга) тохиолдвол хүлээн зөвшөөрөгдөх боломжтой гэж үздэг. итгэлийн түвшинзөв дүгнэлт p=0.999); 100-аас нэг тохиолдолд (алдааны магадлал α = 0.01 эсвэл зөв дүгнэлтийн итгэлийн магадлалын холбогдох утга p = 0.99) эсвэл 100-аас таван тохиолдолд (алдааны магадлал α = 0.05 эсвэл итгэх магадлалын холбогдох утга p = 0.99) зөв гаралт p=0.95). Сүүлийн хоёр түвшинд сэтгэл зүйд шийдвэр гаргах нь заншилтай байдаг.

Заримдаа ярихдаа статистик хүчин төгөлдөр байдал, "ач холбогдлын түвшин" (α гэж тэмдэглэсэн) гэсэн ойлголтыг ашигла. p ба α-ийн тоон утгууд нь 1000 хүртэл бие биенээ нөхдөг - үйл явдлын иж бүрэн багц: эсвэл бид хийсэн. зөв дүгнэлтэсвэл бидний буруу. Эдгээр түвшинг тооцдоггүй, тогтоосон байдаг. Ач холбогдлын түвшинг нэг төрлийн "улаан" шугам гэж ойлгож болох бөгөөд тэдгээрийн огтлолцол нь энэ үйл явдлыг санамсаргүй бус гэж хэлэх боломжийг бидэнд олгоно. Эрх бүхий эрдэм шинжилгээний тайлан, нийтлэл бүрт гаргасан дүгнэлтийг дүгнэлт хийж буй p эсвэл α утгын заалттай хавсаргасан байх ёстой.

Статистикийн дүгнэлтийн аргуудыг курст нарийвчлан авч үзсэн болно " Математик статистик". Одоогоор бид зөвхөн тоонд тодорхой шаардлага тавьдаг гэдгийг л тэмдэглэж байна, эсвэл дээжийн хэмжээ.

Харамсалтай нь шаардлагатай дээжийн хэмжээг урьдчилан тодорхойлох хатуу зөвлөмж байхгүй байна. Түүнээс гадна судлаач ихэвчлэн шаардлагатай бөгөөд хангалттай тооны талаархи асуултын хариултыг хэтэрхий оройтсон байдаг - зөвхөн судалгаанд хамрагдсан түүврийн өгөгдөлд дүн шинжилгээ хийсний дараа л авдаг. Гэсэн хэдий ч хамгийн ерөнхий зөвлөмжийг томъёолж болно:

1. Оношилгооны техникийг боловсруулахад хамгийн том түүврийн хэмжээ шаардлагатай - 200-аас 1000-2500 хүн.

2. 2 дээжийг харьцуулах шаардлагатай бол тэдгээрийн нийт тоо 50-аас доошгүй хүн байх; харьцуулсан дээжийн тоо ойролцоогоор ижил байх ёстой.

3. Аливаа шинж чанарын хамаарлыг судалж байгаа бол түүврийн хэмжээ 30-35-аас доошгүй хүн байх ёстой.

4. Илүү их хэлбэлзэлсудалж буй үл хөдлөх хөрөнгийн түүврийн хэмжээ том байх ёстой. Тиймээс түүврийн нэгэн төрлийн байдлыг нэмэгдүүлэх замаар хэлбэлзлийг бууруулж болно, жишээлбэл, хүйс, нас гэх мэт. Энэ нь мэдээжийн хэрэг ерөнхий дүгнэлт гаргах боломжийг бууруулдаг.

Хараат болон бие даасан дээж.Судалгааны ердийн нөхцөл байдал нь судлаачийн сонирхсон шинж чанарыг цаашид харьцуулах зорилгоор хоёр ба түүнээс дээш дээж дээр судлах явдал юм. Эдгээр дээж нь тэдгээрийн зохион байгуулалтын журмаас хамааран өөр өөр харьцаатай байж болно. Бие даасан дээж Нэг түүврийн аль нэг сэдвийг сонгох магадлал нь өөр түүврийн аль нэг сэдвийг сонгохоос хамаардаггүй гэдгээрээ онцлог юм. эсрэг, хамааралтай дээжнэг түүврийн сэдэв тус бүрийг заасны дагуу хуваарилснаар тодорхойлогддог тодорхой шалгуурөөр түүврийн сэдэв.

AT ерөнхий тохиолдолхамааралтай түүвэрт харьцуулсан түүврийн субьектуудыг хосоор нь сонгох, бие даасан түүвэрт - субъектуудын бие даасан сонголт орно.

"Хэсэгчилсэн хамааралтай" (эсвэл "хэсэгчилсэн бие даасан") дээжийн тохиолдлыг зөвшөөрөхгүй гэдгийг тэмдэглэх нь зүйтэй: энэ нь тэдний төлөөллийг урьдчилан таамаглах боломжгүй байдлаар зөрчиж байна.

Эцэст нь хэлэхэд сэтгэлзүйн судалгааны хоёр парадигмыг ялгаж салгаж болно гэдгийг бид тэмдэглэж байна.

Гэж нэрлэдэг R-арга зүйЭнэ нь ямар нэгэн нөлөөлөл, хүчин зүйл эсвэл бусад өмчийн нөлөөн дор тодорхой шинж чанарын (сэтгэл зүйн) хувьсах чадварыг судлах явдал юм. Дээж нь сэдвүүдийн багц юм.

Өөр нэг арга Q-арга зүй,Янз бүрийн өдөөгч (нөхцөл байдал, нөхцөл байдал гэх мэт) нөлөөн дор субьектийн (ганц) хувьсах чадварыг судлахад оршино. Энэ нь тухайн үеийн нөхцөл байдалтай тохирч байна дээж нь өдөөлтийн багц юм.

Өнөөдөр энэ нь үнэхээр дэндүү амархан: та компьютерийн өмнө алхаж, юу хийж байгаагаа бага эсвэл огт мэдэхгүй байж, үнэхээр гайхалтай хурдтайгаар эрүүл ухаантай, утгагүй зүйлийг бүтээж чадна. (Ж. Бокс)

Эмнэлгийн статистикийн үндсэн нэр томьёо, ойлголтууд

Энэ нийтлэлд бид анагаах ухааны судалгаанд хамааралтай статистикийн гол ойлголтуудын заримыг толилуулж байна. Нөхцөлүүдийг холбогдох нийтлэлд илүү нарийвчлан авч үзсэн болно.

Хувилбар

Тодорхойлолт.Утгын мужид өгөгдлийн тархалтын зэрэг (тэмдгийн утга).

Магадлал

Тодорхойлолт. Магадлал гэдэг нь тодорхой нөхцөл байдалд тодорхой үйл явдал тохиолдож болох түвшин юм.

Жишээ. "Ашиглах үед эдгэрэх магадлал" өгүүлбэр дэх нэр томъёоны тодорхойлолтыг тайлбарлая эмийн бүтээгдэхүүн Arimidex нь 70% -тай тэнцэнэ." Үйл явдал нь "өвчтөний эдгэрэлт", "өвчтөн Аримидекс ууж байна" гэсэн нөхцөл байдал, боломжийн зэрэг нь 70% (ойролцоогоор Аримидекс ууж буй 100 хүнээс 70 нь эдгэрдэг).

Хуримтлагдсан магадлал

Тодорхойлолт. t үед амьд үлдэх хуримтлагдсан магадлал нь тухайн үед амьд үлдсэн өвчтөнүүдийн эзлэх хувьтай ижил байна.

Жишээ. Хэрэв таван жилийн эмчилгээний курсын дараа амьд үлдэх магадлал 0.7 байна гэж үзвэл эхний бүлгийн өвчтөнүүдийн 70% нь амьд үлдэж, 30% нь нас барсан гэсэн үг юм. Өөрөөр хэлбэл, зуун хүн тутмын 30 нь эхний 5 жилд нас барсан байна.

Үйл явдал болох цаг

Тодорхойлолт.Үйл явдал хүртэлх хугацаа - энэ нь зарим нэгжээр илэрхийлэгдсэн, эхний үеэс эхлэн зарим үйл явдал тохиолдох хүртэл өнгөрсөн хугацаа юм.

Тайлбар. Анагаах ухааны судалгааны цаг хугацааны нэгж нь өдөр, сар, жил юм.

Эхний үеийн ердийн жишээ:

    өвчтөний хяналтын эхлэл

    мэс заслын эмчилгээ

Боломжит үйл явдлын ердийн жишээ:

    өвчний явц

    дахилт

    тэвчээртэй үхэл

Дээж

Тодорхойлолт.Сонголтоор олж авсан популяцийн хэсэг.

Түүврийн шинжилгээний үр дүнд үндэслэн нийт хүн амын талаар дүгнэлт гаргадаг бөгөөд энэ нь санамсаргүй байдлаар сонгогдсон тохиолдолд л хүчинтэй. Популяциас санамсаргүй сонголт хийх нь бараг боломжгүй тул түүвэр нь наад зах нь популяцийг төлөөлөхийг хичээх хэрэгтэй.

Хараат болон бие даасан дээж

Тодорхойлолт.Судалгааны объектуудыг бие биенээсээ хамааралгүйгээр элсүүлсэн дээж. Бие даасан дээжийн өөр хувилбар нь хамааралтай (холбогдсон, хосолсон) дээж юм.

Таамаглал

Хоёр талын болон нэг талын таамаглал

Эхлээд статистикт таамаглал гэдэг нэр томьёоны хэрэглээг тайлбарлая.

Ихэнх судалгааны зорилго нь зарим мэдэгдлийн үнэн эсэхийг шалгах явдал юм. Эмийн шинжилгээний зорилго нь ихэвчлэн нэг эм нь нөгөөгөөсөө илүү үр дүнтэй байдаг гэсэн таамаглалыг шалгах явдал юм (жишээлбэл, Аримидекс нь Тамоксифенээс илүү үр дүнтэй байдаг).

Судалгааны нарийн ширийнийг илэрхийлэхийн тулд баталгаажуулж буй мэдэгдлийг математик байдлаар илэрхийлнэ. Жишээлбэл, А нь Аримидекс хэрэглэж буй өвчтөний наслах жилүүдийн тоо, Т нь Тамоксифен хэрэглэсэн өвчтөний наслах жилүүдийн тоо бол шалгах таамаглалыг A>T гэж бичиж болно.

Тодорхойлолт.Хэрэв таамаглал нь хоёр хэмжигдэхүүнтэй тэнцүү байвал түүнийг хоёр талт гэж нэрлэдэг.

Хоёр талт таамаглалын жишээ: A=T.

Тодорхойлолт. Хоёр хэмжигдэхүүний тэгш бус байдлаас бүрдсэн таамаглалыг нэг талт (1 талт) гэж нэрлэдэг.

Нэг талын таамаглалын жишээ:

Дихотом (хоёртын) өгөгдөл

Тодорхойлолт.Өгөгдлийг зөвхөн хоёр хүчинтэй хувилбараар илэрхийлсэн

Жишээ нь: Өвчтөн "эрүүл" - "өвчтэй". Хаван "байгаа" - "байгаагүй".

Итгэлийн интервал

Тодорхойлолт.Зарим хэмжигдэхүүний итгэлийн интервал нь тухайн хэмжигдэхүүний жинхэнэ утгыг агуулсан хэмжигдэхүүний утгын эргэн тойрон дахь муж (тодорхой түвшний итгэл үнэмшилтэй) юм.

Жишээ. Судалгаанд хамрагдаж буй тоо хэмжээг жилийн өвчтөний тоо гэж үзье. Дунджаар тэдний тоо 500, 95% - итгэлийн интервал- (350, 900). Энэ нь тухайн жилд хамгийн багадаа 350, 900-аас илүүгүй хүн эмнэлэгт хандана гэсэн үг (95% магадлалтай).

Зориулалт. Маш түгээмэл товчлол бол: 95% CI (95% CI) нь 95% итгэлийн түвшинтэй итгэлийн интервал юм.

Найдвартай байдал, статистикийн ач холбогдол (P - түвшин)

Тодорхойлолт. Статистикийн ач холбогдолүр дүн нь түүний "үнэн"-д итгэх итгэлийн хэмжүүр юм.

Аливаа судалгаа нь объектын зөвхөн нэг хэсэг дээр суурилдаг. Мансууруулах бодисын үр нөлөөг судлах нь дэлхий дээрх бүх өвчтөнүүдийн үндсэн дээр хийгддэггүй, гэхдээ зөвхөн тодорхой бүлгийн өвчтөнүүдэд (бүх өвчтөнүүдийн үндсэн дээр дүн шинжилгээ хийх боломжгүй юм).

Шинжилгээний үр дүнд зарим дүгнэлт гарсан гэж үзье (жишээлбэл, Аримидексийг хангалттай эмчилгээ болгон ашиглах нь Тамоксифенээс 2 дахин илүү үр дүнтэй байдаг).

Асуух ёстой асуулт бол: "Та энэ үр дүнд хэр итгэж чадах вэ?".

Бид зөвхөн хоёр өвчтөнд тулгуурлан судалгаа хийж байна гэж төсөөлөөд үз дээ. Мэдээжийн хэрэг, энэ тохиолдолд үр дүнд нь анхаарал болгоомжтой хандах хэрэгтэй. Хэрэв олон тооны өвчтөнд үзлэг хийсэн бол (тоон утга " их тоо” нөхцөл байдлаас хамаарна), дараа нь гаргасан дүгнэлтэд аль хэдийн итгэж болно.

Тиймээс итгэлцлийн зэрэг нь p түвшний (p-утга) үнэ цэнээр тодорхойлогддог.

Өндөр p түвшин нь дээжийн шинжилгээнээс олж авсан үр дүнд итгэх итгэлийн доод түвшинтэй тохирч байна. Жишээлбэл, 0.05 (5%) -тай тэнцэх p-түвшин нь тодорхой бүлгийн дүн шинжилгээ хийх явцад хийсэн дүгнэлт нь зөвхөн 5% -ийн магадлал бүхий эдгээр объектуудын санамсаргүй шинж чанар гэдгийг харуулж байна.

Өөрөөр хэлбэл, маш өндөр магадлалтай (95%), дүгнэлтийг бүх объектод хүргэх боломжтой.

Олон судалгаанд 5% нь зөвшөөрөгдөх p-утга гэж үздэг. Энэ нь жишээ нь p=0.01 байвал үр дүнд нь итгэж болно, харин p=0.06 бол боломжгүй гэсэн үг.

Сурах

хэтийн судалгааОролтын хүчин зүйл дээр үндэслэн дээжийг сонгон авч, зарим үр дүнд бий болсон хүчин зүйлийг дээжинд шинжилдэг судалгаа юм.

Ретроспектив судалгаагарсан хүчин зүйл дээр үндэслэн дээжийг сонгон авч, зарим оролтын хүчин зүйлийг дээжинд шинжилдэг судалгаа юм.

Жишээ. Эхний хүчин зүйл нь 20-иос доош насны жирэмсэн эмэгтэй юм. Үүний үр дүнд хүүхэд 2.5 кг-аас хөнгөн/хүнд байдаг. Хүүхдийн жин нь эхийн наснаас хамаарч байгаа эсэхийг бид шинжилдэг.

Хэрэв бид 2 дээж авч, нэг нь 20-иос доош насны эх, нөгөө нь ахмад настнууд, дараа нь бүлэг тус бүрийн хүүхдийн массад дүн шинжилгээ хийвэл энэ нь хэтийн төлөвтэй судалгаа юм.

Хэрэв бид 2 дээж цуглуулж, нэгд нь - 2.5 кг-аас бага жинтэй хүүхэд төрүүлсэн эхчүүд, нөгөөд - илүү жинтэй, дараа нь бүлэг тус бүрийн эхчүүдийн насыг шинжилвэл энэ нь ретроспектив судалгаа юм (мэдээжийн хэрэг ийм судалгаа юм. Туршилт дууссаны дараа л хийж болно, өөрөөр хэлбэл бүх хүүхэд төрсөн).

Египетээс гарсан

Тодорхойлолт.Эмнэлзүйн ач холбогдолтой үйл явдал, лабораторийн үнэ цэнэ, судлаачийн сонирхлыг татсан шинж тэмдэг. Эмнэлзүйн туршилтанд үр дүн нь эмчилгээний болон урьдчилан сэргийлэх арга хэмжээний үр нөлөөг үнэлэх шалгуур болдог.

Эмнэлзүйн эпидемиологи

Тодорхойлолт.Үүнтэй төстэй тохиолдлуудад өвчний эмнэлзүйн явцын судалгаанд үндэслэн тодорхой өвчтөн бүрийн тодорхой үр дүнг урьдчилан таамаглах боломжийг олгодог шинжлэх ухаан. шинжлэх ухааны аргуудурьдчилсан мэдээний үнэн зөвийг баталгаажуулахын тулд өвчтөнүүдийг судлах.

Когорт

Тодорхойлолт.Судалгаанд оролцогчдын зарим нь нэгдсэн нийтлэг шинж чанарүүсэн бий болсон үед удаан хугацаанд судлагдсан.

Хяналт

Түүхэн хяналт

Тодорхойлолт.Хяналтын бүлгийг судалгаанаас өмнөх хугацаанд байгуулж, шалгасан.

Зэрэгцээ хяналт

Тодорхойлолт.Үндсэн бүлгийг бүрдүүлэхтэй зэрэгцэн байгуулагдсан хяналтын бүлэг.

Корреляци

Тодорхойлолт.Тохиолдлын тодорхой хэсэгт нэг тэмдгийн том утга нь эерэг (шууд) хамаарлын хувьд өөр тэмдгийн утгатай эсвэл бага утгатай тохирч байгааг харуулсан хоёр тэмдгийн (тоон эсвэл дарааллын) статистик хамаарал. - сөрөг (урвуу) хамааралтай тохиолдолд.

Жишээ. Өвчтөний цусан дахь тромбоцит ба лейкоцитын түвшин хооронд мэдэгдэхүйц хамаарал илэрсэн. Корреляцийн коэффициент нь 0.76 байна.

Эрсдлийн харьцаа (CR)

Тодорхойлолт.Эрсдлийн харьцаа (аюулын харьцаа) нь эхний бүлгийн объектын хувьд тодорхой ("муу") үйл явдлын магадлалыг хоёр дахь бүлгийн объектын хувьд ижил үйл явдлын магадлалд харьцуулсан харьцаа юм.

Жишээ. Хэрэв тамхи татдаггүй хүмүүст уушигны хорт хавдар тусах магадлал 20%, тамхи татдаг хүмүүсийн уушигны хорт хавдар тусах магадлал 100% байвал CR тавны нэг болно. Энэ жишээнд эхний бүлгийн объектууд нь тамхи татдаггүй, хоёр дахь бүлэг нь тамхи татдаг хүмүүс бөгөөд уушигны хорт хавдар үүсэх нь "муу" үйл явдал гэж тооцогддог.

Энэ нь тодорхой байна:

1) КР=1 бол бүлгүүдэд тохиолдох үйл явдлын магадлал ижил байна

2) Хэрэв КР>1 бол үйл явдал нь хоёрдугаар бүлгийнхээс илүү эхний бүлгийн объектуудад тохиолддог

3) хэрэв CR<1, то событие чаще происходит с объектами из второй группы, чем из первой

Мета-анализ

Тодорхойлолт. FROMижил асуудлыг судалж буй хэд хэдэн судалгааны үр дүнг нэгтгэсэн статистик дүн шинжилгээ (ихэвчлэн эмчилгээ, урьдчилан сэргийлэх, оношлох аргын үр нөлөө). Цуглуулгын судалгаа нь дүн шинжилгээ хийхэд илүү том түүвэр, нэгтгэсэн судалгааны статистикийн илүү их хүчийг өгдөг. Судалгааны аргын үр дүнтэй байдлын талаархи нотлох баримт эсвэл дүгнэлтэд итгэх итгэлийг нэмэгдүүлэхэд ашигладаг.

Каплан-Мейерийн арга (Олон Каплан-Мейерийн тооцоо)

Энэ аргыг статистикч Э.Л.Каплан, Пол Майер нар зохион бүтээжээ.

Энэ аргыг өвчтөнийг ажиглах хугацаатай холбоотой янз бүрийн хэмжигдэхүүнийг тооцоолоход ашигладаг. Ийм утгын жишээ:

    эмийг хэрэглэх үед нэг жилийн дотор эдгэрэх боломж

    мэс заслын дараах гурван жилийн дотор мэс заслын дараа дахин давтагдах магадлал

    Эрхтэн тайрсны дараа түрүү булчирхайн хорт хавдартай өвчтөнүүдийн таван жил амьд үлдэх магадлал

Каплан-Майер аргыг ашиглахын давуу талыг тайлбарлая.

"Хэвийн" шинжилгээний утгын утгыг (Каплан-Мейерийн аргыг ашиглаагүй) харгалзан үзсэн хугацааны интервалыг интервалд хуваах үндсэн дээр тооцоолно.

Жишээлбэл, хэрэв бид 5 жилийн дотор өвчтөний нас барах магадлалыг судалж үзвэл хугацааны интервалыг 5 хэсэгт (1 жилээс бага, 1-2 жил, 2-3 жил, 3-4 жил, 4-) хувааж болно. 5 жил), мөн 10 (тус бүр хагас жил), эсвэл өөр тооны интервал. Үр дүн нь өөр өөр хуваалтуудын хувьд өөр байх болно.

Хамгийн тохиромжтой хуваалтыг сонгох нь тийм ч амар ажил биш юм.

Каплан-Мейерийн аргаар олж авсан хэмжигдэхүүний утгын тооцоо нь ажиглалтын хугацааг интервалд хуваахаас хамаардаггүй бөгөөд зөвхөн өвчтөн бүрийн амьдралын хугацаанаас хамаарна.

Тиймээс судлаачид дүн шинжилгээ хийх нь илүү хялбар байдаг бөгөөд үр дүн нь ихэвчлэн "ердийн" шинжилгээний үр дүнгээс илүү чанартай байдаг.

Каплан-Майерын муруй нь Каплан-Мейерийн аргыг ашиглан олж авсан амьд үлдэх муруйн график юм.

Кокс загвар

Энэхүү загварыг Английн нэрт статистикч, 300 гаруй нийтлэл, номын зохиогч Сэр Дэвид Роксби Кокс (1924 онд төрсөн) зохион бүтээжээ.

Кокс загварыг эсэн мэнд үлдэх шинжилгээнд судлагдсан хэмжигдэхүүнүүд нь цаг хугацааны функцээс хамаардаг нөхцөлд ашигладаг. Жишээлбэл, t жилийн дараа дахин давтагдах магадлал (t=1.2,...) нь log(t) хугацааны логарифмаас хамаарч болно.

Коксын санал болгосон аргын чухал давуу тал нь энэ аргыг олон тооны нөхцөл байдалд ашиглах боломжтой байдаг (загвар нь магадлалын тархалтын шинж чанар, хэлбэрт хатуу хязгаарлалт тавьдаггүй).

Кокс загвар дээр үндэслэн шинжилгээг (Кокс шинжилгээ гэж нэрлэдэг) хийж болох бөгөөд үр дүнд нь эрсдэлийн харьцааны утга болон эрсдэлийн харьцааны итгэлцлийн интервал бий болно.

Статистикийн параметрийн бус аргууд

Тодорхойлолт.Хэвийн бус тархсан тоон мэдээлэлд дүн шинжилгээ хийх, мөн чанарын өгөгдөлд дүн шинжилгээ хийхэд голчлон ашигладаг статистикийн аргуудын ангилал.

Жишээ. Эмчилгээний төрлөөс хамааран өвчтөнүүдийн систолын даралтын ялгааны ач холбогдлыг тодорхойлохын тулд параметрийн бус Манн-Уитни тестийг ашиглана.

Онцлог (хувьсагч)

Тодорхойлолт. Xсудалгааны объектын шинж чанар (ажиглалт). Чанарын болон тоон шинж чанарууд байдаг.

Санамсаргүй болгох

Тодорхойлолт.Тусгай хэрэглүүр (хүснэгт эсвэл санамсаргүй тооны тоолуур, зоос шидэх болон бусад ажиглалтанд бүлгийн дугаарыг санамсаргүй байдлаар олгох) ашиглан судалгааны объектыг үндсэн болон хяналтын бүлэгт санамсаргүй хуваарилах арга. Санамсаргүй сонголт нь судалж буй үр дүнд нөлөөлж болзошгүй мэдэгдэж байгаа болон үл мэдэгдэх шинж чанаруудын хувьд бүлгүүдийн хоорондын ялгааг багасгадаг.

Эрсдэл

АтрибутивСудалгааны объектод тодорхой шинж чанар (эрсдлийн хүчин зүйл) байгаа тул таагүй үр дагавар (жишээлбэл, өвчин) үүсэх нэмэлт эрсдэл. Энэ эрсдэлт хүчин зүйлтэй холбоотой өвчин үүсэх эрсдэлийн нэг хэсэг бөгөөд үүгээрээ тайлбарлагддаг бөгөөд энэ эрсдэлт хүчин зүйлийг арилгавал арилгах боломжтой.

Харьцангуй эрсдэл- нэг бүлгийн таагүй нөхцөл байдлын эрсдэлийг нөгөө бүлгийн эрсдэлтэй харьцуулсан харьцаа. Энэ нь бүлгүүдийг урьдчилан үүсгэсэн, судалж буй нөхцөл байдал хараахан гараагүй байгаа тохиолдолд хэтийн болон ажиглалтын судалгаанд ашиглагддаг.

гулсмал шалгалт

Тодорхойлолт.Ажиглалтуудыг дараалан устгаж, загварыг дахин тооцоолох замаар статистик загварын тогтвортой байдал, найдвартай байдал, гүйцэтгэл (хүчин төгөлдөр) -ийг шалгах арга. Үүссэн загварууд нь илүү төстэй байх тусам загвар нь илүү тогтвортой, найдвартай байдаг.

Үйл явдал

Тодорхойлолт.Судалгааны явцад ажиглагдсан эмнэлзүйн үр дүн, тухайлбал хүндрэл үүсэх, дахилт, эдгэрэлт, үхэл.

Давхаргалалт

Тодорхойлолт. Мсудалгаанд хамрагдах шалгуурыг хангасан бүх оролцогчдын популяцийг эхлээд судалж буй үр дүнд нөлөөлж болох нэг буюу хэд хэдэн шинж чанарт (ихэвчлэн хүйс, нас) үндэслэн бүлэгт (давхарга) хуваадаг түүвэрлэлтийн арга. Эдгээр бүлгүүд (давхарга), оролцогчдыг туршилтын болон хяналтын бүлэгт бие даан элсүүлдэг. Энэ нь судлаачдад туршилтын болон хяналтын бүлгийн хоорондох чухал шинж чанаруудыг тэнцвэржүүлэх боломжийг олгодог.

Болзошгүй байдлын хүснэгт

Тодорхойлолт.Ажиглалтын үнэмлэхүй давтамжийн (тоо) хүснэгт, багана нь нэг шинж чанарын утгуудтай, мөрүүд нь өөр шинж чанарын утгатай тохирч байна (хоёр хэмжээст гэнэтийн хүснэгтийн хувьд). Үнэмлэхүй давтамжийн утгууд нь мөр, баганын уулзвар дахь нүднүүдэд байрладаг.

Болзошгүй байдлын хүснэгтийн жишээг өгье. Аневризмын мэс засал 194 өвчтөнд хийгдсэн. Мэс засал хийлгэхээс өмнө өвчтөнд хавангийн хүндийн зэрэглэлийн мэдэгдэж буй үзүүлэлт.

Хаван \ Үр дүн

хаван байхгүй 20 6 26
дунд зэргийн хавдар 27 15 42
тод хаван 8 21 29
мж 55 42 194

Ийнхүү хавангүй 26 өвчтөнөөс 20 өвчтөн хагалгааны дараа амьд үлдэж, 6 өвчтөн нас баржээ. Дунд зэргийн хавантай 42 өвчтөнөөс 27 өвчтөн амьд үлдэж, 15 нь нас барсан гэх мэт.

Болзошгүй байдлын хүснэгтийн хи-квадрат тест

Нэг шинж тэмдгийн ялгааны ач холбогдлыг (найдвартай байдлыг) тодорхойлохын тулд бусад шинж тэмдгүүдээс хамаарч (жишээлбэл, хавангийн хүнд байдлаас хамааран мэс заслын үр дүн) болзошгүй байдлын хүснэгтэд хи-квадрат тестийг ашигладаг.


Боломж

Зарим үйл явдлын магадлалыг p-тэй тэнцүү болгоё. Тэгвэл үйл явдал болохгүй байх магадлал 1-p байна.

Жишээлбэл, хэрэв өвчтөн таван жилийн дараа амьд үлдэх магадлал 0.8 (80%) бол энэ хугацаанд нас барах магадлал 0.2 (20%) байна.

Тодорхойлолт.Боломж гэдэг нь үйл явдал тохиолдох магадлалыг тохиолдохгүй байх магадлалд харьцуулсан харьцаа юм.

Жишээ. Бидний жишээнд (өвчтөний тухай) боломж 4 байна, учир нь 0.8/0.2=4

Тиймээс эдгэрэх магадлал нь нас барах магадлалаас 4 дахин их байдаг.

Хэмжигдэхүүний утгын тайлбар.

1) Боломж=1 бол үйл явдал болох магадлал нь тухайн үйл явдал тохиолдохгүй байх магадлалтай тэнцүү байна;

2) Хэрэв Боломж >1 бол үйл явдлын магадлал нь тохиолдохгүй байх магадлалаас их байна;

3) хэрэв боломж<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

санаанд оромгүй, харьцаа

Тодорхойлолт.Тооцооллын харьцаа нь эхний бүлгийн объектуудын магадлалыг хоёр дахь бүлгийн объектуудын магадлалын харьцаа юм.

Жишээ. Эрэгтэй, эмэгтэй хүмүүсийн аль аль нь ямар нэгэн эмчилгээ хийлгэдэг гэж бодъё.

Эрэгтэй өвчтөн таван жилийн дараа амьд үлдэх магадлал 0.6 (60%); Энэ хугацаанд түүний үхэх магадлал 0.4 (40%) байна.

Эмэгтэйчүүдийн хувьд ижил төстэй магадлал 0.8 ба 0.2 байна.

Энэ жишээн дээрх магадлалын харьцаа

Хэмжигдэхүүний утгын тайлбар.

1) Хэрэв магадлалын харьцаа = 1 бол эхний бүлгийн боломж хоёр дахь бүлгийн боломжтой тэнцүү байна.

2) Хэрэв магадлалын харьцаа >1 бол эхний бүлгийн боломж хоёрдугаар бүлгийн боломжоос их байна.

3) Хэрэв магадлалын харьцаа<1, то шанс для первой группы меньше шанса для второй группы

Статистик нь эрт дээр үеэс амьдралын салшгүй хэсэг байсаар ирсэн. Хүмүүс хаа сайгүй үүнтэй тулгардаг. Статистик мэдээлэлд үндэслэн хаана, ямар өвчин түгээмэл байдаг, тухайн бүс нутагт эсвэл хүн амын тодорхой хэсэгт юу илүү эрэлт хэрэгцээтэй байгаа талаар дүгнэлт гаргадаг. Тэр ч байтугай төрийн байгууллагад нэр дэвшигчдийн улс төрийн хөтөлбөрийг бий болгох нь түүнд тулгуурладаг. Тэдгээрийг жижиглэн худалдааны сүлжээнүүд бараа бүтээгдэхүүн худалдан авахдаа ашигладаг бөгөөд үйлдвэрлэгчид саналдаа эдгээр өгөгдлийг удирддаг.

Статистик нь нийгмийн амьдралд чухал үүрэг гүйцэтгэдэг бөгөөд түүний бие даасан гишүүн бүрт бага ч гэсэн нөлөөлдөг. Жишээлбэл, хэрэв ихэнх хүмүүс тодорхой хот, бүс нутагт бараан өнгийг илүүд үздэг бол орон нутгийн дэлгүүрүүдээс цэцгийн хэвлэмэл бүхий тод шар өнгийн борооны цув олоход хэцүү байх болно. Гэхдээ ийм нөлөө үзүүлдэг эдгээр өгөгдлийг бүрдүүлдэг тоо хэмжээ нь юу вэ? Жишээлбэл, "статистикийн ач холбогдолтой" гэж юу вэ? Энэ тодорхойлолтод яг юуг хэлээд байна вэ?

Энэ юу вэ?

Статистик нь шинжлэх ухаан болохын хувьд янз бүрийн хэмжигдэхүүн, ойлголтуудын хослолоос бүрддэг. Үүний нэг нь "статистикийн ач холбогдол" гэсэн ойлголт юм. Энэ бол хувьсагчдын утгын нэр бөгөөд бусад үзүүлэлтүүдийн харагдах магадлал нь ач холбогдолгүй юм.

Жишээлбэл, 10 хүн тутмын 9 нь бороотой шөнийн дараа намрын ойд мөөгний төлөө өглөө алхахдаа хөлөндөө резинэн гутал өмсдөг. Хэзээ нэгэн цагт тэдний 8 нь зотон мокасин өмссөн байх магадлал маш бага юм. Тиймээс, энэ жишээнд 9 тоо нь "статистикийн ач холбогдол" гэж нэрлэгддэг утга юм.

Үүний дагуу, бид өгөгдсөн практик жишээг цааш нь хөгжүүлбэл гутлын дэлгүүрүүд зуны улирал дуустал жилийн бусад үетэй харьцуулахад илүү их хэмжээгээр резинэн гутал худалдаж авдаг. Тэгэхээр статистикийн үнэ цэнийн хэмжээ нь энгийн амьдралд нөлөөлдөг.

Мэдээжийн хэрэг, нарийн төвөгтэй тооцоололд вирусын тархалтыг урьдчилан таамаглахдаа олон тооны хувьсагчдыг харгалзан үздэг. Гэхдээ тооцооллын нарийн төвөгтэй байдал, тогтмол бус утгуудын тооноос үл хамааран статистик мэдээллийн чухал үзүүлэлтийг тодорхойлох мөн чанар нь ижил төстэй юм.

Үүнийг хэрхэн тооцдог вэ?

Тэгшитгэлийн "статистикийн ач холбогдол" гэсэн үзүүлэлтийн утгыг тооцоолоход ашигладаг. Өөрөөр хэлбэл, энэ тохиолдолд бүх зүйлийг математик шийддэг гэж маргаж болно. Тооцооллын хамгийн энгийн сонголт бол дараахь параметрүүдийг багтаасан математик үйлдлүүдийн гинжин хэлхээ юм.

  • судалгаа эсвэл объектив өгөгдлийн судалгаанаас олж авсан хоёр төрлийн үр дүн, жишээлбэл, худалдан авалт хийсэн дүнг a, b гэж тэмдэглэсэн;
  • хоёр бүлгийн үзүүлэлт - n;
  • хосолсон дээжийн эзлэх хувийн үнэ - p;
  • "стандарт алдаа" гэсэн ойлголт - SE.

Дараагийн алхам бол тестийн ерөнхий үзүүлэлтийг тодорхойлох явдал юм - t, түүний утгыг 1.96 тоотой харьцуулна. 1.96 нь Оюутны t-тархалтын дагуу 95%-ийн мужийг төлөөлж буй дундаж утга юм.

n ба p-ийн утгуудын хооронд ямар ялгаа байдаг вэ гэсэн асуулт ихэвчлэн гарч ирдэг. Энэ нюансыг жишээгээр тодруулахад хялбар байдаг. Эрэгтэй, эмэгтэй хүмүүсийн аливаа бүтээгдэхүүн, брэндэд үнэнч байх статистикийн ач холбогдлыг тооцоолсон гэж бодъё.

Энэ тохиолдолд үсгүүдийн араас дараахь зүйл орно.

  • n - санал асуулгад оролцогчдын тоо;
  • p - бүтээгдэхүүнд сэтгэл хангалуун байгаа хүмүүсийн тоо.

Энэ тохиолдолд ярилцлагад хамрагдсан эмэгтэйчүүдийн тоог n1 гэж тооцно. Үүний дагуу эрэгтэйчүүд - n2. Үүнтэй ижил утга нь p тэмдэгт дээр "1" ба "2" тоотой байна.

Туршилтын үзүүлэлтийг Оюутны тооцооллын хүснэгтийн дундаж утгатай харьцуулах нь "статистикийн ач холбогдол" гэж нэрлэгддэг зүйл болно.

Баталгаажуулалт гэж юу гэсэн үг вэ?

Математикийн аливаа тооцооллын үр дүнг үргэлж шалгаж болно, хүүхдүүдэд үүнийг бага ангид заадаг. Статистикийн үзүүлэлтүүдийг тооцооллын гинжин хэлхээ ашиглан тодорхойлдог тул тэдгээрийг шалгадаг гэж үзэх нь логик юм.

Гэсэн хэдий ч статистикийн ач холбогдлыг шалгах нь зөвхөн математик биш юм. Статистик нь олон тооны хувьсагч, янз бүрийн магадлалыг авч үздэг бөгөөд энэ нь үргэлж тооцоолох боломжгүй байдаг. Өөрөөр хэлбэл, бид нийтлэлийн эхэнд резинэн гутлын жишээ рүү буцах юм бол дэлгүүрийн бараа худалдан авагчдын найдах статистик мэдээллийн логик бүтэц нь намрын улиралд ердийн бус хуурай, халуун цаг агаарт саад болж болзошгүй юм. . Энэ үзэгдлийн үр дүнд резинэн гутал худалдан авах иргэдийн тоо буурч, худалдааны цэгүүд алдагдал хүлээх болно. Мэдээжийн хэрэг, математикийн томъёо нь цаг агаарын гажигыг урьдчилан таамаглах боломжгүй юм. Энэ мөчийг "алдаа" гэж нэрлэдэг.

Тооцоолсон ач холбогдлын түвшинг шалгахдаа ийм алдаа гарах магадлалыг харгалзан үздэг. Энэ нь тооцоолсон үзүүлэлтүүд болон хүлээн зөвшөөрөгдсөн ач холбогдлын түвшин, түүнчлэн таамаглал гэж нэрлэгддэг хэмжигдэхүүнүүдийг харгалзан үздэг.

Ач холбогдлын түвшин гэж юу вэ?

"Түвшин" гэсэн ойлголт нь статистикийн ач холбогдлын үндсэн шалгуурт багтдаг. Үүнийг хэрэглээний болон практик статистикт ашигладаг. Энэ бол болзошгүй хазайлт эсвэл алдаа гарах магадлалыг харгалзан үздэг нэг төрлийн үнэ цэнэ юм.

Түвшин нь бэлэн дээжийн ялгааг тодорхойлоход суурилдаг бөгөөд энэ нь тэдгээрийн ач холбогдол эсвэл эсрэгээр санамсаргүй байдлыг тогтоох боломжийг олгодог. Энэ ухагдахуун нь зөвхөн дижитал утгатай төдийгүй тэдний өвөрмөц тайлбартай байдаг. Тэд утгыг хэрхэн ойлгохыг тайлбарлаж, үр дүнг дундаж индекстэй харьцуулах замаар түвшинг өөрөө тодорхойлдог бөгөөд энэ нь ялгааны найдвартай байдлын түвшинг харуулдаг.

Тиймээс, түвшний тухай ойлголтыг энгийн байдлаар танилцуулах боломжтой - энэ нь хүлээн авсан статистик мэдээллээс гаргасан дүгнэлтэнд хүлээн зөвшөөрөгдөх, магадлалтай алдаа эсвэл алдааны үзүүлэлт юм.

Ямар ач холбогдлын түвшинг ашигладаг вэ?

Практикт алдааны магадлалын коэффициентүүдийн статистик ач холбогдол нь үндсэн гурван түвшинд суурилдаг.

Эхний түвшин нь 5% байх босго юм. Өөрөөр хэлбэл, алдаа гарах магадлал 5% -иас хэтрэхгүй байна. Энэ нь статистикийн судалгааны мэдээлэлд үндэслэн гаргасан дүгнэлтийн өөгүй, алдаагүй гэдэгт итгэх итгэл 95% байна гэсэн үг юм.

Хоёр дахь түвшин нь 1% босго юм. Үүний дагуу энэ тоо нь статистикийн тооцооллын явцад олж авсан мэдээллээр 99% итгэлтэйгээр удирдаж болно гэсэн үг юм.

Гурав дахь түвшин нь 0.1% байна. Энэ утгын хувьд алдаа гарах магадлал нь хувьтай тэнцүү, өөрөөр хэлбэл алдааг бараг арилгадаг.

Статистикийн таамаглал гэж юу вэ?

Үзэл баримтлалын хувьд алдаа нь тэг таамаглалыг хүлээн зөвшөөрөх эсвэл үгүйсгэх хоёр хэсэгт хуваагддаг. Таамаглал гэдэг нь тодорхойлолтын дагуу бусад өгөгдөл эсвэл мэдэгдлийн багц нуугдаж буй ойлголт юм. Энэ нь статистикийн нягтлан бодох бүртгэлийн сэдэвтэй холбоотой аливаа зүйлийн магадлалын хуваарилалтын тодорхойлолт юм.

Энгийн тооцоололд тэг ба хувилбар гэсэн хоёр таамаглал байдаг. Тэдгээрийн ялгаа нь тэг таамаглал нь статистикийн ач холбогдлыг тодорхойлоход оролцсон түүврийн хооронд үндсэн ялгаа байхгүй гэсэн санаан дээр үндэслэсэн бөгөөд өөр хувилбар нь түүний эсрэг тэсрэг байдаг. Өөрөөр хэлбэл, өөр таамаглал нь эдгээр түүвэрт мэдэгдэхүйц ялгаа байгаа эсэх дээр суурилдаг.

Ямар алдаанууд байна вэ?

Статистикийн ойлголт болох алдаа нь нэг эсвэл өөр таамаглалыг үнэн гэж хүлээн зөвшөөрөхөөс шууд хамаардаг. Тэдгээрийг хоёр чиглэл эсвэл төрөлд хувааж болно:

  • эхний төрөл нь тэг таамаглалыг хүлээн зөвшөөрсөнтэй холбоотой бөгөөд энэ нь буруу болсон;
  • хоёр дахь нь өөр хувилбарыг дагаснаар үүсдэг.

Эхний төрлийн алдааг хуурамч эерэг гэж нэрлэдэг бөгөөд статистикийг ашигладаг бүх салбарт нэлээд түгээмэл байдаг. Үүний дагуу хоёр дахь төрлийн алдааг хуурамч сөрөг гэж нэрлэдэг.

Статистикт регресс яагаад чухал вэ?

Регрессийн статистик ач холбогдол нь өгөгдлийн үндсэн дээр тооцоолсон янз бүрийн хамаарлын загвар нь бодит байдалд хэр нийцэж байгааг тогтооход ашиглаж болно; нягтлан бодох бүртгэл, дүгнэлт гаргах хүчин зүйлсийн хүрэлцээ, дутагдлыг тодорхойлох боломжийг танд олгоно.

Үр дүнг Фишерийн хүснэгтэд жагсаасан өгөгдөлтэй харьцуулах замаар регрессийн утгыг тодорхойлно. Эсвэл дисперсийн шинжилгээ ашиглан. Регрессийн үзүүлэлтүүд нь олон тооны хувьсагч, санамсаргүй өгөгдөл, болзошгүй өөрчлөлтүүд оролцдог цогц статистик судалгаа, тооцоололд чухал ач холбогдолтой.

Статистикийн судалгааны ажил бол судалж буй үзэгдлийн мөн чанарт хамаарах хэв маягийг тодорхойлох явдал юм. Үзүүлэлт ба дундаж утгууд нь бодит байдлын тусгал байх ёстой бөгөөд үүний тулд тэдгээрийн найдвартай байдлын түвшинг тодорхойлох шаардлагатай. Нийтлэг популяцийн түүврийн популяцийг зөв харуулахыг төлөөлөх чанар гэж нэрлэдэг . Түүврийн статистик утгын үнэн зөв, найдвартай байдлын хэмжүүр нь түүврийн хэмжээ, судалж буй шинж чанарын хувьд түүврийн популяцийн олон янз байдлын зэргээс хамаардаг төлөөллийн (төлөөлөгчийн) дундаж алдаа юм.

Тиймээс статистикийн судалгааны үр дүнгийн найдвартай байдлын түвшинг тодорхойлохын тулд харьцангуй ба дундаж утга тус бүрийн харгалзах дундаж алдааг тооцоолох шаардлагатай. m p үзүүлэлтийн дундаж алдааг дараах томъёогоор тооцоолно.

Ажиглалтын тоо 30-аас бага бол хаана

P - үзүүлэлтийн утга хувь, ppm гэх мэт.

q - энэ үзүүлэлтийг хувиар нэмбэл 100, % 0 бол 1000 гэх мэт. (жишээ нь q = 100–P, 1000–P гэх мэт)

Тухайлбал, тус бүс нутагт он гарсаар 224 хүн цусан суулга өвчнөөр өвчилжээ. Хүн ам нь 33000. цусан суулга өвчний өвчлөл

Энэ үзүүлэлтийн дундаж алдаа

Шалгуур үзүүлэлтийн найдвартай байдлын зэрэгтэй холбоотой асуудлыг шийдвэрлэхийн тулд итгэлцлийн коэффициентийг (t) тодорхойлдог бөгөөд энэ нь үзүүлэлтийн дундаж алдааны харьцаатай тэнцүү байна.

Бидний жишээн дээр

t өндөр байх тусам итгэлийн түвшин өндөр байна. t=1 үед үзүүлэлтийн найдвартай байх магадлал 68,3%, t=2 үед - 95,5%, t=3 үед - 99,7% байна. Эмнэлгийн статистикийн судалгаанд 95.5% -99.0% итгэлийн түвшин (найдвартай байдал) ихэвчлэн ашиглагддаг бөгөөд хамгийн хариуцлагатай тохиолдолд 99.7% байдаг. Тиймээс бидний жишээн дээр өвчлөлийн түвшин найдвартай байна.

Хэрэв ажиглалтын тоо 30-аас бага бол шалгуур үзүүлэлтийн утгыг Оюутны хүснэгтээр тодорхойлно. Хэрэв олж авсан утга нь хүснэгтийн утгаас өндөр эсвэл тэнцүү байвал үзүүлэлт найдвартай байна. Хэрэв энэ нь доогуур байвал энэ нь хүчингүй болно.

Хоёр нэгэн төрлийн үзүүлэлтийг харьцуулах шаардлагатай бол тэдгээрийн ялгааны найдвартай байдлыг дараах томъёогоор тодорхойлно.

(том тооноос багаыг нь хасах)

Энд P 1 – P 2 нь харьцуулсан хоёр үзүүлэлтийн ялгаа,

нь хоёр үзүүлэлтийн зөрүүний дундаж алдаа юм.

Тухайлбал, Б дүүрэгт он гарсаар 270 хүн цусан суулга өвчнөөр өвчилсөн байна. Тус дүүргийн хүн ам 45000. Иймээс цусан суулга өвчнөөр өвчлөх нь:

тэдгээр. тохиолдлын хувь зөв байна.

Таны харж байгаагаар В бүсэд өвчлөл А бүсээс бага байна. Бид хоёр үзүүлэлтийн зөрүүний найдвартай байдлыг дараах томъёогоор тодорхойлно.

Хэрэв олон тооны ажиглалт (30-аас дээш) байвал t = 2 ба түүнээс дээш бол үзүүлэлтүүдийн ялгаа нь статистикийн хувьд чухал ач холбогдолтой. Тиймээс, бидний жишээн дээр А бүс нутагт өвчлөл нэлээд өндөр байна, учир нь итгэлцлийн хүчин зүйл (t) 2-оос их байна.

Шалгуур үзүүлэлтийн дундаж алдааны утгыг мэдсэнээр санамсаргүй шалтгааны нөлөөллөөс хамааран энэ үзүүлэлтийн итгэлийн хязгаарыг тодорхойлох боломжтой. Итгэлийн хил хязгаарыг дараах томъёогоор тодорхойлно.

P нь үзүүлэлт;

m нь түүний дундаж алдаа;

t нь шаардлагатай найдвартай байдлын утгаас хамааран итгэлийн коэффициентийг сонгоно: t=1 нь 68.3% тохиолдолд үр дүнгийн найдвартай байдалд тохирч байна, t=2 - 95.5%, t=2.6 - 99%, t=3 - 99.7%. , t=3.3 - 99.9 утгыг ахиу алдаа гэнэ.

Жишээлбэл, Б дүүрэгт цусан суулга өвчний тохиолдлын түвшин 99.7-9% -ийн нарийвчлалтай санамсаргүй хүчин зүйлээс шалтгаалан хэлбэлзэж болно. 49.1-ээс 70.9 хүртэл.

Үүнтэй төстэй нийтлэлүүд

2022 parki48.ru. Бид хүрээ байшин барьж байна. Тохижилт. Барилга. Суурь.