Статистикийн ач холбогдол яагаад түвшинтэй байдаг вэ? Статистикийн ач холбогдол: Тодорхойлолт, ойлголт, ач холбогдол, регрессийн тэгшитгэл ба таамаглалыг шалгах

Хувьсагчдын хоорондын аливаа харилцааны үндсэн шинж чанарууд.

Хамгийн их хоёр энгийн шинж чанаруудХувьсагчдын хоорондын хамаарал: (а) харилцааны хэмжээ, (б) харилцааны найдвартай байдал.

- Хэмжээ . Хараат байдлын хэмжигдэхүүнийг ойлгох, хэмжих нь найдвартай байдлаас илүү хялбар байдаг. Жишээлбэл, хэрэв дээжийн аль нэг эрэгтэй цусны цагаан эсийн тоо (WCC) аль ч эмэгтэйгээс өндөр байсан бол энэ хоёр хувьсагч (Хүйс ба WCC) хоорондын хамаарал маш өндөр байна гэж хэлж болно. Өөрөөр хэлбэл, та нэг хувьсагчийн утгыг нөгөөгийнхээс урьдчилан таамаглах боломжтой.

- Найдвартай байдал ("үнэн"). Харилцан хамаарлын найдвартай байдал нь хамаарлын хэмжээнээс бага зөн совингийн ойлголт боловч энэ нь туйлын чухал юм. Харилцааны найдвартай байдал нь дүгнэлт гаргахад үндэслэсэн тодорхой түүврийн төлөөлөлтэй шууд холбоотой байдаг. Өөрөөр хэлбэл, найдвартай байдал гэдэг нь тухайн хүн амын дундаас авсан өөр түүврийн өгөгдлийг ашиглан харилцааг дахин илрүүлэх (өөрөөр хэлбэл, баталгаажуулах) магадлалыг хэлнэ.

Үүнийг санах хэрэгтэй эцсийн зорилгоэнэ нь үнэт зүйлсийн тодорхой жишээг судлах бараг хэзээ ч байдаггүй; түүвэр нь нийт хүн амын тухай мэдээлэл өгөхдөө л сонирхолтой байдаг. Хэрэв судалгаа нь тодорхой шалгуурыг хангаж байвал түүврийн хувьсагчдын хоорондын хамаарлын найдвартай байдлыг стандарт статистикийн хэмжүүр ашиглан тоолж, танилцуулж болно.

Хамаарал ба найдвартай байдлын хэмжээ нь хоёрыг илэрхийлдэг янз бүрийн шинж чанаруудхувьсагчдын хоорондын хамаарал. Гэхдээ бүрэн бие даасан гэж хэлж болохгүй. Хэвийн хэмжээтэй түүвэр дэх хувьсагчдын хоорондын хамаарлын хэмжээ (холболт) их байх тусам найдвартай байх болно (дараагийн хэсгийг үзнэ үү).

Статистикийн ач холбогдолүр дүн (p-түвшин) нь түүний "үнэн"-д итгэх итгэлийн тооцоолсон хэмжүүр юм ("түүврийн төлөөлөл" гэсэн утгаараа). Техникийн хувьд p-түвшин нь үр дүнгийн найдвартай байдлаас хамааран багасах дарааллаар өөрчлөгддөг хэмжүүр юм. Илүү өндөр p түвшинтүүвэрт олдсон хувьсагчдын хоорондын хамааралд итгэх итгэлийн доод түвшинтэй тохирч байна. Тухайлбал, p-түвшин нь ажиглагдсан үр дүнг нийт хүн амд хуваарилахтай холбоотой алдааны магадлалыг илэрхийлдэг.

Жишээлбэл, p-түвшин = 0.05(жишээ нь 1/20) нь түүвэрт олдсон хувьсагчдын хоорондын хамаарал нь түүврийн санамсаргүй шинж чанар байх магадлал 5% байгааг харуулж байна. Олон судалгаанд p-түвшин 0.05 нь алдааны түвшний хувьд "хүлээн зөвшөөрөгдөх маржин" гэж үздэг.

Ямар түвшний ач холбогдлыг үнэхээр "чухал" гэж үзэх ёстойг шийдэхдээ дур зоргоос зайлсхийх арга байхгүй. Үр дүнг худал гэж үгүйсгэх тодорхой ач холбогдлын түвшинг сонгох нь дур зоргоороо юм.



Практик дээр эцсийн шийдвэрЭнэ нь ихэвчлэн янз бүрийн өгөгдөл дээр хийсэн олон дүн шинжилгээ, харьцуулалтын үр дүнд үр дүнг априори (өөрөөр хэлбэл туршилт явуулахаас өмнө) урьдчилан таамаглаж байсан эсэх, эсвэл судалгааны талбарын уламжлалаас шалтгаална.

Ерөнхийдөө олон талбарт p .05-ын үр дүн нь статистикийн ач холбогдлын хувьд хүлээн зөвшөөрөгдөхүйц хязгаар юм, гэхдээ энэ түвшинд нэлээд том алдааны зөрүү (5%) байдгийг санаарай.

p .01 түвшний үр дүнг ерөнхийд нь статистикийн ач холбогдолтой гэж үздэг бол p .005 эсвэл p .00 түвшний үр дүнг ерөнхийд нь статистикийн ач холбогдолтой гэж үздэг. 001 нь маш чухал юм. Гэсэн хэдий ч ач холбогдлын түвшний энэхүү ангилал нь нэлээд дур зоргоороо бөгөөд зөвхөн үндсэн дээр батлагдсан албан бус гэрээ гэдгийг ойлгох хэрэгтэй. практик туршлага тодорхой судалгааны чиглэлээр.

Цуглуулсан өгөгдлийн нийт дүн дээр дүн шинжилгээ хийх тусам олон чухал (сонгосон түвшинд) үр дүн нь санамсаргүй байдлаар илрэх нь тодорхой байна.

Олон тооны харьцуулалтыг багтаасан статистикийн зарим аргууд нь эдгээр төрлийн алдааг давтах өндөр магадлалтай тул тусгай тохируулга эсвэл залруулга хийдэг. нийт тоохарьцуулалт. Гэсэн хэдий ч статистикийн олон аргууд (ялангуяа энгийн аргуудхайгуулын өгөгдлийн шинжилгээ) нь энэ асуудлыг шийдэх ямар ч аргыг санал болгодоггүй.

Хэрэв хувьсагчдын хоорондын хамаарал “объектив” сул байвал том түүврийг судлахаас өөр ийм хамаарлыг шалгах арга байхгүй. Түүвэр нь бүрэн төлөөлөлтэй байсан ч түүврийн хэмжээ бага байвал нөлөө нь статистикийн хувьд чухал биш юм. Үүний нэгэн адил, хэрэв харилцаа нь "объектив" маш хүчтэй бол түүнийг маш бага түүвэрт ч гэсэн өндөр ач холбогдолтойгоор илрүүлж болно.

Хувьсагчдын хоорондын хамаарал сул байх тусам түүнийг бодитой илрүүлэхэд шаардагдах түүврийн хэмжээ их байх болно.

Олон янз харилцааны хэмжүүр хувьсагчдын хооронд. Тодорхой судалгаанд тодорхой хэмжүүрийг сонгох нь хувьсагчийн тоо, ашигласан хэмжүүр, харилцааны шинж чанар гэх мэтээс хамаарна.

Гэсэн хэдий ч эдгээр арга хэмжээний ихэнх нь хамаарна ерөнхий зарчим: Тэд ажиглагдаж буй хамаарлыг авч үзэж буй хувьсагчдын хоорондох "хамгийн их хамаарал"-тай харьцуулах замаар үнэлэхийг оролддог. Техникийн хувьд ийм тооцоолол хийх ердийн арга бол хувьсагчдын утгууд хэрхэн өөрчлөгдөж байгааг харж, дараа нь одоогийн байгаа нийт өөрчлөлтийн хэдэн хувийг "нийтлэг" ("хамтарсан") хэлбэлзэлтэй холбон тайлбарлаж болохыг тооцоолох явдал юм. хоёр (эсвэл түүнээс дээш) хувьсагч.

Ач холбогдол нь түүврийн хэмжээнээс ихээхэн хамаардаг. Өмнө дурьдсанчлан, маш том түүврийн хувьд хувьсагчдын хоорондын маш сул хамаарал нь мэдэгдэхүйц байх болно, харин жижиг түүврийн хувьд маш хүчтэй хамаарал ч найдвартай биш юм.

Иймд статистикийн ач холбогдлын түвшинг тодорхойлохын тулд түүврийн хэмжээ тус бүрийн хувьсагчдын хоорондын хамаарлын “том” ба “ач холбогдол” хоорондын хамаарлыг илэрхийлэх функц хэрэгтэй.

Ийм функц нь "популяцид ийм хамаарал байхгүй гэж үзвэл өгөгдсөн хэмжээний түүвэрт өгөгдсөн утгын (эсвэл түүнээс дээш) хамаарлыг олж авах магадлал хэр байгааг" яг таг зааж өгөх болно. Өөрөөр хэлбэл, энэ функц нь ач холбогдлын түвшинг өгөх болно
(p-түвшин), улмаар хүн амд энэ хамаарал байхгүй гэсэн таамаглалыг буруугаар үгүйсгэх магадлал.

Энэхүү "алтернатив" таамаглалыг (хүн амын дунд ямар ч хамаарал байхгүй) ихэвчлэн нэрлэдэг тэг таамаглал.

Алдаа гарах магадлалыг тооцоолох функц нь шугаман бөгөөд зөвхөн өөр өөр түүврийн хэмжээтэй өөр өөр налуутай байвал тохиромжтой байх болно. Харамсалтай нь энэ функц нь илүү төвөгтэй бөгөөд үргэлж ижил байдаггүй. Гэсэн хэдий ч ихэнх тохиолдолд түүний хэлбэр нь мэдэгдэж байгаа бөгөөд өгөгдсөн хэмжээтэй дээжийг судлахад ач холбогдлын түвшинг тодорхойлоход ашиглаж болно. Эдгээр функцүүдийн ихэнх нь хуваарилалтын ангитай холбоотой байдаг хэвийн .

Таны “нөгөө тал”-ыг юугаараа онцгой, утга учиртай болгодог гэж та бодож байна вэ? Энэ нь түүний зан чанартай холбоотой юу эсвэл таны энэ хүнийг гэсэн мэдрэмжтэй холбоотой юу? Эсвэл судалгаагаар таны өрөвдөх сэтгэлийн санамсаргүй байдлын талаархи таамаглал 5% -иас бага магадлалтай гэсэн энгийн баримттай байж болох уу? Хэрэв бид сүүлчийн мэдэгдлийг найдвартай гэж үзвэл амжилттай болзох сайтууд зарчмын хувьд байхгүй болно.

Та хуваах тест эсвэл вэбсайтынхаа бусад дүн шинжилгээ хийх үед "статистикийн ач холбогдол" -ыг буруу ойлгох нь үр дүнг буруу тайлбарлах, улмаар хөрвүүлэх оновчлолын явцад буруу үйлдэл хийхэд хүргэдэг. Энэ нь одоо байгаа салбар бүрт өдөр бүр хийгддэг бусад олон мянган статистик туршилтуудын хувьд үнэн юм.

"Статистикийн ач холбогдол" гэж юу болохыг ойлгохын тулд та энэ нэр томъёоны түүхэнд шумбаж, жинхэнэ утгыг нь мэдэж, энэхүү "шинэ" хуучин ойлголт нь судалгааныхаа үр дүнг зөв тайлбарлахад хэрхэн туслахыг ойлгох хэрэгтэй.

Бага зэрэг түүх

Хэдийгээр хүн төрөлхтөн олон зууны турш янз бүрийн асуудлыг шийдвэрлэхийн тулд статистикийг ашиглаж ирсэн ч статистикийн ач холбогдол, таамаглалыг шалгах, санамсаргүй байдлаар ангилах, тэр ч байтугай Туршилтын загвар (ТМБ) гэх мэт орчин үеийн ойлголт 20-р зууны эхэн үеэс л бий болж эхэлсэн бөгөөд энэ нь шинжлэх ухаантай салшгүй холбоотой юм. Сэр Рональд Фишерийн нэр (Сэр Рональд Фишер, 1890-1962):

Рональд Фишер бол хувьслын биологич, статистикч байсан бөгөөд амьтдын хувьсал, байгалийн шалгарлыг судлах онцгой хүсэл эрмэлзэлтэй байсан. ургамал. Тэрээр өөрийн нэр хүндтэй карьерийнхаа туршид бидний өнөөг хүртэл ашигладаг статистикийн олон хэрэглүүр хэрэгслүүдийг боловсруулж, дэлгэрүүлсэн.

Фишер давамгайлал, мутаци, генетикийн хазайлт зэрэг биологийн үйл явцыг тайлбарлахдаа өөрийн боловсруулсан арга техникийг ашигласан. Өнөөдөр бид вэб нөөцийн агуулгыг оновчтой болгох, сайжруулахын тулд ижил хэрэгслийг ашиглаж болно. Эдгээр шинжилгээний хэрэгслүүдийг бүтээх үедээ огт байгаагүй объектуудтай ажиллахад ашиглаж болно гэдэг нь үнэхээр гайхмаар санагдаж байна. Хүмүүс тооцоолуур, компьютергүйгээр нарийн төвөгтэй тооцооллыг хийдэг байсан нь бас гайхмаар юм.

Статистикийн туршилтын үр дүнг үнэн байх магадлал өндөр гэж тайлбарлахын тулд Фишер "ач холбогдол" гэсэн үгийг ашигласан.

Мөн Фишерийн хамгийн сонирхолтой үйл явдлуудын нэгийг "тачаангуй хүү" гэсэн таамаглал гэж нэрлэж болно. Энэ онолын дагуу эмэгтэйчүүд бэлгийн харьцаанд ордог эрчүүдийг (садар самуун) илүүд үздэг, учир нь энэ нь эдгээр эрчүүдээс төрсөн хөвгүүдэд ижил төстэй хандлагатай байж, илүү олон үр удам төрүүлэх боломжийг олгоно (энэ бол зүгээр л онол гэдгийг анхаарна уу).

Гэхдээ хэн ч, тэр байтугай гайхалтай эрдэмтэд ч алдаа гаргахаас хамгаалдаггүй. Фишерийн алдаа өнөөг хүртэл мэргэжилтнүүдийг зовоож байна. Гэхдээ Альберт Эйнштейний хэлсэн үгийг санаарай: "Хэн хэзээ ч алдаа гаргаж байгаагүй хүн хэзээ ч шинэ зүйлийг бүтээгээгүй."

Дараагийн цэг рүү шилжихээсээ өмнө санаарай: статистикийн ач холбогдол нь туршилтын үр дүнгийн зөрүү нь санамсаргүй хүчин зүйлээр тайлбарлах боломжгүй маш их байх явдал юм.

Таны таамаглал юу вэ?

"Статистикийн ач холбогдол" гэж юу болохыг ойлгохын тулд эхлээд "таамаглалыг шалгах" гэж юу болохыг ойлгох хэрэгтэй, учир нь энэ хоёр нэр томъёо нь хоорондоо нягт холбоотой байдаг.
Таамаглал бол зүгээр л онол юм. Онол боловсруулсны дараа та хангалттай нотлох баримт цуглуулж, тэр нотлох баримтыг бодитоор цуглуулах үйл явцыг бий болгох хэрэгтэй болно. Хоёр төрлийн таамаглал байдаг.

Алим эсвэл жүрж - аль нь дээр вэ?

Үгүй таамаглал

Дүрмээр бол энэ нь олон хүн бэрхшээлтэй тулгардаг. Нэг анхаарах зүйл бол вэб сайтын тодорхой өөрчлөлт нь хөрвүүлэлт нэмэгдэхэд хүргэнэ гэдгийг нотлох шиг тэг таамаглал нь нотлогдох шаардлагагүй, харин эсрэгээр. Тэг таамаглал нь хэрэв та сайтад ямар нэгэн өөрчлөлт хийвэл юу ч болохгүй гэсэн онол юм. Мөн судлаачийн зорилго бол энэ онолыг батлах биш няцаах явдал юм.

Гэмт хэргийг илрүүлэх туршлагыг авч үзвэл, мөрдөн байцаагчид гэмт хэрэгтэн хэн болох талаар таамаглал дэвшүүлдэг бол тэг таамаглал нь гэм буруугүй байдлын таамаглал хэмээх хэлбэрийг авдаг бөгөөд үүний дагуу яллагдагчийг гэм буруутай нь нотлогдох хүртэл гэм буруугүй гэж үздэг. шүүх дээр.

Хэрэв тэг таамаглал нь хоёр объект шинж чанараараа тэнцүү бөгөөд та нэг нь илүү сайн болохыг нотлохыг оролдож байгаа бол (жишээлбэл, А нь В-ээс илүү) бол та альтернатив хувилбарын төлөө тэг таамаглалыг үгүйсгэх хэрэгтэй. Жишээлбэл, та хөрвүүлэх оновчлолын нэг буюу өөр хэрэгслийг харьцуулж байна. Тэг таамаглалд хоёулаа зорилтот түвшинд ижил нөлөө үзүүлдэг (эсвэл ямар ч нөлөө үзүүлэхгүй). Альтернатив хувилбарт тэдгээрийн аль нэгнийх нь нөлөө илүү сайн байдаг.

Таны өөр таамаглал нь B - A > 20% гэх мэт тоон утгыг агуулж болно. Энэ тохиолдолд тэг таамаглал ба хувилбар нь дараах хэлбэртэй байж болно.

Альтернатив таамаглалын өөр нэг нэр бол судалгааны таамаглал, учир нь судлаач энэ тодорхой таамаглалыг батлах сонирхолтой байдаг.

Статистикийн ач холбогдол ба p утга

Рональд Фишер болон түүний статистикийн ач холбогдлын тухай ойлголт руу дахин орцгооё.

Нэгэнт тэг таамаглал, өөр хувилбар байгаа бол яаж нэгийг нь баталж нөгөөг нь үгүйсгэх вэ?

Статистик нь мөн чанараараа тодорхой популяцийн (түүвэр) судалгааг хамардаг тул та олж авсан үр дүндээ 100% итгэлтэй байж чадахгүй. Сайн жишээ: Сонгуулийн дүн нь урьдчилсан санал хураалтын үр дүнгээс, тэр ч байтугай гарах сантай харьцуулахад ихэвчлэн ялгаатай байдаг.

Доктор Фишер таны туршилт амжилттай болсон эсэхийг танд мэдэгдэх хуваах шугам үүсгэхийг хүссэн. Найдвартай байдлын индекс ингэж гарч ирсэн. Итгэмжтэй байдал гэдэг нь бидний "чухал" гэж үзсэн болон үл тоомсорлодог зүйлээ хэлэхийн тулд авдаг түвшин юм. Хэрэв "p" ач холбогдлын индекс нь 0.05 ба түүнээс бага байвал үр дүн найдвартай болно.

Санаа зоволтгүй, энэ нь үнэндээ санагдаж байгаа шиг ойлгомжгүй зүйл биш юм.

Гауссын магадлалын тархалт. Ирмэгүүдийн дагуу хувьсагчийн магадлал багатай утгууд нь төв хэсэгт хамгийн их магадлалтай байдаг. P оноо (ногоон сүүдэртэй хэсэг) нь ажиглагдсан үр дүн санамсаргүй тохиолдох магадлал юм.

Хэвийн магадлалын тархалт (Гауссын тархалт) нь график дээрх тодорхой хувьсагчийн бүх боломжит утгуудын дүрслэл (дээрх зурагт) ба тэдгээрийн давтамж юм. Хэрэв та судалгаагаа зөв хийгээд дараа нь бүх хариултаа график дээр буулгавал яг энэ хуваарилалтыг авах болно. дагуу хэвийн тархалт, та ижил төстэй хариултуудын ихээхэн хувийг хүлээн авах бөгөөд үлдсэн сонголтууд нь графикийн ирмэг дээр ("сүүл" гэж нэрлэгддэг) байрлах болно. Энэхүү үнэт зүйлсийн хуваарилалт нь байгальд ихэвчлэн байдаг тул үүнийг "хэвийн" гэж нэрлэдэг.

Түүвэр болон туршилтын үр дүнд тулгуурласан тэгшитгэлийг ашиглан та "туршилтын статистик" гэж нэрлэгддэг зүйлийг тооцоолж болох бөгөөд энэ нь таны үр дүн хэр зэрэг хазайж байгааг харуулах болно. Энэ нь мөн та тэг таамаг үнэнд хэр ойрхон байгааг хэлэх болно.

Үүнийг ойлгоход тань туслахын тулд статистикийн ач холбогдлыг тооцоолохын тулд онлайн тооцоолуур ашиглана уу:

Ийм тооны машинуудын нэг жишээ

"p" үсэг нь тэг таамаглал үнэн байх магадлалыг илэрхийлдэг. Хэрэв тоо нь бага бол энэ нь туршилтын бүлгүүдийн хоорондын ялгааг илтгэнэ, харин тэг таамаглал нь ижил байна. Графикийн хувьд таны тестийн статистик таны хонх хэлбэртэй тархалтын сүүлний аль нэгэнд ойр байх болно.

Доктор Фишер ач холбогдлын босгыг p ≤ 0.05 гэж тогтоохоор шийдсэн. Гэсэн хэдий ч энэ мэдэгдэл нь маргаантай байгаа тул энэ нь хоёр бэрхшээлийг дагуулдаг.

1. Нэгдүгээрт, та тэг таамаглал худал болохыг нотолсон нь өөр таамаглалыг баталсан гэсэн үг биш юм. Энэ бүх ач холбогдол нь зүгээр л та A эсвэл B аль алиныг нь баталж чадахгүй гэсэн үг юм.

2. Хоёрдугаарт, хэрэв p оноо 0.049 бол тэг таамаглалын магадлал 4.9% болно гэсэн үг юм. Энэ нь таны шинжилгээний хариу нэгэн зэрэг үнэн, худал байж болно гэсэн үг юм.

Та p оноог ашиглаж болно, эсвэл ашиглахгүй ч байж болно, гэхдээ дараа нь та тэг таамаглалын магадлалыг тохиолдол тус бүрээр тооцож, энэ нь таны төлөвлөж, туршиж үзсэн өөрчлөлтүүдийг хийхээс сэргийлж хангалттай том эсэхийг шийдэх шаардлагатай болно. .

Өнөөдөр статистикийн тест хийх хамгийн түгээмэл хувилбар бол тестийг өөрөө явуулахын өмнө ач холбогдлын босгыг p ≤ 0.05 болгох явдал юм. Үр дүнг шалгахдаа p-утгыг сайтар ажиглаарай.

Алдаа 1 ба 2

Маш их цаг хугацаа өнгөрсөн тул статистикийн ач холбогдлын хэмжигдэхүүнийг ашиглахад гарч болох алдаануудыг бүр өөрийн гэсэн нэрээр нэрлэсэн.

1-р төрлийн алдаа

Дээр дурдсанчлан p-утга 0.05 нь тэг таамаглал үнэн байх магадлал 5% байна гэсэн үг юм. Хэрэв тэгэхгүй бол та 1-р алдаа гаргах болно. Үр дүн нь таны шинэ вэб сайт таны хөрвүүлэх хурдыг нэмэгдүүлсэн гэсэн боловч 5% -иар тийм биш байх магадлалтай.

2-р төрлийн алдаа

Энэ алдаа нь 1-р алдааны эсрэг байна: та тэг таамаглал худал бол түүнийг хүлээн зөвшөөрдөг. Жишээлбэл, туршилтын үр дүнгээс харахад сайтад хийсэн өөрчлөлтүүд нь ямар ч сайжруулалт хийгээгүй, гэхдээ өөрчлөлт орсон. Үүний үр дүнд та гүйцэтгэлээ сайжруулах боломжийг алддаг.

Энэ алдаа нь түүврийн хэмжээ хангалтгүй тестүүдэд нийтлэг байдаг тул түүврийн хэмжээ их байх тусам үр дүн нь илүү найдвартай байх болно гэдгийг санаарай.

Дүгнэлт

Судлаачдын дунд статистикийн ач холбогдол шиг алдартай нэр томъёо байдаггүй байх. Туршилтын үр дүн статистикийн хувьд ач холбогдолгүй болох нь тогтоогдоогүй тохиолдолд үр дагавар нь хөрвөх ханшийн өсөлтөөс эхлээд компаний сүйрэлд хүргэдэг.

Маркетерууд нөөцөө оновчтой болгохдоо энэ нэр томъёог ашигладаг тул та энэ нь юу гэсэн үг болохыг мэдэх хэрэгтэй. Туршилтын нөхцөл өөр өөр байж болох ч түүврийн хэмжээ болон амжилтын шалгуур нь үргэлж чухал байдаг. Үүнийг санаарай.

Статистикийн ач холбогдол

Тодорхой судалгааны аргыг ашиглан олж авсан үр дүнг гэж нэрлэдэг статистик ач холбогдолтой, хэрэв тэдгээрийн санамсаргүй тохиолдох магадлал маш бага бол. Энэ ойлголтыг зоос шидэх жишээгээр дүрсэлж болно. Зоосыг 30 удаа шидсэн гэж бодъё; Толгойнууд 17 удаа, сүүл нь 13 удаа гарч ирэв. Энэ хийдэг чухал ач холбогдолтойЭнэ үр дүнгийн хүлээгдэж буй үр дүнгээс хазайлт (15 толгой, 15 сүүл), эсвэл энэ хазайлт санамсаргүй байна уу? Энэ асуултад хариулахын тулд жишээлбэл, нэг зоосыг олон удаа, 30 удаа дараалан шидэж, 17:13-ийн "толгой" ба "сүүл"-ийн харьцаа хэдэн удаа давтагдаж байгааг тэмдэглэж болно. Статистикийн дүн шинжилгээбиднийг энэ уйтгартай үйл явцаас авардаг. Үүний тусламжтайгаар эхний 30 зоос шидсэний дараа та 17 "толгой", 13 "сүүл" тохиолдох тохиолдлын тоог тооцоолж болно. Ийм үнэлгээг магадлалын мэдэгдэл гэж нэрлэдэг.

IN шинжлэх ухааны уран зохиолонд аж үйлдвэр-байгууллагын сэтгэл судлал магадлалын мэдэгдэл математик хэлбэрилэрхийллээр тэмдэглэнэ Р(магадлал)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (Р< 0.01). Энэ баримт нь уран зохиолыг ойлгоход чухал ач холбогдолтой боловч эдгээр стандартыг хангаагүй ажиглалт хийх нь утгагүй гэж ойлгож болохгүй. Ач холбогдолгүй судалгааны үр дүн гэж нэрлэгддэг (санамсаргүй байдлаар олж авч болох ажиглалтууд) илүү 100-аас 1-5 удаа) нь чиг хандлагыг тодорхойлоход маш их хэрэгтэй бөгөөд цаашдын судалгаанд гарын авлага болно.

Бүх сэтгэл судлаачид уламжлалт стандарт, журамтай санал нийлдэггүй гэдгийг тэмдэглэх нь зүйтэй (жишээ нь, Cohen, 1994; Sauley & Bedeian, 1989). Хэмжилтийн асуудал нь хэмжилтийн аргуудын үнэн зөв, тэдгээрийн үндэс болсон таамаглалыг судалдаг олон судлаачдын ажлын гол сэдэв юм. одоо байгаа аргуудболон стандарт, түүнчлэн шинэ эмч, багаж хэрэгслийг хөгжүүлэх. Магадгүй ирээдүйд хэзээ нэгэн цагт энэ эрх мэдлийн судалгаа нь статистикийн ач холбогдлыг үнэлэх уламжлалт стандартад өөрчлөлт оруулахад хүргэж, эдгээр өөрчлөлтийг өргөнөөр хүлээн зөвшөөрөх болно. (Америкийн сэтгэл судлалын нийгэмлэгийн тавдугаар хэлтэс нь үнэлгээ, хэмжилт, статистикийн чиглэлээр мэргэшсэн сэтгэл судлаачдын бүлэг юм.)

Судалгааны тайланд магадлалын мэдэгдэл гэх мэт Р< Зарим шалтгааны улмаас 0.05 статистик,өөрөөр хэлбэл тодорхой тооны математик тооцооллын процедурын үр дүнд олж авсан тоо. Магадлалын баталгааг эдгээр статистикийг энэ зорилгоор нийтлэгдсэн тусгай хүснэгтийн өгөгдөлтэй харьцуулах замаар олж авдаг. Үйлдвэр-байгууллагын сэтгэл зүйн судалгаанд статистик зэрэг r, F, t, r>("чи квадрат" -ыг уншина уу) ба Р("олон тооны" гэж уншина уу R").Аль ч тохиолдолд цуврал ажиглалтын дүн шинжилгээнээс олж авсан статистикийг (нэг тоо) нийтлэгдсэн хүснэгтийн тоонуудтай харьцуулж болно. Үүний дараа та энэ тоог санамсаргүй байдлаар олж авах магадлалын талаар магадлалын мэдэгдлийг боловсруулж, өөрөөр хэлбэл ажиглалтын ач холбогдлын талаар дүгнэлт хийж болно.

Энэ номонд дурдсан судалгааг ойлгохын тулд статистикийн ач холбогдлын тухай тодорхой ойлголттой байх нь хангалттай бөгөөд дээр дурдсан статистикийг хэрхэн тооцдогийг мэдэх шаардлагагүй юм. Гэсэн хэдий ч эдгээр бүх процедурын үндэс суурь болох нэг таамаглалыг хэлэлцэх нь ашигтай байх болно. Энэ нь ажиглагдсан бүх хувьсагчид ойролцоогоор хэвийн тархсан гэсэн таамаглал юм. Нэмж дурдахад аж үйлдвэр-байгууллагын сэтгэлзүйн судалгааны тайланг уншихад өөр гурван ойлголт ихэвчлэн тэр жүжигтэй тааралддаг чухал үүрэг- нэгдүгээрт, корреляци ба корреляци, хоёрдугаарт, тодорхойлогч/урьдчилан таамаглах хувьсагч ба “ANOVA” (дисперсийн шинжилгээ), гуравдугаарт, бүлэг статистикийн аргуудхамтдаа "мета-анализ" гэж нэрлэдэг.

Судалгаа нь ихэвчлэн баримт ашиглан баталгаажуулах шаардлагатай зарим таамаглалаас эхэлдэг. Энэхүү таамаглал - таамаглал нь объектын тодорхой багц дахь үзэгдэл эсвэл шинж чанаруудын холболттой холбоотой томъёолдог.

Ийм таамаглалыг баримтын эсрэг шалгахын тулд тэдгээрийн эзэмшигчийн холбогдох шинж чанарыг хэмжих шаардлагатай. Гэхдээ бүх өсвөр насныхны түрэмгий байдлыг хэмжих боломжгүй байдаг шиг бүх эмэгтэй, эрэгтэй хүмүүсийн түгшүүрийг хэмжих боломжгүй юм. Тиймээс судалгаа хийхдээ зөвхөн холбогдох популяцийн харьцангуй цөөн тооны төлөөлөгчдөөр хязгаарлагддаг.

Хүн ам- энэ бол судалгааны таамаглал дэвшүүлсэн объектуудын бүхэл бүтэн багц юм.

Жишээлбэл, бүх эрчүүд; эсвэл бүх эмэгтэйчүүд; эсвэл хотын бүх оршин суугчид. Судалгааны үр дүнд үндэслэн судлаачийн дүгнэлт гаргах гэж буй нийт хүн ам, жишээлбэл, тухайн сургуулийн нэгдүгээр ангийн бүх сурагчдын тоогоор илүү даруухан байж болно.

Тиймээс, ерөнхий популяци нь хязгааргүй тооны биш боловч дүрмээр бол тасралтгүй судалгаа хийх боломжгүй, боломжит сэдвүүдийн багц юм.

Түүвэр эсвэл түүвэр популяцинь тусгайлан сонгосон тооны хязгаарлагдмал объектуудын бүлэг (сэтгэл судлалд - субъект, хариулагч). хүн амшинж чанарыг нь судлах. Үүний дагуу түүвэр ашиглан ерөнхий популяцийн шинж чанарыг судлах гэж нэрлэдэг түүвэр судалгаа. Бараг бүх зүйл сэтгэлзүйн судалгаатүүвэрлэсэн бөгөөд тэдгээрийн дүгнэлт нь нийт хүн амд хамаарна.

Тиймээс, таамаглал дэвшүүлж, харгалзах популяцийг тодорхойлсоны дараа судлаач түүврийг зохион байгуулах асуудалтай тулгардаг. Түүвэр нь түүврийн судалгааны дүгнэлтийг нэгтгэх үндэслэлтэй байх ёстой - ерөнхийдөө нэгтгэх, нийт хүн амд хүргэх. Судалгааны дүгнэлтийн бодит байдлын үндсэн шалгууруудЭдгээр нь түүврийн төлөөлөл ба (эмпирик) үр дүнгийн статистикийн найдвартай байдал юм.

Түүврийн төлөөлөл- өөрөөр хэлбэл, түүний төлөөлөх чанар нь түүврийн судалгаанд хамрагдаж буй үзэгдлүүдийг ерөнхий популяци дахь хувьсах байдлын үүднээс бүрэн дүүрэн илэрхийлэх чадвар юм.

Мэдээжийн хэрэг, зөвхөн нийт хүн ам л судалж буй үзэгдлийн бүх хүрээ, хувьсах нюансын бүрэн дүр зургийг өгч чадна. Тиймээс төлөөлөх чадвар нь түүврийн хязгаарлагдмал хэмжээгээр үргэлж хязгаарлагддаг. Судалгааны үр дүнг нэгтгэх хил хязгаарыг тодорхойлох гол шалгуур нь түүврийн төлөөлөл юм. Гэсэн хэдий ч судлаачид хангалттай түүврийн төлөөллийг олж авах боломжтой арга техникүүд байдаг (Эдгээр аргуудыг "Туршилтын сэтгэл судлал" хичээлд судалдаг).


Эхний бөгөөд гол арга бол энгийн санамсаргүй (санамсаргүй) сонголт юм. Энэ нь хүн амын гишүүн бүр түүвэрт хамрагдах бусад хүмүүстэй адил тэгш байх нөхцлийг бүрдүүлэх явдал юм. Санамсаргүй сонголт нь нийт хүн амын янз бүрийн төлөөлөгчдийг түүвэрт оруулах боломжийг олгодог. Энэ тохиолдолд сонгон шалгаруулах явцад ямар нэгэн хэв маяг үүсэхээс урьдчилан сэргийлэх тусгай арга хэмжээ авдаг. Энэ нь эцэст нь түүвэрт судалж буй өмчийг бүхэлд нь биш юмаа гэхэд хамгийн их олон янзаар төлөөлнө гэж найдаж байна.

Төлөөлөгч байдлыг хангах хоёр дахь арга бол давхрагатай санамсаргүй түүвэрлэлт буюу нийт хүн амын шинж чанарт үндэслэн сонгох явдал юм. Энэ нь судалж буй хөрөнгийн хэлбэлзэлд нөлөөлж болох шинж чанаруудыг (энэ нь хүйс, орлогын түвшин, боловсролын түвшин гэх мэт) урьдчилан тодорхойлох явдал юм. Дараа нь нийт популяцид эдгээр чанараараа ялгаатай бүлгийн (давхарга) тооны хувийн харьцааг тодорхойлж, түүвэр дэх харгалзах бүлгүүдийн ижил хувийн харьцааг баталгаажуулна. Дараа нь энгийн санамсаргүй сонгон шалгаруулах зарчмын дагуу түүврийн дэд бүлэг бүрт субъектуудыг сонгоно.

Статистикийн ач холбогдол,эсвэл статистикийн ач холбогдол, судалгааны үр дүнг статистик дүгнэлтийн аргыг ашиглан тодорхойлно.

Шийдвэр гаргахдаа, судалгааны үр дүнгээс тодорхой дүгнэлт гаргахдаа бид алдаа гаргахаас даатгуулсан уу? Мэдээж үгүй. Эцсийн эцэст бидний шийдвэрүүд нь түүвэр популяцийн судалгааны үр дүн, түүнчлэн бидний сэтгэлзүйн мэдлэгийн түвшинд тулгуурладаг. Бид алдаанаас бүрэн ангид байдаггүй. Статистикийн хувьд ийм алдаа нь 1000 тохиолдлын нэгээс илүүгүй тохиолдвол хүлээн зөвшөөрөгдөх боломжтой гэж үздэг (алдааны магадлал α = 0.001 эсвэл холбогдох утга). итгэх магадлалзөв дүгнэлт p=0.999); 100-аас нэг тохиолдолд (алдаа гарах магадлал α = 0.01 эсвэл зөв дүгнэлтийн холбогдох итгэлийн магадлал p = 0.99) эсвэл 100-аас таван тохиолдолд (алдаа гарах магадлал α = 0.05 эсвэл зөв дүгнэлт гаргах итгэлийн магадлал). p=0.95). Сүүлийн хоёр түвшинд сэтгэл зүйд шийдвэр гаргадаг.

Заримдаа статистикийн ач холбогдлын тухай ярихдаа "ач холбогдлын түвшин" (α гэж тэмдэглэсэн) гэсэн ойлголтыг ашигладаг. p ба α-ийн тоон утгууд нь 1000 хүртэл бие биенээ нөхдөг - үйл явдлын иж бүрэн багц: эсвэл бид хийсэн. зөв дүгнэлт, эсвэл бид буруу байсан. Эдгээр түвшинг тооцоогүй, өгөгдсөн. Ач холбогдлын түвшинг нэг төрлийн "улаан" шугам гэж ойлгож болох бөгөөд тэдгээрийн огтлолцол нь энэ үйл явдлыг санамсаргүй байдлаар ярих боломжийг бидэнд олгоно. Шинжлэх ухааны сайн тайлан, нийтлэл бүрт гаргасан дүгнэлтийг тухайн дүгнэлтийг хийсэн p эсвэл α утгын заалттай хавсаргасан байх ёстой.

Статистикийн дүгнэлтийн аргуудыг курст нарийвчлан авч үзсэн болно " Математик статистик" Одоо бид зүгээр л тоонд нь тодорхой шаардлага тавьдаг гэдгийг анхаарна уу, эсвэл дээжийн хэмжээ.

Харамсалтай нь шаардлагатай түүврийн хэмжээг урьдчилан тодорхойлох хатуу заавар байдаггүй. Түүнээс гадна судлаач ихэвчлэн шаардлагатай бөгөөд хангалттай тооны талаархи асуултын хариултыг хэтэрхий оройтсон байдаг - зөвхөн судалгаанд хамрагдсан түүврийн өгөгдөлд дүн шинжилгээ хийсний дараа л авдаг. Гэсэн хэдий ч хамгийн ерөнхий зөвлөмжийг томъёолж болно:

1. Оношилгооны техникийг боловсруулахад хамгийн том түүврийн хэмжээ шаардлагатай - 200-аас 1000-2500 хүн.

2. 2 дээжийг харьцуулах шаардлагатай бол тэдгээрийн нийт тоо 50-аас доошгүй хүн байх; харьцуулсан дээжийн тоо ойролцоогоор ижил байх ёстой.

3. Аливаа шинж чанарын хамаарлыг судалж байгаа бол түүврийн хэмжээ 30-35-аас доошгүй хүн байх ёстой.

4. Илүү их хэлбэлзэлшинж чанарыг судалж байгаа бол түүврийн хэмжээ их байх ёстой. Тиймээс түүврийн нэгэн төрлийн байдлыг нэмэгдүүлэх замаар хэлбэлзлийг бууруулж болно, жишээлбэл, хүйс, нас гэх мэт. Энэ нь мэдээжийн хэрэг дүгнэлтийг ерөнхийд нь гаргах чадварыг бууруулдаг.

Хараат болон бие даасан дээж.Судалгааны нийтлэг нөхцөл бол судлаачийн сонирхсон шинж чанарыг цаашид харьцуулах зорилгоор хоёр ба түүнээс дээш дээж дээр судлах явдал юм. Эдгээр дээжүүд нь тэдгээрийн зохион байгуулалтын журмаас хамааран өөр өөр харьцаатай байж болно. Бие даасан дээж нэг түүврийн аль нэг сэдвийг сонгох магадлал нь өөр түүврийн аль нэг сэдвийг сонгохоос хамаардаггүй гэдгээрээ онцлог юм. эсрэг, хамааралтай дээжнэг түүврийн сэдэв тус бүрийг заасны дагуу хуваарилснаар тодорхойлогддог тодорхой шалгуурөөр дээжээс сэдэв.

IN ерөнхий тохиолдолхамааралтай түүвэр нь харьцуулсан түүвэр болгон субьектуудыг хосоор нь сонгох, бие даасан түүвэр нь субьектуудыг бие даан сонгохыг хэлнэ.

"Хэсэгчилсэн хамааралтай" (эсвэл "хэсэгчилсэн бие даасан") дээжийн тохиолдлуудыг хүлээн зөвшөөрөх боломжгүй гэдгийг тэмдэглэх нь зүйтэй: энэ нь тэдний төлөөллийг урьдчилан таамаглах аргагүй зөрчиж байна.

Эцэст нь хэлэхэд сэтгэлзүйн судалгааны хоёр парадигмыг ялгаж салгаж болно гэдгийг бид тэмдэглэж байна.

Гэж нэрлэдэг R-арга зүйЭнэ нь тодорхой нөлөөлөл, хүчин зүйл эсвэл бусад өмчийн нөлөөн дор тодорхой эд хөрөнгийн (сэтгэл зүйн) хувьсах чадварыг судлах явдал юм. Дээж нь сэдвүүдийн багц юм.

Өөр нэг арга Q-арга зүй,янз бүрийн өдөөгч (нөхцөл байдал, нөхцөл байдал гэх мэт) нөлөөн дор субьект (хувь хүн) -ийн хувьсах чадварыг судлахад хамаарна. Энэ нь тухайн үеийн нөхцөл байдалтай тохирч байна дээж нь өдөөлтийн багц юм.

Статистикийн судалгааны ажил бол судалж буй үзэгдлийн мөн чанарын үндэслэлийг тодорхойлох явдал юм. Үзүүлэлт ба дундаж утгууд нь бодит байдлын тусгал байх ёстой бөгөөд үүний тулд тэдгээрийн найдвартай байдлын түвшинг тодорхойлох шаардлагатай. Түүврийн популяцийг хүн амын тоогоор зөв төлөөлөхийг төлөөлөх чадвар гэнэ . Түүврийн статистик утгын үнэн зөв, найдвартай байдлын хэмжүүр нь түүврийн хэмжээ, судалж буй шинж чанарын дагуу түүврийн популяцийн олон янз байдлын зэргээс хамаардаг төлөөлөх байдлын (төлөөлөгчийн) дундаж алдаа юм.

Тиймээс статистикийн судалгааны үр дүнгийн найдвартай байдлын түвшинг тодорхойлохын тулд харьцангуй ба дундаж утга тус бүрийн харгалзах дундаж алдааг тооцоолох шаардлагатай. m p үзүүлэлтийн дундаж алдааг дараах томъёогоор тооцоолно.

Ажиглалтын тоо 30-аас бага бол хаана

P - үзүүлэлтийн утга хувь, ppm гэх мэт.

q - энэ үзүүлэлтийг хувиар нэмбэл 100, % 0 бол 1000 гэх мэт. (жишээ нь q = 100–P, 1000–P гэх мэт)

Тухайлбал, тус бүс нутагт он гарсаар 224 хүн цусан суулга өвчнөөр өвчилжээ. Хүн ам: Цусан суулганы өвчлөлийн түвшин 33,000

Энэ үзүүлэлтийн дундаж алдаа

Шалгуур үзүүлэлтийн найдвартай байдлын зэрэгтэй холбоотой асуудлыг шийдвэрлэхийн тулд итгэлцлийн коэффициентийг (t) тодорхойлдог бөгөөд энэ нь үзүүлэлтийн дундаж алдааны харьцаатай тэнцүү байна.

Бидний жишээнд

t өндөр байх тусам өөртөө итгэх итгэлийн түвшин өндөр байна. t=1 үед үзүүлэлтийн найдвартай байх магадлал 68,3%, t=2 үед - 95,5%, t=3 үед - 99,7% байна. Эмнэлгийн статистикийн судалгаанд 95.5% -99.0% итгэлийн түвшин (найдвартай байдал) ихэвчлэн ашиглагддаг бөгөөд хамгийн чухал тохиолдолд 99.7% байдаг. Тиймээс бидний жишээн дээр өвчлөлийн түвшин найдвартай байна.

Хэрэв ажиглалтын тоо 30-аас бага бол Оюутны хүснэгтийг ашиглан шалгуур үзүүлэлтийн утгыг тодорхойлно. Хэрэв үр дүнгийн утга нь хүснэгтийн утгаас өндөр эсвэл тэнцүү байвал үзүүлэлт найдвартай байна. Хэрэв энэ нь доогуур байвал энэ нь найдвартай биш юм.

Хоёр нэгэн төрлийн үзүүлэлтийг харьцуулах шаардлагатай бол тэдгээрийн ялгааны найдвартай байдлыг дараах томъёогоор тодорхойлно.

(том тооноос бага нь хасагдана)

Энд P 1 – P 2 нь харьцуулсан хоёр үзүүлэлтийн ялгаа,

дундаж алдаахоёр үзүүлэлтийн ялгаа.

Тухайлбал, В бүсэд он гарсаар 270 хүн цусан суулга өвчнөөр өвчилсөн байна. Бүс нутгийн хүн ам 45,000 байдаг тул цусан суулга өвчнөөр өвчилдөг.

тэдгээр. тохиолдлын түвшин найдвартай.

Таны харж байгаагаар В бүсэд өвчлөл А бүсээс бага байна. Бид хоёр үзүүлэлтийн зөрүүний найдвартай байдлыг тодорхойлохын тулд дараах томъёог ашиглана.

Хэрэв олон тооны ажиглалт (30-аас дээш) байвал t = 2 ба түүнээс дээш бол үзүүлэлтүүдийн ялгаа нь статистикийн хувьд чухал ач холбогдолтой. Тиймээс бидний жишээн дээр А бүс нутагт өвчлөл нэлээд өндөр байна, учир нь итгэлцлийн коэффициент (t) 2-оос их.

Шалгуур үзүүлэлтийн дундаж алдааны утгыг мэдсэнээр санамсаргүй шалтгааны нөлөөнөөс хамааран энэ үзүүлэлтийн итгэлийн хязгаарыг тодорхойлох боломжтой. Итгэлийн хязгаарыг дараах томъёогоор тодорхойлно.

P - үзүүлэлт;

m нь түүний дундаж алдаа;

t - итгэлцлийн коэффициентийг шаардлагатай найдвартай байдлын утгаас хамааруулан сонгоно: t=1 нь 68.3% тохиолдолд үр дүнгийн найдвартай байдалд тохирч байна, t=2 – 95.5%, t=2.6 – 99%, t=3 – 99.7 %, t=3.3 – 99.9 утгыг хамгийн их алдаа гэнэ.

Жишээлбэл, В бүсэд цусан суулга өвчлөлийн түвшин 99.7 9% -ийн нарийвчлалтай санамсаргүй хүчин зүйлийн нөлөөгөөр хэлбэлзэж болно, i.e. 49.1-ээс 70.9 хүртэл.



Үүнтэй төстэй нийтлэлүүд

2024 parki48.ru. Бид хүрээ байшин барьж байна. Ландшафтын дизайн. Барилга. Суурь.