Excel дэх корреляц ба регрессийн шинжилгээ: гүйцэтгэх заавар. Корреляцийн шинжилгээний үндэс. Хос хамаарлын шугаман хамаарлын шинжилгээний жишээ

Корреляцийн шинжилгээ нь хамгийн өргөн хэрэглэгддэг аргуудын нэг юм статистикийн аргууд, ялангуяа улс төрийн шинжлэх ухааны хүрээнд. Харьцангуй энгийн байдлыг харгалзан үзэхэд энэ нь одоо байгаа таамаглалыг шалгах болон холболт, харилцан хамаарлын талаархи таамаглал дөнгөж бий болж байгаа хайгуулын судалгаанд хоёуланд нь маш ашигтай байж болох юм.

Энэхүү статистикийн техниктэй ажиллах чадвар нь илүү төвөгтэй, нэгдсэн аргуудын салшгүй хэсэг болгон ашигладаг тул хүчин зүйлийн шинжилгээ, кластер шинжилгээний зарим хувилбарууд гэх мэт чухал ач холбогдолтой юм.

Зорилго корреляцийн шинжилгээхоёр ба түүнээс дээш хувьсагчийн хоорондын статистик хамаарлыг хэмжих хэмжүүр юм. Хэрэв хоёр хувьсагчийн хоорондын хамаарлыг судалж байгаа бол корреляцийн шинжилгээг хос болгоно; хэрэв хувьсагчийн тоо хоёроос дээш байвал олон тоо.

Корреляцийн шинжилгээний хувьсагчид нь "тэнцүү" байдаг - тэдгээр нь хамааралтай ба бие даасан (тайлбар, тайлбар) гэж хуваагддаггүй гэдгийг онцлон тэмдэглэх нь зүйтэй. Бид хувьсагчдын аль нэг нь нөгөөдөө үзүүлэх нөлөөг бус харин харилцан хамаарлыг (харилцаа) авч үздэг.

"Корреляцийн шинжилгээ" гэсэн ойлголт нь үнэндээ статистикийн харилцааг шинжлэх хэд хэдэн аргыг нэгтгэдэг. Тэдний хамгийн түгээмэл арга болох Пирсоны аргад бидний анхаарал хандуулах болно. Түүний хэрэглээ нь дараахь нөхцлөөр хязгаарлагддаг.

Хувьсагчдыг хамгийн багадаа интервалын түвшинд хэмжих ёстой;

Хувьсагчдын хоорондын хамаарал нь шугаман байх ёстой, i.e. шулуун шугамаар тогтооно. Хэрэв шугаман бус хамаарал байгаа бол Пирсоны корреляцийн шинжилгээ үүнийг хангалттай тусгахгүй байх магадлалтай;

Пирсоны коэффициентийг дараахь томъёогоор тооцоолно.

Энд Xj ба y/ нь хоёр хувьсагчийн утга, x ба y нь дундаж утга, sx ба sy нь стандарт хазайлт; n - хос утгын тоо.

Шинжилгээнд хамрагдах хувьсагчид хэвийн тархалттай байх ёстой (эсвэл ядаж хэвийн тархалттай ойролцоо).

Корреляцийн шинжилгээ нь хувьсагчдын хоорондын статистик харилцааны хоёр шинж чанарыг агуулдаг.

Харилцааны чиглэл. Өмнө дурьдсанчлан холболтын чиглэл нь шууд (эерэг) ба урвуу (сөрөг);

Холболтын эрчим (нягтрал, битүүмжлэл). Энэ шинж чанар нь нэг хувьсагчийн утгыг нөгөө хувьсагчийн утгууд дээр үндэслэн таамаглах чадварыг тодорхойлдог.

Корреляцийн шинжилгээний онцлогуудыг илүү тодорхой төсөөлөхийн тулд судалгааны талбараас жишээ авч үзье сонгуулийн үйл явц. Бид либерал чиг баримжаатай улс төрийн хоёр нам болох "Зөв хүчний холбоо" ба "Яблоко"-ын сонгогчдын дунд харьцуулсан дүн шинжилгээ хийж байна гэж бодъё. Бидний үүрэг бол нутаг дэвсгэрийн нөхцөлд SPS болон Yabloko сонгогчдын хооронд нийтлэг зүйл байгаа эсэх, энэ нь хэр чухал болохыг ойлгох явдал юм. Үүнийг хийхийн тулд бид жишээлбэл, Холбооны бүрэлдэхүүн хэсгүүдийн сонгуулийн хороодын мэдээллийн хүрээнд эдгээр намуудын дэмжлэгийн түвшинг тодорхойлсон сонгуулийн статистик мэдээллийг авч болно. Энгийнээр хэлэхэд, бид SPS болон Yabloko-ийн хүлээн авсан хувийг ОХУ-ын бүс нутгаар авч үздэг. Доорх нь депутатуудын сонгуулийн талаарх мэдээлэл юм Төрийн Дум 1999 он (Бүгд Найрамдах Чечен улсад сонгууль явуулаагүй тул бүс нутгийн тоо 88).

bgcolor=цагаан>7.24
Болж байна Хувьсагч (%)
"Алим" THX
Адыгей Бүгд Найрамдах Улс 4,63 3,92
Алтайн бүгд найрамдах улс 3,38 5,40
Бүгд Найрамдах Башкортостан Улс 3,95 6,04
Бүгд Найрамдах Буриад Улс 3,14 8,36
Бүгд Найрамдах Дагестан Улс 0,39 1,22
Бүгд Найрамдах Ингушет Улс 2,89 0,38
Кабардино-Балкарын Бүгд Найрамдах Улс 1,38 1,30
Бүгд Найрамдах Халимаг Улс 3,07 3,80
Карачай-Черкес Бүгд Найрамдах Улс 4,17 2,94
Бүгд Найрамдах Карелия Улс 9,66 10,25
Коми Бүгд Найрамдах Улс 8,91 9,95
Мари Эл Бүгд Найрамдах Улс 4,68
гэх мэт. (нийт 88 тохиолдол)

Тиймээс бидэнд "1999 оны SPS дэмжлэг" гэсэн хоёр хувьсагч байна. болон "1999 онд Яблокогийн дэмжлэг", 1999 оны холбооны парламентын сонгуульд санал өгөхөд оролцсон сонгогчдын тооноос эдгээр намд өгсөн саналын хувийн жингээр хамгийн энгийнээр хэрэгжсэн. бүс нутгийн түвшний RF.

Цаашилбал, бидний мэдэлд статистикийн гол аргуудын нэг болох геометрийн дүрслэл болох арга зүйн техник бий. Геометрийн дүрслэл гэдэг нь "тэнхлэгүүд" - хувьсагчдаас бүрдсэн нөхцөлт орон зай дахь тохиолдлыг цэг болгон дүрслэх явдал юм. Бидний жишээн дээр бид бүс бүрийг баруун жигүүрийн намуудын саналын хоёр хэмжээст орон зайн цэг гэж үзэж болно. Энэ тэнхлэг нь "Зөв хүчний холбоог дэмжих", G тэнхлэг нь "Яблокогийн дэмжлэг" гэсэн тэмдгийг үүсгэнэ (эсвэл эсрэгээр; хамааралтай ба бие даасан хувьсагчдыг ялгах боломжгүй тул корреляцийн шинжилгээнд энэ нь чухал биш юм). Бүс нутгийн "координатууд" нь: X тэнхлэгийн дагуу - "SPS дэмжлэг" хувьсагчийн утга (энэ талын бүс нутагт олсон хувь); G тэнхлэгийн дагуу "Apple support" хувьсагчийн утга. Тиймээс, Бүгд Найрамдах Адыгей улс координаттай байх болно (3.92; 4.63), Алтайн Бүгд Найрамдах Улс - (3.38; 5.4) гэх мэт. Бүх тохиолдлын геометрийн дүрслэлийг хийсний дараа бид тараах диаграм буюу корреляцийн талбарыг олж авдаг.

Тархалтын графикийн цэвэр харааны дүн шинжилгээ ч гэсэн регрессийн шугам гэж нэрлэгддэг зарим нөхцөлт шулуун шугамын дагуу цэгүүдийг байрлуулж болохыг харуулж байна. Математикийн хувьд регрессийн шугамыг аргыг ашиглан байгуулдаг хамгийн бага квадратууд(ажиглагдсан цэгүүдээс шулуун шугам хүртэлх зайн квадратуудын нийлбэр хамгийн бага байх үед шугамын байрлалыг тооцоолно).

Регрессийн шугамын дагуу цэгүүд (тохиолдлууд) хэр ойрхон байрлаж байгаагаас харилцааны бат бөх байдал хамаарна. Корреляцийн шинжилгээний тоон үр дүн болох корреляцийн коэффициент (r-ээр тэмдэглэсэн)-д нягтрал нь 0-ээс 1 хооронд хэлбэлздэг. Түүнчлэн, юу вэ илүү ойр үнэ цэнэкоэффициент k - 1, холболт илүү нягт; Энэ утга 0-д ойртох тусам холболт сул байна. Тиймээс, r = 1 үед холболт нь функциональ шинж чанартай болдог - бүх цэгүүд нэг шулуун дээр "хэвтдэг". Холболт бүрэн байхгүй байгааг илтгэх r = 0 үед регрессийн шугам байгуулах боломжгүй болно. Бидний жишээн дээр r = 0.62 бөгөөд энэ нь мэдэгдэхүйц статистик хамаарал байгааг харуулж байна (корреляцийн коэффициентийн тайлбарын талаар дэлгэрэнгүй мэдээллийг доороос үзнэ үү).

Харилцааны төрлийг регрессийн шугамын налуугаар тодорхойлно. Корреляцийн коэффициентэд холболтын хэлбэрийн зөвхөн хоёр утга байдаг: урвуу ("-" тэмдэг) ба шууд ("+" тэмдэг нь уламжлалт байдлаар бичигдээгүй тул тэмдэг байхгүй). Бидний жишээн дээр холболт нь шууд байна. Үүний дагуу шинжилгээний эцсийн үр дүн 0.62 байна.

Өнөө үед Пирсон корреляцийн коэффициентийг статистикийн шинжилгээний бүх программ (SPSS, Statistica, NCSS гэх мэт) ашиглан хялбархан тооцоолж болно. Excel програм("өгөгдлийн шинжилгээ" нэмэлт). Корреляцийн талбарыг нүдээр үнэлэх боломжийг олгодог тул мэргэжлийн багцуудыг ашиглахыг бид зөвлөж байна.

Өгөгдлийн геометрийн дүрслэлийг нүдээр үнэлэх нь яагаад чухал вэ? Нэгдүгээрт, бид харилцаа нь шугаман хэлбэртэй байгаа эсэхийг шалгах ёстой бөгөөд энд хамгийн энгийн бөгөөд энд байна үр дүнтэй арга- яг харааны үнэлгээ. Холболтын шугаман бус байдал илэрсэн тохиолдолд корреляцийн коэффициентийг тооцоолох нь ашиггүй болно гэдгийг санацгаая. Хоёрдугаарт, харааны үнэлгээ нь өгөгдлөөс гадуурх утгыг олох боломжийг олгодог, жишээлбэл. ердийн бус, ердийн бус тохиолдлууд.

Хоёр намын жишээндээ эргэн оръё. Тархалтын графикийг анхааралтай ажиглавал бид "нийтлэг хурдны зам" -аас тодорхой зайд орших ядаж нэг хэвийн бус тохиолдлыг анзаарч, хувьсагчдыг холбох хандлагатай байна. Энэ бол Самара мужийн өгөгдлийг харуулсан цэг юм. Хэдийгээр бага зэрэг боловч Томск, Нижний Новгород муж, Санкт-Петербургт байдал бас хэвийн бус байна.

Та хэт давсан ажиглалтыг арилгах замаар шинжилгээний өгөгдлийг тохируулах боломжтой, жишээлбэл. "Утааг цэвэрлэх" замаар. Квадрат зайны нийлбэрийг тооцоолохтой холбоотой регрессийн шугамыг тооцоолох онцлогоос шалтгаалж, нэг хэтийн үзүүлэлт ч гэсэн ерөнхий дүр зургийг ихээхэн гажуудуулж болно.

88 тохиолдлын зөвхөн нэгийг буюу Самара мужийг хассанаар бид корреляцийн коэффициентийн утгыг олж авснаар өмнө нь олж авсан хэмжээнээс ялгаатай байна: 0.62-тай харьцуулахад 0.73. Холболтын нягтрал 0.1-ээс дээш нэмэгдсэн - энэ нь маш их ач холбогдолтой юм. Санкт-Петербург, Томск, Нижний Новгород мужуудад тохирох онооноосоо салснаар бид илүү ихийг олж авах болно. өндөр нягтралтай: 0,77.

Гэсэн хэдий ч бид хорт утааг цэвэрлэх ажилд автахгүй байх ёстой: тохиолдлын тоог бууруулснаар бид буурдаг ерөнхий түвшинолж авсан үр дүнд статистикийн итгэл. Харамсалтай нь гадуурх утгыг тодорхойлох нийтээр хүлээн зөвшөөрөгдсөн шалгуур байдаггүй бөгөөд судлаачийн ухамсараас ихээхэн хамаардаг. Хамгийн зөв зам- "гадаад" байгаа нь юутай холбоотой болохыг ойлгох. Тиймээс бидний жишээн дээр Самара мужийн атрибутын орон зайд хэвийн бус байр суурь эзэлдэг нь 1999 онд барууны идэвхтэй удирдагчдын нэг нь бүс нутгийн тэргүүн К.Титов байсантай холбоотой юм. Үүний дагуу “Зөв хүчний холбоо” бүс нутагтаа өндөр үр дүнд хүрсэн нь зөвхөн намынх нь дэмжлэг биш, Засаг даргын дэмжлэгтэй холбоотой.

Судалгаандаа эргэн оръё. Бид "Зөв хүчний холбоо" болон "Яблоко"-д санал өгөх нь нутаг дэвсгэрийн үндсэн дээр авсан мэдээллийн багцаас бие биетэйгээ маш нягт уялдаатай байгааг олж мэдсэн. Энэ холбоо нь бидний хараахан шууд авч үзээгүй тодорхой хүчин зүйл эсвэл цогц хүчин зүйл дээр үндэслэсэн гэж үзэх нь логик юм. Янз бүрийн түвшний сонгуулийн статистикийг судалж үзэхэд хоёр нам хотод хамгийн сайн, хөдөө орон нутагт хамгийн муу үр дүн үзүүлж байгааг анзаарахад хялбар байдаг. Хувьсагчдын хоорондын хамаарлыг зуучлагч хүчин зүйлүүдийн нэг нь нутаг дэвсгэрийн хотжилтын түвшин гэж бид таамаглаж болно. Энэ шинж чанарыг "хөдөөгийн хүн амын эзлэх хувь" эсвэл "хотын хүн амын эзлэх хувь" гэсэн хувьсах үзүүлэлтээр хамгийн хялбархан гүйцэтгэдэг. Холбооны субьект бүрт ийм статистик байдаг.

Одоо манай эх сурвалжийн өгөгдөлд гурав дахь хувьсагч гарч ирэв - үүнийг "хөдөөгийн хүн амын эзлэх хувь" гэж үзье.

Цэвэр техникийн хувьд бид хос корреляцийн коэффициент бүрийг тусад нь тооцож болох боловч харилцан хамаарлын матрицыг (хос корреляцийн матриц) нэн даруй олж авах нь илүү тохиромжтой. Матриц нь диагональ тэгш хэмтэй байдаг. Манай тохиолдолд энэ нь дараах байдлаар харагдах болно.

Бид таамаглалыг баталгаажуулсан статистикийн ач холбогдолтой корреляцийн коэффициентүүдийг олж авсан. Тиймээс хотын хүн амын эзлэх хувь нь "Зөв хүчний холбоо" (r = -0.61), "Яблоко" (r = -0.55) -ийг дэмжсэнтэй хоёуланд нь сөргөөр нөлөөлжээ. "SPS дэмжлэг" хувьсагч нь "Яблоко дэмжлэг" хувьсагчтай харьцуулахад хотжилтын хүчин зүйлд илүү мэдрэмтгий болохыг тэмдэглэж болно.

Хажуу утсыг цэвэрлэсний дараа (тарсан зураасыг үзнэ үү) холболт илүү нягт байх болно гэдгийг тэмдэглэх нь зүйтэй. Тиймээс, хоёр хэтрүүлэгчийг арилгасны дараа ( Самара мужба Усть-Ордынскийн Буриадын автономит тойрог) ATP-ийн нягтын коэффициент -0.65 болж нэмэгддэг.

Энэ жишээн дээр бид аль хэдийн нэг хувьсагчийн нөгөөд үзүүлэх нөлөөллийн талаар бодож эхэлж байна. Хатуухан хэлэхэд, дээр дурьдсан, корреляцийн шинжилгээ нь хамааралтай болон бие даасан хувьсагчдыг ялгадаггүй бөгөөд зөвхөн харилцан статистикийн харилцааг бүртгэдэг. Үүний зэрэгцээ сонгогчид хот, хөдөөгийн хүн амд хамаарах нь тэдний сонгуулийн сонголтод нөлөөлдөг болохоос эсрэгээрээ биш гэдгийг бид ойлгож байна.

Холболтын эрчмийн тайлбар

Бид Pearson корреляцийн коэффициентийн утга дээр үндэслэн харилцааны бат бөх чанарыг тайлбарлах асуудалд хандсан.

Энд тодорхой хатуу дүрэм байдаггүй; харин статистикийн судалгааны явцад хуримтлагдсан туршлагын тухай юм. Дараах тайлбарын схемийг уламжлалт гэж үзэж болно өгөгдсөн коэффициент:

Корреляцийн коэффициентийн нягтын тайлбарын ижил төстэй хувилбар нь улс төрийн шинжлэх ухаанаас (жишээлбэл, эдийн засагт) тоон мэдээлэлд илүү их тулгуурладаг шинжлэх ухаанд хэрэглэгддэг гэдгийг тэмдэглэх нь зүйтэй. Эмпирик бодлогын судалгаанд r > 0.7 олох нь нэлээд ховор байдаг; 0.9 утгатай коэффициент нь ердөө л өвөрмөц тохиолдол юм. Энэ нь юуны түрүүнд улс төрийн зан үйлийн сэдэл - нарийн төвөгтэй, олон хүчин зүйлтэй, ихэвчлэн үндэслэлгүй байдаг онцлогтой холбоотой юм. Тодорхой нэгний төлөө санал өгөх гэх мэт нарийн төвөгтэй үзэгдэл болох нь ойлгомжтой Улс төрийн нам, нэг эсвэл бүр хоёр хүчин зүйлд бүрэн захирагдах боломжгүй. Тиймээс, улс төрийн судалгааны талаар бид бага зэрэг зөөлрүүлсэн тайлбарын схемийг санал болгож байна.

0.4 > r > 0.3 - сул хамаарал;

0.6 > r > 0.4 - дундаж хамаарал;

Г> 0.7 - хүчтэй хамаарал.

r квадрат (r 2) болох детерминацийн коэффициентийг тооцоолох явцад корреляцийн коэффициентийн ач холбогдлыг үнэлэх боломжийг олгодог өөр нэг ашигтай журам байдаг. Процедурын утга нь квадрат болгоход бага коэффициентүүд "жингээ" алдах болно.

өндөртэй харьцуулахад хамаагүй хүчтэй. Тэгэхээр 0.9 2 = 0.81 (утга нь зөвхөн 0.09-оор буурдаг); 0.5 2= 0.25 (энд бид аль хэдийн хагас утгыг алдаж байна); 0.3 2 = 0.09 ("турах" гурваас дээш удаа). Бид "тодорхойлох" ба "тодорхойлох" гэж утга учиртай тайлбарлаж болох хувьсагчдын талаар ярих үед r2-ийн утга нь тодорхойлох хувьсагчийн тайлбарлаж буй тохиолдлын эзлэх хувийг заана.

Бидний жишээн дээр утааг цэвэрлэсний дараа “SPS дэмжлэг” болон “Хөдөөгийн хүн амын эзлэх хувь” хувьсагчдын хоорондын хамаарлын коэффициент -0.65 байна. Тодорхойлох коэффициент нь -0.65 2 = 0.42 байна. Бодит байдлыг бага зэрэг хялбаршуулж, хотжилтын хүчин зүйл нь 1999 онд Оросын бүс нутаг дахь "Зөв хүчний холбоонд санал өгөх" хувьсагчийн 40 орчим хувийг тайлбарлаж байна гэж хэлж болно.


1991 1993 1995 19961 1999 2000 2003 2004
1991 1
1993 0,83 1
1995 0,52 0,66 1
1996 0,43 0,47 0,76 і
1999 0,14 0,26 0,61 0,56 1
2000 0,13 0,15 0,34 0,47 0,74 1
2003 0,04 0,13 0,36 0,38 0,81 0,75 1
2004 0,04 0,10 0,11 0,21 0,55 0,66 0,73 1

Сонгуулийн мөчлөг бүрт корреляцийн нягтрал 0.7-оос хэтэрч байгааг анхаарна уу (1991-1993: r = 0.83; 1995-1996: r = 0.76; 1999 - 2000: r = 0.74; 2003 - 2004: 7.). Хамгийн их хугацааны зайд - 1991-1993, 2003-2004 оны ерөнхийлөгчийн болон парламентын сонгуулийн хооронд. - холболт байхгүй, коэффициент нь 0.1-ээс ихгүй байна. Үүний зэрэгцээ, цаг хугацааны явцад холболтын эвдрэл нь удаан явагддаг. Ийнхүү 1995-2003 оны УИХ-ын сонгуулийн идэвхжилийн хооронд сул ч гэсэн холбоо байгаа нь анхаарал татаж байна. (r=0.36). Найман жилийн хугацаанд тодорхой тасралтгүй байдал илэрч, энэ хугацаанд ноцтой "шинэчлэлт" явагддаг. улс төрийн дэглэмХолбооны харилцааны тогтолцоо нь Оросын бүс нутгуудад ирцийн түвшний хуваарилалт өндөр тогтвортой байгааг харуулж байна. Тиймээс бид нутаг дэвсгэрийн сонгуулийн соёлын нэг бүрэлдэхүүн хэсэг болох үйл ажиллагааны түвшин / тасалбар гэж үзэх үндэслэлтэй байна.

Бусад корреляцийн коэффициентүүд

Дээр дурдсанчлан Пирсон корреляцийн коэффициент нь интервал ба хэвийн тархалттай хувьсагчдын хоорондын хамаарлын хамгийн түгээмэл шалгуур юм. Гэхдээ биднээс ихээхэн хазайсан хувьсагч байвал яах вэ хэвийн тархалт? Эсвэл хувьсагч нь интервал биш, харин хэмжигдэхүүн (олон тооны категори бүхий дарааллын хувьсагч) мөн үү?

өндөртэй харьцуулахад хамаагүй хүчтэй. Тэгэхээр 0.9 2= 0.81 (утга зөвхөн 0.09-оор буурна); 0.5 2= 0.25 (энд бид аль хэдийн хагас утгыг алдаж байна); 0.3 2= 0.09 (гурваас дээш "жин хасах"). Бид "тодорхойлох" ба "тодорхойлох" гэж утга учиртай тайлбарлаж болох хувьсагчдын тухай ярих үед r2-ийн утга нь тодорхойлох хувьсагчийн тайлбарлаж буй тохиолдлын эзлэх хувийг заана.

Бидний жишээн дээр утааг цэвэрлэсний дараа “SPS дэмжлэг” болон “Хөдөөгийн хүн амын эзлэх хувь” хувьсагчдын хоорондын хамаарлын коэффициент -0.65 байна. Тодорхойлох коэффициент нь -0.65 2 = 0.42 байна. Бодит байдлыг бага зэрэг хялбаршуулж, 1999 онд Оросын бүс нутгуудад "Зөв хүчний холбоонд санал өгөх" хувьсагчийн 40 орчим хувийг хотжилтын хүчин зүйл тайлбарлаж байна гэж хэлж болно.

Корреляцийн шинжилгээг ашиглан хувьсагчдын хоорондын харилцааны динамикийг цаг хугацааны явцад тодорхойлох

Корреляцийн шинжилгээг зөвхөн хувьсах хэмжигдэхүүн хоорондын хамаарлыг илрүүлэхээс гадна энэ хамаарлын өөрчлөлтийг цаг хугацааны явцад үнэлэхэд ашиглаж болно. Тиймээс ОХУ-ын бүс нутгуудын сонгуулийн үйл ажиллагааны асуудлыг судлахдаа сонгогчдын идэвхжил нь Оросын нутаг дэвсгэрийн сонгуулийн соёлын тодорхой тогтвортой шинж чанар гэдгийг батлах шаардлагатай байв. Энэ нь мэдээжийн хэрэг гэсэн үг биш юм. үнэмлэхүй үзүүлэлтүүд, энэ нь сонгуулиас сонгуульд ихээхэн хэлбэлздэг. Бид ОХУ-ын янз бүрийн бүс нутагт сонгогчдын идэвхжилийн түвшний ялгаатай байдлын тогтвортой байдлын тухай ярьж байна.

Холбооны субъектуудын дунд ирцийн пропорциональ хуваарилалтын тогтвортой байдлыг корреляцийн шинжилгээний аргыг ашиглан маш энгийнээр шалгадаг. 1991-2004 оны холбооны сонгуулийн сонгуулийн үйл ажиллагааны хос корреляцийн матрицыг доор өгөв. өнөөгийн чиг хандлагыг маш тодорхой харуулж байна. Статистикийн холбоо нь сонгуулийн нэг мөчлөгийн дотор хамгийн хүчтэй байдаг (1991-1993; 1995-1996; 1999-2000; 2003-2004), ойрын хоёр мөчлөгийн хооронд цаг хугацааны явцад бага зэрэг суларч, сонгуулийн мөчлөг холдох тусам бүдгэрэх хандлагатай байдаг.

Байгалийн болон нийгмийн хөгжлийн аливаа хуулийг харилцааны багц дүрслэлээр илэрхийлж болно. Хэрэв эдгээр хамаарал нь стохастик бөгөөд нийт хүн амын түүвэр дээр дүн шинжилгээ хийх юм бол судалгааны энэ чиглэл нь хамаарлын статистик судалгааны ажлуудтай холбоотой бөгөөд үүнд хамаарал, регресс, дисперс, ковариацын шинжилгээ, шинжилгээ зэрэг орно. гэнэтийн хүснэгтүүд.

    Судалж буй хувьсагчдын хооронд хамаарал байгаа юу?

    Холболтын ойр байдлыг хэрхэн хэмжих вэ?

Статистикийн судалгааны параметрүүдийн хоорондын хамаарлын ерөнхий диаграммыг Зураг дээр үзүүлэв. 1.

Зураг дээр S нь судалж буй бодит объектын загвар юм. Санамсаргүй хүчин зүйлүүд- эдгээр нь нөлөөллийг харгалзан үзэхэд хэцүү эсвэл одоогоор нөлөөллийг үл тоомсорлож буй хүчин зүйлүүд юм. Үүссэн (хамааралтай, тайлбарласан) хувьсагч нь тухайн объектын үйл ажиллагааны үр дүнг тодорхойлдог.

Харилцааг шинжлэх аргыг сонгохдоо дүн шинжилгээ хийж буй хувьсагчдын шинж чанарыг харгалзан үздэг.

Корреляцийн шинжилгээ нь хувьсагчдын хоорондын хамаарлыг судлахтай холбоотой статистик мэдээллийг боловсруулах арга юм.

Корреляцийн шинжилгээний зорилго нь өөр нэг хувьсагчийг ашиглан нэг хувьсагчийн талаар тодорхой мэдээлэл өгөх явдал юм. Зорилгодоо хүрэх боломжтой тохиолдолд хувьсах хэмжигдэхүүнүүдийг харилцан хамаарал гэж нэрлэдэг. Корреляци нь утгуудын зөвхөн шугаман хамаарлыг илэрхийлдэг боловч тэдгээрийн функциональ холболтыг тусгадаггүй. Жишээлбэл, хэрэв та A = sin(x) ба B = cos (x) хэмжигдэхүүнүүдийн хоорондын хамаарлын коэффициентийг тооцоолвол тэгтэй ойролцоо байх болно, өөрөөр хэлбэл. хэмжигдэхүүнүүдийн хооронд ямар ч хамаарал байхгүй.

Корреляцийг судлахдаа график болон аналитик аргыг ашигладаг.

График шинжилгээ нь корреляцийн талбарыг байгуулахаас эхэлдэг. Корреляцийн талбар (эсвэл тархалтын график) нь хоёр шинж чанарын хэмжилтийн үр дүнгийн хоорондох график харилцаа юм. Үүнийг бүтээхийн тулд анхны өгөгдлийг график дээр зурж, хос утгыг (xi, yi) тэгш өнцөгт координатын систем дэх xi ба yi координаттай цэг болгон харуулна.

Корреляцийн талбарын харааны шинжилгээ нь судалж буй хоёр үзүүлэлтийн хоорондын хамаарлын хэлбэр, чиглэлийн талаар таамаглал гаргах боломжийг олгодог. Харилцааны хэлбэрийн дагуу корреляцийн хамаарлыг ихэвчлэн шугаман (1-р зургийг үз) ба шугаман бус (2-р зургийг үз) гэж хуваадаг. Шугаман хамаарлын үед корреляцийн талбайн дугтуй нь эллипстэй ойролцоо байна. Хоёрын шугаман хамаарал санамсаргүй хэмжигдэхүүннэг санамсаргүй хэмжигдэхүүн нэмэгдэхийн хэрээр өөр нэг санамсаргүй хэмжигдэхүүн нь шугаман хуулийн дагуу өсөх (эсвэл буурах) хандлагатай байдаг.

Хэрэв нэг шинж чанарын үнэ цэнийн өсөлт нь хоёр дахь шинж чанарын үнэ цэнийн өсөлтөд хүргэдэг бол (3-р зургийг үз) эерэг, нэг шинж чанарын үнэ цэнийн өсөлт нь үнэ цэнэ буурахад хүргэдэг бол сөрөг байна. хоёр дахь нь (4-р зургийг үз).

Зөвхөн эерэг эсвэл зөвхөн сөрөг чиглэлтэй хамаарлыг монотон гэж нэрлэдэг.

Шинжилгээ, урьдчилан таамаглах математик аргууд

Корреляцийн шинжилгээ

Оршил

2. Регрессийн шинжилгээ

3. Хүчин зүйлийн шинжилгээ

4. Кластер шинжилгээ

5. Нийгэм, эрх зүйн үйл явцын динамик, прогнозын дүн шинжилгээ

Дүгнэлт

Нийгэм-эдийн засгийн үзэгдэл, үйл явцын хооронд функциональ болон стохастик гэсэн хоёр төрлийн хамаарал байж болно. Янз бүрийн үзэгдлийг тодорхойлдог бусад параметрүүд. Энэ төрлийн хараат байдлын жишээ нийгмийн орчинбараг хэзээ ч тохиолддоггүй.

Стохастик (магадлал) хамаарлын хувьд хамааралтай хувьсагчийн тодорхой утга нь тайлбарлагч хувьсагчийн багц утгуудтай тохирч байна. Энэ нь юуны түрүүнд хамааралтай хувьсагч нь тодорхойгүй олон хүчин зүйлийн нөлөөнд автдагтай холбоотой юм. Нэмж дурдахад хувьсагчийн хэмжилтийн алдаанууд нөлөөлдөг: утгуудын санамсаргүй тархалтын улмаас тэдгээрийн утгыг зөвхөн тодорхой магадлалаар зааж өгч болно.

Нийгэм-эдийн засгийн хүрээнд бид магадлалын шинж чанартай олон үзэгдэлтэй тулгарах ёстой. Тэгэхээр тодорхой хугацаанд үйлдэгдэж, шийдэгдсэн гэмт хэргийн тоо, аль ч бүс нутагт тодорхой хугацаанд гарсан зам тээврийн ослын тоо бүгд санамсаргүй хэмжигдэхүүн юм.

Стохастик харилцааг судлахын тулд тусгай аргууд байдаг, тухайлбал корреляцийн шинжилгээ (корреляци гэдэг нь одоо байгаа үзэгдэл, үйл явцын хоорондын харилцаа, холбоо) юм.

Корреляцийн шинжилгээ- Энэ бол янз бүрийн шинж чанаруудын хоорондын хамаарлыг судлах боломжийг олгодог мэдээлэл боловсруулах статистикийн багц аргыг тодорхой дарааллаар ашиглах явдал юм.

Корреляцийн шинжилгээний даалгаварарга хэлбэрээр математик статистик холболтын хэлбэр, чиглэлийг тогтоох, түүнчлэн судалж буй санамсаргүй шинж чанаруудын хоорондын энэ холболтын ойр байдлыг хэмжих явдал юм.

Статистикийн хувьд хоёр шинж чанарын шугаман хамаарлын хэмжээг энгийн (түүвэр) ашиглан хэмждэг. корреляцийн коэффициент. Нэг хувьсагчийн хэд хэдэн бусад хувьсах хэмжигдэхүүнээс шугаман хамаарлын хэмжээг эдгээр хувьсагчийн бусад хувьсагчидтай уялдаа холбоотой шугаман хамаарлын хэсгийг арилгасны дараа олон тооны коэффициентээр хэмждэг.

Хэлбэрийн хувьд корреляцийн холболтууд нь шугаман (шулуун) ба шугаман бус (муруй) болон чиглэлтэй байж болно.

Шууд харилцаа холбооЭнэ нь нэг шинж чанарын утгыг нэмэгдүүлэх (буурах) үед өөр нэг шинж чанарын утга нэмэгдэх (бууралт) байгааг харуулж байна. At санал хүсэлт Нэг шинж чанарын утгын өсөлт (бууралт) нь өөр шинж чанарын утгын бууралтад (өсөлт) хүргэдэг.



Корреляцийн шинжилгээний гол ажил- холболтын битүүмжлэлийг хэмжих - янз бүрийн корреляцийн коэффициентийг тооцоолох, тэдгээрийн ач холбогдлыг шалгах замаар шийдэгддэг.

Корреляцийн коэффициент нь шууд хамаарлын хувьд 0-ээс +1 хүртэлх утгыг, урвуу хамаарлын хувьд -1-ээс 0 хүртэлх утгыг авч болно 0-тэй ойролцоо коэффициентүүд нь шинж чанаруудын хооронд статистик шугаман хамаарал байхгүй гэж үздэг. коэффициентийн үнэмлэхүй утгууд 0.3-аас бага бол хамаарал сул байна; 0.3...0.5 утгын хувьд холболт дунд зэрэг; 0.5 ... 0.7-д - хамаарал нь чухал ач холбогдолтой; 0.7 ... 0.9 - холболт хүчтэй; хэрэв коэффициентийн утга 0.9-ээс их байвал харилцаа нь маш хүчтэй гэж тооцогддог; хэрэв коэффициентүүд нь +1 эсвэл -1-тэй тэнцүү бол бид функциональ холболтын тухай ярьж байна (статистикийн судалгаанд бараг байдаггүй).

Гэсэн хэдий ч статистикийн хамаарал байгаа эсэхэд итгэх итгэлийн түвшин нь судалж буй хүн амын тооноос хамаардаг тул харилцааны бат бөх байдлын ийм хялбаршуулсан үнэлгээ нь үргэлж зөв байдаггүй. Популяцийн хэмжээ бага байх тусам шинж чанаруудын хоорондын хамаарал байгаа гэсэн таамаглалыг хүлээн зөвшөөрөхийн тулд корреляцийн коэффициентийн утга их байх ёстой. зорилготойгоор тоон хэмжилтшинж чанаруудын хооронд шугаман статистик хамаарал байгаа эсэхэд итгэх итгэлийн зэрэг, ойлголтуудыг нэвтрүүлсэн. ач холбогдлын түвшинТэгээд босго (чухал) утгуудкорреляцийн коэффициент.

Ач холбогдол шалгахҮүссэн корреляцийн коэффициент нь тооцоолсон утгыг чухал утгатай харьцуулахаас бүрдэнэ. Өгөгдсөн тооны хэмжилт болон тодорхой ач холбогдлын түвшний хувьд чухал утгыг олж, тооцоолсон утгатай харьцуулна. Хэрэв тооцоолсон утга нь эгзэгтэй утгаас их байвал хамаарал нь бага байвал хамаарал байхгүй (мөн корреляцийн коэффициентийн энэ утгыг санамсаргүй хазайлтаар тайлбарладаг) эсвэл түүврийг тодорхойлоход бага байна; тэр.

Учир нь шугаман харилцааны оршихуй ба хэмжээг тодорхойлох X ба Y хоёр хувьсагчийн хооронд хоёр процедурыг хийх шаардлагатай. Эхнийх нь [(Xi,Yi),i=1,n] цэгүүдийг хавтгай дээр графикаар харуулах явдал юм. Үүссэн графикийг хувьсагчдын хоорондох шугаман хамаарлын таамаглалын үнэн зөв гэж нэрлэдэг. Хэрэв ийм таамаглал хүлээн зөвшөөрөгдөх юм бол шугаман харилцааны хэмжээг тоон хэлбэрээр илэрхийлэх шаардлагатай. Энэ зорилгоор үүнийг ашигладаг түүвэрлэлтийн хүчин зүйлхамаарал:

Энд n нь хэмжилтийн тоо, Xi,Yi - i-р утгууд, X,Y - дундаж утгууд, sx, sy - X ба Y хувьсагчдын стандарт хазайлтууд.

Онолын хувьд Статистикийн дүн шинжилгээкорреляцийн хамаарлыг тодорхойлсон шугаман хамааралшинжилж буй хувьсагчдын хэвийн тархалтын нөхцөлд. Иймд корреляцийн аргыг зөв хэрэглэхийн тулд хувьсагчдын тархалтын хэвийн болон шугаман хамаарлын хэлбэрт ойр байгааг зөвтгөх шаардлагатай. Үгүй бол илүү нарийн төвөгтэй дүн шинжилгээ хийх арга эсвэл бусад холболтын коэффициентийг ашиглах шаардлагатай болно.

Эмпирик тархалтын хэвийн байдлыг шалгах нэлээн энгийн тооцоолох энгийн арга бол дараах харьцааг тооцоолох явдал юм.

,

Энд C нь дундаж үнэмлэхүй хазайлт, s нь стандарт хазайлт юм.

Хэрэв энэ тэгш бус байдал хангагдсан бол эмпирик тархалтын хэвийн байдал, хувьсагчдын хоорондын шугаман статистик харилцааны хэмжүүр болгон корреляцийн коэффициентийг ашиглах зөв байдлын талаар ярьж болно.

IN ерөнхий тохиолдолГэмт хэргийн гаралтад олон хүчин зүйл нөлөөлдөг. Эдгээрт нийгэм-эдийн засаг, газарзүйн болон цаг уурын, хүн ам зүй гэх мэт, түүнчлэн хүч, арга хэрэгсэл, дотоод хэргийн байгууллагын зохион байгуулалтын түвшинг тодорхойлсон шинж тэмдгүүд орно.

Гэсэн хэдий ч хоёр хувьсагчийн хооронд хүчтэй статистикийн ач холбогдол бүхий хамаарал байгаа ч тэдгээрийн хамтарсан статистик хамаарлыг тодорхойлох бусад шалтгаан (хүчин зүйл) байж болох тул тэдгээрийн учир шалтгааны талаар бүрэн итгэлтэй байж чадахгүй. Статистикийн дүгнэлт нь онолын үндэслэлтэй байх ёстой.

Үүний зэрэгцээ, статистикийн ач холбогдол бүхий холбоо байхгүй байгаа нь шалтгаан-үр дагаврын холбоо байхгүй байгааг илтгэхгүй, харин бодитой үзэл баримтлалтай бол түүнийг тодорхойлох өөр арга, хэрэгслийг хайхад хүргэдэг. практик туршлагатүүний боломжит оршихуйг илтгэнэ.

СУРГАЛТЫН АЖИЛ

Сэдэв: Корреляцийн шинжилгээ

Оршил

1. Корреляцийн шинжилгээ

1.1 Корреляцийн тухай ойлголт

1.2 Ерөнхий ангилалхамаарал

1.3 Корреляцийн талбарууд ба тэдгээрийн барилгын зорилго

1.4 Корреляцийн шинжилгээний үе шатууд

1.5 Корреляцийн коэффициентүүд

1.6 Нормалжсан Бравайс-Пирсон корреляцийн коэффициент

1.7 коэффициент зэрэглэлийн хамааралСпирман

1.8 Корреляцийн коэффициентийн үндсэн шинж чанарууд

1.9 Корреляцийн коэффициентийн ач холбогдлыг шалгах

1.10 Хос корреляцийн коэффициентийн эгзэгтэй утгууд

2. Олон хүчин зүйлийн туршилтыг төлөвлөх

2.1 Асуудлын нөхцөл байдал

2.2 Төлөвлөгөөний төв (үндсэн түвшин) ба хүчин зүйлийн өөрчлөлтийн түвшинг тодорхойлох

2.3 Төлөвлөлтийн матрицыг байгуулах

2.4 Янз бүрийн цуваа дахь хэмжилтийн дисперсийн нэгэн төрлийн байдал, эквивалент байдлыг шалгах

2.5 Регрессийн тэгшитгэлийн коэффициентүүд

2.6 Нөхөн үржихүйн хэлбэлзэл

2.7 Регрессийн тэгшитгэлийн коэффициентүүдийн ач холбогдлыг шалгах

2.8 Регрессийн тэгшитгэлийн хүрэлцээг шалгах

Дүгнэлт

Ном зүй

ОРШИЛ

Туршилтын төлөвлөлт гэдэг нь оновчтой зохион байгуулалтын аргуудыг судалдаг математик, статистикийн салбар юм. туршилтын судалгаа-аас оновчтой сонголттуршилтын бодит төлөвлөгөөг зорилгодоо нийцүүлэн тодорхойлж, судалж буй хүчин зүйлс, үр дүнд дүн шинжилгээ хийх арга. Туршилтын төлөвлөлт нь Английн статистикч Р.Фишерийн (1935) бүтээлүүдээс эхэлсэн бөгөөд тэрээр оновчтой туршилт төлөвлөлт нь хэмжилтийн үр дүнг оновчтой боловсруулахаас дутуугүй чухал ач холбогдолтой тооцооны нарийвчлалыг өгдөг гэж онцолсон байдаг. 20-р зууны 60-аад онд тэнд байсан орчин үеийн онолтуршилтыг төлөвлөх. Түүний аргууд нь функцийн ойролцоо онол, математикийн програмчлалтай нягт холбоотой байдаг. Баригдсан оновчтой төлөвлөгөөтэдгээрийн шинж чанарыг өргөн хүрээний загварт зориулж судалсан.

Туршилтын төлөвлөлт - тодорхой шаардлагад нийцсэн туршилтын төлөвлөгөөг сонгох, туршилтын стратеги боловсруулахад чиглэсэн үйл ажиллагааны багц (априор мэдээлэл олж авахаас эхлээд ажиллах боломжтой математик загварыг олж авах, тодорхойлох хүртэл). оновчтой нөхцөл). Энэ бол судалж буй үзэгдлийн механизмын талаар бүрэн бус мэдлэгтэй нөхцөлд хэрэгжүүлсэн туршилтын зорилготой хяналт юм.

Хэмжилт хийх, дараачийн өгөгдлийг боловсруулах, үр дүнг математик загвар хэлбэрээр албан ёсны болгох явцад алдаа гарч, анхны өгөгдөлд агуулагдах зарим мэдээлэл алдагддаг. Туршилтын төлөвлөлтийн аргыг ашиглах нь математик загварын алдааг тодорхойлж, түүний зохистой байдлыг үнэлэх боломжийг олгодог. Хэрэв загварын нарийвчлал хангалтгүй бол туршилтын төлөвлөлтийн аргыг ашиглах нь орчин үеийн болгох боломжийг олгоно. математик загварөмнөх мэдээллийг алдалгүйгээр, хамгийн бага зардлаар нэмэлт туршилт хийх.

Туршилтыг төлөвлөх зорилго нь хамгийн бага хөдөлмөр зарцуулсан объектын талаар найдвартай, найдвартай мэдээлэл олж авах, түүнчлэн энэхүү мэдээллийг авсаархан, тохиромжтой хэлбэрээр танилцуулах боломжтой туршилт хийх нөхцөл, дүрмийг олох явдал юм. нарийвчлалын тоон үнэлгээний хамт.

Ашигласан төлөвлөлтийн үндсэн аргуудын нэг өөр өөр үе шатуудсудалгааны хэрэглээ:

Скрининг туршилтыг төлөвлөх, түүний гол утга нь цаашдын нарийвчилсан судалгаанд хамрагдах чухал хүчин зүйлсийн бүлгийн бүх хүчин зүйлийг сонгох явдал юм;

Туршилтыг төлөвлөж байна дисперсийн шинжилгээ, өөрөөр хэлбэл чанарын хүчин зүйл бүхий объектын төлөвлөгөө гаргах;

Регрессийн загварыг (олон гишүүнт болон бусад) олж авах боломжийг олгодог регрессийн туршилтыг төлөвлөх;

Судалгааны объектыг туршилтаар оновчтой болгох гол ажил болох туйлын туршилтыг төлөвлөх;

Динамик процессыг судлахдаа төлөвлөлт гэх мэт.

Энэ сэдвийг судлах зорилго нь төлөвлөлтийн онол, орчин үеийн мэдээллийн технологийг ашиглан оюутнуудыг мэргэжлийн чиглэлээр үйлдвэрлэл, техникийн үйл ажиллагаанд бэлтгэх явдал юм.

Хичээлийн зорилго: судлах орчин үеийн аргуудшинжлэх ухаан, үйлдвэрлэлийн туршилтыг төлөвлөх, зохион байгуулах, оновчтой болгох, туршилт хийх, олж авсан үр дүнг боловсруулах.

1. ХАРИЛЦААНЫ ШИНЖИЛГЭЭ

1.1 Корреляцийн тухай ойлголт

Судлаач судалж буй нэг буюу хэд хэдэн түүвэрт хоёр ба түүнээс дээш хувьсагч хоорондоо хэрхэн холбоотой болохыг сонирхдог. Жишээлбэл, өндөр нь хүний ​​жинд нөлөөлж болох уу, эсвэл цусны даралт нь бүтээгдэхүүний чанарт нөлөөлдөг үү?

Хувьсагчдын хоорондын ийм хамаарлыг корреляци буюу корреляци гэж нэрлэдэг. Корреляци гэдэг нь нэг шинж чанарын хувьсах чанар нөгөөгийнх нь хувьсах чадвартай нийцэж байгааг харуулсан хоёр шинж чанарын тогтмол өөрчлөлтийг хэлнэ.

Жишээлбэл, хүмүүсийн өндөр ба жингийн хооронд дунджаар эерэг хамаарал байдаг бөгөөд өндөр байх тусам хүний ​​жин их байдаг. Гэсэн хэдий ч харьцангуй намхан хүмүүс илүүдэл жинтэй, харин эсрэгээрээ астениктай бол энэ дүрэмд үл хамаарах зүйлүүд байдаг. өндөрхөнгөн жинтэй. Ийм үл хамаарах шалтгаан нь биологи, физиологи, сэтгэлзүйн шинж тэмдэг бүр нь хүрээлэн буй орчин, генетик, нийгэм, хүрээлэн буй орчин гэх мэт олон хүчин зүйлийн нөлөөгөөр тодорхойлогддог.

Корреляцийн холболтууд нь математик статистикийн аргуудыг ашиглан зөвхөн төлөөлөх түүвэр дээр судлах боломжтой магадлалын өөрчлөлт юм. Корреляцийн холбоос ба корреляцийн хамаарал гэсэн хоёр нэр томьёо нь ихэвчлэн харилцан адилгүй хэрэглэгддэг. Хараат байдал нь нөлөөлөл, холболт - олон зуун шалтгаанаар тайлбарлаж болох аливаа зохицуулалттай өөрчлөлтийг хэлнэ. Корреляцийн холболтыг шалтгаан-үр дагаврын хамаарлын нотолгоо гэж үзэх боломжгүй, тэдгээр нь зөвхөн нэг шинж чанарын өөрчлөлтийг нөгөөд нь тодорхой өөрчлөлтүүд дагалддаг болохыг харуулж байна.

Корреляцийн хамаарал - Эдгээр нь нэг шинж чанарын утгыг тохиолдох магадлалд оруулдаг өөрчлөлтүүд юм өөр өөр утгатайөөр тэмдэг.

Корреляцийн шинжилгээний даалгавар нь янз бүрийн шинж чанаруудын хоорондын харилцааны чиглэл (эерэг эсвэл сөрөг) ба хэлбэрийг (шугаман, шугаман бус) тогтоох, тэдгээрийн ойр байдлыг хэмжих, эцэст нь олж авсан корреляцийн коэффициентүүдийн ач холбогдлын түвшинг шалгахад чиглэгддэг.

Корреляцийн холболтууд нь хэлбэр, чиглэл, зэрэг (хүч) -ээр ялгаатай байдаг. .

Корреляцийн харилцааны хэлбэр нь шугаман эсвэл муруй шугаман байж болно. Жишээлбэл, симулятор дээрх сургалтын тоо болон хяналтын хуралдааны зөв шийдсэн асуудлын хоорондын хамаарал нь шууд байж болно. Жишээлбэл, урам зоригийн түвшин ба даалгаврын үр нөлөөний хоорондын хамаарал нь муруй хэлбэртэй байж болно (Зураг 1). Хүсэл эрмэлзэл нэмэгдэхийн хэрээр эхлээд даалгаврыг гүйцэтгэх үр нөлөө нэмэгдэж, дараа нь урам зоригийн оновчтой түвшинд хүрдэг бөгөөд энэ нь хамгийн их үр ашигдаалгавар гүйцэтгэх; Урам зоригийн цаашдын өсөлт нь үр ашгийн бууралт дагалддаг.

Зураг 1 - Асуудлыг шийдвэрлэх үр нөлөө ба сэдэлт хандлагын хүч хоорондын хамаарал

Чиглэлийн хувьд корреляцийн хамаарал нь эерэг ("шууд") ба сөрөг ("урвуу") байж болно. Эерэгтэй шугаман хамааралНэг шинж чанарын өндөр утга нь нөгөө шинж чанарын өндөр утгатай, нэг шинж чанарын бага утга нь нөгөөгийн бага утгатай тохирч байна (Зураг 2). Сөрөг хамааралтай бол харилцаа нь урвуу байна (Зураг 3). Эерэг корреляцитай бол корреляцийн коэффициент байна эерэг тэмдэг, сөрөг хамааралтай - сөрөг тэмдэг.

Зураг 2 – Шууд хамаарал

Зураг 3 – Урвуу хамаарал


Зураг 4 – Ямар ч хамааралгүй

Корреляцийн зэрэг, бат бөх эсвэл ойр байдлыг корреляцийн коэффициентийн утгаар тодорхойлно. Холболтын хүч нь түүний чиглэлээс хамаардаггүй бөгөөд корреляцийн коэффициентийн үнэмлэхүй утгаараа тодорхойлогддог.

1.2 Корреляцийн ерөнхий ангилал

Корреляцийн коэффициентээс хамааран дараахь хамаарлыг ялгана.

Хүчтэй, эсвэл r>0.70 корреляцийн коэффициенттэй ойрхон;

Дунджаар (0.50

Дунд зэрэг (0.30

Сул (0.20

Маш сул (r<0,19).

1.3 Корреляцийн талбарууд ба тэдгээрийн барилгын зорилго

Корреляцийг хоёр шинж чанарын хэмжсэн утгууд (x i, y i) болох туршилтын өгөгдөл дээр үндэслэн судалдаг. Хэрэв туршилтын өгөгдөл бага бол хоёр хэмжээст эмпирик тархалтыг x i ба y i утгуудын давхар цуврал хэлбэрээр илэрхийлнэ. Үүний зэрэгцээ шинж чанаруудын хоорондын хамаарлын хамаарлыг янз бүрийн аргаар тодорхойлж болно. Аргумент ба функцийн хоорондын хамаарлыг хүснэгт, томьёо, график гэх мэтээр өгч болно.

Корреляцийн шинжилгээ нь бусад статистик аргуудын нэгэн адил туршилтын xi ба y i утгыг олж авсан тодорхой ерөнхий популяцид судалж буй шинж чанаруудын зан төлөвийг тодорхойлдог магадлалын загварыг ашиглахад суурилдаг. Тоон үзүүлэлтүүдийн хоорондын хамаарлыг судлахдаа утгыг хэмжүүрийн нэгжээр (метр, секунд, килограмм гэх мэт) нарийн хэмжиж болох хоёр хэмжээст хэвийн тархсан популяцийн загварыг ихэвчлэн ашигладаг. Ийм загвар нь x i ба y i хувьсагчдын хоорондын хамаарлыг тэгш өнцөгт координатын систем дэх цэгүүдийн геометрийн байршлын хэлбэрээр графикаар харуулдаг. Энэхүү график харилцааг тараах график буюу корреляцийн талбар гэж бас нэрлэдэг.
Хоёр хэмжээст хэвийн тархалтын (корреляцийн талбар) энэхүү загвар нь корреляцийн коэффициентийн тодорхой график тайлбарыг өгөх боломжийг олгодог. нийт тархалт нь таван параметрээс хамаарна: μ x, μ y - дундаж утгууд (математикийн хүлээлт); σ x ,σ y - стандарт хазайлтсанамсаргүй хэмжигдэхүүн X ба Y ба p – корреляцийн коэффициент нь X ба Y санамсаргүй хэмжигдэхүүнүүдийн хоорондын хамаарлын хэмжүүр юм.
Хэрэв p = 0 бол хоёр хэмжээст хэвийн популяциас олж авсан x i , y i утгууд нь тойргоор хязгаарлагдсан талбайн дотор х, у координатаар график дээр байрлана (Зураг 5, а). Энэ тохиолдолд X ба Y санамсаргүй хэмжигдэхүүнүүдийн хооронд хамаарал байхгүй бөгөөд тэдгээрийг хамааралгүй гэж нэрлэдэг. Хоёр хэмжээст хэвийн тархалтын хувьд хамааралгүй байдал нь X ба Y санамсаргүй хэмжигдэхүүнүүдийн бие даасан байдлыг нэгэн зэрэг илэрхийлдэг.

тоон хэмжигдэхүүнүүдийн хоорондын хамаарлыг судлах хамгийн түгээмэл аргуудын нэг юм. Үүний гол зорилго нь хоёр параметр ба түүний зэрэг хоорондын хамаарлыг олж, дараа нь тэгшитгэл гаргах явдал юм. Тухайлбал, математик, англи хэлээр шалгалт өгч тэнцсэн хүүхдүүд бий. Бид корреляцийг ашиглан нэг тестийн гүйцэтгэл өөр хичээлийн гүйцэтгэлд нөлөөлж байгаа эсэхийг тодорхойлох боломжтой. Регрессийн шинжилгээний хувьд энэ нь англи хэлний шалгалтын оноонд тулгуурлан математикийн дүнг таамаглахад тусалдаг ба эсрэгээр.

Корреляцийн график гэж юу вэ?

Аливаа шинжилгээ мэдээлэл цуглуулахаас эхэлдэг. Илүү их байх тусам эцсийн үр дүн илүү нарийвчлалтай болно. Дээрх жишээнд бид оюутнууд шалгалт өгөх ёстой хоёр салбартай. Тэдний амжилтын үзүүлэлт бол оноо юм. Корреляци ба регрессийн шинжилгээ нь нэг хичээлийн үр дүн хоёр дахь шалгалтын оноонд нөлөөлж байгаа эсэхийг харуулдаг. Энэ асуултад хариулахын тулд бүх сурагчдын дүнг зэрэгцүүлэн шинжлэх шаардлагатай. Гэхдээ эхлээд хамааралтай хувьсагчаа шийдэх хэрэгтэй. Энэ тохиолдолд энэ нь тийм ч чухал биш юм. Математикийн шалгалт өмнө нь болсон гэж бодъё. Үүн дээрх оноонууд нь бие даасан хувьсагч юм (х тэнхлэг дээр зурсан). Англи хэл нь хуваарийн дараа ордог. Тиймээс үүн дээрх оноо нь хамааралтай хувьсагч юм (ординатын тэнхлэгийн дагуу зурсан). Гарсан график нь шулуун шугамтай хэдий чинээ төстэй байх тусам сонгосон хоёр хэмжигдэхүүн хоорондын шугаман хамаарал илүү хүчтэй болно. Энэ нь математикийн хичээлээр онц сурдаг оюутнууд англи хэлний шалгалтанд А оноо авах магадлал өндөр байна гэсэн үг.

Таамаглал ба хялбаршуулсан байдал

Корреляци-регрессийн шинжилгээний арга нь шалтгаан-үр дагаврын холбоог олох явдал юм. Гэсэн хэдий ч эхний үе шатанд эдгээр хоёр хэмжигдэхүүн дэх өөрчлөлт нь судлаачийн хараахан тооцоогүй гуравдахь хэмжигдэхүүнтэй холбоотой байж магадгүй гэдгийг ойлгох хэрэгтэй. Мөн хувьсагчдын хооронд шугаман бус хамаарал байж болох тул тэгтэй тэнцүү коэффициент авах нь туршилтын төгсгөл биш юм.

Шугаман Пирсоны хамаарал

Хоёр нөхцөл хангагдсан тохиолдолд энэ коэффициентийг ашиглаж болно. Эхнийх нь хувьсагчдын бүх утгууд нь оновчтой тоонууд, хоёр дахь нь хэмжигдэхүүнүүд пропорциональ өөрчлөгдөх төлөвтэй байна. Энэ коэффициент нь үргэлж -1 ба 1 хооронд байна. Хэрэв тэгээс их бол шууд пропорциональ хамаарал байна, бага - урвуу, тэнцүү - эдгээр утгууд нь бие биедээ ямар ч байдлаар нөлөөлөхгүй. Энэ үзүүлэлтийг тооцоолох чадвар нь корреляци ба регрессийн шинжилгээний үндэс юм. Энэ коэффициентийг Карл Пирсон анх Фрэнсис Галтоны санаан дээр үндэслэн боловсруулсан.

Шинж чанар ба анхааруулга

Pearson корреляцийн коэффициент нь хүчирхэг хэрэгсэл боловч үүнийг болгоомжтой ашиглах хэрэгтэй. Үүнийг ашиглахдаа дараахь анхааруулга байдаг.

  1. Пирсоны коэффициент нь шугаман хамаарал байгаа эсэхийг харуулдаг. Корреляци ба регрессийн шинжилгээ үүгээр дуусахгүй, хувьсагчид хоорондоо хамааралтай хэвээр байна.
  2. Коэффициентийн утгыг тайлбарлахдаа болгоомжтой байх хэрэгтэй. Та хөлийн хэмжээ болон IQ түвшний хоорондын хамаарлыг олж чадна. Гэхдээ энэ нь нэг үзүүлэлт нөгөөг нь тодорхойлдог гэсэн үг биш юм.
  3. Пирсоны коэффициент нь үзүүлэлтүүдийн хоорондын шалтгаан-үр дагаврын хамаарлын талаар юу ч хэлдэггүй.

Спирманы зэрэглэлийн корреляцийн коэффициент

Хэрэв нэг үзүүлэлтийн үнэ цэнийн өөрчлөлт нь нөгөө үзүүлэлтийн үнэ цэнийн өсөлт, бууралтад хүргэдэг бол энэ нь хоорондоо холбоотой гэсэн үг юм. Корреляци-регрессийн шинжилгээ, жишээг доор өгөх болно, эдгээр үзүүлэлтүүдтэй яг холбоотой байдаг. Зэрэглэлийн коэффициент нь тооцооллыг хялбарчлах боломжийг олгодог.

Корреляци ба регрессийн шинжилгээ: жишээ

Арван аж ахуйн нэгжийн үйл ажиллагааг үнэлж байна гэж бодъё. Бидэнд оноо өгдөг хоёр шүүгч бий. Энэ тохиолдолд аж ахуйн нэгжийн корреляц ба регрессийн шинжилгээг шугаман Pearson коэффициент дээр үндэслэн хийх боломжгүй юм. Шүүгчдийн үнэлгээний харьцааг бид сонирхохгүй байна. Шүүгчдийн үнэлдэг аж ахуйн нэгжүүдийн зэрэглэл чухал.

Энэ төрлийн шинжилгээ нь дараахь давуу талуудтай.

  • Судалгаанд хамрагдсан хэмжигдэхүүнүүдийн хоорондын хамаарлын параметрийн бус хэлбэр.
  • Зэрэглэлийг өсөх эсвэл буурах дарааллаар хуваарилж болох тул хэрэглэхэд хялбар.

Энэ төрлийн шинжилгээнд тавигдах цорын ганц шаардлага бол эх өгөгдлийг хөрвүүлэх хэрэгцээ юм.

Хэрэглээний асуудлууд

Корреляци ба регрессийн шинжилгээ нь дараахь таамаглал дээр суурилдаг.

  • Ажиглалтуудыг бие даасан гэж үздэг (толгойг таван удаа авах нь дараагийн зоос шидэлтийн үр дүнд нөлөөлөхгүй).
  • Корреляцийн шинжилгээнд хоёр хувьсагчийг санамсаргүй гэж үздэг. Регрессийн хувьд зөвхөн нэг (хамааралтай) байдаг.
  • Таамаглалыг шалгахдаа хэвийн тархалтыг ажиглах ёстой. Хамаарах хувьсагчийн өөрчлөлт нь x тэнхлэг дээрх утга бүрийн хувьд ижил байх ёстой.
  • Корреляцийн диаграм нь хоёр цуврал параметрийн хоорондын хамаарлын талаарх таамаглалын эхний шалгалт болохоос шинжилгээний эцсийн үр дүн биш юм.

Шалтгаан ба хамаарал

Бид экспортын хэмжээ болон ДНБ-ий хоорондын хамаарлын коэффициентийг тооцсон гэж бодъё. Энэ нь модулийн хувьд нэгтэй тэнцүү болсон. Бид корреляци-регрессийн шинжилгээг эцэс хүртэл хийсэн үү? Мэдээж үгүй. Энэ үр дүн нь ДНБ-ийг экспортоор илэрхийлж болно гэсэн үг биш. Шалгуур үзүүлэлтүүдийн хоорондын шалтгаан-үр дагаврын хамаарлыг бид хараахан нотлоогүй байна. Корреляци-регрессийн шинжилгээ - нэг хувьсагчийн утгыг нөгөөд үндэслэн таамаглах. Гэсэн хэдий ч параметр нь ихэвчлэн олон хүчин зүйл нөлөөлдөг гэдгийг та ойлгох хэрэгтэй. Экспорт ДНБ-ийг тодорхойлдог, гэхдээ зөвхөн үүнийг биш. Бусад хүчин зүйлүүд бас бий. Дотоодын нийт бүтээгдэхүүний бусад бүрэлдэхүүн хэсгүүдэд тохируулсан ч энд хамаарал, учир шалтгааны аль аль нь байна.

Өөр нэг нөхцөл байдал илүү аюултай. Их Британид эцэг эх нь тамхи татдаг хүүхдүүд ихэвчлэн гэмт хэрэг үйлддэг гэсэн судалгааг явуулсан байна. Шалгуур үзүүлэлтүүдийн хооронд хүчтэй хамаарал байгааг үндэслэн ийм дүгнэлт хийсэн. Гэсэн хэдий ч энэ нь зөв үү? Нэгдүгээрт, харилцааг эргүүлж болно. Эцэг эхчүүд хүүхдээ байнга асуудалд оруулж, хууль зөрчиж байгаагаас болж тамхи татаж эхэлсэн байж магадгүй. Хоёрдугаарт, хоёр параметрийг гурав дахь нь тодорхойлж болно. Ийм гэр бүлүүд нь нийгмийн доод давхаргад хамаардаг бөгөөд эдгээр нь хоёр асуудалтай байдаг. Иймд хамаарал дээр үндэслэн шалтгаан, үр дагаврын холбоо байна гэж дүгнэж болохгүй.

Регрессийн шинжилгээг яагаад ашигладаг вэ?

Корреляцийн хамаарал нь хэмжигдэхүүнүүдийн хоорондын хамаарлыг олох явдал юм. Энэ тохиолдолд шалтгаан-үр дагаврын холбоо нь хөшигний ард үлддэг. Корреляци ба регрессийн шинжилгээний даалгавар нь зөвхөн хоёр хэмжигдэхүүний утгын хоорондын хамаарлыг батлах үүднээс давхцдаг. Гэвч судлаач эхэндээ шалтгаан-үр дагаврын холбоо байж болох тал дээр анхаардаггүй. Регрессийн шинжилгээнд үргэлж хоёр хувьсагч байдаг бөгөөд тэдгээрийн нэг нь хамааралтай байдаг. Энэ нь хэд хэдэн үе шаттайгаар явагддаг:

  1. Хамгийн бага квадратуудыг ашиглан зөв загварыг сонгох.
  2. Бие даасан хувьсагчийн өөрчлөлт нөгөөд үзүүлэх нөлөөг тодорхойлсон тэгшитгэлийг гаргана.

Жишээлбэл, хэрэв бид нас хүний ​​өндөрт үзүүлэх нөлөөг судалж байгаа бол регрессийн шинжилгээ нь жилийн өөрчлөлтийг урьдчилан таамаглахад тусална.

Шугаман ба олон регресс

X ба Y нь хоорондоо холбоотой хоёр хувьсагч гэж үзье. Регрессийн шинжилгээ нь тэдгээрийн аль нэгнийх нь утгыг нөгөөгийнхөө утгыг үндэслэн таамаглах боломжийг олгодог. Жишээлбэл, төлөвшил, нас нь хамааралтай шинж чанарууд юм. Тэдний хоорондын хамаарлыг шугаман регресс ашиглан тусгана. Үнэн хэрэгтээ X-г Y-ээр илэрхийлэх эсвэл эсрэгээр илэрхийлэх боломжтой. Гэхдээ ихэнхдээ регрессийн шугамын зөвхөн нэг нь зөв байдаг. Шинжилгээний амжилт нь бие даасан хувьсагчийн зөв тодорхойлолтоос ихээхэн хамаардаг. Тухайлбал, манайд тарианы ургац, хур тунадасны хэмжээ гэсэн хоёр үзүүлэлт бий. Өдөр тутмын туршлагаас харахад эхнийх нь хоёр дахь нь хамаардаг, харин эсрэгээрээ биш юм.

Олон тооны регресс нь гурав ба түүнээс дээш хувьсагчийн утгууд дээр үндэслэн үл мэдэгдэх хэмжигдэхүүнийг тооцоолох боломжийг олгодог. Жишээлбэл, нэг га талбайгаас авах будааны ургац нь үр тарианы чанар, хөрсний үржил шим, бордоо, температур, хур тунадаснаас хамаардаг. Эдгээр бүх үзүүлэлтүүд ерөнхий үр дүнд нөлөөлдөг. Загварыг хялбарчлахын тулд дараахь таамаглалыг ашиглана.

  • Бие даасан болон нөлөөлөх шинж чанаруудын хоорондын хамаарал нь шугаман шинж чанартай байдаг.
  • Олон шугаман холболтыг хассан. Энэ нь хамааралтай хувьсагчид хоорондоо хамааралгүй гэсэн үг.
  • Тооны цувааны гомоскедастик ба хэвийн байдал.

Корреляци ба регрессийн шинжилгээний хэрэглээ

Энэ аргыг ашиглах гурван үндсэн тохиолдол байдаг:

  1. Хэмжигдэхүүний хоорондын учир шалтгааны хамаарлыг шалгах. Энэ тохиолдолд судлаач хувьсагчийн утгыг тодорхойлж, тэдгээр нь хамааралтай хувьсагчийн өөрчлөлтөд нөлөөлж байгаа эсэхийг олж мэднэ. Жишээлбэл, та хүмүүст янз бүрийн тунгаар архи өгч, даралтыг нь хэмжиж болно. Энэ тохиолдолд судлаач эхнийх нь хоёр дахь шалтгаан болохоос эсрэгээр биш гэдгийг баттай мэддэг. Корреляци-регрессийн шинжилгээ нь эдгээр хоёр хувьсагчийн хооронд шууд пропорциональ шугаман хамаарлыг илрүүлж, түүнийг тодорхойлсон томьёог гаргаж авах боломжийг олгодог. Энэ тохиолдолд огт өөр хэмжүүрээр илэрхийлсэн хэмжигдэхүүнүүдийг харьцуулж болно.
  2. Шалтгаан-үр дагаврын хамаарлыг сунгахгүйгээр хоёр хувьсагчийн хоорондын хамаарлыг олох. Энэ тохиолдолд судлаач ямар хэмжигдэхүүнийг хамааралтай гэж нэрлэх нь хамаагүй. Түүнээс гадна бодит байдал дээр хоёулаа гуравдагч хувьсагчийн нөлөөнд автдаг тул пропорциональ байдлаар өөрчлөгддөг.
  3. Нэг хэмжигдэхүүний утгыг нөгөөд үндэслэн тооцоолох. Энэ нь мэдэгдэж буй тоонуудыг орлуулах тэгшитгэлийн үндсэн дээр хийгддэг.

Тиймээс корреляцийн шинжилгээнд хувьсагчдын хоорондын хамаарлыг (шалтгаан-үр дагаврын бус) олох, харин регрессийн шинжилгээнд ихэвчлэн математик функцийг ашиглан тайлбарлахыг хэлнэ.



Үүнтэй төстэй нийтлэлүүд

2024 parki48.ru. Бид хүрээ байшин барьж байна. Ландшафтын дизайн. Барилга. Суурь.