Excel дээр корреляцийн коэффициент гэж юу вэ. Корреляцийг тооцоолох, шугаман регресс байгуулах, хоёр RV-ийн хамаарлын таамаглалыг манай үйлчилгээгээр шалгах жишээ.

Өнөөдрийн өгүүллээр бид хувьсагчид хоорондоо хэрхэн холбогдож болох талаар ярих болно. Корреляцийн тусламжтайгаар бид эхний болон хоёр дахь хувьсагчийн хооронд хамаарал байгаа эсэхийг тодорхойлох боломжтой болно. Танд энэ хичээл өмнөх хичээлүүд шиг сэтгэл хөдөлгөм байх болно гэж найдаж байна!

Корреляци нь х ба у хоорондын харилцааны хүч ба чиглэлийг хэмждэг. Зурагт янз бүрийн төрлийн харилцан хамаарлыг эрэмбэлэгдсэн хосуудын (x, y) тархалтын график хэлбэрээр харуулав. Уламжлал ёсоор х-г хэвтээ тэнхлэгт, y-г босоо тэнхлэгт байрлуулна.

А график нь эерэг байдлын жишээ юм шугаман хамаарал: x нэмэгдэхийн хэрээр y нь мөн нэмэгдэж, шугаман байна. Б зурагт сөрөг шугаман корреляцийн жишээг харуулж байгаа бөгөөд х өсөх тусам у шугаман буурдаг. С график дээр бид х ба у хоёрын хооронд ямар ч хамаарал харагдахгүй байна. Эдгээр хувьсагч нь бие биедээ ямар ч байдлаар нөлөөлөхгүй.

Эцэст нь D график нь хувьсагчдын хоорондын шугаман бус харилцааны жишээ юм. x нэмэгдэхэд у эхлээд буурч, дараа нь чиглэлээ өөрчилж, нэмэгдэнэ.

Өгүүллийн үлдсэн хэсэг нь хамааралтай ба бие даасан хувьсагчдын хоорондох шугаман хамааралд зориулагдсан болно.

Корреляцийн коэффициент

Корреляцийн коэффициент r нь бие даасан болон хамааралтай хувьсагчдын хоорондын хамаарлын хүч, чиглэлийг хоёуланг нь өгдөг. R утга нь -1.0-аас +1.0 хооронд байна. r байхад эерэг утга, х ба у хоёрын хоорондын хамаарал эерэг (зураг дээрх А график), r-ийн утга сөрөг байх үед мөн хамаарал сөрөг байна (зураг Б). Корреляцийн коэффициент тэгтэй ойролцоо байгаа нь х ба у хоёрын хооронд С график байхгүй гэдгийг харуулж байна.

x ба y-ийн хоорондох холболтын хүчийг корреляцийн коэффициент - 1.0 эсвэл + - 1.0-ийн ойролцоо байдлаар тодорхойлно. Дараах зургийг судал.

А графикт r = + 1.0 үед x ба у хоёрын хоорондох төгс эерэг хамаарлыг харуулав. Б график нь r = -1.0 үед х ба у хоёрын төгс сөрөг хамаарал юм. С ба D графикууд нь хамааралтай болон бие даасан хувьсагчдын хоорондын хамаарал сул байгаагийн жишээ юм.

Корреляцийн коэффициент r нь хамааралтай болон бие даасан хувьсагчдын хоорондын хамаарлын хүч ба чиглэлийг хоёуланг нь тодорхойлдог. r утга нь -1.0 (хүчтэй сөрөг холболт) + 1.0 (хүчтэй эерэг харилцаа). r=0-ийн хувьд х ба у хоёрын хооронд ямар ч хамаарал байхгүй.

Бодит корреляцийн коэффициентийг бид дараахь тэгшитгэлийг ашиглан тооцоолж болно.

Сайн Сайн! Энэ тэгшитгэл нь ойлгомжгүй тэмдэгтүүдийн аймшигт эмх замбараагүй байдал мэт харагдаж байгааг би мэднэ, гэхдээ бид сандрахаасаа өмнө шалгалтын дүнгийн жишээг авч үзье. Оюутны статистик судлахад зарцуулсан цаг болон төгсөлтийн шалгалтын дүн хоёрын хооронд хамаарал байгаа эсэхийг тодорхойлохыг хүсч байна гэж бодъё. Доорх хүснэгт нь энэ тэгшитгэлийг хэд хэдэн энгийн тооцоолол болгон задалж, илүү хялбар болгоход тусална.

Таны харж байгаагаар хичээлийг судлахад зарцуулсан цаг болон шалгалтын дүн хоёрын хооронд маш хүчтэй эерэг хамаарал байдаг. Багш нар энэ талаар мэдэхэд маш их баяртай байх болно.

Ижил төстэй хувьсагчдын хоорондын хамаарлыг тогтоох нь ямар ашигтай вэ? Их асуулт. Хэрэв холболт байгаа нь тогтоогдвол тухайн хичээлийг судлахад зарцуулсан тодорхой тооны цаг дээр үндэслэн шалгалтын оноог урьдчилан таамаглах боломжтой. Энгийнээр хэлбэл, харилцаа хүчтэй байх тусам бидний таамаг илүү үнэн зөв байх болно.

Корреляцийн коэффициентийг тооцоолоход Excel ашиглах

Корреляцийн коэффициентүүдийн эдгээр аймшигт тооцоог үзээд та үүнийг сурснаар жинхэнэ баяр баясгаланг мэдрэх болно гэдэгт би итгэлтэй байна. Excel програмДараах шинж чанаруудтай CORREL функцээр энэ бүх ажлыг танд хийж чадна.

CORREL(1-р массив; 2-р массив),

массив 1 = эхний хувьсагчийн өгөгдлийн муж,

массив 2 = хоёр дахь хувьсагчийн өгөгдлийн муж.

Жишээлбэл, шалгалтын дүнгийн жишээний корреляцийн коэффициентийг тооцоолоход ашигласан CORREL функцийг зурагт үзүүлэв.

ЛАБОРАТОРИЙН АЖИЛ

ДАХЬ КОРРЕЛЯЦИЙН ШИНЖИЛГЭЭEXCEL

1.1 Корреляцийн шинжилгээ MS Excel дээр

Корреляцийн шинжилгээ нь X ба Y хоёр санамсаргүй хэмжигдэхүүнүүдийн хоорондын холболтын түвшинг тодорхойлоход оршино. Корреляцийн коэффициентийг ийм холболтын хэмжүүр болгон ашигладаг. Корреляцийн коэффициентийг X ба Ү хамтарсан ерөнхий популяциас авсан холбогдох хос ажиглалтын (x i , y i) n эзлэхүүний түүврээс тооцсон болно. Тоон хэмжүүрээр хэмжсэн X ба Y хоорондын хамаарлын зэргийг үнэлэхийн тулд бид ашигладаг. шугаман корреляцийн коэффициент(Пирсоны коэффициент), X ба Y дээжийг ердийн хуулийн дагуу хуваарилсан гэж үзвэл.

Корреляцийн коэффициент нь -1 (хатуу урвуу шугаман хамаарал) -аас 1 (хатуу шууд пропорциональ хамаарал) хооронд хэлбэлздэг. 0 утгын хувьд хоёр түүврийн хооронд шугаман хамаарал байхгүй.

Корреляцийн ерөнхий ангилал (Ивантер Е.В., Коросов А.В., 1992 оны дагуу):

X ба Y хувьсагчдаас хамааран хэд хэдэн төрлийн корреляцийн коэффициентүүд байдаг бөгөөд тэдгээрийг янз бүрийн масштабаар хэмжиж болно. Энэ нь тохирох корреляцийн коэффициентийн сонголтыг тодорхойлдог (Хүснэгт 13-ыг үз):

MS Excel-д хосолсон шугаман корреляцийн коэффициентийг тооцоолох тусгай функцийг ашигладаг CORREL(массив1; массив2),

туршилтын сэдвүүд

Энд массив1 нь эхний сонголтын (X) нүдний мужид хамаарах лавлагаа юм;

Жишээ 1:Сургуулийн 10 хүүхдэд харааны-дүрслэл, аман сэтгэх чадварыг шалгах тест өгсөн. Тестийн даалгавар шийдвэрлэх дундаж хугацааг секундээр хэмжсэн. Судлаач асуултыг сонирхож байна: эдгээр асуудлыг шийдвэрлэх цаг хугацааны хооронд хамаарал байна уу? Х хувьсагч нь харааны-дүрслэлийн тестийг шийдвэрлэх дундаж хугацааг, Y хувьсагч нь тестийн аман даалгаврыг шийдвэрлэх дундаж хугацааг илэрхийлнэ.

Р Шийдэл:Харилцааны түвшинг тодорхойлохын тулд юуны өмнө MS Excel хүснэгтэд өгөгдөл оруулах шаардлагатай (Хүснэгт, 1-р зургийг үз). Дараа нь корреляцийн коэффициентийн утгыг тооцоолно. Үүнийг хийхийн тулд курсорыг C1 нүдэнд байрлуул. Хэрэгслийн самбар дээрх Insert Function (fx) товчийг дарна уу.

Гарч ирэх функцийн шидтэн харилцах цонхноос ангиллыг сонгоно уу Статистикболон функц КОРРЕЛ, дараа нь OK дарна уу. Хулганы заагчийг ашиглан массив1 талбарт (A1:A10) түүвэр өгөгдлийн мужийг оруулна уу. Массив2 талбарт Y (B1:B10) өгөгдлийн жишээ мужийг оруулна. OK дарна уу. С1 нүдэнд корреляцийн коэффициентийн утга гарч ирнэ - 0.54119. Дараа нь та корреляцийн коэффициентийн үнэмлэхүй тоог харж, харилцааны төрлийг (ойр, сул, дунд гэх мэт) тодорхойлох хэрэгтэй.

Цагаан будаа. 1. Корреляцийн коэффициентийг тооцсон үр дүн

Тиймээс тестийн харааны-дүрслэлийн болон аман даалгавруудыг шийдвэрлэх цаг хугацааны хоорондын хамаарал нотлогдоогүй байна.

Дасгал 1.Газар тариалангийн 20 аж ахуйн нэгжийн мэдээлэл байгаа. Хай корреляцийн коэффициентүр тарианы ургац ба газрын чанар хоорондын уялдаа холбоо, ач холбогдлыг үнэлнэ. Өгөгдлийг хүснэгтэд үзүүлэв.

Хүснэгт 2. Үр тарианы ургацын газрын чанараас хамаарал

байшин дугаар

Газрын чанар, оноо

Бүтээмж, ц/га


Даалгавар 2.Спортын фитнесс машины ажиллах хугацаа (мянган цаг) ба засварын зардал (мянган рубль) хооронд хамаарал байгаа эсэхийг тодорхойлно уу:

Симуляторын ажиллах хугацаа (мянган цаг)

Засварын зардал (мянган рубль)

1.2 MS Excel програмын олон корреляци

At их тооАжиглалтын явцад корреляцийн коэффициентийг хэд хэдэн түүврийн хувьд дараалан тооцоолох шаардлагатай бол тав тухтай байдлыг хангах үүднээс үр дүнгийн коэффициентийг хүснэгтэд нэгтгэн харуулав. корреляцийн матрицууд.

Корреляцийн матрицнь харгалзах мөр, баганын огтлолцол дээр харгалзах параметрүүдийн хоорондын хамаарлын коэффициент байх дөрвөлжин хүснэгт юм.

MS Excel-д уг процедурыг корреляцийн матрицыг тооцоолоход ашигладаг хамааралбагцаас Мэдээллийн дүн шинжилгээ хийх.Уг процедур нь янз бүрийн параметрүүдийн хоорондын хамаарлын коэффициентийг агуулсан корреляцийн матрицыг олж авах боломжийг олгодог.

Процедурыг хэрэгжүүлэхийн тулд та дараахь зүйлийг хийх ёстой.

1. командыг ажиллуулах Үйлчилгээ - Шинжилгээ өгөгдөл;

2. гарч ирэх жагсаалтад Шинжилгээний хэрэгслүүдмөр сонгох Корреляциболон товчийг дарна уу БОЛЖ БАЙНА УУ;

3. Гарч ирэх харилцах цонхонд зааж өгнө үү оролтын интервал, өөрөөр хэлбэл дүн шинжилгээ хийсэн өгөгдлийг агуулсан нүднүүдийн холбоосыг оруулна уу. Оролтын интервал нь дор хаяж хоёр багана агуулсан байх ёстой.

4. хэсэг бүлэглэхоруулсан өгөгдлийн дагуу шилжүүлэгчийг тохируулах (багана эсвэл мөрөөр);

5. заана амралтын өдөр интервал, өөрөөр хэлбэл, шинжилгээний үр дүнг харуулах нүдний лавлагааг оруулна. Гаралтын хүрээний хэмжээг автоматаар тодорхойлох бөгөөд гаралтын муж нь эх өгөгдөлтэй давхцаж болзошгүй тохиолдолд дэлгэцэн дээр мессеж гарч ирнэ. Дарах товчлуур БОЛЖ БАЙНА УУ.

Гаралтын мужид корреляцийн матриц харагдах бөгөөд мөр, багана бүрийн огтлолцол дээр харгалзах параметрүүдийн хоорондын хамаарлын коэффициент байдаг. Оролтын муж дахь багана бүр өөртэйгээ бүрэн хамааралтай тул мөр, баганын ижил координаттай гаралтын муж дахь нүднүүд 1-ийн утгыг агуулна.

Жишээ 2Цаг агаарын нөхцөл байдлыг ажиглах, музей, цэцэрлэгт хүрээлэнд зочлоход зориулсан сар бүрийн мэдээллийг авах боломжтой (Хүснэгт 3-ыг үзнэ үү). Цаг агаарын байдал, музей, цэцэрлэгт хүрээлэнгийн ирц хоёрын хооронд хамаарал байгаа эсэхийг тогтоох шаардлагатай.

Хүснэгт 3. Ажиглалтын үр дүн

Цэвэр өдрүүдийн тоо

Музейн үзэгчдийн тоо

Паркийн зочдын тоо

Шийдэл. Корреляцийн шинжилгээг хийхийн тулд A1:G3 мужид анхны өгөгдлийг оруулна (Зураг 2). Дараа нь цэс дээр Үйлчилгээзүйл сонгох Шинжилгээ өгөгдөлдараа нь мөрийг нэмнэ Корреляци. Гарч ирэх харилцах цонхонд оруулна уу оролтын интервал(A2:C7). Өгөгдлийг баганаар авч үзэхийг зааж өгнө үү. Гаралтын мужийг (E1) зааж өгөөд товчлуурыг дарна уу БОЛЖ БАЙНА УУ.

Зураг дээр. 33-аас харахад цаг агаарын нөхцөл байдал, музейн ирцийн хоорондын хамаарал -0.92, цаг агаарын нөхцөл байдал, цэцэрлэгт хүрээлэнгийн ирц хоорондын хамаарал - 0.97, цэцэрлэгт хүрээлэн, музейн ирцийн хоорондын хамаарал - 0.92 байна.

Ийнхүү шинжилгээний үр дүнд музейн ирц ба нартай өдрүүдийн хооронд хүчтэй урвуу шугаман хамаарал, цэцэрлэгт хүрээлэнгийн ирц, цаг агаарын нөхцөл байдлын хооронд бараг шугаман (маш хүчтэй шууд) хамаарал илэрсэн. Музей болон цэцэрлэгт хүрээлэнгийн ирцийн хооронд хүчтэй урвуу хамаарал байдаг.

Цагаан будаа. 2. 2-р жишээнээс корреляцийн матрицыг тооцсон үр дүн

Даалгавар 3. Удирдагчийн зан чанарын сэтгэлзүйн шинж чанарыг шинжээчийн үнэлгээний аргачлалын дагуу 10 менежерийг үнэлэв. 15 шинжээч сэтгэлзүйн шинж чанар бүрийг таван онооны системээр үнэлэв (Хүснэгт 4-ийг үз). Удирдагчийн эдгээр шинж чанарууд хоорондоо ямар холбоотой вэ гэсэн асуултыг сэтгэл судлаач сонирхож байна.

Хүснэгт 4. Судалгааны үр дүн

Сэдвүүд p / p

тактик

нямбай байдал

шүүмжлэл

Корреляцийн шинжилгээ нь нэг үзүүлэлтийн нөгөө үзүүлэлтээс хамаарлын түвшинг тодорхойлоход хэрэглэгддэг түгээмэл статистик судалгааны арга юм. AT Microsoft Excelболомжтой тусгай хэрэгсэлЭнэ төрлийн шинжилгээг хийхэд зориулагдсан. Энэ функцийг хэрхэн ашиглах талаар олж мэдье.

Корреляцийн шинжилгээний мөн чанар

Корреляцийн шинжилгээний зорилго нь хоорондын хамаарал байгаа эсэхийг тодорхойлох явдал юм янз бүрийн хүчин зүйлүүд. Өөрөөр хэлбэл, нэг үзүүлэлтийн бууралт, өсөлт нь нөгөө үзүүлэлтийн өөрчлөлтөд нөлөөлж байгаа эсэхийг тодорхойлдог.

Хэрэв хамаарал тогтоогдвол корреляцийн коэффициентийг тодорхойлно. Дургүй регрессийн шинжилгээ, энэ нь статистик судалгааны энэ аргын тооцоолсон цорын ганц үзүүлэлт юм. Корреляцийн коэффициент нь +1-ээс -1 хооронд хэлбэлздэг. Хэрэв эерэг хамаарал байгаа бол нэг үзүүлэлтийн өсөлт нь хоёр дахь үзүүлэлтийн өсөлтөд нөлөөлдөг. Сөрөг хамааралтай бол нэг үзүүлэлтийн өсөлт нь нөгөө үзүүлэлт буурахад хүргэдэг. Корреляцийн коэффициентийн модуль их байх тусам нэг үзүүлэлтийн өөрчлөлт нь хоёр дахь үзүүлэлтийн өөрчлөлтөд илүү мэдэгдэхүйц байх болно. 0-тэй тэнцүү коэффициенттэй бол тэдгээрийн хоорондын хамаарал бүрэн байхгүй болно.

Корреляцийн коэффициентийн тооцоо

Одоо корреляцийн коэффициентийг тооцоолохыг хичээцгээе тодорхой жишээ. Бид зар сурталчилгааны зардал, борлуулалтын хэмжээг сар бүр тусад нь баганад будсан хүснэгттэй. Борлуулалтын тоо хэмжээнээс хамаарах зэргийг бид олж мэдэх ёстой МөнгөЭнэ нь сурталчилгаанд зарцуулагдсан.

Арга 1: Функцийн шидтэний тусламжтайгаар хамаарлыг тодорхойлох

Корреляцийн шинжилгээ хийх нэг арга бол CORREL функцийг ашиглах явдал юм. Функц нь өөрөө байдаг ерөнхий хэлбэр CORREL(массив1, массив2).

  1. Тооцооллын үр дүнг харуулах нүдийг сонгоно уу. Томъёоны мөрний зүүн талд байрлах "Функц оруулах" товчийг дарна уу.
  2. Function Wizard цонхонд гарч буй жагсаалтаас CORREL функцийг хайж олоорой. "OK" товчийг дарна уу.
  3. Функцийн аргументуудын цонх нээгдэнэ. "Массив1" талбарт хамаарлыг тодорхойлох ёстой утгуудын аль нэгний нүдний мужуудын координатыг оруулна уу. Манай тохиолдолд эдгээр нь "Борлуулалтын дүн" баганад байгаа утгууд байх болно. Талбарт массивын хаягийг оруулахын тулд дээрх баганад байгаа өгөгдөл бүхий бүх нүдийг сонгоход хангалттай.

    "Массив2" талбарт та хоёр дахь баганын координатыг оруулах хэрэгтэй. Бидэнд сурталчилгааны зардал бий. Өмнөх тохиолдлын нэгэн адил бид өгөгдлийг талбарт оруулна.

    "OK" товчийг дарна уу.

Таны харж байгаагаар тоо хэлбэрээр корреляцийн коэффициент нь бидний өмнө нь сонгосон нүдэнд харагдана. AT Энэ тохиолдолдэнэ нь 0.97-тэй тэнцүү бөгөөд энэ нь нэг хэмжигдэхүүн нөгөө хэмжигдэхүүнээс хамааралтай байгаагийн маш өндөр шинж юм.

Арга 2: Шинжилгээний багцыг ашиглан хамаарлыг тооцоол

Нэмж дурдахад шинжилгээний багцад өгөгдсөн хэрэгслүүдийн аль нэгийг ашиглан корреляцийг тооцоолж болно. Гэхдээ эхлээд бид энэ хэрэгслийг идэвхжүүлэх хэрэгтэй.

  1. "Файл" таб руу очно уу.
  2. Нээгдсэн цонхонд "Тохиргоо" хэсэгт очно уу.
  3. Дараа нь "Нэмэлт" зүйл рүү очно уу.
  4. Доод хэсэгт дараагийн цонх"Менежмент" хэсэгт шилжүүлэгч өөр байрлалд байгаа бол "Excel нэмэлт" байрлал руу шилжүүлнэ үү. "OK" товчийг дарна уу.
  5. Нэмэлтүүдийн цонхонд "Шинжилгээний багц" зүйлийн хажууд байгаа нүдийг шалгана уу. "OK" товчийг дарна уу.
  6. Үүний дараа шинжилгээний багц идэвхждэг. "Өгөгдөл" таб руу очно уу. Таны харж байгаагаар туузан дээр шинэ хэрэгслүүд гарч ирэв - "Шинжилгээ". Тэнд байрлах "Өгөгдлийн шинжилгээ" товчийг дарна уу.
  7. Жагсаалт дараах байдлаар нээгдэнэ янз бүрийн сонголтуудмэдээллийн дүн шинжилгээ хийх. "Харилцаа"-г сонгоно уу. "OK" товчийг дарна уу.
  8. Корреляцийн шинжилгээний параметр бүхий цонх нээгдэнэ. Өмнөх аргаас ялгаатай нь "Оролтын интервал" талбарт бид интервалыг багана тус бүрээр биш, харин дүн шинжилгээнд оролцож буй бүх баганын хувьд оруулна. Манай тохиолдолд энэ нь "Зар сурталчилгаа" ба "Борлуулалт" баганад байгаа өгөгдөл юм.

    Манай мэдээллийн бүлгүүд хоёр баганад хуваагддаг тул бид "Бүлэглэх" параметрийг өөрчлөхгүй - "Баганаар" үлдээдэг. Хэрэв тэдгээр нь шугамаар тасархай байсан бол шилжүүлэгчийг "Мөрөөр" байрлал руу шилжүүлэх хэрэгтэй.

    Анхдагч байдлаар, гаралтын сонголтыг "Шинэ ажлын хуудас" гэж тохируулсан бөгөөд өөрөөр хэлбэл өгөгдлийг өөр хуудсан дээр харуулах болно. Шилжүүлэгчийг хөдөлгөж байршлыг өөрчилж болно. Энэ нь одоогийн хуудас (дараа нь та мэдээллийн гаралтын нүднүүдийн координатыг зааж өгөх шаардлагатай) эсвэл шинэ ажлын ном (файл) байж болно.

    Бүх тохиргоо хийгдсэн бол "OK" товчийг дарна уу.

Шинжилгээний үр дүнгийн гаралтын байршлыг анхдагчаар үлдээсэн тул бид руу шилжинэ шинэ навч. Таны харж байгаагаар корреляцийн коэффициент энд байна. Мэдээжийн хэрэг, энэ нь эхний аргыг ашиглахтай адил юм - 0.97. Учир нь энэ хоёр сонголт хоёулаа ижил тооцоолол хийдэг тул тэдгээрийг өөр өөр аргаар хийж болно.

Таны харж байгаагаар Excel програм нь корреляцийн шинжилгээний хоёр аргыг нэгэн зэрэг санал болгодог. Тооцооллын үр дүн, хэрэв та бүх зүйлийг зөв хийвэл бүрэн ижил байх болно. Гэхдээ хэрэглэгч бүр өөрт нь илүү тохиромжтой тооцооны сонголтыг сонгох боломжтой.

Бид танд асуудлыг шийдвэрлэхэд тусалж чадсандаа баяртай байна.

Асуудлын мөн чанарыг нарийвчлан тайлбарлаж, тайлбар дээр асуултаа асуугаарай. Манай мэргэжилтнүүд аль болох хурдан хариулахыг хичээх болно.

Энэ нийтлэл танд тусалсан уу?

Регресс ба корреляцийн шинжилгээ - статистикийн аргуудсудалгаа. Эдгээр нь нэг буюу хэд хэдэн бие даасан хувьсагчаас параметрийн хамаарлыг харуулах хамгийн түгээмэл арга юм.

Тодорхой талаар доор практик жишээнүүдЭдийн засагчдын дунд маш их алдартай эдгээр хоёр шинжилгээг авч үзье. Тэдгээрийг нэгтгэх үед бид үр дүнг олж авах жишээг өгөх болно.

Excel дээрх регрессийн шинжилгээ

Зарим утгуудын (бие даасан, бие даасан) хамааралтай хувьсагчид үзүүлэх нөлөөллийг харуулна. Тухайлбал, эдийн засгийн идэвхтэй хүн амын тоо нь аж ахуйн нэгжийн тоо, цалин хөлс, бусад үзүүлэлтээс хэрхэн хамаардаг. Эсвэл: гадаадын хөрөнгө оруулалт, эрчим хүчний үнэ зэрэг нь ДНБ-ий түвшинд хэрхэн нөлөөлдөг вэ.

Шинжилгээний үр дүн нь танд тэргүүлэх ач холбогдол өгөх боломжийг олгодог. Мөн үндсэн хүчин зүйл дээр үндэслэн, урьдчилан таамаглах, хөгжлийг төлөвлөх тэргүүлэх чиглэлүүдудирдлагын шийдвэр гаргах.

Регресс тохиолддог:

  • шугаман (y = a + bx);
  • параболик (y = a + bx + cx2);
  • экспоненциал (y = a * exp(bx));
  • хүч (y = a*x^b);
  • гипербол (y = b/x + a);
  • логарифм (y = b * 1n(x) + a);
  • экспоненциал (y = a * b^x).

Excel дээр регрессийн загварыг бий болгож, үр дүнг тайлбарлах жишээг авч үзье. Шугаман төрлийн регрессийг авч үзье.

Даалгавар. 6 аж ахуйн нэгжид сарын дундаж цалинтэтгэвэрт гарсан ажилчдын тоо. Тэтгэвэрт гарсан ажилчдын тоо дундаж цалингаас хамаарах эсэхийг тодорхойлох шаардлагатай.

Загвар шугаман регрессдараах хэлбэртэй байна:

Y \u003d a0 + a1x1 + ... + ахк.

a нь регрессийн коэффициент, х нь нөлөөлөх хувьсагч, k нь хүчин зүйлийн тоо юм.

Бидний жишээн дээр Y нь ажлаас халагдсан ажилчдын үзүүлэлт юм. Нөлөөлөх хүчин зүйл нь цалин (x) юм.

Excel нь шугаман регрессийн загварын параметрүүдийг тооцоолоход ашиглаж болох суулгасан функцуудтай. Гэхдээ Analysis ToolPak нэмэлт нь үүнийг илүү хурдан хийх болно.

Хүчирхэг аналитик хэрэгслийг идэвхжүүлэх:

  1. "Оффис" товчийг дараад "Excel Options" таб руу очно уу. "Нэмэлтүүд".
  2. Доод талд нь унждаг жагсаалтын доор "Удирдах" талбарт "Excel Нэмэлтүүд" гэсэн бичээс байх болно (хэрэв байхгүй бол баруун талд байгаа чагт дээр дарж сонгоно уу). Мөн Go товчлуур. дарна уу.
  3. Боломжтой нэмэлтүүдийн жагсаалт нээгдэнэ. "Шинжилгээний багц" -ыг сонгоод OK дарна уу.

Идэвхжүүлсний дараа нэмэлтийг Мэдээллийн табын доор ашиглах боломжтой болно.

Одоо бид регрессийн шинжилгээг шууд авч үзэх болно.

  1. Өгөгдлийн шинжилгээний хэрэгслийн цэсийг нээнэ үү. "Регресс"-ийг сонгоно уу.
  2. Оролтын утга ба гаралтын сонголтыг сонгох цэс нээгдэнэ (үр дүнг хаана харуулах). Анхны өгөгдлийн талбаруудад тайлбарласан параметрийн хүрээ (Y) ба түүнд нөлөөлж буй хүчин зүйлийг (X) заана. Үлдсэн хэсэг нь дуусаагүй ч байж болно.
  3. OK товчийг дарсны дараа програм нь тооцооллыг шинэ хуудсан дээр харуулах болно (та одоогийн хуудсан дээр харуулах интервалыг сонгох эсвэл гаралтыг шинэ ажлын дэвтэрт оноож болно).

Юуны өмнө бид R квадрат болон коэффициентуудад анхаарлаа хандуулдаг.

R-квадрат нь детерминацын коэффициент юм. Бидний жишээнд 0.755 буюу 75.5% байна. Энэ нь тийм гэсэн үг дизайны параметрүүдзагварууд нь судалж буй параметрүүдийн хоорондын хамаарлыг 75.5% -иар тайлбарлаж байна. Детерминацийн коэффициент өндөр байх тусам загвар нь илүү сайн байх болно. Сайн - 0.8-аас дээш. Муу - 0.5-аас бага (ийм дүн шинжилгээг үндэслэлтэй гэж үзэх боломжгүй). Бидний жишээнд - "муу биш".

64.1428 коэффициент нь авч үзэж буй загвар дахь бүх хувьсагчид 0-тэй тэнцүү байвал Y ямар байхыг харуулдаг. Өөрөөр хэлбэл, загварт тайлбарлагдаагүй бусад хүчин зүйлүүд мөн шинжлэгдсэн параметрийн утгад нөлөөлдөг.

Коэффициент -0.16285 нь Х хувьсагчийн Y дээрх жинг харуулж байна. Өөрөөр хэлбэл, энэ загварт багтсан сарын дундаж цалин нь -0.16285 жинтэй (энэ нь бага хэмжээний нөлөөлөл юм) ажлаас халагдсан хүмүүсийн тоонд нөлөөлдөг. "-" тэмдэг нь заана муу нөлөө: цалин өндөр байх тусам ажлаасаа гарах нь бага. Аль нь шударга вэ.

Excel дэх корреляцийн шинжилгээ

Корреляцийн шинжилгээ нь нэг эсвэл хоёр түүврийн үзүүлэлтүүдийн хооронд хамаарал байгаа эсэхийг тогтооход тусалдаг. Жишээлбэл, машины ашиглалтын хугацаа болон засварын зардал, тоног төхөөрөмжийн үнэ ба ашиглалтын хугацаа, хүүхдийн өндөр, жин гэх мэт.

Хэрэв хамаарал байгаа бол нэг параметрийн өсөлт нь нөгөө үзүүлэлтийн өсөлт (эерэг хамаарал) эсвэл буурах (сөрөг) болж байна уу. Корреляцийн шинжилгээ нь шинжээчдэд нэг үзүүлэлтийн үнэ цэнэ нь нөгөө үзүүлэлтийн боломжит утгыг урьдчилан таамаглаж чадах эсэхийг тодорхойлоход тусалдаг.

Корреляцийн коэффициентийг r гэж тэмдэглэнэ. +1-ээс -1 хооронд хэлбэлздэг. Корреляцийн ангилал өөр өөр газар нутагөөр байх болно. Коэффицентийн утга 0 байх үед түүврийн хооронд шугаман хамаарал байхгүй болно.

Хэрхэн ашиглахыг харцгаая Excel хэрэгслүүдкорреляцийн коэффициентийг ол.

CORREL функцийг хосолсон коэффициентийг олоход ашигладаг.

Даалгавар: Ажлын цаг хоорондын хамаарал байгаа эсэхийг тодорхойлох токарьболон түүний засвар үйлчилгээний зардал.

Курсорыг дурын нүдэнд тавиад fx товчийг дарна уу.

  1. "Статистик" ангилалд CORREL функцийг сонгоно уу.
  2. Аргумент "Масив 1" - утгын эхний муж - машины цаг: A2: A14.
  3. Аргумент "Масив 2" - утгын хоёр дахь муж - засварын зардал: B2: B14. OK дарна уу.

Холболтын төрлийг тодорхойлохын тулд та коэффициентийн үнэмлэхүй тоог харах хэрэгтэй (үйл ажиллагааны талбар бүр өөрийн гэсэн масштабтай).

Хэд хэдэн параметрийн (2-оос дээш) корреляцийн шинжилгээ хийхдээ "Өгөгдлийн шинжилгээ" ("Шинжилгээний багц" нэмэлт) ашиглах нь илүү тохиромжтой. Жагсаалтаас та хамаарлыг сонгож, массивыг зааж өгөх хэрэгтэй. Бүгд.

Үр дүнгийн коэффициентүүд нь корреляцийн матрицад харагдах болно. Үүнтэй адил:

Корреляци-регрессийн шинжилгээ

Практикт эдгээр хоёр аргыг ихэвчлэн хамт ашигладаг.

  1. Бид корреляцийн талбарыг бий болгодог: "Оруулах" - "Диаграмм" - "Тараах график" (хосыг харьцуулах боломжийг танд олгоно). Утгын муж нь хүснэгтийн бүх тоон өгөгдөл юм.
  2. Диаграмын аль ч цэг дээр хулганы зүүн товчийг дарна уу. Дараа нь зөв. Нээгдсэн цэснээс "Тренд шугам нэмэх" гэснийг сонгоно уу.
  3. Шугамын параметрүүдийг оноох. Төрөл - "шугаман". Доод талд - "Тэгшитгэлийг диаграммд харуул."
  4. "Хаах" дээр дарна уу.

Одоо регрессийн шинжилгээний өгөгдөл харагдаж байна.

1. Excel програмыг нээнэ үү

2. Өгөгдөл бүхий багана үүсгэх. Бидний жишээн дээр бид нэгдүгээр ангийн сурагчдын түрэмгий зан, өөртөө эргэлзэх хоёрын хоорондын хамаарлыг авч үзэх болно. Туршилтанд 30 хүүхэд оролцсон бөгөөд өгөгдлийг Excel хүснэгтэд үзүүлэв.

1 багана - сэдвийн дугаар

2-р багана - онооны түрэмгий байдал

3 багана - оноогоор өөртөө эргэлзэх

3. Дараа нь та хүснэгтийн хажууд байгаа хоосон нүдийг сонгоод дүрс дээр дарах хэрэгтэй f(x) Excel самбар дээр

4. Сонгох шаардлагатай ангиллуудын дотроос функцуудын цэс нээгдэнэ Статистик, дараа нь функцуудын жагсаалтаас цагаан толгойн дарааллаар олоорой КОРРЕЛболон OK дарна уу

5. Дараа нь функцийн аргументуудын цэс нээгдэх бөгөөд энэ нь бидэнд хэрэгтэй өгөгдлийн баганыг сонгох боломжийг олгоно. Эхний баганыг сонгохын тулд Түрэмгий байдалта мөрний хажууд байгаа цэнхэр товчлуур дээр дарах хэрэгтэй Массив1

6. Өгөгдлийг сонгоцгооё массив1баганаас Түрэмгий байдалмөн харилцах цонхон дээрх цэнхэр товчлуур дээр дарна уу

7. Дараа нь 1-р массивын адил мөрний хажууд байрлах цэнхэр товчлуур дээр дарна Массив 2

8. Өгөгдлийг сонгоцгооё массив2- багана Өөрийгөө үнэлэх чадвар дутмагдахин цэнхэр товчийг дараад OK дарна уу

9.Энд r-Пирсон корреляцийн коэффициентийг тооцож сонгосон нүдэнд бичнэ.Манай тохиолдолд эерэг ба ойролцоогоор тэнцүү байна. Энэ тухай ярьж байна дунд зэргийн эерэгНэгдүгээр ангийн сурагчдын түрэмгий зан, өөртөө эргэлзэх хоёрын хоорондын холбоо

Энэ замаар, статистик дүгнэлтТуршилт нь: r = 0.225, хувьсагчдын хооронд дунд зэргийн эерэг хамаарал илэрсэн. түрэмгий байдалболон өөрийгөө үнэлэх чадвар дутмаг.

Зарим судалгаанд корреляцийн коэффициентийн р-ийн ач холбогдлын түвшинг зааж өгөх шаардлагатай байдаг боловч Excel нь SPSS-ээс ялгаатай нь ийм боломжийг олгодоггүй. Зүгээр дээ, корреляцийн чухал утгуудын хүснэгтүүд байдаг (А.Д. Наследов).

Та мөн Excel дээр регрессийн шугамыг байгуулж, судалгааны үр дүнд хавсаргаж болно.

Корреляцийн коэффициент ба ковариацыг тооцоолъё янз бүрийн төрөлсанамсаргүй хэмжигдэхүүнүүдийн хамаарал.

Корреляцийн коэффициент(корреляцийн шалгуур Пирсон, Англи Pearson Бүтээгдэхүүний Моментийн корреляцийн коэффициент)зэргийг тодорхойлдог шугамансанамсаргүй хэмжигдэхүүнүүдийн хоорондын хамаарал.

Тодорхойлолтоос харахад тооцоолох корреляцийн коэффициент X ба Y санамсаргүй хэмжигдэхүүний тархалтыг мэдэх шаардлагатай. Хэрэв тархалт нь тодорхойгүй бол тооцоолох корреляцийн коэффициенташигласан түүвэрлэлтийн хурдхамааралr (гэж бас нэрлэдэг Rxy эсвэл rxy) :

хаана Sx - стандарт хэлбэлзэлдээж санамсаргүй хувьсагч x, томъёогоор тооцоолсон:

Тооцоолох томъёоноос харж болно хамаарал, хуваагч (стандарт хазайлтын үржвэр) нь тоологчийг энгийнээр хэвийн болгодог хамаарал-1-ээс 1 хүртэлх хэмжээсгүй тоо болж хувирна. Корреляциболон ковариацижил мэдээллийг өгөх (хэрэв мэдэгдэж байгаа бол стандарт хазайлт ), гэхдээ хамааралашиглахад илүү тохиромжтой, учир нь энэ нь хэмжээсгүй юм.

Тооцоол корреляцийн коэффициентболон түүвэр ковариац MS EXCEL дээр CORREL() болон COVAR() тусгай функцууд байдаг тул энэ нь тийм ч хэцүү биш юм. Хүлээн авсан утгыг хэрхэн тайлбарлахыг олж мэдэх нь илүү хэцүү байдаг тул нийтлэлийн ихэнх хэсэг нь үүнд зориулагдсан болно.

Онолын ухралт

Үүнийг эргэн сана хамааралгэсэн баримтаас бүрдэх статистик харилцаа гэж нэрлэдэг өөр өөр утгатайнэг хувьсагч өөр өөртэй тохирч байна дундөөр утгууд (X-ийн утгын өөрчлөлттэй гэсэн үг Y тогтмол байдлаар өөрчлөгддөг). гэж таамаглаж байна хоёулаа X ба Y хувьсагчууд Санамсаргүйутгууд болон тэдгээртэй харьцуулахад санамсаргүй тархалттай байна дундаж утга.

Анхаарна уу. Хэрэв зөвхөн нэг хувьсагч, жишээлбэл, Y нь санамсаргүй шинж чанартай бөгөөд нөгөөгийнх нь утгууд нь тодорхойлогддог (судлаач тогтоосон) бол бид зөвхөн регрессийн тухай ярьж болно.

Тиймээс, жишээлбэл, жилийн дундаж температурын хамаарлыг судлахдаа ярих боломжгүй юм хамааралтемператур, ажиглалтын жил, үүний дагуу үзүүлэлтүүдийг хэрэглэнэ хамааралтус тусын тайлбарын хамт.

хамааралХувьсагчдын хооронд хэд хэдэн аргаар тохиолдож болно:

  1. Хувьсагчдын хооронд учир шалтгааны хамаарал байгаа эсэх. Тухайлбал, шинжлэх ухааны судалгаанд оруулсан хөрөнгө оруулалтын хэмжээ (х хувьсагч Х) болон хүлээн авсан патентын тоо (Y). Эхний хувьсагч дараах байдлаар харагдана бие даасан хувьсагч (хүчин зүйл), хоёрдугаарт - хамааралтай хувьсагч (үр дүн). Хэмжигдэхүүний хамаарал нь тэдгээрийн хоорондын хамаарал байгаа эсэхийг тодорхойлдог боловч эсрэгээр биш гэдгийг санах нь зүйтэй.
  2. Коньюгаци байгаа эсэх (нийтлэг шалтгаан). Жишээлбэл, байгууллагын өсөлтийг дагаад цалингийн сан (PAY) болон байр түрээслэх зардал өсдөг. Байр түрээслэх нь цалингаас хамаарна гэж үзэх нь мэдээжийн хэрэг. Эдгээр хоёр хувьсагч нь ихэнх тохиолдолд ажилчдын тооноос шугаман хамааралтай байдаг.
  3. Хувьсагчдын харилцан нөлөөлөл (нэг хувьсагч өөрчлөгдөхөд хоёр дахь хувьсагч өөрчлөгдөх ба эсрэгээр). Энэ аргын хувьд асуудлын хоёр томъёоллыг зөвшөөрнө; Аливаа хувьсагч нь бие даасан хувьсагч ба хамааралтай хувьсагчийн үүрэг гүйцэтгэдэг.

Энэ замаар, корреляцийн индексхэр хүчтэй байгааг харуулж байна шугаман хамааралхоёр хүчин зүйлийн хооронд (хэрэв байгаа бол) ба регресс нь нэг хүчин зүйлийг нөгөөгөөр нь таамаглах боломжийг олгодог.

Корреляци, бусад статистикийн нэгэн адил зөв програмашигтай байж болох ч ашиглахад хязгаарлалттай байдаг. Хэрэв энэ нь тодорхой харагдаж байвал шугаман хамааралэсвэл харилцааны бүрэн дутагдал, тэгвэл хамааралгайхалтай тусгалаа. Гэхдээ хэрэв өгөгдөл нь шугаман бус хамаарлыг харуулсан бол (жишээлбэл, квадрат), тусдаа бүлгүүд эсвэл хэт давчуу үзүүлэлтүүд байгаа бол тооцоолсон утга корреляцийн коэффициенттөөрөгдүүлсэн байж болно (жишээ файлыг үзнэ үү).

Корреляци 1-тэй ойролцоо буюу -1 (өөрөөр хэлбэл үнэмлэхүй утгаараа 1-тэй ойролцоо) нь хувьсагчдын хүчтэй шугаман хамаарлыг, 0-тэй ойролцоо утга нь хамааралгүй байгааг илтгэнэ. Эерэг хамааралнэг үзүүлэлтийн өсөлтөөр нөгөө үзүүлэлт нь дунджаар нэмэгдэж, сөрөг үзүүлэлттэй байвал буурна гэсэн үг.

Корреляцийн коэффициентийг тооцоолохын тулд тохирох хувьсагчид дараахь нөхцлийг хангасан байх шаардлагатай.

  • хувьсагчийн тоо хоёртой тэнцүү байх ёстой;
  • хувьсагч нь тоон шинж чанартай байх ёстой (жишээлбэл, давтамж, жин, үнэ). Эдгээр хувьсагчийн тооцоолсон дундаж утга нь: дундаж үнээсвэл дундаж жинтэвчээртэй. Тоон хувьсагчдаас ялгаатай нь чанарын (нэрлэсэн) хувьсагч нь зөвхөн хязгаарлагдмал ангиллын багцаас (жишээлбэл, хүйс эсвэл цусны бүлэг) утгыг авдаг. Тоон утгыг эдгээр утгуудтай нөхцөлт байдлаар харьцуулдаг (жишээлбэл, эмэгтэй - 1, эрэгтэй - 2). Энэ тохиолдолд тооцоо хийх нь тодорхой байна дундаж утга, үүнийг олох шаардлагатай хамаарал, буруу байгаа нь тооцоолол нь хамаарал;
  • хувьсагч нь санамсаргүй бөгөөд байх ёстой .

Хоёр хэмжээст өгөгдөл нь өөр бүтэцтэй байж болно. Тэдгээрийн зарим нь ажиллахын тулд тусгай арга барил шаарддаг:

  • Шугаман бус өгөгдлийн хувьд хамааралболгоомжтой хэрэглэх хэрэгтэй. Зарим асуудлын хувьд нэг буюу хоёр хувьсагчийг шугаман хамаарлыг олж авахын тулд хувиргах нь ашигтай байж болох юм (энэ нь хүссэн хувиргалтын төрлийг санал болгохын тулд шугаман бус харилцааны хэлбэрийн талаар таамаглал гаргах шаардлагатай).
  • Ашиглах замаар тараах графикуудзарим өгөгдөлд тэгш бус хэлбэлзэл (тараа) ажиглагдаж болно. Тэгш бус хэлбэлзэлтэй холбоотой асуудал бол хэлбэлзэл ихтэй газрууд нь хамгийн бага үнэн зөв мэдээлэл өгөхөөс гадна хамгийн их нөлөөтооцоолох үед статистик үзүүлэлтүүд. Энэ асуудлыг ихэвчлэн логарифм ашиглах гэх мэт өгөгдлийг хувиргах замаар шийддэг.
  • Зарим өгөгдөлд бөөгнөрөл ажиглагдаж болох бөгөөд энэ нь популяцийг хэсэг хэсгээр нь хуваах шаардлагатайг илтгэж болно.
  • Хэт хэтийн үзүүлэлт (хачирхалтай) нь корреляцийн коэффициентийн тооцоолсон утгыг гажуудуулж болно. Хэт өндөр үзүүлэлт нь тохиолдлын улмаас, мэдээлэл цуглуулах явцад гарсан алдаа эсвэл харилцааны зарим шинж чанарыг тусгаж болно. Нэгэнт хэт давсан үзүүлэлт нь дундаж утгаас хүчтэй хазайдаг тул индикаторыг тооцоолоход ихээхэн хувь нэмэр оруулдаг. Ихэнхдээ статистикийг хэт давчуу үзүүлэлттэй, тоон үзүүлэлтгүйгээр тооцдог.

Корреляцийг тооцоолохын тулд MS EXCEL програмыг ашиглах

2 хувьсагчийг жишээ болгон авч үзье Xболон Юмөн үүний дагуу, дээж аваххэд хэдэн хос утгуудаас бүрддэг (Х i ; Y i). Тодорхой болгохын тулд бүтээцгээе.

Анхаарна уу: График зурах талаар дэлгэрэнгүй мэдээллийг нийтлэлээс үзнэ үү. Барилгын жишээ файлд тараах графикуудучир нь ашигладаг Бид энд X хувьсагч санамсаргүй байх шаардлагаас хазайсан (энэ нь үүслийг хялбаршуулдаг янз бүрийн төрөлхарилцаа: бий болгох чиг хандлага ба өгөгдсөн тархалт). Бодит өгөгдлийн хувьд тараах диаграмыг ашиглах шаардлагатай (доороос харна уу).

Тооцоолол хамааралтөлөө бид зарцуулах болно янз бүрийн тохиолдлуудхувьсагчдын хоорондын хамаарал: шугаман, квадратболон цагт харилцааны дутагдал.

Анхаарна уу: Жишээ файлд та шугаман чиг хандлагын параметрүүд (налуу, Y тэнхлэгтэй огтлолцох) болон энэ чиг хандлагын шугамын эргэн тойронд тархалтын зэргийг тохируулж болно. Та мөн квадрат хамаарлын тохиргоог тохируулах боломжтой.

Барилгын жишээ файлд тараах графикуудхувьсагчийн хамаарал байхгүй тохиолдолд тархалтын диаграммыг ашиглана. Энэ тохиолдолд диаграм дээрх цэгүүдийг үүл хэлбэрээр байрлуулна.

Анхаарна уу: Графикийн масштабыг босоо болон хэвтээ тэнхлэгийн дагуу өөрчилснөөр цэгэн үүл нь босоо эсвэл хэвтээ шугам. Энэ тохиолдолд хувьсагчид бие даасан хэвээр байх нь тодорхой байна.

Дээр дурдсанчлан тооцоолохын тулд корреляцийн коэффициент MS EXCEL дээр CORREL() функцууд байдаг. Та мөн ижил үр дүнг буцаадаг ижил төстэй PEARSON() функцийг ашиглаж болно.

Тооцооллыг баталгаажуулахын тулд хамааралДээрх томъёоны дагуу CORREL() функцээр үүсгэгдсэн бөгөөд жишээ файл нь тооцооллыг харуулж байна хамааралилүү нарийвчилсан томъёог ашиглан:

=КОВАРИАНЦ.Ү(B28:B88;D28:D88)/STDEV.Y(B28:B88)/STDEV.Y(D28:D88)

=COVARIATION.V(B28:B88;D28:D88)/STDEV.V(B28:B88)/STDEV.V(D28:D88)

Анхаарна уу: Дөрвөлжин корреляцийн коэффициент r нь тодорхойлох коэффициент R2, энэ нь QVPIRSON() функцийг ашиглан регрессийн шугамыг байгуулахад тооцдог. R2-ийн утгыг мөн дээр харуулах боломжтой тархалтын график, барьсан шугаман чиг хандлага MS EXCEL-ийн стандарт функцийг ашиглан (диаграммыг сонго, табыг сонгоно уу Зохион байгуулалт, дараа нь бүлэгт Шинжилгээтовчийг дар чиг хандлагын шугамболон сонгох Шугаман ойртолт). Трендийн шугамыг зурах талаар дэлгэрэнгүй мэдээллийг, жишээ нь, үзнэ үү.

Ковариацыг тооцоолохын тулд MS EXCEL програмыг ашиглах

ковариацгэсэн утгатай ойролцоо (энэ нь бас тархалтын хэмжүүр юм), 2 хувьсагчийн хувьд тодорхойлогдсон ялгаа, мөн тархалт- нэг нь. Иймд cov(x;x)=VAR(x).

MS EXCEL-д (2010 оны хувилбараас эхлэн) ковариацыг тооцоолохын тулд COVARIATION.G() болон COVARIATION.V() функцуудыг ашиглана. Эхний тохиолдолд тооцоолох томъёо нь дээрхтэй төстэй байна (төгсгөл ны төлөө Хүн ам ), хоёрдугаарт - 1 / n хүчин зүйлийн оронд 1 / (n-1) -ийг ашигладаг, i.e. төгсгөл .ATны төлөө Дээж.

Анхаарна уу: Өмнөх хувилбаруудын MS EXCEL-д байдаг COVAR() функц нь COVARIANCE.G() функцтэй төстэй.

Анхаарна уу: Англи хэл дээрх CORREL() болон COVAR() функцууд нь CORREL болон COVAR хэлбэрээр илэрхийлэгдэнэ. COVARIANCE.G() ба COVARIANCE.V() функцууд нь COVARIANCE.P болон COVARIANCE.S.

Тооцооллын нэмэлт томъёо ковариацууд:

=СУПРОДУКТ(B28:B88-ДУНДЖ(B28:B88),(D28:D88-ДУНДЖ(D28:D88))/COUNT(D28:D88)

=СУПРОДУКТ(B28:B88-ДУНДЖ(B28:B88),(D28:D88))/COUNT(D28:D88)

=СУПРОДУКТ(B28:B88,D28:D88)/COUNT(D28:D88)-ДУНДЖ(B28:B88)*ДУНДЖ(D28:D88)

Эдгээр томьёо нь өмчийг ашигладаг ковариацууд:

Хэрэв хувьсагч xболон yбие даасан бол тэдгээрийн ковариац нь 0. Хэрэв хувьсагчид бие даасан биш бол тэдгээрийн нийлбэрийн дисперс нь:

VAR(x+y)= VAR(x)+ VAR(y)+2COV(x;y)

ГЭХДЭЭ тархалттэдний ялгаа

VAR(x-y)= VAR(x)+ VAR(y)-2COV(x;y)

Корреляцийн коэффициентийн статистикийн ач холбогдлын үнэлгээ

Таамаглалыг шалгахын тулд бид санамсаргүй хэмжигдэхүүний тархалтыг мэдэх ёстой, өөрөөр хэлбэл. корреляцийн коэффициент r. Ихэвчлэн таамаглалын туршилтыг r-д биш, харин t r-ийн санамсаргүй хэмжигдэхүүнд зориулж хийдэг.

n-2 зэрэгтэй эрх чөлөө.

Хэрэв санамсаргүй хэмжигдэхүүний тооцоолсон утга |t r | t α, n-2 (α-заасан) эгзэгтэй утгаас их байвал тэг таамаглал няцаагдана (утгуудын хоорондын хамаарал статистикийн хувьд чухал).

Нэмэлт шинжилгээний багц

Б ковариац ба корреляцийг тооцоолох ижил нэртэй хэрэгслүүд байдаг шинжилгээ.

Хэрэгслийг дуудсаны дараа дараах талбаруудыг агуулсан харилцах цонх гарч ирнэ.

  • оролтын интервал: та 2 хувьсагчийн анхны өгөгдөл бүхий муж руу холбоос оруулах шаардлагатай
  • Бүлэглэх: Ерөнхийдөө түүхий өгөгдлийг 2 баганад оруулдаг
  • Эхний мөрөнд байгаа шошго: шалгасан бол оролтын интервалбаганын гарчиг агуулсан байх ёстой. Нэмэлтийн үр дүн нь мэдээллийн багана агуулсан байхаар нүдийг шалгахыг зөвлөж байна
  • гаралтын интервал: Тооцооллын үр дүнг байрлуулах нүднүүдийн муж. Энэ мужийн зүүн дээд нүдийг зааж өгөхөд хангалттай.

Нэмэлт нь тооцоолсон корреляц ба ковариацын утгыг буцаана (ковариацын хувьд санамсаргүй хэмжигдэхүүний аль алиных нь хэлбэлзлийг мөн тооцдог).

AT Шинжлэх ухааны судалгааҮр дүн ба хүчин зүйлийн хувьсах хэмжигдэхүүнүүдийн хоорондын хамаарлыг олох шаардлагатай байдаг (тариалангийн ургац ба хур тунадасны хэмжээ, хүйс, насаар нэг төрлийн хүмүүсийн өндөр, жин, судасны цохилт, биеийн температур гэх мэт). ).

Хоёр дахь нь тэдэнтэй холбоотой хүмүүсийн өөрчлөлтөд хувь нэмэр оруулдаг шинж тэмдгүүд юм (эхний).

Корреляцийн шинжилгээний тухай ойлголт

Нэг багц бий Дээр үндэслэн корреляцийн шинжилгээ нь таамаглалыг шалгахад ашигладаг арга юм гэж хэлж болно. статистикийн ач холбогдолхоёр ба түүнээс дээш хувьсагч, хэрэв судлаач тэдгээрийг хэмжиж чадах боловч өөрчлөх боломжгүй.

Хэлэлцэж буй ойлголтын бусад тодорхойлолтууд байдаг. Корреляцийн шинжилгээ нь хувьсагчдын хоорондын хамаарлын коэффициентийг судалдаг боловсруулах арга юм. Энэ тохиолдолд тэдгээрийн хоорондын статистик харилцааг тогтоохын тулд нэг хос эсвэл олон хос шинж чанаруудын хоорондын хамаарлын коэффициентийг харьцуулж үздэг. Корреляцийн шинжилгээ гэдэг нь нэг санамсаргүй хэмжигдэхүүний динамик нь динамик байдалд хүргэдэг хатуу функциональ шинж чанартай санамсаргүй хэмжигдэхүүнүүдийн статистикийн хамаарлыг судлах арга юм. математикийн хүлээлтөөр.

Хуурамч хамаарлын тухай ойлголт

Корреляцийн шинжилгээ хийхдээ үүнийг аль ч багц шинж чанаруудтай холбож, бие биентэйгээ харьцуулахад утгагүй байдаг гэдгийг анхаарч үзэх хэрэгтэй. Заримдаа тэдэнд байдаггүй учир шалтгааныхамтдаа.

Энэ тохиолдолд нэг нь хуурамч хамаарлын тухай ярьдаг.

Корреляцийн шинжилгээний асуудлууд

Дээрх тодорхойлолтууд дээр үндэслэн бид тайлбарласан аргын дараах даалгавруудыг томъёолж болно: нөгөөг нь ашиглан хүссэн хувьсагчдын аль нэгний талаархи мэдээллийг олж авах; судалж буй хувьсагчдын хоорондын хамаарлын ойр байдлыг тодорхойлох.

Корреляцийн шинжилгээ нь судлагдсан шинж чанаруудын хоорондын хамаарлыг тодорхойлоход ордог тул корреляцийн шинжилгээний даалгавруудыг дараахь зүйлсээр нэмж болно.

  • үр дүнгийн шинж тэмдгүүдэд хамгийн их нөлөө үзүүлдэг хүчин зүйлсийг тодорхойлох;
  • харилцааны урьд өмнө судлагдаагүй шалтгааныг тодорхойлох;
  • параметрийн шинжилгээгээр корреляцийн загварыг бий болгох;
  • холбооны параметрүүдийн ач холбогдлыг судлах, тэдгээрийн интервалын тооцоо.

Корреляцийн шинжилгээг регресстэй холбох

Корреляцийн шинжилгээний арга нь ихэвчлэн судлагдсан хэмжигдэхүүнүүдийн хоорондын хамаарлын ойр байдлыг олохоор хязгаарлагдахгүй. Заримдаа энэ нь ижил нэртэй дүн шинжилгээ ашиглан олж авсан регрессийн тэгшитгэлийн эмхэтгэлээр нэмэгддэг бөгөөд үр дүн ба хүчин зүйл (фактор) шинж чанаруудын хоорондын хамаарлын тайлбар юм. Энэ арга нь авч үзэж буй шинжилгээний хамт аргыг бүрдүүлдэг

Энэ аргыг хэрэглэх нөхцөл

Үр дүнгийн хүчин зүйлүүд нь нэг буюу хэд хэдэн хүчин зүйлээс хамаардаг. Хэрэв байгаа бол корреляцийн шинжилгээний аргыг хэрэглэж болно олон тооныүр дүнтэй болон хүчин зүйлийн үзүүлэлтүүдийн (хүчин зүйлс) үнэ цэнийн талаархи ажиглалт, харин судлагдсан хүчин зүйлүүд нь тоон шинж чанартай байх ёстой бөгөөд үүнд тусгагдсан байх ёстой. тодорхой эх сурвалжууд. Эхнийх нь ердийн хуулиар тодорхойлогддог - энэ тохиолдолд корреляцийн шинжилгээний үр дүн нь Пирсоны корреляцийн коэффициент юм, эсвэл шинж тэмдгүүд нь энэ хуульд захирагдахгүй бол коэффициентийг ашиглана. зэрэглэлийн хамааралСпирман.

Корреляцийн шинжилгээний хүчин зүйлсийг сонгох дүрэм

Хэрэглэх үед энэ аргагүйцэтгэлийн үзүүлэлтэд нөлөөлж буй хүчин зүйлсийг тодорхойлох шаардлагатай. Шалгуур үзүүлэлтүүдийн хооронд учир шалтгааны холбоо байх ёстойг харгалзан тэдгээрийг сонгосон. Олон хүчин зүйлийн корреляцийн загварыг бий болгох тохиолдолд үр дүнгийн үзүүлэлтэд чухал нөлөө үзүүлэхийг сонгох боловч корреляцийн загварт 0.85-аас дээш хос корреляцийн коэффициенттэй харилцан хамааралтай хүчин зүйлсийг оруулахгүй байхыг илүүд үздэг. үр дүнгийн параметрийн хамаарал нь шууд бус буюу функциональ.

Үр дүнг харуулах

Корреляцийн шинжилгээний үр дүнг текст болон график хэлбэрээр танилцуулж болно. Эхний тохиолдолд тэдгээрийг корреляцийн коэффициент, хоёрдугаарт, тархалтын график хэлбэрээр үзүүлэв.

Хэрэв параметрүүдийн хооронд хамаарал байхгүй бол диаграм дээрх цэгүүдийг санамсаргүй байдлаар байрлуулж, холболтын дундаж зэрэг нь илүү их эрэмбээр тодорхойлогддог бөгөөд тэмдэглэсэн тэмдгүүдийн дундаас бага эсвэл бага хэмжээний зайгаар тодорхойлогддог. Хүчтэй холболт нь шулуун шугам руу чиглэдэг ба r=1 үед тархалтын график нь хавтгай шугам болно. Урвуу хамаарал нь графикийн зүүн дээд хэсгээс баруун доод тийш, шууд зүүн доод хэсгээс баруун дээд булан руу чиглэсэн чиглэлээр тодорхойлогддог.

Тархалтын графикийн 3D дүрслэл (тараа)

Уламжлалт 2 хэмжээст тархалтын үзүүлэнгээс гадна корреляцийн шинжилгээний 3 хэмжээст график дүрслэлийг одоогоор ашиглаж байна.

Бүх хосолсон графикийг матрицын форматаар нэг зургаар харуулдаг тараах матрицыг бас ашигладаг. n хувьсагчийн хувьд матриц нь n мөр, n багана агуулна. i-р мөр ба j-р баганын огтлолцол дээр байрлах диаграм нь Xj-тэй харьцуулсан Xi хувьсагчдын график юм. Тиймээс мөр, багана бүр нэг хэмжээс бөгөөд нэг нүд нь хоёр хэмжээсийн тархалтын графикийг харуулдаг.

Харилцааны нягт байдлын тооцоо

Корреляцийн битүүмжлэлийг корреляцийн коэффициентээр (r) тодорхойлно: хүчтэй - r = ±0,7-аас ±1, дунд - r = ±0,3-аас ±0,699, сул - r = 0-ээс ±0,299. Энэ ангилал нь хатуу биш юм. Зураг нь арай өөр схемийг харуулж байна.

Корреляцийн шинжилгээний аргыг хэрэглэх жишээ

Их Британид нэгэн сонирхолтой судалгаа хийжээ. Энэ нь тамхи татах нь уушигны хорт хавдартай холбоотой асуудалд зориулагдсан бөгөөд корреляцийн шинжилгээгээр хийгдсэн. Энэхүү ажиглалтыг доор үзүүлэв.

Корреляцийн шинжилгээ хийх анхны өгөгдөл

Мэргэжлийн групп

нас баралт

Тариаланчид, ойчид, загасчид

Уурхайчид, карьерын ажилчид

Хий, кокс, химийн бодис үйлдвэрлэгчид

Шил, керамик үйлдвэрлэгчид

Зуух, төмөр, цутгамал, цувих үйлдвэрүүдийн ажилчид

Цахилгаан, электроникийн ажилчид

Инженерийн болон холбогдох мэргэжил

Мод боловсруулах үйлдвэрлэл

Арьс ширчид

Нэхмэлийн ажилчид

Ажлын хувцас үйлдвэрлэгчид

Хүнс, ундаа, тамхины үйлдвэрийн ажилчид

Цаас, хэвлэх үйлдвэрлэгчид

Бусад бүтээгдэхүүн үйлдвэрлэгчид

Барилгачид

Уран бүтээлчид, засалчид

Хөдөлгөөнгүй хөдөлгүүр, кран гэх мэт жолооч нар.

Ажилчдыг өөр газар оруулаагүй болно

Тээвэр, холбооны ажилчид

Агуулах, агуулах, савлагч, дүүргэгч машин ажилчид

оффисын ажилчид

Борлуулагчид

Спорт, амралт зугаалгын үйлчилгээний ажилчид

Администраторууд ба менежерүүд

Мэргэжилтнүүд, техникчид, уран бүтээлчид

Бид корреляцийн шинжилгээг эхлүүлнэ. Тодорхой болгохын тулд шийдлийг эхлүүлэх нь дээр график арга, үүний тулд бид тараах диаграммыг байгуулдаг.

Тэр шууд холболтыг харуулдаг. Гэсэн хэдий ч зөвхөн график аргад тулгуурлан хоёрдмол утгагүй дүгнэлт гаргахад хэцүү байдаг. Тиймээс бид корреляцийн шинжилгээг үргэлжлүүлэн хийх болно. Корреляцийн коэффициентийг тооцоолох жишээг доор үзүүлэв.

Програм хангамжийн хэрэгслийг ашиглан (MS Excel-ийн жишээн дээр үүнийг доор тайлбарлах болно) бид корреляцийн коэффициентийг тодорхойлдог бөгөөд энэ нь 0.716 бөгөөд энэ нь судлагдсан параметрүүдийн хооронд хүчтэй хамаарал гэсэн үг юм. Хүснэгтийн дагуу олж авсан утгын статистик ач холбогдлыг тодорхойлж, 25 хос утгуудаас 2-ыг хасах шаардлагатай бөгөөд үр дүнд нь бид 23-ыг авч, хүснэгтийн энэ мөрөнд p = 0.01-ийн хувьд r чухал болохыг олж мэдье. (эдгээр нь эмнэлгийн өгөгдөл учраас илүү хатуу хамаарал, бусад тохиолдолд p=0.05 хангалттай) нь энэ хамаарлын шинжилгээнд 0.51 байна. Жишээ нь тооцоолсон r нь чухал r-ээс их байгааг харуулсан бөгөөд корреляцийн коэффициентийн утгыг статистикийн хувьд чухал гэж үздэг.

Корреляцийн шинжилгээнд програм хангамж ашиглах

Тодорхойлсон статистик мэдээллийн боловсруулалтын төрлийг ашиглан хийж болно програм хангамжялангуяа MS Excel. Корреляци нь функцийг ашиглан дараах параметрүүдийг тооцоолоход хамаарна.

1. Корреляцийн коэффициентийг CORREL функц (массив1; массив2) ашиглан тодорхойлно. Массив 1,2 нь үр дүн болон хүчин зүйлийн хувьсагчдын утгын хүрээний нүд юм.

Шугаман корреляцийн коэффициентийг Pearson корреляцийн коэффициент гэж нэрлэдэг тул Excel 2007-ээс эхлэн та ижил массивтай функцийг ашиглаж болно.

Excel-ийн корреляцийн шинжилгээг графикаар харуулах нь "Тараах график" сонголттой "Диаграм" самбарыг ашиглан хийгддэг.

Анхны өгөгдлийг зааж өгсний дараа бид графикийг авна.

2. Оюутны t-тест ашиглан хос корреляцийн коэффициентийн ач холбогдлын үнэлгээ. t-шалгуурын тооцоолсон утгыг өгөгдсөн ач холбогдлын түвшин, эрх чөлөөний зэрэглэлийн тоог харгалзан үзэж буй параметрийн утгуудын харгалзах хүснэгтээс энэ үзүүлэлтийн хүснэгтийн (чухал) утгатай харьцуулна. Энэ тооцоог STUDIV(магадлал; эрх чөлөөний_зэрэг) функцийг ашиглан хийдэг.

3. Хос корреляцийн коэффициентийн матриц. Шинжилгээг "Харилцан хамаарал"-ыг сонгосон "Өгөгдлийн шинжилгээ" хэрэгслийг ашиглан гүйцэтгэдэг. Хос корреляцийн коэффициентүүдийн статистик үнэлгээг харьцуулах замаар гүйцэтгэдэг үнэмлэхүй үнэ цэнэхүснэгтийн (чухал) утгатай. Тооцоолсон хос корреляцийн коэффициент нь эгзэгтэй хэмжээнээс давсан тохиолдолд бид өгөгдсөн магадлалын түвшинг харгалзан шугаман харилцааны ач холбогдлын талаархи тэг таамаглалыг үгүйсгэхгүй гэж хэлж болно.

Эцэст нь

Шинжлэх ухааны судалгаанд корреляцийн шинжилгээний аргыг ашиглах нь янз бүрийн хүчин зүйлүүд болон гүйцэтгэлийн үзүүлэлтүүдийн хоорондын хамаарлыг тодорхойлох боломжийг олгодог. Үүний зэрэгцээ, өндөр корреляцийн коэффициентийг утгагүй хос эсвэл өгөгдлийн багцаас авч болно гэдгийг анхаарч үзэх хэрэгтэй. энэ төрөлхангалттай том өгөгдлийн массив дээр дүн шинжилгээ хийх ёстой.

r-ийн тооцоолсон утгыг олж авсны дараа үүнийг баталгаажуулахын тулд r чухал утгатай харьцуулах нь зүйтэй статистик хүчин төгөлдөр байдалтодорхой хэмжээ. Корреляцийн шинжилгээг гараар томьёо ашиглан эсвэл програм хангамжийн хэрэгсэл, ялангуяа MS Excel ашиглан хийж болно. Эндээс та корреляцийн шинжилгээний судлагдсан хүчин зүйлүүд болон үр дүнд бий болох шинж чанаруудын хоорондын хамаарлыг нүдээр харуулах зорилгоор тараах (тараа) диаграммыг байгуулж болно.

Үүнтэй төстэй нийтлэлүүд

2022 parki48.ru. Бид хүрээ байшин барьж байна. Тохижилт. Барилга. Суурь.