Регрессийн шинжилгээний үндсэн шинж чанарууд. Excel дэх корреляц ба регрессийн шинжилгээ: гүйцэтгэх заавар

Регресс гэж юу вэ?

Хоёр тасралтгүй хувьсагчийг авч үзье x=(x 1 , x 2 , .., x n), y=(y 1 , y 2 , ..., y n).

Цэгүүдийг 2 хэмжээст тархалтын график дээр байрлуулаад бидэнд байгаа гэж хэлье шугаман хамааралхэрэв өгөгдлийг шулуун шугамаар ойролцоолсон бол.

Хэрэв бид үүнийг таамаглаж байгаа бол y-аас хамаарна x, өөрчлөлтүүд yөөрчлөлтөөс үүдэлтэй x, бид регрессийн шугамыг тодорхойлж болно (регресс yдээр x), эдгээр хоёр хувьсагчийн хоорондох шулуун шугамын хамаарлыг хамгийн сайн тодорхойлдог.

"Регресс" гэдэг үгийн статистик хэрэглээ нь Сэр Фрэнсис Гальтон (1889)-ийн хэлснээр дундаж утга руу регресс гэж нэрлэгддэг үзэгдлээс гаралтай.

Тэрээр өндөр аавууд өндөр хүүтэй байдаг бол хөвгүүдийн дундаж өндөр нь өндөр аавынхаас бага байдгийг харуулсан. Хөвгүүдийн дундаж өндөр нь хүн амын дундах бүх эцгийн дундаж өндөрт "буцаж", "буцаж" байв. Тиймээс дунджаар өндөр аавууд нь намхан (гэхдээ өндөр) хүүтэй, намхан аавууд өндөр (гэхдээ нэлээд намхан) хүүтэй байдаг.

регрессийн шугам

Энгийн (хосолсон) шугамыг үнэлдэг математикийн тэгшитгэл шугаман регресс:

xбие даасан хувьсагч эсвэл урьдчилан таамаглагч гэж нэрлэдэг.

Юхамааралтай буюу хариултын хувьсагч юм. Энэ бол бидний хүлээж буй үнэ цэнэ юм y(дунджаар) хэрэв бид үнэ цэнийг мэддэг бол x, өөрөөр хэлбэл таамагласан утга юм y»

  • а- үнэлгээний шугамын чөлөөт гишүүн (гатлах); энэ үнэ цэнэ Ю, хэзээ x=0(Зураг 1).
  • б- тооцоолсон шугамын налуу буюу налуу; энэ нь ямар хэмжээ юм Юнэмэгдүүлбэл дунджаар нэмэгддэг xнэг нэгжийн хувьд.
  • аболон бТооцоолсон шугамын регрессийн коэффициент гэж нэрлэдэг боловч энэ нэр томъёог зөвхөн ашигладаг б.

Хос шугаман регрессийг нэгээс олон бие даасан хувьсагчийг багтаахын тулд өргөтгөж болно; энэ тохиолдолд гэж нэрлэдэг олон регресс.

Зураг 1. a ба налуу b-ийн огтлолцлыг харуулсан шугаман регрессийн шугам (х нэг нэгжээр нэмэгдэхэд Y-ийн өсөлтийн хэмжээ)

Хамгийн бага квадрат арга

Бид ажиглалтын түүврийг ашиглан регрессийн шинжилгээ хийдэг аболон б- популяцийн шугаман регрессийн шугамыг тодорхойлдог α ба β гэсэн үнэн (ерөнхий) параметрүүдийн түүврийн тооцоо ( хүн ам).

Ихэнх энгийн аргакоэффициентийг тодорхойлох аболон ббайна арга хамгийн бага квадратууд (MNK).

Тохиромжтой байдлыг үлдэгдлийг харгалзан үнэлдэг (шугамаас цэг бүрийн босоо зай, жишээлбэл, үлдэгдэл = ажиглагдах боломжтой) y- урьдчилан таамагласан y, будаа. 2).

Үлдэгдэл квадратуудын нийлбэр хамгийн бага байхаар хамгийн сайн тохирох шугамыг сонгосон.

Цагаан будаа. 2. Цэг бүрийн хувьд дүрслэгдсэн үлдэгдэл (босоо тасархай шугам) бүхий шугаман регрессийн шугам.

Шугаман регрессийн таамаглал

Тэгэхээр ажиглагдсан утга бүрийн хувьд үлдэгдэл нь зөрүү ба харгалзах таамагласан утгатай тэнцүү байна.Үлдэгдэл бүр эерэг эсвэл сөрөг байж болно.

Шугаман регрессийн цаана байгаа дараах таамаглалуудыг шалгахын тулд та үлдэгдлийг ашиглаж болно.

  • Үлдэгдэл нь ихэвчлэн тэг дундажаар тархсан;

Шугаман байдал, хэвийн байдал ба/эсвэл тогтмол дисперсийн таамаглал эргэлзээтэй байвал бид эдгээр таамаглалыг хангасан шинэ регрессийн шугамыг хувиргаж эсвэл тооцоолж болно (жишээлбэл, логарифмын хувиргалт ашиглах гэх мэт).

Хэвийн бус үнэ цэнэ (хэт үнэ цэнэ) ба нөлөөллийн цэгүүд

"Нөлөөтэй" ажиглалт нь орхигдуулсан тохиолдолд нэг буюу хэд хэдэн загварын параметрийн тооцоог өөрчилдөг (өөрөөр хэлбэл налуу эсвэл огтлолцол).

Гадны үзүүлэлт (өгөгдлийн багц дахь ихэнх утгуудтай зөрчилдөж буй ажиглалт) нь "нөлөөтэй" ажиглалт байж болох бөгөөд 2D тархалтын график эсвэл үлдэгдлийн графикийг харахад нүдээр сайн илрүүлж болно.

Гадны болон "нөлөөлөх" ажиглалтын (цэг) хувьд загваруудыг оруулсан ба тэдгээрийн аль алинд нь ашигладаг бөгөөд тооцооллын өөрчлөлтөд (регрессийн коэффициент) анхаарлаа хандуулаарай.

Шинжилгээ хийхдээ үл тоомсорлох нь үр дүнд нөлөөлж болзошгүй тул хэт давсан үзүүлэлт эсвэл нөлөөлөх цэгүүдийг автоматаар бүү хая. Эдгээр гажуудлын шалтгааныг үргэлж судалж, дүн шинжилгээ хийж байгаарай.

Шугаман регрессийн таамаглал

Шугаман регрессийг байгуулахдаа регрессийн шугамын ерөнхий налуу β тэгтэй тэнцүү гэсэн тэг таамаглалыг шалгана.

Хэрэв шугамын налуу нь тэг байвал ба хоёрын хооронд шугаман хамаарал байхгүй: өөрчлөлт нь нөлөөлөхгүй

Жинхэнэ налуу нь тэг гэсэн тэг таамаглалыг шалгахын тулд та дараах алгоритмыг ашиглаж болно.

Коэффициентийн стандарт алдаа нь эрх чөлөөний зэрэгтэй тархалтыг дагаж мөрддөг харьцаатай тэнцүү туршилтын статистикийг тооцоол.


,

- үлдэгдлийн хэлбэлзлийн тооцоо.

Ихэвчлэн ач холбогдлын түвшинд хүрсэн бол тэг таамаглалыг үгүйсгэдэг.


хоёр сүүлт туршилтын магадлалыг өгдөг эрх чөлөөний зэрэгтэй тархалтын хувийн цэг хаана байна

Энэ нь 95% магадлалтай ерөнхий налууг агуулсан интервал юм.

Том түүврийн хувьд бид ойролцоогоор 1.96 утгыг тооцож болно гэж бодъё (өөрөөр хэлбэл туршилтын статистик нь хэвийн тархалт)

Шугаман регрессийн чанарын үнэлгээ: тодорхойлох коэффициент R 2

Шугаман хамаарлаас болоод бид өөрчлөгдөхийн хэрээр өөрчлөгдөнө гэж найдаж байна , мөн бид үүнийг регрессээс үүдэлтэй эсвэл тайлбарласан өөрчлөлт гэж нэрлэдэг. Үлдэгдэл өөрчлөлт нь аль болох бага байх ёстой.

Хэрэв тийм бол ихэнх өөрчлөлтийг регрессээр тайлбарлах бөгөөд цэгүүд нь регрессийн шугамд ойрхон байх болно, өөрөөр хэлбэл. мөр нь өгөгдөлд сайн тохирч байна.

Хуваалцах нийт хэлбэлзэл, үүнийг регрессээр тайлбарладаг тодорхойлох коэффициент, ихэвчлэн хувиар илэрхийлж, тэмдэглэнэ R2(хосолсон шугаман регрессийн хувьд энэ нь утга юм r2, корреляцийн коэффициентийн квадрат) нь регрессийн тэгшитгэлийн чанарыг субъектив байдлаар үнэлэх боломжийг олгодог.

Ялгаа нь регрессээр тайлбарлах боломжгүй дисперсийн хувь юм.

Үнэлгээ хийх албан ёсны тест байхгүй тул бид регрессийн шугамын тохирох чанарыг тодорхойлохын тулд субьектив дүгнэлтэд найдахаас өөр аргагүй болдог.

Урьдчилан таамаглахад регрессийн шугамыг ашиглах

Та регрессийн шугамыг ашиглан ажигласан муж доторх утгын утгыг таамаглах боломжтой (эдгээр хязгаараас хэтрүүлэн хэзээ ч бүү гарга).

Бид тодорхой утгатай ажиглагдахуйц дундаж утгыг регрессийн шугамын тэгшитгэлд орлуулах замаар урьдчилан таамагладаг.

Тиймээс, хэрэв бид урьдчилан таамаглах юм бол бид энэ таамагласан утгыг ашигладаг стандарт алдаа, үнэлэх итгэлийн интервалүнэн бол дундаж хэмжээхүн амд.

Энэ процедурыг давт янз бүрийн хэмжээтэйЭнэ шугамын итгэлийн хил хязгаарыг бий болгох боломжийг танд олгоно. Энэ нь үнэн шугамыг агуулсан хамтлаг эсвэл хэсэг юм, жишээлбэл, 95% итгэлийн түвшинтэй.

Энгийн регрессийн төлөвлөгөө

Энгийн регрессийн загвар нь нэг тасралтгүй таамаглагчийг агуулна. Хэрэв 7, 4, 9 гэх мэт таамаглагч P утгатай 3 тохиолдол байгаа бөгөөд дизайн нь P эхний дарааллын эффектийг агуулж байвал дизайны матриц X болно.

а регрессийн тэгшитгэл X1-д P ашиглах нь иймэрхүү харагдаж байна

Y = b0 + b1 P

Хэрэв энгийн регрессийн төлөвлөгөө үр нөлөөг агуулсан бол илүү өндөр дараалалКвадрат эффект гэх мэт P-ийн хувьд дизайны матриц дахь X1 баганын утгууд хоёр дахь зэрэгт нэмэгдэнэ.

тэгшитгэл нь хэлбэрийг авна

Y = b0 + b1 P2

Сигма хязгаарлалттай, хэт параметртэй кодлох аргууд нь энгийн регрессийн загварууд болон зөвхөн тасралтгүй таамаглагчдыг агуулсан бусад загварт хамаарахгүй (учир нь ангилсан таамаглагч байдаггүй). Сонгосон кодчилолын аргаас үл хамааран тасралтгүй хувьсагчдын утгыг зохих хүчээр нэмэгдүүлж, X хувьсагчийн утга болгон ашигладаг. Энэ тохиолдолд хөрвүүлэлт хийгдэхгүй. Үүнээс гадна, регрессийн төлөвлөгөөг тайлбарлахдаа та төлөвлөгөөний X матрицыг авч үзэхгүй байж, зөвхөн регрессийн тэгшитгэлтэй ажиллах боломжтой.

Жишээ нь: Энгийн регрессийн шинжилгээ

Энэ жишээнд хүснэгтэд өгсөн өгөгдлийг ашигласан болно:

Цагаан будаа. 3. Анхны өгөгдлийн хүснэгт.

Санамсаргүй байдлаар сонгогдсон 30 хошууны 1960, 1970 оны хүн амын тооллогын харьцуулалт дээр үндэслэсэн. Тойргийн нэрийг ажиглалтын нэрээр төлөөлдөг. Хувьсагч бүрийн талаарх мэдээллийг доор харуулав.

Цагаан будаа. 4. Хувьсах үзүүлэлтүүдийн хүснэгт.

Судалгааны зорилго

Энэ жишээний хувьд ядуурлын түвшин болон ядуурлын шугамаас доогуур байгаа гэр бүлийн хувь хэмжээг урьдчилан таамаглах хүчний хоорондын хамаарлыг шинжлэх болно. Тиймээс бид 3 (Pt_Poor) хувьсагчийг хамааралтай хувьсагч гэж үзэх болно.

Таамаглал дэвшүүлж болно: хүн амын өөрчлөлт ба ядуурлын шугамаас доогуур байгаа гэр бүлийн хувь холбоотой. Ядуурал нь хүн амын гадагшлах урсгалд хүргэдэг тул ядуурлын шугамаас доогуур хүмүүсийн хувь болон хүн амын өөрчлөлтийн хооронд сөрөг хамаарал байх нь үндэслэлтэй юм шиг санагддаг. Тиймээс бид 1 (Pop_Chng) хувьсагчийг урьдчилан таамаглах хувьсагч гэж үзэх болно.

Үр дүнг харах

Регрессийн коэффициентүүд

Цагаан будаа. 5. Pop_Chng дээр Pt_Poor регрессийн коэффициентүүд.

Pop_Chng мөр ба Парам хоёрын уулзвар дээр. Pop_Chng дээрх Pt_Poor-ийн регрессийн стандарт бус коэффициент нь -0.40374 . Энэ нь хүн амын нэгж буурах бүрт ядуурлын түвшин .40374 болж нэмэгддэг гэсэн үг. Дээд ба доод (анхдагч) 95% итгэлийн хязгаар нь тийм биш юм стандартчилагдсан коэффициенттэг оруулахгүй тул регрессийн коэффициент p түвшинд чухал ач холбогдолтой<.05 . Обратите внимание на не стандартизованный коэффициент, который также является коэффициентом корреляции Пирсона для простых регрессионных планов, равен -.65, который означает, что для каждого уменьшения стандартного отклонения численности населения происходит увеличение стандартного отклонения уровня бедности на.65.

Хувьсагчдын тархалт

Өгөгдөл дэх хэт их үзүүлэлтүүд байгаа тохиолдолд корреляцийн коэффициентийг хэт их үнэлж эсвэл дутуу үнэлж болно. Pt_Poor хамааралтай хувьсагчийн тархалтыг мужаар нь авч үзье. Үүнийг хийхийн тулд бид Pt_Poor хувьсагчийн гистограммыг бүтээх болно.

Цагаан будаа. 6. Pt_Poor хувьсагчийн гистограмм.

Таны харж байгаагаар энэ хувьсагчийн тархалт нь ердийн тархалтаас эрс ялгаатай байна. Гэсэн хэдий ч хоёр муж (баруун хоёр багана) хүртэл ядуурлын шугамаас доогуур байгаа гэр бүлүүдийн хувь нь хэвийн хуваарилалтаар төсөөлж байснаас өндөр байгаа ч тэд "хамгийн хүрээнд" байгаа бололтой.

Цагаан будаа. 7. Pt_Poor хувьсагчийн гистограмм.

Энэ дүгнэлт нь зарим талаараа субъектив юм. Ажиглалт (эсвэл ажиглалт) нь интервалд (дундаж ± 3 дахин стандарт хазайлт) багтахгүй бол хэт давсан үзүүлэлтүүдийг харгалзан үзэх ёстой гэсэн дүрэм юм. Энэ тохиолдолд хүн амын гишүүдийн хоорондын хамааралд ноцтой нөлөө үзүүлэхгүй байхын тулд хэт давтагдах болон үл хамаарах шинжилгээг давтан хийх нь зүйтэй.

Тархалтын график

Хэрэв таамаглалуудын аль нэг нь өгөгдсөн хувьсагчдын хоорондын хамаарлын талаархи априори бол түүнийг харгалзах тархалтын график дээр шалгах нь зүйтэй.

Цагаан будаа. 8. Тархалтын график.

Тархалтын график нь хоёр хувьсагчийн хооронд тодорхой сөрөг хамаарлыг (-.65) харуулж байна. Энэ нь мөн регрессийн шугамын 95% итгэлийн интервалыг харуулдаг, өөрөөр хэлбэл 95% магадлалтайгаар регрессийн шугам хоёр тасархай муруй хооронд дамждаг.

Ач холбогдолын шалгуур

Цагаан будаа. 9. Ач холбогдолын шалгуур үзүүлэлтийг агуулсан хүснэгт.

Pop_Chng регрессийн коэффициентийн тест нь Pop_Chng нь Pt_Poor, p -тэй хүчтэй холбоотой болохыг баталж байна.<.001 .

Үр дүн

Энэ жишээ нь энгийн регрессийн төлөвлөгөөг хэрхэн шинжлэхийг харуулсан. Стандарт бус болон стандартчилагдсан регрессийн коэффициентүүдийн тайлбарыг мөн танилцуулав. Хамаарах хувьсагчийн хариу урвалын тархалтыг судлахын ач холбогдлын талаар ярилцаж, таамаглагч болон хамааралтай хувьсагчийн хоорондын хамаарлын чиглэл, хүчийг тодорхойлох аргачлалыг үзүүлэв.

A) Энгийн шугаман регрессийн график шинжилгээ.

Энгийн шугаман регрессийн тэгшитгэл y=a+bx. Y ба X санамсаргүй хэмжигдэхүүнүүдийн хооронд хамаарал байгаа бол y = ý +  утга,

Энд ý - ý = f(x) тэгшитгэлээс олж авсан y-ийн онолын утга,

 нь онолын ý тэгшитгэлийн бодит (туршилтын) өгөгдлөөс хазайх алдаа юм.

ý-ийн дундаж утгын х-ээс хамаарах тэгшитгэл, өөрөөр хэлбэл ý = f (x) -ийг регрессийн тэгшитгэл гэнэ. Регрессийн шинжилгээ нь дөрвөн үе шатаас бүрдэнэ.

1) үүрэг даалгавар өгөх, холболтын шалтгааныг тогтоох.

2) судалгааны объектын хязгаарлалт, статистикийн мэдээлэл цуглуулах.

3) цуглуулсан өгөгдлийн шинжилгээ, шинж чанарт үндэслэн холбоосын тэгшитгэлийг сонгох.

4) тоон утгын тооцоо, хамаарлын шинж чанар.

Хэрэв хоёр хувьсагч нь нэг хувьсагчийн өөрчлөлт нь нөгөө хувьсагчийн системчилсэн өөрчлөлттэй тохирч байхаар хамааралтай бол эдгээр хувьсагч нь мэдэгдэж байгаа бол тэдгээрийн хоорондын хамаарлын тэгшитгэлийг сонгохдоо регрессийн шинжилгээг ашиглана. Дургүй регрессийн шинжилгээ, корреляцийн шинжилгээг X ба Y хоорондын харилцааны нягт байдлыг шинжлэхэд ашигладаг.

Регрессийн шинжилгээнд шулуун шугам олох талаар бодож үзээрэй.

Онолын регрессийн тэгшитгэл.

"Энгийн регресс" гэсэн нэр томъёо нь нэг хувьсагчийн хэмжээг өөр нэг хувьсагчийн талаарх мэдлэг дээр үндэслэн тооцдог болохыг харуулж байна. Энгийн олон хувьсагчийн регрессээс ялгаатай нь хоёр, гурав ба түүнээс дээш хувьсагчийн мэдлэг дээр үндэслэн хувьсагчийг тооцоолоход ашигладаг. Энгийн шугаман регрессийн график шинжилгээг авч үзье.

Хөдөлмөр эрхлэлтийн өмнөх болон хөдөлмөрийн бүтээмжийн сорилын шинжилгээний хариу гарсан гэж бодъё.

Сонгон шалгаруулалтын үр дүн (100 оноо), x

Гүйцэтгэл (20 оноо), y

График дээрх цэгүүдийг тавиад бид тараах диаграм (талбар) авна. Бид үүнийг сонгон шалгаруулах туршилтын үр дүн, хөдөлмөрийн бүтээмжид дүн шинжилгээ хийхэд ашигладаг.

Тархалтын график ашиглан регрессийн шугамд дүн шинжилгээ хийцгээе. Регрессийн шинжилгээнд дор хаяж хоёр хувьсагч үргэлж тодорхойлогддог. Нэг хувьсагчийн системчилсэн өөрчлөлт нь нөгөө хувьсагчийн өөрчлөлттэй холбоотой байдаг. үндсэн зорилго регрессийн шинжилгээнөгөө хувьсагчийн утга мэдэгдэж байгаа бол нэг хувьсагчийн утгыг тооцоолох явдал юм. Бүрэн даалгаврын хувьд хөдөлмөрийн бүтээмжийг үнэлэх нь чухал юм.

Бие даасан хувьсагчрегрессийн шинжилгээнд хэмжигдэхүүнийг өөр хувьсагчийн шинжилгээний суурь болгон ашигладаг. Энэ тохиолдолд эдгээр нь сонгон шалгаруулах туршилтын үр дүн юм (X тэнхлэгийн дагуу).

хамааралтай хувьсагчтооцоолсон утга гэж нэрлэдэг (Y тэнхлэгийн дагуу). Регрессийн шинжилгээнд зөвхөн нэг хамааралтай хувьсагч, олон бие даасан хувьсагч байж болно.

Энгийн регрессийн шинжилгээний хувьд хамаарлыг хоёр координатын системд (x ба y), x тэнхлэгийн дагуу - бие даасан хувьсагч, у тэнхлэгийн дагуу - хамааралтайгаар төлөөлж болно. Бид огтлолцох цэгүүдийг график дээр хос хэмжигдэхүүнийг харуулсан байдлаар зурдаг. График гэж нэрлэдэг тархалтын график. Үүний бүтээн байгуулалт нь регрессийн шинжилгээний хоёр дахь шат бөгөөд эхнийх нь дүн шинжилгээ хийсэн утгыг сонгох, түүврийн өгөгдлийг цуглуулах явдал юм. Тиймээс статистик шинжилгээнд регрессийн шинжилгээг ашигладаг. Графикийн түүвэр өгөгдлийн хоорондын хамаарал нь шугаман байна.

Х хувьсагч дээр тулгуурлан у хувьсагчийн утгыг тооцоолохын тулд тархалтын цэгүүдийн байршилд үндэслэн x ба у хоёрын хоорондын хамаарлыг хамгийн сайн илэрхийлэх шугамын байрлалыг тодорхойлох шаардлагатай. Бидний жишээнд энэ бол гүйцэтгэлийн шинжилгээ юм. Тархалтын цэгүүдээр татсан шугам - регрессийн шугам. Харааны туршлага дээр үндэслэн регрессийн шугамыг бий болгох нэг арга бол гар аргаар хийх арга юм. Манай регрессийн шугамыг хөдөлмөрийн бүтээмжийг тодорхойлоход ашиглаж болно. Регрессийн шугамын тэгшитгэлийг олох үед

Ихэнхдээ хамгийн бага квадратын тестийг ашигладаг. Хамгийн тохиромжтой шугам бол квадрат хазайлтын нийлбэр хамгийн бага байх шугам юм.

Өсөлтийн шугамын математик тэгшитгэл нь арифметик прогрессийн өсөлтийн хуулийг илэрхийлнэ.

цагт = абX.

Ю = а + бX– нэг параметртэй багасгасан тэгшитгэл нь хязгаарлалтын тэгшитгэлийн хамгийн энгийн хэлбэр юм. Энэ нь дундаж утгын хувьд хүлээн зөвшөөрөгддөг. хоорондын харилцааг илүү сайн илэрхийлэхийн тулд Xболон цагт, нэмэлт пропорциональ хүчин зүйлийг нэвтрүүлсэн б, энэ нь регрессийн шугамын налууг заана.

B) Онолын регрессийн шугамыг байгуулах.

Үүнийг олох үйл явц нь муруйн төрлийг сонгох, зөвтгөх, параметрүүдийг тооцоолохоос бүрдэнэ. а, б, -тайгэх мэт. Барилга угсралтын процессыг тэгшлэх гэж нэрлэдэг бөгөөд шалны дэвсгэрээр санал болгож буй муруйн нөөц. дүн шинжилгээ, янз бүрийн. Ихэнх тохиолдолд эдийн засгийн асуудлуудад бүхэл тооны эерэг зэрэгтэй олон гишүүнтээр илэрхийлэгддэг муруйн гэр бүл, тэгшитгэлийг ашигладаг.

1)
- шулуун шугамын тэгшитгэл,

2)
гиперболын тэгшитгэл нь

3)
параболын тэгшитгэл нь

Энд ý нь онолын регрессийн шугамын ординатууд.

Тэгшитгэлийн төрлийг сонгосны дараа энэ тэгшитгэлээс хамаарах параметрүүдийг олох шаардлагатай. Жишээлбэл, тархалтын талбайн цэгүүдийн байршлын шинж чанар нь онолын регрессийн шугам шулуун болохыг харуулсан.

Тархалтын график нь регрессийн шинжилгээ ашиглан хөдөлмөрийн бүтээмжийг илэрхийлэх боломжийг олгодог. Эдийн засгийн шинжлэх ухаанд регрессийн шинжилгээ нь эцсийн бүтээгдэхүүнд нөлөөлдөг олон шинж чанарыг урьдчилан таамагладаг (үнийг харгалзан үздэг).

C) Шулуун шугамыг олох хамгийн жижиг хүрээнүүдийн шалгуур.

Тархалтын графикт тохирох регрессийн шугамыг сонгоход бидний хэрэглэж болох шалгууруудын нэг нь квадрат алдааны нийлбэр хамгийн бага байх мөрийг сонгоход суурилдаг.

Шулуун шугамд тараах цэгүүдийн ойролцоо байдлыг сегментүүдийн ординатаар хэмждэг. Эдгээр цэгүүдийн хазайлт нь эерэг эсвэл сөрөг байж болох ч туршилтын шугамаас онолын шугамын квадрат хазайлтын нийлбэр нь үргэлж эерэг бөгөөд хамгийн бага байх ёстой. Бүх тархалтын цэгүүд регрессийн шугамын байрлалтай давхцахгүй байгаа нь туршилтын болон онолын өгөгдлүүдийн хооронд зөрүү байгааг харуулж байна. Иймээс олдсоноос бусад регрессийн шугам нь туршилтын болон туршилтын өгөгдлүүдийн хооронд бага хэмжээний хазайлт өгч чадахгүй гэж хэлж болно. Тиймээс онолын тэгшитгэлийг олсон ý болон регрессийн шугамын хувьд бид хамгийн бага квадратын шаардлагыг хангана.

Энэ нь хязгаарлалтын тэгшитгэлийг ашиглан хийгддэг
, параметрүүдийг олохын тулд томьёо ашиглан аболон б. Онолын үнэ цэнийг авч байна
тэгшитгэлийн зүүн талыг дамжуулан тэмдэглэнэ е, бид функцийг авна
үл мэдэгдэх параметрүүдээс аболон б. Үнэ цэнэ аболон бфункцийн хамгийн бага хэмжээг хангана еба хэсэгчилсэн дифференциал тэгшитгэлээс олно
болон
. тэр шаардлагатай нөхцөлГэсэн хэдий ч эерэг квадрат функцийн хувьд энэ нь мөн олоход хангалттай нөхцөл юм аболон б.

Хэсэгчилсэн деривативын тэгшитгэлээс параметрийн томъёог гаргаж авцгаая аболон б:



Бид тэгшитгэлийн системийг олж авна:

хаана
- арифметик дундаж алдаа.

Тоон утгыг орлуулснаар бид параметрүүдийг олно аболон б.

Нэг ойлголт байдаг
. Энэ бол ойролцоолох хүчин зүйл юм.

Хэрвээ д < 33%, то модель приемлема для дальнейшего анализа;

Хэрвээ д> 33%, дараа нь бид гипербол, парабол гэх мэтийг авна. Энэ нь янз бүрийн нөхцөл байдалд дүн шинжилгээ хийх эрхийг өгдөг.

Дүгнэлт: Ойролцоо коэффициентийн шалгуурын дагуу хамгийн тохиромжтой шугам нь хамгийн тохиромжтой шугам юм.

, мөн бидний асуудлын өөр ямар ч регрессийн шугам нь хамгийн бага хазайлтыг өгдөггүй.

D) Үнэлгээний квадрат алдаа, тэдгээрийн ердийн байдлыг шалгах.

Судалгааны 30-аас бага үзүүлэлттэй хүн амын хувьд ( n < 30), для проверки типичности параметров уравнения регрессии используется т-Оюутны шалгуур. Энэ нь бодит утгыг тооцдог т-шалгуур:

Эндээс

хаана нь үлдэгдэл язгуур дундаж квадрат алдаа юм. Хүлээн авсан т аболон т бшүүмжлэлтэй харьцуулахад т кОюутны хүснэгтээс хүлээн зөвшөөрөгдсөн ач холбогдлын түвшинг ( = 0.01 = 99% эсвэл  = 0.05 = 95%) харгалзан үзнэ. П = е = к 1 = мнь судалж буй тэгшитгэлийн параметрийн тоо (чөлөөний зэрэг). Жишээлбэл, хэрэв y = а + bx; м = 2, к 2 = е 2 = х 2 = n – (м+ 1), хаана n- судлагдсан шинж чанаруудын тоо.

т а < т к < т б .

Дүгнэлт: ердийн байдлыг шалгасан регрессийн тэгшитгэлийн параметрүүдийн дагуу холболтын математик загварыг байгуулав.
. Энэ тохиолдолд шинжилгээнд ашигласан математик функцийн параметрүүд (шугаман, гипербол, парабол) нь харгалзах тоон утгыг хүлээн авдаг. Ийм аргаар олж авсан загваруудын семантик агуулга нь үр дүнтэй шинж чанарын дундаж утгыг тодорхойлдог
хүчин зүйлийн шинж чанараас X.

E) Муруй шугаман регресс.

Хувьсагчдын хооронд өөрчлөгдөж буй хамаарал үүсэх үед муруй шугамын хамаарал ихэвчлэн байдаг. Өсөлт (бууралт)-ын эрч хүч нь X олох түвшингээс хамаарна. Муруй шугаман хамаарал нь янз бүрийн хэлбэртэй байж болно. Жишээлбэл, ургац ба хур тунадасны хамаарлыг авч үзье. Байгалийн ижил нөхцөлд хур тунадас ихсэх тусам ургац эрчимтэй нэмэгдэж байгаа боловч тодорхой хязгаар хүртэл байна. Эгзэгтэй цэгийн дараа хур тунадас илүүдэлтэй болж, ургац гамшгийн хэмжээгээр буурдаг. Жишээ нь эхлээд харилцаа эерэг, дараа нь сөрөг байсныг харуулж байна. Чухал цэг - X онцлогийн оновчтой түвшин, Y онцлогийн хамгийн их буюу хамгийн бага утгатай тохирч байна.

Эдийн засгийн шинжлэх ухаанд үнэ ба хэрэглээ, бүтээмж, үйлчилгээний урт хоёрын хооронд ийм хамаарал ажиглагддаг.

параболик хамаарал.

Хэрэв өгөгдөл нь хүчин зүйлийн шинж чанарын өсөлт нь үр дүнгийн шинж чанарыг нэмэгдүүлэхэд хүргэдэг болохыг харуулж байгаа бол хоёр дахь эрэмбийн тэгшитгэлийг (парабол) регрессийн тэгшитгэл болгон авна.

. a,b,c коэффициентүүдийг хэсэгчилсэн дифференциал тэгшитгэлээс олно.

Бид тэгшитгэлийн системийг олж авдаг:

Муруй шугаман тэгшитгэлийн төрлүүд:

,

,

Хөдөлмөрийн бүтээмж болон сонгон шалгаруулалтын шалгалтын онооны хооронд муруй шугаман хамаарал байгаа гэж үзэх үндэслэлтэй. Энэ нь онооны систем өсөх тусам гүйцэтгэл тодорхой түвшинд буурч эхлэх тул шууд загвар нь муруй хэлбэртэй болж магадгүй гэсэн үг юм.

Гурав дахь загвар нь гипербол байх ба бүх тэгшитгэлд х хувьсагчийн оронд илэрхийлэл байх болно.

Корреляци ба регрессийн ойлголтууд нь шууд хамааралтай. Корреляци ба регрессийн шинжилгээний олон нийтлэг тооцооллын арга техникүүд байдаг. Эдгээр нь үзэгдэл, үйл явцын хоорондын шалтгаан-үр дагаврын холбоог тодорхойлоход хэрэглэгддэг. Гэсэн хэдий ч хэрэв корреляцийн шинжилгээстохастик холболтын хүч чадал, чиглэлийг үнэлэх боломжийг танд олгоно регрессийн шинжилгээЭнэ нь бас донтолтын нэг хэлбэр юм.

Регресс нь дараахь байж болно.

a) үзэгдлийн тооноос хамааран (хувьсагчдаас):

Энгийн (хоёр хувьсагчийн хоорондох регресс);

Олон (хамааралтай хувьсагч (y) ба түүнийг тайлбарлаж буй хэд хэдэн хувьсагчийн хоорондох регресс (x1, x2 ... xn);

б) хэлбэрээс хамааран:

Шугаман (шугаман функц хэлбэрээр харагдах ба судалж буй хувьсагчдын хооронд шугаман хамаарал байдаг);

Шугаман бус (шугаман бус функцээр харуулсан, судалж буй хувьсагчдын хоорондын хамаарал нь шугаман бус);

в) анхааралдаа авсан хувьсагчдын хоорондын хамаарлын шинж чанараар:

Эерэг (тайлбарлах хувьсагчийн утгын өсөлт нь хамааралтай хувьсагчийн утгыг нэмэгдүүлэхэд хүргэдэг ба эсрэгээр);

Сөрөг (тайлбар хувьсагчийн утга нэмэгдэхийн хэрээр тайлбарласан хувьсагчийн утга буурдаг);

г) төрлөөр:

Шууд (энэ тохиолдолд шалтгаан нь үр дагаварт шууд нөлөөлдөг, өөрөөр хэлбэл хамааралтай болон тайлбарлагч хувьсагч нь бие биенээсээ шууд хамааралтай байдаг);

Шууд бус (тайлбарлах хувьсагч нь хамааралтай хувьсагч дээр гуравны нэг буюу хэд хэдэн бусад хувьсагчаар дамжуулан шууд бус нөлөө үзүүлдэг);

Хуурамч (утгагүй регресс) - судалж буй үйл явц, үзэгдэлд өнгөц, албан ёсны хандлагаар үүсч болно. Манай улсын архины хэрэглээ багасах, угаалгын нунтаг борлуулалт багасах хоёрын хоорондын хамаарлыг тогтоосон регресс нь утгагүй байдлын жишээ юм.

Регрессийн шинжилгээ хийхдээ дараахь үндсэн ажлуудыг шийддэг.

1. Хараат байдлын хэлбэрийг тодорхойлох.

2. Регрессийн функцийн тодорхойлолт. Үүний тулд нэг буюу өөр төрлийн математикийн тэгшитгэлийг ашигладаг бөгөөд энэ нь нэгдүгээрт, хамааралтай хувьсагчийн өөрчлөлтийн ерөнхий чиг хандлагыг тогтоох, хоёрдугаарт, тайлбарлагч хувьсагчийн (эсвэл хэд хэдэн хувьсагчийн) нөлөөллийг тооцоолох боломжийг олгодог. хамааралтай хувьсагч.

3. Хамаарах хувьсагчийн үл мэдэгдэх утгыг тооцоолох. Үүссэн математикийн хамаарал (регрессийн тэгшитгэл) нь хамааралтай хувьсагчийн утгыг тайлбарлах хувьсагчийн өгөгдсөн утгуудын хүрээнд болон түүнээс цааш тодорхойлох боломжийг олгодог. Сүүлчийн тохиолдолд регрессийн шинжилгээ нь нийгэм-эдийн засгийн үйл явц, үзэгдлийн өөрчлөлтийг урьдчилан таамаглахад ашигтай хэрэгсэл болдог (одоо байгаа чиг хандлага, харилцааг хадгалсан тохиолдолд). Ихэвчлэн урьдчилан таамаглах хугацааны интервалын уртыг эхний үзүүлэлтүүдийн ажиглалт хийсэн хугацааны хагасаас илүүгүй байхаар сонгодог. Идэвхгүй таамаглал, экстраполяцийн асуудлыг шийдэж, идэвхтэй таамаглалыг хоёуланг нь хийж, сайн мэддэг "хэрэв ... тэгвэл" схемийн дагуу үндэслэлийг гаргаж, өөр утгыг нэг буюу хэд хэдэн тайлбарлагч регрессийн хувьсагчид орлуулах боломжтой.



Учир нь регрессийг бий болгоххэмээх тусгай аргыг ашигладаг хамгийн бага квадратын арга. Энэ арга нь бусад тэгшитгэх аргуудаас давуу талтай: шаардлагатай параметрүүдийн харьцангуй энгийн математик тодорхойлолт, магадлалын үүднээс онолын үндэслэл сайтай.

Регрессийн загварыг сонгохдоо түүнд тавигдах зайлшгүй шаардлагуудын нэг бол хангалттай нарийвчлалтай шийдлийг олж авах боломжийг олгодог хамгийн энгийн байдлыг хангах явдал юм. Тиймээс статистикийн харилцааг бий болгохын тулд эхлээд шугаман функцүүдийн ангиллын загварыг (бүх боломжит функцүүдийн хамгийн энгийн нь) авч үздэг.

Үүнд bi, b2...bj - yi утгад хij бие даасан хувьсагчийн нөлөөллийг тодорхойлох коэффициентүүд; ai - чөлөөт гишүүн; ei - хамааралгүй хүчин зүйлсийн хамааралтай хувьсагчид үзүүлэх нөлөөллийг тусгасан санамсаргүй хазайлт; n - бие даасан хувьсагчийн тоо; N нь ажиглалтын тоо бөгөөд нөхцөл (N . n+1) хангагдсан байх ёстой.

Шугаман загварянз бүрийн асуудлын маш өргөн ангиллыг дүрсэлж чадна. Гэсэн хэдий ч бодит байдал дээр, ялангуяа нийгэм-эдийн засгийн системд их хэмжээний ойролцоо алдаанаас болж шугаман загварыг ашиглахад заримдаа хэцүү байдаг. Тиймээс шугаманчлалыг зөвшөөрдөг шугаман бус олон регрессийн функцийг ихэвчлэн ашигладаг. Тэдгээрийн дотроос, жишээлбэл, нийгэм-эдийн засгийн янз бүрийн судалгаанд хэрэглэгдэх болсон үйлдвэрлэлийн функц (Кобб-Дугласын хүчний функц) юм. Энэ нь иймэрхүү байна:

Үүнд b 0 - хэвийн болгох коэффициент, b 1 ...b j - үл мэдэгдэх коэффициентүүд, e i - санамсаргүй хазайлт.

Байгалийн логарифмуудыг ашиглан бид энэ тэгшитгэлийг шугаман хэлбэрт шилжүүлж болно.

Үүссэн загвар нь дээр дурдсан стандарт шугаман регрессийн процедурыг ашиглах боломжийг танд олгоно. Хоёр төрлийн (нэмэлт ба үржүүлгийн) загваруудыг барьсны дараа хамгийн сайныг нь сонгож, илүү бага ойролцоо алдаатай цаашдын судалгааг хийж болно.

Ойролцоогоор функцийг сонгох сайн боловсруулсан систем байдаг - аргументуудыг бүлэг бүртгэх арга(MGUA).

Сонгосон загварын зөв эсэхийг ажигласан y i утгууд ба y i регрессийн тэгшитгэлийг ашиглан таамагласан харгалзах утгуудын хоорондын зөрүү болох үлдэгдлийг судлах үр дүнгээр дүгнэж болно. Энэ тохиолдолд загварын зохистой байдлыг шалгахтооцоолсон дундаж ойролцоо алдаа:

Хэрэв e нь 15% ба түүнээс доош байвал загварыг хангалттай гэж үзнэ.

Нийгэм-эдийн засгийн тогтолцооны хувьд сонгодог регрессийн загварт нийцэх үндсэн нөхцөлүүд үргэлж хангагддаггүй гэдгийг бид онцлон тэмдэглэж байна.

Үүний үр дүнд үүссэн хангалтгүй байдлын бүх шалтгааныг дурдалгүйгээр бид зөвхөн нэрлэх болно олон шугаман байдал- статистикийн хамаарлыг судлахад регрессийн шинжилгээний аргыг үр дүнтэй ашиглах хамгийн хэцүү асуудал. Доод олон шугаман байдалтайлбарлагч хувьсагчдын хооронд шугаман хамаарал байгаа нь ойлгогдоно.

Энэ үзэгдэл:

а) регрессийн коэффициентүүдийн утгыг утга учиртай тайлбарлахдаа гажуудуулах;

б) тооцооллын нарийвчлалыг бууруулдаг (тооцооллын зөрүү нэмэгддэг);

в) түүврийн өгөгдөлд коэффициентийн тооцооллын мэдрэмжийг нэмэгдүүлдэг (түүврийн хэмжээ нэмэгдэх нь тооцооллын утгад ихээхэн нөлөөлдөг).

Multicollinearity-ийг багасгах янз бүрийн арга техникүүд байдаг. Хамгийн хүртээмжтэй арга бол хоёр хувьсагчийн хоорондын корреляцийн коэффициент нь үнэмлэхүй утгаараа 0.8-тай тэнцэх утгаас хэтэрсэн тохиолдолд тэдгээрийн аль нэгийг хасах явдал юм. Хувьсагчдаас алийг нь хадгалах вэ гэдэг нь утга учиртай эргэцүүлсний үндсэн дээр шийдэгддэг. Дараа нь регрессийн коэффициентүүдийг дахин тооцоолно.

Алхам алхмаар регрессийн алгоритмыг ашиглах нь загварт нэг бие даасан хувьсагчийг тууштай оруулах, регрессийн коэффициентүүдийн ач холбогдол, хувьсагчдын олон шугаман байдлыг шинжлэх боломжийг олгодог. Эцэст нь регрессийн коэффициентүүдийн шаардлагатай ач холбогдол, олон шугаман хамаарлын хамгийн бага үр нөлөөг өгдөг хувьсагчид л судлагдсан хамааралд үлдэнэ.

Регрессийн шинжилгээ нь статистикийн судалгааны хамгийн түгээмэл аргуудын нэг юм. Энэ нь хамааралтай хувьсагчид бие даасан хувьсагчдын нөлөөллийн түвшинг тодорхойлоход ашиглаж болно. Microsoft Excel-ийн функцууд нь ийм төрлийн дүн шинжилгээ хийхэд зориулагдсан хэрэгслүүдтэй байдаг. Тэдгээр нь юу болох, тэдгээрийг хэрхэн ашиглах талаар авч үзье.

Гэхдээ регрессийн шинжилгээ хийх боломжийг олгодог функцийг ашиглахын тулд та юуны түрүүнд анализын багцыг идэвхжүүлэх хэрэгтэй. Зөвхөн дараа нь энэ процедурт шаардлагатай хэрэгслүүд Excel туузан дээр гарч ирнэ.


Одоо бид таб руу ороход "Өгөгдөл", хэрэгслийн хайрцаг дахь туузан дээр "Шинжилгээ"Бид шинэ товчлуурыг харах болно - "Мэдээллийн дүн шинжилгээ хийх".

Регрессийн шинжилгээний төрлүүд

Хэд хэдэн төрлийн регресс байдаг:

  • параболик;
  • хүч;
  • логарифм;
  • экспоненциал;
  • жагсаал;
  • гиперболик;
  • шугаман регресс.

Excel дээр сүүлийн төрлийн регрессийн шинжилгээний хэрэгжилтийн талаар бид дараа нь илүү дэлгэрэнгүй ярих болно.

Excel дэх шугаман регресс

Жишээлбэл, гудамжинд өдрийн дундаж агаарын температур, тухайн ажлын өдрийн дэлгүүрийн үйлчлүүлэгчдийн тоог харуулсан хүснэгтийг доор харуулав. Регрессийн шинжилгээний тусламжтайгаар агаарын температур гэх мэт цаг агаарын нөхцөл байдал нь жижиглэнгийн худалдааны байгууллагын ирцэд хэрхэн нөлөөлж болохыг олж мэдье.

Ерөнхий шугаман регрессийн тэгшитгэл нь дараах байдалтай байна: Y = a0 + a1x1 + ... + axk. Энэ томъёонд Югэдэг нь бидний нөлөөллийг судлах гэж буй хувьсагчийг хэлнэ. Манай тохиолдолд энэ нь худалдан авагчдын тоо юм. Утга xхувьсагчдад нөлөөлөх янз бүрийн хүчин зүйлүүд юм. Сонголтууд ань регрессийн коэффициентууд юм. Өөрөөр хэлбэл, тэд тодорхой хүчин зүйлийн ач холбогдлыг тодорхойлдог. Индекс кЭдгээр ижил хүчин зүйлсийн нийт тоог илэрхийлнэ.


Шинжилгээний үр дүнгийн шинжилгээ

Регрессийн шинжилгээний үр дүнг тохиргоонд заасан газарт хүснэгт хэлбэрээр харуулав.

Гол үзүүлэлтүүдийн нэг нь R-дөрвөлжин. Энэ нь загварын чанарыг илтгэнэ. Манай тохиолдолд энэ коэффициент 0.705 буюу ойролцоогоор 70.5% байна. Энэ бол хүлээн зөвшөөрөгдсөн чанарын түвшин юм. 0.5-аас бага харьцаа муу байна.

Өөр нэг чухал үзүүлэлт нь шугамын уулзвар дахь нүдэнд байрладаг "Y уулзвар"болон багана "Итгэлцүүрүүд". Энд Y ямар утгатай болохыг зааж өгсөн бөгөөд манай тохиолдолд энэ нь худалдан авагчдын тоо бөгөөд бусад бүх хүчин зүйлүүд тэгтэй тэнцүү байна. Энэ хүснэгтэд энэ утга 58.04 байна.

Графикийн огтлолцол дээрх утга "Хувьсагч X1"болон "Итгэлцүүрүүд"нь Х-ээс Y-ийн хамаарлын түвшинг харуулж байна. Манай тохиолдолд энэ нь дэлгүүрийн үйлчлүүлэгчдийн тооноос температураас хамаарах түвшин юм. 1.31 коэффициент нь нөлөөллийн нэлээд өндөр үзүүлэлт гэж тооцогддог.

Таны харж байгаагаар Microsoft Excel ашиглан регрессийн шинжилгээний хүснэгт үүсгэх нь маш хялбар юм. Гэхдээ зөвхөн бэлтгэгдсэн хүн л гаралт дээр олж авсан өгөгдөлтэй ажиллаж, мөн чанарыг нь ойлгож чадна.

Корреляцийн шинжилгээгээр хувьсагчдын хооронд статистик хамаарал байгаа эсэхийг илрүүлж, тэдгээрийн ойрын зэрэглэлийг үнэлсний дараа тэд ихэвчлэн регрессийн шинжилгээ ашиглан тодорхой төрлийн хамаарлын математик тайлбарыг хийдэг. Үүний тулд үр дүнтэй y үзүүлэлт ба x 1, x 2, ..., x аргументуудыг хамгийн мэдээлэл сайтай аргументуудтай холбосон функцүүдийн ангиллыг сонгож, холбоосын параметрүүдийн үл мэдэгдэх утгын тооцооллыг сонгосон. тэгшитгэлийг тооцоолж, үүссэн тэгшитгэлийн шинж чанарыг шинжилнэ.

Аргументуудын өгөгдсөн утгуудаас үр дүнтэй y шинж чанарын дундаж утгын хамаарлыг тодорхойлдог f (x 1, x 2, ..., x k) функцийг регрессийн функц (тэгшитгэл) гэж нэрлэдэг. "Регресс" (лат. - регресс - ухрах, ямар нэгэн зүйл рүү буцах) гэсэн нэр томъёог Английн сэтгэл зүйч, антропологич Ф.Галтон нэвтрүүлсэн бөгөөд энэ ойлголтыг ашигласан анхны тодорхой жишээнүүдийн нэгний онцлогтой холбоотой юм. Тиймээс Ф.Гальтон өсөлтийн удамшлын шинжилгээтэй холбогдуулан статистик мэдээллийг боловсруулж, хэрэв аавууд бүх эцгүүдийн дундаж өндрөөс х инчээр хазайдаг бол тэдний хөвгүүд бүх хөвгүүдийн дундаж өндрөөс х-ээс бага хазайдаг болохыг тогтоожээ. инч. Илэрсэн чиг хандлагыг "дундаж төлөв рүү буцах" гэж нэрлэсэн. Түүнээс хойш статистикийн уран зохиолд "регресс" гэсэн нэр томъёо өргөн хэрэглэгдэж ирсэн боловч олон тохиолдолд энэ нь статистикийн хамаарлын тухай ойлголтыг нарийн тодорхойлж чаддаггүй.

Регрессийн тэгшитгэлийг үнэн зөв тайлбарлахын тулд үр дүнтэй y үзүүлэлтийн тархалтын хуулийг мэдэх шаардлагатай. Статистикийн практикт судлаачид өгөгдсөн утгуудын хувьд дүн шинжилгээ хийсэн үр дүнгийн y үзүүлэлтийн магадлалын тархалтын нөхцөлт хуулийн талаар нарийн мэдлэггүй байдаг тул үл мэдэгдэх үнэн регрессийн функцэд тохирох ойролцоо утгыг хайхаар хязгаарлах шаардлагатай байдаг. аргументийн x.

Үнэн f(x) = M(y1x), загварын регрессийн хоорондын хамаарлыг авч үзье? болон регрессийн y оноо. Үр дүнтэй y үзүүлэлтийг х аргументтай дараах харьцаагаар хамааруулъя.

Энд - e нь хэвийн тархалтын хуультай санамсаргүй хэмжигдэхүүн бөгөөд Me \u003d 0 ба D e \u003d y 2 байна. Энэ тохиолдолд жинхэнэ регрессийн функц нь: f(x) = M(y/x) = 2x 1.5.

Бид жинхэнэ регрессийн тэгшитгэлийн тодорхой хэлбэрийг мэдэхгүй ч yi = 2x1.5 + e харьцаатай холбоотой хоёр хэмжээст санамсаргүй хэмжигдэхүүн дээр есөн ажиглалт хийж, Зураг дээр үзүүлэв гэж бодъё. нэг

Зураг 1 - Үнэний f (x) ба онолын харилцан зохицуулалт? регрессийн загварууд

Зураг дээрх цэгүүдийн байршил. 1 нь хэлбэрийн шугаман хамаарлын ангилалд өөрийгөө хязгаарлах боломжийг олгодог уу? = 0 үед + 1 x үед. Хамгийн бага квадратын аргыг ашиглан y = b 0 +b 1 x регрессийн тэгшитгэлийн тооцоог олно. Харьцуулбал, Зураг дээр. 1 нь жинхэнэ регрессийн функц y \u003d 2x 1.5, онолын ойролцоо регрессийн функцийн графикуудыг харуулж байна уу? = 0 + үед 1 x .

Бид регрессийн функцийн анги сонгохдоо алдаа гаргасан бөгөөд энэ нь статистикийн судалгааны практикт нэлээд түгээмэл байдаг тул бидний гаргасан статистикийн дүгнэлт, тооцоо алдаатай байх болно. Бид ажиглалтын хэмжээг хэчнээн ихэсгэсэн ч y-ийн түүврийн тооцоолол f(x) жинхэнэ регрессийн функцтэй ойртохгүй. Хэрэв бид регрессийн функцүүдийн ангиллыг зөв сонгосон бол f (x)-ийн тайлбарт алдаа гарах уу? Зөвхөн хязгаарлагдмал түүврийн хэмжээгээр тайлбарлаж болно.

Анхны статистик мэдээллээс үр дүнтэй үзүүлэлт y(x) ба үл мэдэгдэх регрессийн функц f(x) = M(y/x)-ын нөхцөлт утгыг хамгийн сайн сэргээхийн тулд дараах хангалттай байдлын шалгууруудыг (алдагдлын функц) ихэвчлэн ашигладаг. .

Хамгийн бага квадрат арга. Үүний дагуу үр дүнтэй y үзүүлэлтийн ажиглагдсан утгуудын (i = 1,2,..., n) загварын утгаас квадрат хазайлтыг багасгасан. = f(x i), энд x i нь i-р ажиглалтын аргументуудын векторын утга:

Хамгийн бага модулиудын арга. Үүний дагуу модульчлагдсан утгуудаас үр дүнтэй үзүүлэлтийн ажиглагдсан утгуудын үнэмлэхүй хазайлтын нийлбэрийг багасгасан. Тэгээд бид авдаг = f(x i), дундаж үнэмлэхүй медиан регресс? |y i - f(х i)| >мин.

Регрессийн шинжилгээ нь арга юм Статистикийн дүн шинжилгээ y санамсаргүй хэмжигдэхүүний x j = (j=1,2,..., k) хувьсагчдаас хамаарал нь регрессийн шинжилгээнд хамааралгүй гэж үзсэн. санамсаргүй хэмжигдэхүүн, жинхэнэ тархалтын хуулиас үл хамааран x j.

y санамсаргүй хэмжигдэхүүн нь x/ (/ = 1, 2, ..., k) аргументуудын функц болох нөхцөлт математикийн хүлээлт y бүхий хэвийн тархалтын хуультай байдаг гэж ихэвчлэн таамаглаж байна. аргументууд, дисперс y 2 .

Ерөнхийдөө регрессийн шинжилгээний шугаман загвар нь дараахь хэлбэртэй байна.

Ю = Y к j=0 in jв j1 , x 2 . . .. ,x к)+E

Энд c j нь түүний хувьсагчийн зарим функц юм - x 1, x 2. . .. ,x k , E нь тэг математикийн хүлээлттэй, y 2 дисперстэй санамсаргүй хэмжигдэхүүн юм.

Регрессийн шинжилгээнд үндэслэн регрессийн тэгшитгэлийн төрлийг сонгоно бие махбодьсудалж буй үзэгдэл, ажиглалтын үр дүн.

Регрессийн тэгшитгэлийн үл мэдэгдэх параметрүүдийн тооцоог ихэвчлэн хамгийн бага квадратын аргаар олдог. Доор бид энэ асуудлыг илүү нарийвчлан авч үзэх болно.

2D шугаман тэгшитгэлрегресс. Судалж буй үзэгдлийн дүн шинжилгээнд үндэслэн "дунджаар" y байна гэж үзье. шугаман функц x-ээс, өөрөөр хэлбэл регрессийн тэгшитгэл байна

y \u003d M (y / x) \u003d 0 + 1 x үед)

Энд M(y1x) нь өгөгдсөн х-ийн санамсаргүй хэмжигдэхүүний у-ийн нөхцөлт математик хүлээлт; 0 ба 1 үед - түүврийн ажиглалтын үр дүнгээс тооцоолох ёстой ерөнхий популяцийн үл мэдэгдэх параметрүүд.

0 ба 1-ийн параметрүүдийг үнэлэхийн тулд n хэмжээтэй түүврийг хоёр хэмжээст ерөнхий олонлогоос (x, y) авлаа гэж бодъё, энд (x, y,) нь i-р ажиглалтын үр дүн (i). = 1, 2,..., n) . Энэ тохиолдолд регрессийн шинжилгээний загвар нь дараах хэлбэртэй байна.

y j = 0 + үед 1 x+e j .

Энд e j .- бие даасан хэвийн тархалттай санамсаргүй хэмжигдэхүүнүүд нь тэг математикийн хүлээлт ба дисперс y 2, өөрөөр хэлбэл M e j . = 0;

D e j .= y 2 бүх i = 1, 2,..., n.

Хамгийн бага квадратын аргын дагуу 0 ба 1-ийн үл мэдэгдэх параметрүүдийг тооцоолохдоо түүврийн шинж чанаруудын b 0 ба b 1 утгуудын утгын квадрат хазайлтын нийлбэрийг багасгахын тулд ийм утгыг авах ёстой. үр дүнтэй шинж чанар y i нөхцөл байдлаас математикийн хүлээлт? би

Бид эдийн засгийн үйл ажиллагааны дундаж хэмжээ, үзүүлэлт бүхий арван долоон ердийн аж ахуйн нэгжийн жишээг ашиглан аж ахуйн нэгжийн ашигт маркетингийн шинж чанарын нөлөөллийг тодорхойлох аргачлалыг авч үзэх болно.

Асуудлыг шийдэхдээ бид анхаарч үзсэн дараах шинж чанаруудүр дүнд нь тодорхойлсон асуулгахамгийн чухал (чухал):

* аж ахуйн нэгжийн шинэлэг үйл ажиллагаа;

* бүтээгдэхүүний нэр төрлийг төлөвлөх;

* үүсэх үнийн бодлого;

* олон нийттэй харилцах;

* маркетингийн систем;

* ажилчдын урамшууллын систем.

Хүчин зүйлээр харьцуулах тогтолцооны үндсэн дээр квадрат матрицуудхүчин зүйл тус бүрийн харьцангуй тэргүүлэх чиглэлийн утгыг тооцсон зэргэлдээ байдал: аж ахуйн нэгжийн шинэлэг үйл ажиллагаа, бүтээгдэхүүний нэр төрлийг төлөвлөх, үнийн бодлого, зар сурталчилгаа, олон нийттэй харилцах, борлуулалтын систем, ажилчдын урамшууллын систем.

Компанийн мэргэжилтнүүдийн санал асуулгын үр дүнд "олон нийттэй харилцах" хүчин зүйлийн тэргүүлэх чиглэлүүдийн тооцооллыг олж авсан. Дараах тэмдэглэгээг хүлээн зөвшөөрнө: > (илүү сайн), > (илүү сайн эсвэл ижил), = (тэнцүү),< (хуже или одинаково), <

Дараа нь аж ахуйн нэгжийн маркетингийн түвшинг цогцоор нь үнэлэх асуудлыг шийдсэн. Шалгуур үзүүлэлтийг тооцоолохдоо авч үзсэн тодорхой шинж чанаруудын ач холбогдлыг (жин) тодорхойлж, тодорхой үзүүлэлтүүдийн шугаман эргэлтийн асуудлыг шийдсэн. Мэдээллийн боловсруулалтыг тусгайлан боловсруулсан програмын дагуу явуулсан.

Дараа нь аж ахуйн нэгжийн маркетингийн түвшингийн иж бүрэн үнэлгээг тооцоолсон - маркетингийн коэффициентийг 1-р хүснэгтэд оруулсан болно. Үүнээс гадна дээрх хүснэгтэд аж ахуйн нэгжийг бүхэлд нь тодорхойлсон үзүүлэлтүүдийг оруулсан болно. Хүснэгт дэх өгөгдлийг регрессийн шинжилгээнд ашиглана. Үр дүн нь ашиг юм. Маркетингийн коэффициентийн зэрэгцээ дараахь үзүүлэлтүүдийг хүчин зүйлийн шинж тэмдэг болгон ашигласан: нийт бүтээгдэхүүний хэмжээ, үндсэн хөрөнгийн өртөг, ажилчдын тоо, мэргэшлийн коэффициент.

Хүснэгт 1 - Регрессийн шинжилгээний эхний өгөгдөл


Хүснэгт дэх өгөгдөл дээр үндэслэн корреляцийн коэффициентүүдийн хамгийн чухал утгатай хүчин зүйлсийн үндсэн дээр ашгийн хүчин зүйлээс хамаарлын регрессийн функцийг бүтээв.

Манай тохиолдолд регрессийн тэгшитгэл нь дараах хэлбэртэй байна.

Регрессийн тэгшитгэлийн коэффициентүүд нь ашгийн хэмжээнд дээр дурдсан хүчин зүйлсийн тоон нөлөөллийн талаар өгүүлдэг. Тэд хүчин зүйлийн тэмдэг нэг нэгжээр өөрчлөгдөхөд түүний үнэ цэнэ хэдэн мянган рубль өөрчлөгдөж байгааг харуулдаг. Тэгшитгэлээс харахад маркетингийн хольцын харьцаа нэг нэгжээр нэмэгдэх нь ашиг 1547.7 мянган рублиэр нэмэгддэг. Энэ нь маркетингийн үйл ажиллагааг сайжруулахад аж ахуйн нэгжүүдийн эдийн засгийн үзүүлэлтийг сайжруулах асар их боломж байгааг харуулж байна.

Маркетингийн үр ашгийг судлахад хамгийн сонирхолтой бөгөөд хамгийн чухал хүчин зүйл бол X5 хүчин зүйл болох маркетингийн коэффициент юм. Статистикийн онолын дагуу одоо байгаа олон тооны регрессийн тэгшитгэлийн давуу тал нь маркетингийн хүчин зүйл зэрэг хүчин зүйл бүрийн тусгаарлагдсан нөлөөллийг үнэлэх чадвар юм.

Гүйцэтгэсэн регрессийн шинжилгээний үр дүн нь тэгшитгэлийн параметрүүдийг тооцоолохоос илүү өргөн хэрэглэгддэг. Аж ахуйн нэгжүүдийг харьцангуй сайн эсвэл харьцангуй муу гэж ангилах (Kef,) шалгуур нь үр дүнгийн харьцангуй үзүүлэлт дээр суурилдаг.

Энд Y факти нь i-р аж ахуйн нэгжийн бодит үнэ цэнэ, мянган рубль;

Y тооцоолсон - регрессийн тэгшитгэлийн дагуу тооцоолсон i-р аж ахуйн нэгжийн ашгийн үнэ цэнэ.

Шийдэж буй асуудлын хувьд утгыг "үр ашгийн хүчин зүйл" гэж нэрлэдэг. Коэффициентийн утга нэгээс их байх тохиолдолд аж ахуйн нэгжийн үйл ажиллагааг үр дүнтэй гэж үзэж болно. Энэ нь бодит ашиг нь түүврийн дундаж ашгаас их байна гэсэн үг юм.

Бодит болон тооцоолсон ашгийн утгыг Хүснэгтэнд үзүүлэв. 2.

Хүснэгт 2 - Регрессийн загвар дахь үр дүнтэй шинж чанарын шинжилгээ

Хүснэгтийн дүн шинжилгээнээс харахад манай тохиолдолд 3, 5, 7, 9, 12, 14, 15, 17-р аж ахуйн нэгжүүдийн үйл ажиллагаа амжилттай болсон гэж үзэж болно.

Үүнтэй төстэй нийтлэлүүд

2022 parki48.ru. Бид хүрээ байшин барьж байна. Тохижилт. Барилга. Суурь.