Регрессийн шинжилгээний тодорхойлолт. Шугаман регрессийн үндэс

ҮР ДҮН

Хүснэгт 8.3a. Регрессийн статистик
Регрессийн статистик
Олон Р 0,998364
R-дөрвөлжин 0,99673
Нормчилсан R квадрат 0,996321
стандарт алдаа 0,42405
Ажиглалт 10

Эхлээд бодож үзээрэй дээд хэсэг 8.3а хүснэгтэд үзүүлсэн тооцоолол - регрессийн статистик.

Тодорхой байдлын хэмжүүр гэж нэрлэгддэг R-квадрат утга нь үүссэн регрессийн шугамын чанарыг тодорхойлдог. Энэ чанар нь анхны өгөгдөл болон регрессийн загвар (тооцсон өгөгдөл) хоорондын уялдаа холбоогоор илэрхийлэгддэг. Тодорхой байдлын хэмжүүр нь үргэлж интервал дотор байдаг.

Ихэнх тохиолдолд R-квадрат утга нь эдгээр утгуудын хооронд байдаг бөгөөд үүнийг хэт туйл гэж нэрлэдэг, i.e. тэг ба нэг хооронд.

Хэрэв R квадратын утга нэгтэй ойролцоо байвал уг загвар нь харгалзах хувьсагчдын бараг бүх хувьсагчийг тайлбарладаг гэсэн үг юм. Үүний эсрэгээр, R-квадрат утга нь тэгтэй ойролцоо байвал бүтээгдсэн загварын чанар муу байна гэсэн үг.

Бидний жишээн дээр тодорхой байдлын хэмжүүр нь 0.99673 бөгөөд энэ нь регрессийн шугам нь анхны өгөгдөлтэй маш сайн тохирч байгааг харуулж байна.

Олон Р- коэффициент олон хамаарал R - бие даасан хувьсагч (X) ба хамааралтай хувьсагчийн (Y) хамаарлын зэргийг илэрхийлнэ.

Олон R нь тэнцүү квадрат язгууртодорхойлох коэффициентээс энэ утга нь тэгээс нэг хүртэлх утгыг авна.

Энгийн шугаман регрессийн шинжилгээнд олон тооны R нь Пирсон корреляцийн коэффициенттэй тэнцүү байна. Үнэн хэрэгтээ манай тохиолдолд олон тооны R нь өмнөх жишээний (0.998364) Pearson корреляцийн коэффициенттэй тэнцүү байна.

Хүснэгт 8.3б. Регрессийн коэффициентүүд
Магадлал стандарт алдаа t-статистик
Y уулзвар 2,694545455 0,33176878 8,121757129
Хувьсагч X 1 2,305454545 0,04668634 49,38177965
* Тооцооллын тайруулсан хувилбарыг өгсөн болно

Одоо бод дунд хэсэгтооцооллыг хүснэгт 8.3б-д үзүүлэв. Энд регрессийн коэффициент b (2.305454545) ба y тэнхлэгийн дагуух офсетийг өгөв, өөрөөр хэлбэл. тогтмол a (2.694545455).

Тооцоолол дээр үндэслэн бид регрессийн тэгшитгэлийг дараах байдлаар бичиж болно.

Ү= x*2.305454545+2.694545455

Хувьсагчдын хоорондын харилцааны чиглэлийг шинж тэмдгүүд (сөрөг эсвэл эерэг) дээр үндэслэн тодорхойлно. регрессийн коэффициентууд(коэффицент b).

Хэрэв тэмдэг байвал регрессийн коэффициент- эерэг, хамааралтай хувьсагчийн хамаарал нь бие даасан хувьсагчтай эерэг байх болно. Манай тохиолдолд регрессийн коэффициентийн тэмдэг эерэг байгаа тул хамаарал нь мөн эерэг байна.

Хэрэв тэмдэг байвал регрессийн коэффициент- сөрөг, хамааралтай хувьсагч ба бие даасан хувьсагчийн хоорондын хамаарал сөрөг (урвуу).

Хүснэгт 8.3в. үлдэгдэл гаралтын үр дүнг танилцуулж байна. Эдгээр үр дүнг тайланд харуулахын тулд "Регресс" хэрэгслийг ажиллуулахдаа "Үлдэгдэл" нүдийг идэвхжүүлэх шаардлагатай.

ҮЛДЭГДСЭН ТАТАА

Хүснэгт 8.3c. Үлдсэн
Ажиглалт Таамагласан Y Үлдсэн Стандарт үлдэгдэл
1 9,610909091 -0,610909091 -1,528044662
2 7,305454545 -0,305454545 -0,764022331
3 11,91636364 0,083636364 0,209196591
4 14,22181818 0,778181818 1,946437843
5 16,52727273 0,472727273 1,182415512
6 18,83272727 0,167272727 0,418393181
7 21,13818182 -0,138181818 -0,34562915
8 23,44363636 -0,043636364 -0,109146047
9 25,74909091 -0,149090909 -0,372915662
10 28,05454545 -0,254545455 -0,636685276

Тайлангийн энэ хэсгийг ашиглан бид регрессийн байгуулсан шугамаас цэг бүрийн хазайлтыг харж болно. Хамгийн их үнэмлэхүй үнэ цэнэ

Регрессийн шинжилгээ нь судлагдсан шинж чанаруудын хоорондын стохастик хамаарлын аналитик илэрхийлэлийг тогтоох арга юм. Регрессийн тэгшитгэл нь дунджаар хэрхэн өөрчлөгдөж байгааг харуулдаг цагталь нэгийг нь өөрчлөх үед x би , мөн иймэрхүү харагдаж байна:

хаана у -хамааралтай хувьсагч (энэ нь үргэлж нэг);

X би - бие даасан хувьсагч (хүчин зүйл) (тэдгээрийн хэд хэдэн байж болно).

Хэрэв ганц бие даасан хувьсагч байгаа бол энэ нь энгийн регрессийн шинжилгээ юм. Хэрэв хэд хэдэн байвал П 2), тэгвэл ийм шинжилгээг multivariate гэж нэрлэдэг.

Регрессийн шинжилгээний явцад хоёр үндсэн ажлыг шийддэг.

    регрессийн тэгшитгэлийг бүтээх, i.e. үр дүнгийн үзүүлэлт ба бие даасан хүчин зүйлсийн хоорондын хамаарлын төрлийг олох x 1 , x 2 , …, x n .

    үүссэн тэгшитгэлийн ач холбогдлын үнэлгээ, i.e. Сонгосон хүчин зүйлийн онцлог шинж чанаруудын өөрчлөлтийг хэр их тайлбарлаж байгааг тодорхойлох y.

Регрессийн шинжилгээг голчлон төлөвлөлт, түүнчлэн зохицуулалтын тогтолцоог боловсруулахад ашигладаг.

Дургүй корреляцийн шинжилгээЗөвхөн шинжлэгдсэн шинж чанаруудын хооронд хамаарал байгаа эсэх асуултад хариулдаг регрессийн шинжилгээ нь албан ёсны илэрхийлэлийг өгдөг. Нэмж дурдахад, корреляцийн шинжилгээ нь хүчин зүйлсийн аливаа хамаарлыг судалдаг бол регрессийн шинжилгээ нь нэг талын хамаарлыг судалдаг, өөрөөр хэлбэл. хүчин зүйлийн тэмдгүүдийн өөрчлөлт нь үр дүнгийн тэмдэгт хэрхэн нөлөөлж байгааг харуулсан холболт.

Регрессийн шинжилгээ нь хамгийн хөгжсөн аргуудын нэг юм математик статистик. Хатуухан хэлэхэд регрессийн шинжилгээг хэрэгжүүлэх нь хэд хэдэн тусгай шаардлагыг (ялангуяа, xл ,x 2 ,...,x n ;yбие даасан, хэвийн тархалттай, тогтмол хэлбэлзэлтэй санамсаргүй хэмжигдэхүүн байх ёстой). AT жинхэнэ амьдралрегрессийн болон корреляцийн шинжилгээний шаардлагыг чанд дагаж мөрдөх нь маш ховор боловч эдийн засгийн судалгаанд эдгээр хоёр арга нь маш түгээмэл байдаг. Эдийн засаг дахь хамаарал нь зөвхөн шууд бус, урвуу ба шугаман бус байж болно. Ямар ч хамаарал байгаа тохиолдолд регрессийн загварыг барьж болно, гэхдээ олон хувьсагчтай шинжилгээнд зөвхөн шугаман хэлбэрийн загварыг ашигладаг.

Регрессийн тэгшитгэлийг бүтээх ажлыг дүрмээр бол аргын дагуу гүйцэтгэдэг хамгийн бага квадратуудҮүний мөн чанар нь үүссэн шинж чанарын бодит утгын квадрат хазайлтын нийлбэрийг тооцоолсон утгаас нь багасгах явдал юм, тухайлбал:

хаана т -ажиглалтын тоо;

j =a+b 1 x 1 j 2 x 2 j + ... + б n X n j - үр дүнгийн хүчин зүйлийн тооцоолсон утга.

Регрессийн коэффициентийг хувийн компьютер эсвэл тусгай санхүүгийн тооцоолуурын аналитик багц ашиглан тодорхойлохыг зөвлөж байна. Хамгийн энгийн тохиолдолд нэг хүчин зүйлийн шугаман регрессийн тэгшитгэлийн регрессийн коэффициентүүд y = a + bxтомъёог ашиглан олж болно:

кластерийн шинжилгээ

Кластерийн шинжилгээ нь элементүүд нь олон шинж чанараараа тодорхойлогддог популяцийг бүлэглэх (бүлэглэх) зорилготой олон хувьсагчийн шинжилгээний аргуудын нэг юм. Онцлог бүрийн утгууд нь шинж чанаруудын олон хэмжээст орон зайд судлагдсан популяцийн нэгж бүрийн координат болдог. Хэд хэдэн үзүүлэлтийн утгуудаар тодорхойлогддог ажиглалт бүрийг эдгээр үзүүлэлтүүдийн орон зайд цэг хэлбэрээр илэрхийлж болох бөгөөд тэдгээрийн утгыг олон хэмжээст орон зайд координат гэж үздэг. Цэгүүдийн хоорондох зай Рболон q-тай ккоординатыг дараах байдлаар тодорхойлно.

Кластер хийх гол шалгуур нь кластеруудын ялгаа нь нэг кластерт хуваарилагдсан ажиглалтын хоорондох ялгаанаас илүү чухал байх ёстой. олон хэмжээст орон зайд тэгш бус байдлыг ажиглах ёстой:

хаана r 1, 2 - кластер 1 ба 2-ын хоорондох зай.

Регрессийн шинжилгээний процедурын нэгэн адил кластер хийх процедур нь маш их хөдөлмөр шаарддаг тул үүнийг компьютер дээр хийхийг зөвлөж байна.

Түүний бүтээлүүд 1908 оноос хойш хийгдсэн. Тэр үүнийг үл хөдлөх хөрөнгө худалддаг төлөөлөгчийн ажлын жишээн дээр тайлбарлав. Тэмдэглэлдээ орон сууцны борлуулалтын мэргэжилтэн тодорхой барилга тус бүрийн өргөн хүрээний оролтын өгөгдлийн бүртгэлийг хөтөлжээ. Дуудлага худалдааны дүнгээр ямар хүчин зүйл байгааг тогтоосон хамгийн их нөлөөгүйлгээний үнэ хүртэл.

Шинжилгээ их тоогүйлгээ нь сонирхолтой үр дүнд хүрсэн. Эцсийн үнэд олон хүчин зүйл нөлөөлсөн бөгөөд заримдаа хачирхалтай дүгнэлтэд хүргэж, анхны өндөр боломж бүхий байшинг хямд үнээр зарах үед шууд "гадна" байсан.

Ийм дүн шинжилгээг ашиглах хоёр дахь жишээ бол ажилчдын цалин хөлсийг тодорхойлох үүрэг хүлээсэн ажил юм. Даалгаврын нарийн төвөгтэй байдал нь хүн бүрт тогтмол хэмжээгээр хуваарилах биш, харин түүний үнэ цэнийг гүйцэтгэсэн тодорхой ажилтай хатуу нийцүүлэхийг шаарддаг байв. Бараг ижил төстэй шийдэл бүхий олон асуудал гарч ирсэн нь тэдгээрийг математикийн түвшинд илүү нарийвчлан судлах шаардлагатай байв.

"Регрессийн шинжилгээ" гэсэн хэсэгт нэлээд байр суурь эзэлдэг практик аргуудрегрессийн үзэл баримтлалд хамаарах хамаарлыг судлахад ашигладаг. Статистикийн судалгааны явцад олж авсан өгөгдлүүдийн хооронд эдгээр хамаарал ажиглагдаж байна.

Шийдвэрлэх олон ажлуудын дунд тэрээр регрессийн тэгшитгэлийн тодорхойлолт гэсэн гурван үндсэн зорилгыг өөртөө тавьдаг. ерөнхий үзэл; регрессийн тэгшитгэлийн нэг хэсэг болох үл мэдэгдэх параметрүүдийн тооцоолол; статистикийн регрессийн таамаглалыг шалгах. Туршилтын ажиглалтын үр дүнд олж авсан хос хэмжигдэхүүнүүдийн хооронд үүсэх хамаарлыг судлах явцад (x1, y1), ..., (xn, yn) төрлийн цуваа (иж бүрдэл) бүрдүүлдэг. регрессийн онолын заалтууд ба нэг Y хэмжигдэхүүний хувьд тодорхой магадлалын тархалт ажиглагдаж байхад нөгөө X нь тогтмол хэвээр байна гэж үзнэ.

Y үр дүн нь X хувьсагчийн утгаас хамаардаг бөгөөд энэ хамаарлыг янз бүрийн хэв маягаар тодорхойлж болох бөгөөд олж авсан үр дүнгийн нарийвчлал нь ажиглалтын шинж чанар, шинжилгээний зорилгод нөлөөлдөг. Туршилтын загвар нь энгийн боловч үнэмшилтэй тодорхой таамаглал дээр суурилдаг. Гол нөхцөл нь X параметр нь хяналттай утга юм. Түүний утгыг туршилт эхлэхээс өмнө тогтоодог.

Туршилтын явцад хяналтгүй XY-ийн хос утгыг ашигладаг бол регрессийн шинжилгээг ижил аргаар хийдэг боловч үр дүнг тайлбарлахын тулд судлагдсан үр дүнгийн хоорондын хамаарал санамсаргүй хэмжигдэхүүн, арга хэрэглэж байна Математик статистикийн аргууд нь хийсвэр сэдэв биш. Тэд амьдралдаа хамгийн их хэрэглэгдэхүүнээ олдог янз бүрийн талбаруудхүний ​​үйл ажиллагаа.

AT шинжлэх ухааны уран зохиололсон дээрх аргыг тодорхойлох өргөн хэрэглээшугаман регрессийн шинжилгээ гэсэн нэр томъёо. Х хувьсагчийн хувьд регрессор эсвэл таамаглагч гэсэн нэр томъёог ашигладаг бөгөөд хамааралтай Y-хувьсагчдыг шалгуур үзүүлэлт гэж нэрлэдэг. Энэ нэр томьёо нь зөвхөн хувьсагчдын математикийн хамаарлыг тусгасан боловч учир шалтгааны хамаарлыг илэрхийлдэггүй.

Регрессийн шинжилгээолон төрлийн ажиглалтын үр дүнг боловсруулахад ашигладаг хамгийн түгээмэл арга юм. Физик болон биологийн хамаарлыг энэ аргаар судалдаг бөгөөд үүнийг эдийн засаг, технологийн аль алинд нь хэрэгжүүлдэг. Бусад олон талбарууд регрессийн шинжилгээний загварыг ашигладаг. дисперсийн шинжилгээ, Статистикийн дүн шинжилгээолон хэмжээст сургалтын энэ горимтой нягт хамтран ажиллах.

Регрессийн шинжилгээний зорилго нь хамааралтай хувьсагч ба нэг (хос регрессийн шинжилгээ) ба түүнээс дээш (олон) бие даасан хувьсагчийн хоорондын хамаарлыг хэмжих явдал юм. Бие даасан хувьсагчдыг хүчин зүйл, тайлбарлагч, тодорхойлогч, регресс, таамаглагч гэж нэрлэдэг.

Хараат хувьсагчийг заримдаа тодорхойлсон, тайлбарласан эсвэл "хариу" хувьсагч гэж нэрлэдэг. туйлын өргөн хэрэглээЭмпирик судалгаанд регрессийн шинжилгээ хийх нь зөвхөн таамаглалыг шалгахад тохиромжтой хэрэгсэл болдогтой холбоотой биш юм. Регресс, ялангуяа олон регресс нь юм үр дүнтэй аргазагварчлал ба таамаглал.

Регрессийн шинжилгээтэй ажиллах зарчмуудыг илүү энгийн буюу хос аргаар тайлбарлаж эхэлцгээе.

Хос регрессийн шинжилгээ

Регрессийн шинжилгээг ашиглах эхний алхамууд нь корреляцийн коэффициентийг тооцоолох хүрээнд бидний хийсэн алхамуудтай бараг ижил байх болно. Пирсоны аргыг ашиглан корреляцийн шинжилгээний үр дүнтэй байх гурван үндсэн нөхцөл - хувьсагчдын хэвийн тархалт, хувьсагчдын интервалын хэмжилт, хувьсагчдын хоорондох шугаман хамаарал нь олон регрессийн хувьд мөн хамааралтай. Үүний дагуу эхний шатанд тархалтын графикийг байгуулж, хувьсагчдын статистик болон тайлбарласан шинжилгээг хийж, регрессийн шугамыг тооцоолно. Корреляцийн шинжилгээний хүрээнд регрессийн шугамыг хамгийн бага квадратын аргыг ашиглан байгуулдаг.

Өгөгдлийн шинжилгээний хоёр аргын ялгааг илүү тодорхой харуулахын тулд "SPS дэмжлэг" болон "хөдөөгийн хүн амын эзлэх хувь" хувьсагчдад аль хэдийн авч үзсэн жишээнд хандъя. Анхны өгөгдөл нь ижил байна. Тархалтын графикийн ялгаа нь регрессийн шинжилгээнд хамааралтай хувьсагчийг зурах нь зөв байх болно - манай тохиолдолд Y тэнхлэгийн дагуу "SPS дэмжлэг" байдаг бол корреляцийн шинжилгээнд энэ нь хамаагүй. Хажуу утгыг цэвэрлэсний дараа тархалтын график дараах байдалтай байна.

Регрессийн шинжилгээний үндсэн санаа нь байх явдал юм ерөнхий чиг хандлагаХувьсагчдын хувьд - регрессийн шугам хэлбэрээр - бие даасан утгатай байх хамааралтай хувьсагчийн утгыг урьдчилан таамаглах боломжтой.

Ердийн математикийг төсөөлөөд үз дээ шугаман функц. Евклидийн орон зай дахь дурын шугамыг дараах томъёогоор тодорхойлж болно.

энд a нь y тэнхлэгийн дагуух офсетийг тодорхойлдог тогтмол; b - шугамын өнцгийг тодорхойлох коэффициент.

Налуу ба тогтмолыг мэдсэнээр та дурын x-ийн хувьд y-ийн утгыг тооцоолж (урьдчилан таамаглаж) болно.

Энэхүү хамгийн энгийн функц нь бид y-ийн утгыг яг тодорхой бус, харин тодорхой хугацаанд урьдчилан таамаглах нөхцөлтэйгөөр регрессийн шинжилгээний загварын үндэс болсон юм. итгэлийн интервал, өөрөөр хэлбэл ойролцоогоор.

Тогтмол хэмжигдэхүүн нь регрессийн шугам ба у тэнхлэгийн огтлолцох цэг юм (статистикийн багцад ихэвчлэн "таслах" гэж нэрлэдэг F-тасралт). SPS-д санал өгөх бидний жишээнд түүний дугуйрсан утга нь 10.55 байх болно. Налуугийн коэффициент b нь ойролцоогоор -0.1-тэй тэнцүү байх болно (корреляцийн шинжилгээнд тэмдэг нь харилцааны төрлийг харуулж байна - шууд эсвэл урвуу). Тиймээс үүссэн загвар нь SP C = -0.1 x Sel шиг харагдах болно. бид. + 10.55.

ATP \u003d -0.10 x 47 + 10.55 \u003d 5.63.

Анхны болон урьдчилан таамагласан утгуудын хоорондох ялгааг үлдэгдэл гэж нэрлэдэг (бид статистикийн үндсэн ойлголт болох гэнэтийн хүснэгтэд дүн шинжилгээ хийхдээ аль хэдийн тулгарч байсан). Тиймээс, Бүгд Найрамдах Адыгей улсын хувьд үлдэгдэл нь 3.92 - 5.63 = -1.71 болно. Үлдэгдэл модулийн утга их байх тусам утгыг сайн таамаглахгүй.

Бид бүх тохиолдлын хувьд таамагласан утга ба үлдэгдлийг тооцдог.
Болж байна Бямба. бид. THX

(эх)

THX

(урьдчилан таамагласан)

Үлдсэн
Адыгей Бүгд Найрамдах Улс 47 3,92 5,63 -1,71 -
Алтайн бүгд найрамдах улс 76 5,4 2,59 2,81
Бүгд Найрамдах Башкортостан Улс 36 6,04 6,78 -0,74
Бүгд Найрамдах Буриад Улс 41 8,36 6,25 2,11
Бүгд Найрамдах Дагестан Улс 59 1,22 4,37 -3,15
Бүгд Найрамдах Ингушет Улс 59 0,38 4,37 3,99
гэх мэт.

Анхны болон таамагласан утгуудын харьцааны дүн шинжилгээ нь үүссэн загварын чанар, түүний урьдчилан таамаглах чадварыг үнэлэхэд тусалдаг. Регрессийн статистикийн гол үзүүлэлтүүдийн нэг нь олон хүчин зүйлкорреляци R - хамааралтай хувьсагчийн анхны болон таамагласан утгуудын хоорондын хамаарлын коэффициент. Хосолсон регрессийн шинжилгээнд энэ нь хамааралтай ба бие даасан хувьсагчийн хоорондох ердийн Pearson корреляцийн коэффициенттэй тэнцүү, манай тохиолдолд 0.63 байна. Олон R-ийг утга учиртай тайлбарлахын тулд үүнийг детерминацын коэффициент болгон хувиргах шаардлагатай. Үүнийг корреляцийн шинжилгээтэй ижил аргаар хийдэг - квадрат. Детерминацийн коэффициент R-квадрат (R 2) нь бие даасан (бие даасан) хувьсагчдаас тайлбарласан хамааралтай хувьсагчийн хэлбэлзлийн хувийг харуулдаг.

Манай тохиолдолд R 2 = 0.39 (0.63 2); Энэ нь "хөдөөгийн хүн амын эзлэх хувь" хувьсагч нь "CPS-ийн дэмжлэг" хувьсагчийн өөрчлөлтийн 40 орчим хувийг тайлбарлаж байна гэсэн үг. Детерминацийн коэффициентийн утга их байх тусам загварын чанар өндөр болно.

Загварын чанарын өөр нэг хэмжүүр бол тооцооллын стандарт алдаа юм. Энэ нь регрессийн шугамын эргэн тойронд цэгүүд хэр их "тарагдсан" хэмжүүр юм. Интервал хувьсагчдын тархалтын хэмжүүр нь стандарт хэлбэлзэл. Үүний дагуу, стандарт алдаатооцоо нь үлдэгдэл хуваарилалтын стандарт хазайлт юм. Түүний үнэ цэнэ өндөр байх тусам тархалт ихсэх ба загвар нь муу болно. Манай тохиолдолд стандарт алдаа нь 2.18 байна. Энэ хэмжээгээр манай загвар "SPS дэмжлэг" хувьсагчийн утгыг таамаглахдаа "дунджаар алдаа гаргах" болно.

Регрессийн статистикт мөн дисперсийн шинжилгээ орно. Үүний тусламжтайгаар бид дараахь зүйлийг олж мэдэв: 1) хамааралтай хувьсагчийн өөрчлөлтийн (тархалтын) ямар хувь нь бие даасан хувьсагчаар тайлбарлагдаж байгааг; 2) үлдэгдэл (тайлагдаагүй хэсэг) хамааралтай хувьсагчийн дисперсийн хэдэн хувийг эзэлдэг; 3) эдгээр хоёр утгын харьцаа хэд вэ? (/ "-харьцаа). Түүврийн судалгаанд хэлбэлзлийн статистик нь онцгой ач холбогдолтой - энэ нь бие даасан болон хамааралтай хувьсагчдын хооронд хамаарал хэр байгааг харуулдаг. хүн ам. Гэсэн хэдий ч тасралтгүй судалгааны хувьд (бидний жишээн дээрх шиг) үр дүнгийн судалгаа дисперсийн шинжилгээашигтай. Энэ тохиолдолд илэрсэн статистикийн зүй тогтол нь санамсаргүй нөхцөл байдлын хослолоос үүдэлтэй эсэх, судалгаанд хамрагдаж буй популяци байрладаг нөхцөл байдлын хувьд хэр онцлог шинж чанартай болохыг шалгана. Энэ нь зарим нэг том хүн амд олж авсан үр дүнгийн үнэн биш, харин түүний тогтмол байдлын зэрэг, санамсаргүй нөлөөллөөс ангид байх явдал юм.

Манай тохиолдолд дисперсийн статистикийн шинжилгээ дараах байдалтай байна.

SS df MS Ф утга учир
Регресс. 258,77 1,00 258,77 54,29 0.000000001
Үлдсэн 395,59 83,00 Л,11
Нийт 654,36

54.29-ийн F-харьцаа нь 0.0000000001 түвшинд чухал ач холбогдолтой. Үүний дагуу бид тэг таамаглалыг (бидний олсон харилцаа санамсаргүй гэсэн) үгүйсгэж чадна.

t шалгуур нь ижил төстэй функцийг гүйцэтгэдэг, гэхдээ үүнтэй холбоотой регрессийн коэффициентууд(булан ба F хөндлөн). / шалгуурыг ашиглан бид ерөнхий популяцийн регрессийн коэффициентүүд тэгтэй тэнцүү гэсэн таамаглалыг шалгана. Манай тохиолдолд бид тэг таамаглалыг дахин итгэлтэйгээр үгүйсгэж чадна.

Олон регрессийн шинжилгээ

Олон регрессийн загвар нь хос регрессийн загвартай бараг адилхан; Ганц ялгаа нь шугаман функцэд хэд хэдэн бие даасан хувьсагчийг дараалан оруулсан явдал юм.

Y = b1X1 + b2X2 + …+ bpXp + a.

Хэрэв хоёроос олон бие даасан хувьсагч байвал бид авч чадахгүй харааны танилцуулгаТэдний харилцааны талаар, энэ талаар олон регресс нь хосолсон регрессээс бага "харагдах" юм. Хоёр бие даасан хувьсагч байгаа тохиолдолд өгөгдлийг 3D тархалтын графикт харуулах нь ашигтай байж болно. Мэргэжлийн статистикийн програм хангамжийн багцад (жишээлбэл, Statistica) гурван хэмжээст диаграмыг эргүүлэх сонголт байдаг бөгөөд энэ нь өгөгдлийн бүтцийг сайн дүрслэн харуулах боломжийг олгодог.

Хамт ажиллаж байхдаа олон регресс, уурын өрөөнөөс ялгаатай нь шинжилгээний алгоритмыг тодорхойлох шаардлагатай. Стандарт алгоритм нь эцсийн регрессийн загварт байгаа бүх таамаглагчдыг багтаасан болно. алхам алхмаар алгоритмБие даасан хувьсагчдыг тайлбарлах "жин" дээр үндэслэн дараалан оруулах (хасах) орно. алхам алхмаар аргаолон бие даасан хувьсагчтай үед сайн; энэ нь илэн далангүй сул таамаглагчдын загварыг "цэвэрлэж", илүү нягт, товч болгодог.

Олон тооны регрессийн зөв байдлын нэмэлт нөхцөл (интервал, хэвийн байдал, шугаман байдлын хамт) нь олон шугаман байдал байхгүй - бие даасан хувьсагчдын хооронд хүчтэй хамаарал байх явдал юм.

Олон тооны регрессийн статистикийн тайлбар нь хос регрессийн тохиолдолд авч үзсэн бүх элементүүдийг агуулдаг. Үүнээс гадна олон регрессийн шинжилгээний статистикийн бусад чухал бүрэлдэхүүн хэсгүүд байдаг.

Бид Оросын бүс нутгуудын сонгуулийн үйл ажиллагааны түвшний ялгааг тайлбарласан таамаглалыг турших жишээн дээр олон тооны регресс бүхий ажлыг харуулах болно. Тусгай эмпирик судалгаагаар сонгогчдын ирцэд дараахь зүйлс нөлөөлдөг болохыг харуулж байна.

Үндэсний хүчин зүйл (хувьсагч "Оросын хүн ам"; ОХУ-ын бүрдүүлэгч байгууллагууд дахь Оросын хүн амын эзлэх хувь хэлбэрээр үйл ажиллагаа явуулдаг). Оросын хүн амын эзлэх хувь нэмэгдэх нь сонгогчдын ирц буурахад хүргэдэг гэж үздэг;

Хотжилтын хүчин зүйл ("хотын хүн ам" хувьсах хэмжигдэхүүн; ОХУ-ын бүрэлдэхүүнд багтах хотын хүн амын эзлэх хувь хэлбэрээр үйл ажиллагаа явуулдаг, бид энэ хүчин зүйлийг корреляцийн шинжилгээний нэг хэсэг болгон ажиллаж байсан). Хотын хүн амын эзлэх хувь нэмэгдэх нь сонгогчдын ирц буурахад хүргэдэг гэж үздэг.

Хамаарах хувьсагч - "Сонгуулийн үйл ажиллагааны эрч хүч" ("идэвхтэй") нь 1995-2003 оны холбооны сонгуулийн бүс нутгийн ирцийн дундаж мэдээллээр тодорхойлогддог. Хоёр бие даасан, нэг хамааралтай хувьсагчийн анхны мэдээллийн хүснэгт нь дараах хэлбэртэй байна. :

Болж байна Хувьсагч
Хөрөнгө. Гор. бид. Орос. бид.
Адыгей Бүгд Найрамдах Улс 64,92 53 68
Алтайн бүгд найрамдах улс 68,60 24 60
Бүгд Найрамдах Буриад Улс 60,75 59 70
Бүгд Найрамдах Дагестан Улс 79,92 41 9
Бүгд Найрамдах Ингушет Улс 75,05 41 23
Бүгд Найрамдах Халимаг Улс 68,52 39 37
Карачай-Черкес бүгд найрамдах улс 66,68 44 42
Бүгд Найрамдах Карелия Улс 61,70 73 73
Коми Бүгд Найрамдах Улс 59,60 74 57
Бүгд Найрамдах Мари Эл 65,19 62 47

гэх мэт. (ялгааг цэвэрлэсний дараа 88 тохиолдолоос 83 тохиолдол үлдсэн)

Загварын чанарыг тодорхойлсон статистик:

1. Олон тооны R = 0.62; L квадрат = 0.38. Тиймээс үндэсний хүчин зүйл болон хотжилтын хүчин зүйл нь "сонгуулийн үйл ажиллагаа" хувьсагчийн хэлбэлзлийн 38 орчим хувийг тайлбарлаж байна.

2. Дундаж алдаа 3.38 байна. Баригдсан загвар нь сонгуулийн ирцийн түвшинг урьдчилан таамаглахад "дунджаар" ийм алдаатай байдаг.

3. Тайлбартай ба тайлбарлагдаагүй хэлбэлзлийн l-харьцаа 0.000000003 түвшинд 25.2 байна. Илчлэгдсэн харилцааны санамсаргүй байдлын талаархи хоосон таамаглалыг үгүйсгэв.

4. "Хотын хүн ам" ба "Оросын хүн ам" хувьсагчдын тогтмол ба регрессийн коэффициентийн шалгуур үзүүлэлт нь 0.0000001 түвшинд чухал ач холбогдолтой; 0.00005 ба 0.007 тус тус байна. Коэффициентуудын санамсаргүй байдлын талаархи тэг таамаглалыг үгүйсгэв.

Хамаарах хувьсагчийн анхны болон таамагласан утгуудын харьцааг шинжлэхэд хэрэгтэй нэмэлт статистикууд бол Махаланобисын зай ба Күүкийн зай юм. Эхнийх нь тухайн хэргийн өвөрмөц байдлын хэмжүүр юм (бүх бие даасан хувьсагчийн утгуудын хослол хэр их байгааг харуулдаг. Энэ тохиолдолдбүх бие даасан хувьсагчдын дунджаас нэгэн зэрэг хазайсан). Хоёр дахь нь тухайн хэргийн нөлөөллийн хэмжүүр юм. Өөр өөр ажиглалтууд нь регрессийн шугамын налууд янз бүрийн байдлаар нөлөөлдөг бөгөөд Күүкийн зайг ашиглан тэдгээрийг энэ үзүүлэлтийн дагуу харьцуулж болно. Энэ нь хэт давсан үзүүлэлтүүдийг цэвэрлэхэд хэрэгтэй (хэт нөлөө бүхий тохиолдол гэж үзэж болно).

Бидний жишээн дээр Дагестан бол өвөрмөц бөгөөд нөлөө бүхий тохиолдлуудын нэг юм.

Болж байна Анхны

үнэт зүйлс

Предска

үнэт зүйлс

Үлдсэн Зай

Махаланобис

Зай
Адыгей 64,92 66,33 -1,40 0,69 0,00
Алтайн бүгд найрамдах улс 68,60 69.91 -1,31 6,80 0,01
Бүгд Найрамдах Буриад Улс 60,75 65,56 -4,81 0,23 0,01
Бүгд Найрамдах Дагестан Улс 79,92 71,01 8,91 10,57 0,44
Бүгд Найрамдах Ингушет Улс 75,05 70,21 4,84 6,73 0,08
Бүгд Найрамдах Халимаг Улс 68,52 69,59 -1,07 4,20 0,00

Бодит регрессийн загвар нь дараах параметрүүдтэй байна: Y-таслалт (тогтмол) = 75.99; б (Хор. суу.) \u003d -0.1; b (Орос. нас.) = -0.06. Эцсийн томъёо.

Регрессийн шинжилгээ нь тодорхой хэмжигдэхүүнийг өөр хэмжигдэхүүн эсвэл өөр хэд хэдэн хэмжигдэхүүнээс хамаарлыг судалдаг. Регрессийн шинжилгээг голчлон дунд хугацааны таамаглал, түүнчлэн урт хугацааны таамаглалд ашигладаг. Дунд болон урт хугацааны хугацаа нь бизнесийн орчинд гарсан өөрчлөлтийг бий болгож, эдгээр өөрчлөлтүүдийн судалж буй үзүүлэлтэд үзүүлэх нөлөөллийг харгалзан үзэх боломжийг олгодог.

Регрессийн шинжилгээ хийхийн тулд дараахь зүйлийг хийх шаардлагатай.

    судлагдсан үзүүлэлтүүдийн жилийн мэдээллийн хүртээмж,

    нэг удаагийн урьдчилсан мэдээний хүртээмж, i.e. шинэ мэдээллээр сайжрахгүй урьдчилсан мэдээ.

Регрессийн шинжилгээг ихэвчлэн хөрөнгө оруулалтын хэмжээ, ашиг, борлуулалтын хэмжээ гэх мэт цогц, олон талт шинж чанартай объектуудад хийдэг.

At норматив таамаглах аргазорилго болгон авсан үзэгдлийн боломжит төлөв байдалд хүрэх арга зам, нөхцөлийг тодорхойлсон. Урьдчилан тогтоосон хэм хэмжээ, үзэл баримтлал, урамшуулал, зорилгын үндсэн дээр үзэгдлийн хүссэн төлөвт хүрэхийг урьдчилан таамаглах тухай ярьж байна. Ийм урьдчилсан мэдээ нь асуултанд хариулдаг: хүссэн зүйлдээ ямар арга замаар хүрэх вэ? Норматив аргыг программчилсан эсвэл зорилтот таамаглалд ихэвчлэн ашигладаг. Стандартын тоон илэрхийлэл ба үнэлгээний функцийн боломжуудын тодорхой цар хүрээг хоёуланг нь ашигладаг.

Хүн амын янз бүрийн бүлгийн мэргэжилтнүүдийн боловсруулсан хүнсний болон хүнсний бус бүтээгдэхүүний хэрэглээний физиологийн болон оновчтой хэм хэмжээг тоон илэрхийлэл ашиглах тохиолдолд эдгээр барааны хэрэглээний түвшинг тодорхойлох боломжтой болно. тогтоосон нормдоо хүрэхээс өмнөх жилүүд. Ийм тооцоог интерполяци гэж нэрлэдэг. Интерполяци гэдэг нь тогтсон харилцаанд тулгуурлан аливаа үзэгдлийн цаг хугацааны цувралд байхгүй үзүүлэлтүүдийг тооцоолох арга юм. Шалгуур үзүүлэлтийн бодит утга ба түүний стандартын утгыг динамик цувралын хэт гишүүдийн хувьд авч үзвэл энэ цувралын утгын хэмжээг тодорхойлох боломжтой. Тиймээс интерполяцийг норматив арга гэж үздэг. Экстраполяцид ашигласан өмнө нь өгөгдсөн томьёо (4)-ийг интерполяцид ашиглаж болох ба энд y n нь бодит өгөгдлийг биш, харин үзүүлэлтийн стандартыг тодорхойлох болно.

Үнэлгээний функцийн боломжуудын хуваарийг (талбар, спектр), өөрөөр хэлбэл давуу хуваарилалтын функцийг норматив аргаар ашиглах тохиолдолд ойролцоогоор дараахь зэрэглэлийг зааж өгсөн болно: хүсээгүй - бага хүсээгүй - илүү хүсүүштэй - хамгийн хүсүүштэй - оновчтой (стандарт).

Урьдчилан таамаглах норматив арга нь бодитой байдлын түвшин, улмаар шийдвэрийн үр нөлөөг нэмэгдүүлэх зөвлөмж боловсруулахад тусалдаг.

Загварчлал, магадгүй хамгийн хэцүү таамаглах арга. Математик загварчлал гэдэг нь эдийн засгийн үзэгдлийг математик томьёо, тэгшитгэл, тэгш бус байдлаар дүрслэн харуулахыг хэлнэ. Математикийн төхөөрөмж нь урьдчилан таамаглаж буй объектын бүх гүн, нарийн төвөгтэй байдлыг бүрэн тусгах нь нэлээд хэцүү боловч урьдчилан таамагласан дэвсгэрийг үнэн зөв тусгах ёстой. "Загвар" гэсэн нэр томъёо нь "хэмжих" гэсэн утгатай modelus гэсэн латин үгнээс гаралтай. Тиймээс загварчлалыг урьдчилан таамаглах арга биш харин загвар дээр ижил төстэй үзэгдлийг судлах арга гэж үзэх нь илүү зөв байх болно.

Өргөн утгаараа загваруудыг судалгааны объектыг орлуулагч гэж нэрлэдэг бөгөөд энэ нь объектын талаар шинэ мэдлэг олж авах боломжийг олгодог. Загвар нь тухайн объектын математик тодорхойлолт гэж үзэх ёстой. Энэ тохиолдолд загвар нь судалж буй объекттой зарим нэг захидал харилцаатай байдаг бөгөөд судалгааны явцад түүнийг орлуулж, объектын талаарх мэдээллийг танилцуулж болох үзэгдэл (субъект, суурилуулалт) гэж тодорхойлогддог.

Загварын талаар нарийвчилсан ойлголттой бол үүнийг урьдчилан таамаглах объект гэж үздэг бөгөөд түүний судалгаа нь ирээдүйд объектын боломжит төлөв байдал, эдгээр төлөвт хүрэх арга замын талаар мэдээлэл авах боломжийг олгодог. Энэ тохиолдолд урьдчилан таамаглах загварын зорилго нь тухайн объектын талаар ерөнхийдөө бус, зөвхөн түүний ирээдүйн төлөв байдлын талаар мэдээлэл авах явдал юм. Дараа нь загвар бүтээхдээ тухайн загвар нь зөвхөн түүний ирээдүйн төлөвийг илэрхийлдэг тул объект өөрөө байхгүй эсвэл өөр оршин тогтнох боломжтой тул объекттой шууд харьцах эсэхийг шалгах боломжгүй байж болно.

Загварууд нь материаллаг, тохиромжтой байж болно.

Эдийн засагт хамгийн тохиромжтой загваруудыг ашигладаг. Нийгэм-эдийн засаг (эдийн засгийн) үзэгдлийн тоон тодорхойлолтод хамгийн тохиромжтой загвар бол тоо, томъёо, тэгшитгэл, алгоритм эсвэл график дүрслэлийг ашигладаг математик загвар юм. Эдийн засгийн загваруудын тусламжтайгаар дараахь зүйлийг тодорхойлно.

    эдийн засгийн янз бүрийн үзүүлэлтүүдийн хоорондын хамаарал;

    шалгуур үзүүлэлтүүдэд тавигдсан янз бүрийн хязгаарлалт;

    үйл явцыг оновчтой болгох шалгуур.

Мэдээллийн чанартай объектын тодорхойлолтХүссэн утгыг тооцоолохын тулд ямар параметр, анхны мэдээллийг цуглуулахыг зааж өгсөн түүний албан ёсны схемийн хэлбэрээр төлөөлж болно. Математик загвар нь албан ёсны схемээс ялгаатай нь тухайн объектыг тодорхойлсон тодорхой тоон өгөгдлийг агуулдаг.Математик загварыг боловсруулах нь загварчлагдсан үйл явцын мөн чанарын талаархи таамаглагчийн санаанаас ихээхэн хамаардаг. Түүний санаан дээр үндэслэн тэрээр ажлын таамаглал дэвшүүлж, түүний тусламжтайгаар загварын аналитик бичлэгийг томъёо, тэгшитгэл, тэгш бус байдлын хэлбэрээр бүтээдэг. Тэгшитгэлийн системийг шийдсэний үр дүнд функцийн тодорхой параметрүүдийг олж авдаг бөгөөд энэ нь хүссэн хувьсагчийн цаг хугацааны өөрчлөлтийг тодорхойлдог.

Урьдчилан таамаглах зохион байгуулалтын элемент болох ажлын дараалал, дарааллыг ашигласан урьдчилан таамаглах аргаас хамааран тодорхойлно. Ихэвчлэн энэ ажлыг хэд хэдэн үе шаттайгаар явуулдаг.

1-р үе шат - урьдчилан таамаглах ухагдахуун, өөрөөр хэлбэл урьдчилан таамаглах объект, урьдчилсан нөхцөл байдлыг тогтоох. Эхний шатны ажлыг дараах дарааллаар гүйцэтгэнэ.

    объектын урьдчилсан дүн шинжилгээ, түүний параметрийн үнэлгээ, тэдгээрийн ач холбогдол, харилцан хамаарлыг багтаасан өнгөрсөн хугацаанд объектын тодорхойлолтыг бүрдүүлэх;

    мэдээллийн эх сурвалжийг тодорхойлох, үнэлэх, тэдэнтэй ажиллах журам, зохион байгуулалт, буцаан мэдээлэл цуглуулах, байршуулах;

    судалгааны зорилтуудыг тодорхойлох.

Урьдчилан таамаглах ажлыг гүйцэтгэхдээ урьдчилан таамаглагчид тэдгээрийн системчилсэн тайлбарыг олж авахын тулд объектын хөгжлийн түүх, урьдчилсан мэдээг судалдаг.

2-р үе шат - урьдчилан таамаглах оношлогоо, түүний явцад тэдгээрийн хөгжлийн чиг хандлагыг тодорхойлох, урьдчилан таамаглах загвар, аргыг сонгох зорилгоор урьдчилан таамаглах объектын системчилсэн тайлбар, урьдчилсан мэдээг судалдаг. Ажлыг дараах дарааллаар гүйцэтгэнэ.

    объектын албан ёсны тайлбарыг багтаасан урьдчилан таамаглах объектын загварыг боловсруулах, загвар нь тухайн объектод тохирох түвшинг шалгах;

    урьдчилан таамаглах аргыг сонгох (үндсэн ба туслах), алгоритм, ажлын хөтөлбөр боловсруулах.

3-р үе шат - ивээн тэтгэх, өөрөөр хэлбэл урьдчилсан таамаглалыг өргөн хүрээтэй боловсруулах үйл явц, үүнд: 1) өгөгдсөн хугацаанд урьдчилан таамагласан параметрүүдийг тооцоолох; 2) урьдчилсан мэдээний бие даасан бүрэлдэхүүн хэсгүүдийн синтез.

4-р шат - урьдчилсан таамаглалыг үнэлэх, түүний дотор түүний баталгаажуулалт, өөрөөр хэлбэл найдвартай байдал, үнэн зөв, хүчинтэй байдлын түвшинг тодорхойлох.

Эрэл хайх, үнэлэх явцад өмнөх үе шатуудын үндсэн дээр урьдчилан таамаглах даалгавар, түүний үнэлгээг шийддэг.

Заасан үе шат нь ойролцоогоор бөгөөд урьдчилан таамаглах үндсэн аргаас хамаарна.

Урьдчилан таамаглалын үр дүнг гэрчилгээ, тайлан эсвэл бусад материалын хэлбэрээр боловсруулж, үйлчлүүлэгчид танилцуулна.

Урьдчилан таамаглахад объектын бодит байдлаас урьдчилан таамаглах хазайлтыг зааж өгч болох бөгөөд үүнийг урьдчилан таамаглах алдаа гэж нэрлэдэг бөгөөд үүнийг дараахь томъёогоор тооцоолно.

;
;
. (9.3)

Урьдчилан таамаглахад гарсан алдааны эх үүсвэр

Үндсэн эх сурвалжууд нь:

1. Өгөгдлийг өнгөрсөн үеэс ирээдүй рүү хялбархан шилжүүлэх (экстраполяци) (жишээлбэл, борлуулалтын 10% -иар өсөхөөс бусад тохиолдолд компанид урьдчилан таамаглах өөр сонголт байхгүй).

2. Аливаа үйл явдлын магадлал, судалж буй объектод үзүүлэх нөлөөллийг үнэн зөв тодорхойлох боломжгүй байх.

3. Төлөвлөгөөний хэрэгжилтэд нөлөөлж буй урьдчилан таамаглаагүй хүндрэлүүд (таслах үйл явдлууд), жишээлбэл, борлуулалтын хэлтсийн даргыг гэнэт халах.

Ерөнхийдөө урьдчилан таамаглах туршлага хуримтлуулах, түүний аргуудыг боловсруулах тусам таамаглалын нарийвчлал нэмэгддэг.

Үүнтэй төстэй нийтлэлүүд

2022 parki48.ru. Бид хүрээ байшин барьж байна. Тохижилт. Барилга. Суурь.