Шулуун шугамын регресс. Регрессийн коэффициент. Шугаман регрессийн үндэс

Регрессийн коэффициентүүдГүйцэтгэлийн үзүүлэлтэд нөлөөлөх хүчин зүйлсийн эрч хүчийг харуулна. Хэрэв хүчин зүйлийн үзүүлэлтүүдийн урьдчилсан стандартчилал хийгдсэн бол b 0 нь нийлбэр дэх үр дүнтэй үзүүлэлтийн дундаж утгатай тэнцүү байна. b 1 , b 2 , ..., b n коэффициентүүд нь хүчин зүйлийн үзүүлэлтийн утгууд дунджаас тэгтэй тэнцүү хазайсан тохиолдолд үр дүнтэй үзүүлэлтийн түвшин дундаж утгаас хэдэн нэгжээр хазайж байгааг харуулдаг. стандарт хэлбэлзэл. Тиймээс регрессийн коэффициентүүд нь гүйцэтгэлийн үзүүлэлтийн түвшинг нэмэгдүүлэх хувь хүний ​​хүчин зүйлийн ач холбогдлын түвшинг тодорхойлдог. Регрессийн коэффициентүүдийн тодорхой утгыг аргын дагуу эмпирик мэдээллээс тодорхойлно хамгийн бага квадратууд(хэвийн тэгшитгэлийн системийг шийдсэний үр дүнд).

Регрессийн шугам- тархалтын диаграм дээрх туршилтын цэгүүдийн тархалтыг хамгийн зөв тусгасан шугам, налуугийн эгц байдал нь хоёр интервалын хувьсагчийн хоорондын хамаарлыг тодорхойлдог.

Регрессийн шугамыг ихэвчлэн шугаман функц (шугаман регресс) хэлбэрээр олдог. хамгийн зөв замхүссэн муруйг ойртуулж байна. Үүнийг хамгийн бага квадратын аргыг ашиглан бодитоор ажиглагдсан зүйлсийн тооцооллоос зөрүүтэй квадрат хазайлтын нийлбэрийг багасгасан үед хийдэг (хүссэн үзүүлэлтийг илэрхийлэх шулуун шугам ашиглан тооцоолно гэсэн үг юм. регрессийн хамаарал):

(M - дээжийн хэмжээ). Энэ арга нь дээр суурилдаг мэдэгдэж байгаа баримт, дээрх илэрхийлэлд гарч буй дүн нь яг тухайн тохиолдолд хамгийн бага утгыг авна.
57. Корреляцийн онолын үндсэн үүрэг.

Корреляцийн онол нь зөвхөн шалтгаан-үр дагаврын холбоонд байдаггүй үзэгдлүүдийн хоорондын уялдаа холбоог үнэлдэг аппарат юм. Корреляцийн онолыг ашиглан стохастик, гэхдээ учир шалтгааны хамаарлыг үнэлдэг. Зохиогч нь М.Л.Лукацкаятай хамт тооцоо судалгаа хийхийг оролдсон учир шалтгааны холбоо. Гэвч юмс үзэгдлийн шалтгаан, үр дагаврын хамаарал, учир шалтгаан, үр дагаврыг хэрхэн тодорхойлох тухай асуудал нээлттэй хэвээр байгаа бөгөөд албан ёсны түвшинд энэ нь үндсэндээ шийдэгдэх боломжгүй юм шиг санагддаг.

Корреляцийн онол ба түүнийг үйлдвэрлэлийн шинжилгээнд хэрэглэх.

Математик статистикийн салбаруудын нэг болох корреляцийн онол нь бусад статистик үзүүлэлтүүд тодорхой утгыг хүлээн авсан тохиолдолд тодорхой найдвартай байдлын хүрээнд судалж буй параметрийг байрлуулах боломжит хязгаарын талаар үндэслэлтэй таамаглал дэвшүүлэх боломжийг олгодог.

Корреляцийн онолд ялгах нь заншилтай байдаг хоёр үндсэн ажил.

Эхний даалгаваркорреляцийн онол - корреляцийн хэлбэрийг тогтоох, i.e. регрессийн функцийн төрөл (шугаман, квадрат гэх мэт).

Хоёр дахь даалгаваркорреляцийн онол - корреляцийн холболтын ойр (хүч чадал) -ийг үнэлэх.

Y-ийн X-ийн корреляцийн холболтын ойр (хамаарал) нь нөхцөлт дундаж орчимд Y утгуудын тархалтын хэмжээгээр үнэлэгддэг. Их тархалт нь Y-ийн X-ээс сул хамаарлыг, жижиг дисперс нь хүчтэй хамаарал байгааг илтгэнэ.
58. Корреляцийн хүснэгт ба түүний тоон үзүүлэлт.

Практикт X ба Y хэмжигдэхүүнүүдийн бие даасан ажиглалтын үр дүнд дүрмээр бол эдгээр хэмжигдэхүүний боломжит бүх хос утгыг бүхэлд нь авч үзэхгүй, харин зөвхөн хязгаарлагдмал дээжийг авч үздэг. хүн ам, мөн түүврийн олонлогийн эзлэхүүн n нь түүвэрт байгаа хосуудын тоогоор тодорхойлогддог.

Түүвэр дэх X утгыг x 1, x 2,....x m утгуудыг авч үзье, энэ утгын утгуудын тоо нь бие биенээсээ ялгаатай байна. ерөнхий тохиолдолТэд тус бүрийг дээж дээр давтаж болно. Түүвэр дэх Y утгыг y 1, y 2,....y k утгуудыг авч үзье, энд k нь энэ утгын өөр өөр утгуудын тоо бөгөөд ерөнхий тохиолдолд тэдгээр нь тус бүр байж болно. дээж дээр давтагдсан. Энэ тохиолдолд тохиолдлын давтамжийг харгалзан өгөгдлийг хүснэгтэд оруулна. Бүлэглэгдсэн өгөгдөл бүхий ийм хүснэгтийг корреляцийн хүснэгт гэж нэрлэдэг.

Үр дүнгийн статистик боловсруулалтын эхний үе шат бол корреляцийн хүснэгтийг эмхэтгэх явдал юм.

Y\X x 1 x 2 ... х м н ж
y 1 n 12 n 21 n м1 n y1
y 2 n 22 n м2 n y2
...
у к n 1k n 2k n mk n yk
n x n x1 n x2 n xm n

Хүснэгтийн үндсэн хэсгийн эхний мөрөнд дээжээс олдсон X хэмжигдэхүүний бүх утгыг өсөх дарааллаар жагсаав. Харгалзах мөр, баганын огтлолцол дээр n ij (i = 1,2 ,...,m; j=1,2,...,k) давтамж нь хосын тохиолдлын тоотой тэнцүү байна (x i ; y i) дээжинд. Жишээлбэл, давтамж n 12 нь түүвэр дэх хос (x 1 ;y 1) тохиолдлын тоог илэрхийлнэ.

Мөн n xi n ij , 1≤i≤m, i-р баганын элементүүдийн нийлбэр, n yj n ij, 1≤j≤k нь j-р эгнээний элементүүдийн нийлбэр ба n xi байна. = n yj =n

Корреляцийн хүснэгтийн өгөгдлөөс олж авсан томъёоны аналогууд нь дараах хэлбэртэй байна.


59. Эмпирик ба онолын регрессийн шугамууд.

Онолын регрессийн шугамЭнэ тохиолдолд бие даасан ажиглалтын үр дүнгээс тооцоолж болно. Системийг шийдэхийн тулд хэвийн тэгшитгэлбидэнд ижил өгөгдөл хэрэгтэй: x, y, xy, xy. Бидэнд 1958 онд цементийн үйлдвэрлэлийн хэмжээ, үндсэн үйлдвэрлэлийн хэмжээний тухай мэдээлэл байна.Үүнд тавигдсан: цементийн үйлдвэрлэлийн хэмжээ (биет үзүүлэлтээр) болон үндсэн хөрөнгийн хэмжээ хоорондын хамаарлыг судлах. [ 1 ]

Онолын регрессийн шугам (тэгшитгэлээс тооцоолсон) бодит (эмпирик) шугамаас хазайх тусам дундаж ойролцоо алдаа бага байна.

Онолын регрессийн шугамыг олох үйл явц нь хамгийн бага квадратын аргыг ашиглан эмпирик регрессийн шугамыг тохируулах явдал юм.

Онолын регрессийн шугамыг олох үйл явцыг эмпирик регрессийн шугамыг тэгшлэх гэж нэрлэдэг бөгөөд төрлийг сонгох, зөвтгөхөөс бүрдэнэ; муруй ба түүний тэгшитгэлийн параметрийн тооцоо.

Эмпирик регресс нь аналитик эсвэл хосолсон бүлгийн өгөгдлийн дагуу бүтээгдсэн бөгөөд үр дүнгийн шинж чанарын бүлгийн дундаж утгуудын хүчин зүйлийн шинж чанарын бүлгийн дундаж утгуудаас хамаарлыг илэрхийлдэг. Эмпирик регрессийн график дүрслэл – эвдэрсэн шугам, абсциссууд нь хүчин зүйлийн шинж чанарын бүлгийн дундаж утгууд, ординатууд нь үр дүнгийн шинж чанарын бүлгийн дундаж утгууд юм. Онооны тоо нь бүлэгт багтсан бүлгийн тоотой тэнцүү байна.

Эмпирик регрессийн шугам нь авч үзэж буй харилцааны гол чиг хандлагыг илэрхийлдэг. Хэрэв эмпирик регрессийн шугам нь гадаад төрхөөрөө шулуун шугам руу ойртвол шинж чанаруудын хооронд шугаман хамаарал байгаа гэж үзэж болно. Хэрэв холболтын шугам муруй руу ойртвол энэ нь муруй корреляцийн хамаарал байгаатай холбоотой байж магадгүй юм.
60. Түүврийн хамаарал ба регрессийн коэффициент.

График дээрх шинж чанаруудын хоорондын хамаарлыг харуулсан бол шугаман хамаарал, тооцоолох корреляцийн коэффициент r, энэ нь хувьсагчдын хоорондын хамаарлын ойр байдлыг үнэлэх, мөн шинж чанарт гарсан өөрчлөлтийн хэдэн хувь нь үндсэн шинж чанарын нөлөөлөл, аль хэсэг нь бусад хүчин зүйлийн нөлөөллөөс шалтгаалж байгааг олж мэдэх боломжийг олгодог. Коэффицент нь -1-ээс +1 хооронд хэлбэлздэг. Хэрэв r=0 бол шинж чанаруудын хооронд ямар ч холбоо байхгүй. Тэгш байдал r=0 нь зөвхөн шугаман корреляцийн хамаарал байхгүйг илтгэнэ, гэхдээ хамаарал огт байхгүй, статистикийн хамаарлаас хамаагүй бага. Хэрэв r= ±1, дараа нь энэ нь бүрэн (функциональ) холболт байгаа гэсэн үг юм. Энэ тохиолдолд ажиглагдсан бүх утгууд нь шулуун шугам болох регрессийн шугам дээр байрладаг.
Корреляцийн коэффициентийн практик ач холбогдлыг детерминацын коэффициент гэж нэрлэдэг квадрат утгаар нь тодорхойлно.
Регресс, ойролцоогоор (ойролцоогоор тайлбарласан) шугаман функц y = kX + b. Y-ийн X дээр регрессийн хувьд регрессийн тэгшитгэл нь: `y x = ryx X + b; (1). X дээрх Y-ийн шууд регрессийн налуу ryx-ийг X дээрх Y-ийн регрессийн коэффициент гэнэ.

Хэрэв түүврийн өгөгдлийг ашиглан тэгшитгэл (1) олдвол түүнийг дуудна жишээ регрессийн тэгшитгэл. Үүний дагуу ryx нь X дээрх Y-ийн түүврийн регрессийн коэффициент, b нь тэгшитгэлийн түүвэр дамми гишүүн юм. Регрессийн коэффициент нь X-ийн нэгж хэлбэлзэлд ногдох Y-ийн хэлбэлзлийг хэмждэг. Регрессийн тэгшитгэлийн параметрүүдийг (ryx ба b коэффициентүүд) хамгийн бага квадратын аргыг ашиглан олно.
61. Нийт хүн амын дунд корреляцийн коэффициентийн ач холбогдол, хамаарлын ойр байдлыг үнэлэх.

Корреляцийн коэффициентийн ач холбогдолОюутны тест ашиглан шалгасан:

Хаана - корреляцийн коэффициентийн язгуур дундаж квадрат алдаа нь дараах томъёогоор тодорхойлогддог.

Хэрэв тооцоолсон утга нь хүснэгтийн утгаас өндөр байвал корреляцийн коэффициентийн утга нь Хүснэгтийн утгууд чухал гэж дүгнэж болно тОюутны t-тестийн утгуудын хүснэгтээс олно. Энэ тохиолдолд эрх чөлөөний зэрэглэлийн тоог харгалзан үзнэ (V = n - 1) ба түвшин итгэх магадлал(эдийн засгийн тооцоонд ихэвчлэн 0.05 эсвэл 0.01). Бидний жишээн дээр эрх чөлөөний зэрэглэлийн тоо нь: P - 1 = 40 - 1 = 39. Итгэлийн түвшинд Р = 0,05; т= 2.02. Учир нь (бүх тохиолдолд бодит утга нь t-хүснэгтээс өндөр байдаг) үр дүн ба хүчин зүйлийн үзүүлэлтүүдийн хоорондын хамаарал найдвартай бөгөөд корреляцийн коэффициентийн хэмжээ нь чухал юм.

Корреляцийн коэффициентийн тооцоо, хязгаарлагдмал түүврээс тооцоолсон, бараг үргэлж тэгээс ялгаатай. Гэхдээ энэ нь корреляцийн коэффициент гэсэн үг биш юм хүн аммөн тэгээс ялгаатай. Коэффицентийн түүврийн утгын ач холбогдлыг үнэлэх эсвэл статистик таамаглалыг шалгах даалгаврын дагуу корреляцийн коэффициент тэгтэй тэнцүү гэсэн таамаглалыг шалгах шаардлагатай. Хэрэв таамаглал бол НКорреляцийн коэффициент нь 0-тэй тэнцүү байвал түүврийн коэффициент нь чухал бөгөөд холбогдох утгууд нь шугаман хамааралтай холбоотой байх болно. Хэрэв таамаглал бол Н 0-ийг хүлээн зөвшөөрвөл коэффициентийн үнэлгээ нь ач холбогдолгүй, утгууд нь хоорондоо шугаман хамааралгүй (хэрэв физик шалтгаанаар хүчин зүйлүүд холбоотой байж болох юм бол энэ хамаарал байхгүй гэж хэлэх нь дээр. байгаа ED дээр үндэслэн байгуулагдсан). Корреляцийн коэффициентийн үнэлгээний ач холбогдлын талаарх таамаглалыг шалгахын тулд энэхүү санамсаргүй хэмжигдэхүүний тархалтын талаарх мэдлэг шаардлагатай.  утгын хуваарилалт ikсанамсаргүй хэмжигдэхүүн үед зөвхөн онцгой тохиолдлыг судалсан УжТэгээд Их Британиердийн хуулийн дагуу хуваарилагдсан.

Тэг таамаглалыг шалгах шалгуур болгон Н 0 санамсаргүй хэмжигдэхүүн хэрэглэнэ . Хэрэв корреляцийн коэффициентийн модуль нь нэгдмэл байдлаас харьцангуй хол байвал утга тХэрэв тэг таамаглал үнэн бол Студентийн хуулийн дагуу хуваарилагдана n- 2 зэрэг эрх чөлөө. Өрсөлдөгч таамаглал Н 1 нь  утга гэсэн үгтэй тохирч байна ikтэгтэй тэнцүү биш (тэгээс их эсвэл бага). Тиймээс эгзэгтэй бүс нутаг хоёр талтай.
62. Түүврийн корреляцийн коэффициентийг тооцоолох, түүврийн шулуун шугамын регрессийн тэгшитгэлийг байгуулах.

Түүвэрлэлтийн коэффициентхамааралтомъёогоор олно

утгын түүврийн стандарт хазайлт хаана байна.

Түүврийн корреляцийн коэффициент нь ба хоёрын хоорондох шугаман хамаарлын ойр байдлыг харуулдаг: нэгдмэл байдал ойртох тусам ба хоорондын шугаман хамаарал хүчтэй болно.

Энгийн шугаман регресс нь нэг оролтын хувьсагч ба нэг гаралтын хувьсагчийн хоорондох шугаман хамаарлыг олдог. Үүнийг хийхийн тулд регрессийн тэгшитгэлийг тодорхойлно - энэ нь тэгшитгэлээр тодорхойлсон Y-ийн утгуудын хамаарал, Y-ийн хамаарал нь x-ийн утгаас хамаарал, бие даасан x хувьсагч ба популяци зэргийг тусгасан загвар юм. :

Хаана A0- регрессийн тэгшитгэлийн чөлөөт гишүүн;

A1- регрессийн тэгшитгэлийн коэффициент

Дараа нь харгалзах шулуун шугамыг регрессийн шугам гэж нэрлэдэг. Загварын параметрүүд гэж нэрлэгддэг A0 ба A1 коэффициентүүдийг регрессийн шугамаас бодит өгөгдлийн ажиглалтад харгалзах цэгүүдийн квадрат хазайлтын нийлбэр хамгийн бага байхаар сонгосон. Коэффициентийг хамгийн бага квадратын аргыг ашиглан сонгоно. Өөрөөр хэлбэл, энгийн шугаман регресс нь нэг оролтын хувьсагч ба нэг гаралтын хувьсагчийн хоорондын хамаарлыг хамгийн сайн ойролцоолсон шугаман загварыг тодорхойлдог.

График аргыг ашиглах.
Энэ аргыг судалж буй эдийн засгийн үзүүлэлтүүдийн хоорондын холболтын хэлбэрийг нүдээр харуулахад ашигладаг. Үүнийг хийхийн тулд тэгш өнцөгт системкоординат, график байгуулж, үр дүнгийн шинж чанарын Y-ийн бие даасан утгыг ординатын тэнхлэгийн дагуу, X хүчин зүйлийн шинж чанарын бие даасан утгуудыг абсцисса тэнхлэгийн дагуу зурна.
Үр дүн ба хүчин зүйлийн шинж чанарын цэгүүдийн багцыг нэрлэдэг корреляцийн талбар.
Корреляцийн талбар дээр үндэслэн бид (хүн амын хувьд) X ба Y-ийн бүх боломжит утгуудын хоорондын хамаарал шугаман байна гэж таамаглаж болно.

Шугаман регрессийн тэгшитгэл y = bx + a + ε хэлбэртэй байна
Энд ε нь санамсаргүй алдаа (хазайлт, эвдрэл).
Санамсаргүй алдаа байгаа шалтгаанууд:
1. Регрессийн загварт чухал ач холбогдолтой тайлбарлагч хувьсагчдыг оруулаагүй;
2. Хувьсагчдыг нэгтгэх. Жишээлбэл, нийт хэрэглээний функц нь оролдлого юм ерөнхий илэрхийлэлхувь хүний ​​зарцуулалтын шийдвэрүүдийн нийлбэр. Энэ нь зөвхөн өөр өөр параметртэй хувь хүний ​​харилцааны ойролцоо тооцоолол юм.
3. Загварын бүтцийг буруу тодорхойлсон;
4. Буруу функциональ үзүүлэлт;
5. Хэмжилтийн алдаа.
Тодорхой ажиглалт бүрийн ε i хазайлт нь санамсаргүй бөгөөд түүвэр дэх тэдгээрийн утга тодорхойгүй тул:
1) x i ба y i ажиглалтаас зөвхөн α ба β параметрийн тооцоог авч болно.
2) Регрессийн загварын α ба β параметрүүдийн үнэлгээ нь санамсаргүй шинж чанартай тус бүр a ба b утгууд юм. санамсаргүй түүвэрт тохирох;
Дараа нь тооцоолж буй регрессийн тэгшитгэл (түүврийн өгөгдлөөр бүтээгдсэн) y = bx + a + ε хэлбэртэй байх ба энд e i нь алдааны ажиглагдсан утгууд (тооцоолол) ε i ба a ба b нь тус тусын тооцоолол юм. олох ёстой регрессийн загварын α ба β параметрүүд.
α ба β параметрүүдийг тооцоолохын тулд хамгийн бага квадратын аргыг (хамгийн бага квадратын арга) ашигладаг.
Ердийн тэгшитгэлийн систем.

Бидний өгөгдлийн хувьд тэгшитгэлийн систем нь дараах хэлбэртэй байна.

10a + 356b = 49
356a + 2135b = 9485

Эхний тэгшитгэлээс бид a-г илэрхийлж, хоёр дахь тэгшитгэлд орлуулна
Бид b = 68.16, a = 11.17-г авна

Регрессийн тэгшитгэл:
y = 68.16 x - 11.17

1. Регрессийн тэгшитгэлийн параметрүүд.
Дээж гэсэн үг.



Түүврийн зөрүү.


Стандарт хэлбэлзэл

1.1. Корреляцийн коэффициент
Бид холболтын ойрын үзүүлэлтийг тооцдог. Энэ үзүүлэлт нь жишээ юм шугаман коэффициентхамаарлыг дараах томъёогоор тооцоолно.

Шугаман корреляцийн коэффициент нь -1-ээс +1 хүртэлх утгыг авна.
Онцлог шинж чанаруудын хоорондын холбоо нь сул, хүчтэй (ойр) байж болно. Тэдний шалгуурыг Чаддокийн хуваарийн дагуу үнэлдэг.
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
Бидний жишээнд Y шинж чанар ба X хүчин зүйлийн хоорондын холбоо маш өндөр бөгөөд шууд байна.

1.2. Регрессийн тэгшитгэл(регрессийн тэгшитгэлийн тооцоо).

Шугаман регрессийн тэгшитгэл нь y = 68.16 x -11.17
Тэгшитгэлийн коэффициентүүд шугаман регрессэдийн засгийн утга учир өгч болно. Регрессийн тэгшитгэлийн коэффициентхэдэн нэгж байгааг харуулж байна. хүчин зүйл 1 нэгжээр өөрчлөгдөхөд үр дүн өөрчлөгдөнө.
Коэффициент b = 68.16 нь хэмжилтийн нэгжид х хүчин зүйлийн утгын өсөлт, бууралттай үр дүнтэй үзүүлэлтийн дундаж өөрчлөлтийг (х хэмжилтийн нэгжээр) харуулна. IN энэ жишээнд 1 нэгжээр өсөхөд у дунджаар 68.16-аар нэмэгдэнэ.
a = -11.17 коэффициент нь y-ийн таамагласан түвшинг албан ёсоор харуулдаг, гэхдээ зөвхөн x = 0 нь түүврийн утгуудтай ойролцоо байвал л болно.
Гэхдээ хэрэв x = 0 нь x-ийн түүврийн утгуудаас хол байвал шууд утгаар тайлбарлах нь буруу үр дүнд хүргэж болзошгүй бөгөөд регрессийн шугам нь ажиглагдсан түүврийн утгыг нэлээд үнэн зөв дүрсэлсэн ч гэсэн энэ нь бас болно гэсэн баталгаа байхгүй. зүүн эсвэл баруун экстраполяци хийх үед тохиолдох болно.
Регрессийн тэгшитгэлд тохирох x утгыг орлуулснаар бид ажиглалт бүрийн гүйцэтгэлийн үзүүлэлтийн y(x)-ийн зэрэгцүүлсэн (урьдчилан таамагласан) утгыг тодорхойлж чадна.
y ба x хоорондын хамаарал нь регрессийн коэффициент b (хэрэв > 0 бол - шууд хамаарал, эсрэгээр - урвуу) тэмдгийг тодорхойлно. Бидний жишээн дээр холболт нь шууд байна.

1.3. Уян хатан байдлын коэффициент.
Үр дүнгийн үзүүлэлт y ба хүчин зүйлийн шинж чанарын хэмжлийн нэгжийн зөрүүтэй бол үр дүнгийн шинж чанарт үзүүлэх хүчин зүйлсийн нөлөөг шууд үнэлэхийн тулд регрессийн коэффициентийг (жишээ b) ашиглахыг зөвлөдөггүй.
Эдгээр зорилгын үүднээс уян хатан байдлын коэффициент ба бета коэффициентийг тооцоолно. Уян хатан байдлын коэффициентийг дараах томъёогоор олно.


Энэ нь х хүчин зүйлийн шинж чанар 1%-иар өөрчлөгдөхөд үр дүнтэй шинж чанар y дунджаар хэдэн хувиар өөрчлөгдөхийг харуулдаг. Энэ нь хүчин зүйлийн хэлбэлзлийн түвшинг харгалздаггүй.
Бидний жишээнд уян хатан байдлын коэффициент 1-ээс их байна.Тиймээс X 1%-иар өөрчлөгдвөл Y 1%-иас дээш өөрчлөгдөнө. Өөрөөр хэлбэл, X нь Y-д ихээхэн нөлөөлдөг.
Бета коэффициенттүүний дундаж утгын аль хэсгийг харуулдаг квадрат хазайлтхүчин зүйлийн шинж чанар нь тогтмол үед стандарт хазайлтын утгаар өөрчлөгдөхөд үр дүнтэй шинж чанарын дундаж утга өөрчлөгдөнө. тогтмол түвшинҮлдсэн бие даасан хувьсагчдын утга:

Тэдгээр. Энэ үзүүлэлтийн стандарт хазайлтаар x-ийн өсөлт нь дундаж Y-ийг 0.9796-аар нэмэгдүүлэхэд хүргэнэ. стандарт хэлбэлзэлэнэ үзүүлэлт.

1.4. Ойролцооны алдаа.
Үнэмлэхүй ойртсон алдааг ашиглан регрессийн тэгшитгэлийн чанарыг үнэлье.


Алдаа нь 15% -иас их байгаа тул энэ тэгшитгэлийг регресс болгон ашиглахыг зөвлөдөггүй.

1.6. Тодорхойлох коэффициент.
(Олон) корреляцийн коэффициентийн квадратыг детерминацийн коэффициент гэж нэрлэдэг бөгөөд энэ нь хүчин зүйлийн шинж чанарын хэлбэлзлээр тайлбарлагдаж буй үр дүнгийн шинж чанарын хэлбэлзлийн эзлэх хувийг харуулдаг.
Ихэнх тохиолдолд детерминацийн коэффициентийг тайлбарлахдаа үүнийг хувиар илэрхийлдэг.
R2 = 0.982 = 0.9596
тэдгээр. тохиолдлын 95.96% -д х-ийн өөрчлөлт нь у-ийн өөрчлөлтөд хүргэдэг. Өөрөөр хэлбэл, регрессийн тэгшитгэлийг сонгох нарийвчлал өндөр байна. Y-ийн өөрчлөлтийн үлдсэн 4.04%-ийг загварт харгалзаагүй хүчин зүйлсээр тайлбарлаж байна.

x y x 2 y 2 x y у(х) (y i -y cp) 2 (у-у(х)) 2 (x i -x cp) 2 |y - y x |:y
0.371 15.6 0.1376 243.36 5.79 14.11 780.89 2.21 0.1864 0.0953
0.399 19.9 0.1592 396.01 7.94 16.02 559.06 15.04 0.163 0.1949
0.502 22.7 0.252 515.29 11.4 23.04 434.49 0.1176 0.0905 0.0151
0.572 34.2 0.3272 1169.64 19.56 27.81 87.32 40.78 0.0533 0.1867
0.607 44.5 .3684 1980.25 27.01 30.2 0.9131 204.49 0.0383 0.3214
0.655 26.8 0.429 718.24 17.55 33.47 280.38 44.51 0.0218 0.2489
0.763 35.7 0.5822 1274.49 27.24 40.83 61.54 26.35 0.0016 0.1438
0.873 30.6 0.7621 936.36 26.71 48.33 167.56 314.39 0.0049 0.5794
2.48 161.9 6.17 26211.61 402 158.07 14008.04 14.66 2.82 0.0236
7.23 391.9 9.18 33445.25 545.2 391.9 16380.18 662.54 3.38 1.81

2. Регрессийн тэгшитгэлийн параметрийн тооцоо.
2.1. Корреляцийн коэффициентийн ач холбогдол.

Ач холбогдолын түвшин α=0.05, эрх чөлөөний зэрэг k=7 бүхий Оюутны хүснэгтийг ашиглан бид t критийг олно.
t crit = (7;0.05) = 1.895
Энд m = 1 нь тайлбарлах хувьсагчдын тоо юм.
Хэрэв t ажиглагдсан > t чухал бол корреляцийн коэффициентийн үр дүнгийн утгыг чухал ач холбогдолтой гэж үзнэ (корреляцийн коэффициент тэгтэй тэнцүү гэсэн тэг таамаглал няцаагдана).
t obs > t crit тул корреляцийн коэффициент 0-тэй тэнцүү гэсэн таамаглалыг бид үгүйсгэдэг. Өөрөөр хэлбэл корреляцийн коэффициент нь статистикийн ач холбогдолтой
Хосолсон шугаман регрессийн хувьд t 2 r = t 2 b ба дараа нь регрессийн ач холбогдол ба корреляцийн коэффициентүүдийн талаарх таамаглалыг шалгах нь шугаман регрессийн тэгшитгэлийн ач холбогдлын талаарх таамаглалыг шалгахтай тэнцүү юм.

2.3. Регрессийн коэффициентийн тооцоог тодорхойлох үнэн зөв байдлын шинжилгээ.
Эвдрэлийн тархалтыг шударга бус тооцоолсон үнэ цэнэ нь:


S 2 y = 94.6484 - тайлбарлагдаагүй дисперс (регрессийн шугамын эргэн тойронд хамааралтай хувьсагчийн тархалтын хэмжүүр).
S y = 9.7287 - стандарт алдаатооцоолол (регрессийн стандарт алдаа).
S a - санамсаргүй хэмжигдэхүүний стандарт хазайлт a.


S b - санамсаргүй хэмжигдэхүүний стандарт хазайлт b.

2.4. Хамаарах хувьсагчийн итгэлийн интервалууд.
Бүтээсэн загварт үндэслэсэн эдийн засгийн таамаглал нь хувьсагчдын хоорондын урьд өмнө байсан харилцааг тухайн хугацаанд хадгална гэж үздэг.
Үр дүнгийн шинж чанарын хамааралтай хувьсагчийг таамаглахын тулд загварт багтсан бүх хүчин зүйлийн таамагласан утгыг мэдэх шаардлагатай.
Хүчин зүйлсийн урьдчилан таамагласан утгыг загварт орлуулж, судалж буй үзүүлэлтийн таамаглах цэгийн тооцоог олж авна. (a + bx p ± ε)
Хаана

Y-ийн боломжит утгуудын 95% нь хязгааргүй төвлөрөх интервалын хил хязгаарыг тооцоолъё. их тооажиглалт ба X p = 1 (-11.17 + 68.16*1 ± 6.4554)
(50.53;63.44)

Хувь хүн итгэлцлийн интервалуудУчир ньЮөгөгдсөн утгадX.
(a + bx i ± ε)
Хаана

x i y = -11.17 + 68.16x i εi y мин ymax
0.371 14.11 19.91 -5.8 34.02
0.399 16.02 19.85 -3.83 35.87
0.502 23.04 19.67 3.38 42.71
0.572 27.81 19.57 8.24 47.38
0.607 30.2 19.53 10.67 49.73
0.655 33.47 19.49 13.98 52.96
0.763 40.83 19.44 21.4 60.27
0.873 48.33 19.45 28.88 67.78
2.48 158.07 25.72 132.36 183.79

95% -ийн магадлалаар хязгааргүй тооны ажиглалтын Y утга нь олсон интервалын хязгаараас гарахгүй гэдгийг баталгаажуулах боломжтой.

2.5. Шугаман регрессийн тэгшитгэлийн коэффициентүүдийн талаархи таамаглалыг шалгах.
1) t-статистик. Оюутны тест.
Хувь хүний ​​регрессийн коэффициентүүд тэгтэй тэнцүү байх тухай H 0 таамаглалыг (хэрэв хувилбар нь H 1-тэй тэнцүү биш бол) α=0.05 ач холбогдлын түвшинд шалгая.
t crit = (7;0.05) = 1.895


12.8866 > 1.895 тул регрессийн коэффициент b-ийн статистик ач холбогдол нь батлагдсан (бид энэ коэффициент тэгтэй тэнцүү гэсэн таамаглалыг үгүйсгэж байна).


2.0914 > 1.895 тул регрессийн коэффициент a-ийн статистикийн ач холбогдол нь батлагдсан (бид энэ коэффициент тэгтэй тэнцүү гэсэн таамаглалыг үгүйсгэж байна).

Регрессийн тэгшитгэлийн коэффициентүүдийн итгэлийн интервал.
Регрессийн коэффициентүүдийн итгэлцлийн интервалыг 95% найдвартайгаар дараах байдлаар тодорхойлно.
(b - t crit S b ; b + t crit S b)
(68.1618 - 1.895 5.2894; 68.1618 + 1.895 5.2894)
(58.1385;78.1852)
95% -ийн магадлалаар энэ параметрийн утга нь олсон интервалд байх болно гэж хэлж болно.
(a - t a)
(-11.1744 - 1.895 5.3429; -11.1744 + 1.895 5.3429)
(-21.2992;-1.0496)
95% -ийн магадлалаар энэ параметрийн утга нь олсон интервалд байх болно гэж хэлж болно.

2) F-статистик. Фишерийн шалгуур.
Регрессийн загварын ач холбогдлыг турших нь Фишерийн F тестийг ашиглан хийгддэг бөгөөд тооцоолсон утгыг судалж буй үзүүлэлтийн анхны цуврал ажиглалтын дисперсийн харьцаа ба үлдэгдэл дарааллын дисперсийн бодитой үнэлгээний харьцаагаар олдог. энэ загварын хувьд.
Хэрэв lang=EN-US>n-m-1) эрх чөлөөний зэрэгтэй тооцоолсон утга нь өгөгдсөн ач холбогдлын түвшинд хүснэгтлэгдсэн утгаас их байвал загварыг чухал гэж үзнэ.

энд m нь загвар дахь хүчин зүйлийн тоо.
Хосолсон шугаман регрессийн статистик ач холбогдлыг дараах алгоритмыг ашиглан үнэлнэ.
1. Тэгшитгэл бүхэлдээ статистикийн хувьд ач холбогдолгүй гэсэн тэг таамаг дэвшүүлсэн: H 0: R 2 =0 ач холбогдлын α түвшинд.
2. Дараа нь F-шалгуурын бодит утгыг тодорхойлно:


Энд m=1 хос регрессийн хувьд.
3. Квадратуудын нийт нийлбэр (илүү их дисперс)-ийн чөлөөт байдлын зэрэг нь 1, үлдэгдэлийн чөлөөт байдлын зэрэг нь өгөгдсөн ач холбогдлын түвшнийг харгалзан хүснэгтийн утгыг Фишерийн хуваарилалтын хүснэгтээс тодорхойлно. Шугаман регрессийн квадратуудын нийлбэр (бага дисперс) нь n-2 .
4. Хэрэв F тестийн бодит утга нь хүснэгтийн утгаас бага байвал тэг таамаглалыг үгүйсгэх шалтгаан байхгүй гэж тэд хэлэв.
Үгүй бол тэг таамаглалыг үгүйсгэж, (1-α) магадлалаар өөр таамаглалыг гаргана. статистикийн ач холбогдолерөнхий тэгшитгэл.
k1=1 ба k2=7 эрх чөлөөний зэрэгтэй шалгуур үзүүлэлтийн хүснэгтийн утга, Fkp = 5.59
F > Fkp-ийн бодит утга учир детерминацийн коэффициент нь статистикийн ач холбогдолтой (Регрессийн тэгшитгэлийн олсон үнэлгээ нь статистикийн хувьд найдвартай).

Үлдэгдлийн автокорреляцийг шалгах.
OLS ашиглан чанарын регрессийн загварыг бий болгох чухал урьдчилсан нөхцөл бол бусад бүх ажиглалтын хазайлтын утгуудаас санамсаргүй хазайлтын утгуудын бие даасан байдал юм. Энэ нь аливаа хазайлт, ялангуяа зэргэлдээх хазайлтын хооронд ямар ч хамаарал байхгүй гэдгийг баталгаажуулдаг.
Автокорреляци (цуваа хамаарал)цаг хугацаа (цаг хугацааны цуваа) эсвэл орон зайд (загалмайн цуваа) эрэмблэгдсэн ажиглагдсан үзүүлэлтүүдийн хоорондын хамаарал гэж тодорхойлогддог. Хугацааны цувааны өгөгдлийг ашиглах үед регрессийн шинжилгээнд үлдэгдлийн автокорреляци (хугацаа) түгээмэл байдаг ба хөндлөн огтлолын өгөгдлийг ашиглах үед маш ховор байдаг.
IN эдийн засгийн даалгавархамаагүй илүү түгээмэл эерэг автокорреляцигэхээсээ илүү сөрөг автокорреляци. Ихэнх тохиолдолд эерэг автокорреляци нь чиглэлтэй холбоотой байдаг байнгын өртөлтзагварт харгалзаагүй зарим хүчин зүйл.
Сөрөг автокорреляциүнэндээ эерэг хазайлтын дараа сөрөг болон эсрэгээр байна гэсэн үг. Улирлын мэдээгээр (өвөл-зун) ундааны эрэлт, орлогын ижил хамаарлыг авч үзвэл ийм нөхцөл байдал үүсч болно.
дунд автокорреляцийг үүсгэдэг гол шалтгаанууд, дараахь зүйлийг ялгаж болно.
1. Тодорхойлолтын алдаа. Загварт ямар нэгэн чухал тайлбарлагч хувьсагчийг оруулаагүй эсвэл буруу сонголтхараат байдлын хэлбэрүүд нь ихэвчлэн регрессийн шугамаас ажиглалтын цэгүүдийн системчилсэн хазайлтад хүргэдэг бөгөөд энэ нь автокорреляцид хүргэдэг.
2. Инерци. Эдийн засгийн олон үзүүлэлтүүд (инфляци, ажилгүйдэл, ҮНБ гэх мэт) нь бизнесийн үйл ажиллагааны хэлбэлзэлтэй холбоотой тодорхой мөчлөгийн шинж чанартай байдаг. Тиймээс индикаторуудын өөрчлөлт нь тэр даруй тохиолддоггүй, гэхдээ тодорхой инерцтэй байдаг.
3. Аалзны торны эффект. Үйлдвэрлэлийн болон бусад салбарт эдийн засгийн үзүүлэлтүүд өөрчлөлтөд хариу үйлдэл үзүүлдэг эдийн засгийн нөхцөл байдалсааталтай (цаг хугацааны хоцрогдол).
4. Өгөгдлийг жигд болгох. Ихэнхдээ тодорхой урт хугацааны өгөгдлийг бүрдүүлэгч интервалаар нь дундажлах замаар олж авдаг. Энэ нь авч үзэж буй хугацаанд үүссэн хэлбэлзлийг тодорхой жигдрүүлж, улмаар автокорреляцийг үүсгэж болзошгүй юм.
Автокорреляцийн үр дагавар нь гетероскедастикийн үр дагавартай төстэй: регрессийн коэффициент ба детерминацийн коэффициентийн ач холбогдлыг тодорхойлсон t- ба F-статистикийн дүгнэлт нь буруу байх магадлалтай.

Автокорреляцийг илрүүлэх

1. График арга
Автокорреляцийг графикаар тодорхойлох хэд хэдэн сонголт байдаг. Тэдний нэг нь e i хазайлтыг хүлээн авсан мөчүүдтэй холбодог. Энэ тохиолдолд абсцисса тэнхлэг нь статистикийн мэдээллийг олж авах цагийг харуулдаг серийн дугааражиглалт, ординатын дагуу - хазайлт e i (эсвэл хазайлтын тооцоо).
Хэрэв хазайлтуудын хооронд тодорхой холболт байгаа бол автокорреляци явагдана гэж үзэх нь зүйн хэрэг юм. Хамааралгүй байх нь автокорреляци байхгүйг илтгэнэ.
Хэрэв та e i-ийн e i-1-ээс хамаарлыг зурвал автокорреляци илүү тодорхой болно.

Durbin-Watson тест.
Энэ шалгуур нь автокорреляцийг илрүүлэхэд хамгийн сайн танигдсан шалгуур юм.
Регрессийн тэгшитгэлд статистик дүн шинжилгээ хийхдээ эхний шатихэвчлэн нэг урьдчилсан нөхцөлийн боломжит байдлыг шалгадаг: өөр хоорондоо хазайх статистикийн бие даасан байдлын нөхцөл. Энэ тохиолдолд хөрш зэргэлдээх e i утгуудын хамааралгүй байдлыг шалгана.

y у(х) e i = y-y(x) д 2 (e i - e i-1) 2
15.6 14.11 1.49 2.21 0
19.9 16.02 3.88 15.04 5.72
22.7 23.04 -0.3429 0.1176 17.81
34.2 27.81 6.39 40.78 45.28
44.5 30.2 14.3 204.49 62.64
26.8 33.47 -6.67 44.51 439.82
35.7 40.83 -5.13 26.35 2.37
30.6 48.33 -17.73 314.39 158.7
161.9 158.07 3.83 14.66 464.81
662.54 1197.14

Хазайлын хамаарлыг шинжлэхийн тулд Durbin-Watson статистикийг ашигладаг.

d 1 ба d 2 эгзэгтэй утгыг шаардлагатай ач холбогдлын түвшин α, ажиглалтын тоо n = 9, тайлбарлах хувьсагчийн тоо m = 1 гэсэн тусгай хүснэгтийн үндсэн дээр тодорхойлно.
Дараах нөхцөл хангагдсан тохиолдолд автокорреляци байхгүй.
d 1< DW и d 2 < DW < 4 - d 2 .
Хүснэгтэд хамаарахгүйгээр та ойролцоо дүрмийг ашиглаж, 1.5 бол үлдэгдэл автокорреляци байхгүй гэж үзэж болно.< DW < 2.5. Для более надежного вывода целесообразно обращаться к табличным значениям.

Корреляцийн хамаарлыг судлах нь хамааралтай хувьсагч болгон авч болох нэг хувьсагчийн утгууд нөгөө хувьсагчийн авсан утгуудаас хамааран "дунджаар" өөрчлөгддөг хувьсагчдын хоорондын холболтыг судлахад суурилдаг. хувьсагч, хамааралтай хувьсагчтай холбоотой шалтгаан гэж үздэг. Энэ шалтгааны үйлдэл нь нарийн төвөгтэй харилцан үйлчлэлийн нөхцөлд явагддаг янз бүрийн хүчин зүйлүүд, үүний үр дүнд хэв маягийн илрэл нь тохиолдлын нөлөөгөөр бүрхэгдэнэ. Тухайн шинж чанар-хүчин зүйлийн утгын бүлгийн үр дүнтэй шинж чанарын дундаж утгыг тооцоолсноор тохиолдлын нөлөөллийг хэсэгчлэн арилгадаг. Онолын холбооны шугамын параметрүүдийг тооцоолсноор тэдгээрийг цаашид арилгаж, "x" хүчин зүйлийн өөрчлөлттэй "y" дахь хоёрдмол утгагүй (хэлбэрийн хувьд) өөрчлөлтийг олж авна.

Стохастик харилцааг судлахын тулд хоёр зэрэгцээ цувааг харьцуулах арга, аналитик бүлэглэх арга, корреляцийн шинжилгээ, регрессийн шинжилгээ болон зарим параметрийн бус аргууд. IN ерөнхий үзэлХарилцаа холбоог судлах чиглэлээр статистикийн үүрэг бол тэдгээрийн оршихуй, чиглэл, холболтын хүчийг тоон үзүүлэлтээр илэрхийлэхээс гадна хүчин зүйлийн шинж чанарын үр дүнд үзүүлэх нөлөөллийн хэлбэрийг (аналитик илэрхийлэл) тодорхойлох явдал юм. Үүнийг шийдвэрлэхийн тулд корреляцийн аргууд ба регрессийн шинжилгээ.

БҮЛЭГ 1. РЕГРЕССИЙН ТЭГШИтгэл: ОНОЛЫН ҮНДЭС

1.1. Регрессийн тэгшитгэл: функцүүдийн мөн чанар ба төрөл

Регресс (лат. regressio- урвуу хөдөлгөөн, түүнээс дээш шилжилт нарийн төвөгтэй хэлбэрүүднарийн төвөгтэй болгох) нь магадлалын онолын үндсэн ойлголтуудын нэг юм математик статистик, санамсаргүй хэмжигдэхүүний дундаж утгын өөр нэг санамсаргүй хэмжигдэхүүн эсвэл хэд хэдэн санамсаргүй хэмжигдэхүүний утгаас хамаарлыг илэрхийлдэг. Энэ ойлголтыг 1886 онд Фрэнсис Галтон танилцуулсан.

Онолын регрессийн шугам нь корреляцийн талбайн цэгүүдийг тойруулан бүлэглэж, үндсэн чиглэл, холболтын гол чиг хандлагыг харуулсан шугам юм.

Онолын регрессийн шугам нь "x" хүчин зүйлтэй холбоотой бусад бүх шалтгааныг санамсаргүй байдлаар өөрчлөх тохиолдолд "y" хүчин зүйлийн шинж чанарын дундаж утгын өөрчлөлтийг тусгах ёстой. , бүрэн хүчингүй болсон. Иймээс энэ шугамыг онолын регрессийн шугамын харгалзах цэгүүдээс корреляцийн талбайн цэгүүдийн хазайлтын нийлбэр тэгтэй тэнцүү байх ба эдгээр хазайлтын квадратуудын нийлбэр хамгийн бага байхаар зурах ёстой.

y=f(x) - регрессийн тэгшитгэл нь хувьсагчдын хоорондын статистик хамаарлын томъёо юм.

Хавтгай дээрх шулуун шугамыг (хоёр хэмжээст орон зайд) y=a+b*x тэгшитгэлээр олно. Илүү дэлгэрэнгүй, y хувьсагчийг тогтмол (a) ба налуу (b) х хувьсагчаар үржүүлж илэрхийлж болно. Тогтмолыг заримдаа огтлолцох нэр томъёо гэж нэрлэдэг ба налууг заримдаа регресс эсвэл B-коэффицент гэж нэрлэдэг.

Чухал алхамРегрессийн шинжилгээ нь шинж чанаруудын хоорондын хамаарлыг тодорхойлдог функцийн төрлийг тодорхойлох явдал юм. Гол үндэс нь судалж буй хамаарлын мөн чанар, түүний механизмын утга учиртай дүн шинжилгээ байх ёстой. Үүний зэрэгцээ судалж буй нийгэм-эдийн засгийн үзэгдлүүд нь маш нарийн төвөгтэй бөгөөд тэдгээрийн түвшинг бүрдүүлж буй хүчин зүйлүүд нь хоорондоо нягт уялдаатай, харилцан үйлчилдэг тул хүчин зүйл тус бүр болон гүйцэтгэлийн үзүүлэлтүүдийн хоорондын уялдаа холбоог онолын хувьд үндэслэлтэй болгох нь үргэлж боломжгүй байдаг. бусадтайгаа. Тиймээс үндэслэн онолын шинжилгээИхэнхдээ харилцааны чиглэл, судалж буй популяцид түүнийг өөрчлөх боломж, шугаман харилцааг ашиглах хууль ёсны байдал, хэт үнэ цэнэ байж болзошгүй гэх мэт хамгийн ерөнхий дүгнэлтийг гаргаж болно. Ийм таамаглалд зайлшгүй шаардлагатай нэмэлт зүйл нь тодорхой бодит мэдээллийн дүн шинжилгээ байх ёстой.

Эмпирик регрессийн шугам дээр үндэслэн харилцааны шугамын ойролцоо санааг олж авах боломжтой. Эмпирик регрессийн шугам нь ихэвчлэн тасархай шугам бөгөөд их бага ач холбогдолтой завсарлагатай байдаг. Энэ нь үр дүнтэй шинж чанарын өөрчлөлтөд нөлөөлдөг бусад тооцоогүй хүчин зүйлсийн нөлөөлөл дунджаар бүрэн арилдаггүй, хангалтгүйн улмаас тайлбарлагддаг. их хэмжээгээражиглалт, тиймээс ажиглалтын тоо хангалттай их байвал онолын муруйн төрлийг сонгох, зөвтгөхөд эмпирик харилцааны шугамыг ашиглаж болно.

Тодорхой судалгаануудын нэг элемент бол харилцан хамаарлыг тодорхойлоход ихэвчлэн загваруудын өрсөлдөгч хувилбаруудаар эмпирик өгөгдлийг ойролцоолох чанарын шалгуурыг ашиглахад үндэслэсэн янз бүрийн хамаарлын тэгшитгэлүүдийг харьцуулах явдал юм. эдийн засгийн үзүүлэлтүүддараах төрлийн функцуудыг ашиглана:

1. Шугаман:

2. Гипербол:

3. Үзүүлэн харуулах:

4. Параболик:

5. Эрчим хүч:

6. Логарифм:

7. Логистик:

Нэг тайлбарлагч, нэг тайлбарласан хувьсагчтай загвар нь хосолсон регрессийн загвар юм. Хэрэв хоёр ба түүнээс дээш тайлбарлагч (хүчин зүйл) хувьсагчийг ашиглаж байгаа бол бид олон регрессийн загварыг ашиглах тухай ярьж байна. Энэ тохиолдолд эдгээр хувьсагчдыг холбосон шугаман, экспоненциал, гипербол, экспоненциал болон бусад төрлийн функцуудыг сонголт болгон сонгож болно.

Регрессийн тэгшитгэлийн a ба b параметрүүдийг олохын тулд хамгийн бага квадратын аргыг ашиглана. Эмпирик өгөгдөлд хамгийн сайн тохирох функцийг олохын тулд хамгийн бага квадратын аргыг ашиглахдаа онолын регрессийн шугамаас эмпирик цэгүүдийн хазайлтын квадратуудын баг нь хамгийн бага утга байх ёстой гэж үздэг.

Хамгийн бага квадратын шалгуурыг дараах байдлаар бичиж болно.

Үүний үр дүнд эмпирик өгөгдөлд хамгийн сайн тохирох шугамын a ба b параметрүүдийг тодорхойлохдоо хамгийн бага квадратын аргыг ашиглах нь экстремум асуудал болж буурдаг.

Үнэлгээний хувьд дараахь дүгнэлтийг гаргаж болно.

1. Хамгийн бага квадратын тооцоологч нь түүврийн функцууд бөгөөд тэдгээрийг тооцоолоход хялбар болгодог.

2. Хамгийн бага квадратын тооцоолол нь цэгийн тооцооонолын регрессийн коэффициентүүд.

3. Эмпирик регрессийн шугам нь заавал x,y цэгээр дамждаг.

4. Эмпирик регрессийн тэгшитгэлийг хазайлтын нийлбэр нь

.

Эмпирик ба онолын харилцааны шугамын график дүрслэлийг Зураг 1-д үзүүлэв.


Тэгшитгэлийн b параметр нь регрессийн коэффициент юм. Хэрэв шууд хамаарал байгаа бол регрессийн коэффициент байна эерэг утга, мөн урвуу хамаарлын үед регрессийн коэффициент сөрөг байна. Регрессийн коэффициент нь хүчин зүйлийн шинж чанар "x" нэгээр өөрчлөгдөхөд "y" үр дүнтэй шинж чанарын утга дунджаар хэр их өөрчлөгдөж байгааг харуулдаг. Геометрийн хувьд регрессийн коэффициент нь "х" тэнхлэгтэй харьцуулахад корреляцийн тэгшитгэлийг харуулсан шулуун шугамын налуу юм (тэгшитгэлийн хувьд).

).

Олон хэмжээст хэсэг Статистикийн дүн шинжилгээ, хараат байдлыг сэргээхэд зориулагдсан, регрессийн шинжилгээ гэж нэрлэдэг. "Шугаман регрессийн шинжилгээ" гэсэн нэр томъёог авч үзэж буй функц нь тооцоолсон параметрүүдээс шугаман хамааралтай (бие даасан хувьсагчийн хамаарал нь дур зоргоороо байж болно) тохиолдолд хэрэглэгддэг. Үнэлгээний онол

Шугаман регрессийн шинжилгээний тохиолдолд үл мэдэгдэх параметрүүдийг тусгайлан сайн боловсруулсан. Хэрэв шугаман байдал байхгүй бөгөөд шугаман бодлого руу шилжих боломжгүй бол дүрмээр бол: сайн шинж чанарууддүнгээс ямар ч хүлээлт байхгүй. Хамааралтай тохиолдолд бид арга барилыг харуулах болно янз бүрийн төрөл. Хэрэв хамаарал нь олон гишүүнт (олон гишүүн) хэлбэртэй байвал. Хэрэв корреляцийн тооцоо нь хоёр хувьсагчийн хоорондын хамаарлын бат бөх чанарыг тодорхойлдог бол регрессийн шинжилгээ нь энэ харилцааны төрлийг тодорхойлоход үйлчилж, өөр (бие даасан) хувьсагчийн утга дээр үндэслэн нэг (хамааралтай) хувьсагчийн утгыг таамаглах боломжийг олгодог. . Шугаман регрессийн шинжилгээ хийхийн тулд хамааралтай хувьсагч нь интервал (эсвэл дарааллын) масштабтай байх ёстой. Үүний зэрэгцээ хоёртын логистикийн регресс нь дихотомийн хувьсагчийн аль ч масштабтай холбоотой бусад хувьсагчаас хамааралтай болохыг харуулж байна. Пробитийн шинжилгээнд хэрэглээний ижил нөхцөл хамаарна. Хэрэв хамааралтай хувьсагч нь ангилалтай боловч хоёроос дээш ангилалтай бол интервалын масштабад хамаарах хувьсагчдын хоорондын шугаман бус хамаарлыг олон гишүүнт логистик регресс нь шинжлэх тохиромжтой арга юм. Шугаман бус регрессийн аргыг энэ зорилгоор зохион бүтээсэн.

Өгөгдлийн шинжилгээний үндэс.

Практикт тохиолддог ердийн асуудал бол хувьсагчдын хоорондын хамаарал эсвэл хамаарлыг тодорхойлох. Бодит амьдрал дээр хувьсагчид хоорондоо холбоотой байдаг. Жишээлбэл, маркетингийн хувьд зар сурталчилгаанд зарцуулсан мөнгөний хэмжээ нь борлуулалтад нөлөөлдөг; эмнэлгийн судалгааны тунгаар эмийн бүтээгдэхүүннөлөөнд нөлөөлдөг; нэхмэлийн үйлдвэрлэлд даавууны будгийн чанар нь температур, чийгшил болон бусад үзүүлэлтээс хамаардаг; металлургийн хувьд гангийн чанар нь тусгай нэмэлт гэх мэтээс хамаардаг. Өгөгдлийн хамаарлыг олж, өөрийн зорилгодоо ашиглах нь өгөгдлийн шинжилгээний ажил юм.

Та X ба Y хувьсагчийн хос утгыг ажиглаж, тэдгээрийн хоорондын хамаарлыг олохыг хүсч байна гэж бодъё. Жишээлбэл:

X - онлайн дэлгүүрт зочилсон хүмүүсийн тоо, Y - борлуулалтын хэмжээ;

X - плазмын самбар диагональ, Y - үнэ;

X нь хувьцааг худалдан авах үнэ, Y нь худалдах үнэ;

X нь Лондонгийн хөрөнгийн бирж дэх хөнгөн цагааны өртөг, Y нь борлуулалтын хэмжээ;

X - газрын тос дамжуулах хоолойн эвдрэлийн тоо, Y - алдагдлын хэмжээ;

X нь онгоцны "нас", Y нь засварын зардал;

X- худалдааны бүс, Y - дэлгүүрийн эргэлт;

X нь орлого, Y нь хэрэглээ гэх мэт.

Х хувьсагчийг ихэвчлэн бие даасан хувьсагч, Y хувьсагчийг хамааралтай хувьсагч гэж нэрлэдэг. Заримдаа X хувьсагчийг урьдчилан таамаглагч, Y хувьсагчийг хариу үйлдэл гэж нэрлэдэг.



Бид X-ийн хамаарлыг яг таг тодорхойлох эсвэл X-ийн өгөгдсөн утгуудын хувьд Y-ийн утга ямар байхыг урьдчилан таамаглахыг хүсч байна. IN энэ тохиолдолдбид X утгууд болон харгалзах Y утгуудыг ажиглаж байна. Даалгавар бол ажиглагдсанаас ялгаатай X-ийн утгуудаас Y-г тодорхойлох боломжийг олгодог загвар бүтээх явдал юм.Статистикийн хувьд ийм асуудлуудыг хүрээнд шийддэг регрессийн шинжилгээ.

Төрөл бүрийн регрессийн загварууд байдаг, функцын сонголтоор тодорхойлогддог f(x 1 ,x 2 ,…,x м):

1) Энгийн шугаман регресс

2) Олон регресс

3) Олон гишүүнт регресс

Магадлал регрессийн параметрүүд гэж нэрлэдэг.

Регрессийн шинжилгээний гол онцлог: түүний тусламжтайгаар судалж буй хувьсагчдын хоорондын хамаарал ямар хэлбэр, шинж чанартай болох талаар тодорхой мэдээлэл авах боломжтой.

Регрессийн шинжилгээний үе шатуудын дараалал

1. Асуудлын томъёолол. Энэ үе шатанд судалж буй үзэгдлүүдийн хамаарлын талаархи урьдчилсан таамаглалууд үүсдэг.

2. Хараат ба бие даасан (тайлбар) хувьсагчийн тодорхойлолт.

3. Статистикийн мэдээлэл цуглуулах. Регрессийн загварт багтсан хувьсагч бүрийн хувьд өгөгдөл цуглуулах ёстой.

4. Холболтын хэлбэрийн тухай таамаглал дэвшүүлэх (энгийн буюу олон, шугаман эсвэл шугаман бус).

5. Регрессийн функцийг тодорхойлох (регрессийн тэгшитгэлийн параметрүүдийн тоон утгыг тооцоолоход оршино)

6. Регрессийн шинжилгээний үнэн зөвийг үнэлэх.

7. Хүлээн авсан үр дүнгийн тайлбар. Регрессийн шинжилгээний үр дүнг урьдчилсан таамаглалтай харьцуулсан болно. Хүлээн авсан үр дүнгийн үнэн зөв, найдвартай байдлыг үнэлдэг.

8. Хамаарах хувьсагчийн үл мэдэгдэх утгуудын таамаглал.

Регрессийн шинжилгээг ашиглан урьдчилан таамаглах, ангилах асуудлыг шийдвэрлэх боломжтой. Урьдчилан таамагласан утгыг тайлбарлагч хувьсагчдын утгыг регрессийн тэгшитгэлд орлуулах замаар тооцоолно. Ангиллын асуудлыг ийм байдлаар шийддэг: регрессийн шугам нь бүхэл бүтэн объектыг хоёр ангид хуваадаг бөгөөд функцийн утга нь тэгээс их байгаа хэсэг нь нэг ангилалд, тэгээс бага хэсэг нь хамаарна. өөр ангилалд багтдаг.

Регрессийн шинжилгээний үндсэн ажлууд:харилцааны хэлбэрийг тогтоох, регрессийн функцийг тодорхойлох, хамааралтай хувьсагчийн үл мэдэгдэх утгыг тооцоолох.

Шугаман регресс

Шугаман регрессхэлбэрийн тэгшитгэлийг олох хүртэл бууруулна

Эсвэл . (1.1)

x- бие даасан хувьсагч эсвэл урьдчилан таамаглагч гэж нэрлэдэг.

Ю– хамааралтай эсвэл хариулах хувьсагч. Энэ бол бидний хүлээж буй үнэ цэнэ юм y(дунджаар) хэрэв бид үнэ цэнийг мэддэг бол x, өөрөөр хэлбэл Энэ бол "урьдчилан таамагласан үнэ цэнэ" y»

· а– үнэлгээний шугамын чөлөөт хугацаа (уулзвар); энэ бол утга учир юм Ю, Хэзээ x=0(Зураг 1).

· б– тооцоолсон шугамын налуу буюу налуу; энэ нь хэмжээг илэрхийлнэ Юнэмэгдүүлбэл дунджаар нэмэгдэнэ xнэг нэгж тутамд.

· аТэгээд бТооцоолсон шугамын регрессийн коэффициент гэж нэрлэдэг боловч энэ нэр томъёог зөвхөн ашигладаг б.

· д- дундаж 0-тэй ажиглагдах боломжгүй санамсаргүй хэмжигдэхүүнүүд, эсвэл тэдгээрийг ажиглалтын алдаа гэж нэрлэдэг.

Зураг 1. a огтлолцол ба налуу b-ийг харуулсан шугаман регрессийн шугам (х нэг нэгжээр нэмэгдэхэд Y хэмжээ нэмэгдэнэ)

Маягтын тэгшитгэл нь хүчин зүйлийн өгөгдсөн утгыг авах боломжийг олгодог Xүр дүнгийн шинж чанарын онолын утгуудтай байх ба үүнд хүчин зүйлийн бодит утгыг орлуулна. X. График дээр онолын утгууд нь регрессийн шугамыг төлөөлдөг.

Ихэнх тохиолдолд (үргэлж биш бол) регрессийн шугамтай харьцуулахад ажиглалтын тодорхой тархалт байдаг.

Онолын регрессийн шугамкорреляцийн талбайн цэгүүдийг тойруулан бүлэглэх ба холболтын үндсэн чиглэл, гол чиг хандлагыг харуулсан шугам юм.

Регрессийн шинжилгээний чухал үе шат бол шинж чанаруудын хоорондын хамаарлыг тодорхойлдог функцийн төрлийг тодорхойлох явдал юм. Тэгшитгэлийн төрлийг сонгох гол үндэс нь судалж буй хамаарлын мөн чанар, түүний механизмын утга учиртай дүн шинжилгээ байх ёстой.

Параметрүүдийг олохын тулд АТэгээд бБид регрессийн тэгшитгэлийг ашигладаг хамгийн бага квадратын арга (LSM). Эмпирик өгөгдөлд хамгийн сайн тохирох функцийг олохын тулд OLS ашиглах үед, онолын регрессийн шугамаас эмпирик цэгүүдийн квадрат хазайлтын (үлдэгдэл) нийлбэр нь хамгийн бага утга байх ёстой гэж үздэг.

Үлдэгдлийг (шугамаас цэг бүрийн босоо зай, жишээлбэл, үлдэгдэл = ажиглагдсан) харах замаар тохирлыг үнэлдэг. y- урьдчилан таамагласан y, будаа. 2).

Үлдэгдэл квадратуудын нийлбэр хамгийн бага байхаар хамгийн сайн тохирох шугамыг сонгосон.

Цагаан будаа. 2. Цэг бүрийн хувьд үлдэгдэл дүрслэгдсэн (босоо тасархай шугам) шугаман регрессийн шугам.

Энгийн хувиргалт хийсний дараа бид параметрийн утгыг тодорхойлохын тулд хамгийн бага квадратын аргыг ашиглан хэвийн тэгшитгэлийн системийг олж авдаг. аТэгээд бЭмпирик өгөгдөл дээр суурилсан шугаман корреляцийн тэгшитгэлүүд:

. (1.2)

Шийдвэрлэж байна энэ систем-тай холбоотой тэгшитгэлүүд б, бид энэ параметрийг тодорхойлохын тулд дараах томъёог авна.

(1.3)

y, x-ийн дундаж утгууд хаана байна.

Параметрийн утга АБид энэ системийн эхний тэгшитгэлийн хоёр талыг хуваах замаар олж авна n:

Параметр бтэгшитгэлд регрессийн коэффициент гэж нэрлэдэг. Шууд хамаарал байгаа тохиолдолд регрессийн коэффициент эерэг, урвуу хамааралтай тохиолдолд регрессийн коэффициент сөрөг байна.

Хэрэв регрессийн коэффициентийн тэмдэг эерэг байвал хамааралтай хувьсагч ба бие даасан хувьсагчийн хоорондын хамаарал эерэг байна.

Хэрэв регрессийн коэффициентийн тэмдэг сөрөг байвал хамааралтай хувьсагч ба бие даасан хувьсагчийн хоорондын хамаарал сөрөг (урвуу) байна.

Регрессийн коэффициент нь үүссэн шинж чанарын утга дунджаар хэр их өөрчлөгдөж байгааг харуулдаг yхүчин зүйлийн шинж чанар өөрчлөгдөх үед Xнэгжид геометрийн регрессийн коэффициент нь тэнхлэгтэй харьцуулахад корреляцийн тэгшитгэлийг харуулсан шулуун шугамын налуу юм. X(тэгшитгэлийн хувьд).

Шугаман хамаарлын улмаас бид үүнийг регрессийн улмаас үүссэн эсвэл тайлбарласан өөрчлөлт гэж нэрлэдэг. Үлдэгдэл өөрчлөлт нь аль болох бага байх ёстой.

Хэрэв энэ нь үнэн бол ихэнх өөрчлөлтийг регрессээр тайлбарлах бөгөөд цэгүүд нь регрессийн шугамд ойрхон байх болно, өөрөөр хэлбэл. мөр нь өгөгдөлд сайн тохирч байна.

Тоон шинж чанархоорондын шугаман хамаарлын зэрэг санамсаргүй хэмжигдэхүүн X ба Y нь корреляцийн коэффициент юм r( Хоёр шинж чанарын хоорондын уялдаа холбоог харуулсан үзүүлэлт ) .

Корреляцийн коэффициент:

Энд x нь хүчин зүйлийн шинж чанарын утга;

y - үүссэн шинж чанарын утга;

n - өгөгдлийн хосын тоо.


Зураг 3 - Цэгүүдийн "үүл"-ийн байршлын сонголтууд

Хэрэв корреляцийн коэффициент r=1, дараа нь хооронд XТэгээд Юфункц байдаг шугаман хамаарал, бүх оноо (x i, y i)шулуун шугам дээр хэвтэх болно.

Хэрэв корреляцийн коэффициент r=0 (r~0), дараа нь тэд ингэж хэлдэг XТэгээд Юхамааралгүй, өөрөөр хэлбэл. тэдгээрийн хооронд шугаман хамаарал байхгүй.

Шинж тэмдгүүдийн хоорондын хамаарал (Чаддокийн масштабаар) хүчтэй, дунд, сул байж болно . Холболтын ойр байдал нь корреляцийн коэффициентийн утгаар тодорхойлогддог бөгөөд энэ нь -1-ээс +1 хүртэлх утгыг авч болно.. Холболтын битүүмжлэлийг үнэлэх шалгуурыг Зураг дээр үзүүлэв. 1.

Цагаан будаа. 4. Харилцааны ойр байдлыг үнэлэх тоон шалгуур

Хувьсагчдын хоорондын аливаа хамаарал нь хэмжээ ба найдвартай гэсэн хоёр чухал шинж чанартай байдаг. Хоёр хувьсагчийн хоорондын хамаарал хэдий чинээ хүчтэй байна, төдий чинээ харилцааны хэмжээ их байх ба нэг хувьсагчийн утгыг нөгөө хувьсагчийн утгаас таамаглахад хялбар байдаг.Хараат байдлын цар хүрээг хэмжих нь найдвартай байдлаас илүү хялбар байдаг.

Хараат байдлын найдвартай байдал нь түүний хэмжээнээс багагүй чухал юм. Энэ шинж чанар нь судалж буй түүврийн төлөөлөлтэй холбоотой юм. Харилцааны найдвартай байдал нь бусад өгөгдлүүд дээр энэ харилцаа дахин олдох магадлал хэр их байгааг тодорхойлдог.

Хувьсагчдын хамаарлын хэмжээ нэмэгдэхийн хэрээр түүний найдвартай байдал ихэвчлэн нэмэгддэг.

Хуваалцах нийт хэлбэлзэл, үүнийг регрессээр тайлбарладаг тодорхойлох коэффициент, ихэвчлэн хувиар илэрхийлж, тэмдэглэдэг R 2(хосолсон шугаман регрессийн хувьд энэ нь хэмжигдэхүүн юм r 2, корреляцийн коэффициентийн квадрат) нь регрессийн тэгшитгэлийн чанарыг субъектив байдлаар үнэлэх боломжийг олгодог.

Детерминацийн коэффициент нь бүтээгдсэн регрессийн "тайлбарласан" дундаж утгыг тойрсон дисперсийн эзлэх хувийг хэмждэг. Детерминацийн коэффициент нь 0-ээс 1-ийн хооронд хэлбэлздэг. Детерминацийн коэффициент 1-д ойртох тусам регресс нь өгөгдлийн хамаарлыг "тайлбарлах" нь тэгтэй ойролцоо утга нь бүтээгдсэн загварын чанар муутай гэсэн үг юм. Хэрэв бүх таамаглагчид ялгаатай бол детерминацийн коэффициент 1-д аль болох ойр байж болно.

Энэ ялгаа нь регрессээр тайлбарлах боломжгүй дисперсийн хувийг илэрхийлнэ.

Олон регресс

Олон тооны регрессийг үр дүнтэй шинж чанарт нөлөөлж буй олон хүчин зүйлээс нэг давамгайлсан хүчин зүйлийг ялгах боломжгүй, хэд хэдэн хүчин зүйлийн нөлөөллийг харгалзан үзэх шаардлагатай нөхцөлд ашигладаг. Жишээлбэл, гаралтын хэмжээг үндсэн ба хэмжээнээс хамаарч тодорхойлно эргэлтийн хөрөнгө, боловсон хүчний тоо, удирдлагын түвшин гэх мэт эрэлтийн түвшин нь зөвхөн үнээс төдийгүй хүн амд байгаа хөрөнгөөс хамаарна.

Олон тооны регрессийн гол зорилго нь хэд хэдэн хүчин зүйл бүхий загварыг бий болгож, хүчин зүйл бүрийн нөлөөллийг тусад нь тодорхойлох, түүнчлэн судалж буй үзүүлэлтэд тэдгээрийн хамтарсан нөлөөллийг тодорхойлох явдал юм.

Олон регресс нь хэд хэдэн бие даасан хувьсагчтай харилцааны тэгшитгэл юм.

Суралцах хугацаандаа оюутнууд янз бүрийн тэгшитгэлтэй байнга тулгардаг. Тэдний нэг болох регрессийн тэгшитгэлийг энэ нийтлэлд авч үзэх болно. Энэ төрлийн тэгшитгэлийг математикийн параметрүүдийн хоорондын хамаарлын шинж чанарыг тодорхойлоход тусгайлан ашигладаг. Энэ төрөлтэгш байдлыг статистик болон эконометрикт ашигладаг.

Регрессийн тодорхойлолт

Математикийн хувьд регресс гэдэг нь өгөгдлийн багцын дундаж утгыг өөр хэмжигдэхүүний утгаас хамаарлыг тодорхойлдог тодорхой хэмжигдэхүүнийг хэлнэ. Регрессийн тэгшитгэл нь тодорхой шинж чанарын функцээр өөр шинж чанарын дундаж утгыг харуулдаг. Регрессийн функц нь y = x энгийн тэгшитгэлийн хэлбэртэй бөгөөд y нь хамааралтай хувьсагч, х нь бие даасан хувьсагчийн үүрэг гүйцэтгэдэг (онцлог хүчин зүйл). Үнэн хэрэгтээ регрессийг y = f (x) гэж илэрхийлдэг.

Хувьсагчдын хоорондын хамаарлын төрлүүд юу вэ?

Ерөнхийдөө хоёр байна эсрэг төрлүүдхарилцаа холбоо: хамаарал ба регресс.

Эхнийх нь нөхцөлт хувьсагчийн тэгш байдалаар тодорхойлогддог. Энэ тохиолдолд аль хувьсагч нөгөөгөөсөө хамаарах нь найдвартай мэдэгддэггүй.

Хэрэв хувьсагчдын хооронд тэгш байдал байхгүй бөгөөд нөхцөл нь аль хувьсагч нь тайлбарлагч, аль нь хамааралтай болохыг хэлж байвал бид хоёр дахь төрлийн холболт байгаа тухай ярьж болно. Шугаман регрессийн тэгшитгэлийг бий болгохын тулд ямар төрлийн хамаарал ажиглагдаж байгааг олж мэдэх шаардлагатай.

Регрессийн төрлүүд

Өнөөдөр гипербол, шугаман, олон, шугаман бус, хос, урвуу, логарифм шугаман гэсэн 7 төрлийн регресс байдаг.

Гипербол, шугаман, логарифм

Шугаман регрессийн тэгшитгэлийг статистикт тэгшитгэлийн параметрүүдийг тодорхой тайлбарлахад ашигладаг. y = c+t*x+E шиг харагдаж байна. Гипербол тэгшитгэл нь ердийн гипербол y = c + m / x + E хэлбэртэй байна. Логарифмийн хувьд шугаман тэгшитгэллогарифмын функц ашиглан хамаарлыг илэрхийлнэ: y = в в + м* онд х + Е.

Олон ба шугаман бус

Дахиад хоёр нарийн төвөгтэй төрлүүдРегресс нь олон ба шугаман бус байдаг. Олон тооны регрессийн тэгшитгэлийг y = f(x 1, x 2 ... x c) + E функцээр илэрхийлнэ. Энэ тохиолдолд y нь хамааралтай хувьсагчийн үүрэг, х нь тайлбарлагч хувьсагчийн үүрэг гүйцэтгэдэг. E хувьсагч нь стохастик бөгөөд энэ нь тэгшитгэлийн бусад хүчин зүйлийн нөлөөг агуулдаг. Шугаман бус тэгшитгэлрегресс нь бага зэрэг маргаантай байдаг. Нэг талаас, харгалзан үзсэн үзүүлэлтүүдтэй харьцуулахад энэ нь шугаман биш, харин нөгөө талаас үзүүлэлтүүдийг үнэлэх үүргийн хувьд шугаман шинж чанартай байдаг.

Урвуу ба хосолсон регрессийн төрлүүд

Урвуу функц нь хувиргах шаардлагатай функцийн төрөл юм шугаман харагдах байдал. Хамгийн уламжлалт хэрэглээний программуудад y = 1/c + m*x+E функцийн хэлбэртэй байдаг. Хос регрессийн тэгшитгэл нь өгөгдлийн хоорондын хамаарлыг y = f (x) + E-ийн функцээр харуулдаг. Бусад тэгшитгэлийн нэгэн адил у нь х-ээс хамаардаг ба E нь стохастик параметр юм.

Корреляцийн тухай ойлголт

Энэ нь хоёр үзэгдэл, үйл явцын хоорондын хамаарал байгааг харуулсан үзүүлэлт юм. Харилцааны хүчийг корреляцийн коэффициентээр илэрхийлдэг. Түүний утга нь [-1;+1] интервалд хэлбэлздэг. Сөрөг үзүүлэлт нь байгааг илтгэнэ санал хүсэлт, эерэг - шулуун шугамын тухай. Хэрэв коэффициент 0-тэй тэнцүү утгыг авбал ямар ч хамаарал байхгүй болно. Хэрхэн илүү ойр үнэ цэнэ 1 рүү - параметрүүдийн хоорондын холболт 0-д ойртох тусам сул байна.

Арга зүй

Корреляцийн параметрийн аргууд нь харилцааны бат бөх байдлыг үнэлэх боломжтой. Эдгээр нь хэвийн тархалтын хуульд захирагдах параметрүүдийг судлахын тулд тархалтын тооцооны үндсэн дээр ашиглагддаг.

Шугаман регрессийн тэгшитгэлийн параметрүүд нь хамаарлын төрөл, регрессийн тэгшитгэлийн функцийг тодорхойлох, сонгосон харилцааны томъёоны үзүүлэлтүүдийг үнэлэхэд шаардлагатай. Корреляцийн талбарыг холболтыг тодорхойлох арга болгон ашигладаг. Үүнийг хийхийн тулд одоо байгаа бүх өгөгдлийг графикаар дүрсэлсэн байх ёстой. Бүх мэдэгдэж буй өгөгдлийг тэгш өнцөгт хоёр хэмжээст координатын системд зурах ёстой. Энэ нь корреляцийн талбарыг үүсгэдэг. Тайлбарлах хүчин зүйлийн утгыг абсцисса тэнхлэгийн дагуу, харин хамааралтай хүчин зүйлийн утгыг ординатын тэнхлэгийн дагуу тэмдэглэнэ. Хэрэв параметрүүдийн хооронд функциональ хамаарал байгаа бол тэдгээрийг шугам хэлбэрээр байрлуулна.

Хэрэв ийм өгөгдлийн корреляцийн коэффициент 30% -иас бага байвал холболт бараг бүрэн байхгүй гэж хэлж болно. Хэрэв энэ нь 30% -аас 70% хооронд байвал энэ нь дунд зэргийн ойр холболт байгааг илтгэнэ. 100% үзүүлэлт нь функциональ холболтын нотолгоо юм.

Шугаман бус регрессийн тэгшитгэлийг шугаман адил корреляцийн индекс (R)-ээр нэмж оруулах ёстой.

Олон регрессийн хамаарал

Детерминацын коэффициент нь квадрат экспонент юм олон хамаарал. Тэрээр танилцуулсан үзүүлэлтүүд болон судалж буй шинж чанаруудын хоорондын нягт уялдаа холбоог ярьдаг. Энэ нь үр дүнд үзүүлэх параметрийн нөлөөллийн мөн чанарын тухай ярьж болно. Энэ үзүүлэлтийг ашиглан олон регрессийн тэгшитгэлийг тооцоолно.

Олон корреляцийн үзүүлэлтийг тооцоолохын тулд түүний индексийг тооцоолох шаардлагатай.

Хамгийн бага квадрат арга

Энэ арга нь регрессийн хүчин зүйлсийг тооцоолох арга юм. Үүний мөн чанар нь функцээс хамаарах хүчин зүйлийн үр дүнд олж авсан квадрат хазайлтын нийлбэрийг багасгах явдал юм.

Ийм аргыг ашиглан хос шугаман регрессийн тэгшитгэлийг тооцоолж болно. Энэ төрлийн тэгшитгэлийг үзүүлэлтүүдийн хооронд хос шугаман хамаарлыг илрүүлэх үед ашигладаг.

Тэгшитгэлийн параметрүүд

Шугаман регрессийн функцийн параметр бүр нь тодорхой утгатай байдаг. Хосолсон шугаман регрессийн тэгшитгэл нь c ба m гэсэн хоёр параметрийг агуулна. m параметр нь х хувьсагч нэг ердийн нэгжээр буурах (өсөх) тохиолдолд y функцийн эцсийн үзүүлэлтийн дундаж өөрчлөлтийг харуулдаг. Хэрэв x хувьсагч тэг бол функц нь c параметртэй тэнцүү байна. Хэрэв x хувьсагч тэг биш бол в хүчин зүйл нь эдийн засгийн утга агуулаагүй болно. Функцид нөлөөлөх цорын ганц зүйл бол в хүчин зүйлийн өмнөх тэмдэг юм. Хэрэв хасах зүйл байвал үр дүнгийн өөрчлөлт нь хүчин зүйлтэй харьцуулахад удаан байна гэж хэлж болно. Хэрэв нэмэх зүйл байгаа бол энэ нь үр дүнгийн хурдацтай өөрчлөлтийг илтгэнэ.

Регрессийн тэгшитгэлийн утгыг өөрчилдөг параметр бүрийг тэгшитгэлээр илэрхийлж болно. Жишээлбэл, c хүчин зүйл нь c = y - mx хэлбэртэй байна.

Бүлэглэсэн өгөгдөл

Бүх мэдээллийг x шинж чанараар бүлэглэсэн ажлын нөхцлүүд байдаг боловч тодорхой бүлгийн хувьд хамааралтай үзүүлэлтийн харгалзах дундаж утгыг зааж өгсөн болно. Энэ тохиолдолд дундаж утгууд нь x-ээс хамаарч үзүүлэлт хэрхэн өөрчлөгдөхийг тодорхойлдог. Тиймээс бүлэглэсэн мэдээлэл нь регрессийн тэгшитгэлийг олоход тусална. Үүнийг харилцааны шинжилгээ болгон ашигладаг. Гэсэн хэдий ч энэ арга нь сул талуудтай. Харамсалтай нь дундаж үзүүлэлтүүд ихэвчлэн гадны хэлбэлзэлтэй байдаг. Эдгээр хэлбэлзэл нь харилцааны хэв маягийг илэрхийлдэггүй; Дундаж нь шугаман регрессийн тэгшитгэлээс хамаагүй муу харилцааны хэв маягийг харуулдаг. Гэсэн хэдий ч тэдгээрийг тэгшитгэл олох үндэс болгон ашиглаж болно. Хувь хүн амын тоог харгалзах дундажаар үржүүлснээр бүлэг доторх y нийлбэрийг гаргаж болно. Дараа нь та хүлээн авсан бүх дүнг нэгтгэж, эцсийн y үзүүлэлтийг олох хэрэгтэй. Xy нийлбэр үзүүлэлтээр тооцоо хийхэд арай хэцүү. Хэрэв интервал бага бол бид бүх нэгжийн (бүлэг доторх) x үзүүлэлтийг ижил байх нөхцөлтэйгээр авч болно. Х ба у-ийн үржвэрийн нийлбэрийг олохын тулд та үүнийг y-ийн нийлбэрээр үржүүлэх хэрэгтэй. Дараа нь бүх дүнг нэгтгэж, xy-ийн нийт дүнг авна.

Олон тооны хос регрессийн тэгшитгэл: харилцааны ач холбогдлыг үнэлэх

Өмнө дурьдсанчлан олон тооны регресс нь y = f (x 1,x 2,…,x m)+E хэлбэрийн функцтэй. Ихэнхдээ ийм тэгшитгэлийг бүтээгдэхүүний эрэлт нийлүүлэлт, эргүүлэн худалдаж авсан хувьцааны хүүгийн орлогын асуудлыг шийдвэрлэх, үйлдвэрлэлийн өртгийн функцийн шалтгаан, төрлийг судлахад ашигладаг. Үүнийг макро эдийн засгийн янз бүрийн судалгаа, тооцоололд идэвхтэй ашигладаг боловч микро эдийн засгийн түвшинд энэ тэгшитгэлийг бага зэрэг ашигладаг.

Олон тооны регрессийн гол ажил бол загварчлах шаардлагатай үзүүлэлт, түүний коэффициентүүд дээр хүчин зүйл тус бүрийг тусад нь болон бүхэлд нь ямар нөлөө үзүүлж байгааг тодорхойлохын тулд асар их хэмжээний мэдээлэл агуулсан өгөгдлийн загварыг бий болгох явдал юм. Регрессийн тэгшитгэл нь олон төрлийн утгыг авч болно. Энэ тохиолдолд харилцааг үнэлэхийн тулд шугаман ба шугаман бус гэсэн хоёр төрлийн функцийг ихэвчлэн ашигладаг.

Шугаман функцийг дараах хамаарлын хэлбэрээр дүрсэлсэн: y = a 0 + a 1 x 1 + a 2 x 2,+ ... + a m x m. Энэ тохиолдолд a2, a m нь "цэвэр" регрессийн коэффициент гэж тооцогддог. Эдгээр нь y параметрийн дундаж өөрчлөлтийг бусад үзүүлэлтүүдийн тогтвортой утгын нөхцөлтэй харгалзах параметр бүрийг нэг нэгжээр өөрчлөх (буурах эсвэл нэмэгдүүлэх) тодорхойлоход шаардлагатай.

Шугаман бус тэгшитгэл нь жишээлбэл хэлбэртэй байдаг эрчим хүчний функц y=ax 1 b1 x 2 b2 ...x m bm . Энэ тохиолдолд b 1, b 2 ..... b m үзүүлэлтүүдийг уян хатан байдлын коэффициент гэж нэрлэдэг бөгөөд тэдгээр нь харгалзах үзүүлэлт x 1% -иар өсөх (буурах) үр дүн хэрхэн өөрчлөгдөхийг (хэчнээн% -иар) харуулдаг. бусад хүчин зүйлийн тогтвортой үзүүлэлттэй.

Олон тооны регрессийг байгуулахдаа ямар хүчин зүйлийг анхаарч үзэх хэрэгтэй

Зөв барихын тулд олон регресс, ямар хүчин зүйлд онцгой анхаарал хандуулах ёстойг олж мэдэх шаардлагатай.

Эдийн засгийн хүчин зүйлсийн хоорондын хамаарлын мөн чанар болон загварчилж байгаа зүйлийн талаар тодорхой ойлголттой байх шаардлагатай. Үүнд оруулах шаардлагатай хүчин зүйлүүд нь дараах шалгуурыг хангасан байх ёстой.

  • Үүнд хамаарах ёстой тоон хэмжилт. Объектын чанарыг тодорхойлсон хүчин зүйлийг ашиглахын тулд ямар ч тохиолдолд тоон хэлбэрийг өгөх ёстой.
  • Хүчин зүйлийн харилцан хамаарал, функциональ хамаарал байх ёсгүй. Ийм үйлдэл нь ихэвчлэн эргэлт буцалтгүй үр дагаварт хүргэдэг - систем энгийн тэгшитгэлүүдболзолгүй болж, энэ нь түүний найдваргүй байдал, тодорхой бус үнэлгээг дагуулдаг.
  • Асар их корреляцийн индикаторын хувьд үзүүлэлтийн эцсийн үр дүнд нөлөөлөх хүчин зүйлсийн тусгаарлагдсан нөлөөг олж мэдэх арга байхгүй тул коэффициентүүдийг тайлбарлах боломжгүй болно.

Барилгын арга

Тэгшитгэлийн хүчин зүйлсийг хэрхэн сонгохыг тайлбарлах олон тооны арга, аргууд байдаг. Гэсэн хэдий ч эдгээр бүх аргууд нь хамаарлын үзүүлэлтийг ашиглан коэффициентийг сонгоход суурилдаг. Тэдгээрийн дотор:

  • Устгах арга.
  • Солих арга.
  • Алхам алхмаар регрессийн шинжилгээ.

Эхний арга нь нийт багцаас бүх коэффициентийг шүүж авах явдал юм. Хоёрдахь арга нь олон нэмэлт хүчин зүйлийг нэвтрүүлэх явдал юм. Гурав дахь нь тэгшитгэлд өмнө нь ашиглаж байсан хүчин зүйлсийг арилгах явдал юм. Эдгээр аргууд бүр оршин тогтнох эрхтэй. Тэд давуу болон сул талуудтай боловч шаардлагагүй үзүүлэлтүүдийг арилгах асуудлыг өөрсдөө шийдэж чадна. Дүрмээр бол бие даасан арга тус бүрээр олж авсан үр дүн нь маш ойрхон байна.

Олон талт шинжилгээний аргууд

Хүчин зүйлсийг тодорхойлох ийм аргуудыг харгалзан үзэхэд үндэслэдэг бие даасан хослолуудхарилцан уялдаатай шинж чанарууд. Эдгээрт ялгах шинжилгээ, хэлбэрийг таних, үндсэн бүрэлдэхүүн хэсгүүдийн шинжилгээ, кластерийн шинжилгээ орно. Нэмж дурдахад хүчин зүйлийн шинжилгээ байдаг боловч энэ нь бүрэлдэхүүн хэсгийн аргыг хөгжүүлснээр гарч ирсэн. Эдгээр нь бүгд тодорхой нөхцөл, хүчин зүйлээс хамаарч тодорхой нөхцөл байдалд хамаарна.



Үүнтэй төстэй нийтлэлүүд

2024 parki48.ru. Бид хүрээ байшин барьж байна. Ландшафтын дизайн. Барилга. Суурь.