Регрессийн шинжилгээний регрессийн төрлүүд. Математик статистикийн аргууд. Регрессийн шинжилгээ

Лекц 3

Регрессийн шинжилгээ.

1) Регрессийн тоон шинж чанар

2) Шугаман регресс

3) Шугаман бус регресс

4) Олон регресс

5) Гүйцэтгэхийн тулд MS EXCEL ашиглах регрессийн шинжилгээ

Хяналт, үнэлгээний хэрэгсэл - тестийн даалгавар

1. Регрессийн тоон шинж чанар

Регрессийн шинжилгээ - статистикийн аргахамааралтай хувьсагчид нэг буюу хэд хэдэн бие даасан хувьсагчийн нөлөөллийн судалгаа. Бие даасан хувьсагчдыг өөрөөр хэлбэл регресс буюу урьдчилан таамаглагч, харин хамааралтай хувьсагчдыг шалгуур гэж нэрлэдэг. Хараат болон бие даасан хувьсагчдын нэр томьёо нь зөвхөн хувьсагчдын математикийн хамаарлыг илэрхийлдэг болохоос шалтгаан ба үр дагаврын хамаарлыг илэрхийлдэггүй.

Регрессийн шинжилгээний зорилго

  • Шалгуур (хамааралтай) хувьсагчийн өөрчлөлтийн детерминизмын зэргийг урьдчилан таамаглагчид (бие даасан хувьсагчид) тодорхойлох.
  • Бие даасан хувьсагчийг ашиглан хамааралтай хувьсагчийн утгыг урьдчилан таамаглах.
  • Хараат хувьсагчийн өөрчлөлтөд бие даасан хувьсагчдын оруулсан хувь нэмрийг тодорхойлох.

Регрессийн шинжилгээгээр хувьсагчдын хооронд хамаарал байгаа эсэхийг тодорхойлох боломжгүй, учир нь ийм хамаарал байгаа нь шинжилгээг хэрэглэх урьдчилсан нөхцөл болдог.

Регрессийн шинжилгээг хийхийн тулд эхлээд сайн мэддэг байх хэрэгтэй үндсэн ойлголтуудстатистик ба магадлалын онол.

Дискрет ба тасралтгүй санамсаргүй хэмжигдэхүүний үндсэн тоон шинж чанарууд: хүлээгдэж буй үнэ цэнэ, дисперс ба стандарт хазайлт.

Санамсаргүй хэмжигдэхүүнийг хоёр төрөлд хуваадаг.

  • Зөвхөн тодорхой, урьдчилан тодорхойлсон утгыг авч болох дискрет (жишээлбэл, шидсэн дээд ирмэг дээрх тоонуудын утгууд). шооэсвэл дарааллын утгуудодоогийн сар);
  • · тасралтгүй (ихэнхдээ - зарим физик хэмжигдэхүүний утгууд: жин, зай, температур гэх мэт), байгалийн хуулиудын дагуу ямар ч утгыг дор хаяж тодорхой интервалд авч болно.

хуваарилалтын хууль санамсаргүй хувьсагч- энэ нь салангид санамсаргүй хэмжигдэхүүний боломжит утгууд ба түүний магадлалын хоорондын хамаарал бөгөөд ихэвчлэн хүснэгтэд бичигдсэн байдаг.

Магадлалын статистик тодорхойлолтыг харьцангуй давтамжаар илэрхийлдэг санамсаргүй үйл явдал, өөрөөр хэлбэл санамсаргүй хэмжигдэхүүний тоог нийт санамсаргүй хэмжигдэхүүнд харьцуулсан харьцаагаар олно.

Дискрет санамсаргүй хэмжигдэхүүний математик хүлээлтXхэмжигдэхүүний утгуудын бүтээгдэхүүний нийлбэр гэж нэрлэдэг XЭдгээр утгуудын магадлалын талаар. Математикийн хүлээлтийг эсвэл гэж тэмдэглэнэ М(X) .

n

= М(X) = x 1 х 1 + x 2 х 2 +… + x n p n = С x i пи

би=1

Санамсаргүй хэмжигдэхүүнийг математикийн хүлээлттэй нь харгалзах дисперсийг дисперс гэж нэрлэгддэг тоон шинж чанарыг ашиглан тодорхойлно. Энгийнээр хэлбэл дисперс гэдэг нь санамсаргүй хэмжигдэхүүний дундаж утгын эргэн тойронд тархалт юм. Тархалтын мөн чанарыг ойлгохын тулд жишээг авч үзье. Дунд цалинулс даяар ойролцоогоор 25 мянган рубль байна. Энэ тоо хаанаас ирсэн бэ? Хамгийн магадлалтай нь бүх цалинг нэмж, ажилчдын тоонд хуваадаг. AT Энэ тохиолдолдмаш том тархалт (цалингийн доод хэмжээ нь 4 мянган рубль, дээд тал нь 100 мянган рубль). Хэрэв хүн бүр ижил цалинтай байсан бол тархалт тэг болж, тархалт байхгүй болно.

Дискрет санамсаргүй хэмжигдэхүүний тархалтXсанамсаргүй хэмжигдэхүүний зөрүүний квадратын математик хүлээлт ба түүний математик хүлээлт гэж нэрлэдэг.

D = M [ ((X - M (X)) 2 ]

Математикийн хүлээлтийн тодорхойлолтыг ашиглан дисперсийг тооцоолохдоо бид дараах томъёог авна.

D \u003d S (x i - M (X)) 2 p i

Дисперс нь санамсаргүй хэмжигдэхүүний квадратын хэмжээтэй байна. Санамсаргүй хэмжигдэхүүнтэй ижил хэмжээс дэх боломжит утгуудын тархалтын тоон шинж чанартай байх шаардлагатай тохиолдолд дундажийг ашиглана. стандарт хэлбэлзэл.

Стандарт хэлбэлзэлсанамсаргүй хэмжигдэхүүнийг түүний дисперсийн квадрат язгуур гэж нэрлэдэг.

Дундаж квадрат хазайлт нь санамсаргүй хэмжигдэхүүний математик хүлээлтийн эргэн тойронд байгаа утгуудын тархалтын хэмжүүр юм.

Жишээ.

Х санамсаргүй хэмжигдэхүүний тархалтын хуулийг дараах хүснэгтээр өгөв.

Түүний математик хүлээлт, дисперс болон стандарт хазайлтыг ол .

Бид дээрх томъёог ашигладаг:

M (X) \u003d 1 0.1 + 2 0.4 + 4 0.4 + 5 0.1 \u003d 3

D \u003d (1-3) 2 0.1 + (2 - 3) 2 0.4 + (4 - 3) 2 0.4 + (5 - 3) 2 0.1 \u003d 1.6

Жишээ.

Бэлэн мөнгөний хонжворт сугалаанд 1000 рублийн 1, 100 рублийн 10, 1 рублийн 100 хонжвор тоглогддог. нийт тоотасалбар 10000. Нэг эзэмшигчийн санамсаргүй хожлын X хуваарилалтын хуулийг гарга сугалааны тасалбармөн санамсаргүй хэмжигдэхүүний математик хүлээлт, дисперс болон стандарт хазайлтыг тодорхойлно.

X 1 \u003d 1000, X 2 \u003d 100, X 3 \u003d 1, X 4 \u003d 0,

P 1 = 1/10000 = 0.0001, P 2 = 10/10000 = 0.001, P 3 = 100/10000 = 0.01, P 4 = 1 - (P 1 + P 2 + P 3) = 0.9889.

Бид үр дүнг хүснэгтэд үзүүлэв:

Математикийн хүлээлт - санамсаргүй хэмжигдэхүүний утгыг магадлалаар нь хослуулсан үржвэрийн нийлбэр. Энэ асуудлын хувьд үүнийг томъёогоор тооцоолохыг зөвлөж байна

1000 0.0001 + 100 0.001 + 1 0.01 + 0 0.9889 = 0.21 рубль.

Бид жинхэнэ "шударга" тасалбарын үнийг авсан.

D \u003d S (x i - M (X)) 2 p i \u003d (1000 - 0.21) 2 0.0001 + (100 - 0.21) 2 0.001 +

+ (1 - 0,21) 2 0,01 + (0 - 0,21) 2 0,9889 ≈ 109,97

Тасралтгүй санамсаргүй хэмжигдэхүүнүүдийн тархалтын функц

Туршилтын үр дүнд нэг боломжит утгыг (аль нь болох нь тодорхойгүй) авах утгыг санамсаргүй хэмжигдэхүүн гэж нэрлэдэг. Дээр дурдсанчлан санамсаргүй хэмжигдэхүүн нь салангид (тасралтгүй) ба тасралтгүй байдаг.

Дискрет хувьсагч гэдэг нь дугаарлаж болох тодорхой магадлал бүхий тусдаа боломжит утгыг авдаг санамсаргүй хэмжигдэхүүн юм.

Тасралтгүй хэмжигдэхүүн нь төгсгөлтэй эсвэл хязгааргүй интервалаас бүх утгыг авах боломжтой санамсаргүй хэмжигдэхүүн юм.

Энэ хүртэл бид өөрсдийгөө зөвхөн нэг "төрөл бүрийн" санамсаргүй хэмжигдэхүүнээр хязгаарлаж ирсэн - дискрет, жишээлбэл. хязгаарлагдмал утгыг авах.

Гэхдээ статистикийн онол, практик нь тасралтгүй санамсаргүй хэмжигдэхүүн гэсэн ойлголтыг ашиглахыг шаарддаг - ямар ч интервалаас ямар ч тоон утгыг зөвшөөрдөг.

Тасралтгүй санамсаргүй хэмжигдэхүүний тархалтын хуулийг магадлалын нягтын функц гэж нэрлэгдэх функцийг ашиглан тодорхой зааж өгсөн болно. f(x). магадлал P(a< X < b) того, что значение, принятое случайной величиной Х, попадет в промежуток (a; b), определяется равенством

П (а< X < b) = ∫ е(x) dx

f (x) функцийн графикийг тархалтын муруй гэнэ. Геометрийн хувьд санамсаргүй хэмжигдэхүүн (a; b) интервалд орох магадлал нь харгалзах талбайн хэмжээтэй тэнцүү байна. муруй шугаман трапец, хязгаарлагдмал тархалтын муруй, Ox тэнхлэг ба шулуун шугамууд x = a, x = b.

P(a£X

Хэрэв нарийн төвөгтэй үйл явдлаас хязгаарлагдмал эсвэл тоолж болох олонлогийг хасвал шинэ үйл явдлын магадлал өөрчлөгдөхгүй хэвээр үлдэнэ.

f(x) функц - бодит аргумент x-ийн тоон скаляр функцийг магадлалын нягт гэж нэрлэдэг бөгөөд хэрэв энэ цэг дээр хязгаар байгаа бол x цэг дээр оршино.

Магадлалын нягтын шинж чанарууд:

  1. Магадлалын нягт нь сөрөг бус функц, өөрөөр хэлбэл f(x) ≥ 0

(хэрэв санамсаргүй хэмжигдэхүүн X-ийн бүх утгууд (a;b) интервалд байвал сүүлчийнх

тэгш байдлыг ∫ f (x) dx = 1) гэж бичиж болно.

Одоо F(x) = P(X) функцийг авч үзье< х). Эта функция называется функцией распределения вероятности случайной величины Х. Функция F(х) существует как для дискретных, так и для непрерывных случайных величин. Если f (x) - функция плотности распределения вероятности

тасралтгүй санамсаргүй хэмжигдэхүүн X, дараа нь F (x) = ∫ f(x) dx = 1).

Сүүлийн тэгшитгэлээс харахад f (x) = F" (x)

Заримдаа f(x) функцийг дифференциал магадлалын тархалтын функц, F(x) функцийг хуримтлагдсан магадлалын тархалтын функц гэж нэрлэдэг.

Бид магадлалын тархалтын функцийн хамгийн чухал шинж чанаруудыг тэмдэглэв.

  1. F(x) нь буурахгүй функц юм.
  2. F(-∞)=0.
  3. F (+∞) = 1.

Магадлалын онолд тархалтын функцийн тухай ойлголт гол байр суурь эзэлдэг. Энэ ойлголтыг ашигласнаар тасралтгүй санамсаргүй хэмжигдэхүүний өөр тодорхойлолтыг өгч болно. Санамсаргүй хэмжигдэхүүн нь интеграл тархалтын функц F(x) тасралтгүй байвал түүнийг тасралтгүй гэж нэрлэдэг.

Тасралтгүй санамсаргүй хэмжигдэхүүний тоон үзүүлэлтүүд

Аливаа санамсаргүй хэмжигдэхүүний математикийн хүлээлт, дисперс болон бусад параметрүүдийг бараг үргэлж тархалтын хуулиас дагах томъёог ашиглан тооцдог.

Тасралтгүй санамсаргүй хэмжигдэхүүний хувьд математикийн хүлээлтийг дараах томъёогоор тооцоолно.

M(X) = ∫ x f(x) dx

Тархалт:

D(X) = ∫ ( х- M (X)) 2 е(x) dx эсвэл D(X) = ∫ x 2 f(x) dx - (М (Х)) 2

2. Шугаман регресс

Хоёр хэмжээст санамсаргүй хэмжигдэхүүний (X, Y) X ба Y бүрэлдэхүүн хэсгүүд нь хамааралтай байг. Жишээлбэл, тэдгээрийн аль нэгийг нөгөөгийнхөө шугаман функцээр дүрсэлж болно гэж бид таамаглах болно

Y ≈ g(X) = α + βX ба α ба β параметрүүдийг хамгийн бага квадратын аргаар тодорхойлно.

Тодорхойлолт. g(X) = α + βX функцийг дуудна хамгийн сайн ойролцоо Y нь хамгийн бага квадратын аргын утгаар, хэрэв математикийн хүлээлт M(Y - g(X)) 2 боломжит хамгийн бага утгыг авбал; g(X) функцийг дуудна дундаж квадрат регресс Y-ээс X хүртэл.

Теорем X дээрх Y-ийн шугаман дундаж квадрат регресс нь:

X ба Y корреляцийн коэффициент хаана байна.

Тэгшитгэлийн коэффициентүүд.

Эдгээр утгуудад F (α, β) функц байгаа эсэхийг шалгаж болно.

Ф(α, β ) = М(Y - α - βX)² нь минимумтай бөгөөд энэ нь теоремийн баталгааг баталж байна.

Тодорхойлолт. коэффициент гэж нэрлэдэг X дээрх регрессийн коэффициент Y, ба шулуун шугам - - X дээрх Y-ийн шууд дундаж квадрат регресс.

Хөдөлгөөнгүй цэгийн координатыг тэгшитгэлд орлуулснаар F(α, β) функцийн хамгийн бага утгыг олох боломжтой. Энэ утгыг гэнэ. үлдэгдэл тархалт Y нь X-тэй харьцуулахад Y-г солих үед зөвшөөрөгдөх алдааны хэмжээг тодорхойлдог

g(X) = α + βX. Үед үлдэгдэл дисперс нь 0, өөрөөр хэлбэл тэгш байдал нь ойролцоо биш, харин яг тодорхой байна. Иймд Y ба X нь шугаман функциональ хамаарлаар холбогдсон үед. Үүний нэгэн адил та Y дээр X-ийн язгуур-дундаж квадрат регрессийн шулуун шугамыг авч болно:

ба Y-д хамаарах X-ийн үлдэгдэл дисперс. Учир нь шууд регресс хоёулаа давхцдаг. X дээр Y ба X дээр Y регрессийн тэгшитгэлийг харьцуулж, тэгшитгэлийн системийг шийдэхдээ регрессийн шугамын огтлолцлын цэгийг олох боломжтой - координаттай цэг (t x, t y) гэж нэрлэгддэг. X ба Y утгуудын хамтарсан тархалтын төв.

Бид В.Э.Гмурманы “Магадлалын онол ба математик статистик” сурах бичгийн 256-р хуудаснаас регрессийн тэгшитгэл зохиох алгоритмыг авч үзэх болно.

1) Түүврийн элементүүдийн тоо, түүврийн сонголтууд, тэдгээрийн квадратууд, бүтээгдэхүүнийг бүртгэх тооцооны хүснэгтийг эмхэтгэх.

2) Тооноос бусад бүх баганын нийлбэрийг тооцоол.

3) Хэмжигдэхүүн, тархалт, стандарт хазайлт тус бүрийн дундаж утгыг тооцоол.

5) X ба Y хоорондын хамаарал байгаа тухай таамаглалыг шалга.

6) Хоёр регрессийн шугамын тэгшитгэлийг зохиож, эдгээр тэгшитгэлийн графикийг зур.

X дээрх шулуун шугамын регрессийн Y налуу нь түүврийн регрессийн коэффициент юм

Коэффицент b=

Бид X дээрх Y регрессийн шугамын хүссэн тэгшитгэлийг олж авна.

Y \u003d 0.202 X + 1.024

Үүнтэй адилаар, Y дээр X регрессийн тэгшитгэл:

X дээрх шулуун шугамын регрессийн Y налуу нь түүврийн регрессийн коэффициент pxy байна:

Коэффицент b=

X \u003d 4.119 Y - 3.714

3. Шугаман бус регресс

Хэрэв эдийн засгийн үзэгдлүүдийн хооронд шугаман бус хамаарал байгаа бол тэдгээрийг холбогдох шугаман бус функцээр илэрхийлнэ.

Шугаман бус регрессийн хоёр ангилал байдаг.

1. Шинжилгээнд орсон тайлбарлагч хувьсагчдын хувьд шугаман бус, харин тооцоолсон параметрийн хувьд шугаман регресс, жишээлбэл:

Төрөл бүрийн зэрэгтэй олон гишүүнтүүд

Адил талт гипербол - ;

Хагас гарифм функц - .

2. Тооцоолсон параметрийн хувьд шугаман бус регресс, жишээлбэл:

Эрчим хүч -;

Үзүүлэн харуулах -;

Экспоненциал - .

Оруулсан хувьсагчдын шугаман бус регрессийг хувьсагчийн энгийн өөрчлөлтөөр шугаман хэлбэрт оруулж, цаашдын параметрийн үнэлгээг хамгийн бага квадратын аргыг ашиглан гүйцэтгэнэ. Зарим функцийг авч үзье.

Хоёрдугаар зэргийн параболыг дараах орлуулгыг ашиглан шугаман хэлбэрт оруулна. Үүний үр дүнд бид хоёр хүчин зүйлийн тэгшитгэлд хүрч, хамгийн бага квадратын аргыг ашиглан параметрүүдийг нь тооцоолох нь тэгшитгэлийн системд хүргэдэг.

Хоёрдахь зэргийн параболыг ихэвчлэн хүчин зүйлийн утгын тодорхой интервалын хувьд авч үзэж буй шинж чанаруудын харилцааны шинж чанар өөрчлөгдөх тохиолдолд ашигладаг: шууд хамаарал нь урвуу эсвэл урвуу нь шууд болж өөрчлөгддөг.

Түүхий эд, материал, түлшний тодорхой зардал, бүтээгдэхүүний хэмжээ, бараа эргэлтийн хугацаа, эргэлтийн үнэ цэнийн хоорондын хамаарлыг тодорхойлохын тулд тэгш талт гиперболыг ашиглаж болно. Үүний сонгодог жишээ бол ажилгүйдлийн түвшин хоорондын шугаман бус хамаарлыг тодорхойлдог Филлипсийн муруй юм. xцалингийн өсөлтийн хувиар y.

Гиперболыг энгийн орлуулалтаар шугаман тэгшитгэл болгон бууруулна: . Шугаман тэгшитгэлийн системийг бүтээхийн тулд та хамгийн бага квадратын аргыг ашиглаж болно.

Үүнтэй адил хамаарал нь шугаман хэлбэр болж буурдаг: , болон бусад.

Энгелийн муруйг (удаан эдэлгээний барааны зардлын эзлэх хувь ба нийт зарцуулалт (эсвэл орлого) хоорондын хамаарлын математик тодорхойлолт) тодорхойлохдоо тэгш талт гипербол болон хагас логарифмын муруйг ашигладаг. Тэдгээрийг оруулсан тэгшитгэлийг хөдөө аж ахуйн үйлдвэрлэлийн бүтээмж, хөдөлмөрийн эрчмийг судлахад ашигладаг.

4. Олон регресс

Олон тооны регресс - олон бие даасан хувьсагчтай холбоосын тэгшитгэл:

хамааралтай хувьсагч хаана байна (үр дүнгийн тэмдэг);

Бие даасан хувьсагч (хүчин зүйл).

Олон регрессийн тэгшитгэлийг бий болгохын тулд дараахь функцуудыг ихэвчлэн ашигладаг.

шугаман -

хүч -

үзэсгэлэнд оролцогч -

гипербол -.

Та шугаман хэлбэр болгон багасгаж болох бусад функцуудыг ашиглаж болно.

Олон тооны регрессийн тэгшитгэлийн параметрүүдийг тооцоолохын тулд хамгийн бага квадратын аргыг (LSM) ашигладаг. Шугаман тэгшитгэл ба шугаман бус тэгшитгэлийн хувьд дараахь хэвийн тэгшитгэлийн системийг бүтээсэн бөгөөд үүний шийдэл нь регрессийн параметрүүдийн тооцоог авах боломжтой болгодог.

Үүнийг шийдвэрлэхийн тулд тодорхойлогчдын аргыг хэрэглэж болно:

системийн тодорхойлогч хаана байна;

Хувийн тодорхойлогч хүчин зүйлүүд; системийн тодорхойлогчийн матрицын харгалзах баганыг системийн зүүн талын өгөгдлөөр солих замаар олж авдаг.

Олон регрессийн тэгшитгэлийн өөр нэг төрөл нь стандартчилагдсан масштабын регрессийн тэгшитгэл бөгөөд LSM нь стандартчилсан хуваарь дээрх олон регрессийн тэгшитгэлд хэрэглэгдэх боломжтой.

5. ХэрэглээMSEXCELрегрессийн шинжилгээ хийх

Регрессийн шинжилгээ нь санамсаргүй хэмжигдэхүүн Y (хамааралтай) ба нэг буюу хэд хэдэн хувьсагчийн утгуудын (бие даасан) хоорондын хамаарлын хэлбэрийг тогтоодог бөгөөд сүүлчийн утгыг яг өгсөн гэж үздэг. Ийм хамаарлыг ихэвчлэн хэд хэдэн үл мэдэгдэх параметрүүдийг агуулсан зарим математик загвараар (регрессийн тэгшитгэл) тодорхойлдог. Регрессийн шинжилгээний явцад түүврийн өгөгдлийн үндсэн дээр эдгээр параметрүүдийн тооцооллыг олж, тооцооллын статистикийн алдаа эсвэл итгэлийн интервалын хил хязгаарыг тодорхойлж, хүлээн зөвшөөрөгдсөн математик загвар нь туршилтын өгөгдөлтэй нийцэж байгаа эсэхийг (хангалттай) шалгана.

Шугаман регрессийн шинжилгээнд санамсаргүй хэмжигдэхүүнүүдийн хоорондын хамаарлыг шугаман гэж үздэг. Хамгийн энгийн тохиолдолд хосолсон шугаман регрессийн загварт X ба Y гэсэн хоёр хувьсагч байдаг. Мөн энэ нь n хос ажиглалтад (X1, Y1), (X2, Y2), ..., (Xn, Yn) шаардлагатай. регрессийн шугам гэж нэрлэгддэг шулуун шугамыг барих (сонгох) бөгөөд энэ нь ажиглагдсан утгуудыг "хамгийн сайн" ойртуулдаг. Энэ y=ax+b шулууны тэгшитгэл нь регрессийн тэгшитгэл юм. Регрессийн тэгшитгэлийг ашиглан бие даасан x хэмжигдэхүүний өгөгдсөн утгатай харгалзах хамааралтай y-ийн хүлээгдэж буй утгыг таамаглаж болно. Нэг хамааралтай хувьсагч Y ба хэд хэдэн бие даасан хувьсагчийн X1, X2, ..., Xm хоорондын хамаарлыг авч үзэх тохиолдолд олон шугаман регрессийн тухай ярьж байна.

Энэ тохиолдолд регрессийн тэгшитгэл нь хэлбэртэй байна

y = a 0 +a 1 x 1 +a 2 x 2 +…+a м x м ,

Энд a0, a1, a2, …, am нь тодорхойлох регрессийн коэффициентүүд юм.

Регрессийн тэгшитгэлийн коэффициентийг хамгийн бага квадратын аргыг ашиглан тодорхойлж, Y хувьсагчийн бодит утга ба регрессийн тэгшитгэлийг ашиглан тооцоолсон квадратын зөрүүний хамгийн бага боломжит нийлбэрийг олж авна. Тиймээс, жишээлбэл, шугаман хамаарал байхгүй байсан ч шугаман регрессийн тэгшитгэлийг байгуулж болно.

Регрессийн загварын үр дүнтэй байдлын хэмжүүр нь детерминацийн коэффициент R2 (R-квадрат) юм. Тодорхойлох коэффициент нь 0-ээс 1-ийн хоорондох утгыг авч болно, үр дүнд нь үүссэн регрессийн тэгшитгэл нь анхны өгөгдлийг ямар нарийвчлалтайгаар дүрсэлж байгааг (ойролцоогоор) тодорхойлдог. Регрессийн загварын ач холбогдлыг мөн F-шалгуур (Фишер) ашиглан судалж, a0, a1, a2, ..., am коэффициентүүдийн тэгээс ялгах найдвартай байдлыг Стьюдентийн t тестээр шалгана.

Excel-д туршилтын өгөгдлийг 16-р дараалал хүртэлх шугаман тэгшитгэлээр ойролцоолсон болно.

у = a0+a1x1+a2x2+…+a16x16

Шугаман регрессийн коэффициентийг олж авахын тулд шинжилгээний багцаас "Регресс" процедурыг ашиглаж болно. Мөн LINEST функц нь шугаман регрессийн тэгшитгэлийн талаарх бүрэн мэдээллийг өгдөг. Нэмж дурдахад регрессийн тэгшитгэлийн параметрүүдийг олж авахын тулд SLOPE ба INTERCEPT функцийг ашиглаж болно, TREND ба FORECAST функцийг шаардлагатай цэгүүдэд урьдчилан таамагласан Y утгыг (хосоор регрессийн хувьд) олж авах боломжтой.

LINEST функцийн хэрэглээг нарийвчлан авч үзье (мэддэг_y, [мэддэг_x], [тогтмол], [статистик]): мэдэгдэж буй_y - хамааралтай Y параметрийн мэдэгдэж буй утгуудын муж. Хос регрессийн шинжилгээнд энэ нь байж болно ямар ч хэлбэр; олон тооны хувьд энэ нь мөр эсвэл багана байх ёстой; мэдэгдэж байгаа_x нь нэг буюу хэд хэдэн бие даасан параметрийн мэдэгдэж буй утгуудын муж юм. Y мужтай ижил хэлбэртэй байх ёстой (олон параметр, олон багана эсвэл мөр тус тус); тогтмол - логикийн аргумент. Хэрэв регрессийн шинжилгээний даалгаврын практик утга дээр үндэслэн регрессийн шугамыг гарал үүслээр дамжих шаардлагатай бол чөлөөт коэффициент нь 0-тэй тэнцүү байвал энэ аргументын утгыг 0 (эсвэл " худал"). Хэрэв утгыг 1 (эсвэл "үнэн") гэж тохируулсан эсвэл орхигдуулсан бол чөлөөт коэффициентийг ердийн аргаар тооцоолно; статистик бол булийн аргумент юм. Хэрэв утгыг 1 (эсвэл "үнэн") гэж тохируулсан бол загварын үр нөлөө, ач холбогдлыг үнэлэхэд ашигладаг нэмэлт регрессийн статистикийг (хүснэгтийг үзнэ үү) буцаана. Ерөнхий тохиолдолд y=ax+b хос регрессийн хувьд LINEST функцийг хэрэглэсний үр дүн дараах байдалтай байна.

Хүснэгт. Хос регрессийн шинжилгээний LINEST-ийн гаралтын муж

y=a0+a1x1+a2x2+…+amxm тэгшитгэлийн олон регрессийн шинжилгээ хийх тохиолдолд эхний мөрөнд am,…,a1,a0 коэффициентүүд, хоёр дахь мөрөнд эдгээр коэффициентүүдийн стандарт алдаанууд гарч ирнэ. . Регрессийн статистик мэдээллээр дүүргэсэн эхний хоёр баганаас бусад 3-5-р мөрүүд нь #Үгүй болно.

LINEST функцийг массивын томьёо болгон оруулж эхлээд үр дүндээ хүссэн хэмжээтэй массивыг (регрессийн статистик шаардлагатай бол m+1 багана, 5 мөр) сонгоод CTRL+SHIFT+ENTER товчийг дарж томъёоны оруулгыг гүйцээнэ.

Бидний жишээний үр дүн:

Нэмж дурдахад, програм нь суулгасан функцтэй - Өгөгдлийн таб дээрх Өгөгдлийн шинжилгээ.

Үүнийг мөн регрессийн шинжилгээ хийхэд ашиглаж болно:

Слайд дээр - Өгөгдлийн шинжилгээ ашиглан хийсэн регрессийн шинжилгээний үр дүн.

ҮР ДҮН

Регрессийн статистик

Олон Р

R-дөрвөлжин

Нормчилсан R квадрат

стандарт алдаа

Ажиглалт

Вариацын шинжилгээ

Ач холбогдол Ф

Регресс

Магадлал

стандарт алдаа

t-статистик

P-утга

доод 95%

Шилдэг 95%

Доод 95.0%

Шилдэг 95.0%

Y уулзвар

Хувьсагч X 1

Бидний өмнө нь авч үзсэн регрессийн тэгшитгэлүүд мөн MS Excel дээр бүтээгдсэн. Тэдгээрийг гүйцэтгэхийн тулд эхлээд тараах графикийг бүтээж, дараа нь контекст цэсээр дамжуулан - Трендийн шугам нэмэхийг сонгоно уу. Шинэ цонхонд хайрцгийг шалгана уу - Диаграмм дээрх тэгшитгэлийг үзүүлж, диаграм дээр ойртсон найдвартай байдлын утгыг (R ^ 2) байрлуулна.

Уран зохиол:

  1. Магадлалын онол ба математик статистик. Gmurman V. E. Их дээд сургуулиудад зориулсан сурах бичиг. - Эд. 10, sr. - М .: Илүү өндөр. сургууль, 2010. - 479 он.
  2. Дасгал, даалгаварт дээд математик. Их дээд сургуулиудад зориулсан сурах бичиг / Данко П.Е., Попов А.Г., Кожевникова Т.Я., Данко С.П. 2 цагийн дотор - Эд. 6, sr. - М .: Оникс хэвлэлийн газар ХХК: Мир ба Боловсрол хэвлэлийн газар ХХК, 2007. - 416 х.
    1. 3. http://www.machinelearning.ru/wiki/index.php?title=%D0%A0%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8 %D1%8F - регрессийн шинжилгээний талаархи зарим мэдээлэл

Регрессийн шинжилгээний аргыг үнэ цэнийн харилцааг бий болгох, уялдуулах зорилгоор тодорхой параметрийн цуваатай холбоотой бүтээгдэхүүний техник, эдийн засгийн үзүүлэлтүүдийг тодорхойлоход ашигладаг. Энэ аргыг үндсэн хэрэглээний шинж чанарыг тусгасан нэг буюу хэд хэдэн техник, эдийн засгийн үзүүлэлтүүдээр тодорхойлогддог бүтээгдэхүүний түвшин, үнийн харьцаанд дүн шинжилгээ хийх, зөвтгөхөд ашигладаг. Регрессийн шинжилгээ нь бүтээгдэхүүний техникийн болон эдийн засгийн үзүүлэлтээс үнийн хамаарлыг тодорхойлсон эмпирик томъёог олох боломжийг бидэнд олгодог.

P=f(X1X2,...,Xn),

Энд P нь бүтээгдэхүүний нэгж үнийн утга, руб.; (X1, X2, ... Xp) - бүтээгдэхүүний техник, эдийн засгийн үзүүлэлтүүд.

Регрессийн шинжилгээний арга нь ашигласан норматив-параметрийн аргуудаас хамгийн дэвшилтэт арга бөгөөд орчин үеийн мэдээллийн технологи, системийг ашиглахад суурилсан тооцоолол хийхэд үр дүнтэй байдаг. Түүний хэрэглээ нь дараах үндсэн алхмуудыг агуулна.

  • бүтээгдэхүүний параметрийн бүлгийн ангиллын тодорхойлолт;
  • бүтээгдэхүүний үнэд хамгийн их нөлөөлдөг параметрүүдийг сонгох;
  • параметрүүдийг өөрчлөх үед үнийн өөрчлөлтийн мэдээлэх хэлбэрийг сонгох, зөвтгөх;
  • хэвийн тэгшитгэлийн системийг байгуулах, регрессийн коэффициентийг тооцоолох.

Үнэ нь тэгшитгэхэд хамаарах бүтээгдэхүүний үндсэн мэргэшлийн бүлэг нь параметрийн хүрээ бөгөөд тэдгээрийн хэрэглээ, ашиглалтын нөхцөл, шаардлага зэргээс хамааран бүтээгдэхүүнийг янз бүрийн загвараар бүлэглэх боломжтой. Параметрийн цуваа үүсгэх үед автомат ангилал. Бүтээгдэхүүний нийт массаас түүний нэгэн төрлийн бүлгийг хуваарилах боломжийг олгодог аргыг хэрэглэж болно. Техникийн болон эдийн засгийн үзүүлэлтүүдийг сонгохдоо дараахь үндсэн шаардлагуудыг үндэслэнэ.

  • сонгосон параметрүүдийн найрлагад стандарт, техникийн нөхцөлд заасан параметрүүдийг багтаасан болно; техникийн үзүүлэлтүүдээс гадна (хүч чадал, даац, хурд гэх мэт) цуваа үйлдвэрлэлийн үзүүлэлт, нарийн төвөгтэй байдлын хүчин зүйл, нэгдмэл байдал гэх мэтийг ашигладаг;
  • Сонгосон параметрүүдийн багц нь цувралд багтсан бүтээгдэхүүний дизайн, технологи, ашиглалтын шинж чанарыг хангалттай бүрэн тодорхойлж, үнийн хувьд нэлээд нягт хамааралтай байх ёстой;
  • параметрүүд нь харилцан хамааралтай байх ёсгүй.

Үнэд ихээхэн нөлөөлдөг техник, эдийн засгийн үзүүлэлтүүдийг сонгохын тулд хос корреляцийн коэффициентийн матрицыг тооцоолно. Параметрүүдийн хоорондын хамаарлын коэффициентийн хэмжээнээс хамааран тэдгээрийн харилцааны нягт байдлыг дүгнэж болно. Үүний зэрэгцээ тэгтэй ойролцоо хамаарал нь параметрийн үнэд бага зэрэг нөлөөлж байгааг харуулж байна. Техникийн болон эдийн засгийн үзүүлэлтүүдийн эцсийн сонголтыг компьютерийн технологи, зохих стандарт програмыг ашиглан алхам алхмаар регрессийн шинжилгээний явцад явуулдаг.

Үнийн практикт дараахь багц функцийг ашигладаг.

шугаман

P = ao + alXl + ... + antXn,

шугаман хүч

P \u003d ao + a1X1 + ... + anXp + (an + 1Xp) (an + 1Xp) + ... + (an + nXp2) (an + nXp2)

урвуу логарифм

P \u003d a0 + a1: X1 + ... + an: Xn-д,

хүч

P = a0 (X1^a1) (X2^a2) .. (Xn^an)

жагсаал

P = e^(a1+a1X1+...+anXn)

гипербол

P \u003d ao + a1: X1 + a2: X2 + ... + an: Xn,

хаана P - үнийн тэнцвэржүүлэх; X1 X2,..., Xn - цувралын бүтээгдэхүүний техник, эдийн засгийн үзүүлэлтүүдийн утга; a0, a1 ..., an - регрессийн тэгшитгэлийн тооцоолсон коэффициентүүд.

Үнийн талаархи практик ажилд үнэ ба техник, эдийн засгийн үзүүлэлтүүдийн хоорондын холболтын хэлбэрээс хамааран бусад регрессийн тэгшитгэлийг ашиглаж болно. Үнэ болон техникийн болон эдийн засгийн параметрүүдийн багц хоорондын хамаарлын функцын төрлийг компьютер дээр боловсруулах явцад урьдчилан тохируулах эсвэл автоматаар сонгох боломжтой. Үнэ болон параметрийн багц хоорондын хамаарлын нягтыг олон корреляцийн коэффициентийн утгаар үнэлдэг. Эв нэгдэлтэй ойрхон байгаа нь ойр дотно харилцааг илтгэнэ. Регрессийн тэгшитгэлийн дагуу энэхүү параметрийн цувралын бүтээгдэхүүний үнийн уялдуулсан (тооцсон) утгыг олж авна. Тохируулгын үр дүнг үнэлэхийн тулд тооцоолсон үнийн утгын бодит хэмжээнээс харьцангуй хазайлтыг тооцоолно.

Tsr \u003d Rf - Rr: R x 100

Энд Рф, Рр - бодит ба тооцоолсон үнэ.

Cr-ийн утга нь 8-10% -иас хэтрэхгүй байх ёстой. Тооцоолсон утгууд бодит хэмжээнээс мэдэгдэхүйц хазайсан тохиолдолд дараахь зүйлийг судлах шаардлагатай.

  • түүний найрлагад цувралын бусад бүтээгдэхүүнээс параметрүүдээрээ эрс ялгаатай бүтээгдэхүүнийг багтааж болох тул параметрийн цуваа үүсэх зөв байдал. Тэдгээрийг хасах ёстой;
  • техникийн болон эдийн засгийн үзүүлэлтүүдийг зөв сонгох. Үнэтэй бага хамааралтай параметрүүдийн багц боломжтой. Энэ тохиолдолд параметрүүдийг хайх, сонгох ажлыг үргэлжлүүлэх шаардлагатай.

Регрессийн шинжилгээ хийх журам, аргачлал, тэгшитгэлийн үл мэдэгдэх параметрүүдийг олох, олж авсан үр дүнгийн эдийн засгийн үнэлгээг математик статистикийн шаардлагын дагуу гүйцэтгэдэг.

Регрессийн шинжилгээний зорилго нь хамааралтай хувьсагч ба нэг (хос регрессийн шинжилгээ) ба түүнээс дээш (олон) бие даасан хувьсагчийн хоорондын хамаарлыг хэмжих явдал юм. Бие даасан хувьсагчдыг хүчин зүйл, тайлбарлагч, тодорхойлогч, регресс, таамаглагч гэж нэрлэдэг.

Хараат хувьсагчийг заримдаа тодорхойлсон, тайлбарласан эсвэл "хариу" хувьсагч гэж нэрлэдэг. Эмпирик судалгаанд регрессийн шинжилгээг маш өргөнөөр ашиглаж байгаа нь зөвхөн таамаглалыг шалгахад тохиромжтой хэрэглүүр болсонтой холбоотой биш юм. Регресс, ялангуяа олон регресс нь загварчлах, урьдчилан таамаглах үр дүнтэй арга юм.

Регрессийн шинжилгээтэй ажиллах зарчмуудыг илүү энгийн буюу хос аргаар тайлбарлаж эхэлцгээе.

Хос регрессийн шинжилгээ

Регрессийн шинжилгээг ашиглах эхний алхамууд нь корреляцийн коэффициентийг тооцоолох хүрээнд бидний хийсэн алхамуудтай бараг ижил байх болно. Пирсоны аргыг ашиглан корреляцийн шинжилгээний үр дүнтэй байх гурван үндсэн нөхцөл - хувьсагчдын хэвийн тархалт, хувьсагчдын интервалын хэмжилт, хувьсагчдын хоорондох шугаман хамаарал нь олон регрессийн хувьд мөн хамааралтай. Үүний дагуу эхний шатанд тархалтын графикийг байгуулж, хувьсагчдын статистик болон тайлбарласан шинжилгээг хийж, регрессийн шугамыг тооцоолно. Корреляцийн шинжилгээний хүрээнд регрессийн шугамыг хамгийн бага квадратын аргыг ашиглан байгуулдаг.

Өгөгдлийн шинжилгээний хоёр аргын ялгааг илүү тодорхой харуулахын тулд "SPS дэмжлэг" болон "хөдөөгийн хүн амын эзлэх хувь" хувьсагчдад аль хэдийн авч үзсэн жишээнд хандъя. Анхны өгөгдөл нь ижил байна. Тархалтын графикийн ялгаа нь регрессийн шинжилгээнд хамааралтай хувьсагчийг зурах нь зөв байх болно - манай тохиолдолд Y тэнхлэгийн дагуу "SPS дэмжлэг" байдаг бол корреляцийн шинжилгээнд энэ нь хамаагүй. Хажуу утгыг цэвэрлэсний дараа тархалтын график дараах байдалтай байна.

Регрессийн шинжилгээний үндсэн санаа нь хувьсагчдын ерөнхий чиг хандлагатай - регрессийн шугам хэлбэрээр та хамааралтай хувьсагчийн утгыг, бие даасан утгыг урьдчилан таамаглах явдал юм.

Энгийн математик шугаман функцийг төсөөлье. Евклидийн орон зай дахь дурын шугамыг дараах томъёогоор тодорхойлж болно.

энд a нь y тэнхлэгийн дагуух офсетийг тодорхойлдог тогтмол; b - шугамын өнцгийг тодорхойлох коэффициент.

Налуу ба тогтмолыг мэдсэнээр та дурын x-ийн хувьд y-ийн утгыг тооцоолж (урьдчилан таамаглаж) болно.

Энэхүү хамгийн энгийн функц нь бид y-ийн утгыг яг таг биш, харин тодорхой итгэлийн интервалын дотор урьдчилан таамаглах болно гэсэн анхааруулга бүхий регрессийн шинжилгээний загварын үндэс болсон. ойролцоогоор.

Тогтмол хэмжигдэхүүн нь регрессийн шугам ба у тэнхлэгийн огтлолцох цэг юм (статистикийн багцад ихэвчлэн "таслах" гэж нэрлэдэг F-тасралт). SPS-д санал өгөх бидний жишээнд түүний дугуйрсан утга нь 10.55 байх болно. Налуугийн коэффициент b нь ойролцоогоор -0.1-тэй тэнцүү байх болно (корреляцийн шинжилгээнд тэмдэг нь харилцааны төрлийг харуулж байна - шууд эсвэл урвуу). Тиймээс үүссэн загвар нь SP C = -0.1 x Sel шиг харагдах болно. бид. + 10.55.

ATP \u003d -0.10 x 47 + 10.55 \u003d 5.63.

Анхны болон урьдчилан таамагласан утгуудын хоорондох ялгааг үлдэгдэл гэж нэрлэдэг (бид статистикийн үндсэн ойлголт болох гэнэтийн хүснэгтэд дүн шинжилгээ хийхдээ аль хэдийн тулгарч байсан). Тиймээс, Бүгд Найрамдах Адыгей улсын хувьд үлдэгдэл нь 3.92 - 5.63 = -1.71 болно. Үлдэгдэл модулийн утга их байх тусам утгыг сайн таамаглахгүй.

Бид бүх тохиолдлын хувьд таамагласан утга ба үлдэгдлийг тооцдог.
Болж байна Бямба. бид. THX

(эх)

THX

(урьдчилан таамагласан)

Үлдсэн
Адыгей Бүгд Найрамдах Улс 47 3,92 5,63 -1,71 -
Алтайн бүгд найрамдах улс 76 5,4 2,59 2,81
Бүгд Найрамдах Башкортостан Улс 36 6,04 6,78 -0,74
Бүгд Найрамдах Буриад Улс 41 8,36 6,25 2,11
Бүгд Найрамдах Дагестан Улс 59 1,22 4,37 -3,15
Бүгд Найрамдах Ингушет Улс 59 0,38 4,37 3,99
гэх мэт.

Анхны болон таамагласан утгуудын харьцааны дүн шинжилгээ нь үүссэн загварын чанар, түүний урьдчилан таамаглах чадварыг үнэлэхэд тусалдаг. Регрессийн статистикийн гол үзүүлэлтүүдийн нэг бол олон корреляцийн коэффициент R - хамааралтай хувьсагчийн анхны болон таамагласан утгуудын хоорондын хамаарлын коэффициент юм. Хосолсон регрессийн шинжилгээнд энэ нь хамааралтай ба бие даасан хувьсагчийн хоорондох ердийн Pearson корреляцийн коэффициенттэй тэнцүү, манай тохиолдолд 0.63 байна. Олон R-ийг утга учиртай тайлбарлахын тулд үүнийг детерминацын коэффициент болгон хувиргах шаардлагатай. Үүнийг корреляцийн шинжилгээтэй ижил аргаар хийдэг - квадрат. Детерминацийн коэффициент R-квадрат (R 2) нь бие даасан (бие даасан) хувьсагчдаас тайлбарласан хамааралтай хувьсагчийн хэлбэлзлийн хувийг харуулдаг.

Манай тохиолдолд R 2 = 0.39 (0.63 2); Энэ нь "хөдөөгийн хүн амын эзлэх хувь" хувьсагч нь "CPS-ийн дэмжлэг" хувьсагчийн өөрчлөлтийн 40 орчим хувийг тайлбарлаж байна гэсэн үг. Детерминацийн коэффициентийн утга их байх тусам загварын чанар өндөр болно.

Загварын чанарын өөр нэг хэмжүүр бол тооцооллын стандарт алдаа юм. Энэ нь регрессийн шугамын эргэн тойронд цэгүүд хэр их "тарагдсан" хэмжүүр юм. Интервалын хувьсагчийн тархалтын хэмжүүр нь стандарт хазайлт юм. Үүний дагуу тооцооллын стандарт алдаа нь үлдэгдэл хуваарилалтын стандарт хазайлт юм. Түүний үнэ цэнэ өндөр байх тусам тархалт ихсэх ба загвар нь муу болно. Манай тохиолдолд стандарт алдаа нь 2.18 байна. Энэ хэмжээгээр манай загвар "SPS дэмжлэг" хувьсагчийн утгыг таамаглахдаа "дунджаар алдаа гаргах" болно.

Регрессийн статистикт мөн дисперсийн шинжилгээ орно. Үүний тусламжтайгаар бид дараахь зүйлийг олж мэдэв: 1) хамааралтай хувьсагчийн өөрчлөлтийн (тархалтын) ямар хувь нь бие даасан хувьсагчаар тайлбарлагдаж байгааг; 2) үлдэгдэл (тайлагдаагүй хэсэг) хамааралтай хувьсагчийн дисперсийн хэдэн хувийг эзэлдэг; 3) эдгээр хоёр утгын харьцаа хэд вэ? (/ "-харьцаа). Тархалтын статистик нь түүвэр судалгаанд онцгой ач холбогдолтой - энэ нь нийт хүн амын дунд бие даасан болон хамааралтай хувьсагчдын хоорондын хамаарал хэр байгааг харуулдаг. , тасралтгүй судалгааны хувьд (бидний жишээн дээрх шиг) судалгаа Энэ тохиолдолд илэрсэн статистикийн зүй тогтол нь санамсаргүй нөхцөл байдлын давхцлаас үүдэлтэй эсэх, судалгаанд хамрагдсан популяцийн нөхцөл байдлын цогцод хэр их онцлогтой болохыг шалгана. , өөрөөр хэлбэл олж авсан үр дүн нь илүү өргөн хүрээтэй ерөнхий агрегатуудын хувьд үнэн биш, харин түүний тогтмол байдлын зэрэг, санамсаргүй нөлөөллөөс ангид байх нь тогтоогдсон.

Манай тохиолдолд дисперсийн статистикийн шинжилгээ дараах байдалтай байна.

SS df MS Ф утга учир
Регресс. 258,77 1,00 258,77 54,29 0.000000001
Үлдсэн 395,59 83,00 Л,11
Нийт 654,36

54.29-ийн F-харьцаа нь 0.0000000001 түвшинд чухал ач холбогдолтой. Үүний дагуу бид тэг таамаглалыг (бидний олсон харилцаа санамсаргүй гэсэн) үгүйсгэж чадна.

Үүнтэй төстэй функцийг t шалгуураар гүйцэтгэдэг боловч регрессийн коэффициент (өнцгийн болон F-загалмай) -ын хувьд. / шалгуурыг ашиглан бид ерөнхий популяцийн регрессийн коэффициентүүд тэгтэй тэнцүү гэсэн таамаглалыг шалгана. Манай тохиолдолд бид тэг таамаглалыг дахин итгэлтэйгээр үгүйсгэж чадна.

Олон регрессийн шинжилгээ

Олон регрессийн загвар нь хос регрессийн загвартай бараг адилхан; Ганц ялгаа нь шугаман функцэд хэд хэдэн бие даасан хувьсагчийг дараалан оруулсан явдал юм.

Y = b1X1 + b2X2 + …+ bpXp + a.

Хэрэв хоёроос олон бие даасан хувьсагч байгаа бол бид тэдгээрийн хамаарлыг дүрслэн харуулах боломжгүй бөгөөд энэ талаар олон тооны регресс нь хос регрессээс бага "харагдах" болно. Хоёр бие даасан хувьсагч байгаа тохиолдолд өгөгдлийг 3D тархалтын графикт харуулах нь ашигтай байж болно. Мэргэжлийн статистикийн програм хангамжийн багцад (жишээлбэл, Statistica) гурван хэмжээст диаграмыг эргүүлэх сонголт байдаг бөгөөд энэ нь өгөгдлийн бүтцийг сайн дүрслэн харуулах боломжийг олгодог.

Олон регресстэй ажиллахдаа хос регрессээс ялгаатай нь шинжилгээний алгоритмыг тодорхойлох шаардлагатай. Стандарт алгоритм нь эцсийн регрессийн загварт байгаа бүх таамаглагчдыг багтаасан болно. Алхам алхмаар алгоритм нь бие даасан хувьсагчдыг тайлбарлах "жин" дээр үндэслэн дараалсан оруулах (хасах) гэж үздэг. Олон бие даасан хувьсагчтай үед шаталсан арга нь сайн; энэ нь илэн далангүй сул таамаглагчдын загварыг "цэвэрлэж", илүү нягт, товч болгодог.

Олон тооны регрессийн зөв байдлын нэмэлт нөхцөл (интервал, хэвийн байдал, шугаман байдлын хамт) нь олон шугаман байдал байхгүй - бие даасан хувьсагчдын хооронд хүчтэй хамаарал байх явдал юм.

Олон тооны регрессийн статистикийн тайлбар нь хос регрессийн тохиолдолд авч үзсэн бүх элементүүдийг агуулдаг. Үүнээс гадна олон регрессийн шинжилгээний статистикийн бусад чухал бүрэлдэхүүн хэсгүүд байдаг.

Бид Оросын бүс нутгуудын сонгуулийн үйл ажиллагааны түвшний ялгааг тайлбарласан таамаглалыг турших жишээн дээр олон тооны регресс бүхий ажлыг харуулах болно. Тусгай эмпирик судалгаагаар сонгогчдын ирцэд дараахь зүйлс нөлөөлдөг болохыг харуулж байна.

Үндэсний хүчин зүйл (хувьсагч "Оросын хүн ам"; ОХУ-ын бүрдүүлэгч байгууллагууд дахь Оросын хүн амын эзлэх хувь хэлбэрээр үйл ажиллагаа явуулдаг). Оросын хүн амын эзлэх хувь нэмэгдэх нь сонгогчдын ирц буурахад хүргэдэг гэж үздэг;

Хотжилтын хүчин зүйл ("хотын хүн ам" хувьсах хэмжигдэхүүн; ОХУ-ын бүрэлдэхүүнд багтах хотын хүн амын эзлэх хувь хэлбэрээр үйл ажиллагаа явуулдаг, бид энэ хүчин зүйлийг корреляцийн шинжилгээний нэг хэсэг болгон ажиллаж байсан). Хотын хүн амын эзлэх хувь нэмэгдэх нь сонгогчдын ирц буурахад хүргэдэг гэж үздэг.

Хамаарах хувьсагч - "Сонгуулийн үйл ажиллагааны эрч хүч" ("идэвхтэй") нь 1995-2003 оны холбооны сонгуулийн бүс нутгийн ирцийн дундаж мэдээллээр тодорхойлогддог. Хоёр бие даасан, нэг хамааралтай хувьсагчийн анхны мэдээллийн хүснэгт нь дараах хэлбэртэй байна. :

Болж байна Хувьсагч
Хөрөнгө. Гор. бид. Орос. бид.
Адыгей Бүгд Найрамдах Улс 64,92 53 68
Алтайн бүгд найрамдах улс 68,60 24 60
Бүгд Найрамдах Буриад Улс 60,75 59 70
Бүгд Найрамдах Дагестан Улс 79,92 41 9
Бүгд Найрамдах Ингушет Улс 75,05 41 23
Бүгд Найрамдах Халимаг Улс 68,52 39 37
Карачай-Черкес бүгд найрамдах улс 66,68 44 42
Бүгд Найрамдах Карелия Улс 61,70 73 73
Коми Бүгд Найрамдах Улс 59,60 74 57
Бүгд Найрамдах Мари Эл 65,19 62 47

гэх мэт. (ялгааг цэвэрлэсний дараа 88 тохиолдолоос 83 тохиолдол үлдсэн)

Загварын чанарыг тодорхойлсон статистик:

1. Олон тооны R = 0.62; L квадрат = 0.38. Тиймээс үндэсний хүчин зүйл болон хотжилтын хүчин зүйл нь "сонгуулийн үйл ажиллагаа" хувьсагчийн хэлбэлзлийн 38 орчим хувийг тайлбарлаж байна.

2. Дундаж алдаа 3.38 байна. Баригдсан загвар нь сонгуулийн ирцийн түвшинг урьдчилан таамаглахад "дунджаар" ийм алдаатай байдаг.

3. Тайлбартай ба тайлбарлагдаагүй хэлбэлзлийн l-харьцаа 0.000000003 түвшинд 25.2 байна. Илчлэгдсэн харилцааны санамсаргүй байдлын талаархи хоосон таамаглалыг үгүйсгэв.

4. "Хотын хүн ам" ба "Оросын хүн ам" хувьсагчдын тогтмол ба регрессийн коэффициентийн шалгуур үзүүлэлт нь 0.0000001 түвшинд чухал ач холбогдолтой; 0.00005 ба 0.007 тус тус байна. Коэффициентуудын санамсаргүй байдлын талаархи тэг таамаглалыг үгүйсгэв.

Хамаарах хувьсагчийн анхны болон таамагласан утгуудын харьцааг шинжлэхэд хэрэгтэй нэмэлт статистикууд бол Махаланобисын зай ба Күүкийн зай юм. Эхнийх нь тухайн тохиолдлын өвөрмөц байдлын хэмжүүр юм (тухайн тохиолдлын бүх бие даасан хувьсагчийн утгуудын нэгдэл нь бүх бие даасан хувьсагчийн дундаж утгаас нэгэн зэрэг хэр зэрэг хазайж байгааг харуулдаг). Хоёр дахь нь тухайн хэргийн нөлөөллийн хэмжүүр юм. Өөр өөр ажиглалтууд нь регрессийн шугамын налууд янз бүрийн байдлаар нөлөөлдөг бөгөөд Күүкийн зайг ашиглан тэдгээрийг энэ үзүүлэлтийн дагуу харьцуулж болно. Энэ нь хэт давсан үзүүлэлтүүдийг цэвэрлэхэд хэрэгтэй (хэт нөлөө бүхий тохиолдол гэж үзэж болно).

Бидний жишээн дээр Дагестан бол өвөрмөц бөгөөд нөлөө бүхий тохиолдлуудын нэг юм.

Болж байна Анхны

үнэт зүйлс

Предска

үнэт зүйлс

Үлдсэн Зай

Махаланобис

Зай
Адыгей 64,92 66,33 -1,40 0,69 0,00
Алтайн бүгд найрамдах улс 68,60 69.91 -1,31 6,80 0,01
Бүгд Найрамдах Буриад Улс 60,75 65,56 -4,81 0,23 0,01
Бүгд Найрамдах Дагестан Улс 79,92 71,01 8,91 10,57 0,44
Бүгд Найрамдах Ингушет Улс 75,05 70,21 4,84 6,73 0,08
Бүгд Найрамдах Халимаг Улс 68,52 69,59 -1,07 4,20 0,00

Бодит регрессийн загвар нь дараах параметрүүдтэй байна: Y-таслалт (тогтмол) = 75.99; б (Хор. суу.) \u003d -0.1; b (Орос. нас.) = -0.06. Эцсийн томъёо.

Регрессийн шинжилгээ нь статистикийн судалгааны хамгийн түгээмэл аргуудын нэг юм. Энэ нь хамааралтай хувьсагчид бие даасан хувьсагчдын нөлөөллийн түвшинг тодорхойлоход ашиглаж болно. Microsoft Excel-ийн функцууд нь ийм төрлийн дүн шинжилгээ хийхэд зориулагдсан хэрэгслүүдтэй байдаг. Тэдгээр нь юу болох, тэдгээрийг хэрхэн ашиглах талаар авч үзье.

Гэхдээ регрессийн шинжилгээ хийх боломжийг олгодог функцийг ашиглахын тулд та юуны түрүүнд анализын багцыг идэвхжүүлэх хэрэгтэй. Зөвхөн дараа нь энэ процедурт шаардлагатай хэрэгслүүд Excel туузан дээр гарч ирнэ.


Одоо бид таб руу ороход "Өгөгдөл", хэрэгслийн хайрцаг дахь туузан дээр "Шинжилгээ"Бид шинэ товчлуурыг харах болно - "Мэдээллийн дүн шинжилгээ хийх".

Регрессийн шинжилгээний төрлүүд

Хэд хэдэн төрлийн регресс байдаг:

  • параболик;
  • хүч;
  • логарифм;
  • экспоненциал;
  • жагсаал;
  • гиперболик;
  • шугаман регресс.

Excel дээр сүүлийн төрлийн регрессийн шинжилгээний хэрэгжилтийн талаар бид дараа нь илүү дэлгэрэнгүй ярих болно.

Excel дэх шугаман регресс

Жишээлбэл, гудамжны өдрийн дундаж агаарын температур, тухайн ажлын өдрийн дэлгүүрийн үйлчлүүлэгчдийн тоог харуулсан хүснэгтийг доор харуулав. Регрессийн шинжилгээний тусламжтайгаар агаарын температур гэх мэт цаг агаарын нөхцөл байдал нь жижиглэн худалдааны байгууллагын ирцэд хэрхэн нөлөөлж болохыг олж мэдье.

Ерөнхий шугаман регрессийн тэгшитгэл нь дараах байдалтай байна: Y = a0 + a1x1 + ... + axk. Энэ томъёонд Югэдэг нь бидний нөлөөллийг судлах гэж буй хувьсагчийг хэлнэ. Манай тохиолдолд энэ нь худалдан авагчдын тоо юм. Утга xхувьсагчдад нөлөөлөх янз бүрийн хүчин зүйлүүд юм. Сонголтууд ань регрессийн коэффициентууд юм. Өөрөөр хэлбэл, тэд тодорхой хүчин зүйлийн ач холбогдлыг тодорхойлдог. Индекс кэдгээр ижил хүчин зүйлсийн нийт тоог илэрхийлнэ.


Шинжилгээний үр дүнгийн шинжилгээ

Регрессийн шинжилгээний үр дүнг тохиргоонд заасан газарт хүснэгт хэлбэрээр харуулав.

Гол үзүүлэлтүүдийн нэг нь R-дөрвөлжин. Энэ нь загварын чанарыг илтгэнэ. Манай тохиолдолд энэ коэффициент 0.705 буюу ойролцоогоор 70.5% байна. Энэ бол хүлээн зөвшөөрөгдсөн чанарын түвшин юм. 0.5-аас бага харьцаа муу байна.

Өөр нэг чухал үзүүлэлт нь шугамын уулзвар дахь нүдэнд байрладаг "Y уулзвар"ба багана "Итгэлцүүрүүд". Энд Y ямар утгатай болохыг зааж өгсөн бөгөөд манай тохиолдолд энэ нь худалдан авагчдын тоо бөгөөд бусад бүх хүчин зүйлүүд тэгтэй тэнцүү байна. Энэ хүснэгтэд энэ утга 58.04 байна.

Графикийн огтлолцол дээрх утга "Хувьсагч X1"болон "Итгэлцүүрүүд"нь Х-ээс Y-ийн хамаарлын түвшинг харуулж байна. Манай тохиолдолд энэ нь дэлгүүрийн үйлчлүүлэгчдийн тооноос температураас хамаарах түвшин юм. 1.31 коэффициент нь нөлөөллийн нэлээд өндөр үзүүлэлт гэж тооцогддог.

Таны харж байгаагаар Microsoft Excel ашиглан регрессийн шинжилгээний хүснэгт үүсгэх нь маш хялбар юм. Гэхдээ зөвхөн бэлтгэгдсэн хүн л гаралт дээр олж авсан өгөгдөлтэй ажиллаж, мөн чанарыг нь ойлгож чадна.

Суралцах хугацаандаа оюутнууд янз бүрийн тэгшитгэлтэй байнга тулгардаг. Тэдний нэг болох регрессийн тэгшитгэлийг энэ зүйлд авч үзнэ. Энэ төрлийн тэгшитгэлийг математикийн параметрүүдийн хоорондын хамаарлын шинж чанарыг тодорхойлоход тусгайлан ашигладаг. Энэ төрлийн тэгш байдлыг статистик, эконометрикт ашигладаг.

Регрессийн тодорхойлолт

Математикийн хувьд регресс гэдэг нь өгөгдлийн багцын дундаж утгыг өөр хэмжигдэхүүний утгаас хамаарлыг тодорхойлдог тодорхой хэмжигдэхүүн гэж ойлгодог. Регрессийн тэгшитгэл нь тодорхой шинж чанарын функцээр өөр нэг шинж чанарын дундаж утгыг харуулдаг. Регрессийн функц нь y \u003d x энгийн тэгшитгэлийн хэлбэртэй бөгөөд y нь хамааралтай хувьсагчийн үүрэг гүйцэтгэдэг бөгөөд x нь бие даасан хувьсагч (онцлогын хүчин зүйл) юм. Үнэн хэрэгтээ регрессийг y = f (x) гэж илэрхийлдэг.

Хувьсагчдын хоорондын хамаарлын төрлүүд юу вэ

Ерөнхийдөө корреляци ба регресс гэсэн хоёр эсрэг төрлийн харилцааг ялгадаг.

Эхнийх нь нөхцөлт хувьсагчийн тэгш байдалаар тодорхойлогддог. Энэ тохиолдолд аль хувьсагч нөгөөгөөсөө хамаарах нь тодорхойгүй байна.

Хэрэв хувьсагчдын хооронд тэгш байдал байхгүй бөгөөд нөхцөл нь аль хувьсагч нь тайлбарлагч, аль нь хамааралтай болохыг хэлж байвал бид хоёр дахь төрлийн холболт байгаа тухай ярьж болно. Шугаман регрессийн тэгшитгэлийг бий болгохын тулд ямар төрлийн хамаарал ажиглагдаж байгааг олж мэдэх шаардлагатай.

Регрессийн төрлүүд

Өнөөдрийг хүртэл 7 өөр төрлийн регресс байдаг: гипербол, шугаман, олон, шугаман бус, хос, урвуу, логарифм шугаман.

Гипербол, шугаман, логарифм

Шугаман регрессийн тэгшитгэлийг статистикт тэгшитгэлийн параметрүүдийг тодорхой тайлбарлахад ашигладаг. y = c + m * x + E шиг харагдаж байна. Гипербол тэгшитгэл нь ердийн гипербол y \u003d c + m / x + E хэлбэртэй байна. Логарифмын шугаман тэгшитгэл нь логарифмын функцийг ашиглан хамаарлыг илэрхийлдэг: y \u003d в + m * In x + In E.

Олон ба шугаман бус

Хоёр илүү төвөгтэй регрессийн төрөл нь олон ба шугаман бус байдаг. Олон тооны регрессийн тэгшитгэлийг y \u003d f (x 1, x 2 ... x c) + E функцээр илэрхийлнэ. Энэ тохиолдолд y нь хамааралтай хувьсагч, x нь тайлбарлагч хувьсагч юм. Хувьсагч E нь стохастик бөгөөд тэгшитгэлийн бусад хүчин зүйлсийн нөлөөг агуулдаг. Шугаман бус регрессийн тэгшитгэл нь бага зэрэг нийцэхгүй байна. Нэг талаас, харгалзан үзсэн үзүүлэлтүүдийн хувьд энэ нь шугаман биш, нөгөө талаас үзүүлэлтүүдийг үнэлэх үүрэг нь шугаман шинж чанартай байдаг.

Урвуу ба хос регресс

Урвуу функц нь шугаман хэлбэрт шилжих шаардлагатай функц юм. Хамгийн уламжлалт хэрэглээний програмуудад энэ нь y \u003d 1 / c + m * x + E функцийн хэлбэртэй байдаг. Хосолсон регрессийн тэгшитгэл нь өгөгдлийн хоорондын хамаарлыг y = f(x) + E-ийн функцээр харуулдаг. Бусад тэгшитгэлүүдийн нэгэн адил у нь x-ээс хамаарах ба E нь стохастик параметр юм.

Корреляцийн тухай ойлголт

Энэ нь хоёр үзэгдэл, үйл явцын хоорондын хамаарал байгааг харуулсан үзүүлэлт юм. Харилцааны хүчийг корреляцийн коэффициентээр илэрхийлдэг. Түүний утга нь [-1;+1] интервалд хэлбэлздэг. Сөрөг үзүүлэлт нь санал хүсэлт байгаа эсэхийг, эерэг үзүүлэлт нь шууд байгааг илтгэнэ. Хэрэв коэффициент 0-тэй тэнцүү утгыг авбал ямар ч хамаарал байхгүй болно. Энэ утга 1-тэй ойртох тусам параметрүүдийн хоорондын хамаарал хүчтэй байх тусам 0-д ойртох тусам сул байна.

Арга зүй

Корреляцийн параметрийн аргууд нь харилцааны нягт байдлыг үнэлэх боломжтой. Эдгээр нь ердийн тархалтын хуульд захирагдах параметрүүдийг судлахын тулд тархалтын тооцооны үндсэн дээр ашиглагддаг.

Шугаман регрессийн тэгшитгэлийн параметрүүд нь хамаарлын төрөл, регрессийн тэгшитгэлийн функцийг тодорхойлох, сонгосон харилцааны томъёоны үзүүлэлтүүдийг үнэлэхэд шаардлагатай. Корреляцийн талбарыг харилцааг тодорхойлох арга болгон ашигладаг. Үүнийг хийхийн тулд одоо байгаа бүх өгөгдлийг графикаар дүрсэлсэн байх ёстой. Тэгш өнцөгт хоёр хэмжээст координатын системд бүх мэдэгдэж буй өгөгдлийг зурах ёстой. Корреляцийн талбар ингэж бүрддэг. Тайлбарлах хүчин зүйлийн утгыг абсцисса дагуу, харин хамааралтай хүчин зүйлийн утгыг ордны дагуу тэмдэглэнэ. Хэрэв параметрүүдийн хооронд функциональ хамаарал байгаа бол тэдгээрийг шугам хэлбэрээр байрлуулна.

Хэрэв ийм өгөгдлийн корреляцийн коэффициент нь 30% -иас бага бол бид бараг бүрэн холболт байхгүй тухай ярьж болно. Хэрэв энэ нь 30% -аас 70% хооронд байвал энэ нь дунд зэргийн ойрын холбоос байгааг илтгэнэ. 100% үзүүлэлт нь функциональ холболтын нотолгоо юм.

Шугаман бус регрессийн тэгшитгэлийг шугаман адил корреляцийн индексээр (R) нэмэх шаардлагатай.

Олон регрессийн хамаарал

Детерминацын коэффициент нь олон корреляцийн квадратын үзүүлэлт юм. Тэрээр танилцуулж буй шалгуур үзүүлэлтүүдийн судалж буй шинж чанаруудтай нягт уялдаатай байгаа талаар ярьдаг. Энэ нь үр дүнд үзүүлэх параметрийн нөлөөллийн мөн чанарын тухай ярьж болно. Энэ үзүүлэлтийг ашиглан олон регрессийн тэгшитгэлийг үнэлнэ.

Олон корреляцийн индексийг тооцоолохын тулд түүний индексийг тооцоолох шаардлагатай.

Хамгийн бага квадрат арга

Энэ арга нь регрессийн хүчин зүйлсийг тооцоолох арга юм. Үүний мөн чанар нь функцээс хамаарах хүчин зүйлийн улмаас олж авсан квадрат хазайлтын нийлбэрийг багасгахад оршино.

Ийм аргыг ашиглан хос шугаман регрессийн тэгшитгэлийг тооцоолж болно. Энэ төрлийн тэгшитгэлийг хос шугаман харилцааны үзүүлэлтүүдийн хооронд илрүүлэх тохиолдолд ашигладаг.

Тэгшитгэлийн сонголтууд

Шугаман регрессийн функцын параметр бүр нь тодорхой утгатай байдаг. Хосолсон шугаман регрессийн тэгшитгэл нь c ба m гэсэн 2 параметрийг агуулна.Т параметр нь x хувьсагч нэг ердийн нэгжээр буурсан (өсөлт) y функцийн эцсийн үзүүлэлтийн дундаж өөрчлөлтийг харуулдаг. Хэрэв x хувьсагч тэг бол функц нь c параметртэй тэнцүү байна. Хэрэв x хувьсагч тэг биш бол в хүчин зүйл нь эдийн засгийн утгагүй болно. Функцид нөлөөлөх цорын ганц зүйл бол в хүчин зүйлийн өмнөх тэмдэг юм. Хэрэв хасах зүйл байгаа бол хүчин зүйлтэй харьцуулахад үр дүн нь удаан өөрчлөгдсөн гэж хэлж болно. Хэрэв нэмэх зүйл байгаа бол энэ нь үр дүнгийн хурдацтай өөрчлөлтийг илтгэнэ.

Регрессийн тэгшитгэлийн утгыг өөрчилдөг параметр бүрийг тэгшитгэлээр илэрхийлж болно. Жишээлбэл, c хүчин зүйл нь c = y - mx хэлбэртэй байна.

Бүлэглэсэн өгөгдөл

Бүх мэдээллийг x шинж чанарын дагуу бүлэглэсэн даалгаврын ийм нөхцөл байдаг, гэхдээ тодорхой бүлгийн хувьд хамааралтай үзүүлэлтийн харгалзах дундаж утгыг зааж өгсөн болно. Энэ тохиолдолд дундаж утгууд нь индикатор нь x-ээс хэрхэн хамааралтай болохыг тодорхойлдог. Тиймээс бүлэглэсэн мэдээлэл нь регрессийн тэгшитгэлийг олоход тусална. Үүнийг харилцааны шинжилгээ болгон ашигладаг. Гэсэн хэдий ч энэ арга нь сул талуудтай. Харамсалтай нь дундаж үзүүлэлтүүд ихэвчлэн гадны хэлбэлзэлтэй байдаг. Эдгээр хэлбэлзэл нь харилцааны хэв маягийн тусгал биш бөгөөд зөвхөн түүний "дуу чимээ" -ийг далдалдаг. Дундаж нь шугаман регрессийн тэгшитгэлээс хамаагүй муу харилцааны хэв маягийг харуулдаг. Гэсэн хэдий ч тэдгээрийг тэгшитгэл олох үндэс болгон ашиглаж болно. Тодорхой хүн амын тоог харгалзах дундажаар үржүүлснээр та бүлэг доторх y-ийн нийлбэрийг гаргаж болно. Дараа нь та бүх хүлээн авсан дүнг устгаж, эцсийн y үзүүлэлтийг олох хэрэгтэй. Xy нийлбэр үзүүлэлтээр тооцоо хийхэд арай хэцүү. Хэрэв интервал бага байвал бид бүх нэгжид (бүлэг доторх) х индикаторыг нөхцлөөр авч болно. Үүнийг y-ийн нийлбэрээр үржүүлээд x ба y-ийн үржвэрийн нийлбэрийг ол. Цаашилбал, бүх нийлбэрүүдийг нэгтгэж, нийт xy нийлбэрийг олж авна.

Олон хос тэгшитгэлийн регресс: Харилцааны ач холбогдлыг үнэлэх

Өмнө дурьдсанчлан олон тооны регресс нь y \u003d f (x 1, x 2, ..., x m) + E хэлбэрийн функцтэй байдаг. Ихэнхдээ ийм тэгшитгэлийг барааны эрэлт, нийлүүлэлтийн асуудлыг шийдвэрлэх, эргүүлэн худалдаж авсан хувьцааны хүүгийн орлого, үйлдвэрлэлийн зардлын функцын шалтгаан, төрлийг судлахад ашигладаг. Энэ нь мөн макро эдийн засгийн олон төрлийн судалгаа, тооцоололд идэвхтэй ашиглагддаг боловч микро эдийн засгийн түвшинд энэ тэгшитгэлийг бага зэрэг ашигладаг.

Олон тооны регрессийн гол ажил бол хүчин зүйл тус бүрийг тус тусад нь болон тэдгээрийн нийлбэрээр загварчлах үзүүлэлт, түүний коэффициентүүдэд ямар нөлөө үзүүлж байгааг тодорхойлохын тулд асар их хэмжээний мэдээлэл агуулсан өгөгдлийн загварыг бий болгох явдал юм. Регрессийн тэгшитгэл нь янз бүрийн утгыг авч болно. Энэ тохиолдолд харилцааг үнэлэхийн тулд шугаман ба шугаман бус хоёр төрлийн функцийг ихэвчлэн ашигладаг.

Шугаман функцийг ийм хамаарлын хэлбэрээр дүрсэлсэн болно: y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m. Энэ тохиолдолд a2, a m нь "цэвэр" регрессийн коэффициентүүд гэж тооцогддог. Эдгээр нь y параметрийн дундаж өөрчлөлтийг бусад үзүүлэлтүүдийн тогтвортой утгын нөхцөлтэй харгалзах параметр бүрийг нэг нэгжээр өөрчлөх (буурах эсвэл нэмэгдүүлэх) тодорхойлоход шаардлагатай.

Шугаман бус тэгшитгэлүүд нь жишээ нь y=ax 1 b1 x 2 b2 ...x m bm чадлын функцийн хэлбэртэй байна. Энэ тохиолдолд b 1, b 2 ..... b m - үзүүлэлтүүдийг уян хатан байдлын коэффициент гэж нэрлэдэг бөгөөд тэдгээр нь харгалзах үзүүлэлт x 1% -иар өсөх (буурах) үр дүн хэрхэн өөрчлөгдөхийг (хэчнээн% -иар) харуулдаг. болон бусад хүчин зүйлсийн тогтвортой үзүүлэлттэй.

Олон тооны регрессийг бий болгоход ямар хүчин зүйлсийг анхаарч үзэх хэрэгтэй

Олон тооны регрессийг зөв бий болгохын тулд ямар хүчин зүйлд онцгой анхаарал хандуулах ёстойг олж мэдэх шаардлагатай.

Эдийн засгийн хүчин зүйлүүд болон загварчлагдсан хоорондын харилцааны мөн чанарын талаар тодорхой ойлголттой байх шаардлагатай. Оруулсан хүчин зүйлүүд нь дараах шалгуурыг хангасан байх ёстой.

  • Хэмжих боломжтой байх ёстой. Аливаа объектын чанарыг тодорхойлсон хүчин зүйлийг ашиглахын тулд ямар ч тохиолдолд тоон хэлбэрийг өгөх ёстой.
  • Хүчин зүйлийн харилцан хамаарал, функциональ хамаарал байх ёсгүй. Ийм үйлдэл нь ихэвчлэн эргэлт буцалтгүй үр дагаварт хүргэдэг - ердийн тэгшитгэлийн систем нь болзолгүй болж, энэ нь түүний найдваргүй байдал, бүдэг бадаг тооцоололд хүргэдэг.
  • Асар их корреляцийн индикаторын хувьд үзүүлэлтийн эцсийн үр дүнд нөлөөлөх хүчин зүйлсийн тусгаарлагдсан нөлөөг олж мэдэх арга байхгүй тул коэффициентүүдийг тайлбарлах боломжгүй болно.

Барилгын арга

Тэгшитгэлийн хүчин зүйлсийг хэрхэн сонгохыг тайлбарлах маш олон арга, арга байдаг. Гэсэн хэдий ч эдгээр бүх аргууд нь корреляцийн индексийг ашиглан коэффициентийг сонгоход суурилдаг. Тэдгээрийн дотор:

  • Хасагдах арга.
  • Аргыг асаах.
  • Алхам алхмаар регрессийн шинжилгээ.

Эхний арга нь нэгтгэсэн багцаас бүх коэффициентийг шүүж авах явдал юм. Хоёр дахь арга нь олон нэмэлт хүчин зүйлийг нэвтрүүлэх явдал юм. Гурав дахь нь тэгшитгэлд өмнө нь хэрэглэж байсан хүчин зүйлсийг арилгах явдал юм. Эдгээр аргууд бүр оршин тогтнох эрхтэй. Тэд давуу болон сул талуудтай боловч шаардлагагүй үзүүлэлтүүдийг шалгах асуудлыг өөрсдийнхөөрөө шийдэж чадна. Дүрмээр бол бие даасан арга тус бүрээр олж авсан үр дүн нь маш ойрхон байна.

Олон хувьсагчийн шинжилгээний аргууд

Хүчин зүйлсийг тодорхойлох ийм аргууд нь харилцан хамааралтай шинж чанаруудын бие даасан хослолыг харгалзан үзэхэд суурилдаг. Эдгээрт ялгах шинжилгээ, хэв маягийг таних, үндсэн бүрэлдэхүүн хэсгүүдийн шинжилгээ, кластерийн шинжилгээ орно. Үүнээс гадна хүчин зүйлийн шинжилгээ байдаг боловч энэ нь бүрэлдэхүүн хэсгийн аргыг хөгжүүлсний үр дүнд бий болсон. Эдгээрийг бүгдийг нь тодорхой нөхцөл байдалд, тодорхой нөхцөл, хүчин зүйлийн дагуу ашигладаг.

Үүнтэй төстэй нийтлэлүүд

2022 parki48.ru. Бид хүрээ байшин барьж байна. Тохижилт. Барилга. Суурь.