Регрессийн хамаарал. Microsoft Excel дахь регрессийн шинжилгээ

A) График шинжилгээ нь энгийн шугаман регресс.

Энгийн шугаман регрессийн тэгшитгэл y=a+bx. Y ба X санамсаргүй хэмжигдэхүүнүүдийн хооронд хамаарал байгаа бол y = ý +  утга,

Энд ý - ý = f(x) тэгшитгэлээс олж авсан y-ийн онолын утга,

 – онолын ý тэгшитгэлийн бодит (туршилтын) өгөгдлөөс хазайсан алдаа.

Дундаж ý утгын x-ээс хамаарах тэгшитгэл буюу ý = f(x)-ийг регрессийн тэгшитгэл гэнэ. Регрессийн шинжилгээ нь дөрвөн үе шатаас бүрдэнэ.

1) асуудлыг тодорхойлж, холболтын шалтгааныг тогтоох.

2) судалгааны объектын хязгаарлалт, статистикийн мэдээлэл цуглуулах.

3) цуглуулсан өгөгдлийн шинжилгээ, шинж чанарт үндэслэн холболтын тэгшитгэлийг сонгох.

4) тоон утгын тооцоо, корреляцийн холболтын шинж чанар.

Хэрэв хоёр хувьсагч нь нэг хувьсагчийн өөрчлөлт нь нөгөө хувьсагчийн системчилсэн өөрчлөлттэй тохирч байхаар хамааралтай бол эдгээр хувьсагч нь мэдэгдэж байгаа бол тэдгээрийн хоорондын хамаарлын тэгшитгэлийг сонгохдоо регрессийн шинжилгээг ашиглана. Регрессийн шинжилгээнээс ялгаатай нь корреляцийн шинжилгээ нь X ба Y хоорондын харилцааны ойр байдлыг шинжлэхэд ашиглагддаг.

Регрессийн шинжилгээнд шулуун шугам олох талаар авч үзье.

Онолын регрессийн тэгшитгэл.

"Энгийн регресс" гэсэн нэр томъёо нь нэг хувьсагчийн утгыг өөр нэг хувьсагчийн талаарх мэдлэг дээр үндэслэн тооцдог болохыг харуулж байна. Энгийн олон хувьсагчийн регрессээс ялгаатай нь хоёр, гурав ба түүнээс дээш хувьсагчийн мэдлэг дээр үндэслэн хувьсагчийг тооцоолоход ашигладаг. Энгийн шугаман регрессийн график шинжилгээг авч үзье.

Хөдөлмөр эрхлэлтийн өмнөх болон хөдөлмөрийн бүтээмжийг шалгах тестийн үр дүн гарсан гэж бодъё.

Сонгон шалгаруулалтын үр дүн (100 оноо), x

Бүтээмж (20 оноо), y

График дээрх цэгүүдийг зурснаар бид тараах диаграмм (талбар) олж авна. Бид үүнийг сонгон шалгаруулах туршилтын үр дүн, хөдөлмөрийн бүтээмжид дүн шинжилгээ хийхэд ашигладаг.

Тархалтын график ашиглан регрессийн шугамд дүн шинжилгээ хийцгээе. Регрессийн шинжилгээнд дор хаяж хоёр хувьсагч үргэлж тодорхойлогддог. Нэг хувьсагчийн системчилсэн өөрчлөлт нь нөгөө хувьсагчийн өөрчлөлттэй холбоотой байдаг. үндсэн зорилго регрессийн шинжилгээөөр хувьсагчийн утга мэдэгдэж байгаа бол нэг хувьсагчийн утгыг тооцоолохоос бүрдэнэ. Бүрэн даалгаврын хувьд хөдөлмөрийн бүтээмжийг үнэлэх нь чухал юм.

Бие даасан хувьсагчрегрессийн шинжилгээнд өөр хувьсагчийг шинжлэхэд үндэс болгон ашигладаг хэмжигдэхүүн. Энэ тохиолдолд эдгээр нь сонгон шалгаруулах туршилтын үр дүн юм (X тэнхлэгийн дагуу).

Хамааралтай хувьсагчтооцоолсон утга (Y тэнхлэгийн дагуу) гэж нэрлэдэг. Регрессийн шинжилгээнд зөвхөн нэг хамааралтай хувьсагч, нэгээс олон бие даасан хувьсагч байж болно.

Энгийн регрессийн шинжилгээний хувьд хамаарлыг хоёр координатын системээр (х ба у) төлөөлж болох ба X тэнхлэг нь бие даасан хувьсагч, Y тэнхлэг нь хамааралтай хувьсагч болно. График дээр хос утгыг дүрслэхийн тулд бид огтлолцох цэгүүдийг зурдаг. Хуваарь гэж нэрлэдэг тархалтын график. Үүний бүтээн байгуулалт нь регрессийн шинжилгээний хоёр дахь шат бөгөөд эхнийх нь дүн шинжилгээ хийсэн утгыг сонгох, түүврийн өгөгдлийг цуглуулах явдал юм. Тиймээс статистикийн шинжилгээнд регрессийн шинжилгээг ашигладаг. Диаграм дахь түүвэр өгөгдлийн хоорондын хамаарал нь шугаман байна.

х хувьсагч дээр үндэслэн у хувьсагчийн утгыг тооцоолохын тулд шугамын байрлалыг тодорхойлох шаардлагатай. хамгийн зөв замтархалтын график дахь цэгүүдийн байршилд тулгуурлан х ба у хоёрын хоорондын хамаарлыг илэрхийлнэ. Бидний жишээнд энэ бол гүйцэтгэлийн шинжилгээ юм. Тархалтын цэгүүдээр татсан шугам - регрессийн шугам. Харааны туршлага дээр үндэслэн регрессийн шугамыг бий болгох нэг арга бол гар аргаар хийх арга юм. Манай регрессийн шугамыг хөдөлмөрийн бүтээмжийг тодорхойлоход ашиглаж болно. Регрессийн шугамын тэгшитгэлийг олох үед

шалгуурыг ихэвчлэн ашигладаг хамгийн бага квадратууд. Хамгийн тохиромжтой шугам бол квадрат хазайлтын нийлбэр хамгийн бага байх шугам юм

Өсөлтийн шугамын математик тэгшитгэл нь арифметик прогрессийн өсөлтийн хуулийг илэрхийлнэ.

цагт = АбX.

Ю = А + бX– нэг параметртэй өгөгдсөн тэгшитгэл нь холболтын тэгшитгэлийн хамгийн энгийн төрөл юм. Энэ нь дундаж утгын хувьд хүлээн зөвшөөрөгддөг. хоорондын харилцааг илүү нарийвчлалтай илэрхийлэх XТэгээд цагт, нэмэлт пропорциональ коэффициентийг нэвтрүүлсэн б, энэ нь регрессийн шугамын налууг заана.

B) Онолын регрессийн шугамыг байгуулах.

Үүнийг олох үйл явц нь муруйн төрлийг сонгох, зөвтгөх, параметрүүдийг тооцоолохоос бүрдэнэ. А, б, -тайгэх мэт. Барилга угсралтын процессыг тэгшлэх гэж нэрлэдэг бөгөөд шалны дэвсгэрээр санал болгож буй муруйг нийлүүлэх. дүн шинжилгээ, янз бүрийн. Ихэнхдээ дотор байдаг эдийн засгийн даалгаварэерэг бүхэл тооны олон гишүүнтээр илэрхийлэгдсэн муруй, тэгшитгэлийн бүлгийг ашиглана.

1)
- шулуун шугамын тэгшитгэл;

2)
- гиперболын тэгшитгэл;

3)
- параболын тэгшитгэл;

Энд ý нь онолын регрессийн шугамын ординатууд.

Тэгшитгэлийн төрлийг сонгосны дараа та энэ тэгшитгэлээс хамаарах параметрүүдийг олох хэрэгтэй. Жишээлбэл, сарнилын талбайн цэгүүдийн байршлын шинж чанар нь онолын регрессийн шугам шулуун болохыг харуулсан.

Тарсан график нь регрессийн шинжилгээ ашиглан хөдөлмөрийн бүтээмжийг илэрхийлэх боломжийг олгодог. Эдийн засгийн шинжлэх ухаанд регрессийн шинжилгээг эцсийн бүтээгдэхүүнд нөлөөлөх олон шинж чанарыг урьдчилан таамаглахад ашигладаг (үнийг харгалзан үздэг).

B) Шулуун шугамыг олох хамгийн жижиг хүрээнүүдийн шалгуур.

Тархалтын графикт тохирох регрессийн шугамын хувьд бидний хэрэглэж болох нэг шалгуур нь квадрат алдааны нийлбэр хамгийн бага байх мөрийг сонгоход суурилдаг.

Шулуун шугамд тараах цэгүүдийн ойролцоо байдлыг сегментүүдийн ординатаар хэмждэг. Эдгээр цэгүүдийн хазайлт нь эерэг ба сөрөг байж болох ч туршилтын шугамаас онолын шугамын хазайлтын квадратуудын нийлбэр нь үргэлж эерэг бөгөөд хамгийн бага байх ёстой. Бүх тархалтын цэгүүд регрессийн шугамын байрлалтай давхцахгүй байгаа нь туршилтын болон онолын өгөгдлүүдийн хооронд зөрүү байгааг харуулж байна. Иймээс олдсоноос бусад регрессийн шугам нь туршилтын болон туршилтын өгөгдлүүдийн хооронд бага хэмжээний хазайлт өгч чадахгүй гэж бид хэлж чадна. Тиймээс онолын тэгшитгэлийг олсон ý болон регрессийн шугамын хувьд бид хамгийн бага квадратын шаардлагыг хангана.

Энэ нь холболтын тэгшитгэлийг ашиглан хийгддэг
параметрүүдийг олохын тулд томъёог ашиглах АТэгээд б. Онолын үнэ цэнийг авч байна
болон томилох зүүн талдамжуулан тэгшитгэл е, бид функцийг авна
үл мэдэгдэх параметрүүдээс АТэгээд б. Үнэ цэнэ АТэгээд бхамгийн бага функцийг хангана еба хэсэгчилсэн дифференциал тэгшитгэлээс олно
Тэгээд
. Энэ шаардлагатай нөхцөлГэсэн хэдий ч эерэг квадрат функцийн хувьд энэ нь олоход хангалттай нөхцөл юм АТэгээд б.

Параметрийн томьёог хэсэгчилсэн дериватив тэгшитгэлээс гаргаж авцгаая АТэгээд б:



Бид тэгшитгэлийн системийг олж авна:

Хаана
- арифметик дундаж алдаа.

Тоон утгыг орлуулснаар бид параметрүүдийг олно АТэгээд б.

Нэг ойлголт байдаг
. Энэ бол ойролцоолох хүчин зүйл юм.

Хэрэв д < 33%, то модель приемлема для дальнейшего анализа;

Хэрэв д> 33%, дараа нь бид гипербола, парабола гэх мэтийг авна. Энэ нь янз бүрийн нөхцөл байдалд дүн шинжилгээ хийх эрхийг өгдөг.

Дүгнэлт: Ойролцоо коэффициентийн шалгуурын дагуу хамгийн тохиромжтой шугам нь хамгийн тохиромжтой шугам юм.

, мөн бидний асуудлын өөр ямар ч регрессийн шугам нь хамгийн бага хазайлтыг өгдөггүй.

D) Үнэлгээний квадрат алдаа, тэдгээрийн ердийн байдлыг шалгах.

Судалгааны параметрийн тоо 30-аас бага хүн амтай холбоотой ( n < 30), для проверки типичности параметров уравнения регрессии используется т-Оюутны t-тест. Энэ нь бодит утгыг тооцдог т-шалгуур:

Эндээс

Хаана – үлдэгдэл язгуурын дундаж квадрат алдаа. Хүлээн авсан т аТэгээд т бшүүмжлэлтэй харьцуулахад т кОюутны хүснэгтээс хүлээн зөвшөөрөгдсөн ач холбогдлын түвшинг харгалзан үзнэ ( = 0.01 = 99% эсвэл  = 0.05 = 95%). П = е = к 1 = м– судалж буй тэгшитгэлийн параметрийн тоо (чөлөөний зэрэг). Жишээлбэл, хэрэв y = а + bx; м = 2, к 2 = е 2 = х 2 = n – (м+ 1), хаана n- судлагдсан шинж чанаруудын тоо.

т а < т к < т б .

Дүгнэлт: ердийн байдлыг шалгасан регрессийн тэгшитгэлийн параметрүүдийг ашиглан харилцааны математик загварыг бий болгосон.
. Энэ тохиолдолд шинжилгээнд ашигласан математик функцийн параметрүүд (шугаман, гипербол, парабол) нь харгалзах тоон утгыг хүлээн авдаг. Ийм аргаар олж авсан загваруудын семантик агуулга нь тэдгээр нь үүссэн шинж чанарын дундаж утгыг тодорхойлдог явдал юм.
хүчин зүйлийн шинж чанараас X.

D) Муруй шугаман регресс.

Хувьсагчдын хооронд өөрчлөгдөж буй хамаарал үүсэх үед муруй шугаман хамаарал ихэвчлэн үүсдэг. Өсөлт (бууралт)-ын эрчим нь X-ийн түвшнээс хамаарна.Муруйн хамаарлын янз бүрийн хэлбэрүүд байдаг. Жишээлбэл, газар тариалангийн ургац ба хур тунадасны хамаарлыг авч үзье. Байгалийн ижил нөхцөлд хур тунадас нэмэгдэхийн хэрээр ургац эрчимтэй нэмэгдэж байгаа боловч тодорхой хязгаар хүртэл байна. Чухал цэгийн дараа хур тунадас хэтэрч, ургац гамшгийн хэмжээгээр буурдаг. Энэ жишээнээс харахад харилцаа нь эхлээд эерэг, дараа нь сөрөг байсан. Чухал цэг нь X атрибутын оновчтой түвшин бөгөөд энэ нь Y атрибутын хамгийн их буюу хамгийн бага утгатай тохирч байна.

Эдийн засгийн шинжлэх ухаанд үнэ ба хэрэглээ, бүтээмж, туршлага хоёрын хооронд ийм хамаарал ажиглагддаг.

Параболик хамаарал.

Хэрэв өгөгдөл нь хүчин зүйлийн шинж чанарын өсөлт нь үр дүнгийн шинж чанарыг нэмэгдүүлэхэд хүргэдэг бол хоёр дахь эрэмбийн тэгшитгэлийг (парабол) регрессийн тэгшитгэл болгон авна.

. a,b,c коэффициентүүдийг хэсэгчилсэн дифференциал тэгшитгэлээс олно.

Бид тэгшитгэлийн системийг олж авдаг:

Муруй шугаман тэгшитгэлийн төрлүүд:

,

,

Бид хөдөлмөрийн бүтээмж болон сонгон шалгаруулалтын шалгалтын онооны хооронд муруй шугаман хамаарал байгаа гэж үзэх эрхтэй. Энэ нь онооны систем нэмэгдэхийн хэрээр гүйцэтгэл нь зарим түвшинд буурч эхлэх тул шулуун загвар нь муруй хэлбэртэй болж магадгүй гэсэн үг юм.

Гурав дахь загвар нь гипербол байх ба бүх тэгшитгэлд x хувьсагчийг илэрхийллээр солино.

1908 оноос хойшхи бүтээлүүддээ. Тэр үүнийг үл хөдлөх хөрөнгө худалддаг төлөөлөгчийн ажлын жишээн дээр тайлбарлав. Байшингийн борлуулалтын мэргэжилтэн өөрийн бүртгэлдээ тодорхой барилга тус бүрийн өргөн хүрээний оролтын өгөгдлийг бүртгэж байсан. Дуудлага худалдааны дүнгээр ямар хүчин зүйл байгааг тогтоосон хамгийн их нөлөөгүйлгээний үнэ хүртэл.

Шинжилгээ их хэмжээнийгүйлгээ нь сонирхолтой үр дүнг авчирсан. Эцсийн үнэд олон хүчин зүйл нөлөөлсөн бөгөөд заримдаа хачирхалтай дүгнэлтүүд, тэр ч байтугай анхны боломжит байшинг хямд үнээр зарах үед илт "хачирхалтай" дүгнэлтэд хүргэдэг.

Ийм дүн шинжилгээг ашиглах хоёр дахь жишээ бол ажилчдын цалин хөлсийг тодорхойлох үүрэг хүлээсэн ажил юм. Даалгаврын нарийн төвөгтэй байдал нь хүн бүрт тогтмол мөнгө хуваарилах шаардлагагүй, харин гүйцэтгэсэн тодорхой ажилтай хатуу нийцүүлэхийг шаарддагт оршино. Бараг ижил төстэй шийдэл бүхий олон асуудал гарч ирсэн нь тэдгээрийг математикийн түвшинд илүү нарийвчлан судлах шаардлагатай байв.

"Регрессийн шинжилгээ" гэсэн хэсэгт нэлээд их газар хуваарилагдсан практик аргууд, регрессийн үзэл баримтлалд хамаарах хамаарлыг судлахад ашигладаг. Эдгээр хамаарлыг статистик судалгаанаас олж авсан өгөгдлүүдийн хооронд ажиглаж байна.

Шийдвэрлэх олон асуудлын дотроос тэрээр регрессийн тэгшитгэлийг тодорхойлох гурван үндсэн зорилгыг тавьдаг. ерөнхий үзэл; регрессийн тэгшитгэлийн нэг хэсэг болох үл мэдэгдэх параметрүүдийн тооцоог бүтээх; статистикийн регрессийн таамаглалыг шалгах. Туршилтын ажиглалтын үр дүнд олж авсан, (x1, y1), ..., (xn, yn) төрлийн цуваа (иж бүрдэл) бүрдүүлдэг хос хэмжигдэхүүнүүдийн хооронд үүсэх хамаарлыг судлах явцад тэдгээр нь дараахь зүйлд тулгуурладаг. регрессийн онолын заалтууд ба нэг Y хэмжигдэхүүний хувьд тодорхой магадлалын тархалт байгаа бол нөгөө X нь тогтмол хэвээр байна гэж үзнэ.

Y үр дүн нь X хувьсагчийн утгаас хамаардаг бөгөөд энэ хамаарлыг янз бүрийн хэв маягаар тодорхойлж болох бөгөөд олж авсан үр дүнгийн нарийвчлал нь ажиглалтын шинж чанар, шинжилгээний зорилгод нөлөөлдөг. Туршилтын загвар нь хялбаршуулсан боловч үнэмшилтэй тодорхой таамаглал дээр суурилдаг. Гол нөхцөл нь X параметр нь хяналттай хэмжигдэхүүн юм. Түүний утгыг туршилт эхлэхээс өмнө тогтоодог.

Хэрэв туршилтанд хяналтгүй XY хувьсагчдыг ашигладаг бол регрессийн шинжилгээг ижил аргаар хийдэг боловч үр дүнг тайлбарлахын тулд судалж буй хувьсагчдын хоорондын хамаарлыг судалдаг. санамсаргүй хэмжигдэхүүн, аргууд хэрэглэгдэж байна Methods математик статистикхийсвэр сэдэв биш. Тэд амьдралд хэрэглэгдэхүүнээ хамгийн их олдог янз бүрийн талбаруудхүний ​​үйл ажиллагаа.

IN шинжлэх ухааны уран зохиолМиний олсон дээрх аргыг тодорхойлох өргөн хэрэглээхугацааны шугаман регрессийн шинжилгээ. X хувьсагчийн хувьд регрессор эсвэл таамаглагч гэсэн нэр томъёог ашигладаг бөгөөд хамааралтай Y хувьсагчдыг шалгуур үзүүлэлт гэж нэрлэдэг. Энэ нэр томьёо нь зөвхөн хувьсагчдын математикийн хамаарлыг тусгасан боловч шалтгаан-үр дагаврын хамаарлыг илэрхийлдэггүй.

Регрессийн шинжилгээ нь олон төрлийн ажиглалтын үр дүнг боловсруулахад хэрэглэгддэг хамгийн түгээмэл арга юм. Физик болон биологийн хамаарлыг арга хэрэгслээр судалдаг энэ арга, энэ нь эдийн засаг, технологийн аль алинд нь хэрэгждэг. Бусад олон салбарт регрессийн шинжилгээний загварыг ашигладаг. Вариацын шинжилгээ, Статистикийн дүн шинжилгээолон хэмжээст судалгааны энэ аргатай нягт хамтран ажиллах.

Корреляци ба регрессийн ойлголтууд нь шууд хамааралтай. Корреляци ба регрессийн шинжилгээнд олон тооны нийтлэг тооцоолох аргууд байдаг. Эдгээр нь үзэгдэл, үйл явцын хоорондын шалтгаан-үр дагаврын холбоог тодорхойлоход хэрэглэгддэг. Гэсэн хэдий ч хэрэв корреляцийн шинжилгээЭнэ нь стохастик холболтын хүч ба чиглэлийг тооцоолох боломжийг бидэнд олгодог регрессийн шинжилгээ- бас донтох хэлбэр.

Регресс нь дараахь байж болно.

a) үзэгдлийн тооноос хамааран (хувьсагчдаас):

Энгийн (хоёр хувьсагчийн хоорондох регресс);

Олон (хамаарах хувьсагч (y) ба хэд хэдэн тайлбарлагч хувьсагч (x1, x2...xn) хоорондын регресс);

б) хэлбэрээс хамааран:

Шугаман (шугаман функцээр харуулах ба судалж буй хувьсагчдын хооронд шугаман хамаарал байдаг);

Шугаман бус (шугаман бус функцээр харагдана; судалж буй хувьсагчдын хоорондын хамаарал нь шугаман бус);

в) анхааралдаа авсан хувьсагчдын хоорондын хамаарлын шинж чанараар:

Эерэг (тайлбарлах хувьсагчийн утгын өсөлт нь хамааралтай хувьсагчийн утгыг нэмэгдүүлэхэд хүргэдэг ба эсрэгээр);

Сөрөг (тайлбарлах хувьсагчийн утга нэмэгдэхийн хэрээр тайлбарласан хувьсагчийн утга буурах);

г) төрлөөр:

Шууд (энэ тохиолдолд шалтгаан нь үр дагаварт шууд нөлөөлдөг, өөрөөр хэлбэл хамааралтай болон тайлбарлагч хувьсагч нь бие биенээсээ шууд хамааралтай);

Шууд бус (тайлбарлах хувьсагч нь хамааралтай хувьсагч дээр гуравны нэг буюу хэд хэдэн бусад хувьсагчаар дамжуулан шууд бус нөлөө үзүүлдэг);

Хуурамч (утгагүй регресс) - судалж буй үйл явц, үзэгдэлд өнгөц, албан ёсны хандлагаас үүдэлтэй байж болно. Утгагүй жишээ бол манай улсын архины хэрэглээ багасч, угаалгын нунтаг борлуулалт буурсан хоёрын хоорондын уялдаа холбоог тогтоосон регресс юм.

Регрессийн шинжилгээ хийхдээ дараахь үндсэн ажлуудыг шийддэг.

1. Хараат байдлын хэлбэрийг тодорхойлох.

2. Регрессийн функцийн тодорхойлолт. Үүнийг хийхийн тулд эхлээд тогтоох боломжийг олгодог нэг төрлийн математик тэгшитгэлийг ашигла ерөнхий чиг хандлагахамааралтай хувьсагчийн өөрчлөлт, хоёрдугаарт, тайлбарлагч хувьсагч (эсвэл хэд хэдэн хувьсагчийн) хамааралтай хувьсагчид үзүүлэх нөлөөг тооцоолох.

3. Хамаарах хувьсагчийн үл мэдэгдэх утгыг тооцоолох. Үүссэн математикийн хамаарал (регрессийн тэгшитгэл) нь хамааралтай хувьсагчийн утгыг тайлбарлагч хувьсагчдын тогтоосон утгын интервал дотор болон түүнээс дээш аль алинд нь тодорхойлох боломжийг олгодог. Сүүлчийн тохиолдолд регрессийн шинжилгээ нь үүрэг гүйцэтгэдэг ашигтай хэрэгсэлнийгэм-эдийн засгийн үйл явц, үзэгдлийн өөрчлөлтийг урьдчилан таамаглах үед (одоо байгаа чиг хандлага, харилцааг хадгалах тохиолдолд). Дүрмээр бол урьдчилан таамаглах хугацааг эхний үзүүлэлтүүдийн ажиглалт хийсэн хугацааны хагасаас илүүгүй байхаар сонгоно. Идэвхгүй прогноз, экстраполяцийн асуудлыг шийдэж, идэвхтэй таамаглалыг хоёуланг нь хийж, сайн мэддэг "хэрэв ..., тэгвэл" схемийн дагуу үндэслэл гаргаж, янз бүрийн утгыг нэг буюу хэд хэдэн тайлбарлагч регрессийн хувьсагчид орлуулах боломжтой. .



Учир нь регрессийн бүтээн байгуулалттусгай арга гэж нэрлэдэг хамгийн бага квадратын арга. Энэ арга нь бусад тэгшитгэх аргуудаас давуу талтай: шаардлагатай параметрүүдийг харьцангуй энгийн математик тодорхойлох, магадлалын үүднээс онолын үндэслэл сайтай.

Регрессийн загварыг сонгохдоо түүнд тавигдах зайлшгүй шаардлагуудын нэг бол хангалттай нарийвчлалтай шийдлийг олж авах боломжийг олгодог хамгийн энгийн байдлыг хангах явдал юм. Тиймээс, статистикийн харилцааг бий болгохын тулд эхлээд дүрмээр бол бид ангийн загварыг авч үздэг шугаман функцууд(бүх боломжит функцүүдийн ангиллын хамгийн энгийн нь):

энд bi, b2...bj нь yi утгад xij бие даасан хувьсагчийн нөлөөллийг тодорхойлох коэффициентүүд; ai - чөлөөт гишүүн; ei - хамааралгүй хүчин зүйлийн нөлөөллийг тусгасан санамсаргүй хазайлт; n - бие даасан хувьсагчийн тоо; N нь ажиглалтын тоо бөгөөд (N . n+1) нөхцөлийг хангасан байх ёстой.

Шугаман загварянз бүрийн асуудлын маш өргөн ангиллыг дүрсэлж чадна. Гэсэн хэдий ч практикт, ялангуяа нийгэм-эдийн засгийн тогтолцоонд шугаман загварыг ашиглах нь заримдаа хэцүү байдаг. том алдаануудойролцоо тооцоолол. Тиймээс шугаман бус функцийг ихэвчлэн ашигладаг олон регресс, шугаманчлалыг зөвшөөрөх. Үүнд, жишээлбэл, үйлдвэрлэлийн функц ( эрчим хүчний функцКобб-Дуглас) нь нийгэм, эдийн засгийн янз бүрийн судалгаанд хэрэглэгдэх болсон. Энэ нь иймэрхүү байна:

Энд b 0 нь хэвийн болгох коэффициент, b 1 ...b j нь үл мэдэгдэх коэффициент, e i нь санамсаргүй хазайлт юм.

Ашиглаж байна байгалийн логарифмууд, бид энэ тэгшитгэлийг болгон хувиргаж болно шугаман хэлбэр:

Үүссэн загвар нь дээр дурдсан стандарт шугаман регрессийн процедурыг ашиглах боломжийг олгодог. Хоёр төрлийн (нэмэлт ба үржүүлэх) загваруудыг хийснээр та хамгийн сайныг нь сонгож, бага ойролцоо алдаатай цаашдын судалгаа хийх боломжтой.

Ойролцоогоор функцийг сонгох сайн боловсруулсан систем байдаг - аргументуудыг бүлэг бүртгэх арга(MGUA).

Сонгосон загварын зөв эсэхийг ажигласан y i утгууд ба урьдчилан таамагласан харгалзах утгуудын хоорондын ялгаа болох үлдэгдлийг судлах үр дүнгээр дүгнэж болно. регрессийн тэгшитгэлутгууд y i . Энэ тохиолдолд загварын зохистой байдлыг шалгахтооцоолсон дундаж алдааойролцоогоор:

Хэрэв e нь 15% -иас ихгүй байвал загварыг хангалттай гэж үзнэ.

Нийгэм-эдийн засгийн тогтолцооны хувьд сонгодог регрессийн загварт нийцэх үндсэн нөхцөл тэр бүр хангагддаггүйг бид онцолж байна.

Үүссэн хангалтгүй байдлын бүх шалтгааныг дурдалгүйгээр бид зөвхөн нэрлэх болно олон шугаман байдал- статистикийн хамаарлыг судлахад регрессийн шинжилгээний процедурыг үр дүнтэй ашиглах хамгийн хэцүү асуудал. Доод олон шугаман байдалтайлбарлагч хувьсагчдын хооронд шугаман хамаарал байна гэж ойлгогддог.

Энэ үзэгдэл:

а) регрессийн коэффициентийг утга учиртай тайлбарлахдаа утгыг гажуудуулдаг;

б) үнэлгээний нарийвчлалыг бууруулдаг (үнэлгээний тархалт нэмэгддэг);

в) түүврийн өгөгдөлд коэффициентийн тооцооллын мэдрэмжийг нэмэгдүүлдэг (түүврийн хэмжээг нэмэгдүүлэх нь тооцоололд ихээхэн нөлөөлдөг).

Multicollinearity-ийг бууруулах янз бүрийн арга техникүүд байдаг. Ихэнх боломжийн арга- хоёр хувьсагчийн хоорондын корреляцийн коэффициент нь тэнцүү утгаас давсан тохиолдолд хоёр хувьсагчийн аль нэгийг хасах. үнэмлэхүй үнэ цэнэ 0.8. Хувьсагчдаас алийг нь хадгалах вэ гэдэг нь бодитой үндэслэлд тулгуурлан шийдэгдэнэ. Дараа нь регрессийн коэффициентүүдийг дахин тооцоолно.

Алхам алхмаар регрессийн алгоритмыг ашиглах нь загварт нэг бие даасан хувьсагчийг дараалан оруулах, регрессийн коэффициент ба хувьсагчдын олон шугаман байдлын ач холбогдлыг шинжлэх боломжийг олгодог. Эцэст нь регрессийн коэффициентийн шаардлагатай ач холбогдол, олон шугаман хамаарлын хамгийн бага нөлөөллийг хангадаг хувьсагчид л судалж буй харилцаанд үлдэнэ.

Регресс ба корреляцийн шинжилгээ - статистикийн аргуудсудалгаа. Эдгээр нь нэг буюу хэд хэдэн бие даасан хувьсагчаас параметрийн хамаарлыг харуулах хамгийн түгээмэл арга юм.

Тодорхой талаар доор практик жишээнүүдЭдийн засагчдын дунд маш их алдартай эдгээр хоёр шинжилгээг авч үзье. Бид тэдгээрийг нэгтгэх үед үр дүнг олж авах жишээг өгөх болно.

Excel дээрх регрессийн шинжилгээ

Зарим утгуудын (бие даасан, бие даасан) хамааралтай хувьсагчид үзүүлэх нөлөөллийг харуулна. Тухайлбал, эдийн засгийн идэвхтэй хүн амын тоо нь аж ахуйн нэгжийн тоо, цалин болон бусад үзүүлэлтээс хэрхэн хамаардаг. Эсвэл: гадаадын хөрөнгө оруулалт, эрчим хүчний үнэ зэрэг нь ДНБ-ий түвшинд хэрхэн нөлөөлдөг вэ.

Шинжилгээний үр дүн нь тэргүүлэх чиглэлийг тодруулах боломжийг танд олгоно. Мөн үндсэн хүчин зүйл дээр үндэслэн хөгжлийг урьдчилан таамаглаж, төлөвлө тэргүүлэх чиглэлүүд, удирдлагын шийдвэр гаргах.

Регресс тохиолддог:

  • шугаман (y = a + bx);
  • параболик (y = a + bx + cx 2);
  • экспоненциал (y = a * exp(bx));
  • хүч (y = a*x^b);
  • гипербол (y = b/x + a);
  • логарифм (y = b * 1n(x) + a);
  • экспоненциал (y = a * b^x).

Excel дээр регрессийн загвар бүтээх, үр дүнг тайлбарлах жишээг харцгаая. Регрессийн шугаман төрлийг авч үзье.

Даалгавар. 6 аж ахуйн нэгжид сарын дундаж цалингарсан ажилчдын тоо. Ажлаас халагдсан ажилчдын тоо дундаж цалингаас хамаарах эсэхийг тодорхойлох шаардлагатай.

Шугаман регрессийн загвар дараах байдалтай байна.

Y = a 0 + a 1 x 1 +…+a k x k.

a регрессийн коэффициентууд, х нь нөлөөлөх хувьсагчид, k нь хүчин зүйлийн тоо юм.

Бидний жишээн дээр Y нь ажилчдаа халагдсаны үзүүлэлт юм. Нөлөөлөх хүчин зүйл нь цалин (x) юм.

Excel-д шугаман регрессийн загварын параметрүүдийг тооцоолоход туслах функцууд байдаг. Гэхдээ "Шинжилгээний багц" нэмэлт нь үүнийг илүү хурдан хийх болно.

Бид хүчирхэг аналитик хэрэгслийг идэвхжүүлдэг:

Идэвхжүүлсний дараа нэмэлт нь Мэдээллийн таб дээр боломжтой болно.

Одоо регрессийн шинжилгээг өөрөө хийцгээе.



Юуны өмнө бид R квадрат болон коэффициентүүдэд анхаарлаа хандуулдаг.

R-квадрат нь детерминацын коэффициент юм. Бидний жишээнд - 0.755 буюу 75.5%. Энэ нь тийм гэсэн үг дизайны параметрүүдзагварууд нь судалж буй параметрүүдийн хоорондын хамаарлын 75.5% -ийг тайлбарлаж байна. Детерминацийн коэффициент өндөр байх тусам загвар нь илүү сайн байх болно. Сайн - 0.8-аас дээш. Муу - 0.5-аас бага (ийм дүн шинжилгээг үндэслэлтэй гэж үзэх боломжгүй). Бидний жишээнд - "муу биш".

64.1428 коэффициент нь авч үзэж буй загварын бүх хувьсагч 0-тэй тэнцүү байвал Y ямар байхыг харуулдаг. Өөрөөр хэлбэл, шинжилж буй параметрийн утгад загварт заагаагүй бусад хүчин зүйлс мөн нөлөөлнө.

Коэффициент -0.16285 нь Х хувьсагчийн Y дээрх жинг харуулж байна. Өөрөөр хэлбэл, энэ загварт багтсан сарын дундаж цалин нь -0.16285 жинтэй (энэ нь бага хэмжээний нөлөөлөл) ажлаас халагдсан хүмүүсийн тоонд нөлөөлдөг. "-" тэмдэг нь заана муу нөлөө: цалин өндөр байх тусам цөөн хүн ажлаасаа гарах болно. Аль нь шударга вэ.



Excel дэх корреляцийн шинжилгээ

Корреляцийн шинжилгээ нь нэг эсвэл хоёр түүврийн үзүүлэлтүүдийн хооронд хамаарал байгаа эсэхийг тодорхойлоход тусалдаг. Жишээлбэл, машины ашиглалтын хугацаа болон засварын зардал, тоног төхөөрөмжийн үнэ ба ашиглалтын хугацаа, хүүхдийн өндөр, жин гэх мэт.

Хэрэв холболт байгаа бол нэг параметрийн өсөлт нь нөгөө параметрийн өсөлт (эерэг хамаарал) эсвэл буурах (сөрөг) болоход хүргэдэг. Корреляцийн шинжилгээ нь шинжээчдэд нэг үзүүлэлтийн утгыг нөгөө үзүүлэлтийн боломжит утгыг таамаглахад ашиглаж болох эсэхийг тодорхойлоход тусалдаг.

Корреляцийн коэффициентийг r-ээр тэмдэглэнэ. +1-ээс -1 хооронд хэлбэлздэг. Корреляцийн ангилал өөр өөр газар нутагөөр байх болно. Коэффициент 0 байх үед шугаман хамааралдээжийн хооронд байхгүй.

Хэрхэн ашиглахыг харцгаая Excel хэрэгслүүдкорреляцийн коэффициентийг ол.

Хосолсон коэффициентийг олохын тулд CORREL функцийг ашигладаг.

Зорилго: Үйл ажиллагааны цаг хоорондын хамаарал байгаа эсэхийг тодорхойлох токарьболон түүний засвар үйлчилгээний зардал.

Курсорыг дурын нүдэнд байрлуулаад fx товчийг дарна уу.

  1. "Статистик" ангилалд CORREL функцийг сонгоно уу.
  2. Аргумент "Масив 1" - утгын эхний муж - машины ажиллах хугацаа: A2: A14.
  3. Аргумент "Масив 2" - утгын хоёр дахь муж - засварын зардал: B2: B14. OK дарна уу.

Холболтын төрлийг тодорхойлохын тулд та коэффициентийн үнэмлэхүй тоог харах хэрэгтэй (үйл ажиллагааны талбар бүр өөрийн гэсэн масштабтай).

Учир нь корреляцийн шинжилгээхэд хэдэн параметр (2-оос дээш), "Өгөгдлийн шинжилгээ" ("Шинжилгээний багц" нэмэлт) ашиглах нь илүү тохиромжтой. Жагсаалтаас хамаарлыг сонгоод массивыг зааж өгөх хэрэгтэй. Бүгд.

Үр дүнгийн коэффициентүүд нь корреляцийн матрицад харагдах болно. Үүн шиг:

Корреляци ба регрессийн шинжилгээ

Практикт эдгээр хоёр аргыг ихэвчлэн хамт ашигладаг.

Жишээ:


Одоо регрессийн шинжилгээний өгөгдөл харагдаж байна.

Регрессийн шинжилгээ нь статистикийн судалгааны хамгийн түгээмэл аргуудын нэг юм. Үүнийг нөлөөллийн түвшинг тодорхойлоход ашиглаж болно бие даасан хэмжигдэхүүнүүдхамааралтай хувьсагч дээр. Үйл ажиллагааны хувьд Microsoft ExcelЭнэ төрлийн шинжилгээг хийхэд зориулагдсан хэрэгслүүд байдаг. Тэдгээр нь юу болох, тэдгээрийг хэрхэн ашиглах талаар авч үзье.

Гэхдээ регрессийн шинжилгээ хийх боломжийг олгодог функцийг ашиглахын тулд эхлээд анализын багцыг идэвхжүүлэх хэрэгтэй. Зөвхөн дараа нь энэ процедурт шаардлагатай хэрэгслүүд Excel туузан дээр гарч ирнэ.


Одоо бид таб руу очиход "Өгөгдөл", хэрэгслийн хайрцаг дахь туузан дээр "Шинжилгээ"Бид шинэ товчлуурыг харах болно - "Мэдээллийн дүн шинжилгээ хийх".

Регрессийн шинжилгээний төрлүүд

Хэд хэдэн төрлийн регресс байдаг:

  • параболик;
  • тайвшруулах;
  • логарифм;
  • экспоненциал;
  • харуулах;
  • гиперболик;
  • шугаман регресс.

Excel дээр сүүлийн төрлийн регрессийн шинжилгээ хийх талаар бид дараа нь илүү дэлгэрэнгүй ярих болно.

Excel дээрх шугаман регресс

Жишээ болгон доороос гадна өдрийн дундаж агаарын температур, тухайн ажлын өдрийн дэлгүүрийн үйлчлүүлэгчдийн тоог харуулсан хүснэгтийг доор харуулав. Яг яаж гэдгийг регрессийн шинжилгээ ашиглан олж мэдье цаг агаарагаарын температур хэлбэрээр жижиглэн худалдааны байгууллагын ирц нөлөөлж болно.

Ерөнхий шугаман регрессийн тэгшитгэл нь дараах байдалтай байна: Y = a0 + a1x1 +…+ akhk. Энэ томъёонд Юхувьсагч, бидний судлах гэж буй хүчин зүйлсийн нөлөөллийг хэлнэ. Манай тохиолдолд энэ нь худалдан авагчдын тоо юм. Утга x- Энэ янз бүрийн хүчин зүйлүүд, хувьсагчид нөлөөлж байна. Сонголтууд арегрессийн коэффициентүүд юм. Өөрөөр хэлбэл, тэд тодорхой хүчин зүйлийн ач холбогдлыг тодорхойлдог хүмүүс юм. Индекс кны төлөө нийтэдгээр ижил хүчин зүйлүүд.


Шинжилгээний үр дүнгийн шинжилгээ

Регрессийн шинжилгээний үр дүнг тохиргоонд заасан газарт хүснэгт хэлбэрээр харуулав.

Гол үзүүлэлтүүдийн нэг нь R-дөрвөлжин. Энэ нь загварын чанарыг илтгэнэ. Манай тохиолдолд энэ коэффициент 0.705 буюу 70.5%-тай тэнцүү байна. Энэ бол хүлээн зөвшөөрөгдсөн чанарын түвшин юм. 0.5-аас бага хамааралтай байх нь муу.

Өөр чухал үзүүлэлтшугамын огтлолцол дахь нүдэнд байрлана "Y уулзвар"ба багана "Магадлал". Энэ нь Y ямар утгатай болохыг харуулж байгаа бөгөөд манай тохиолдолд энэ нь худалдан авагчдын тоо бөгөөд бусад бүх хүчин зүйлүүд тэгтэй тэнцүү байна. Энэ хүснэгтэд энэ утга 58.04 байна.

Графикийн огтлолцол дээрх утга "Хувьсагч X1"Тэгээд "Магадлал"нь Х-ээс Y-ийн хамаарлын түвшинг харуулж байна. Манай тохиолдолд энэ нь дэлгүүрийн үйлчлүүлэгчдийн тооноос температураас хамаарах түвшин юм. 1.31 коэффициентийг нэлээд тооцно өндөр хувьнөлөө.

Бидний харж байгаагаар ашиглаж байна Microsoft програмууд Excel нь регрессийн шинжилгээний хүснэгтийг үүсгэхэд маш хялбар юм. Гэхдээ зөвхөн бэлтгэгдсэн хүн л гаралтын өгөгдөлтэй ажиллаж, мөн чанарыг нь ойлгож чадна.



Үүнтэй төстэй нийтлэлүүд

2024 parki48.ru. Бид хүрээ байшин барьж байна. Ландшафтын дизайн. Барилга. Суурь.