Ойролцоогоор алдааны тооцооны жишээ. Регрессийн загварчлалын үр дүнгийн статистикийн найдвартай байдлын Фишерийн F-шалгуурыг ашиглан үнэлгээ хийх

Бүс нутгийн нутаг дэвсгэрийн хувьд 200X-ийн өгөгдлийг өгсөн болно.

Бүс нутгийн дугаар Хөдөлмөрийн чадвартай нэг хүнд ногдох дундаж амьжиргааны доод түвшин, руб., х Өдөр тутмын дундаж цалин, руб., at
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

Дасгал:

1. Корреляцийн талбар байгуулж, холболтын хэлбэрийн талаар таамаглал дэвшүүл.

2. Тэгшитгэлийн параметрүүдийг тооцоол шугаман регресс

4. Уян хатан байдлын дундаж (ерөнхий) коэффициентийг ашиглан хүчин зүйл ба үр дүнгийн хоорондын хамаарлын бат бөх байдлын харьцуулсан үнэлгээг өг.

7. Хүчин зүйлийн таамагласан утга нь дундаж түвшнээс 10%-иар өссөн тохиолдолд үр дүнгийн таамагласан утгыг тооцоол. Ач холбогдолын түвшний таамаглалд итгэх итгэлийн интервалыг тодорхойл.

Шийдэл:

Excel ашиглан энэ асуудлыг шийдье.

1. Боломжтой x ба y өгөгдлийг харьцуулж, жишээлбэл, x хүчин зүйлийн өсөх дарааллаар эрэмбэлэхэд нэг хүнд ногдох амьжиргааны доод хэмжээ нэмэгдэх нь өдрийн дундаж цалин нэмэгдэх үед шинж тэмдгүүдийн хооронд шууд хамаарлыг ажиглаж болно. Үүний үндсэн дээр тэмдгүүдийн хоорондын хамаарал шууд байна гэж үзэж болох бөгөөд үүнийг шулуун шугамын тэгшитгэлээр дүрсэлж болно. График шинжилгээний үндсэн дээр ижил дүгнэлтийг баталж байна.

Корреляцийн талбар үүсгэхийн тулд та Excel PPP ашиглаж болно. Эхний өгөгдлийг дарааллаар оруулна уу: эхлээд x, дараа нь y.

Өгөгдөл агуулсан нүднүүдийн хэсгийг сонгоно уу.

Дараа нь сонгоно уу: Тэмдэглэгээтэй оруулах / тараах / тараах 1-р зурагт үзүүлсэн шиг.

Зураг 1 Корреляцийн талбайн байгуулалт

Корреляцийн талбарын шинжилгээ нь шууд ойролцоо байгааг харуулж байна шугаман хамаарал, учир нь цэгүүд бараг шулуун шугаманд байрладаг.

2. Шугаман регрессийн тэгшитгэлийн параметрүүдийг тооцоолох
суурилагдсан статистик функцийг ашиглах LINEST.

Үүний тулд:

1) Шинжилгээ хийх өгөгдлийг агуулсан одоо байгаа файлыг нээх;
2) Регрессийн статистикийн үр дүнг харуулахын тулд 5х2 (5 мөр, 2 багана) хоосон нүднүүдийн хэсгийг сонгоно уу.
3) Идэвхжүүлэх Функцийн мастер: үндсэн цэснээс сонгоно уу Томъёо / Оруулах функц.
4) Цонхонд Ангилалчи авна Статистик, функцийн цонхонд - LINEST. Товчлуур дээр дарна уу БОЛЖ БАЙНА УУЗураг 2-т үзүүлсэн шиг;

Зураг 2 Function Wizard харилцах цонх

5) Функцийн аргументуудыг бөглөнө үү:

Мэдэгдэж буй үнэт зүйлс

Мэдэгдэж буй x утгууд

Тогтмол- тэгшитгэлд чөлөөт нэр томъёо байгаа эсвэл байхгүй байгааг харуулсан логик утга; хэрэв Тогтмол = 1 бол чөлөөт гишүүнийг ердийн аргаар тооцоолно, хэрэв Тогтмол = 0 бол чөлөөт гишүүнийг 0;

Статистик- регрессийн шинжилгээнд нэмэлт мэдээлэл харуулах эсэхийг харуулах логикийн утга. Хэрэв Статистик = 1 бол Нэмэлт мэдээлэлгарч ирэх бөгөөд хэрэв Статистик = 0 бол тэгшитгэлийн параметрүүдийн зөвхөн тооцооллыг харуулна.

Товчлуур дээр дарна уу БОЛЖ БАЙНА УУ;

Зураг 3 LINEST аргументуудын харилцах цонх

6) Сонгосон хэсгийн зүүн дээд нүдэнд эцсийн хүснэгтийн эхний элемент гарч ирнэ. Хүснэгтийг бүхэлд нь томруулахын тулд товчлуурыг дарна уу дараа нь гарын товчлол дээр дарна уу ++ .

Нэмэлт регрессийн статистикийг дараах схемд үзүүлсэн дарааллаар гаргана.

Коэффициентийн утга b Коэффициентийн утга a
b стандарт алдаа стандарт алдаа a
стандарт алдаа y
F-статистик
Квадратуудын регрессийн нийлбэр

Зураг 4 LINEST функцийг тооцоолсны үр дүн

Бид регрессийн тэгшитгэлийг авсан:

Бид дүгнэж байна: Нэг хүнд ногдох амьжиргааны доод хэмжээг 1 рубльээр нэмэгдүүлэв. өдрийн дундаж цалин дунджаар 0.92 рубль нэмэгддэг.

52% хэлбэлзэлтэй гэсэн үг цалин(y) нь х хүчин зүйлийн хэлбэлзэлтэй - нэг хүнд ногдох амьжиргааны доод түвшин, 48% - загварт ороогүй бусад хүчин зүйлсийн нөлөөгөөр тайлбарлагддаг.

Тооцоолсон тодорхойлох коэффициентийн дагуу корреляцийн коэффициентийг тооцоолох боломжтой. .

Харилцааг ойр дотно гэж үнэлдэг.

4. Уян хатан байдлын дундаж (ерөнхий) коэффициентийг ашиглан бид үр дүнд үзүүлэх хүчин зүйлийн нөлөөллийн хүчийг тодорхойлно.

Шулуун шугамын тэгшитгэлийн хувьд дундаж (ерөнхий) уян хатан байдлын коэффициентийг дараах томъёогоор тодорхойлно.

Бид x утгатай нүднүүдийн талбайг сонгоод дундаж утгыг олно Томъёо / Автомат / Дундаж, мөн y-ийн утгуудтай ижил зүйлийг хий.

Зураг 5 Функц ба аргументийн дундаж утгыг тооцоолох

Тэгэхээр нэг хүнд ногдох амьжиргааны доод түвшин дундаж утгаасаа 1%-иар өөрчлөгдвөл өдрийн дундаж цалин дунджаар 0.51%-иар өөрчлөгдөнө.

Өгөгдлийн шинжилгээний хэрэгсэл ашиглах Регрессболомжтой:
- регрессийн статистикийн үр дүн,
- тархалтын шинжилгээний үр дүн,
- итгэлцлийн интервалын үр дүн,
- үлдэгдэл ба регрессийн шугамын тохирох графикууд,
- үлдэгдэл ба хэвийн магадлал.

Уг процедур нь дараах байдалтай байна.

1) хандалтыг шалгах Шинжилгээний багц. Үндсэн цэсэнд дарааллаар сонгоно уу: Файл / Тохиргоо / Нэмэлтүүд.

2) Унах Хяналтзүйл сонгох Excel нэмэлтүүдболон товчийг дарна уу Яв.

3) Цонхонд нэмэлтүүдхайрцгийг шалгана уу Шинжилгээний багц, дараа нь товчийг дарна уу БОЛЖ БАЙНА УУ.

Хэрвээ Шинжилгээний багцталбарын жагсаалтад байхгүй Боломжтой нэмэлтүүд, товчийг дарна уу Хяналтхайх.

Хэрэв танд анализын багц таны компьютер дээр суулгаагүй гэсэн мессеж ирсэн бол товшино уу Тиймээсуулгахын тулд.

4) Үндсэн цэсэнд дарааллаар сонгоно уу: Өгөгдөл / Өгөгдлийн шинжилгээ / Шинжилгээний хэрэгсэл / Регресс, дараа нь товчийг дарна уу БОЛЖ БАЙНА УУ.

5) Мэдээлэл оруулах, гаргах сонголтуудын харилцах цонхыг бөглөнө үү:

Оролтын интервал Y- үр дүнтэй шинж чанарын өгөгдлийг агуулсан хүрээ;

Оролтын интервал X- хүчин зүйлийн шинж чанарын өгөгдлийг агуулсан муж;

Шошго- эхний мөрөнд баганын нэр орсон эсэхийг харуулсан туг;

Тогтмол - тэг- тэгшитгэлд чөлөөт нэр томъёо байгаа эсвэл байхгүй байгааг харуулсан туг;

гаралтын интервал- ирээдүйн хүрээний зүүн дээд нүдийг зааж өгөхөд хангалттай;

6) Шинэ ажлын хуудас - та шинэ хуудсанд дурын нэрийг тохируулж болно.

Дараа нь товчлуурыг дар БОЛЖ БАЙНА УУ.

Зураг 6 Регрессийн хэрэгслийн параметрүүдийг оруулах харилцах цонх

Асуудлын өгөгдлийн регрессийн шинжилгээний үр дүнг Зураг 7-д үзүүлэв.

Зураг 7 Регрессийн хэрэглүүрийг хэрэглэсний үр дүн

5. Ойролцоо дундаж алдааг ашиглан тэгшитгэлийн чанарыг тооцоолъё. Зураг 8-д үзүүлсэн регрессийн шинжилгээний үр дүнг ашиглая.

Зураг 8 "Үлдэгдэл дүгнэлт" регрессийн хэрэглүүрийг хэрэглэсний үр дүн

Зохиоцгооё шинэ ширээЗураг 9-д үзүүлсэн шиг. C баганад бид харьцангуй ойртсон алдааг томъёогоор тооцоолно.

Зураг 9 Дундаж ойролцоолсон алдааны тооцоо

Дундаж алдааОйролцоогоор дараах томъёогоор тооцоолно.

Баригдсан загварын чанарыг сайн гэж үнэлдэг, учир нь энэ нь 8-10% -иас хэтрэхгүй байна.

6. Хүснэгтээс регрессийн статистик(Зураг 4) Фишерийн F шалгуурын бодит утгыг бичье.

Учир нь 5% -ийн ач холбогдлын түвшинд, дараа нь бид регрессийн тэгшитгэл чухал ач холбогдолтой гэж дүгнэж болно (харилцаа нь батлагдсан).

8. Тооцоолох статистикийн ач холбогдолрегрессийн параметрүүдийг Стьюдентийн t-статистикийг ашиглан, тооцоолох замаар гүйцэтгэнэ итгэлийн интервалүзүүлэлт бүр.

Үзүүлэлтүүдийн тэгээс статистикийн хувьд ач холбогдолгүй зөрүүтэй H 0 таамаглалыг бид дэвшүүлэв.

.

эрх чөлөөний зэрэглэлийн тооны хувьд

Зураг 7-д t-статистикийн бодит утгууд байна:

Корреляцийн коэффициентийн t тестийг хоёр аргаар тооцоолж болно.

Би арга:

хаана - корреляцийн коэффициентийн санамсаргүй алдаа.

Бид 7-р зураг дээрх хүснэгтээс тооцооллын өгөгдлийг авдаг.

II арга:

Бодит t-статистикийн утгууд нь хүснэгтийн утгуудаас илүү байна:

Тиймээс H 0 таамаглалыг үгүйсгэсэн, өөрөөр хэлбэл регрессийн параметрүүд болон корреляцийн коэффициент нь тэгээс санамсаргүй байдлаар ялгаатай биш, харин статистикийн хувьд чухал ач холбогдолтой юм.

a параметрийн итгэлийн интервалыг дараах байдлаар тодорхойлно

a параметрийн хувьд Зураг 7-д үзүүлсэн 95%-ийн хязгаар нь:

Регрессийн коэффициентийн итгэлцлийн интервалыг дараах байдлаар тодорхойлно

Регрессийн коэффициент b-ийн хувьд Зураг 7-д үзүүлсэн 95%-ийн хязгаар нь:

Итгэлийн интервалын дээд ба доод хязгаарт дүн шинжилгээ хийх нь магадлал өндөртэй гэсэн дүгнэлтэд хүргэдэг. a ба b параметрүүд нь заасан хил хязгаарт багтах тул тэг утгыг авахгүй, өөрөөр хэлбэл. статистикийн хувьд ач холбогдолгүй бөгөөд тэгээс мэдэгдэхүйц ялгаатай байна.

7. Регрессийн тэгшитгэлийн олж авсан тооцоолол нь үүнийг урьдчилан таамаглахад ашиглах боломжийг бидэнд олгодог. Хэрэв амьжиргааны доод түвшний урьдчилсан тооцоолсон үнэ цэнэ нь:

Дараа нь амьжиргааны доод түвшингийн таамагласан үнэ цэнэ нь:

Бид урьдчилан таамаглах алдааг томъёогоор тооцоолно.

хаана

Бид мөн Excel PPP ашиглан зөрүүг тооцдог. Үүний тулд:

1) Идэвхжүүлэх Функцийн мастер: үндсэн цэснээс сонгоно уу Томъёо / Оруулах функц.

3) Хүчин зүйлийн шинж чанарын тоон өгөгдлийг агуулсан мужийг бөглөнө үү. дарна уу БОЛЖ БАЙНА УУ.

Зураг 10 Вариацын тооцоо

Зөрчлийн утгыг авна уу

Эрх чөлөөний нэг градусын үлдэгдэл дисперсийг тооцоолохдоо бид 7-р зурагт үзүүлсэн дисперсийн шинжилгээний үр дүнг ашиглана.

0.95 магадлал бүхий y-ийн бие даасан утгыг урьдчилан таамаглах итгэлцлийн интервалыг дараах илэрхийллээр тодорхойлно.

Интервал нь нэлээд өргөн бөгөөд энэ нь юуны түрүүнд ажиглалтын хэмжээ багатай холбоотой юм. Ерөнхийдөө сарын дундаж цалингийн биелсэн таамаг найдвартай болсон.

Асуудлын нөхцөлийг дараахаас авав: Эконометрикийн семинар: Прок. тэтгэмж / I.I. Елисеева, С.В. Курышева, Н.М. Гордеенко болон бусад; Эд. I.I. Елисеева. - М.: Санхүү, статистик, 2003. - 192 х.: өвчтэй.

Хувь хүний ​​регрессийн коэффициентүүд тэгтэй тэнцүү байх тухай H 0 таамаглалыг (H 1 хувилбар нь тэнцүү биш) b=0.05 ач холбогдлын түвшинд шалгая.

Хэрэв гол таамаглал худал бол бид өөр хувилбарыг хүлээн авна. Энэхүү таамаглалыг шалгахын тулд Стьюдентын t-тестийг ашигладаг.

Ажиглалтын өгөгдлөөс олдсон t-тестийн утгыг (үүнийг ажиглагдсан эсвэл бодит гэж нэрлэдэг) Оюутны хуваарилалтын хүснэгтээс (ихэвчлэн статистик эсвэл эконометрикийн сурах бичиг, семинарын төгсгөлд өгдөг) тодорхойлсон хүснэгтийн (чухал) утгатай харьцуулна. ).

Хүснэгтийн утгашугаман хос регрессийн хувьд (n-2), n нь ажиглалтын тоотой тэнцүү байх ач холбогдлын түвшин (b) ба чөлөөт байдлын зэрэгээс хамаарч тодорхойлогддог.

Хэрэв t-шалгуурын бодит утга нь хүснэгтийн утгаас (модуль) их байвал үндсэн таамаглалыг үгүйсгэж (1-b) магадлалаар параметр эсвэл статистик шинж чанар in хүн амтэгээс эрс ялгаатай.

Хэрэв t-шалгуурын бодит утга нь хүснэгтээс бага байвал (модулаар) үндсэн таамаглалыг үгүйсгэх шалтгаан байхгүй, өөрөөр хэлбэл. ерөнхий популяци дахь параметр эсвэл статистик шинж чанар нь b-ийн ач холбогдлын түвшинд тэгээс мэдэгдэхүйц ялгаатай биш юм.

t crit (n-m-1;b/2) = (30;0.025) = 2.042

1.7-с хойш< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в Энэ тохиолдолд b коэффициентийг үл тоомсорлож болно.

0.56-аас хойш< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

Регрессийн тэгшитгэлийн коэффициентүүдийн итгэлийн интервал.

Регрессийн коэффициентүүдийн итгэлцлийн интервалыг 95% найдвартайгаар дараах байдлаар тодорхойлно.

  • (b - t crit S b; b + t crit S b)
  • (0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
  • (-0.13;1.41)

0 (тэг) цэг нь итгэлцлийн интервалд оршдог тул b коэффициентийн интервалын үнэлгээ нь статистикийн хувьд чухал биш юм.

  • (a - t crit S a; a + t crit S a)
  • (24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
  • (-65.79;114.91)

95% -ийн магадлалаар энэ параметрийн утга нь олсон интервалд байх болно гэж маргаж болно.

0 (тэг) цэг нь итгэлцлийн интервалд оршдог тул a коэффициентийн интервалын үнэлгээ нь статистикийн хувьд ач холбогдолгүй юм.

2) F-статистик. Фишерийн шалгуур.

Тодорхойлолтын коэффициент R 2 нь шугаман регрессийн тэгшитгэлийн ач холбогдлыг бүхэлд нь шалгахад ашиглагддаг.

Регрессийн загварын ач холбогдлыг Фишерийн F-тестийг ашиглан шалгадаг бөгөөд тооцоолсон утгыг судалж буй үзүүлэлтийн ажиглалтын эхний цувралын дисперсийн харьцаа ба үлдэгдэл дарааллын хэлбэлзлийн шударга бус үнэлгээний харьцаагаар олдог. энэ загвар.

Хэрэв k 1 =(m) ба k 2 =(n-m-1) чөлөөт зэрэгтэй тооцоолсон утга нь өгөгдсөн ач холбогдлын түвшинд хүснэгтийн утгаас их байвал загварыг чухал гэж үзнэ.

энд m нь загвар дахь хүчин зүйлийн тоо.

Хосолсон шугаман регрессийн статистикийн ач холбогдлын үнэлгээг дараах алгоритмын дагуу гүйцэтгэнэ.

  • 1. Тэгшитгэл бүхэлдээ статистикийн хувьд ач холбогдолгүй гэсэн тэг таамаглал дэвшүүлсэн: H 0: R 2 =0 ач холбогдлын түвшинд b.
  • 2. Дараа нь F-шалгуурын бодит утгыг тодорхойлно:

Энд m=1 хос регрессийн хувьд.

3. Квадратуудын нийт нийлбэр (илүү их хэлбэлзэл)-ийн чөлөөт байдлын зэрэг нь 1, үлдэгдэл нийлбэрийн чөлөөт байдлын зэрэг нь 1 байна гэдгийг харгалзан хүснэгтийн утгыг Фишерийн хуваарилалтын хүснэгтээс тухайн ач холбогдлын түвшингээр тодорхойлно. шугаман регрессийн квадратууд (бага дисперс) n-2 байна.

F хүснэгт нь нөлөөнд байгаа шалгуур үзүүлэлтийн хамгийн их боломжит утга юм санамсаргүй хүчин зүйлүүдөгөгдсөн эрх чөлөө, ач холбогдлын түвшин b. Ач холбогдолын түвшин b - үнэн бол зөв таамаглалыг үгүйсгэх магадлал. Ихэвчлэн b-ийг 0.05 эсвэл 0.01-тэй тэнцүү авдаг.

4. Хэрэв F-шалгуурын бодит утга нь хүснэгтийн утгаас бага байвал тэг таамаглалыг үгүйсгэх шалтгаан байхгүй гэж тэд хэлэв.

Үгүй бол тэг таамаглалыг үгүйсгэж (1-b) магадлалаар тэгшитгэлийн статистик ач холбогдлын талаархи өөр таамаглалыг бүхэлд нь хүлээн авна.

Эрх чөлөөний зэрэгтэй шалгуур үзүүлэлтийн хүснэгтийн утга k 1 \u003d 1 ба k 2 \u003d 30, F хүснэгт \u003d 4.17

F-ийн бодит утгаас хойш< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Фишерийн F-тест ба Студентийн t-статистикийн хоорондын хамаарлыг тэгшитгэлээр илэрхийлнэ.

Регрессийн тэгшитгэлийн чанарын үзүүлэлтүүд.

Үлдэгдэлийн автокорреляцийг шалгана уу.

LSM ашиглан чанарын регрессийн загварыг бий болгох чухал урьдчилсан нөхцөл бол бусад бүх ажиглалтын хазайлтын утгуудаас санамсаргүй хазайлтын утгуудын бие даасан байдал юм. Энэ нь аливаа хазайлт, ялангуяа зэргэлдээх хазайлтын хооронд ямар ч хамаарал байхгүй гэдгийг баталгаажуулдаг.

Автокорреляци (цуваа хамаарал) нь цаг хугацаанд (цаг хугацааны цуваа) эсвэл орон зайд (хөндлөн цуваа) эрэмблэгдсэн ажиглагдсан үзүүлэлтүүдийн хоорондын хамаарлыг хэлнэ. Үлдэгдлийн автокорреляци (хачирхалт) нь ихэвчлэн олддог регрессийн шинжилгээхугацааны цувааны өгөгдлийг ашиглах үед, хөндлөн огтлолын өгөгдлийг ашиглах үед маш ховор байдаг.

AT эдийн засгийн даалгаварэерэг автокорреляци нь сөрөг автокорреляциас хамаагүй түгээмэл байдаг. Ихэнх тохиолдолд эерэг автокорреляци нь чиглэлтэй холбоотой байдаг байнгын нөлөөлөлзагварт харгалзаагүй зарим хүчин зүйл.

Сөрөг автокорреляци гэдэг нь үнэн хэрэгтээ эерэг хазайлтыг сөрөг, эсрэгээр нь дагаж мөрддөг гэсэн үг юм. Улирлын мэдээгээр (өвөл-зун) ундааны эрэлт, орлогын ижил хамаарлыг авч үзвэл ийм нөхцөл байдал үүсч болно.

Автокорреляцийн гол шалтгаануудын дунд дараахь зүйлс орно.

  • 1. Тодорхойлолтын алдаа. Загвар дахь ямар нэгэн чухал тайлбарлагч хувьсагчийг тооцохгүй байх, эсвэл буруу сонголтхамаарлын хэлбэрүүд нь ихэвчлэн регрессийн шугамаас ажиглалтын цэгүүдийн системийн хазайлтад хүргэдэг бөгөөд энэ нь автокорреляцид хүргэдэг.
  • 2. Инерци. Эдийн засгийн олон үзүүлэлтүүд (инфляци, ажилгүйдэл, ҮНБ гэх мэт) бизнесийн үйл ажиллагааны хэлбэлзэлтэй холбоотой тодорхой мөчлөгтэй байдаг. Тиймээс индикаторуудын өөрчлөлт нь тэр даруй тохиолддоггүй, гэхдээ тодорхой инерцтэй байдаг.
  • 3. Вэб эффект. Аж үйлдвэрийн болон бусад олон салбарт эдийн засгийн үзүүлэлтүүд өөрчлөлтөд хариу үйлдэл үзүүлдэг эдийн засгийн нөхцөл байдалсааталтай (цаг хугацааны хоцрогдол).
  • 4. Өгөгдлийг жигд болгох. Ихэнх тохиолдолд тодорхой урт хугацааны өгөгдлийг түүний бүрдүүлэгч интервалаар дундажлан авах замаар олж авдаг. Энэ нь авч үзэж буй хугацаанд үүссэн хэлбэлзлийг тодорхой жигдрүүлж, улмаар автокорреляцийг үүсгэж болзошгүй юм.

Автокорреляцийн үр дагавар нь гетероскедастикийн үр дагавартай төстэй: регрессийн коэффициент ба детерминацийн коэффициентийн ач холбогдлыг тодорхойлдог t- ба F-статистикийн дүгнэлт буруу байж болно.


Эмпирик регрессийн коэффициент b 0 , b 1-ийг MS Excel хүснэгтийн процессорын "Өгөгдлийн шинжилгээ" нэмэлтийн "Регресс" хэрэглүүрийг ашиглан тодорхойлно.

Коэффициентийг тодорхойлох алгоритм нь дараах байдалтай байна.

1. MS Excel-ийн хүснэгтэнд эхний өгөгдлийг оруулна.

2. Өгөгдлийн шинжилгээний нэмэлтийг дууд (Зураг 2).

3. Регрессийн шинжилгээний хэрэглүүрийг сонгоно (Зураг 3).

4. Регрессийн цонхны харгалзах байрлалуудыг бөглөнө (Зураг 4).

5. Регрессийн цонхны OK товчийг дараад асуудлыг шийдвэрлэх протоколыг авна уу (Зураг 5)


Зураг 3 - Регрессийн хэрэглүүрийг сонгох




Зураг 4 - Цонхны регресс

Зураг 5 - Асуудлыг шийдвэрлэх протокол

Зураг 5-аас эмпирик регрессийн коэффициентүүд нь тэнцүү байгааг харуулж байна

b 0 = 223,

b 1 = 0.0088.

Дараа нь сарын тэтгэврийн y-ийн утгыг амьжиргааны доод түвшний утгатай холбосон хос шугаман регрессийн тэгшитгэл нь дараах хэлбэртэй байна.

.(3.2)

Цаашилбал, даалгаврын дагуу амьжиргааны доод түвшин х, сарын тэтгэврийн у хоорондын статистик харилцааны нягт байдлыг үнэлэх шаардлагатай. Энэ тооцоог корреляцийн коэффициент ашиглан хийж болно. 5-р зураг дээрх энэ коэффициентийн утгыг олон тооны R гэж тодорхойлсон бөгөөд 0.038-тай тэнцүү байна. Онолын хувьд үнэ цэнэ өгөгдсөн коэффициент-1-ээс +1-ийн хооронд байгаа бол амьжиргааны доод хэмжээ x ба сарын тэтгэврийн y хоорондын статистик хамаарал тийм ч чухал биш гэж дүгнэж болно.

5-р зурагт үзүүлсэн "R - квадрат" параметр нь корреляцийн коэффициентийн квадрат бөгөөд детерминацийн коэффициент гэж нэрлэгддэг. Энэ коэффициентийн утга нь регрессээр (тайлбарлах хувьсагч x) тайлбарласан хамааралтай y хэмжигдэхүүний дисперсийн эзлэх хувийг тодорхойлдог. Үүний дагуу 1-ийн утга нь эконометрик загварт тооцогдоогүй бусад бүх тайлбарлагч хувьсагчдын нөлөөллөөс үүссэн y хувьсагчийн дисперсийн эзлэх хувийг тодорхойлдог. Үүссэн эконометрик загварт харгалзаагүй бүх тайлбарлагч хувьсагчдын эзлэх хувь ойролцоогоор 1-0,00145 = 0,998 буюу 99,8% байгааг Зураг 5-аас харж болно.



Дээр дараагийн алхам, даалгаврын дагуу уян хатан байдлын коэффициентийг ашиглан тайлбарлагч х хувьсагч ба хамааралтай хувьсагч у хоёрын хоорондох холболтын зэргийг тодорхойлох шаардлагатай. Хосолсон шугаман регрессийн загварын уян хатан байдлын коэффициентийг дараах байдлаар тодорхойлно.

Тиймээс амьжиргааны доод хэмжээ 1%-иар өөрчлөгдөхөд сарын тэтгэвэр 0.000758%-иар өөрчлөгддөг.

. (3.4)

Үүнийг хийхийн тулд бид анхны хүснэгт 1-ийг хоёр баганаар нэмж оруулсан бөгөөд үүнд хамаарал (3.2) ба зөрүүний утгыг ашиглан тооцоолсон утгыг тодорхойлно.

Хүснэгт 3.2. Ойролцоо дундаж алдааны тооцоо.

Дараа нь дундаж ойролцоо алдаа нь тэнцүү байна

.

Ойролцоогоор дундаж алдааны утга нь (12 ... 15)% -иас хэтрэхгүй байх ёстой гэдгийг практикт мэддэг.

Дээр сүүлчийн алхам F - Фишерийн шалгуурыг ашиглан загварчлалын статистикийн найдвартай байдлыг үнэлье. Үүнийг хийхийн тулд бид дараах нөхцлийн дагуу олж авсан регрессийн тэгшитгэлийн статистик ач холбогдолгүй байдлын талаархи H 0 тэг таамаглалыг шалгана.

хэрэв өгөгдсөн ач холбогдлын түвшинд a = 0.05 бол F-шалгуурын онолын (тооцсон) утга нь F крит (хүснэгт)-ээс их байвал тэг таамаглалыг үгүйсгэж, үр дүнд нь гарсан регрессийн тэгшитгэлийг авна. чухал ач холбогдолтой.

Зураг 5-аас харахад Fcalc = 0.0058 байна. F-шалгуурын чухал утгыг FDISP статистик функцийг ашиглан тодорхойлно (Зураг 6). Оролтын параметрүүдфункц нь ач холбогдлын түвшин (магадлал) ба эрх чөлөөний зэрэглэлийн тоо 1 ба 2. Хосолсон регрессийн загварын хувьд эрх чөлөөний зэрэг нь 1 (нэг тайлбарлагч хувьсагч) ба n-2 = 6-2 тэнцүү байна. =4.



Зураг 6 - FDISP статистик функцийн цонх

Зураг 6-аас харахад F-шалгуурын эгзэгтэй утга 7.71 байна.

F тооцсоноос хойш< F крит, то нулевая гипотеза не отвергается и полученное регрессийн тэгшитгэлстатистикийн хувьд ач холбогдолгүй.

13. Загварын барилга олон регресс EXCEL ашиглан.

Даалгаврын сонголтын дагуу статистикийн материалыг ашиглах шаардлагатай.

1. барих шугаман тэгшитгэлтүүний параметрүүдийн эдийн засгийн утгыг тайлбарлах олон регресс.

2. Уян хатан байдлын дундаж (ерөнхий) коэффициентийг ашиглан бүтээмжийн шинж чанартай хүчин зүйлсийн хамаарлын ойролцоо байдлын харьцуулсан үнэлгээ өгөх.

3. Регрессийн коэффициентүүдийн статистикийн ач холбогдлыг Student's t тест, F тест ашиглан тэгшитгэлийн ач холбогдлын талаарх тэг таамаглалыг ашиглан үнэлнэ.

4. Ойролцоо дундаж алдааг тодорхойлох замаар тэгшитгэлийн чанарыг үнэлнэ.

Хосолсон регрессийн загварыг бий болгох анхны өгөгдлийг Хүснэгт 3.3-т үзүүлэв.

Хүснэгт 3.3. Анхны өгөгдөл.

Цэвэр орлого, сая ам Хөрөнгийн эргэлт, мл. ам.доллар, х 1 Ашигласан капитал, мл. ам.доллар, х 2
6,6 6,9 83,6
2,7 93,6 25,4
1,6 10,0 6,4
2,4 31,5 12,5
3,3 36,7 14,3
1,8 13,8 6,5
2,4 64,8 22,7
1,6 30,4 15,8
1,4 12,1 9,3
0,9 31,3 18,9

Регрессийн тэгшитгэлийг бүтээх технологи нь 3.1-д заасан алгоритмтай төстэй. Регрессийн тэгшитгэлийг байгуулах протоколыг Зураг 7-д үзүүлэв.

ҮР ДҮН
Регрессийн статистик
Олон Р 0,901759207
R-дөрвөлжин 0,813169667
Нормчилсан R квадрат 0,759789572
стандарт алдаа 0,789962026
Ажиглалт
Вариацын шинжилгээ
df MS Ф
Регресс 9,50635999 15,23357468
Үлдэгдэл 0,624040003
Нийт
Магадлал t-статистик
Y уулзвар 1,113140304 2,270238114
Хувьсагч X 1 -0,000592199 -0,061275574
Хувьсагч X 2 0,063902851 5,496523193

Зураг 7. Үр дүнгийн гаралт.

Бидний сонирхож буй тоо хэмжээний бодит утга нь регрессийн тэгшитгэлээр тооцоолсон хэмжээнээс ялгаатай байна. Энэ ялгаа бага байх тусам тооцоолсон утгууд нь эмпирик өгөгдөлд ойртох болно илүү чанартайзагварууд. Ажиглалт бүрийн хувьд хувьсагчийн бодит болон тооцоолсон утгуудын хазайлтын хэмжээ нь ойролцоолсон алдаа юм. Хазайлт нь эерэг ба сөрөг аль аль нь байж болох тул ажиглалт бүрийн ойролцоох алдааг модулийн хувиар тодорхойлох нь заншилтай байдаг.

Хазайлт () нь үнэмлэхүй ойролцоо алдаа гэж тооцогддог бөгөөд дараа нь - харьцангуй алдааойролцоо тооцоолол.

Ойролцооны дундаж алдааг арифметик дундажаар тодорхойлно. . Заримдаа тэд дундаж ойролцоо алдааны тодорхойлолтыг ашигладаг бөгөөд энэ нь .

Ажлын төгсгөл -

Энэ сэдэв нь:

Эконометрик

Сайтын сайт дээрээс уншина уу: эдийн засгийн мэргэжлүүд ..

Хэрэв чамд хэрэгтэй бол нэмэлт материалЭнэ сэдвээр, эсвэл та хайж байсан зүйлээ олсонгүй бол манай ажлын мэдээллийн сангаас хайлтыг ашиглахыг зөвлөж байна.

Хүлээн авсан материалыг бид юу хийх вэ:

Хэрэв энэ материал танд хэрэгтэй болсон бол та үүнийг нийгмийн сүлжээн дэх хуудсандаа хадгалах боломжтой.

Энэ хэсгийн бүх сэдвүүд:

Анхны мэдээллийн бүрдэл
үндсэн суурь суурь мэдээлэлэконометрикийн судалгаа, статистик мэдээлэл эсвэл өгөгдөлд зориулагдсан нягтлан бодох бүртгэл. Эконометрикийн судалдаг харилцаа нь стохастик шинж чанартай байдаг, өөрөөр хэлбэл.

Лагранжийн интерполяцийн олон гишүүнт
Х ба у хоёрын хооронд y = f(x) хамаарал байг, үүний тулд бид бие даасан цэгүүдийг мэддэг (xi, yi), i = 0,1,2,...,

Тохиолдол 1
Нэг цэгээр (x0, y0) y = y0+b(x-x0) (2.1) (мөн босоо шугам) бүхий харандаагаар зурж болно.

Тохиолдол 2
Хоёр ялгаатай цэгээр (x0,y0), (x1,y1) нэг бөгөөд зөвхөн нэг шулуун шугам байна. Хэрэв x0 ¹

Тохиолдол 3
Хоёрдугаар зэргийн олон гишүүнт ( квадрат функц), график нь гурван цэгээр дамждаг (x0,y0), (x1,y1), (x2)

Кейс n.
График нь n+1 (xi,yi), i=0,1,2,…,n цэгээр дамждаг n-р зэргийн Лагранжийн интерполяцийн олон гишүүнтийг дараах байдлаар бичиж болох нь одоо тодорхой боллоо.

Хосолсон шугаман регресс. Хамгийн бага квадрат арга
n хос тоо (xi, yi), i=1,2,…,n байг, тэдгээрийн хувьд тэдгээр нь x ба y-ийн хоорондох шугаман хамааралд тохирно гэж үздэг.

Олон шугаман регресс
Судалгааны объектод нөлөөлж буй бусад хүчин зүйлийн нөлөөллийг үл тоомсорлож чадвал хос регресс нь загварчлалд сайн үр дүнг өгч чадна. Гэхдээ ихэвчлэн хэд хэдэн байдаг

Шугаман бус загварууд
Бид аргын хэрэглээг судалсан хамгийн бага квадратуудфункциональ хамааралд орсон параметрүүдийг шугаман аргаар тодорхойлох. Тиймээс тэдний хувьд 3, 4-р зүйлд бид системийг олж авсан

Эконометрийн тэгшитгэлийн системүүд
обьект статистик судалгаанийгэм-эдийн засгийн шинжлэх ухаанд байдаг нарийн төвөгтэй системүүд. Хувьсагчдын хоорондын харилцааны нягтыг хэмжих, тусгаарлагдсан регрессийн тэгшитгэлийг бий болгох

Цагийн цувааны бүрэлдэхүүн хэсгүүд
Хугацааны цуврал x(t) нь цаг хугацааны t цэгүүдийн дараалалд харгалзах x утгуудын багц юм, өөрөөр хэлбэл. нь ихэвчлэн авч үздэг t®x(t) функц юм

Хугацааны цувааны бүрэлдэхүүн хэсгүүдийг тодорхойлох
Хугацааны цувааны чиг хандлагыг загварчлах хамгийн түгээмэл аргуудын нэг бол график зурах явдал юм аналитик функцдараалсан утгуудын хамаарлыг тодорхойлдог

Энэ тохиолдолд ak, bk коэффициентүүд тэнцүү байх болно
Хэрэв функц x (t) тэгш бол, i.e. x (-t) = x (t) тэгш байдал биелнэ, дараа нь in

Хугацааны цуваа нь санамсаргүй процесс
Эдийн засгийн үзүүлэлтийн утгыг x(t) ямар ч үед t гэж үзье санамсаргүй хувьсагч X(t). Ингэж бодъё

ARIMA загварууд
Эконометрикийн хувьд спектрийн нягтын тооцоолол (спектр анализ) ашиглан цаг хугацааны цувралын шинжилгээ нь ихэвчлэн туслах үүрэг гүйцэтгэдэг бөгөөд шинж чанарын үеийг тогтооход тусалдаг.

Улирлын чанартай бүрэлдэхүүн хэсгүүдийн нягтлан бодох бүртгэл
Хугацааны цувааны үечилсэн (улирлын) бүрэлдэхүүн хэсгүүдийг харгалзан үзэх боломжийг олгодог ARIMA загварын ерөнхий дүгнэлтийг Ж.Бокс, Г.Женкинс нар санал болгосон. Энэ аргыг системд хэрэгжүүлдэг

Анхны мэдээллийн алдааны шинжилгээ
Үнэ цэнэ эдийн засгийн үзүүлэлтүүдихэвчлэн алдаатай, алдаатай мэдэгддэг. Алдаа, хэмжилтийн алдаа агуулсан өгөгдлийг боловсруулах үндсэн дүрмийг авч үзье. Идээ

Итгэлийн интервалууд
Санамсаргүй хэмжигдэхүүнийг танилцуулъя. (13.1) h-н улмаас xОN(0,1) гэдгийг шалгахад хялбар

Алдааг тооцоолох
Эмпирик өгөгдөл нь ихэвчлэн математик боловсруулалтанд хамрагддаг - зарим тохиолдолд нэмэх, хасах, үржүүлэх, хуваах арифметик үйлдлүүд хийгддэг.

Тодорхойлох коэффициент
Детерминацийн коэффициент нь регрессийн загварын чанарыг тодорхойлдог. Үнэ цэнэ янз бүрийн хэмжээтэй, авах

Хамгийн их магадлалын зарчим. Гетероскедастик алдаатай регрессийн загварыг бий болгох
агуулсан хэмжилтийн үр дүнгээс үл мэдэгдэх хэмжигдэхүүнийг олох санамсаргүй алдаа, нь хамгийн бага квадратын арга (LSM). Тодорхойлох хэмжигдэхүүнүүд нь ихэвчлэн үүссэн тэгшитгэлээр холбогддог

Статистикийн таамаглал
Өмнөх догол мөрүүдэд эдийн засгийн үзүүлэлтүүд болон үйл явцын хамаарлыг загварчлах аргачлалыг авч үзсэн. Энэ холболтыг олж авсан регрессийн тэгшитгэлийг ашиглан загварчилсан.

F - статистик
Регрессийн загварын ач холбогдлыг Фишерийн F тест ашиглан тодорхойлно. Үүний тулд харьцааг тооцоолно

T - статистик
Ач холбогдлыг үнэлэхийн тулд бие даасан параметрүүдрегрессийн загвар y=a+bx+e тэдгээрийн утгыг стандарт алдаатай харьцуулна. Энэ нь гэж нэрлэгддэг тооцооллыг хийдэг

Харилцан хамаарал ба тодорхойлох үзүүлэлтүүд

Шугаман хос регресс

Хүснэгтэнд тооцоолсон туслах өгөгдөл дээр үндэслэн. 2, бид харилцааны ойрын үзүүлэлтийг тооцдог.

Энэ үзүүлэлт нь жишээ юм шугаман коэффициентхамаарлыг томъёогоор тооцоолсон.

Корреляцийн коэффициентийг тооцоолсон үр дүнд үндэслэн хүчин зүйл болон үүсэх шинж чанарын хоорондын хамаарал шууд бөгөөд хүчтэй байна гэж дүгнэж болно (Чаддокийн хуваарийн дагуу).

Корреляцийн коэффициентийн квадратыг детерминацийн коэффициент гэж нэрлэдэг бөгөөд энэ нь хүчин зүйлийн шинж чанарын өөрчлөлтөөр тайлбарлагддаг үр дүнд бий болсон шинж чанарын өөрчлөлтийн хувь хэмжээг харуулдаг.

Ихэвчлэн тодорхойлох коэффициентийн тайлбарыг өгөхдөө үүнийг хувиар илэрхийлдэг.

R 2 \u003d 0.847 2 \u003d 0.7181

тэдгээр. тохиолдлын 71.81% -д хүчин зүйлийн шинж чанарын өөрчлөлт нь үүссэн шинж чанарыг өөрчлөхөд хүргэдэг. Регрессийн тэгшитгэлийн сонголтын нарийвчлал нэлээд өндөр байна. Y-ийн өөрчлөлтийн үлдсэн 28.19%-ийг загварт харгалзаагүй хүчин зүйлсээр тайлбарлаж байна.

Эрчим хүчний хос регресс

Хүчний хосын регрессийн үр дүн ба хүчин зүйлийн тэмдгийн хоорондын хамаарлын ойролцоо байдлыг корреляцийн коэффициент ашиглан тодорхойлно.

Мэдэгдэж буй өгөгдлийг орлуулснаар бид дараахь зүйлийг авна.

Тодорхойлох үзүүлэлт.

тэдгээр. тохиолдлын 69% -д хүчин зүйлийн шинж чанарын өөрчлөлт нь үүссэн шинж чанарыг өөрчлөхөд хүргэдэг. Регрессийн тэгшитгэлийн сонголтын нарийвчлал дундаж байна. Y-ийн өөрчлөлтийн үлдсэн 31% нь загварт харгалзаагүй хүчин зүйлүүдээр тайлбарлагддаг.

Ойролцоогоор дундаж алдаа

Шугаман хос регресс

Үнэмлэхүй ойролцоо алдааг ашиглан регрессийн тэгшитгэлийн чанарыг үнэлье. Ойролцоогоор дундаж алдаа нь тооцоолсон утгуудын бодит хэмжээнээс дундаж хазайлт юм.

Эрчим хүчний хос регресс

Ойролцоогоор дундаж алдаа нь тооцоолсон утгуудын бодит хэмжээнээс дундаж хазайлт юм.

Ойролцоогоор 5%-7%-ийн алдаа байгааг харуулж байна сайн сонголтанхны өгөгдөлд регрессийн тэгшитгэл.

Алдаа нь 7% -иас их байгаа тул энэ тэгшитгэлийг регресс болгон ашиглахыг хүсэхгүй байна.

Үр дүнгийн статистикийн найдвартай байдлыг Фишерийн F-тест ашиглан үнэлэх регрессийн загварчлал

Шугаман хос регресс

Тодорхойлолтын коэффициент R 2 нь шугаман регрессийн тэгшитгэлийн ач холбогдлыг бүхэлд нь шалгахад ашиглагддаг.

Регрессийн загварын ач холбогдлыг Фишерийн F-тестийг ашиглан шалгадаг бөгөөд тооцоолсон утгыг судалж буй үзүүлэлтийн ажиглалтын эхний цувралын дисперсийн харьцаа ба үлдэгдэл дарааллын хэлбэлзлийн шударга бус үнэлгээний харьцаагаар олдог. энэ загвар.

Хэрэв k 1 =(m) ба k 2 =(n-m-1) чөлөөт зэрэгтэй тооцоолсон утга нь өгөгдсөн ач холбогдлын түвшинд хүснэгтийн утгаас их байвал загварыг чухал гэж үзнэ.

Хосолсон шугаман регрессийн статистикийн ач холбогдлын үнэлгээг дараах алгоритмын дагуу гүйцэтгэнэ.

Энд m=1 хос регрессийн хувьд.

F >-ийн бодит утгаас хойш

Эрчим хүчний хос регресс

Шугаман хос регрессийн нэгэн адил бид чадлын хосын регрессийг тооцоолох болно

энд m нь загвар дахь хүчин зүйлийн тоо.

1. Тэгшитгэл бүхэлдээ статистикийн хувьд ач холбогдолгүй гэсэн тэг таамаглал дэвшүүлсэн: H 0: R 2 =0 ач холбогдлын түвшинд b.

2. F-шалгуурын бодит утгыг тодорхойлох:

Энд m=1 хос регрессийн хувьд.

3. Квадратуудын нийт нийлбэр (илүү их хэлбэлзэл)-ийн чөлөөт байдлын зэрэг нь 1, үлдэгдэл нийлбэрийн чөлөөт байдлын зэрэг нь 1 байна гэдгийг харгалзан хүснэгтийн утгыг Фишерийн хуваарилалтын хүснэгтээс тухайн ач холбогдлын түвшингээр тодорхойлно. шугаман регрессийн квадратууд (бага дисперс) n-2 байна.

F хүснэгт нь өгөгдсөн эрх чөлөөний зэрэг ба ач холбогдлын түвшний санамсаргүй хүчин зүйлийн нөлөөгөөр шалгуур үзүүлэлтийн байж болох хамгийн их утга юм. Ач холбогдолын түвшин b - үнэн бол зөв таамаглалыг үгүйсгэх магадлал. Ихэвчлэн b-ийг 0.05 эсвэл 0.01-тэй тэнцүү авдаг.

4. Хэрэв F-шалгуурын бодит утга нь хүснэгтийн утгаас бага байвал тэг таамаглалыг үгүйсгэх шалтгаан байхгүй гэж тэд хэлэв.

Үгүй бол тэг таамаглалыг үгүйсгэж (1-b) магадлалаар тэгшитгэлийн статистик ач холбогдлын талаархи өөр таамаглалыг бүхэлд нь хүлээн авна.

Эрх чөлөөний зэрэгтэй шалгуур үзүүлэлтийн хүснэгтийн утга:

k 1 \u003d 1 ба k 2 \u003d 8, F хүснэгт \u003d 5.32

F > F хүснэгтийн бодит утга учир детерминацийн коэффициент нь статистикийн ач холбогдолтой (регрессийн тэгшитгэлийн олсон үнэлгээ нь статистикийн хувьд найдвартай).

Шинжилгээний үр дүнд үндэслэн шугаман хос регресс ба чадлын хос регрессийн детерминацийн коэффициентүүд статистикийн хувьд чухал ач холбогдолтой гэж бид дүгнэж байна.

Шугаман хос регресс нь илүү өндөр (экспоненциал) детерминацын коэффициенттэй байдаг тул энэ нь хүчин зүйл ба үр дүнгийн шинж чанарын хоорондын хамаарлыг хангалттай дүрсэлсэн гэж бид үзэж байна.

Үүнтэй төстэй нийтлэлүүд

2022 parki48.ru. Бид хүрээ байшин барьж байна. Тохижилт. Барилга. Суурь.