Знайти помилку апроксимації. Оцінка за допомогою F-критерію Фішера статистичної надійності результатів регресійного моделювання

Перевіримо гіпотезу H 0 про рівність окремих коефіцієнтів регресії нулю (при альтернативі H 1 не дорівнює) лише на рівні значимості б=0.05.

Якщо основна гіпотеза виявиться неправильною, ми приймаємо альтернативну. Для перевірки цієї гіпотези використовується t-критерій Стьюдента.

Знайдене за даними спостережень значення t-критерію (його ще називають спостерігається або фактичним) порівнюється з табличним (критичним) значенням, що визначається за таблицями розподілу Стьюдента (які зазвичай наводяться в кінці підручників та практикумів зі статистики чи економетрики).

Табличне значеннявизначається залежно від рівня значущості (б) та числа ступенів свободи, яке у разі лінійної парної регресії дорівнює (n-2), n-число спостережень.

Якщо фактичне значення t-критерію більше табличного (за модулем), то основну гіпотезу відкидають і вважають, що з ймовірністю (1-б) параметр або статистична характеристика генеральної сукупностіЗначно відрізняється від нуля.

Якщо фактичне значення t-критерію менше табличного (за модулем), немає підстав відкидати основну гіпотезу, тобто. параметр чи статистична характеристика у генеральній сукупності незначно відрізняється від нуля за рівня значимості б.

t критий (n-m-1; б/2) = (30; 0.025) = 2.042

Оскільки 1.7< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в даному випадкукоефіцієнтом b можна знехтувати.

Оскільки 0.56< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

Довірчий інтервал коефіцієнтів рівняння регресії.

Визначимо довірчі інтервали коефіцієнтів регресії, які з надійністю 95% будуть такими:

  • (b - t крит S b; b + t крит S b)
  • (0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
  • (-0.13;1.41)

Так як точка 0 (нуль) лежить усередині довірчого інтервалу, то інтервальна оцінка коефіцієнта статистично незначна.

  • (a - t критий S a ; a + t критий S a)
  • (24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
  • (-65.79;114.91)

Імовірно, 95% можна стверджувати, що значення даного параметра будуть лежати в знайденому інтервалі.

Оскільки точка 0 (нуль) лежить усередині довірчого інтервалу, то інтервальна оцінка коефіцієнта статистично незначна.

2) F-статистика. Критерій Фішера.

Коефіцієнт детермінації R 2 використовується для перевірки суттєвості рівняння лінійної регресіїзагалом.

Перевірка значимості моделі регресії проводиться з використанням F-критерію Фішера, розрахункове значення якого перебуває як відношення дисперсії вихідного ряду спостережень показника, що вивчається, і незміщеної оцінки дисперсії залишкової послідовності для даної моделі.

Якщо розрахункове значення з k 1 =(m) і k 2 =(n-m-1) ступенями свободи більше табличного при заданому рівні значущості, модель вважається значущою.

де m – число факторів у моделі.

Оцінка статистичної значущості парної лінійної регресії проводиться у разі наступного алгоритму:

  • 1. Висувається нульова гіпотеза у тому, що рівняння загалом статистично незначимо: H 0: R 2 =0 лише на рівні значимості б.
  • 2. Далі визначають фактичне значення F-критерію:

де m=1 для парної регресії.

3. Табличне значення визначається за таблицями розподілу Фішера для заданого рівня значимості, враховуючи, що число ступенів свободи для загальної суми квадратів (більшої дисперсії) дорівнює 1 і число ступенів свободи залишкової суми квадратів (меншої дисперсії) при лінійній регресії дорівнює n-2 .

F табл – це максимально можливе значення критерію під впливом випадкових факторівпри даних ступенях свободи та рівні значущості б. Рівень значущості б - можливість відкинути правильну гіпотезу за умови, що вона вірна. Зазвичай приймається дорівнює 0,05 або 0,01.

4. Якщо фактичне значення F-критерію менше табличного, то кажуть, що немає підстав відхиляти нульову гіпотезу.

В іншому випадку, нульова гіпотеза відхиляється і з ймовірністю (1-б) приймається альтернативна гіпотеза про статистичну значущість рівняння в цілому.

Табличне значення критерію зі ступенями свободи k 1 =1 і k 2 =30 F табл = 4.17

Оскільки фактичне значення F< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Зв'язок між F-критерієм Фішера та t-статистикою Стьюдента виражається рівністю:

Показники якості рівняння регресії.

Перевірка на наявність автокореляції залишків.

Важливою причиною побудови якісної регресійної моделі МНК є незалежність значень випадкових відхилень від значень відхилень в інших спостереженнях. Це гарантує відсутність корелювання між будь-якими відхиленнями і, зокрема, між сусідніми відхиленнями.

Автокореляція (послідовна кореляція) визначається як кореляція між показниками, що спостерігаються, упорядкованими в часі (тимчасові ряди) або в просторі (перехресні ряди). Автокореляція залишків (відхилень) зазвичай трапляється у регресійному аналізі під час використання даних часових рядів і дуже рідко під час використання перехресних даних.

У економічні завданнязначно частіше трапляється позитивна автокореляція, ніж негативна автокореляція. Найчастіше позитивна автокореляція викликається спрямованим постійним впливомдеяких неврахованих у моделі факторів.

Негативна автокореляція фактично означає, що за позитивним відхиленням слідує негативне і навпаки. Така ситуація може мати місце, якщо ту саму залежність між попитом на прохолодні напої та доходами розглядати за сезонними даними (зима-літо).

Серед основних причин, що викликають автокореляцію, можна виділити такі:

  • 1. Помилки специфікації. Неврахування в моделі будь-якої важливої ​​пояснюючої змінної або неправильний вибірФорми залежності зазвичай призводять до системних відхилень точок спостереження від лінії регресії, що може зумовити автокореляцію.
  • 2. Інерція. Багато економічних показників (інфляція, безробіття, ВНП і т.д.) мають певну циклічність, пов'язану з хвилеподібністю ділової активності. Тому зміна показників відбувається не миттєво, а має певну інертність.
  • 3. Ефект павутиння. У багатьох виробничих та інших сферах економічні показники реагують зміну економічних умовіз запізненням (тимчасовим лагом).
  • 4. Згладжування даних. Найчастіше дані по деякому тривалому часовому періоду отримують усереднення даних по складових його інтервалах. Це може призвести до певного згладжування коливань, які були всередині періоду, що розглядається, що в свою чергу може бути причиною автокореляції.

Наслідки автокореляції схожі з наслідками гетероскедастичності: висновки з t- та F-статистиків, що визначають значущість коефіцієнта регресії та коефіцієнта детермінації, можливо, будуть невірними.

Для загальної оцінкиЯкість побудованої економетричної визначаються такі характеристики як коефіцієнт детермінації, індекс кореляції, середня відносна помилка апроксимації, а також перевіряється значущість рівняння регресії за допомогою F-Крітерія Фішера. Перелічені характеристики є досить універсальними і можуть застосовуватися як для лінійних, так і для нелінійних моделей, а також моделей із двома та більш факторними змінними. Визначальне значення при обчисленні всіх перерахованих характеристик якості має ряд залишків ε i, який обчислюється шляхом віднімання з фактичних (отриманих за спостереженнями) значень досліджуваної ознаки y iзначень, розрахованих за рівнянням моделі y рi.

Коефіцієнт детермінації

показує, яка частка зміни досліджуваного ознаки враховано моделі. Тобто коефіцієнт детермінації показує, яка частина зміни досліджуваної змінної може бути обчислена, виходячи зі змін включених у модель факторних змінних за допомогою обраного типу функції, що зв'язує факторні змінні та досліджувану ознаку в рівнянні моделі.

Коефіцієнт детермінації R 2може приймати значення від 0 до 1. Чим ближче коефіцієнт детермінації R 2до одиниці, тим краща якістьмоделі.

Індекс кореляції можна легко обчислити, знаючи коефіцієнт детермінації:

Індекс кореляції Rхарактеризує тісноту обраного при побудові моделі типу зв'язку між врахованими в моделі факторами та змінною, що досліджується. У разі лінійної парної регресії його значення по абсолютної величинизбігається з коефіцієнтом парної кореляції r(x, y), який ми розглянули раніше, і характеризує тісноту лінійного зв'язку між xі y. Значення індексу кореляції, очевидно, також лежать в інтервалі від 0 до 1. Чим ближче величина Rдо одиниці, тим вибраний вид функції пов'язує між собою факторні змінні і досліджуваний ознака, тим краще якість моделі.

(2.11)

виражається у відсотках та характеризує точність моделі. Прийнятна точність моделі під час вирішення практичних завдань може визначатися, з міркувань економічної доцільності з урахуванням конкретної ситуації. Широко застосовується критерій, відповідно до якого точність вважається задовільною, якщо середня відносна похибкаменше 15%. Якщо E отн.менше 5%, то кажуть, що модель має високу точність. Не рекомендується застосовувати для аналізу та прогнозу моделі з незадовільною точністю, тобто коли E отн.більше ніж 15%.

F-критерій Фішера використовується з метою оцінки значущості рівняння регресії. Розрахункове значення F-критерію визначається із співвідношення:

. (2.12)

Критичне значення F-критерія визначається за таблицями при заданому рівні значимості α і ступенях свободи (можна використовувати функцію FРАСПОБР Excel). Тут, як і раніше, m- Число факторів, врахованих в моделі, n– кількість спостережень. Якщо розрахункове значення більше критичного, то рівняння моделі визнається значущим. Чим більше розрахункове значення F-Критерію, тим краще якість моделі.

Визначимо характеристики якості збудованої нами лінійної моделі для Приклад 1. Скористаємося даними Таблиці 2. Коефіцієнт детермінації:

Отже, у межах лінійної моделі зміна обсягу продажу на 90,1% пояснюється зміною температури повітря.

Індекс кореляції

.

Значення індексу кореляції у разі парної лінійної моделі як бачимо, дійсно по модулю дорівнює коефіцієнту кореляції між відповідними змінними (обсяг продажів і температура). Оскільки отримане значення досить близько до одиниці, то можна зробити висновок про наявність тісного лінійного зв'язку між досліджуваною змінною (обсяг продажів) та факторною змінною (температура).

F-критерій Фішера

Критичне значення F крпри α = 0,1; ν 1 =1; ν 2 =7-1-1=5 дорівнює 4,06. Розрахункове значення F-Критерію більше табличного, отже, рівняння моделі є значущим.

Середня відносна помилка апроксимації

Побудована лінійна модель парної регресії має незадовільну точність (>15%), і її рекомендується використовуватиме аналізу та прогнозування.

У результаті, незважаючи на те, що більшість статистичних характеристикзадовольняють критеріям, що висуваються до них, лінійна модель парної регресії непридатна для прогнозування обсягу продажів залежно від температури повітря. Нелінійний характер залежності між зазначеними змінними за даними спостережень добре видно на Рис.1. Проведений аналіз це підтвердив.

Середня помилка апроксимації- Середнє відхилення розрахункових значень від фактичних:

Де y x – розрахункове значення за рівнянням.

Значення середньої помилкиапроксимації до 15% свідчить про добре підібрану модель рівняння.

По семи територіях Уральського районуза 199Х відомі значення двох ознак.

Потрібно:
1. Для характеристики залежності у від х розрахувати параметри наступних функцій:
а) лінійною;
б) статечної;
в) показовою;
г) рівносторонньої гіперболи (так само потрібно придумати як заздалегідь лінеаризувати цю модель).
2. Оцінити кожну модель через середню помилку апроксимаціїА СР і F-критерій Фішера.

Рішення проводимо за допомогою онлайн калькулятораЛінійне рівняння регресії.
а) лінійне рівняннярегресії;
Використання графічного методу.
Цей метод застосовують для наочного зображення форми зв'язку між досліджуваними економічними показниками. Для цього в прямокутної системикоординат будують графік, по осі ординат відкладають індивідуальні значення результативної ознаки Y, а по осі абсцис - індивідуальні значення факторної ознаки X.
Сукупність точок результативної та факторної ознак називається полем кореляції.


З поля кореляції можна висунути гіпотезу (для генеральної сукупності) у тому, що зв'язок між усіма можливими значеннями X і Y носить лінійний характер.
Лінійне рівняння регресії має вигляд y = bx + a + ε
Тут - випадкова помилка (відхилення, обурення).
Причини існування випадкової помилки:
1. Невключення до регресійної моделі значних пояснюючих змінних;
2. Агрегування змінних. Наприклад, функція сумарного споживання – це спроба загального виразусукупності рішень окремих індивідів про витрати. Це лише апроксимація окремих співвідношень, які мають різні параметри.
3. Неправильний опис структури моделі;
4. Неправильна функціональна специфікація;
5. Помилки виміру.
Оскільки відхилення ε i кожного конкретного спостереження i – випадкові та його значення у вибірці невідомі, то:
1) за спостереженнями x i та y i можна отримати лише оцінки параметрів α та β
2) Оцінками параметрів і регресійної моделі є відповідно величини а і b, які носять випадковий характер, т.к. відповідають випадковій вибірці;
Тоді оцінне рівняння регресії (побудоване за вибірковими даними) матиме вигляд y = bx + a + ε, де e i – значення (оцінки) помилок ε i , що спостерігаються, а і b відповідно оцінки параметрів α і β регресійної моделі, які слід знайти.
Для оцінки параметрів і - використовують МНК (метод найменших квадратів).




Отримуємо b = -0.35, a = 76.88
Рівняння регресії:
y = -0.35 x + 76.88

x y x 2 y 2 x y y(x) (y i -y cp) 2 (y-y(x)) 2 |y - yx |:y
45,1 68,8 2034,01 4733,44 3102,88 61,28 119,12 56,61 0,1094
59 61,2 3481 3745,44 3610,8 56,47 10,98 22,4 0,0773
57,2 59,9 3271,84 3588,01 3426,28 57,09 4,06 7,9 0,0469
61,8 56,7 3819,24 3214,89 3504,06 55,5 1,41 1,44 0,0212
58,8 55 3457,44 3025 3234 56,54 8,33 2,36 0,0279
47,2 54,3 2227,84 2948,49 2562,96 60,55 12,86 39,05 0,1151
55,2 49,3 3047,04 2430,49 2721,36 57,78 73,71 71,94 0,172
384,3 405,2 21338,41 23685,76 22162,34 405,2 230,47 201,71 0,5699

Примітка: значення y(x) знаходяться з отриманого рівняння регресії:
y(45.1) = -0.35*45.1 + 76.88 = 61.28
y(59) = -0.35 * 59 + 76.88 = 56.47
... ... ...

Помилка апроксимації
Оцінимо якість рівняння регресії за допомогою помилки абсолютної апроксимації. Середня помилка апроксимації- Середнє відхилення розрахункових значень від фактичних:

Оскільки помилка менше 15%, то дане рівняння можна використовувати як регресію.

F-статистики. Критерій Фішера.










3. Табличне значення визначається за таблицями розподілу Фішера для заданого рівня значимості, враховуючи, що число ступенів свободи для загальної суми квадратів (більшої дисперсії) дорівнює 1 і число ступенів свободи залишкової суми квадратів (меншої дисперсії) при лінійній регресії дорівнює n-2 .
4. Якщо фактичне значення F-критерію менше табличного, то кажуть, що немає підстав відхиляти нульову гіпотезу.
В іншому випадку, нульова гіпотеза відхиляється і з ймовірністю (1-α) приймається альтернативна гіпотеза про статистичну значущість рівняння в цілому.

< Fkp, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

б) статечна регресія;
Рішення проводиться за допомогою сервісу «Нелінійна регресія». При виборі вкажіть Ступінь y = ax b
в) показова регресія;
г) модель рівносторонньої гіперболи.
Система звичайних рівнянь.

Для наших даних система рівнянь має вигляд
7a + 0.1291b = 405.2
0.1291a + 0.0024b = 7.51
З першого рівняння виражаємо а і підставимо на друге рівняння
Отримуємо b = 1054.67, a = 38.44
Рівняння регресії:
y = 1054.67/x + 38.44
Помилка апроксимації.
Оцінимо якість рівняння регресії за допомогою помилки абсолютної апроксимації.

Оскільки помилка менше 15%, то дане рівняння можна використовувати як регресію.

Критерій Фішера.
Перевірка значимості моделі регресії проводиться з використанням F-критерію Фішера, розрахункове значення якого перебуває як відношення дисперсії вихідного ряду спостережень показника, що вивчається, і незміщеної оцінки дисперсії залишкової послідовності для даної моделі.
Якщо розрахункове значення з k1=(m) і k2=(n-m-1) ступенями свободи більше табличного при заданому рівні значущості, то модель вважається значущою.

де m - Число факторів в моделі.
Оцінка статистичної значущості парної лінійної регресії проводиться у разі наступного алгоритму:
1. Висувається нульова гіпотеза у тому, що рівняння загалом статистично незначимо: H 0: R 2 =0 лише на рівні значимості α.
2. Далі визначають фактичне значення F-критерію:

де m=1 для парної регресії.
Табличне значення критерію зі ступенями свободи k1=1 та k2=5, Fkp=6.61
Оскільки фактичне значення F< Fkp, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Територіями регіону наводяться дані за 200Х р.

Номер регіону Середньодушовий прожитковий мінімум на день одного працездатного, руб., х Середньоденна заробітна плата, руб., у
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

Завдання:

1. Побудуйте поле кореляції та сформулюйте гіпотезу про форму зв'язку.

2. Розрахуйте параметри рівняння лінійної регресії

4. Дайте за допомогою середнього (загального) коефіцієнта еластичності порівняльну оцінку сили зв'язку фактора із результатом.

7. Розрахуйте прогнозне значення результату, якщо прогнозне значення фактора збільшиться на 10% його середнього рівня. Визначте довірчий інтервал прогнозу рівня значущості .

Рішення:

Вирішимо це завдання за допомогою Excel.

1. Зіставивши наявні дані х і у, наприклад, ранжирувавши їх у порядку зростання фактора х, можна спостерігати наявність прямої залежності між ознаками, коли збільшення середньодушового прожиткового мінімуму збільшує середньоденну заробітну плату. Виходячи з цього, можна зробити припущення, що зв'язок між ознаками прямий і його можна описати рівнянням прямий. Той самий висновок підтверджується і основі графічного аналізу.

Щоб побудувати поле кореляції, можна скористатися ППП Excel. Введіть вихідні дані у послідовності: спочатку х, потім у.

Виділіть область клітинок, що містить дані.

Потім оберіть: Вставка / Точкова діаграма / Точкова з маркерамияк показано малюнку 1.

Малюнок 1 Побудова поля кореляції

Аналіз поля кореляції показує наявність близької прямолінійної залежності, оскільки точки розташовані практично по прямій лінії.

2. Для розрахунку параметрів рівняння лінійної регресії
скористаємося вбудованою статистичною функцією Лінейн.

Для цього:

1) Відкрийте існуючий файл, що містить дані, що аналізуються;
2) Виділіть область порожніх осередків 5×2 (5 рядків, 2 стовпці) для виведення результатів регресійної статистики.
3) Активізуйте Майстер функцій: у головному меню виберіть Формули / Вставити функцію.
4) У вікні Категоріяоберете Статистичні, у вікні функція - Лінейн. Клацніть по кнопці ОКяк показано на малюнку 2;

Малюнок 2 Діалогове вікно «Майстер функцій»

5) Заповніть аргументи функції:

Відомі значення у

Відомі значення х

Константа- логічне значення, що вказує на наявність або відсутність вільного члена в рівнянні; якщо Константа = 1, вільний член розраховується звичайним чином, якщо Константа = 0, то вільний член дорівнює 0;

Статистика- логічне значення, яке вказує, виводити додаткову інформацію щодо регресійного аналізу чи ні. Якщо Статистика = 1, то додаткова інформаціявиводиться, якщо Статистика = 0, виводяться лише оцінки параметрів рівняння.

Клацніть по кнопці ОК;

Рисунок 3 Діалогове вікно аргументів функції ЛІНІЙН

6) У лівому верхньому осередку виділеної області з'явиться перший елемент підсумкової таблиці. Щоб розкрити всю таблицю, натисніть клавішу , а потім на комбінацію клавіш ++ .

Додаткова регресійна статистика буде виводитись у порядку, зазначеному в наступній схемі:

Значення коефіцієнта b Значення коефіцієнта a
Стандартна помилка b Стандартна помилка a
Стандартна помилка y
F-статистика
Регресійна сума квадратів

Рисунок 4 Результат обчислення функції ЛІНІЙН

Набули рівняння регресії:

Робимо висновок: Зі збільшенням середньодушового прожиткового мінімуму на 1 руб. середньоденна вести збільшується загалом на 0,92 крб.

Це означає, що 52% варіації заробітної плати(у) пояснюється варіацією фактора х – середньодушового прожиткового мінімуму, а 48% – дією інших факторів, не включених до моделі.

За обчисленим коефіцієнтом детермінації можна розрахувати коефіцієнт кореляції: .

Зв'язок оцінюється як тісний.

4. За допомогою середнього (загального) коефіцієнта еластичності визначимо силу впливу фактора на результат.

Для рівняння прямий середній (загальний) коефіцієнт еластичності визначимо за такою формулою:

Середні значення знайдемо, виділивши область осередків зі значеннями х, і виберемо Формули / Автосума / Середнє, і те саме зробимо зі значеннями у.

Рисунок 5 Розрахунок середніх значень функції та аргумент

Таким чином, за зміни середньодушового прожиткового мінімуму на 1% від свого середнього значення середньоденна заробітна плата зміниться в середньому на 0,51%.

За допомогою інструмента аналізу даних Регресіяможна отримати:
- результати регресійної статистики,
- результати дисперсійного аналізу,
- результати довірчих інтервалів,
- залишки та графіки підбору лінії регресії,
- залишки та нормальну ймовірність.

Порядок дій наступний:

1) перевірте доступ до Пакету аналізу. У головному меню виберіть: Файл/Параметри/Надбудови.

2) У списку, що розкривається Управліннявиберіть пункт Надбудови Excelта натисніть кнопку Перейти.

3) У вікні Надбудовивстановіть прапорець Пакет аналізу, а потім натисніть кнопку ОК.

Якщо Пакет аналізувідсутня у списку поля Доступні надбудови, натисніть кнопку Огляд, щоб здійснити пошук.

Якщо відображається повідомлення про те, що пакет аналізу не встановлено на комп'ютері, натисніть кнопку Так, щоб встановити його.

4) У головному меню послідовно виберіть: Дані / Аналіз даних / Інструменти аналізу / Регресія, а потім натисніть кнопку ОК.

5) Заповніть діалогове вікно введення даних та параметрів виведення:

Вхідний інтервал Y- Діапазон, що містить дані результативної ознаки;

Вхідний інтервал X- Діапазон, що містить дані факторної ознаки;

Мітки- прапорець, який вказує, чи містить перший рядок назви стовпців чи ні;

Константа - нуль- Прапорець, що вказує на наявність або відсутність вільного члена у рівнянні;

Вихідний інтервал- Досить вказати ліву верхню комірку майбутнього діапазону;

6) Новий робочий лист – можна задати довільне ім'я нового листа.

Потім натисніть кнопку ОК.

Рисунок 6 Діалогове вікно введення параметрів інструменту Регресія

Результати регресійного аналізудля даних завдання представлені малюнку 7.

Рисунок 7 Результат застосування інструменту регресія

5. Оцінимо за допомогою середньої помилки апроксимації якість рівнянь. Скористаємося результатами регресійного аналізу, представленого на Рисунку 8.

Рисунок 8 Результат застосування інструменту регресія «Виведення залишку»

Складемо нову таблицюяк показано на малюнку 9. У графі С розрахуємо відносну помилкуапроксимації за формулою:

Рисунок 9 Розрахунок середньої помилки апроксимації

Середня помилка апроксимації розраховується за формулою:

Якість побудованої моделі оцінюється як хороша, тому що не перевищує 8 – 10%.

6. З таблиці з регресійною статистикою(Малюнок 4) випишемо фактичне значення F-критерію Фішера:

Оскільки при 5%-ном рівні значимості, можна дійти невтішного висновку про значимість рівняння регресії (зв'язок доведено).

8. Оцінку статистичної значущості параметрів регресії проведемо за допомогою t-статистики Стьюдента та шляхом розрахунку довірчого інтервалу кожного з показників.

Висуваємо гіпотезу Н 0 про статистично незначну відмінність показників від нуля:

.

для числа ступенів свободи

На малюнку 7 є фактичні значення t-статистики:

t-критерій для коефіцієнта кореляції можна розрахувати двома способами:

I спосіб:

де - Випадкова помилка коефіцієнта кореляції.

Дані для розрахунку візьмемо з таблиці на малюнку 7.

II спосіб:

Фактичні значення t-статистики перевищують табличні значення:

Тому гіпотеза Н 0 відхиляється, тобто параметри регресії та коефіцієнт кореляції не випадково відрізняються від нуля, а статистично значущі.

Довірчий інтервал для параметра a визначається як

Для параметра a 95% межі як показано на малюнку 7 склали:

Довірчий інтервал для коефіцієнта регресії визначається як

Для коефіцієнта регресії b 95% межі як показано на малюнку 7 склали:

Аналіз верхньої та нижньої меж довірчих інтервалів призводить до висновку про те, що з ймовірністю параметри a і b, перебуваючи у зазначених межах, не набувають нульових значень, тобто. є статистично незначущими і істотно відмінні від нуля.

7. Отримані оцінки рівняння регресії дають змогу використовувати його для прогнозу. Якщо прогнозне значення прожиткового мінімуму становитиме:

Тоді прогнозне значення прожиткового мінімуму становитиме:

Помилку прогнозу розрахуємо за такою формулою:

де

Дисперсію вважатимемо також за допомогою ППП Excel. Для цього:

1) Активізуйте Майстер функцій: у головному меню виберіть Формули / Вставити функцію.

3) Заповніть діапазон, що містить числові дані факторної ознаки. Натисніть ОК.

Рисунок 10 Розрахунок дисперсії

Набули значення дисперсії

Для підрахунку залишкової дисперсії на один ступінь свободи скористаємося результатами дисперсійного аналізу, як показано на Рисунку 7.

Довірчі інтервали прогнозу індивідуальних значень у при ймовірності 0,95 визначаються виразом:

Інтервал досить широкий, насамперед, рахунок малого обсягу спостережень. Загалом виконаний прогноз середньомісячної заробітної плати виявився надійним.

Умову задачі взято з: Практикум з економетрики: Навч. посібник/І.І. Єлісєєва, С.В. Куришева, Н.М. Гордєєнко та ін; За ред. І.І. Єлісєєвої. – М.: Фінанси та статистика, 2003. – 192 с.: іл.


Емпіричні коефіцієнти регресії b 0 , b 1 визначатимемо за допомогою інструмента «Регресія» надбудови «Аналіз даних» табличного процесора MS Excel.

Алгоритм визначення коефіцієнтів ось у чому.

1. Вхідні дані в табличний процесор MS Excel.

2. Викликаємо над будівництво Аналіз даних (рисунок 2).

3. Вибираємо інструмент аналізу Регресія (рисунок 3).

4. Заповнюємо відповідні позиції вікна Регресія (рис. 4).

5. Натискаємо кнопку ОК вікна Регресія та отримуємо протокол розв'язання задачі (рисунок 5)


Рисунок 3 – Вибір інструменту Регресія




Рисунок 4 – Вікно Регресія

Рисунок 5 – Протокол розв'язання задачі

З малюнка 5 видно, що емпіричні коефіцієнти регресії відповідно дорівнюють

b 0 = 223,

b 1 = 0,0088.

Тоді рівняння парної лінійної регресії, що зв'язує величину щомісячної пенсії з величиною прожиткового мінімуму має вигляд

.(3.2)

Далі, відповідно до завдання необхідно оцінити тісноту статистичного зв'язку між величиною прожиткового мінімуму х та величиною щомісячної пенсії у. Цю оцінку можна зробити за допомогою коефіцієнта кореляції. Величина цього коефіцієнта малюнку 5 позначена як множинний R і дорівнює 0,038. Оскільки теоретично величина даного коефіцієнтазнаходиться в межах від -1 до +1, то можна зробити висновок про не суттєвість статистичного зв'язку між величиною прожиткового мінімуму х і величиною щомісячної пенсії у.

Параметр «R – квадрат», представлений малюнку 5 є квадрат коефіцієнта кореляції і називається коефіцієнтом детермінації. Розмір даного коефіцієнта характеризує частку дисперсії залежної змінної у, пояснену регресією (що пояснює змінної х). Відповідно величина 1- характеризує частку дисперсії змінної у, викликану впливом решти, неврахованих в економетричної моделі пояснюють змінних. З малюнка 5 видно, частка всіх неврахованих в отриманої економетричної моделі пояснюючих змінних приблизно становить 1- 0,00145 = 0,998 чи 99,8%.



на наступному етапі, Відповідно до завдання необхідно визначити ступінь зв'язку пояснюючої змінної х із залежною змінною у, використовуючи коефіцієнт еластичності. Коефіцієнт еластичності для моделі парної лінійної регресії визначається як:

Отже, за зміни прожиткового мінімуму на 1% величина щомісячної пенсії змінюється на 0,000758%.

. (3.4)

Для цього вихідну таблицю 1 доповнюємо двома колонками, в яких визначаємо значення розраховані з використанням залежності (3.2) і значення різниці .

Таблиця 3.2. Розрахунок середньої помилки апроксимації.

Тоді середня помилка апроксимації дорівнює

.

З практики відомо, що значення середньої помилки апроксимації не повинно перевищувати (12...15)%

на останньому етапівиконаємо оцінку статистичної надійності моделювання за допомогою F - критерію Фішера. Для цього виконаємо перевірку нульової гіпотези Н 0 про статистичну не значущість отриманого рівняння регресії за умовою:

якщо за заданому рівні значимості a = 0,05 теоретичне (розрахункове) значення F-критерію більше його критичного значення F крит (табличного), то нульова гіпотеза відкидається, і отримане рівняння регресії приймається значним.

З малюнка 5 випливає, що F розрахунок = 0,0058. Критичне значення F-критерію визначаємо за допомогою використання статистичної функції FРАСПОБР (рисунок 6). Вхідними параметрамифункції є рівень значущості (імовірність) і число ступенів свободи 1 і 2. Для моделі парної регресії число ступенів свободи відповідно дорівнює 1 (одна змінна, що пояснює) і n-2 = 6-2=4.



Рисунок 6 – Вікно статистичної функції FРАСПОБР

З малюнка 6 видно, що критичне значення F-критерію дорівнює 7,71.

Так як F розрах< F крит, то нулевая гипотеза не отвергается и полученное регресійне рівняннястатистично незначимо.

13. Побудова моделі множинної регресіїіз використанням EXCEL.

Відповідно до варіанта завдання, використовуючи статистичний матеріал, необхідно.

1. Побудувати лінійне рівняння множинної регресії пояснити економічний зміст параметрів.

2. Дати порівняльну оцінку тісноти зв'язку факторів із результативною ознакою за допомогою середніх (загальних) коефіцієнтів еластичності.

3. Оцінити статистичну значимістькоефіцієнтів регресії за допомогою t-критерію Стьюдента та нульової гіпотези про значущість рівняння за допомогою F-критерію.

4. Оцінити якість рівняння у вигляді визначення середньої помилки апроксимації.

Вихідні дані для побудови моделі парної регресії наведено у таблиці 3.3.

Таблиця 3.3. Вихідні дані.

Чистий дохід, млн. доларів США у Оборот капіталу, мол. дол. США, х 1 Використаний капітал, мол. дол. США, х 2
6,6 6,9 83,6
2,7 93,6 25,4
1,6 10,0 6,4
2,4 31,5 12,5
3,3 36,7 14,3
1,8 13,8 6,5
2,4 64,8 22,7
1,6 30,4 15,8
1,4 12,1 9,3
0,9 31,3 18,9

Технологія побудови рівняння регресії аналогічна алгоритму, викладеному у пункті 3.1. Протокол побудови рівняння регресії показано малюнку 7.

ВИСНОВОК ПІДСУМКІВ
Регресійна статистика
Множинний R 0,901759207
R-квадрат 0,813169667
Нормований R-квадрат 0,759789572
Стандартна помилка 0,789962026
Спостереження
Дисперсійний аналіз
df MS F
Регресія 9,50635999 15,23357468
Залишок 0,624040003
Разом
Коефіцієнти t-статистика
Y-перетин 1,113140304 2,270238114
Змінна X 1 -0,000592199 -0,061275574
Змінна X 2 0,063902851 5,496523193

Малюнок 7. Виведення підсумків.



Схожі статті

2024 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.