Оцінка рівнів значимості коефіцієнтів регресійного рівняння. Перевірка значущості рівняння регресії

Після того як рівняння регресії побудовано та за допомогою коефіцієнта детермінації оцінено його точність, залишається відкритим питанняза рахунок чого досягнуто цієї точності і відповідно чи можна цьому рівнянню довіряти. Справа в тому, що рівняння регресії будувалося не за генеральної сукупності, яка невідома, а щодо вибірки з неї. Крапки з генеральної сукупності потрапляють у вибірку випадковим чином, тому відповідно до теорії ймовірності серед інших випадків можливий варіант, коли вибірка з “широкої” генеральної сукупності виявиться “вузькою” (рис. 15).

Мал. 15. Можливий варіантвлучення точок у вибірку з генеральної сукупності.

В цьому випадку:

а) рівняння регресії, побудоване на вибірку, може значно відрізнятися від рівняння регресії для генеральної сукупності, що призведе до помилок прогнозу;

б) коефіцієнт детермінації та інші характеристики точності виявляться невиправдано високими і вводитимуть в оману про прогнозні якості рівняння.

У граничному випадку не виключений варіант, коли з генеральної сукупності хмара з головною віссю паралельної горизонтальної осі (відсутня зв'язок між змінними) за рахунок випадкового відбору буде отримана вибірка, головна вісь якої виявиться нахиленою до осі. Таким чином, спроби прогнозувати чергові значення генеральної сукупності спираючись на дані вибірки з неї загрожують не тільки помилками в оцінці сили та напряму зв'язку між залежною та незалежною змінними, але й небезпекою знайти зв'язок між змінними там, де насправді її немає.

В умовах відсутності інформації про всі точки генеральної сукупності єдиний спосіб зменшити помилки в першому випадку полягає у використанні при оцінці коефіцієнтів рівняння регресії методу, що забезпечує їх незміщеність та ефективність. А ймовірність настання другого випадку може бути значно знижена завдяки тому, що апріорі відома одна властивість генеральної сукупності з двома незалежними один від одного змінними – в ній відсутня саме цей зв'язок. Досягається це зниження за рахунок перевірки статистичної значимостіотриманого рівняння регресії

Один з варіантів перевірки, що найчастіше використовуються, полягає в наступному. Для отриманого рівняння регресії визначається -статистика - характеристика точності рівняння регресії, що є відношенням тієї частини дисперсії залежною змінною яка пояснена рівнянням регресії до непоясненої (залишкової) частини дисперсії. Рівняння для визначення статистики у разі багатовимірної регресії має вигляд:

де: - Пояснена дисперсія - частина дисперсії залежною змінною Y яка пояснена рівнянням регресії;

Залишкова дисперсія - частина дисперсії залежною змінною Y яка не пояснена рівнянням регресії, її наявність є наслідком дії випадкової складової;

Число точок у вибірці;

Число змінних у рівнянні регресії.

Як видно з наведеної формули, дисперсії визначаються як окреме від поділу відповідної суми квадратів на число ступенів свободи. Число ступенів свободи це мінімально необхідне число значень залежної змінної, яких достатньо для отримання шуканої характеристики вибірки і які можуть вільно змінюватись з урахуванням того, що для цієї вибірки відомі всі інші величини, що використовуються для розрахунку потрібної характеристики.

Для отримання залишкової дисперсії потрібні коефіцієнти рівняння регресії. У разі парної лінійної регресіїкоефіцієнтів два, тому відповідно до формули (беручи ) число ступенів свободи дорівнює . Мається на увазі, що для визначення залишкової дисперсії достатньо знати коефіцієнти рівняння регресії і лише значень залежної змінної вибірки. Два значення, що залишилися, можуть бути обчислені на підставі цих даних, а значить, не є вільно варіюються.

Для обчислення поясненої дисперсії значень залежної змінної взагалі не потрібні, оскільки її можна обчислити, знаючи коефіцієнти регресії при незалежних змінних та дисперсію незалежної змінної. Для того щоб переконатися в цьому, достатньо згадати вираз, що наводився раніше. . Тому число ступенів свободи для залишкової дисперсії дорівнює числу незалежних змінних у рівнянні регресії (для парної лінійної регресії).

В результаті критерій для рівняння парної лінійної регресії визначається за формулою:

.

Теоретично ймовірності доведено, що критерій рівняння регресії, отриманого для вибірки з генеральної сукупності, у якої відсутній зв'язок між залежною і незалежною змінною має розподіл Фішера, досить добре вивчений. Завдяки цьому для будь-якого значення критерію можна розрахувати ймовірність його появи і навпаки, визначити те значення критерію яке він не зможе перевищити із заданою ймовірністю.

Для здійснення статистичної перевірки значущості рівняння регресії формулюється нульова гіпотеза про відсутність зв'язку між змінними (всі коефіцієнти при змінних дорівнюють нулю) і вибирається рівень значущості.

Рівень значущості – це припустима можливість зробити помилку першого роду – відкинути внаслідок перевірки правильну нульову гіпотезу. У даному випадку зробити помилку першого роду означає визнати за вибіркою наявність зв'язку між змінними в генеральній сукупності, коли насправді її там немає.

Зазвичай рівень значущості приймається рівним 5% чи 1%. Що рівень значимості (що менше ), то вище рівень надійності тесту, рівний , тобто. Тим більше шанс уникнути помилки визнання щодо вибірки наявності зв'язку у генеральної сукупності насправді незв'язаних між собою змінних. Але зі зростанням рівня значущості зростає небезпека скоєння помилки другого роду – відкинути правильну нульову гіпотезу, тобто. не помітити за вибіркою наявний насправді зв'язок змінних у генеральній сукупності. Тому залежно від того, яка помилка має великі негативні наслідки, Вибирають той чи інший рівень значущості.

Для обраного рівня значущості за розподілом Фішера визначається табличне значення ймовірність перевищення, якого у вибірці потужністю, отриманої з генеральної сукупності без зв'язку між змінними, не перевищує рівня значущості. порівнюється з фактичним значенням критерію для регресійного рівняння.

Якщо виконується умова, то помилкове виявлення зв'язку зі значенням -критерію рівним або більшим за вибіркою з генеральної сукупності з незв'язаними між собою змінними відбуватиметься з ймовірністю меншою за рівень значущості. Відповідно до правила “дуже рідкісних подійне буває”, приходимо до висновку, що встановлений за вибіркою зв'язок між змінними є і в генеральній сукупності, з якої вона отримана.

Якщо виявляється , то рівняння регресії статистично не значимо. Іншими словами існує реальна ймовірність того, що за вибіркою встановлено не існує в реальності зв'язок між змінними. До рівняння, що не витримало перевірку на статистичну значущість, ставляться так само, як і до ліків з терміном, що минув термін придатності.

Ті – такі ліки не обов'язково зіпсовані, але якщо немає впевненості у їхній якості, то їх вважають за краще не використовувати. Це правило не вберігає від усіх помилок, але дозволяє уникнути найбільш грубих, що також досить важливо.

Другий варіант перевірки, зручніший у разі використання електронних таблиць, це зіставлення ймовірності появи отриманого значення -критерію з рівнем значущості. Якщо ця можливість виявляється нижче рівня значимості , отже рівняння статистично значуще, інакше немає.

Після того, як виконано перевірку статистичної значущості регресійного рівняння в цілому корисно, особливо для багатовимірних залежностей здійснити перевірку на статистичну значущість отриманих коефіцієнтів регресії. Ідеологія перевірки така ж як і при перевірці рівняння в цілому але як критерій використовується - критерій Стьюдента, що визначається за формулами:

і

де: - значення критерію Стьюдента для коефіцієнтів і відповідно;

- Залишкова дисперсія рівняння регресії;

Число точок у вибірці;

Число змінних у вибірці, для парної лінійної регресії.

Отримані фактичні значення критерію Стьюдента порівнюються з табличними значеннями отриманими з розподілу Стьюдента. Якщо виявляється, що , то відповідний коефіцієнт статистично значущий, інакше немає. Другий варіант перевірки статистичної значущості коефіцієнтів - визначити ймовірність появи критерію Стьюдента і порівняти з рівнем значущості.

Для змінних, чиї коефіцієнти виявилися статистично не значущими, велика ймовірність того, що їх вплив на залежну змінну в генеральній сукупності взагалі відсутній. Тому або необхідно збільшити кількість точок у вибірці, тоді можливо коефіцієнт стане статистично значущим і заодно уточниться його значення, або як незалежні змінні знайти інші, більш тісно пов'язані з залежною змінною. Точність прогнозування у разі обох випадках зросте.

Як експресний метод оцінки значущості коефіцієнтів рівняння регресії можна застосовувати наступне правило- Якщо критерій Стьюдента більше 3, то такий коефіцієнт, як правило, виявляється статистично значущим. А взагалі вважається, що для отримання статистично значимих рівнянь регресії необхідно, щоб виконувалася умова.

Стандартна помилка прогнозування отриманого рівняння регресії невідомого значення при відомому оцінюють за формулою:

Таким чином, прогноз з довірчою ймовірністю 68% може бути представлений у вигляді:

Якщо потрібна інша довірча ймовірність, то рівня значимості необхідно визначити критерій Стьюдента і довірчий інтервалдля прогнозу з рівнем надійності дорівнюватиме .

Прогнозування багатовимірних та нелінійних залежностей

Якщо прогнозована величина залежить від кількох незалежних змінних, то цьому випадку є багатовимірна регресія виду:

де: - Коефіцієнти регресії, що описують вплив змінних на прогнозовану величину.

Методика визначення коефіцієнтів регресії не відрізняється від парної лінійної регресії, особливо при використанні електронної таблиці, так як там застосовується та сама функція і для парної і для багатовимірної лінійної регресії. У цьому бажано щоб між незалежними змінними були відсутні взаємозв'язки, тобто. зміна однієї змінної не позначалося на значення інших змінних. Але ця вимога не є обов'язковою, важливо щоб між змінними були відсутні функціональні лінійні залежності. Описані вище процедури перевірки статистичної значущості отриманого рівняння регресії та її окремих коефіцієнтів, оцінка точності прогнозування залишається як і для випадку парної лінійної регресії. У той же час застосування багатомірних регресій замість парної зазвичай дозволяє при належному виборі змінних суттєво підвищити точність опису поведінки залежної змінної, а отже, і точність прогнозування.

Крім цього, рівняння багатовимірної лінійної регресії дозволяють описати і нелінійну залежність прогнозованої величини від незалежних змінних. Процедура наведення нелінійного рівняннядо лінійного виглядуназивається лінеаризацією. Зокрема, якщо ця залежність описується поліномом ступеня відмінного від 1, то, здійснивши заміну змінних зі ступенями відмінними від одиниці на нові змінні в першому ступені, отримуємо завдання багатовимірної лінійної регресії замість нелінійної. Так, наприклад, якщо вплив незалежної змінної описується параболою виду

то заміна дозволяє перетворити нелінійне завдання до багатовимірного лінійного вигляду

Так само легко можуть бути перетворені нелінійні завдання, у яких нелінійність виникає внаслідок того, що прогнозована величина залежить від твору незалежних змінних. Для обліку такого впливу необхідно запровадити нову змінну, що дорівнює цьому твору.

У тих випадках, коли нелінійність описується складнішими залежностями, лінеаризація можлива за рахунок перетворення координат. Для цього розраховуються значення та будуються графіки залежності вихідних точок у різних комбінаціях перетворених змінних. Та комбінація перетворених координат чи перетворених і не перетворених координат, у якій залежність найближче до прямої лінії підказує заміну змінних яка призведе до перетворення не лінійної залежностідо лінійного вигляду. Наприклад, нелінійна залежність виду

перетворюється на лінійну вигляду

Отримані коефіцієнти регресії для перетвореного рівняння залишаються незміщеними та ефективними, але перевірка статистичної значущості рівняння та коефіцієнтів неможлива

Перевірка обґрунтованості застосування методу найменших квадратів

Застосування методу найменших квадратів забезпечує ефективність та несмещенность оцінок коефіцієнтів рівняння регресії за дотримання наступних умов (умов Гауса-Маркова):

3. значення не залежать один від одного

4. значення не залежать від незалежних змінних

Найбільш просто можна перевірити дотримання цих умов шляхом побудови графіків залишків залежно від , Потім від незалежної (незалежних) змінних. Якщо точки на цих графіках розташовані в коридорі розташованому симетрично осі абсцис і розташування точок не проглядаються закономірності, то умови Гауса-Маркова виконані і можливості підвищити точність рівняння регресії відсутні. Якщо це не так, то існує можливість суттєво підвищити точність рівняння і для цього необхідно звернутись до спеціальної літератури.

Підсумкові тести з економетрики

1. Оцінка значущості параметрів рівняння регресії складає основі:

А) t – критерію Стьюдента;

б) F-критерія Фішера - Снедекору;

в) середньої квадратичної помилки;

г) середньої помилки апроксимації.

2. Коефіцієнт регресії у рівнянні , що характеризує зв'язок між обсягом реалізованої продукції (млн. руб.) та прибутком підприємств автомобільної промисловості за рік (млн. руб.) означає, що при збільшенні обсягу реалізованої продукції на 1 млн. руб. прибуток збільшується на:

г) 0,5млн. руб.;

в) 500тис. руб.;

р) 1,5 млн. крб.

3. Кореляційне відношення (індекс кореляції) вимірює ступінь тісноти зв'язку між Х таY:

а) лише за нелінійної форми залежності;

Б) за будь-якої форми залежності;

в) лише за лінійної залежності.

4. У напрямку зв'язку бувають:

а) помірні;

Б) прямі;

в) прямолінійні.

5. За 17 спостереженнями побудовано рівняння регресії:
.
Для перевірки значущості рівняння обчисленоспостережуване значенняt- Статистики: 3.9. Висновок:

А) Рівняння значимо при a = 0,05;

б) Рівняння незначне за a = 0,01;

в) Рівняння незначне за a = 0,05.

6. Які наслідки порушення припущення МНК «математичне очікування регресійних залишків дорівнює нулю»?

А) Зміщені оцінки коефіцієнтів регресії;

б) Ефективні, але неспроможні оцінки коефіцієнтів регресії;

в) неефективні оцінки коефіцієнтів регресії;

г) Неспроможні оцінки коефіцієнтів регресії.

7. Яке з таких тверджень правильне у разі гетероскедастичності залишків?

А) Висновки з t та F-статистиків є ненадійними;

г) Оцінки параметрів рівняння регресії є усунутими.

8. На чому ґрунтується тест рангової кореляціїСпірмена?

А) На використанні t – статистики;

в) На використанні ;

9. На чому базується тест Уайта?

б) На використанні F-статистики;

В) На використанні ;

г) На графічному аналізі залишків.

10. Яким способом можна скористатися для усунення автокореляції?

11. Як називається порушення припущення про сталість дисперсії залишків?

а) мультиколінеарність;

б) автокореляція;

В) Гетероскедастичність;

г) Гомоскедастичність.

12. Фіктивні змінні вводяться у:

а) лише у лінійні моделі;

б) лише у множинну нелінійну регресію;

в) лише у нелінійні моделі;

Г) як у лінійні, так і в нелінійні моделі, що приводяться до лінійного вигляду.

13. Якщо у матриці парних коефіцієнтів кореляції зустрічаються
, то це свідчить:

А) Про наявність мультиколінеарності;

б) Про відсутність мультиколлінеарності;

в) Про наявність автокореляції;

г) Про відсутність гетероскедастичності.

14. За допомогою якого заходу неможливо позбутися мультиколінеарності?

а) збільшення обсягу вибірки;

Г) Перетворення випадкової складової.

15. Якщо
і ранг матриці А менший (К-1) то рівняння:

а) надіденцифіковано;

Б) неідентифіковано;

в) точно ідентифіковано.

16.Рівняння регресії має вигляд:

а)
;

б)
;

в)
.

17. У чому полягає проблема ідентифікації моделі?

А) одержання однозначно визначених параметрів моделі, заданої системою одночасних рівнянь;

б) вибір та реалізація методів статистичного оцінювання невідомих параметрів моделі за вихідними статистичними даними;

в) перевірка адекватності моделі.

18. Який метод застосовується для оцінювання параметрів надіденцифікованого рівняння?

В) ДМНК, КМНК;

19. Якщо якісна змінна маєkальтернативних значень, то при моделюванні використовуються:

А) (k-1) фіктивна змінна;

б) kфіктивних змінних;

в) (k+1) фіктивна змінна.

20. Аналіз тісноти та напрями зв'язків двох ознак здійснюється на основі:

а) парного коефіцієнта кореляції;

б) коефіцієнт детермінації;

в) множинного коефіцієнта кореляції.

21. У лінійному рівнянні x = а 0 +a 1 x коефіцієнт регресії показує:

а) тісноту зв'язку;

б) частку дисперсії "Y", залежну від "X";

В) на скільки в середньому зміниться "Y" за зміни "X" на одну одиницю;

г) помилку коефіцієнта кореляції.

22. Який показник використовується для визначення частини варіації, обумовленої зміною величини фактора, що вивчається?

а) коефіцієнт варіації;

б) коефіцієнт кореляції;

В) коефіцієнт детермінації;

г) коефіцієнт еластичності.

23. Коефіцієнт еластичності показує:

А) на скільки % зміниться значення y за зміни x на 1 %;

б) на скільки одиниць свого виміру зміниться значення y при зміні x на 1 %;

в) на скільки % зміниться значення y при зміні x на од. свого виміру.

24. Які методи можна застосувати для виявлення гетероскедастичності?

А) Тест Голфелда-Квандта;

Б) Тест рангової кореляції Спірмена;

в) Тест Дарбіна-Вотсона.

25. На чому ґрунтується тест Голфельда-Квандта

а) На використанні t-статистики;

Б) На використанні F – статистики;

в) На використанні ;

г) На графічному аналізі залишків.

26. За допомогою яких методів не можна усунути автокореляцію залишків?

а) узагальненим методом найменших квадратів;

Б) Виваженим способом найменших квадратів;

В) Методом максимальної правдоподібності;

Г) Двокроковим методом найменших квадратів.

27. Як називається порушення припущення про незалежність залишків?

а) мультиколінеарність;

Б) автокореляція;

в) Гетероскедастичність;

г) Гомоскедастичність.

28. Яким методом можна скористатися для усунення гетероскедастичності?

А) узагальненим методом найменших квадратів;

б) Виваженим шляхом найменших квадратів;

в) методом максимальної правдоподібності;

г) Двокроковим методом найменших квадратів.

30. Якщо поt-критерію більшість коефіцієнтів регресії статистично значущі, а модель загалом поF- критерію незначна то це може свідчити про:

а) мультиколінеарності;

Б) Про автокореляцію залишків;

в) Про гетероскедастичність залишків;

г) Такий варіант неможливий.

31. Чи можливо за допомогою перетворення змінних позбавитися мультиколлінеарності?

а) Цей захід ефективний тільки при збільшенні обсягу вибірки;

32. За допомогою якого методу можна визначити оцінки параметра рівняння лінійної регресії:

А) шляхом найменшого квадрата;

б) кореляційно- регресійного аналізу;

в) дисперсійний аналіз.

33. Побудовано множинне лінійне рівняння регресії з фіктивними змінними. Для перевірки значимості окремих коефіцієнтів використовується розподіл:

а) Нормальне;

б) Стьюдента;

в) Пірсон;

г) Фішера-Снідекору.

34. Якщо
і ранг матриці А більший (К-1) то рівняння:

А) надіденцифіковано;

б) неідентифіковано;

в) точно ідентифіковано.

35. Для оцінювання параметрів точно ідентифікованої системи рівнянь застосовується:

а) ДМНК, КМНК;

б) ДМНК, МНК, КМНК;

36. Критерій Чоу ґрунтується на застосуванні:

А) F – статистики;

б) t – статистики;

в) критерії Дарбіна-Уотсона.

37. Фіктивні змінні можуть набувати значення:

г) будь-які значення.

39. За 20 спостереженнями побудовано рівняння регресії:
.
Для перевірки значущості рівняння обчислено значення статистики:4.2. Висновки:

а) Рівняння значимо при a = 0.05;

б) Рівняння незначне при a = 0.05;

в) Рівняння незначне при a = 0.01.

40. Яке з таких тверджень неправильне у разі гетероскедастичності залишків?

а) Висновки з tіF-статистиків є ненадійними;

б) Гетероскедастичність проявляється через низьке значення статистики Дарбіна-Уотсона;

в) При гетероскедастичності оцінки залишаються ефективними;

г) Оцінки є усунутими.

41. Тест Чоу заснований на порівнянні:

а) дисперсій;

б) коефіцієнтів детермінації;

в) математичних очікувань;

г) середніх.

42. Якщо у тесті Чоу
то вважається:

А) що розбиття на подинтервали доцільно з погляду поліпшення якості моделі;

б) модель є статистично незначущою;

в) модель є статистично значущою;

г) що немає сенсу розбивати вибірку на частини.

43. Фіктивні змінні є змінними:

а) якісними;

б) випадковими;

в) кількісними;

г) логічними.

44. Який із перерахованих методів не може бути застосований для виявлення автокореляції?

а) Метод рядів;

б) критерій Дарбіна-Уотсона;

в) тест рангової кореляції Спірмена;

Г) тест Уайт.

45. Найпростіша структурна форма моделі має вигляд:

а)

б)

в)

г)
.

46. ​​За допомогою яких заходів можна позбутися мультиколлінеарності?

а) збільшення обсягу вибірки;

б) Винятки змінних висококорельованих з іншими;

в) зміна специфікації моделі;

г) Перетворення випадкової складової.

47. Якщо
і ранг матриці А дорівнює (К-1) то рівняння:

а) надіденцифіковано;

б) неідентифіковано;

В) точно ідентифіковано;

48. Модель вважається ідентифікованою, якщо:

а) серед рівнянь моделі є хоча одне нормальне;

Б) кожне рівняння системи ідентифікується;

в) серед рівнянь моделі є хоча б одне неідентифіковане;

г) серед рівнянь моделі є хоча б одне надідентифіковане.

49. Який метод застосовується для оцінювання параметрів неіденцифікованого рівняння?

а) ДМНК, КМНК;

б) ДМНК, МНК;

У) параметри такого рівняння не можна оцінити.

50. На стику яких галузей знань виникла економетрика:

а) економічна теорія; економічна та математична статистика;

б) економічна теорія, математична статистика та теорія ймовірності;

в) економічна та математична статистика, теорія ймовірності.

51. У множинному лінійному рівнянні регресії будуються довірчі інтервали для коефіцієнтів регресії за допомогою розподілу:

а) Нормального;

Б) Стьюдента;

в) Пірсон;

г) Фішера-Снідекору.

52. За 16 спостереженнями збудовано парне лінійне рівняння регресії. Дляперевірки значущості коефіцієнта регресії обчисленоt на6л =2.5.

а) Коефіцієнт незначний при a = 0.05;

б) Коефіцієнт значимий при a = 0.05;

в) Коефіцієнт значимий за a=0.01.

53. Відомо, що між величинамиXіYіснуєпозитивний зв'язок. У яких межахперебуває парний коефіцієнт кореляції?

а) від -1 до 0;

б) від 0 до 1;

У) від –1 до 1.

54. Множинний коефіцієнт кореляції дорівнює 0.9. Який відсотокдисперсії результативної ознаки пояснюється впливом усіхфакторні ознаки?

55. Який із перерахованих методів не може бути застосований для виявлення гетероскедастичності?

А) Тест Голфелда-Квандта;

б) Тест рангової кореляції Спірмена;

в) метод рядів.

56. Наведена форма моделі є:

а) систему нелінійних функцій екзогенних змінних від ендогенних;

Б) систему лінійних функційендогенних змінних від екзогенних;

в) систему лінійних функцій екзогенних змінних від ендогенних;

г) систему нормальних рівнянь.

57. У яких межах змінюється приватний коефіцієнт кореляції, обчислений за рекуретними формулами?

а) від - до + ;

б) від 0 до 1;

в) від 0 до + ;

г) від -1 до +1.

58. У яких межах змінюється приватний коефіцієнт кореляції, обчислений через коефіцієнт детермінації?

а) від - до + ;

Б) від 0 до 1;

в) від 0 до + ;

г) від -1 до +1.

59. Екзогенні змінні:

а) залежні змінні;

Б) незалежні змінні;

61. При додаванні до рівняння регресії ще одного пояснюючого фактора множинний коефіцієнт кореляції:

а) зменшиться;

б) зросте;

в) збереже своє значення.

62. Побудовано гіперболічне рівняння регресії:Y= a+ b/ X. ДляДля перевірки значущості рівняння використовується розподіл:

а) Нормальне;

Б) Стьюдента;

в) Пірсон;

г) Фішера-Снідекору.

63. Для яких видів систем параметри окремих економетричних рівнянь можна знайти з допомогою традиційного методу найменших квадратів?

а) система нормальних рівнянь;

Б) система незалежних рівнянь;

В) система рекурсивних рівнянь;

г) система взаємозалежних рівнянь.

64. Ендогенні змінні:

А) залежні змінні;

б) незалежні змінні;

в) датовані попередніми моментами часу.

65. У яких межах змінюється коефіцієнт детермінації?

а) від 0 до + ;

б) від - до + ;

в) від 0 до +1;

г) від -l до +1.

66. Побудовано множинне лінійне рівняння регресії. Для перевірки значимості окремих коефіцієнтів використовується розподіл:

а) Нормальне;

б) Стьюдента;

в) Пірсон;

Г) Фішера-Снідекору.

67. При додаванні до рівняння регресії ще одного пояснюючого фактора коефіцієнт детермінації:

а) зменшиться;

Б) зросте;

в) збереже своє значення;

г) не зменшиться.

68. Суть методу найменших квадратів у тому, что:

А) оцінка визначається за умови мінімізації суми квадратів відхилень вибіркових даних від оцінки, що визначається;

б) оцінка визначається за умови мінімізації суми відхилень вибіркових даних від оцінки, що визначається;

в) оцінка визначається за умови мінімізації суми квадратів відхилень вибіркової середньої від вибіркової дисперсії.

69. До якого класу нелінійних регресій належить парабола:

73. До якого класу нелінійних регресій відноситься експоненційна крива:

74. До якого класу нелінійних регресій належить функція виду ŷ
:

А) регресії, нелінійні щодо включених до аналізу змінних, але лінійних за оцінюваними параметрами;

б) нелінійні регресії за оцінюваними параметрами.

78. До якого класу нелінійних регресій відноситься функція виду ŷ
:

а) регресії, нелінійні щодо включених до аналізу змінних, але лінійних за оцінюваними параметрами;

Б) нелінійні регресії за оцінюваними параметрами.

79. У рівнянні регресії у формі гіперболи ŷ
якщо величина
b >0 , то:

а) зі збільшенням факторного ознаки хзначення результативної ознаки ууповільнено зменшуються, і при х→∞середня величина убуде рівна а;

б) то значення результативної ознаки узростає із уповільненим зростанням зі збільшенням факторного ознаки х, і при х→∞

81. Коефіцієнт еластичності визначається за формулою

а) лінійної функції;

б) Параболи;

в) гіперболи;

г) Показовою кривою;

д) Ступінь.

82. Коефіцієнт еластичності визначається за формулою
для моделі регресії у формі:

а) лінійної функції;

Б) Параболи;

в) гіперболи;

г) Показовою кривою;

д) Ступінь.

86. Рівняння
називається:

а) лінійним трендом;

б) параболічним трендом;

в) гіперболічний тренд;

г) експоненційним трендом.

89. Рівняння
називається:

а) лінійним трендом;

б) параболічним трендом;

в) гіперболічний тренд;

г) експоненційним трендом.

90. Система види називається:

а) системою незалежних рівнянь;

б) системою рекурсивних рівнянь;

в) системою взаємозалежних (спільних, одночасних) рівнянь.

93. Економетрику можна визначити як:

А) це самостійна наукова дисципліна, що об'єднує сукупність теоретичних результатів, прийомів, методів та моделей, призначених для того, щоб на базі економічної теорії, економічної статистики та математико-статистичного інструментарію надавати конкретний кількісний вираз загальним (якісним) закономірностям, зумовленим економічною теорією;

Б) наука про економічні виміри;

У) статистичний аналіз економічних даних.

94. До завдань економетрики можна віднести:

А) прогноз економічних та соціально-економічних показників, що характеризують стан та розвиток аналізованої системи;

Б) імітація можливих сценаріїв соціально-економічного розвитку системи для виявлення того, як плановані зміни тих чи інших параметрів, що піддаються управлінню, позначаться на вихідних характеристиках;

в) перевірка гіпотез за статистичними даними.

95. За характером розрізняють зв'язки:

А) функціональні та кореляційні;

б) функціональні, криволінійні та прямолінійні;

в) кореляційні та зворотні;

г) статистичні та прямі.

96. При прямому зв'язку із збільшенням факторної ознаки:

а) результативна ознака зменшується;

б) результативна ознака не змінюється;

В) результативна ознака зростає.

97. Які методи використовуються для виявлення наявності, характеру та напряму зв'язку у статистиці?

а) середніх величин;

Б) порівняння паралельних рядів;

В) метод аналітичного угруповання;

г) відносних величин;

д) графічний метод.

98. Який метод використовується виявлення форми впливу одних чинників інші?

а) кореляційний аналіз;

Б) регресійний аналіз;

в) індексний аналіз;

г) дисперсійний аналіз.

99. Який метод використовується для кількісної оцінки сили впливу одних факторів на інші:

а) кореляційний аналіз;

б) регресійний аналіз;

в) метод середніх величин;

г) дисперсійний аналіз.

100. Які показники за своєю величиною існують у межах від мінус до плюс одиниці:

а) коефіцієнт детермінації;

б) кореляційне ставлення;

У) лінійний коефіцієнт кореляції.

101. Коефіцієнт регресії при однофакторній моделі показує:

а) скільки одиниць змінюється функція при зміні аргументу однією одиницю;

б) скільки відсотків змінюється функція однією одиницю зміни аргументу.

102. Коефіцієнт еластичності показує:

а) на скільки відсотків змінюється функція зі зміною аргументу одну одиницю свого виміру;

Б) на скільки відсотків змінюється функція із зміною аргументу на 1%;

в) скільки одиниць свого виміру змінюється функція зі зміною аргументу на 1%.

105. Розмір індексу кореляції, що дорівнює 0,087, свідчить:

А) про слабку їхню залежність;

б) про сильний взаємозв'язок;

в) про помилки у обчисленнях.

107. Розмір парного коефіцієнта кореляції, що дорівнює 1,12, свідчить:

а) про слабку їхню залежність;

б) про сильний взаємозв'язок;

В) про помилки у обчисленнях.

109. Які із наведених чисел можуть бути значеннями парного коефіцієнта кореляції:

111. Які із наведених чисел можуть бути значеннями множинного коефіцієнта кореляції:

115. Позначте правильну форму лінійного рівняння регресії:

а) ŷ
;

б) ŷ
;

в) ŷ
;

Г) ŷ
.

Для перевірки значущості аналізується відношення коефіцієнта регресії та її середньоквадратичного відхилення. Це ставлення є розподілом Стьюдента, тобто визначення значимості використовуємо t – критерій:

- СКОвід залишкової дисперсії;

- сума відхилень від середнього значення

Якщо t рас. >t таб. , то коефіцієнт b i є значимим.

Довірчий інтервал визначається за такою формулою:

ПОРЯДОК ВИКОНАННЯ РОБОТИ

    Взяти вихідні дані згідно з варіантом роботи (за номером студента в журналі). Задано статичний об'єкт управління з двома входами X 1 , X 2 та одним виходом Y. На об'єкті проведено пасивний експеримент та отримано вибірку обсягом 30 точок, що містить значення Х 1 , Х 2 і Yдля кожного експерименту.

    Відкрити новий файл у Excel 2007. вихідну інформаціюу стовпці вихідної таблиці - значення вхідних змінних X 1 , Х 2 та вихідний змінної Y.

    Підготувати додатково два стовпці для введення розрахункових значень Yта залишків.

    Викликати програму «Регресія»: Дані/ Аналіз даних/ Регресія.

Мал. 1. Діалогове вікно "Аналіз даних".

    Ввести у діалогове вікно «Регресія» адреси вихідних даних:

    вхідний інтервал Y, вхідний інтервал X (2 стовпці),

    встановити рівень надійності 95%,

    в опції «Вихідний інтервал, вказати ліву верхню комірку місця виведення даних регресійного аналізу (першу комірку на 2-сторінці робочого листа),

    включити опції «Залишки» та «графік залишків»,

    натиснути кнопку ОК запуску регресійного аналізу.

Мал. 2. Діалогове вікно "Регресія".

    Excel виведе 4 таблиці та 2 графіки залежності залишків від змінних Х1і Х2.

    Відформатувати таблицю "Виведення підсумків" - розширити стовпець з найменуваннями вихідних даних, зробити в другому стовпці 3 значущі цифри після коми.

    Відформатувати таблицю Дисперсійний аналіз»- Зробити зручним для читання та розуміння кількість значущих цифр після ком, скоротити найменування змінних і налаштувати ширину стовпців.

    Відформатувати таблицю коефіцієнтів рівняння - скоротити найменування змінних і скоригувати за необхідності ширину стовпців, зробити зручним для читання та розуміння кількість значущих цифр, видалити 2 останні стовпці (значення та розмітку таблиці).

    Дані з таблиці "Виведення залишку" перенести в підготовлені стовпці вихідної таблиці, потім видалити таблицю "Виведення залишку" (опція "спеціальна вставка").

    Ввести отримані оцінки коефіцієнтів у вихідну таблицю.

    Підтягнути таблиці результатів максимум догори сторінки.

    Побудувати під таблицями діаграми Yексп, Yрозрахта помилки прогнозу (залишку).

    Форматувати діаграми залишків. За отриманими графіками оцінити правильність моделі входів Х1, Х2.

    Роздрукувати результати регресійного аналізу.

    Розібратися з результатами регресійного аналізу.

    Підготувати звіт роботи.

ПРИКЛАД ВИКОНАННЯ РОБОТИ

Прийом виконання регресійного аналізу у пакеті EXCEL представлений малюнки 3-5.

Мал. 3. Приклад регресійного аналізу у пакеті EXCEL.


Рис.4. Графіки залишків змінних Х1, Х2

Мал. 5. Графіки Yексп,Yрозрахта помилки прогнозу (залишку).

За даними регресійного аналізу можна сказати:

1. Рівняння регресії отримане за допомогою Excel має вигляд:

    Коефіцієнт детермінації:

Варіація результату 46,5% пояснюється варіацією чинників.

    Загальний F-критерій перевіряє гіпотезу про статистичну значущість рівняння регресії. Аналіз виконується при порівнянні фактичного та табличного значення F-критерію Фішера.

Оскільки фактичне значення перевищує табличне
, то робимо висновок, що отриманої рівняння регресії статистично значуще.

    Коефіцієнт множинної кореляції:

    b 0 :

t таб. (29, 0.975) = 2.05

b 0 :

Довірчий інтервал:

    Визначаємо довірчий інтервал для коефіцієнта b 1 :

Перевірка значущості коефіцієнта b 1 :

t рас. >t таб. коефіцієнт b 1 є значним

Довірчий інтервал:

    Визначаємо довірчий інтервал для коефіцієнта b 2 :

Перевірка значущості для коефіцієнта b 2 :

Визначаємо довірчий інтервал:

ВАРІАНТИ ЗАВДАНЬ

Таблиця 2. Варіанти завдань

№ варіанта

Результативна ознака Y i

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 1

Y 2

Y 2

Y 2

Y 2

Y 2

№ фактора X i

№ фактора X i

Продовження таблиці 1

№ варіанта

Результативна ознака Y i

Y 2

Y 2

Y 2

Y 2

Y 2

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

Y 3

№ фактора X i

№ фактора X i

Таблиця 3. Вихідні дані

Y 1

Y 2

Y 3

X 1

X 2

X 3

X 4

X 5

ПИТАННЯ ДЛЯ САМОКОНТРОЛЮ

    Завдання регресійного аналізу.

    Причини регресійного аналізу.

    Основне рівняння дисперсійного аналізу.

    Що показує F-відношення Фішера?

    Як визначається табличне значення критерію Фішера?

    Що демонструє коефіцієнт детермінації?

    Як визначити значущість коефіцієнтів регресії?

    Як визначити довірчий інтервал коефіцієнтів регресії?

    Як визначити розрахункові значення t-критерію?

    Як визначити табличне значення t-критерію?

    Сформулюйте основну ідею дисперсійного аналізу, на вирішення яких завдань він найефективніший?

    Які основні теоретичні причини дисперсійного аналізу?

    Зробіть розкладання загальної суми квадратів відхилень на складові дисперсійному аналізі.

    Як отримати оцінки дисперсій із сум квадратів відхилень?

    Як виходять необхідні числа ступенів свободи?

    Як визначається стандартна помилка?

    Поясніть схему двофакторного дисперсійного аналізу.

    Чим відрізняється перехресна класифікація від ієрархічної класифікації?

    Чим відрізняються збалансовані дані?

Звіт оформляється у текстовому редакторі Word на папері формату А4 ГОСТ 6656-76 (210х297 мм) та містить:

    Назва лабораторної роботи

    Мета роботи.

  1. Результати обчислення.

ЧАС, ВІДВЕДЕНИЙ НА ВИКОНАННЯ

ЛАБОРАТОРНОЇ РОБОТИ

Підготовка до роботи – 0,5 акад. години.

Виконання роботи – 0,5 акад. години.

Розрахунки на ЕОМ – 0,5 акад. години.

Оформлення роботи – 0,5 акад. години.

Література

    Ідентифікація об'єктів керування. / А. Д. Семенов, Д. В. Артамонов, А. В. Брюхачов. Навчальний посібник. – Пенза: ПДУ, 2003. – 211 с.

    Основи статистичного аналізу. Практикум з статистичним методамта дослідження операцій з використанням пакетів STATISTIC та EXCEL. / Вуколов Е.А. Навчальний посібник. – К.: ФОРУМ, 2008. – 464 с.

    Основи теорії ідентифікації об'єктів керування. / А.А. Ігнатьєв, С.А. Ігнатьєв. Навчальний посібник. – Саратов: СДТУ, 2008. – 44 с.

    Теорія ймовірності та математична статистика у прикладах та задачах із застосуванням EXCEL. / Г.В. Горєлова, І.А. Кацько. – Ростов н/Д: Фенікс, 2006. – 475 с.

    Мета роботи 2

    Основні поняття 2

    Порядок виконання роботи 6

    Приклад виконання роботи 9

    Запитання для самоконтролю 13

    Час, відведений на виконання роботи 14

    Оцінивши параметри aі b, ми отримали рівняння регресії, яким можна оцінити значення yза заданими значеннями x. Природно вважати, що розрахункові значення залежної змінної нічого очікувати збігатися з дійсними значеннями, оскільки лінія регресії визначає взаємозв'язок лише середньому, загалом. Окремі значення розпорошені навколо неї. Таким чином, надійність одержуваних за рівнянням регресії розрахункових значень багато в чому визначається розсіюванням значень, що спостерігаються навколо лінії регресії. На практиці, як правило, дисперсія помилок невідома та оцінюється за спостереженнями одночасно з параметрами регресії. aі b. Цілком логічно припустити, що оцінка пов'язана із сумою квадратів залишків регресії. Величина є вибірковою оцінкою дисперсії обурень, що містяться в теоретичної моделі . Можна показати, що для моделі парної регресії

    де - Відхилення фактичного значення залежної змінної від її розрахункового значення.

    Якщо , то всім спостережень фактичні значення залежної змінної збігаються з розрахунковими (теоретичними) значеннями . Графічно це означає, що теоретична лінія регресії (лінія, побудована за функцією ) проходить через усі точки кореляційного поля, що можливе лише за строго функціонального зв'язку. Отже, результативна ознака уповністю зумовлений впливом фактора х.

    Зазвичай практично має місце деяке розсіювання точок кореляційного поля щодо теоретичної лінії регресії, т. е. відхилення емпіричних даних від теоретичних . Цей розкид обумовлений як впливом фактора х, тобто. регресією yпо х, (Таку дисперсію називають поясненою, так як вона пояснюється рівнянням регресії),так і дією інших причин (непояснена варіація, випадкова). Величина цих відхилень лежить в основі розрахунку показників якості рівняння.

    Згідно з основним положенням дисперсійного аналізу загальна сума квадратів відхилень залежної змінної yвід середнього значення може бути розкладена на дві складові: пояснену рівнянням регресії та непояснену:

    ,

    де - значення y, обчислені за рівнянням .

    Знайдемо відношення суми квадратів відхилень, поясненої рівнянням регресії, до загальної суми квадратів:

    , звідки

    . (7.6)

    Відношення частини дисперсії, поясненої рівнянням регресії до загальної дисперсіїрезультативної ознаки називається коефіцієнтом детермінації. Значення не може перевершити одиниці і це максимальне значеннябуде досягнуто при , тобто. коли кожне відхилення дорівнює нулю і тому всі точки діаграми розсіювання точно лежать на прямій.

    Коефіцієнт детермінації характеризує частку поясненої регресією дисперсії у загальній величині дисперсії залежною змінною . Відповідно величина характеризує частку варіації (дисперсії) у,непояснену рівнянням регресії, а отже, викликану впливом інших неврахованих у моделі факторів. Чим ближче до одиниці, тим вища якість моделі.



    При парній лінійній регресії коефіцієнт детермінації дорівнює квадрату парного лінійного коефіцієнтакореляції: .

    Корінь із цього коефіцієнта детермінації є коефіцієнт (індекс) множинної кореляції, або теоретичне кореляційне відношення.

    Для того щоб дізнатися, чи дійсно отримане при оцінці регресії значення коефіцієнта детермінації відображає справжню залежність між yі xвиконують перевірку значимості збудованого рівняння в цілому та окремих параметрів. Перевірка значущості рівняння регресії дозволяє дізнатися, чи придатне рівняння регресії для практичного використаннянаприклад, для прогнозу чи ні.

    При цьому висувають основну гіпотезу про незначущість рівняння в цілому, яка формально зводиться до гіпотези про рівність нулю параметрів регресії, або, що те саме, про рівність нуля коефіцієнта детермінації: . Альтернативна гіпотеза про значущість рівняння - гіпотеза про нерівність нулю параметрів регресії або про нерівність нулю коефіцієнта детермінації: .

    Для перевірки значущості моделі регресії використовують F-критерій Фішера, що обчислюється як відношення суми квадратів (з розрахунку на одну незалежну змінну) до залишкової суми квадратів (з розрахунку на один ступінь свободи):

    , (7.7)

    де k- Число незалежних змінних.

    Після поділу чисельника та знаменника співвідношення (7.7) на загальну суму квадратів відхилень залежною змінною, F-критерій може бути еквівалентно виражений на основі коефіцієнта:

    .

    Якщо нульова гіпотеза справедлива, то пояснена рівнянням регресії та непояснена (залишкова) дисперсії не відрізняються одна від одної.

    Розрахункове значення F-критерій порівнюється з критичним значенням, яке залежить від кількості незалежних змінних k, та від числа ступенів свободи (n-k-1). Табличне (критичне) значення F-критерію – це максимальна величина відносин дисперсій, що може бути при випадковому розбіжності їх за заданого рівня ймовірності наявності нульової гіпотези. Якщо розрахункове значення F-критерій більше табличного при заданому рівні важливості, то нульова гіпотеза про відсутність зв'язку відхиляється і робиться висновок про суттєвість зв'язку, тобто. модель вважається значною.

    Для моделі парної регресії

    .

    У лінійній регресії зазвичай оцінюється значущість як рівняння загалом, а й окремих його коефіцієнтів. Для цього визначається стандартна помилка кожного параметра. Стандартні помилкикоефіцієнтів регресії параметрів визначаються за формулами:

    , (7.8)

    (7.9)

    Стандартні помилки коефіцієнтів регресії або середньоквадратичні відхилення, розраховані за формулами (7.8,7.9), як правило, наводяться у результатах розрахунку моделі регресії у статистичних пакетах.

    Маючи середньоквадратичні помилки коефіцієнтів регресії, перевіряють значимість цих коефіцієнтів використовуючи звичайну схемуперевірки статистичних гіпотез

    Як основну гіпотезу висувають гіпотезу про незначну відмінність від нуля «справжнього» коефіцієнта регресії. Альтернативною гіпотезою у своїй є гіпотеза зворотна, т. е. про нерівність нулю «істинного» параметра регресії. Перевірка цієї гіпотези здійснюється за допомогою t-статистики, що має t-розподіл Стьюдента:

    Потім розрахункові значення t-статистики порівнюються з критичними значеннями t-статистики, що визначаються за таблицями розподілу Стьюдента. Критичне значення визначається залежно від рівня значимості α та числа ступенів свободи, яке дорівнює (n-k-1), п -кількість спостережень, k- Число незалежних змінних. У разі лінійної парної регресії число ступенів свободи дорівнює (п- 2). Критичне значення також може бути обчислено на комп'ютері за допомогою вбудованої функції СТЮДРАСПОБР пакету Ехсеl.

    Якщо розрахункове значення t-статистики більше критичного, то основну гіпотезу відкидають і вважають, що з ймовірністю (1-α)«Істинний» коефіцієнт регресії істотно відрізняється від нуля, що статистичним підтвердженням існування лінійної залежності відповідних змінних.

    Якщо розрахункове значення t-статистики менше критичного, немає підстав відкидати основну гіпотезу, т. е. «справжній» коефіцієнт регресії незначно відрізняється від нуля за рівня значимості α . У цьому випадку фактор, що відповідає цьому коефіцієнту, повинен бути виключений з моделі.

    Значимість коефіцієнта регресії можна встановити шляхом побудови довірчого інтервалу. Довірчий інтервал для параметрів регресії aі bвизначають наступним чином:

    ,

    ,

    де визначається за таблицею розподілу Стьюдента рівня значимості α та числа ступенів свободи (п- 2) для парної регресії.

    Оскільки коефіцієнти регресії в економетричних дослідженнях мають чітку економічну інтерпретацію, довірчі інтервали повинні містити нуль. Справжнє значення коефіцієнта регресії неспроможна одночасно містити позитивні і негативні величини, зокрема й нуль, інакше ми отримуємо суперечливі результати за економічної інтерпретації коефіцієнтів, чого може бути. Таким чином, коефіцієнт значимий, якщо отриманий довірчий інтервал не накриває нуль.

    Приклад 7.4.За даними прикладу 7.1:

    а) Побудувати парну лінійну модель регресії залежності прибутку від від відпускної ціни з допомогою програмних засобів обробки даних.

    б) Оцінити значимість рівняння регресії загалом, використовуючи F-критерій Фішера при α=0,05.

    в) Оцінити значущість коефіцієнтів моделі регресії, використовуючи t-критерій Стьюдента при α=0,05і α=0,1.

    Для проведення регресійного аналізу використовуємо стандартну офісну програму EXCEL. Побудову регресійної моделі проведемо за допомогою інструмента РЕГРЕСІЯ налаштування ПАКЕТ АНАЛІЗУ (рис.7.5), запуск якого здійснюється наступним чином:

    СервісАналіз данихРЕГРЕСІЯОК.

    Рис.7.5. Використання інструменту РЕГРЕСІЯ

    У діалоговому вікні РЕГРЕСІЯ в полі Вхідний інтервал Y необхідно ввести адресу діапазону осередків, що містять залежну змінну. У полі Вхідний інтервал Х потрібно ввести адреси одного або декількох діапазонів, що містять значення незалежних змінних Прапорець Мітки у першому рядку – встановлюється в активний стан, якщо виділені заголовки стовпців. На рис. 7.6. показано екранна формаобчислення моделі регресії за допомогою інструмента РЕГРЕСІЯ.

    Мал. 7.6. Побудова моделі парної регресії за допомогою

    інструменту РЕГРЕСІЯ

    В результаті роботи інструменту РЕГРЕСІЯ формується наступний протокол регресійного аналізу (рис.7.7).

    Мал. 7.7. Протокол регресійного аналізу

    Рівняння залежності прибутку від відпускної ціни має вигляд:

    Оцінку значущості рівняння регресії проведемо використовуючи F-критерій Фішера. Значення F-критерій Фішера візьмемо із таблиці «Дисперсійний аналіз» протоколу EXCEL (рис. 7.7.). Розрахункове значення F-критерію 53,372. Табличне значення F-критерію при рівні значимості α=0,05та числі ступенів свободи складає 4,964. Так як , то рівняння вважається значним.

    Розрахункові значення t-критерія Стьюдента для коефіцієнтів рівняння регресії наведено у результативній таблиці (рис. 7.7). Табличне значення t-критерія Стьюдента за рівня значимості α=0,05та 10 степенях волі становить 2,228. Для коефіцієнта регресії a, отже коефіцієнт aне значущий. Для коефіцієнта регресії b, отже, коефіцієнт bзначущий.

    Перевірку значущості рівняння регресії зробимо на основі

    F-критерія Фішера:

    Значення F-критерію Фішера можна знайти у таблиці Дисперсійний аналіз протоколу Еxcel. Табличне значення F-критерію при довірчій ймовірності α = 0,95 і числі ступенів свободи, що дорівнює v1 = k = 2 і v2 = n - k - 1 = 50 - 2 - 1 = 47, становить 0,051.

    Оскільки Fрасч > Fтабл, рівняння регресії слід визнати значним, тобто його можна використовуватиме аналізу та прогнозування.

    Оцінку значимості коефіцієнтів отриманої моделі, використовуючи результати звіту Excel, можна здійснити трьома способами.

    Коефіцієнт рівняння регресії визнається значущим у тому разі, якщо:

    1) спостерігається значення t-статистики Стьюдента для цього коефіцієнта більше, ніж критичне (табличне) значення статистики Стьюдента (для заданого рівня значущості, наприклад α = 0,05, та числа ступенів свободи df = n – k – 1, де n – число спостережень, а k – число чинників моделі);

    2) Р-значення t-статистики Стьюдента для цього коефіцієнта менше, ніж рівень значущості, наприклад α = 0,05;

    3) довірчий інтервал для цього коефіцієнта, обчислений з деякою довірчою ймовірністю (наприклад, 95%), не містить нуль у собі, тобто нижня 95% і верхня 95% межі довірчого інтервалу мають однакові знаки.

    Значення коефіцієнтів a1 і a2 перевіримо по другому та третьому способам:

    P-значення ( a1 ) = 0,00 < 0,01 < 0,05.

    Р-значення ( a2 ) = 0,00 < 0,01 < 0,05.

    Отже, коефіцієнти a1 і a2 значущі за 1%-ном рівні, а тим паче при 5%-ном рівні значимості. Нижні та верхні 95% межі довірчого інтервалу мають однакові знаки, отже, коефіцієнти a1 і a2 значущі.

    Визначення пояснюючої змінної, від якої

    Може залежати дисперсія випадкових збурень.

    Перевірка виконання умови гомоскедастичності

    Залишків по тесту Гольдфельда-Квандта

    При перевірці передумови МНК про гомоскедастичність залишків у моделі множинної регресії слід спочатку визначити, стосовно якого з факторів дисперсія залишків найбільше порушена. Це можна зробити в результаті візуального дослідження графіків залишків, побудованих за кожним із факторів, включених у модель. Та з пояснюючих змінних, від якої більше залежить дисперсія випадкових обурень, і буде впорядкована за зростанням фактичних значень під час перевірки тесту Гольдфельда-Квандта. Графіки легко отримати у звіті, який формується в результаті використання інструменту Регресія у пакеті Аналіз даних).

    Графіки залишків по кожному з факторів двофакторної моделі

    З представлених графіків видно, що дисперсія залишків найбільше порушена стосовно фактора Короткострокова дебіторська заборгованість.

    Перевіримо наявність гомоскедастичності у залишках двофакторної моделі на основі тесту Гольдфельда-Квандта.

      Упорядкуємо змінні Y і X2 за зростанням фактора Х4 (в Excel для цього можна використовувати команду Дані - Сортування за зростанням Х4):

      Дані відсортовані за зростанням X4:

    1. Приберемо із середини впорядкованої сукупності С = 1/4 · n = 1/4 · 50 = 12,5 (12) значення. В результаті отримаємо дві сукупності відповідно з малими та великими значеннями Х4.

      Для кожної сукупності виконаємо розрахунки:

    Сума

    111234876536,511

    966570797682,068

    455748832843,413

    232578961097,877

    834043911651,192

    193722998259,505

    1246409153509,290

    31419681912489,100

    2172804245053,280

    768665257272,099

    2732445494273,330

    163253156450,331

    18379855056009,900

    10336693841766,000

    Сума

    69977593738424,600

    Рівняння для сукупностей

    Y = -27275,746 + 0,126 X2 + 1,817 X4

    Y = 61439,511 + 0,228 X2 + 0,140 X4

    Результати даної таблиці отримано за допомогою інструмента Регресія по черзі до кожної з отриманих сукупностей.

    4. Знайдемо ставлення отриманих залишкових сум квадратів

    (у чисельнику має бути велика сума):

    5. Висновок про наявність гомоскедастичності залишків робимо за допомогою F-критерію Фішера з рівнем значущості α = 0,05 та двома однаковими ступенями свободи k1 = k2 = == 17

    де р - Число параметрів рівняння регресії:

    Fтабл (0,05; 17; 17) = 9,28.

    Так як Fтабл> R, то підтверджується гомоскедастичність в залишках двофакторної регресії.

    Схожі статті

2023 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.