Як порахувати помилку апроксимації в excel. Оцінка за допомогою F-критерію Фішера статистичної надійності результатів регресійного моделювання

Перевіримо гіпотезу H 0 про рівність окремих коефіцієнтів регресії нулю (при альтернативі H 1 не дорівнює) лише на рівні значимості б=0.05.

Якщо основна гіпотеза виявиться неправильною, ми приймаємо альтернативну. Для перевірки цієї гіпотези використовується t-критерій Стьюдента.

Знайдене за даними спостережень значення t-критерію (його ще називають спостерігається або фактичним) порівнюється з табличним (критичним) значенням, що визначається за таблицями розподілу Стьюдента (які зазвичай наводяться в кінці підручників та практикумів зі статистики чи економетрики).

Табличне значеннявизначається залежно від рівня значущості (б) та числа ступенів свободи, яке у разі лінійної парної регресії дорівнює (n-2), n-число спостережень.

Якщо фактичне значення t-критерію більше табличного (за модулем), то основну гіпотезу відкидають і вважають, що з ймовірністю (1-б) параметр або статистична характеристика генеральної сукупностіЗначно відрізняється від нуля.

Якщо фактичне значення t-критерію менше табличного (за модулем), немає підстав відкидати основну гіпотезу, тобто. параметр чи статистична характеристика у генеральній сукупності незначно відрізняється від нуля за рівня значимості б.

t критий (n-m-1; б/2) = (30; 0.025) = 2.042

Оскільки 1.7< 2.042, то статистическая значимость коэффициента регрессии b не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в даному випадкукоефіцієнтом b можна знехтувати.

Оскільки 0.56< 2.042, то статистическая значимость коэффициента регрессии a не подтверждается (принимаем гипотезу о равенстве нулю этого коэффициента). Это означает, что в данном случае коэффициентом a можно пренебречь.

Довірчий інтервал коефіцієнтів рівняння регресії.

Визначимо довірчі інтервали коефіцієнтів регресії, які з надійністю 95% будуть такими:

(b - t крит S b; b + t крит S b)
(0.64 - 2.042 * 0.38; 0.64 + 2.042 * 0.38)
(-0.13;1.41)

Так як точка 0 (нуль) лежить усередині довірчого інтервалу, то інтервальна оцінка коефіцієнта статистично незначна.

(a - t критий S a ; a + t критий S a)
(24.56 - 2.042 * 44.25; 24.56 + 2.042 * 44.25)
(-65.79;114.91)

Імовірно, 95% можна стверджувати, що значення даного параметра будуть лежати в знайденому інтервалі.

Оскільки точка 0 (нуль) лежить усередині довірчого інтервалу, то інтервальна оцінка коефіцієнта статистично незначна.

2) F-статистика. Критерій Фішера.

Коефіцієнт детермінації R 2 використовується для перевірки суттєвості рівняння лінійної регресії загалом.

Перевірка значущості моделі регресії проводиться з використанням F-критерію Фішера, розрахункове значення якого перебуває як відношення дисперсії вихідного ряду спостережень показника, що вивчається, і незміщеної оцінки дисперсії залишкової послідовності для даної моделі.

Якщо розрахункове значення з k 1 =(m) і k 2 =(n-m-1) ступенями свободи більше табличного при заданому рівні значущості, модель вважається значущою.

де m – число факторів у моделі.

Оцінка статистичної значимостіпарної лінійної регресії проводиться у разі наступного алгоритму:

1. Висувається нульова гіпотеза у тому, що рівняння загалом статистично незначимо: H 0: R 2 =0 лише на рівні значимості б.
2. Далі визначають фактичне значення F-критерію:

де m=1 для парної регресії.

3. Табличне значення визначається за таблицями розподілу Фішера для заданого рівня значимості, враховуючи, що число ступенів свободи для загальної суми квадратів (більшої дисперсії) дорівнює 1 і число ступенів свободи залишкової суми квадратів (меншої дисперсії) при лінійній регресії дорівнює n-2 .

F табл – це максимально можливе значення критерію під впливом випадкових факторівпри даних ступенях свободи та рівні значущості б. Рівень значущості б - можливість відкинути правильну гіпотезу за умови, що вона вірна. Зазвичай приймається дорівнює 0,05 або 0,01.

4. Якщо фактичне значення F-критерію менше табличного, то кажуть, що немає підстав відхиляти нульову гіпотезу.

В іншому випадку, нульова гіпотеза відхиляється і з ймовірністю (1-б) приймається альтернативна гіпотеза про статистичну значущість рівняння в цілому.

Табличне значення критерію зі ступенями свободи k 1 =1 і k 2 =30 F табл = 4.17

Оскільки фактичне значення F< F табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Зв'язок між F-критерієм Фішера та t-статистикою Стьюдента виражається рівністю:

Показники якості рівняння регресії.

Перевірка на наявність автокореляції залишків.

Важливою причиною побудови якісної регресійної моделі МНК є незалежність значень випадкових відхилень від значень відхилень в інших спостереженнях. Це гарантує відсутність корелювання між будь-якими відхиленнями і, зокрема, між сусідніми відхиленнями.

Автокореляція (послідовна кореляція) визначається як кореляція між показниками, що спостерігаються, упорядкованими в часі (тимчасові ряди) або в просторі (перехресні ряди). Автокореляція залишків (відхилень) зазвичай трапляється у регресійному аналізі під час використання даних часових рядів і дуже рідко під час використання перехресних даних.

У економічні завданнязначно частіше трапляється позитивна автокореляція, ніж негативна автокореляція. Найчастіше позитивна автокореляція викликається спрямованим постійним впливомдеяких неврахованих у моделі факторів.

Негативна автокореляція фактично означає, що за позитивним відхиленням слідує негативне і навпаки. Така ситуація може мати місце, якщо ту саму залежність між попитом на прохолодні напої та доходами розглядати за сезонними даними (зима-літо).

Серед основних причин, що викликають автокореляцію, можна виділити такі:

1. Помилки специфікації. Неврахування в моделі будь-якої важливої пояснюючої змінної або невірний вибірФорми залежності зазвичай призводять до системних відхилень точок спостереження від лінії регресії, що може зумовити автокореляцію.
2. Інерція. Багато економічних показників (інфляція, безробіття, ВНП і т.д.) мають певну циклічність, пов'язану з хвилеподібністю ділової активності. Тому зміна показників відбувається не миттєво, а має певну інертність.
3. Ефект павутиння. У багатьох виробничих та інших сферах економічні показники реагують зміну економічних умовіз запізненням (тимчасовим лагом).
4. Згладжування даних. Найчастіше дані по деякому тривалому часовому періоду отримують усереднення даних по складових його інтервалах. Це може призвести до певного згладжування коливань, які були всередині періоду, що розглядається, що в свою чергу може бути причиною автокореляції.

Наслідки автокореляції схожі з наслідками гетероскедастичності: висновки з t- та F-статистиків, що визначають значущість коефіцієнта регресії та коефіцієнта детермінації, можливо, будуть невірними.

Серед різних методівпрогнозування не можна виділити апроксимацію. З її допомогою можна проводити приблизні підрахунки та обчислювати заплановані показники, шляхом заміни вихідних об'єктів більш прості. В Екселі теж існує можливість використання цього методу для прогнозування та аналізу. Давайте розглянемо, як цей метод можна застосувати у програмі вбудованими інструментами.

Найменування даного методу походить від латинського слова proxima - "найближча" Саме наближення шляхом спрощення та згладжування відомих показників, вибудовування їх у тенденцію і є його основою. Але даний методможна використовувати як для прогнозування, але й дослідження вже існуючих результатів. Адже апроксимація є, по суті, спрощенням вихідних даних, а спрощений варіант легше дослідити.

Головний інструмент, за допомогою якого проводиться згладжування в Excel - це побудова лінії тренду. Суть у тому, що у основі вже існуючих показників добудовується графік функції майбутні періоди. Основне призначення лінії тренду, як не складно здогадатися, це складання прогнозів чи виявлення загальної тенденції.

Але вона може бути побудована із застосуванням одного з п'яти видів апроксимації:

Лінійний;
експоненційної;
Логарифмічній;
поліноміальної;
Ступіньної.

Розглянемо кожен із варіантів докладніше окремо.

Спосіб 1: лінійне згладжування

Насамперед, давайте розглянемо найпростіший варіант апроксимації, а саме за допомогою лінійної функції. На ньому ми зупинимося найдокладніше, тому що викладемо загальні моменти характерні і для інших способів, а саме побудова графіка та деякі інші нюанси, на яких при розгляді наступних варіантів вже не зупинятимемося.

Насамперед, побудуємо графік, на підставі якого проводитимемо процедуру згладжування. Для побудови графіка візьмемо таблицю, де помісячно зазначена собівартість одиниці виробленої підприємством, і відповідна прибуток у цьому періоді. Графічна функція, яку ми побудуємо, відображатиме залежність збільшення прибутку від зменшення собівартості продукції.

Згладжування, яке використовується в даному випадку, описується такою формулою:

У нашому випадку формула приймає такий вид:

y=-0,1156x+72,255

Розмір достовірності апроксимації в нас дорівнює 0,9418 , що досить прийнятним результатом, характеризує згладжування, як достовірне.

Спосіб 2: експоненційна апроксимація

Тепер давайте розглянемо експоненційний тип апроксимації Ексель.

Загальний вигляд функції згладжування при цьому такий:

де e– це підстава натурального логарифму.

У нашому випадку формула прийняла таку форму:

y=6282,7*e^(-0,012*x)

Спосіб 3: логарифмічне згладжування

Тепер настала черга розглянути метод логарифмічної апроксимації.

У загальному виглядіформула згладжування виглядає так:

де ln- Це величина натурального логарифму. Звідси й найменування способу.

У нашому випадку формула набуває такого вигляду:

y=-62,81ln(x)+404,96

Спосіб 4: поліноміальне згладжування

Настала черга розглянути метод поліноміального згладжування.

Формула, яка описує даний типзгладжування, набрала наступного вигляду:

y=8E-08x^6-0,0003x^5+0,3725x^4-269,33x^3+109525x^2-2E+07x+2E+09

Спосіб 5: статечне згладжування

На завершення розглянемо метод статечної апроксимації в Excel.

Цей спосіб ефективно використовується у випадках інтенсивної зміни даних функції. Важливо врахувати, що цей варіант застосовується лише за умови, що функція та аргумент не приймають негативних або нульових значень.

Загальна формула, що описує цей метод має такий вигляд:

У нашому випадку вона виглядає так:

y = 6E+18x^(-6,512)

Як бачимо, при використанні конкретних даних, які ми застосовували для прикладу, найбільший рівень достовірності показав метод поліноміальної апроксимації з поліномом шостою ( 0,9844 ), найменший рівень достовірності у лінійного методу (0,9418 ). Але це зовсім не означає, що така тенденція буде при використанні інших прикладів. Ні, рівень ефективності у наведених вище методів може значно відрізнятися, залежно від конкретного виду функції, для якої будуватиметься лінія тренду. Тому, якщо для цієї функції обраний метод найефективніший, це зовсім не означає, що він також буде оптимальним і в іншій ситуації.

Якщо ви поки що не можете відразу визначити, ґрунтуючись на наведених вище рекомендаціях, який вид апроксимації підійде саме у вашому випадку, тобто сенс спробувати всі методи. Після побудови лінії тренду та перегляду її рівня достовірності можна буде вибрати оптимальний варіант.

Територіями регіону наводяться дані за 200Х р.

Номер регіону	Середньодушовий прожитковий мінімум на день одного працездатного, руб., х	Середньоденна заробітна плата, руб., у
1	78	133
2	82	148
3	87	134
4	79	154
5	89	162
6	106	195
7	67	139
8	88	158
9	73	152
10	87	162
11	76	159
12	115	173

Завдання:

1. Побудуйте поле кореляції та сформулюйте гіпотезу про форму зв'язку.

2. Розрахуйте параметри рівняння лінійної регресії

4. Дайте за допомогою середнього (загального) коефіцієнта еластичності порівняльну оцінку сили зв'язку фактора із результатом.

7. Розрахуйте прогнозне значення результату, якщо прогнозне значення фактора збільшиться на 10% його середнього рівня. Визначте довірчий інтервал прогнозу рівня значущості .

Рішення:

Вирішимо це завдання за допомогою Excel.

1. Зіставивши наявні дані х і у, наприклад, ранжирувавши їх у порядку зростання фактора х, можна спостерігати наявність прямої залежності між ознаками, коли збільшення середньодушового прожиткового мінімуму збільшує середньоденну заробітну плату. Виходячи з цього, можна зробити припущення, що зв'язок між ознаками прямий і його можна описати рівнянням прямий. Той самий висновок підтверджується і основі графічного аналізу.

Щоб побудувати поле кореляції, можна скористатися ППП Excel. Введіть вихідні дані у послідовності: спочатку х, потім у.

Виділіть область клітинок, що містить дані.

Потім оберіть: Вставка / Точкова діаграма / Точкова з маркерамияк показано малюнку 1.

Малюнок 1 Побудова поля кореляції

Аналіз поля кореляції показує наявність близькою до прямо лінійної залежності, Оскільки точки розташовані практично по прямій лінії.

2. Для розрахунку параметрів рівняння лінійної регресії
скористаємося вбудованою статистичною функцією Лінейн.

Для цього:

1) Відкрийте існуючий файл, що містить дані, що аналізуються;
2) Виділіть область порожніх осередків 5×2 (5 рядків, 2 стовпці) для виведення результатів регресійної статистики.
3) Активізуйте Майстер функцій: у головному меню оберете Формули / Вставити функцію.
4) У вікні Категоріяви берете Статистичні, у вікні функція - Лінейн. Клацніть по кнопці ОКяк показано на малюнку 2;

Рисунок 2 Діалогове вікно «Майстер функцій»

5) Заповніть аргументи функції:

Відомі значення у

Відомі значення х

Константа- логічне значення, що вказує на наявність або відсутність вільного члена в рівнянні; якщо Константа = 1, вільний член розраховується звичайним чином, якщо Константа = 0, то вільний член дорівнює 0;

Статистика- логічне значення, яке вказує, виводити додаткову інформацію щодо регресійного аналізу чи ні. Якщо Статистика = 1, то додаткова інформаціявиводиться, якщо Статистика = 0, виводяться лише оцінки параметрів рівняння.

Клацніть по кнопці ОК;

Рисунок 3 Діалогове вікно аргументів функції ЛІНІЙН

6) У лівому верхньому осередку виділеної області з'явиться перший елемент підсумкової таблиці. Щоб розкрити всю таблицю, натисніть клавішу , а потім на комбінацію клавіш ++ .

Додаткова регресійна статистика буде виводитись у порядку, зазначеному в наступній схемі:

Значення коефіцієнта b	Значення коефіцієнта a
Стандартна помилка b	Стандартна помилка a
Стандартна помилка y
F-статистика
Регресійна сума квадратів

Рисунок 4 Результат обчислення функції ЛІНІЙН

Набули рівняння регресії:

Робимо висновок: Зі збільшенням середньодушового прожиткового мінімуму на 1 руб. середньоденна вести збільшується загалом на 0,92 крб.

Це означає, що 52% варіації заробітної плати(у) пояснюється варіацією фактора х – середньодушового прожиткового мінімуму, а 48% – дією інших факторів, не включених до моделі.

За обчисленим коефіцієнтом детермінації можна розрахувати коефіцієнт кореляції: .

Зв'язок оцінюється як тісний.

4. За допомогою середнього (загального) коефіцієнта еластичності визначимо силу впливу фактора на результат.

Для рівняння прямий середній (загальний) коефіцієнт еластичності визначимо за такою формулою:

Середні значення знайдемо, виділивши область осередків зі значеннями х, і виберемо Формули / Автосума / Середнє, і те саме зробимо зі значеннями у.

Рисунок 5 Розрахунок середніх значень функції та аргумент

Таким чином, за зміни середньодушового прожиткового мінімуму на 1% від свого середнього значення середньоденна заробітна плата зміниться в середньому на 0,51%.

За допомогою інструмента аналізу даних Регресіяможна отримати:
- результати регресійної статистики,
- результати дисперсійного аналізу,
- результати довірчих інтервалів,
- залишки та графіки підбору лінії регресії,
- залишки та нормальну ймовірність.

Порядок дій наступний:

1) перевірте доступ до Пакету аналізу. У головному меню виберіть: Файл/Параметри/Надбудови.

2) У списку, що розкривається Управліннявиберіть пункт Надбудови Excelта натисніть кнопку Перейти.

3) У вікні Надбудовивстановіть прапорець Пакет аналізу, а потім натисніть кнопку ОК.

Якщо Пакет аналізувідсутня у списку поля Доступні надбудови, натисніть кнопку Огляд, щоб здійснити пошук.

Якщо відображається повідомлення про те, що пакет аналізу не встановлено на комп'ютері, натисніть кнопку Так, щоб встановити його.

4) У головному меню послідовно виберіть: Дані / Аналіз даних / Інструменти аналізу / Регресія, а потім натисніть кнопку ОК.

5) Заповніть діалогове вікно введення даних та параметрів виведення:

Вхідний інтервал Y- Діапазон, що містить дані результативної ознаки;

Вхідний інтервал X- Діапазон, що містить дані факторної ознаки;

Мітки- прапорець, який вказує, чи містить перший рядок назви стовпців чи ні;

Константа - нуль- Прапорець, що вказує на наявність або відсутність вільного члена у рівнянні;

Вихідний інтервал- Досить вказати ліву верхню комірку майбутнього діапазону;

6) Новий робочий лист – можна задати довільне ім'я нового листа.

Потім натисніть кнопку ОК.

Рисунок 6 Діалогове вікно введення параметрів інструменту Регресія

Результати регресійного аналізудля даних завдання представлені малюнку 7.

Рисунок 7 Результат застосування інструменту регресія

5. Оцінимо за допомогою середньої помилкиапроксимації якість рівнянь. Скористаємося результатами регресійного аналізу, представленого на Рисунку 8.

Рисунок 8 Результат застосування інструменту регресія «Виведення залишку»

Складемо нову таблицюяк показано на малюнку 9. У графі С розрахуємо відносну помилку апроксимації за формулою:

Рисунок 9 Розрахунок середньої помилки апроксимації

Середня помилка апроксимації розраховується за формулою:

Якість побудованої моделі оцінюється як хороша, тому що не перевищує 8 – 10%.

6. З таблиці з регресійною статистикою(Малюнок 4) випишемо фактичне значення F-критерію Фішера:

Оскільки при 5%-ном рівні значимості, можна дійти невтішного висновку про значимість рівняння регресії (зв'язок доведено).

8. Оцінку статистичної значущості параметрів регресії проведемо за допомогою t-статистики Стьюдента та шляхом розрахунку довірчого інтервалу кожного з показників.

Висуваємо гіпотезу Н 0 про статистично незначну відмінність показників від нуля:

для числа ступенів свободи

На малюнку 7 є фактичні значення t-статистики:

t-критерій для коефіцієнта кореляції можна розрахувати двома способами:

I спосіб:

де - Випадкова помилка коефіцієнта кореляції.

Дані до розрахунку візьмемо з таблиці на Рисунку 7.

II спосіб:

Фактичні значення t-статистики перевищують табличні значення:

Тому гіпотеза Н 0 відхиляється, тобто параметри регресії та коефіцієнт кореляції не випадково відрізняються від нуля, а статистично значущі.

Довірчий інтервал для параметра a визначається як

Для параметра a 95% межі як показано на малюнку 7 склали:

Довірчий інтервал для коефіцієнта регресії визначається як

Для коефіцієнта регресії b 95% межі як показано на малюнку 7 склали:

Аналіз верхньої та нижньої меж довірчих інтервалів призводить до висновку про те, що з ймовірністю параметри a і b, перебуваючи у зазначених межах, не набувають нульових значень, тобто. є статистично незначущими і істотно відмінні від нуля.

7. Отримані оцінки рівняння регресії дають змогу використовувати його для прогнозу. Якщо прогнозне значення прожиткового мінімуму становитиме:

Тоді прогнозне значення прожиткового мінімуму становитиме:

Помилку прогнозу розрахуємо за такою формулою:

де

Дисперсію вважатимемо також за допомогою ППП Excel. Для цього:

1) Активізуйте Майстер функцій: у головному меню оберете Формули / Вставити функцію.

3) Заповніть діапазон, що містить числові дані факторної ознаки. Натисніть ОК.

Рисунок 10 Розрахунок дисперсії

Набули значення дисперсії

Для підрахунку залишкової дисперсії на один ступінь свободи скористаємося результатами дисперсійного аналізу, як показано на Рисунку 7.

Довірчі інтервали прогнозу індивідуальних значень у при ймовірності 0,95 визначаються виразом:

Інтервал досить широкий, передусім, рахунок малого обсягу спостережень. Загалом виконаний прогноз середньомісячної заробітної плати виявився надійним.

Умову задачі взято з: Практикум з економетрики: Навч. посібник/І.І. Єлісєєва, С.В. Куришева, Н.М. Гордєєнко та ін; За ред. І.І. Єлісєєвої. – М.: Фінанси та статистика, 2003. – 192 с.: іл.

Для загальної оцінкиякості побудованої економетричної визначаються такі характеристики як коефіцієнт детермінації, індекс кореляції, середня відносна помилкаапроксимації, а також перевіряється значущість рівняння регресії за допомогою F-Крітерія Фішера. Перелічені характеристики є досить універсальними і можуть застосовуватися як для лінійних, так і для нелінійних моделей, а також моделей із двома та більш факторними змінними. Визначальне значення при обчисленні всіх перерахованих характеристик якості має ряд залишків ε i, який обчислюється шляхом віднімання з фактичних (отриманих за спостереженнями) значень досліджуваної ознаки y iзначень, розрахованих за рівнянням моделі y рi.

Коефіцієнт детермінації

показує, яка частка зміни досліджуваного ознаки враховано моделі. Тобто коефіцієнт детермінації показує, яка частина зміни досліджуваної змінної може бути обчислена, виходячи зі змін включених у модель факторних змінних за допомогою обраного типу функції, що зв'язує факторні змінні та досліджувану ознаку в рівнянні моделі.

Коефіцієнт детермінації R 2може приймати значення від 0 до 1. Чим ближче коефіцієнт детермінації R 2до одиниці, тим краща якістьмоделі.

Індекс кореляції можна легко обчислити, знаючи коефіцієнт детермінації:

Індекс кореляції Rхарактеризує тісноту обраного при побудові моделі типу зв'язку між врахованими в моделі факторами та змінною, що досліджується. У разі лінійної парної регресії його значення по абсолютної величинизбігається з коефіцієнтом парної кореляції r(x, y), який ми розглянули раніше, і характеризує тісноту лінійного зв'язку між xі y. Значення індексу кореляції, очевидно, також лежать в інтервалі від 0 до 1. Чим ближче величина Rдо одиниці, тим вибраний вид функції пов'язує між собою факторні змінні і досліджуваний ознака, тим краще якість моделі.

(2.11)

виражається у відсотках та характеризує точність моделі. Прийнятна точність моделі під час вирішення практичних завдань може визначатися, з міркувань економічної доцільності з урахуванням конкретної ситуації. Широко застосовується критерій, за яким точність вважається задовільною, якщо середня відносна похибка менше 15%. Якщо E отн.менше 5%, то кажуть, що модель має високу точність. Не рекомендується застосовувати для аналізу та прогнозу моделі з незадовільною точністю, тобто коли E отн.більше ніж 15%.

F-критерій Фішера використовується з метою оцінки значущості рівняння регресії. Розрахункове значення F-критерію визначається із співвідношення:

. (2.12)

Критичне значення F-критерія визначається за таблицями при заданому рівні значимості α і ступенях свободи (можна використовувати функцію FРАСПОБР Excel). Тут, як і раніше, m- Число факторів, врахованих в моделі, n– кількість спостережень. Якщо розрахункове значення більше критичного, то рівняння моделі визнається значущим. Чим більше розрахункове значення F-Критерію, тим краще якість моделі.

Визначимо характеристики якості збудованої нами лінійної моделі для Приклад 1. Скористаємося даними Таблиці 2. Коефіцієнт детермінації:

Отже, у межах лінійної моделі зміна обсягу продажу на 90,1% пояснюється зміною температури повітря.

Індекс кореляції

Значення індексу кореляції у разі парної лінійної моделі як бачимо, дійсно по модулю дорівнює коефіцієнту кореляції між відповідними змінними (обсяг продажів і температура). Оскільки отримане значення досить близько до одиниці, то можна зробити висновок про наявність тісного лінійного зв'язку між досліджуваною змінною (обсяг продажів) та факторною змінною (температура).

F-критерій Фішера

Критичне значення F крпри α = 0,1; ν 1 =1; ν 2 =7-1-1=5 дорівнює 4,06. Розрахункове значення F-Критерію більше табличного, отже, рівняння моделі є значущим.

Середня відносна помилка апроксимації

Побудована лінійна модель парної регресії має незадовільну точність (>15%), і її рекомендується використовуватиме аналізу та прогнозування.

У результаті, незважаючи на те, що більшість статистичних характеристикзадовольняють критеріям, що висуваються до них, лінійна модель парної регресії непридатна для прогнозування обсягу продажів залежно від температури повітря. Нелінійний характер залежності між зазначеними змінними за даними спостережень добре видно на Рис.1. Проведений аналіз це підтвердив.

Фактичні значення цікавої для нас величини відрізняються від розрахованих за рівнянням регресії. Чим менше ця відмінність, чим ближче розраховані значення підходять до емпіричних даних, тим краща якість моделі. Величина відхилень фактичних та розрахункових значень змінної величини по кожному спостереженню є помилкою апроксимації. Оскільки відхилення може бути величиною як позитивної, і негативної, то помилки апроксимації кожного спостереження прийнято визначати у відсотках по модулю.

Відхилення () розглядаються як абсолютна помилка апроксимації, тоді – відносна помилка апроксимації.

Середня помилка апроксимації визначається як середнє арифметичне: . Іноді користуються визначенням середньої помилки апроксимації, що має вигляд.

Кінець роботи -

Ця тема належить розділу:

Економетрика

На сайті сайт читайте: економічних спеціальностей.

Якщо вам потрібно додатковий матеріална цю тему, або Ви не знайшли те, що шукали, рекомендуємо скористатися пошуком по нашій базі робіт:

Що робитимемо з отриманим матеріалом:

Якщо цей матеріал виявився корисним для Вас, Ви можете зберегти його на свою сторінку в соціальних мережах:

Всі теми цього розділу:

Склад вихідної інформації
Основною базою вихідної інформаціїдля економетричних досліджень служать дані статистики чи дані бухгалтерського обліку. Досліджувані економетрикою взаємозв'язки стохастичні за своєю природою, т.

Інтерполяційний поліном Лагранжа
Нехай є залежність y = f(x) між величинами x та y, для якої нам відомі окремі точки (xi, yi), i = 0,1,2,…,

Випадок 1.
Через одну точку (x0, y0) можна провести пучок прямих y = y0+b(x-x0) (2.1) (а також вертикальну пря)

Випадок 2
Через дві різні точки (x0, y0), (x1, y1) проходить одна і лише одна пряма. Якщо x0 ¹

Випадок 3.
Багаточлен другого ступеня ( квадратична функція), графік якої проходить через три точки (x0, y0), (x1, y1), (x2

Випадок n.
Тепер ясно, що інтерполяційний поліном Лагранжа n-ого ступеня, графік якого проходить через n+1 точку (xi,yi), i=0,1,2,…,n, можна записати у ви

Парна лінійна регресія. Метод найменших квадратів
Нехай є n пар чисел (xi, yi), i=1,2,…,n, щодо яких передбачається, що вони відповідають лінійній залежності між величинами x та y:

Множинна лінійна регресія
Парна регресія може дати хороший результат при моделюванні, якщо вплив інших факторів, що впливають на об'єкт дослідження, можна знехтувати. Але, існує зазвичай кілька

Нелінійні моделі
Ми вивчили застосування методу найменших квадратіввизначення параметрів, які входять у функціональні залежності лінійно. Тому для них у параграфах 3 і 4 вийшли сист

Системи одночасних економетричних рівнянь
Об'єктом статистичного вивченняу соціально-економічних науках є складні системи. Вимірювання тісноти зв'язків між змінними, побудова ізольованих рівнянь регресії

Складові тимчасового ряду
Тимчасовий ряд x(t) – це безліч значень величини x, відповідальних послідовності моментів часу t, тобто. це функція t®x(t), яка зазвичай вважає

Визначення складових часового ряду
Одним із найбільш поширених способів моделювання тенденції тимчасового ряду є побудова аналітичної функції, Що характеризує залежність послідовних значень

При цьому коефіцієнти ak, bk дорівнюватимуть
Якщо функція x (t) парна, тобто. виконується рівність x(-t) = x(t), то в

Тимчасовий ряд як випадковий процес
Нехай значення економічного показника x(t) у будь-який момент часу t є випадкову величину X(t). Припустимо, що слу

Моделі ARIMA
В економетриці аналіз часових рядів з використанням оцінки спектральної щільності (спектральний аналіз) грає, як правило, допоміжну роль, допомагаючи встановити періоди хара

Облік сезонних складових
Узагальнення моделі ARIMA, що дозволяють врахувати періодичні (сезонні) складові тимчасового ряду, було запропоновано Дж. Боксом і Г. Дженкінсом. Цей метод реалізований у системі

Аналіз похибок вихідної інформації
Значення економічних показниківзазвичай відомі неточно, із деякою похибкою. Розглянемо основні правила обробки даних, що містять похибки або помилки вимірювань. Пус

Довірчі інтервали
Введемо випадкову величину. (13.1) Неважко перевірити, що xN(0,1), внаслідок ч

Розрахунок похибок
Емпіричні дані часто піддаються математичній обробці - над ними виконуються арифметичні операції складання, віднімання, множення та поділу, у деяких випадках

Коефіцієнт детермінації
Коефіцієнт детермінації характеризує якість регресійної моделі. Значення різних величин, получ

Принцип максимальної правдоподібності. Побудова регресійних моделей при гетероскедастичності помилок
Для знаходження невідомих величин за результатами вимірювань, що містять випадкові похибки, служить спосіб найменших квадратів (МНК). Визначені величини зазвичай пов'язані рівняннями, що утворюють

Статистичні гіпотези
У попередніх параграфах розглядалася методика моделювання взаємозв'язків економічних показників та процесів. З допомогою отриманих рівнянь регресії моделювалася цей зв'язок.

F – статистика
Значимість регресійної моделі визначається за допомогою F-критерію Фішера. Для цього обчислюється відношення

T – статистика
Для оцінки значущості окремих параметріврегресійної моделі y=a+bx+e їх величина порівнюється зі стандартною помилкою. При цьому розраховується так званий

Схожі статті

Обговорюють:

Таємниці стародавніх – гороскоп Тибету Буддійський гороскоп за датою народження:Здрастуйте, дорогі читачі! У цій статті ми намагатимемося розкрити...
Що означають числа у практиці фен шуй:Символіка чисел у давнину мала магічну силу, але й досі...
Ведичний астролог про дхарму чоловіка та жінки Мокша: значення та цілі:До кожного учня йоги та послідовника вчень індуїзму/ведизму знайома...
Магія еліксирів Знайомтесь: «магічна кухня» скотта каннінгема:Людині завжди здавалося, що термін відпущеного йому життя занадто короткий.