Побудова лінійного рівняння парної регресії. Парна регресія

Рівняння парної регресії.

З поля кореляції можна висунути гіпотезу (для генеральної сукупності) у тому, що зв'язок між усіма можливими значеннями X і Y носить лінійний характер.

Лінійне рівняння регресії має вигляд y = bx + a + ε

Система нормальних рівнянь.

a n + b∑x = ∑y

a∑x + b∑x 2 = ∑y x

Для наших даних система рівнянь має вигляд

12a + 1042 b = 1709

1042 a + 91556 b = 149367

З першого рівняння виражаємо аі підставимо на друге рівняння:

Отримуємо емпіричні коефіцієнти регресії: b = 0.9, a = 64.21

Рівняння регресії (емпіричне рівняння регресії):

y = 0.9 x + 64.21

Емпіричні коефіцієнти регресії aі bє лише оцінками теоретичних коефіцієнтів β i , а саме рівняння відображає лише загальну тенденцію в поведінці змінних, що розглядаються.

Для розрахунку параметрів лінійної регресії збудуємо розрахункову таблицю (табл. 1)

1. Параметри рівняння регресії.

Вибіркові середні.

Вибіркові дисперсії:

Середньоквадратичне відхилення

1.1. Коефіцієнт кореляції

Коваріація.

Розраховуємо показник тісноти зв'язку. Таким показником є ​​вибірковий лінійний коефіцієнт кореляції, який розраховується за такою формулою:

1.2. Рівняння регресії(Оцінка рівняння регресії).

Лінійне рівняння регресії має вигляд y = 0.9 x + 64.21

1.3. Коефіцієнт еластичності.

Коефіцієнт еластичності знаходиться за формулою:

1.4. Помилка апроксимації.

Помилка апроксимації в межах 5%-7% свідчить про хорошому підборірівняння регресії до вихідних даних.

1.5. Емпіричне кореляційне ставлення.

Емпіричне кореляційне ставлення обчислюється всім форм зв'язку і служить вимір тісноти залежності. Змінюється в межах.

Індекс кореляції.

Для лінійної регресії індекс кореляції дорівнює коефіцієнту кореляції r xy = 0.79.

Для будь-якої форми залежності тіснота зв'язку визначається за допомогою множинного коефіцієнта кореляції:

1.6. Коефіцієнт детермінації.

Найчастіше, даючи інтерпретацію коефіцієнта детермінації, його виражають у відсотках.

R 2 = 0.79 2 = 0.62

Для оцінки якості параметрів лінійної регресії збудуємо розрахункову таблицю (табл. 2)

2. Оцінка параметрів рівняння регресії.

2.1. Значення коефіцієнта кореляції.

Для того щоб при рівні значущості α перевірити нульову гіпотезу про рівність нулю генерального коефіцієнта кореляції нормальної двовимірної випадкової величини при конкуруючій гіпотезі H 1 ≠ 0, треба обчислити значення критерію, що спостерігається.

та за таблицею критичних точокрозподілу Стьюдента, за заданим рівнем значущості α і числом ступенів свободи k = n - 2 знайти критичну точку t критий двосторонньої критичної області. Якщо t набл< t крит оснований отвергнуть нулевую гипотезу. Если |t набл | >t критий - нульову гіпотезу відкидають.

За таблицею Стьюдента з рівнем значущості α=0.05 та ступенями свободи k=10 знаходимо t крит:

де m = 1 – кількість пояснюючих змінних.

2.2. Інтервальна оцінка для коефіцієнта кореляції ( довірчий інтервал).

2.3. Аналіз точності визначення оцінок коефіцієнтів регресії.

Незміщеною оцінкою дисперсії збурень є величина:

S 2 y = 53.63 - непояснена дисперсія (захід розкиду залежної змінної навколо лінії регресії).

S y = 7.32 – стандартна помилка оцінки (стандартна помилка регресії).

Sa - стандартне відхиленнядовільної величини a.

S b – стандартне відхилення випадкової величини b.

2.4. Довірчі інтервали для залежної змінної.

(a + bx p ± ε)

Розрахуємо межі інтервалу, в якому буде зосереджено 95% можливих значень Y при необмежено великій кількості спостережень та X p = 107

Індивідуальні довірчі інтервали для Y за даного значення X.

(a + bx i ± ε)

t критий (n-m-1;α/2) = (10;0.025) = 2.228

2.5. Перевірка гіпотез щодо коефіцієнтів лінійного рівняннярегресії.

1) t-статистика. Критерій Стьюдента.

t критий (n-m-1;α/2) = (10;0.025) = 2.228

Довірчий інтервал для коефіцієнтів рівняння регресії.

(b - t крит S b; b + t крит S b)

(a - t критий S a ; a + t критий S a)

2) F-статистика. Критерій Фішера.

Табличне значення критерію зі ступенями свободи k 1 =1 і k 2 =10, F табл = 4.96

Лінійна парна регресія знаходить широке застосування економетриці як чіткої економічної інтерпретації її параметрів. Лінійна регресія зводиться до знаходження рівняння виду

або . (3.6)

Рівняння виду дозволяє за заданими значеннями фактора хмати теоретичні значення результативної ознаки, підставляючи в нього фактичні значення фактора x.

Побудова парної лінійної регресії зводиться до оцінки її параметрів та . Оцінки параметрів лінійної регресії можна знайти різними методами. Наприклад, методом найменших квадратів(МНК).

Відповідно до методу найменших квадратів оцінки параметрів і вибираються таким чином, щоб сума квадратів відхилень фактичних значень результативної ознаки (у)від розрахункових (теоретичних, модельних) була мінімальна. Іншими словами, з усієї множини ліній лінія регресії на графіку вибирається так, щоб сума квадратів відстаней по вертикалі між точками і цією лінією була б мінімальною (рис. 3.2):

, (3.7)

Мал. 3.2. Лінія регресії з мінімальною сумоюквадратів відстаней по вертикалі між точками та цією лінією

Для подальших висновків у виразі (3.7) підставимо модельне значення, тобто і отримаємо:

Щоб знайти мінімум функції (3.8), треба обчислити похідні по кожному з параметрів і і прирівняти їх до нуля:

Перетворюючи цю систему, отримаємо наступну систему нормальних рівнянь для оцінки параметрів і :

. (3.9)

Матрична форма запису цієї системи має вигляд:

. (3.10)

Вирішуючи систему нормальних рівнянь (3.10) у матричній формі отримаємо:

Алгебраїчна форма вирішення системи (3.11) можна записати наступним чином:

Після нескладних перетворень формулу (3.12) можна записати у зручній формі:

Необхідно зауважити, що оцінки параметрів рівняння регресії можна отримати і за іншими формулами, наприклад:

(3.14)

Тут вибірковий парний лінійний коефіцієнткореляції.

Після обчислення параметрів регресії ми можемо записати рівняння математичної моделі регресії:

Необхідно зауважити, що параметр показує середню зміну результату із зміною фактора на одну одиницю. Так, якщо у функції витрат (у -витрати (тис. руб.), х- Кількість одиниць продукції). То, отже, із збільшенням обсягу продукції (х)на 1 од. Витрати виробництва зростають у середньому 2 тис. крб., т. е. додатковий приріст продукції 1 од. вимагатиме збільшення витрат у середньому на 2 тис. руб.

Можливість чіткої економічної інтерпретації коефіцієнта регресії зробила лінійне рівняння регресії досить поширеним у економетричних дослідженнях.

Формально - значення упри х= 0. Якщо ознака-фактор не має і не може мати нульового значення, то вищезазначене трактування вільного члена не має сенсу. Параметр може мати економічного змісту. Спроби економічно інтерпретувати параметр можуть призвести до абсурду, особливо при < 0.

Приклад 3.2. Припустимо по групі підприємств, що випускають той самий вид продукції, розглядається функція витрат: . Інформація, необхідна розрахунку оцінок параметрів і , представлена ​​у табл. 3.1.

Таблиця 3.1

Розрахунковатаблиця

№ підприємства

Випуск продукції, тис. од. ()

Витрати виробництва, млн крб. ()

Система нормальних рівнянь матиме вигляд:

.

Рішення цієї системи за формулою (4.13) дає результат:

Запишемо модель рівняння регресії (4.16):

Підставивши в рівняння значення x, знайдемо теоретичні (модельні) значення у,(Див. останню графу табл. 3.1).

У разі величина параметра немає економічного сенсу.

У цьому прикладі маємо:

Рівняння регресії завжди доповнюється показником тісноти зв'язку. При використанні лінійної регресії як такий показник виступає лінійний коефіцієнт кореляції. Існують різні модифікації формули лінійного коефіцієнта кореляції. Деякі з них наведені нижче:

Як відомо, лінійний коефіцієнт кореляції перебуває у межах: .

Якщо коефіцієнт регресії , то, і, навпаки, при, .

За даними табл. 4.1 величина лінійного коефіцієнта кореляції становила 0,993, що досить близько до 1 означає наявність дуже тісної залежності витрат за виробництво від величини обсягу випущеної продукції.

Слід мати на увазі, що величина лінійного коефіцієнта кореляції оцінює тісноту зв'язку аналізованих ознак її лінійній формі. Тому близькість абсолютної величини лінійного коефіцієнта кореляції до нуля ще означає відсутність зв'язку між ознаками. При іншій специфікації моделі зв'язок між ознаками може бути досить тісним.

Для оцінки якості підбору лінійної функції розраховується квадрат лінійного коефіцієнта кореляції коефіцієнт детермінації.Коефіцієнт детермінації характеризує частку дисперсії результативної ознаки у,зрозумілу регресією, в загальної дисперсіїрезультативної ознаки.

Відповідно величина характеризує частку дисперсії викликану впливом інших не врахованих моделі чинників.

У нашому прикладі. Отже, рівнянням регресії пояснюється 98,6% дисперсії результативної ознаки, а на долю інших факторів припадає лише 1,4% її дисперсії (тобто залишкова дисперсія). Величина коефіцієнта детермінації служить одним із критеріїв оцінки якості лінійної моделі. Чим більша частка поясненої варіації, тим відповідно менше роль інших факторів, і, отже, лінійна модель добре апроксимує вихідні дані і нею можна скористатися для прогнозу значень результативної ознаки. Так, вважаючи, що обсяг продукції підприємства може становити 6 тис. . од., прогнозне значення витрат виробництва виявиться 221,01 тис. крб.

Призначення сервісу. За допомогою сервісу в онлайн режиміможна знайти:
  • параметри рівняння лінійної регресії y=a+bx лінійний коефіцієнт кореляції з перевіркою його значущості;
  • тісноту зв'язку за допомогою показників кореляції та детермінації, МНК-оцінку, статичну надійність регресійного моделюванняза допомогою F-критерію Фішера та за допомогою t-критерію Стьюдента , довірчий інтервал прогнозу для рівня значущості α

Рівняння парної регресії відноситься до рівняння регресії першого порядку. Якщо економетрична модель містить лише одну пояснювальну змінну, вона має назву парної регресії. Рівняння регресії другого порядкуі рівняння регресії третього порядкуставляться до нелінійних рівнянь регресії.

Приклад. Здійсніть вибір залежної (пояснюється) і пояснюючої змінної для побудови парної регресійної моделі. Дайте. Визначте теоретичне рівняння парної регресії. Оцініть адекватність збудованої моделі (інтерпретуйте R-квадрат, показники t-статистики, F-статистики).
Рішеннябудемо проводити на основі процесу економетричного моделювання.
1-й етап (постановочний) – визначення кінцевих цілей моделювання, набору чинників і показників, що беруть участь у моделі, їх ролі.
Специфікація моделі - визначення мети дослідження та вибір економічних змінних моделі.
Ситуаційне (практичне) завдання. По 10 підприємствам регіону вивчається залежність вироблення продукції одного працівника y (тис. крб.) від питомої вагиробітників високої кваліфікації у загальній чисельності робітників x (у %).
2-й етап (апріорний) – передмодельний аналіз економічної сутності досліджуваного явища, формування та формалізація апріорної інформації та вихідних припущень, зокрема що стосується природи та генези вихідних статистичних даних та випадкових залишкових складових у вигляді низки гіпотез.
Вже на цьому етапі можна говорити про явну залежність рівня кваліфікації робітника та його виробленням, адже чим досвідченіший працівник, тим вища його продуктивність. Але як оцінити цю залежність?
Парна регресіяявляє собою регресію між двома змінними - y і x, тобто модель виду:

Де y – залежна змінна (результативна ознака); x - незалежна, або пояснює, змінна (ознака-фактор). Знак «^» означає, що між змінними x і y немає суворої функціональної залежності, тому практично в кожному окремому випадку величина y складається з двох доданків:

Де y – фактичне значення результативної ознаки; y x – теоретичне значення результативної ознаки, знайдене з рівняння регресії; ε – випадкова величина, Що характеризує відхилення реального значення результативної ознаки від теоретичного, знайденого за рівнянням регресії
Графічно покажемо регресійну залежністьміж виробленням продукції одного працівника і частки робітників високої кваліфікації.


3-й етап (параметризація) – власне моделювання, тобто. вибір загального виду моделі, зокрема складу і форми зв'язків, що входять до неї, між змінними. Вибір виду функціональної залежності у рівнянні регресії називається параметризацією моделі. Вибираємо рівняння парної регресії, тобто. на кінцевий результат y впливатиме лише один фактор.
4-й етап (інформаційний) – збирання необхідної статистичної інформації, тобто. реєстрація значень факторів, що беруть участь у моделі, і показників. Вибірка складається із 10 підприємств галузі.
5-й етап (ідентифікація моделі) – оцінювання невідомих параметрів моделі за наявними статистичними даними.
Щоб визначити параметри моделі, використовуємо МНК – метод найменших квадратів. Система нормальних рівнянь виглядатиме так:
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
Для розрахунку параметрів регресії збудуємо розрахункову таблицю (табл. 1).
xyx 2y 2x y
10 6 100 36 60
12 6 144 36 72
15 7 225 49 105
17 7 289 49 119
18 7 324 49 126
19 8 361 64 152
19 8 361 64 152
20 9 400 81 180
20 9 400 81 180
21 10 441 100 210
171 77 3045 609 1356

Дані беремо з таблиці 1 (останній рядок), у результаті маємо:
10a + 171 b = 77
171 a + 3045 b = 1356
Цю СЛАУ вирішуємо методом Крамера або методом зворотної матриці.
Отримуємо емпіричні коефіцієнти регресії: b = 0.3251, a = 2.1414
Емпіричне рівняння регресії має вигляд:
y = 0.3251 x + 2.1414
6-й етап (верифікація моделі) - зіставлення реальних та модельних даних, перевірка адекватності моделі, оцінка точності модельних даних.
Аналіз проводимо за допомогою

100 рбонус за перше замовлення

Виберіть тип роботи Дипломна робота Курсова роботаМагістерська дисертація Звіт з практики Стаття Доповідь Рецензія Контрольна роботаМонографія Розв'язання задач Бізнес-план Відповіді на запитання Творча роботаЕсе Чертеж Твори Переклад Презентації Набір тексту Інше Підвищення унікальності тексту Кандидатська дисертація Лабораторна роботаДопомога on-line

Дізнатись ціну

Парною регресією називається рівняння зв'язку двох змінних

у і х Вида y= f(x),

де у - залежна змінна (результативна ознака);

х - незалежна, що пояснює змінна (ознака-фактор).

Розрізняють лінійні та нелінійні регресії.

Метод найменших квадратів МНК

Для оцінки параметрів регресій, лінійних за цими параметрами, використовується метод найменших квадратів (МНК) . МНК дозволяє отримати такі оцінки параметрів, при яких сума квадратів відхилень фактичних значень результативної ознаки від теоретичних значень ŷ xпри тих же значеннях фактора xмінімальна, тобто.

5. Оцінка статистичної значущості показників кореляції, параметрів рівняння парної лінійної регресії, рівняння регресії загалом.

6. Оцінка ступеня тісноти зв'язку між кількісними змінними. Коефіцієнт коваріації. Показники кореляції: лінійний коефіцієнт кореляції, індекс кореляції (теоретичне кореляційне ставлення).

Коефіцієнт коваріації

Мч(у) - Тобто. отримаємо кореляційну залежність.

Наявність кореляційної залежності неспроможна відповісти питанням про причини зв'язку. Кореляція встановлює лише міру зв'язку, тобто. міру узгодженого варіювання.

Міру взаємозв'язку 2 змінними можна знайти за допомогою коваріації.

, ,

Розмір показника коваріації залежить від одиниць в γ вимірюється змінна. Тож оцінки ступеня узгодженого варіювання використовують коефіцієнт кореляції - безрозмірну характеристику має певний межі варіювання.

7. Коефіцієнт детермінації. Стандартна помилка рівняння регресії.

Коефіцієнт детермінації (rxy2) - характеризує частку дисперсії результативної ознаки y, яка пояснюється дисперсією, у загальній дисперсії результативної ознаки. Чим ближче rxy2 до 1, тим якісніша регресійна модель, тобто вихідна модель добре апроксимує вихідні дані.

8. Оцінка стат значимості показників корр-ії, параметрів рівняння парної лінійної регресії, рівняння регресії загалом: t-критерій Стьюдента, F-Критер Фішера.

9. Нелінійні моделі регресії та їх лінеаризація.

Нелінійні регресії поділяються на два класи : регресії, нелінійні щодо виключених в аналіз пояснюють змінних, але лінійні за параметрами, що оцінюються, і регресії, нелінійні за оцінюваними параметрами.

Приклади регресій, нелінійних по пояснюючих змінних, але лінійних за оцінюваними параметрами:


Нелінійні моделі регресії та їх лінеарізація

При нелінійній залежності ознак, що наводиться до лінійного вигляду, параметри множинної регресіїтакож визначаються по МНК з тією лише різницею, що він використовується не до вихідної інформації, а до перетворених даних. Так, розглядаючи статечну функцію

,

ми перетворюємо її на лінійний вигляд:

де змінні виражені у логарифмах.

Далі обробка МНК та сама: будується система нормальних рівнянь і визначаються невідомі параметри. Потенціюючи значення, знаходимо параметр aі відповідно загальний виглядрівняння статечної функції.

Взагалі кажучи, не лінійна регресіяпо включеним змінним не приховує будь-яких складнощів в оцінці її параметрів. Ця оцінка визначається, як і в лінійній регресії, МНК. Так, у двофакторному рівнянні нелінійної регресії

може бути проведена лінеаризація, введенням у нього нових змінних . В результаті виходить чотирифакторне рівняння лінійної регресії.

10.Мультиколлінеарність. Методи усунення мультиколлінеарності.

Найбільші труднощі у використанні апарату множинної регресії виникають за наявності мультиколінеарності факторів, коли більш ніж два фактори пов'язані між собою лінійною залежністю . Наявність мультиколлінеарності факторів може означати, що деякі фактори завжди діятимуть в унісон. В результаті варіація у вихідних даних перестає бути повністю незалежною, і не можна оцінити вплив кожного фактора окремо.

Чим сильніша мультиколлінеарність факторів, тим менш надійна оцінка розподілу суми поясненої варіації за окремими факторами за допомогою методу найменших квадратів (МНК).

Включення в модель мультиколінеарних факторів небажано наступних причин:

ü утрудняється інтерпретація параметрів множинної регресії; параметри лінійної регресії втрачають економічний зміст;

ü оцінки параметрів ненадійні, виявляють великі стандартні помилкита змінюються зі зміною обсягу спостережень, що робить модель непридатною для аналізу та прогнозування

Методи усунення мультиколінеарності

- Виняток змінної (их) з моделі;

Однак потрібна певна обачність при застосуванні даного методу. У цій ситуації можливі помилки специфікації.

- Отримання додаткових даних або побудова нової вибірки;

Іноді зменшення мультиколлинеарности досить збільшити обсяг вибірки. Наприклад, при використанні щорічних даних можна перейти до поквартальних даних. Збільшення кількості даних зменшує дисперсії коефіцієнтів регресії і цим збільшує їх статистичну значимість. Проте отримання нової вибірки чи розширення старої який завжди можливе чи пов'язані з серйозними витратами. Крім того, такий підхід може збільшити

автокореляцію.

- Зміна специфікації моделі;

У ряді випадків проблема мультиколлінеарності може бути вирішена шляхом зміни специфікації моделі: або змінюється форма моделі, або додаються нові пояснюючі змінні, які не враховані в моделі.

- Використання попередньої інформації про деякі параметри;

11. Класична лінійна модель множинної регр-ії (КЛММР). Визначення параметрів ур-я множинної регр-ії методом найм квадратів.

Парна лінійна регресія

Попередні розрахунки:

;
;
;
;
;

;
.

Побудова таблиці виду

Середнє значення

Формули для розрахунків параметрів:

,
.

Лінейн

Оцінка тісноти зв'язку:

а) коефіцієнт кореляції
, або
;

При комп'ютерному підборі використовувати вбудовану функцію Корел

б) коефіцієнт еластичності
;

в) коефіцієнт детермінації .

Оцінка значущості рівняння регресії загалом:

Попередні розрахунки із побудовою таблиці виду

а) F -критерій Фішерапри числі ступенів свободи
і
і рівні значимості 0,05 дивитись у таблиці. Розрахункове значення критерію:

.

Якщо розрахункове значення F-критерію більше табличного, нульова гіпотеза про відсутність значущого зв'язку ознак xі y відхиляється, і робиться висновок про суттєвість зв'язку.

б) Середня помилка апроксимації

.

Оцінка значущості параметрів регресії:

а) Стандартна помилка параметра a розраховується за формулою

, де
.

б) Стандартна помилка коефіцієнта регресії bрозраховується за формулою

.

в) Стандартна помилка коефіцієнта кореляції розраховується за формулою

.

t-Критерій Ст'юдента при числі ступенів свободи
і рівні значимості 0,05 дивитись у таблиці.

Фактичні значення t-статистики:

,
,
.

Якщо фактичне значення по абсолютної величиниперевищує табличне, гіпотезу про несуттєвість параметра регресії можна відхилити, параметр визнається значущим.

Зв'язок міжF -критерієм Фішера і t -критерієм Ст'юдентавиражається рівністю

.

Розрахунок довірчих інтервалів для параметрів регресії:

Довірчий інтервал для параметра a визначається як
;

довірчий інтервал для коефіцієнта регресії визначається як
.

При комп'ютерному аналізі використовувати в Excel Сервіс/Аналіз даних/Регресія.

Інтервальний прогноз на основі лінійного рівняння регресії:

Нехай – прогнозне значення факторної ознаки;
- Точковий прогноз результативної ознаки. Тоді

а) середня помилка прогнозу :

;

б) довірчий інтервал прогнозу

за допомогою табличного редактораMS Excel

Активізація надбудовиПакет аналізу

Для активізації надбудови Пакет аналізунеобхідно виконати такі дії:

1. Вибрати команду Сервіс/Надбудови.

2. У діалоговому вікні встановити прапорець Пакет аналізу.

Відповідно до варіанта завдання, використовуючи статистичний матеріал, необхідно:

2. Оцінити тісноту зв'язку залежної змінної (результативного фактора) з пояснювальною змінною за допомогою показників кореляції та детермінації.

3. Оцінити за допомогою F-Критер Фішера статистичну надійність моделювання.

4. Оцінити статистичну значущість параметрів регресії та кореляції.

5. Визначити середню помилку апроксимації.

6. Використовуючи коефіцієнт еластичності, виконати кількісну оцінку впливу пояснюючого чинника результат.

7. Виконати точковий та інтервальний прогноз результативної ознаки зі збільшенням пояснювальної ознаки на 25% від її середнього значення (достовірність прогнозу 95%).

8. На одній діаграмі зобразити поле кореляції вихідних даних та пряму регресію.

приклад

Є дані про річну ціну програми «Майстер ділового адміністрування» та кількість слухачів в освітній установі.

I. Вводимо вихідні дані у документ Excel.

ІІ. Викликаємо надбудову Аналіз данихв меню сервіс.

ІІІ. Вибираємо інструмент Регресія.

IV. Заповнюємо відповідні позиції вікна Регресія.

V. Після натискання Ок отримуємо протокол розв'язання задачі.

VI. Аналізуємо отриманий протокол.

1) Коефіцієнт регресії;

Вільний член рівняння регресії
.

Примітка. За потреби результати округляються з необхідною точністю. Вимогу щодо округлення можна провести спочатку, задавши кількість знаків після коми в меню Формат осередку.

Рівняння парної лінійної регресії має вигляд: .

2) Коефіцієнт кореляції
, що свідчить про тісний зв'язок ознак yі x. Коефіцієнт детермінації
. Отримане рівняння регресії пояснює 53% варіації ознаки y, Інші 47% мінливості цієї ознаки обумовлені впливом неврахованих у моделі факторів.

3) Оцінимо статистичну значимість (надійність моделювання) рівняння загалом. Розрахункове значення критерію Фішера зазначено у протоколі,
. Критичне значення цього критерію можна знайти за допомогою статистичної функції FРОЗКЛАДтабличного редактора Еxcel.

Вхідними параметрами цієї функції є:

- Рівень значущості (імовірність), мається на увазі ймовірність помилки відкинути вірну гіпотезу про статистичну незначущість побудованого рівняння регресії. Як правило, вибирають рівень значущості, що дорівнює 0,05 або 0,01;

– число ступенів свободи 1 – збігається з кількістю параметрів при змінній рівнянні регресії, для парної лінійної регресії
це число дорівнює одиниці;

- Число ступенів свободи 2 дорівнює для парної лінійної регресії
, де n- Обсяг вихідних статистичних даних.

Виконуємо дії Вставка/ФункціяВибираємо потрібне.

Оскільки розрахункове значення F-критерію більше табличного, рівного 4,84, нульова гіпотеза про відсутність значущого зв'язку ознак x і y відхиляється і робиться висновок про суттєвість зв'язку.

4) Оцінимо статистичну значимість властивостей aі bу рівнянні регресії за допомогою t- Критерію Ст'юдента.

Розрахункові значення статистики Ст'юдента
,
. Відповідне табличне значення можна визначити через статистичну функцію Стюдрозбірчисло ступенів свободи дорівнює
.

Оскільки фактичні значення абсолютної величини перевищують табличне, рівне 2,2, гіпотезу про несуттєвість параметрів регресії можна відхилити.

5) Визначимо середню помилку апроксимації,
. Знадобиться виконання допоміжних розрахунків, оформлених у вигляді таблиці.

Таким чином, середня помилка апроксимації за цим рівнянням регресії становить 12,66%, модель парної лінійної регресії можна визнати задовільною та придатною для прогнозування.

6) Виконаємо кількісну оцінку впливу фактора xна фактор y, використовуючи коефіцієнт еластичності Для парної лінійної регресії його можна знайти за формулою
. Маємо

.

Отже, зі збільшенням кількості слухачів на 1% річна ціна зменшиться на 0,4%.

7) Виконаємо розрахунок прогнозу yзі збільшенням чинника xна 25% від середнього.

Прогнозне значення.

Точковий прогноз ознаки y: .

Середня помилка прогнозу дорівнює ,

де
- Залишкова дисперсія,
-Дисперсія фактора x.

Чисельне значення суми
у протоколі позначено як залишкове SS.

Тоді
,
.

Найшвидший спосіб отримання допоміжних характеристик - Середнього значення фактора xі - дисперсії, скористатися інструментом Описова статистикау пакеті Аналіз даних.

Протокол виведення результатів має вигляд

Довірчий інтервал прогнозу: , де – відповідне табличне значення критерію Ст'юдента (знайдено раніше за функцією Стюдрозбір,
).

Отже,

тобто. можна бути впевненим на 95%, що ціна річного курсу при 35 слухачах варіюватиметься в зазначених межах(при точковому прогнозі ціни 3,65825 тис. дол.).

8) Для побудови діаграми виконаємо такі дії:

Крок 1 Вставка/Діаграма/Графік

Крок 3Ряд/Додати/Значення/Виділити стовпець регресійних значень фактора - .

Крок 4Підписи осіX/ Виділити стовпець значень x.

Крок 4Кожному з рядів присвоїти ім'я, підписати осі координат та назву діаграми.

Примітка.

Для побудови діаграми значення фактора xмають бути відсортовані за зростанням із збереженням відповідного значення y. Це може бути зроблено так Дані/Сортування/Виділити стовпець, у якому необхідно зробити сортування. Наприклад,

Завдання для самостійної роботи

Варіант 1

x

y

Варіант 2

x– енергоозброєність на 10 підприємствах, кВт;

y- продуктивність праці, тис. руб.

Варіант 3

x- Якість землі, бали;

y- Урожайність, ц/га.

Варіант 4

x- Якість землі, бали;

y- Урожайність, ц/га.

Варіант 5

x– товарообіг;

y-Витрати звернення по відношенню до товарообігу.

Варіант 6

x- електроозброєність на одного робітника;

y- Випуск готової продукціїна одного робітника.

Варіант 7

x-Рівень доходів сім'ї;

y- Витрати на продукти харчування (в розрахунку на 100 руб. Доходів).

Схожі статті

2024 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.