Значимість коефіцієнтів кореляції. Контрольна робота: Оцінка значущості коефіцієнтів регресії та кореляції за допомогою f-критерію Стьюдента

ПОЧАТКОВІ ДАНІ

ОЦІНКА ДОСТАВНОСТІ КОЕФІЦІЄНТА КОРРЕЛЯЦІЇ

Коефіцієнт лінійної кореляції, обчислений за вибірковими даними випадковою величиною. Отриманий з вибірки коефіцієнт кореляції rє оцінкою коефіцієнта кореляції rв генеральної сукупності. Зі зменшенням числа спостережень надійність коефіцієнта кореляції падає. Оцінка суттєвості (значущості) лінійного коефіцієнта кореляції полягає в зіставленні значення rз його середньою квадратичною помилкою:

Оцінюючи значимості коефіцієнта кореляції зазвичай розглядаються такі ситуации.

1. Якщо кількість спостережень досить велика (зазвичай понад 30), а значення коефіцієнта кореляції вбирається у 0.9, розподіл коефіцієнта кореляції rможна вважати приблизно нормальним із середньою квадратичною помилкою

При достатньо великому числіспостережень rповинен перевищувати свою середню помилку щонайменше, ніж утричі: . Якщо це нерівність не виконується, існування зв'язку між ознаками не можна вважати доведеним.

Задавшись певною ймовірністю, можна побудувати довірчі кордони r:

Так, наприклад, за ймовірності 0,95, для якої t= 1,96, довірчі межі становитимуть

,

За ймовірності 0,997, для якої коефіцієнт довіри t= 3, довірчі межі становитимуть

Оскільки значення r не може перевищувати одиницю, то у випадку, якщо > 1, слід зазначити лише нижню межу, тобто стверджувати, що реальна r не менша, ніж .

2. Для малого обсягу вибірки, з розподілом rдалеким від нормального, використовуються інші методи оцінки значущості коефіцієнта кореляції. При невеликій кількості спостережень (n< 30), середня помилкалінійного коефіцієнта кореляції знаходиться за формулою:

а значущість перевіряється на основі tкритерію Стьюдента. При цьому висувається гіпотеза про рівність коефіцієнта кореляції нулю, тобто відсутність зв'язку між y і x в генеральній сукупності. Для цього використовується статистика:

,

розрахункове значення якої зіставляється з табличним, з таблиць розподілу Стьюдента. Якщо нульова гіпотеза вірна, тобто r=0, то розподіл t- критерію підпорядковується закону розподілу Стьюдента з n-2ступенями свободи та прийнятим рівнем значущості (зазвичай 0,05). У кожному конкретному випадку за таблицею розподілу t-критерія Стьюдента знаходиться табличне (критичне) значення t, Яке допустимо при справедливості нульової гіпотези, і з ним порівнюється фактичне (розрахункове) значення t. Якщо t розрах. > t табл. , то нульова гіпотеза відхиляється і лінійний коефіцієнтвважається значним, а зв'язок між xі y- Суттєвою. І навпаки.



3. При малій кількості спостережень у вибірці та високому коефіцієнті кореляції (розподіл rвідрізняється від нормального) для перевірки гіпотези про наявність кореляційного зв'язку, а також побудови довірчого інтервалузастосовується z-перетворення Фішера.

Для цього розраховується величина

Розподіл zнаближається до нормального. Варіація zвиражається формулою

Розрахуємо zкритерій для прикладу 1, оскільки в цьому випадку ми маємо невелику кількість спостережень та високий коефіцієнт кореляції.

.

Щоб не обчислювати значення логарифмів, можна скористатися спеціальними таблицями Z-перетворень (Єфімова М.Р. Стор. 402, Шмойлова Р.А. Стор.446, Єлісєєва І.І. Стор.473). Знаходимо, що коефіцієнт кореляції 0,94 відповідає Z = 1,74.

Ставлення Zдо середньої квадратичної помилки дорівнює 3. Таким чином, ми можемо вважати дійсну наявність зв'язку між величиною випуску продукції та витратою електроенергії для всієї сукупності підприємств.

Розрахунок коефіцієнтів кореляції зробимо у програмі STATISTICA.

Малюнок 1 – Кореляційна матриця.

Кореляція визначає ступінь, з яким значення двох змінних «пропорційні» один до одного. Пропорційністьозначає просто лінійну залежність . Кореляція висока, якщо на графіку залежність можна уявити прямою лінією (з позитивним або негативним кутом нахилу). Таким чином, це найпростіша регресійна модель, що описує залежність однієї змінної від одного фактора.

Зазначимо основні характеристики цього показника.

Він може набувати значень від –1 до +1. Знак "+" означає, що зв'язок прямий (коли значення однієї змінної зростають, значення іншої змінної також зростають), "-" означає, що зв'язок зворотний.

Чим ближче коефіцієнт до 1, величині коефіцієнта кореляції менше 0,3 зв'язок оцінюється як слабкий, від 0,31 до 0,5 – помірний, від 0,51 до 0,7 – значний, від 0,71 до 0,9 – тісний , 0,91 та вище – дуже тісна.

Якщо значення змінних збільшити (зменшити) одне й те число чи одне й те саме число раз, то величина коефіцієнта кореляції не зміниться.

Коефіцієнт кореляції – це показник, що оцінює тісноту лінійного зв'язку між ознаками.

При r= ±1 кореляційний зв'язок представляє лінійну функціональну залежність. При цьому всі значення, що спостерігаються, розташовуються на загальній прямій. Її ще називають лінією регресії. При r= 0 лінійний кореляційний зв'язок відсутня. У цьому групові середні змінних збігаються зі своїми загальними середніми, а лінії регресії паралельні осям координат.

Рівність r= 0 говорить лише про відсутність лінійної кореляційної залежності (некорельованості змінних), але не взагалі про відсутність кореляційної, а тим більше статистичної залежності.

Грунтуючись на коефіцієнтах кореляції, ми не можемо суворо доказати причинної залежності між змінними, проте можете визначити помилкові кореляції, тобто кореляції, які обумовлені впливами «інших», що залишаються поза вашим полем зору змінних.

Основна проблема помилкової кореляції полягає в тому, що ми не знаємо,

хто є її носієм. Тим не менш, якщо ми знаємо, де шукати, то

можна скористатися приватними кореляціями , щоб контролювати (частково виключений) вплив певних змінних.


Малюнок 2 – Діаграми розсіювання.

КУРСОВА РОБОТА

Тема: Кореляційний аналіз

Вступ

1. Кореляційний аналіз

1.1 Поняття кореляційного зв'язку

1.2 Загальна класифікаціякореляційних зв'язків

1.3 Кореляційні поля та мета їх побудови

1.4 Етапи кореляційного аналізу

1.5 Коефіцієнти кореляції

1.6 Нормований коефіцієнт кореляції Браве-Пірсона

1.7 Коефіцієнт рангової кореляціїСпірмена

1.8 Основні властивості коефіцієнтів кореляції

1.9 Перевірка значимості коефіцієнтів кореляції

1.10 Критичні значення коефіцієнта парної кореляції

2. Планування багатофакторного експерименту

2.1 Умова завдання

2.2 Визначення центр плану (основний рівень) та рівня варіювання факторів

2.3 Побудова матриці планування

2.4 Перевірка однорідності дисперсії та рівноточності вимірювання у різних серіях

2.5 Коефіцієнти рівняння регресії

2.6 Дисперсія відтворюваності

2.7 Перевірка значущості коефіцієнтів рівняння регресії

2.8 Перевірка адекватності рівняння регресії

Висновок

Список літератури

ВСТУП

Планування експерименту -математико-статистична дисципліна, що вивчає методи раціональної організації експериментальних досліджень- від оптимального виборудосліджуваних факторів та визначення власне плану експерименту відповідно до його метою до методів аналізу результатів. Початок планування експерименту поклали праці англійського статистика Р.Фішера (1935), який підкреслив, що раціональне планування експерименту дає не менш суттєвий виграш у точності оцінок, ніж оптимальна обробка результатів вимірювань. У 60-х роках 20 століття склалася сучасна теоріяпланування експерименту. Її методи тісно пов'язані з теорією наближення функцій та математичним програмуванням. Побудовано оптимальні планита досліджено їх властивості для широкого класу моделей.

Планування експерименту - вибір плану експерименту, що задовольняє заданим вимогам, сукупність дій спрямованих на розробку стратегії експериментування (від отримання апріорної інформації до отримання працездатної математичної моделі або визначення оптимальних умов). Це цілеспрямоване управління експериментом, що реалізується в умовах неповного знання механізму явища, що вивчається.

У процесі вимірювань, подальшої обробки даних, а також формалізації результатів у вигляді математичної моделі, виникають похибки і втрачається частина інформації, що міститься у вихідних даних. Застосування методів планування експерименту дозволяє визначити похибку математичної моделі та судити про її адекватність. Якщо точність моделі виявляється недостатньою, застосування методів планування експерименту дозволяє модернізувати. математичну модельз проведенням додаткових дослідів без втрати попередньої інформації та з мінімальними витратами.

Мета планування експерименту – знаходження таких умов та правил проведення дослідів за яких вдається отримати надійну та достовірну інформацію про об'єкт з найменшою витратою праці, а також подати цю інформацію у компактній та зручній формі з кількісною оцінкою точності.

Серед основних методів планування, що застосовуються на різних етапахдослідження, що використовують:

Планування експерименту, що відсіює, основне значення якого виділення з усієї сукупності факторів групи істотних факторів, що підлягають подальшому детальному вивченню;

Планування експерименту для дисперсійного аналізу, тобто. складання планів для об'єктів із якісними факторами;

Планування регресійного експерименту, що дозволяє отримувати регресійні моделі (поліноміальні та інші);

Планування екстремального експерименту, де головне завдання – експериментальна оптимізація об'єкта дослідження;

Планування щодо динамічних процесів тощо.

Метою вивчення дисципліни є підготовка студентів до виробничо-технічної діяльності за спеціальністю із застосуванням методів теорії планування та сучасних інформаційних технологій.

Завдання дисципліни: вивчення сучасних методівпланування, організації та оптимізації наукового та промислового експерименту, проведення експериментів та обробки отриманих результатів.

1. Кореляційний аналіз

1.1 Поняття кореляційного зв'язку

Дослідника нерідко цікавить, як пов'язані між собою дві або більше змінних в одній або кількох досліджуваних вибірках. Наприклад, чи може зростання впливати на вагу людини, чи може тиск впливати на якість продукції?

Такі залежність між змінними величинами називається кореляційної, чи кореляцією. Кореляційний зв'язок - це узгоджена зміна двох ознак, що відображає той факт, що мінливість однієї ознаки знаходиться відповідно до мінливості іншої.

Відомо, наприклад, що в середньому між зростанням людей та їхньою вагою спостерігається позитивний зв'язок, і такий, що чим більше зростання, тим більша вага людини. Однак з цього правила є винятки, коли відносно низькі люди мають надмірну вагу, і, навпаки, астеніки, високому зростаннімають малу вагу. Причиною подібних винятків і те, кожен біологічний, фізіологічний чи психологічний ознака визначається впливом багатьох чинників: середовищних, генетичних, соціальних, екологічних тощо.

Кореляційні зв'язки - це ймовірні зміни, які можна вивчати тільки на представницьких вибірках методами математичної статистики. Обидва терміни – кореляційний зв'язок та кореляційна залежність – часто використовуються як синоніми. Залежність має на увазі вплив, зв'язок - будь-які узгоджені зміни, які можуть пояснюватися сотнями причин. Кореляційні зв'язки не можуть розглядатися як свідчення причинно-наслідкової залежності, вони свідчать лише про те, що зміни однієї ознаки, як правило, супроводжують певні зміни іншої.

Кореляційна залежність - це зміни, які вносять значення однієї ознаки у ймовірність появи різних значеньіншої ознаки.

Завдання кореляційного аналізу зводиться до встановлення напряму (позитивне або негативне) і форми (лінійний, нелінійний) зв'язок між варіюючими ознаками, вимірювання її тісноти, і, нарешті, до перевірки рівня значущості отриманих коефіцієнтів кореляції.

Кореляційні зв'язки розрізняються за формою, напрямом та ступенем (силою) .

За формою кореляційний зв'язок може бути прямолінійним або криволінійним. Прямолінійним може бути, наприклад, зв'язок між кількістю тренувань на тренажері та кількістю правильно розв'язуваних завдань у контрольній сесії. Криволінійною може бути, наприклад, зв'язок між рівнем мотивації та ефективністю виконання завдання (рисунок 1). За підвищення мотивації ефективність виконання завдання спочатку зростає, потім досягається оптимальний рівень мотивації, якому відповідає максимальна ефективністьвиконання завдання; подальшого підвищення мотивації супроводжує зниження ефективності.

Рисунок 1 - Зв'язок між ефективністю розв'язання задачі та силою мотиваційної тенденції

У напрямку кореляційний зв'язок може бути позитивним ("прямий") і негативним ("зворотним"). При позитивній прямолінійної кореляціївищим значенням однієї ознаки відповідають вищі значення іншого, а нижчим значенням однієї ознаки - низькі значення іншого (рисунок 2). При негативній кореляції співвідношення обернені (рисунок 3). При позитивній кореляції коефіцієнт кореляції має позитивний знакпри негативній кореляції - негативний знак.

Малюнок 2 – Пряма кореляція

Рисунок 3 – Зворотна кореляція


Малюнок 4 – Відсутність кореляції

Ступінь, сила чи тіснота кореляційного зв'язку визначається за величиною коефіцієнта кореляції. Сила зв'язку не залежить від її спрямованості та визначається за абсолютним значенням коефіцієнта кореляції.

1.2 Загальна класифікація кореляційних зв'язків

Залежно від коефіцієнта кореляції розрізняють такі кореляційні зв'язки:

Сильна або тісна при коефіцієнті кореляції r>0,70;

Середня (при 0,50

Помірна (при 0,30

Слабка (при 0,20

Дуже слабка (при r<0,19).

1.3 Кореляційні поля та мета їх побудови

Кореляція вивчається на підставі експериментальних даних, що є виміряними значеннями (x i , y i) двох ознак. Якщо експериментальних даних небагато, то двовимірний емпіричний розподіл представляється як подвійного ряду значень x i і y i . У цьому кореляційну залежність між ознаками можна описувати різними способами. Відповідність між аргументом та функцією може бути задана таблицею, формулою, графіком тощо.

Кореляційний аналіз, як і інші статистичні методи, заснований на використанні імовірнісних моделей, що описують поведінку досліджуваних ознак деякої генеральної сукупності, з якої отримані експериментальні значення x i y y . Коли досліджується кореляція між кількісними ознаками, значення яких можна точно виміряти в одиницях метричних шкал (метри, секунди, кілограми і т.д.), дуже часто приймається модель двовимірної нормально розподіленої генеральної сукупності. Така модель відображає залежність між змінними величинами x i та y i графічно у вигляді геометричного місця точок у системі прямокутних координат. Цю графічну залежність називають також діаграмою розсіювання або кореляційним полем.
Ця модель двовимірного нормального розподілу (кореляційне поле) дозволяє дати наочну графічну інтерпретацію коефіцієнта кореляції, т.к. розподіл у сукупності залежить від п'яти параметрів: μ x , μ y – середні значення (математичні очікування); σ x ,σ y – стандартні відхилення випадкових величин Х та Y та р – коефіцієнт кореляції, який є мірою зв'язку між випадковими величинами Х та Y.
Якщо р = 0, то значення, x i , y i , отримані з двовимірної нормальної сукупності, розташовуються на графіку в координатах х, в межах області, обмеженою колом (рисунок 5, а). У цьому випадку між випадковими величинами Х та Y відсутня кореляція і вони називаються некорельованими. Для двовимірного нормального розподілу некорелювання означає одночасно і незалежність випадкових величин Х і Y.

Як неодноразово зазначалося, для статистичного висновку про наявність чи відсутність кореляційного зв'язку між досліджуваними змінними необхідно перевірити значущість вибіркового коефіцієнта кореляції. У зв'язку з тим, що надійність статистичних характеристик, у тому числі і коефіцієнта кореляції, залежить від обсягу вибірки, може скластися така ситуація, коли величина коефіцієнта кореляції буде цілком обумовлена ​​випадковими коливаннями у вибірці, на підставі якої він обчислений. При суттєвому зв'язку між змінними коефіцієнт кореляції має істотно відрізнятися від нуля. Якщо кореляційна зв'язок між досліджуваними змінними відсутня, коефіцієнт кореляції генеральної сукупності ρ дорівнює нулю. При практичних дослідженнях, як правило, ґрунтуються на вибіркових спостереженнях. Як будь-яка статистична характеристика, вибірковий коефіцієнт кореляції є випадковою величиною, т. е. його значення випадково розсіюються навколо однойменного параметра генеральної сукупності (справжнього значення коефіцієнта кореляції). За відсутності кореляційного зв'язку між змінними у і хКоефіцієнт кореляції в генеральній сукупності дорівнює нулю. Але через випадковий характер розсіювання принципово можливі ситуації, коли деякі коефіцієнти кореляції, обчислені за вибірками із цієї сукупності, будуть відмінними від нуля.

Чи можуть виявлені відмінності бути приписані до випадкових коливань у вибірці або вони відображають суттєву зміну умов формування відносин між змінними? Якщо значення вибіркового коефіцієнта кореляції потрапляють у зону розсіювання, зумовлену випадковим характером самого показника, це не є доказом відсутності зв'язку. Найбільше, що у своїй можна стверджувати, зводиться до того що, що дані спостережень не заперечують відсутності зв'язок між змінними. Але якщо значення вибіркового коефіцієнта кореляції буде лежати поза згаданою зоною розсіювання, то роблять висновок, що він істотно відрізняється від нуля, і можна вважати, що між змінними у і хІснує статистично значущий зв'язок. Використовуваний на вирішення цього завдання критерій, заснований на розподілі різних статистик, називається критерієм значимості.

Процедура перевірки значущості починається з формулювання нульової гіпотези H0 . У загальному вигляді вона полягає в тому, що між параметром вибірки та параметром генеральної сукупності немає будь-яких суттєвих відмінностей. Альтернативна гіпотеза H1 полягає в тому, що між цими параметрами є суттєві відмінності. Наприклад, під час перевірки наявності кореляції у генеральній сукупності нульова гіпотеза у тому, що справжній коефіцієнт кореляції дорівнює нулю ( Н0: ρ = 0). Якщо результаті перевірки виявиться, що нульова гіпотеза не прийнятна, то вибірковий коефіцієнт кореляції rухзначно відрізняється від нуля (нульова гіпотеза відкидається і приймається альтернативна Н1).Іншими словами, припущення про некорелювання випадкових змінних у генеральній сукупності слід визнати необґрунтованим. І навпаки, якщо основі критерію значимості нульова гіпотеза приймається, тобто. rухлежить у допустимій зоні випадкового розсіювання, то немає підстав вважати сумнівним припущення про некорельованість змінних у генеральній сукупності.

При перевірці значущості дослідник встановлює рівень значущості α, який дає певну практичну впевненість у тому, що помилкові висновки будуть зроблені лише в окремих випадках. Рівень значущості висловлює ймовірність того, що нульова гіпотеза Н0відкидається у той час, коли вона насправді вірна. Ясно, що має сенс вибирати цю ймовірність якнайменшу.

Нехай відомий розподіл вибіркової характеристики, яка є незміщеною оцінкою параметра генеральної сукупності. Вибраному рівню значимості α відповідають під кривою цього розподілу заштриховані площі (див. рис. 24). Незаштрихована площа під кривою розподілу визначає можливість Р = 1 - α . Кордони відрізків на осі абсцис під заштрихованими площами називають критичними значеннями, а самі відрізки утворюють критичну область, чи область відхилення гіпотези.

При процедурі перевірки гіпотези вибіркову характеристику, обчислену за наслідками спостережень, порівнюють із відповідним критичним значенням. При цьому слід розрізняти односторонню та двосторонню критичні області. Форма завдання критичної галузі залежить від постановки завдання під час статистичного дослідження. Двостороння критична область необхідна у разі, коли за порівнянні параметра вибірки і параметра генеральної сукупності потрібно оцінити абсолютну величину розбіжності з-поміж них, т. е. цікаві як позитивні, і негативні різниці між досліджуваними величинами. Коли ж треба переконатися в тому, що одна величина в середньому строго більша або менша за іншу, використовується одностороння критична область (право- або лівостороння). Цілком очевидно, що для того самого критичного значення рівень значущості при використанні односторонньої критичної області менший, ніж при використанні двосторонньої. Якщо розподіл вибіркової характеристики симетричний,

Рис. 24. Перевірка нульової гіпотези H0

рівень значимості двосторонньої критичної області дорівнює α, а односторонньої - (див. рис. 24). Обмежимося лише загальною постановкою проблеми. Докладніше з теоретичним обгрунтуванням перевірки статистичних гіпотез можна ознайомитися у спеціальній літературі. Далі ми лише вкажемо критерії значущості для різних процедур, не зупиняючись з їхньої побудові.

Перевіряючи значущість коефіцієнта парної кореляції, встановлюють наявність або відсутність кореляційного зв'язку між явищами, що досліджуються. За відсутності зв'язку коефіцієнт кореляції генеральної сукупності дорівнює нулю (ρ = 0). Процедура перевірки починається з формулювання нульової та альтернативної гіпотез:

Н0: різницю між вибірковим коефіцієнтом кореляції. r і ρ = 0 незначно,

Н1: різниця між rі ρ = 0 значуще, і отже, між змінними уі хє суттєвий зв'язок. З альтернативної гіпотези випливає, що потрібно скористатися двосторонньою критичною областю.

У розділі 8.1 вже згадувалося, що вибірковий коефіцієнт кореляції за певних передумов пов'язаний із випадковою величиною t, що підпорядковується розподілу Стьюдента з f = п- 2 ступенями свободи. Обчислена за результатами вибірки статистика

порівнюється з критичним значенням, що визначається за таблицею розподілу Стьюдента при заданому рівні значущості α іf = п- 2 степенях свободи. Правило застосування критерію ось у чому: якщо | t| >tf, то нульова гіпотеза на рівні значимості відкидається, т. е. зв'язок між змінними значима; якщо | t| ≤tf, то нульова гіпотеза на рівні значущості приймається. Відхилення значення r від ρ = 0 можна приписати довільної варіації. Дані вибірки характеризують аналізовану гіпотезу як можливу і правдоподібну, т. е. гіпотеза про відсутність зв'язку не викликає заперечень.

Процедура перевірки гіпотези значно спрощується, якщо замість статистики tскористатися критичними значеннями коефіцієнта кореляції, які можуть бути визначені через квантил розподілу Стьюдента шляхом підстановки (8.38) t= tf, а і r= ρ f, а:

(8.39)

Існують докладні таблиці критичних значень, витримка з яких наведена у додатку цієї книги (див. табл. 6). Правило перевірки гіпотези у разі зводиться до такого: якщо r> ρ f, а, то можемо стверджувати, що зв'язок між змінними є суттєвим. Якщо rrf, то результати спостережень вважаємо несуперечливими гіпотезі про відсутність зв'язку.

Вступ. 2

1. Оцінка значущості коефіцієнтів регресії та кореляції за допомогою f-критерію Стьюдента. 3

2. Розрахунок значущості коефіцієнтів регресії та кореляції за допомогою f-критерію Стьюдента. 6

Висновок. 15

Після побудови рівняння регресії необхідно зробити перевірку його значимості: з допомогою спеціальних критеріїв встановити, чи є отримана залежність, виражена рівнянням регресії, випадкової, тобто. чи можна її використовувати з прогнозною метою і для факторного аналізу. У статистиці розроблено методики суворої перевірки значущості коефіцієнтів регресії за допомогою дисперсійного аналізу та розрахунку спеціальних критеріїв (наприклад, F-критерію). Нестрога перевірка може бути виконана шляхом розрахунку середнього відносного лінійного відхилення (е), що називається середньою помилкою апроксимації:

Перейдемо тепер до оцінки значущості коефіцієнтів регресії bj і побудові довірчого інтервалу параметрів регресійної моделі Ру (J=l,2,..., р).

Блок 5 - оцінка значимості коефіцієнтів регресій за величиною ^-критерію Стьюдента. Розрахункові значення ta порівнюються з допустимим значенням

Блок 5 - оцінка значимості коефіцієнтів регресій за величиною -критерію. Розрахункові значення t0n порівнюються з допустимим значенням 4,/, яке визначається за таблицями t - розподілу для заданої ймовірності помилок (а) та числа ступенів свободи (/).

Крім перевірки значимості всієї моделі, необхідно провести перевірки значущості коефіцієнтів регресії за критерієм Стюдента. Мінімальне значення коефіцієнта регресії Ьг має відповідати умові bifob-^t, де bi - значення коефіцієнта рівняння регресії в натуральному масштабі при i-ц факторної ознаки; аь. - Середня квадратична помилка кожного коефіцієнта. непорівнянність між собою за своєю значимістю коефіцієнтів D;

Подальший статистичний аналіз стосується перевірки важливості коефіцієнтів регресії. Для цього знаходимо значення ^-критерію для коефіцієнтів регресії. В результаті їх порівняння визначається найменший за величиною -критерій. Фактор, коефіцієнту якого відповідає найменший -критерій, виключається з подальшого аналізу.

Для оцінки статистичної значущості коефіцієнтів регресії та кореляції розраховуються t-критерій Ст'юдента та довірчі інтервали кожного з показників. Висувається гіпотеза Але про випадкову природу показників, тобто. про незначне їх відмінність від нуля. Оцінка значущості коефіцієнтів регресії та кореляції за допомогою f-критерію Стьюдента проводиться шляхом зіставлення їх значень із величиною випадкової помилки:

Оцінка значимості коефіцієнтів чистої регресії за допомогою /-критерію Стьюдента зводиться до обчислення значення

Якість праці - характеристика конкретної праці, що відбиває ступінь його складності, напруженості (інтенсивності), умови значимість у розвиток економіки. К.т. вимірюється у вигляді тарифної системи, що дозволяє диференціювати заробітну плату залежно від рівня кваліфікації (складності праці), умов, тяжкості праці та її інтенсивності, і навіть значимості окремих галузей і виробництв, районів, територій у розвиток економіки нашої країни. К.т. знаходить вираз у заробітній платі працівників, що складається на ринку праці під впливом попиту та пропозиції робочої сили (конкретні види праці). К.т. - складна за структурою

Отримані бали відносної значимості окремих економічних, соціальних та екологічних наслідків здійснення проекту дають далі основу для порівняння альтернативних проектів та їх варіантів за допомогою "комплексного бального безрозмірного критерію соціальної та еколого-економічної ефективності" проекту Ек, що розраховується (у усереднених балах значущості)

Внутрішньогалузеве регулювання забезпечує відмінності в оплаті праці працівників цієї галузі промисловості залежно від значущості окремих видів виробництва даної галузі, від складності та умов праці, а також від застосовуваних форм оплати праці.

Отримана рейтингова оцінка підприємства, що аналізується, по відношенню до підприємства-еталону без урахування значимості окремих показників є порівняльною. При порівнянні рейтингових оцінок кількох підприємств найвищий рейтинг має підприємство із мінімальним значенням отриманої порівняльної оцінки.

Розуміння якості товару як міри його корисності ставить практично важливе питання про її вимір. Його рішення досягається вивченням значимості окремих властивостей у задоволенні певної потреби. Значимість навіть однієї й тієї ж якості може бути неоднаковою залежно та умовами споживання товару. Отже, і корисність товару за різних обставин її використання різна.

Другий етап роботи - вивчення статистичних даних та виявлення взаємозв'язку та взаємодії показників, визначення значущості окремих факторів та причин зміни загальних показників.

Всі аналізовані показники зводяться в один такий спосіб, що в результаті виходить комплексна оцінка всіх аналізованих сторін діяльності підприємства з урахуванням умов його діяльності, з урахуванням ступеня значимості окремих показників для різних типів інвесторів:

p align="justify"> Коефіцієнти регресії показують інтенсивність впливу факторів на результативний показник. Якщо проведено попередню стандартизацію факторних показників, то Ь0 дорівнює середньому значенню результативного показника в сукупності. Коефіцієнти Ь, Ь2 ..... Ьл показують, на скільки одиниць рівень результативного показника відхиляється від свого середнього значення, якщо значення факторного показника відхиляються від середнього, що дорівнює нулю, на одне стандартне відхилення. Отже, коефіцієнти регресії характеризують ступінь значимості окремих чинників підвищення рівня результативного показника. Конкретні значення коефіцієнтів регресії визначають за емпіричними даними згідно з методом найменших квадратів (в результаті розв'язання систем нормальних рівнянь).

2. Розрахунок значущості коефіцієнтів регресії та кореляції за допомогою f-критерію Стьюдента

Розглянемо лінійну форму багатофакторних зв'язків як найбільш просту, а й як форму, передбачену пакетами прикладних програм для ПЕОМ. Якщо ж зв'язок окремого фактора з результативною ознакою не є лінійним, то роблять лінеаризацію рівняння шляхом заміни чи перетворення величини факторної ознаки.

Загальний вигляд багатофакторного рівняння регресії має вигляд:


де k – число факторних ознак.

Щоб спростити систему рівнянь МНК, необхідну обчислення параметрів рівняння (8.32), зазвичай вводять величини відхилень індивідуальних значень всіх ознак середніх величин цих ознак.

Отримуємо систему k рівнянь МНК:

Вирішуючи цю систему, отримуємо значення коефіцієнтів умовно чистої регресії b. Вільний член рівняння обчислюється за формулою


Термін «коефіцієнт умовно-чистої регресії» означає, що кожна з величин bj вимірює середнє за сукупністю відхилення результативної ознаки від його середньої величини при відхиленні даного фактора хj від своєї середньої величини на одиницю його вимірювання та за умови, що всі інші фактори, що входять до рівняння регресії, закріплені на середніх значеннях, не змінюються, не змінюються.

Отже, на відміну коефіцієнта парної регресії коефіцієнт умовно-чистої регресії вимірює вплив чинника, абстрагуючись від зв'язку варіації цього з варіацією інших чинників. Якщо було б можливим включити до рівняння регресії всі чинники, що впливають варіацію результативного ознаки, то величини bj. можна було б вважати за заходи чистого впливу факторів. Але оскільки реально неможливо включити всі чинники рівняння, то коефіцієнти bj. не вільні від домішки впливу факторів, що не входять до рівняння.

Включити всі фактори в рівняння регресії неможливо з однієї з трьох причин або відразу з усіх, оскільки:

1) частина факторів може бути невідома сучасній науці, пізнання будь-якого процесу завжди неповне;

2) у відомих теоретичних чинників немає інформації чи така ненадійна;

3) чисельність досліджуваної сукупності (вибірки) обмежена, що дозволяє включити до рівняння регресії обмежену кількість факторів.

Коефіцієнти умовно чистої регресії bj. є іменованими числами, вираженими у різних одиницях виміру, і тому незрівнянні друг з одним. Для перетворення в порівняні відносні показники застосовується те саме перетворення, що й отримання коефіцієнта парної кореляції. Отриману величину називають стандартизованим коефіцієнтом регресії або ?-коефіцієнтом.


Коефіцієнт при факторі хj, визначає міру впливу варіації фактора хj на варіацію результативної ознаки при відволіканні від супутньої варіації інших факторів, що входять до рівняння регресії.

Коефіцієнти умовно-чистої регресії корисно висловити як відносних порівняних показників зв'язку, коефіцієнтів еластичності:

p align="justify"> Коефіцієнт еластичності фактора хj говорить про те, що при відхиленні величини даного фактора від його середньої величини на 1% і при відволіканні від супутнього відхилення інших факторів, що входять до рівняння, результативна ознака відхилиться від свого середнього значення на ej відсотків від у. Найчастіше інтерпретують і застосовують коефіцієнти еластичності в термінах динаміки: зі збільшенням фактора х.на 1% його середньої величини результативна ознака збільшиться на е. відсотків його середньої величини.

Розглянемо розрахунок та інтерпретацію рівняння багатофакторної регресії на прикладі тих самих 16 господарств (табл. 8.1). Результативна ознака – рівень валового доходу та три фактори, що впливають на нього, представлені в табл. 8.7.

Нагадаємо ще раз, що для отримання надійних і досить точних показників кореляційного зв'язку необхідна численніша сукупність.


Таблиця 8.7

Рівень валового доходу та його фактори

Номери господарств

Валовий дохід, руб.

Витрати праці, чол.-дні/га х1

Частка ріллі,

Надій молока на 1 корову,

Таблиця 8.8 Показники рівняння регресії

Dependent variable: у

Regression coefficient

Constant-240,112905

Std. error оf est. = 79,243276


Рішення проведено за програмою Microstat для ПЕОМ. Наведемо таблиці з друку: табл. 8.7 дає середні величини та середні квадратичні відхилення всіх ознак. Табл. 8.8 містить коефіцієнти регресії та їх ймовірнісну оцінку:

перша графа "var" - змінні, тобто фактори; друга графа "regression coefficient" - коефіцієнти умовно-чистої регресії bj; третю графу «std. errror» - середні помилки оцінок коефіцієнтів регресії; четверта графа – значення t-критерію Стьюдента при 12 ступенях свободи варіації; п'ята графа «prob» - ймовірність нульової гіпотези щодо коефіцієнтів регресії;

шоста графа "partial r2" - приватні коефіцієнти детермінації. Зміст та методика розрахунку показників у графах 3-6 розглядаються далі у розділі 8. «Constant» - вільний член рівняння регресії a; «Std. error of est.» - Середня квадратична помилка оцінки результативної ознаки рівняння регресії. Було отримано рівняння множинної регресії:

у = 2,26 x1 - 4,31 х2 + 0,166 х3 - 240.

Це означає, що величина валового доходу на 1 га сільгоспугідь у середньому за сукупністю зростала на 2,26 руб. зі збільшенням витрат праці на 1 год/га; зменшувалась у середньому на 4,31 руб. при зростанні частки ріллі в сільгоспугіддях на 1% і збільшувалася на 0,166 руб. при зростанні надою молока на корову на 1 кг. Негативна величина вільного члена цілком закономірна, і, як уже зазначено у п. 8.2, результативна ознака - валовий дохід стає нульовим задовго до досягнення нульових значень факторів, що у виробництві неможливе.

Негативне значення коефіцієнта при х^ - сигнал про суттєве неблагополуччя в економіці досліджуваних господарств, де рослинництво збиткове, а прибуткове лише тваринництво. При раціональних методах ведення сільського господарства та нормальних цінах (рівноважних чи близьких до них) на продукцію всіх галузей, дохід повинен не зменшуватися, а зростати зі збільшенням найбільш родючої частки у сільгоспугіддях – ріллі.

На основі даних передостанніх двох рядків табл. 8.7 та табл. 8.8 розрахуємо р-коефіцієнти та коефіцієнти еластичності згідно з формулами (8.34) та (8.35).

Як на варіацію рівня доходу, так і на його можливу зміну в динаміці найсильніше впливає фактор х3 – продуктивність корів, а найслабше – х2 – частка ріллі. Значення Р2/ використовуватимуться надалі (табл. 8.9);

Таблиця 8.9 Порівняльний вплив факторів на рівень доходу

Чинники хj


Отже, ми отримали, що?-коефіцієнт фактора хj відноситься до коефіцієнта еластичності цього фактора, як коефіцієнт варіації фактора до коефіцієнта варіації результативної ознаки. Оскільки, як видно з останнього рядка табл. 8.7, коефіцієнти варіації всіх факторів менші за коефіцієнт варіації результативної ознаки; всі?-коефіцієнти менше коефіцієнтів еластичності.

Розглянемо співвідношення між парним і умовно-чистим коефіцієнтом регресії з прикладу чинника -с,. Парне лінійне рівняння зв'язку у с х має вигляд:

y = 3,886x1 - 243,2

Умовно-чистий коефіцієнт регресії при x1 становить лише 58% парного. Інші 42% пов'язані з тим, що варіації x1 супроводжує варіація факторів x2 x3, яка, у свою чергу, впливає на результативну ознаку. Зв'язки всіх ознак та його коефіцієнти парних регресій представлені на графі зв'язків (рис. 8.2).


Якщо скласти оцінки прямого та опосередкованого впливу варіації х1 на у, тобто добутку коефіцієнтів парних регресій по всіх «шляхах» (рис. 8.2), отримаємо: 2,26 + 12,55 · 0,166 + (-0,00128) · (-4,31) + (-0,00128) · 17,00 · 0,166 = 4,344.

Ця величина навіть більша за парний коефіцієнт зв'язку x1 з у. Отже, непрямий вплив варіації x1 через ознаки-фактори, що не входять до рівняння, - зворотне, що дає в сумі:

1 Айвазян С.А., Мхітарян В.С. Прикладна статистика та основи економетрики. Підручник для вишів. - М.: ЮНІТІ, 2008, - 311с.

2 Джонстон Дж. Економетричні методи. - М: Статистика, 1980,. - 282с.

3 Доугерті К. Введення в економетрику. - М: ІНФРА-М, 2004, - 354с.

4 Дрейєр Н., Сміт Р., Прикладний регресійний аналіз. - М.: Фінанси та статистика, 2006, - 191с.

5 Магнус Я.Р., Картишев П.К., Пересецький А.А. Економетрики. Початковий курс.-М.: Справа, 2006, - 259с.

6 Практикум з економетрики / Под ред. І.І.Єлісєєвої.- М.: Фінанси та статистика, 2004, - 248с.

7 Економетрика / Под ред. І.І.Єлісєєвої.- М.: Фінанси та статистика, 2004, - 541с.

8 Кремер Н., Путко Б. Економетрика. - М.: ЮНІТІ-ДАНА, 200, - 281с.


Айвазян С.А., Мхітарян В.С. Прикладна статистика та основи економетрики. Підручник для вишів. - М.: ЮНІТІ, 2008,-с. 23.

Кремер Н., Путко Б. Економетрика. - М.: ЮНІТІ-ДАНА, 200, -с.64

Дрейєр Н., Сміт Р., Прикладний регресійний аналіз. - М.: Фінанси та статистика, 2006, - с57.

Практикум з економетрики / Под ред. І.І.Єлісеєвої.- М.: Фінанси та статистика, 2004, -з 172.

Схожі статті

2022 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.