Регресійна залежність. Регресійний аналіз у Microsoft Excel

А) Графічний аналіз простий лінійної регресії.

Просте лінійне рівняння регресії y = a + bx. Якщо між випадковими величинами У та X існує кореляційний зв'язок, то значення у = ý + ,

де y – теоретичне значення у, отримане з рівняння y = f(x),

 – похибка відхилення теоретичного рівняння від фактичних (експериментальних) даних.

Рівняння залежності середньої величини від х, тобто ý = f(x) називають рівнянням регресії. Регресійний аналіз складається з чотирьох етапів:

1) постановка завдання та встановлення причин зв'язку.

2) обмеження об'єкта досліджень, збирання статистичної інформації.

3) вибір рівняння зв'язку на основі аналізу та характеру зібраних даних.

4) розрахунок числових значень, показників кореляційного зв'язку.

Якщо дві змінні пов'язані таким чином, що зміна однієї змінної відповідає систематичній зміні іншої змінної, то для оцінки та вибору рівняння зв'язку між ними застосовують регресійний аналіз, якщо ці змінні відомі. На відміну від регресійного аналізу кореляційний аналіз застосовують для аналізу тісноти зв'язку між X і У.

Розглянемо знаходження прямої при регресійному аналізі:

Теоретичне рівняння регресії.

Термін «проста регресія» вказує на те, що величина однієї змінної оцінюється на основі знань про іншу змінну. На відміну від простої, багатофакторна регресія застосовується для оцінки змінної на основі знання двох, трьох і більше змінних. Розглянемо графічний аналіз простої лінійної регресії.

Припустимо, є результати відбіркових випробувань за попереднім наймом на роботу та продуктивністю праці.

Результати відбору (100 балів), x

Продуктивність (20 балів), y

Нанісши крапки на графік, отримаємо діаграму (поле) розсіювання. Використовуємо її для аналізу результатів відбірних випробувань та продуктивності праці.

За діаграмою розсіювання проаналізуємо лінію регресії. У регресійному аналізі завжди вказуються хоча б дві змінні. Систематичне зміна однієї змінної пов'язані з зміною інший. основна ціль регресійного аналізуполягає в оцінці величини однієї змінної, якщо величина іншої змінної відома. Для повної задачі важливою є оцінка продуктивності праці.

Незалежною змінноюу регресійному аналізі називається величина, яка використовується як основа для аналізу іншої змінної. У разі – це результати відбіркових випробувань (по осі X).

Залежною змінноюназивається оцінювана величина (по осі У). У регресійному аналізі може бути лише одна залежна змінна та кілька незалежних змінних.

Для простого регресійного аналізу залежність можна у двокоординатної системі (х і у), по осі X – незалежна змінна, по осі У – залежна. Наносимо точки перетину таким чином, щоб на графіку було представлено пару величин. Графік називають діаграмою розсіювання. Її побудова – це другий етап регресійного аналізу, оскільки перший – це вибір аналізованих величин та збір даних вибірки. Отже, регресійний аналіз застосовується для статистичного аналізу. Зв'язок між вибірковими даними діаграми лінійний.

Для оцінки величини змінної у на основі змінної х необхідно визначити положення лінії, яка найкращим чиномпредставляє зв'язок між х і у на основі розташування точок діаграми розсіювання. У прикладі це аналіз продуктивності. Лінія, проведена через точки розсіювання – лінія регресії. Одним із способів побудови лінії регресії, заснованому на візуальному досвіді, є спосіб побудови від руки. На нашій лінії регресії можна визначити продуктивність праці. При знаходженні рівняння лінії регресії

часто застосовують критерій найменших квадратів. Найбільш підходящою є та лінія, де сума квадратів відхилень мінімальна

Математичне рівняння лінії зростання представляє закон зростання арифметичної прогресії:

у = аbх.

Y = а + bх– наведене рівняння з одним параметром є найпростішим видом рівняння зв'язку. Воно прийнятне для середніх величин. Щоб точніше висловити зв'язок між хі у, вводиться додатковий коефіцієнт пропорційності bщо вказує нахил лінії регресії.

Б) Побудова теоретичної лінії регресії.

Процес її знаходження полягає у виборі та обґрунтуванні типу кривої та розрахунків параметрів а, b, зі т.д. Процес побудови називають вирівнюванням і запас кривих, пропонованих мат. аналізом, різноманітний. Найчастіше в економічні завданнявикористовують сімейство кривих, рівняння, які виражаються багаточленами цілих позитивних ступенів.

1)
- Рівняння прямої,

2)
- Рівняння гіперболи,

3)
- Рівняння параболи,

де - ординати теоретичної лінії регресії.

Вибравши тип рівняння, необхідно знайти параметри, від яких це рівняння залежить. Наприклад, характер розташування точок у полі розсіювання показав, що теоретична лінія регресії є прямою.

Діаграма розсіювання дозволяє уявити продуктивність праці з допомогою регресійного аналізу. В економіці за допомогою регресійного аналізу передбачаються багато показників, що впливають на кінцевий продукт (з урахуванням ціноутворення).

В) Критерій найменших кадратів знаходження прямої лінії.

Один із критеріїв, які ми могли б застосувати для відповідної лінії регресії на діаграмі розсіювання, заснований на виборі лінії, для якої сума квадратів похибок буде мінімальною.

Близькість точок розсіювання до прямої вимірюється ординатами відрізків. Відхилення цих точок можуть бути позитивними та негативними, але сума квадратів відхилень теоретичної прямої від експериментальної завжди позитивна і має бути мінімальною. Факт розбіжності всіх точок розсіювання зі становищем лінії регресії свідчить про існування розбіжності між експериментальними і теоретичними даними. Таким чином, можна сказати, що жодна інша лінія регресії, крім тієї, яку знайшли, не може дати меншу суму відхилень між експериментальними та досвідченими даними. Отже, знайшовши теоретичне рівняння ý та лінію регресії, ми задовольняємо вимогам найменших квадратів.

Це робиться за допомогою рівняння зв'язку
, використовуючи формули для знаходження параметрів аі b. Взявши теоретичне значення
і позначивши ліву частинурівняння через f, отримаємо функцію
від невідомих параметрів аі b. Значення аі bбудуть задовольняти мінімум функції fта перебувають з рівнянь приватних похідних
і
. Це необхідна умоваПроте для позитивної квадратичної функції це є і достатньою умовою для знаходження аі b.

Виведемо з рівнянь похідних формули формули параметрів аі b:



отримаємо систему рівнянь:

де
- Середньоарифметичні похибки.

Підставивши числові значення, знайдемо параметри аі b.

Існує поняття
. Це коефіцієнт апроксимації.

Якщо е < 33%, то модель приемлема для дальнейшего анализа;

Якщо е> 33%, то беремо гіперболу, параболу тощо. Це дає право для аналізу у різних ситуаціях.

Висновок: за критерієм коефіцієнта апроксимації найбільш підходящою є та лінія, для яких

і жодна інша лінія регресії для нашого завдання не дає мінімум відхилень.

Г) Квадратична помилка оцінки, перевірка їхньої типовості.

Стосовно сукупності, у якої число параметрів дослідження менше 30 ( n < 30), для проверки типичности параметров уравнения регрессии используется t-Критерій Стьюдента. При цьому обчислюється фактичне значення t-критерія:

Звідси

де - Залишкова середньоквадратична похибка. Отримані t aі t bпорівнюють із критичним t kіз таблиці Стьюдента з урахуванням прийнятого рівня значущості ( = 0,01 = 99% або  = 0,05 = 95%). P = f = k 1 = m- Число параметрів досліджуваного рівняння (ступінь свободи). Наприклад, якщо y = a + bx; m = 2, k 2 = f 2 = p 2 = n – (m+ 1), де n– кількість досліджуваних ознак.

t a < t k < t b .

Висновок: за перевіреними на типовість параметрами рівняння регресії проводиться побудова математичної моделі зв'язку
. При цьому параметри застосованої в аналізі математичної функції (лінійна, гіпербола, парабола) набувають відповідних кількісних значень. Смисловий зміст одержаних таким чином моделей полягає в тому, що вони характеризують середню величину результативної ознаки
від факторної ознаки X.

Д) Криволінійна регресія.

Досить часто зустрічається криволінійна залежність, коли між змінними встановлюється співвідношення, що змінюється. Інтенсивність зростання (зменшення) залежить від рівня перебування X. Криволінійна залежність буває різних видів. Наприклад, розглянемо залежність між урожаєм та опадами. Зі збільшенням опадів за рівних природних умов інтенсивне збільшення врожаю, але до певної межі. Після критичної точки опади виявляються зайвими і врожайність катастрофічно падає. З прикладу видно, що спочатку зв'язок був позитивним, а потім негативним. Критична точка - оптимальний рівень ознаки X, якому відповідає максимальне чи мінімальне значення ознаки У.

В економіці такий зв'язок спостерігається між ціною та споживанням, продуктивністю та стажем.

Параболічна залежність.

Якщо дані показують, що збільшення факторної ознаки призводить до зростання результативної ознаки, то як рівняння регресії береться рівняння другого порядку (парабола).

. Коефіцієнти a,b,c перебувають з рівнянь приватних похідних:

Отримуємо систему рівнянь:

Види криволінійних рівнянь:

,

,

Має право припускати, що між продуктивністю праці та балами відбіркових випробувань існує криволінійна залежність. Це означає, що зі зростанням бальної системи продуктивність почне на якомусь рівні зменшуватися, тому пряма модель може бути криволінійною.

Третьою моделлю буде гіпербола, і у всіх рівняннях замість змінної х стоятиме вираз.

У своїх роботах, датованих ще 1908 роком. Він описав його на прикладі роботи агента, який здійснює продаж нерухомості. У своїх записах спеціаліст з торгівлі будинками вів облік широкого спектра вихідних даних кожної конкретної будівлі. За результатами торгів визначалося, який фактор мав найбільший впливна ціну правочину.

Аналіз великої кількостіугод дав цікаві результати. На кінцеву вартість впливали безліч факторів, іноді призводячи до парадоксальних висновків і навіть до явних «викидів», коли будинок із високим початковим потенціалом продавався за заниженим ціновим показником.

Другим прикладом застосування такого аналізу наведено роботу, якій було довірено визначення винагороди співробітникам. Складність завдання полягала в тому, що була потрібна не роздача фіксованої суми кожному, а сувора відповідність її величини безпосередньо виконаній роботі. Поява безлічі завдань, мають практично подібний варіант рішення, зажадало більш детального вивчення на математичному рівні.

У значне місце було відведено під розділ «регресійний аналіз», у ньому об'єдналися практичні методи, що використовуються для дослідження залежностей, що підпадають під поняття регресійних. Ці взаємозв'язки спостерігаються між даними, отриманими під час статистичних досліджень.

Серед безлічі розв'язуваних задач основними ставить перед собою три цілі: визначення рівняння регресії загального вигляду; побудова оцінок параметрів, які є невідомими, що входять до складу рівняння регресії; перевірка статистичних регресійних гіпотез. В ході вивчення зв'язку, що виникає між парою величин, отриманих в результаті експериментальних спостережень і складових ряд (множина) типу (x1, y1), ..., (xn, yn), спираються на положення теорії регресії і припускають, що для однієї величини Y спостерігається певний ймовірнісний розподіл, при тому, що інше X залишається фіксованим.

Результат Y залежить від значення змінної X, ця залежність може визначатися різними закономірностями, при цьому на точність отриманих результатів впливає характер спостережень і мета аналізу. Експериментальна модель ґрунтується на певних припущеннях, які є спрощеними, але правдоподібними. Основною умовою є те, що параметр X є контрольованою величиною. Його значення задаються на початок експерименту.

Якщо в ході експерименту використовується пара неконтрольованих величин XY, то регресійний аналіз здійснюється тим самим способом, але для інтерпретації результатів, в ході якої вивчається зв'язок досліджуваних випадкових величин, застосовуються методи математичної статистикине є абстрактною темою. Вони знаходять собі застосування в житті в самих різних сферахдіяльність людини.

У науковій літературідля визначення вище вказаного методу знайшов широке використаннятермін лінійний регресійний аналіз. Для змінної X застосовують термін регресор або предиктор, а залежні Y змінні ще називають критеріальними. У цій термінології відбивається лише математична залежність змінних, але не слідчо-причинні відносини.

Регресійний аналіз служить найпоширенішим методом, який використовується в ході обробки результатів різних спостережень. Фізичні та біологічні залежності вивчаються за коштами даного методу, він реалізований й у економіці, й у техніці. Маса інших областей використовують моделі регресійного аналізу. Дисперсійний аналіз, статистичний аналізбагатовимірний тісно співпрацюють з цим способом вивчення.

Поняття кореляції та регресії безпосередньо пов'язані між собою. У кореляційному та регресійному аналізі багато загальних обчислювальних прийомів. Вони використовуються для виявлення причинно-наслідкових співвідношень між явищами та процесами. Однак, якщо кореляційний аналіздозволяє оцінити силу та напрямок стохастичного зв'язку, то регресійний аналіз- ще й форму залежності.

Регресія може бути:

а) залежно від кількості явищ (змінних):

Простий (регресія між двома змінними);

Множинної (регресія між залежною змінною (y) і кількома змінними, що її пояснюють (х1, х2...хn);

б) залежно від форми:

Лінійною (відображається лінійною функцією, а між змінними, що вивчаються, існують лінійні співвідношення);

Нелінійний (відображається нелінійною функцією, між досліджуваними змінними зв'язок носить нелінійний характер);

в) за характером зв'язку між включеними на розгляд змінними:

Позитивною (збільшення значення пояснюючої змінної призводить до збільшення значення залежної змінної та навпаки);

Негативною (зі збільшенням значення пояснюючої змінної значення пояснюваної змінної зменшується);

г) за типом:

Безпосередній (у разі причина надає прямий вплив на слідство, тобто залежна і пояснює змінні пов'язані безпосередньо друг з одним);

Непрямої (пояснювальна змінна надає опосередковану дію через третю чи низку інших змінних на залежну змінну);

Помилковий (нонсенс регресія) - може виникнути при поверхневому та формальному підході до досліджуваних процесів та явищ. Прикладом безглуздих є регресія, яка встановлює зв'язок між зменшенням кількості споживаного алкоголю нашій країні та зменшенням продажу прального порошку.

Під час проведення регресійного аналізу вирішуються такі основні завдання:

1. Визначення форми залежності.

2. Визначення функції регресії. Для цього використовують математичне рівняння того чи іншого типу, що дозволяє, по-перше, встановити загальну тенденціюзміни залежної змінної, а, по-друге, обчислити вплив пояснюючої змінної (або кількох змінних) на залежну змінну.

3. Оцінка невідомих значень залежною змінною. Отримана математична залежність (рівняння регресії) дозволяє визначати значення залежної змінної як у межах інтервалу заданих значень пояснюючих змінних, і поза ним. В останньому випадку регресійний аналіз виступає як корисного інструментупри прогнозуванні змін соціально-економічних процесів та явищ (за умови збереження існуючих тенденцій та взаємозв'язків). Зазвичай довжина тимчасового відрізка, який здійснюється прогнозування, вибирається трохи більше половини інтервалу часу, у якому проведено спостереження вихідних показників. Можна здійснити як пасивний прогноз, вирішуючи завдання екстраполяції, так і активний, ведучи міркування за відомою схемою "якщо ..., то" і підставляючи різні значення в одну або кілька змінних регресії, що пояснюють.



Для побудови регресіївикористовується спеціальний метод, який отримав назву методу найменших квадратів. Цей метод має переваги перед іншими методами згладжування: порівняно просте математичне визначення шуканих параметрів та хороше теоретичне обґрунтування з імовірнісної точки зору.

При виборі моделі регресії однією з суттєвих вимог до неї є забезпечення максимально можливої ​​простоти, що дозволяє отримати рішення з достатньою точністю. Тому для встановлення статистичних зв'язків спочатку, як правило, розглядають модель із класу лінійних функцій(як найпростішого з усіх можливих класів функцій):

де bi, b2 ... bj - Коефіцієнти, що визначають вплив незалежних змінних хij на величину yi; аi – вільний член; ei - випадкове відхилення, що відбиває вплив неврахованих факторів на залежну змінну; n – число незалежних змінних; N число спостережень, причому має дотримуватися умова (N. n+1).

Лінійна модельможе описувати дуже широкий клас різних завдань. Однак на практиці, зокрема в соціально-економічних системах, іноді важко застосування лінійних моделей через великих помилокапроксимації. Тому нерідко використовуються функції нелінійної множинної регресії, що допускають лінеарізацію. До них, наприклад, належить виробнича функція ( статечна функціяКобба-Дугласа), що знайшла застосування у різних соціально-економічних дослідженнях. Вона має вигляд:

де b 0 – нормувальний множник, b 1 … b j – невідомі коефіцієнти, e i – випадкове відхилення.

Використовуючи натуральні логарифми, можна перетворити це рівняння на лінійну форму:

Отримана модель дозволяє використовувати стандартні процедури лінійної регресії, описані вище. Побудувавши моделі двох видів (адитивні та мультиплікативні), можна вибрати найкращі та провести подальші дослідження з меншими помилками апроксимації.

Існує добре розвинена система підбору апроксимуючих функцій. методика групового обліку аргументів(МГУА).

Про правильність підібраної моделі можна судити за результатами дослідження залишків, що є різницею між величинами y i, що спостерігаються, і відповідними прогнозованими за допомогою регресійного рівняннявеличинами y i. В цьому випадку для перевірки адекватності моделірозраховується середня помилкаапроксимації:

Модель вважається адекватною, якщо e знаходиться не більше 15%.

Особливо підкреслимо, що стосовно соціально-економічних систем далеко не завжди виконуються основні умови адекватності класичної регресійної моделі.

Не зупиняючись на всіх причинах неадекватності, назвемо лише мультиколінеарність- найскладнішу проблему ефективного застосування процедур регресійного аналізу щодо статистичних залежностей. Під мультиколінеарністюрозуміється наявність лінійного зв'язку між пояснювальними змінними.

Це явище:

а) спотворює сенс коефіцієнтів регресії за її змістовної інтерпретації;

б) знижує точність оцінювання (зростає дисперсія оцінок);

в) посилює чутливість оцінок коефіцієнтів до вибіркових даних (збільшення обсягу вибірки може сильно вплинути значення оцінок).

Існують різні прийоми зниження мультиколінеарності. Найбільш доступний спосіб- усунення однієї з двох змінних, якщо коефіцієнт кореляції між ними перевищує значення, що дорівнює по абсолютної величини 0,8. Яку зі змінних залишити вирішують, виходячи із змістовних міркувань. Потім знову проводиться розрахунок коефіцієнтів регресії.

Використання алгоритму покрокової регресії дозволяє послідовно включати в модель однієї незалежної змінної і аналізувати значимість коефіцієнтів регресії і мультиколлинеарность змінних. Остаточно в досліджуваній залежності залишаються лише ті змінні, які забезпечують необхідну значущість коефіцієнтів регресії та мінімальний вплив мультиколлінеарності.

Регресійний та кореляційний аналіз – статистичні методидослідження. Це найпоширеніші способи показати залежність будь-якого параметра від однієї чи кількох незалежних змінних.

Нижче на конкретних практичні прикладирозглянемо ці два дуже популярні серед економістів аналізу. А також наведемо приклад отримання результатів при їх об'єднанні.

Регресійний аналіз у Excel

Показує вплив одних значень (самостійних, незалежних) на залежну змінну. Наприклад, як залежить кількість економічно активного населення кількості підприємств, величини зарплати та інших. властивостей. Або як впливають іноземні інвестиції, ціни на енергоресурси та ін на рівень ВВП.

Результат аналізу дає змогу виділяти пріоритети. І ґрунтуючись на головних факторах, прогнозувати, планувати розвиток пріоритетних напрямків, ухвалювати управлінські рішення.

Регресія буває:

  • лінійної (у = а + bx);
  • параболічній (y = a + bx + cx 2);
  • експоненційною (y = a * exp (bx));
  • статечної (y = a * x ^ b);
  • гіперболічної (y = b/x + a);
  • логарифмічної (y = b * 1n(x) + a);
  • показовою (y = a * b^x).

Розглянемо з прикладу побудова регресійної моделі в Excel та інтерпретацію результатів. Візьмемо лінійний тип регресії.

Завдання. На 6 підприємствах було проаналізовано середньомісячну заробітня платаі кількість співробітників, що звільнилися. Необхідно визначити залежність кількості співробітників, що звільнилися, від середньої зарплати.

Модель лінійної регресії має такий вигляд:

У = а 0 + а 1 х 1 + ... + а до х к.

Де а – коефіцієнти регресії, х – що впливають змінні, до – число чинників.

У нашому прикладі як У виступає показник працівників, що звільнилися. фактор, що впливає - заробітна плата (х).

У Excel існують інтегровані функції, з допомогою яких можна розрахувати параметри моделі лінійної регресії. Але найшвидше це зробить надбудова «Пакет аналізу».

Активуємо потужний аналітичний інструмент:

Після активації надбудова буде доступна на вкладці "Дані".

Тепер візьмемося безпосередньо регресійним аналізом.



Насамперед звертаємо увагу на R-квадрат та коефіцієнти.

R-квадрат – коефіцієнт детермінації. У прикладі – 0,755, чи 75,5%. Це означає, що розрахункові параметримоделі на 75,5% пояснюють залежність між параметрами, що вивчаються. Що коефіцієнт детермінації, то якісніша модель. Добре – понад 0,8. Погано – менше 0,5 (такий аналіз навряд можна вважати резонним). У нашому прикладі - "непогано".

Коефіцієнт 64,1428 показує, яким буде Y, якщо всі змінні в моделі, що розглядається, будуть рівні 0. Тобто на значення аналізованого параметра впливають і інші фактори, не описані в моделі.

p align="justify"> Коефіцієнт -0,16285 показує вагомість змінної Х на Y. Тобто середньомісячна заробітна плата в межах даної моделі впливає на кількість звільнених з вагою -0,16285 (це невеликий ступінь впливу). Знак «-» вказує на негативний вплив: чим більша зарплата, тим менше звільнених Що слушно.



Кореляційний аналіз у Excel

Кореляційний аналіз допомагає встановити, чи між показниками в одній або двох вибірках є зв'язок. Наприклад, між часом роботи верстата та вартістю ремонту, ціною техніки та тривалістю експлуатації, зростанням та вагою дітей тощо.

Якщо зв'язок є, то чи тягне збільшення одного параметра підвищення (позитивна кореляція) чи зменшення (негативна) іншого. Кореляційний аналіз допомагає аналітику визначитися, чи можна за величиною одного показника передбачити можливе значення іншого.

Коефіцієнт кореляції позначається r. Варіюється в межах від +1 до -1. Класифікація кореляційних зв'язків для різних сфербуде відрізнятись. При значенні коефіцієнта 0 лінійної залежностіміж вибірками немає.

Розглянемо як за допомогою засобів Excelвизначити коефіцієнт кореляції.

Для знаходження парних коефіцієнтів застосовується функція Корел.

Завдання: Визначити, чи є взаємозв'язок між часом роботи токарного верстатата вартістю його обслуговування.

Ставимо курсор у будь-яку комірку і натискаємо кнопку fx.

  1. У категорії «Статистичні» вибираємо функцію КОРРЕЛ.
  2. Аргумент "Масив 1" - перший діапазон значень - час роботи верстата: А2: А14.
  3. Аргумент "Масив 2" - другий діапазон значень - вартість ремонту: В2: В14. Тиснемо ОК.

Щоб визначити тип зв'язку, потрібно подивитися абсолютну кількість коефіцієнта (для кожної сфери діяльності є своя шкала).

Для кореляційного аналізукількох параметрів (більше 2) зручніше застосовувати «Аналіз даних» (надбудова «Пакет аналізу»). У списку потрібно вибрати кореляцію та позначити масив. Всі.

Отримані коефіцієнти відобразяться у кореляційній матриці. На кшталт такий:

Кореляційно-регресійний аналіз

Насправді ці дві методики часто застосовуються разом.

Приклад:


Тепер стали помітні й дані регресійного аналізу.

Регресійний аналіз є одним із найбільш затребуваних методів статистичного дослідження. З його допомогою можна встановити ступінь впливу незалежних величинна залежну змінну. У функціоналі Microsoft Excelє інструменти, призначені щодо такого аналізу. Давайте розберемо, що вони являють собою і як ними користуватися.

Але для того, щоб використовувати функцію, що дозволяє провести регресійний аналіз, перш за все, потрібно активувати Пакет аналізу. Тільки тоді необхідні для цієї процедури інструменти з'являться на Стрічці Ексель.


Тепер, коли ми перейдемо у вкладку «Дані»на стрічці в блоці інструментів «Аналіз»ми побачимо нову кнопку – «Аналіз даних».

Види регресійного аналізу

Існує кілька видів регресій:

  • параболічна;
  • статечна;
  • логарифмічна;
  • експонентна;
  • показова;
  • гіперболічна;
  • Лінійна регресія.

Про виконання останнього виду регресійного аналізу в Екселі ми докладніше поговоримо далі.

Лінійна регресія у програмі Excel

Внизу, як приклад, представлена ​​таблиця, в якій зазначено середньодобову температуру повітря на вулиці, та кількість покупців магазину за відповідний робочий день. Давайте з'ясуємо за допомогою регресійного аналізу, як саме погодні умовияк температури повітря можуть вплинути на відвідуваність торгового закладу.

Загальне рівняння регресії лінійного вигляду має такий вигляд: У = а0 + а1х1 +…+акхк. У цій формулі Yозначає змінну, вплив чинників яку ми намагаємося вивчити. У нашому випадку це кількість покупців. Значення x– це різні фактори, що впливають на змінну. Параметри aє коефіцієнтами регресії. Тобто саме вони визначають значущість того чи іншого чинника. Індекс kпозначає Загальна кількістьцих факторів.


Розбір результатів аналізу

Результати регресійного аналізу виводяться у вигляді таблиці там, яке зазначено в настройках.

Одним із основних показників є R-квадрат. У ньому вказується якість моделі. У нашому випадку даний коефіцієнтдорівнює 0,705 чи близько 70,5%. Це прийнятний рівень якості. Залежність менше ніж 0,5 є поганою.

Ще один важливий показникрозташований у осередку на перетині рядка «Y-перетин»та стовпця «Коефіцієнти». Тут вказується яке значення буде у Y, а нашому випадку, це кількість покупців, за всіх інших чинниках рівних нулю. У цій таблиці це значення дорівнює 58,04.

Значення на перетині граф «Змінна X1»і «Коефіцієнти»показує рівень залежності Y від X. У нашому випадку це рівень залежності кількості клієнтів магазину від температури. Коефіцієнт 1,31 вважається досить високим показникомвпливу.

Як бачимо, за допомогою програми Microsoft Excel досить легко скласти таблицю регресійного аналізу. Але працювати з отриманими на виході даними і розуміти їх суть зможе лише підготовлена ​​людина.



Схожі статті

2024 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.