Кореляційний аналіз виявляє. Кореляційний аналіз: основне визначення та сфери застосування

Основні поняття кореляційного аналізу

Вирізняють кілька видів зв'язки між змінними:

Кореляційна залежністьпередбачає взаємну узгодженість змін змінних величин, і навіть те, що це зміни можна виміряти одноразово чи багаторазово (у разі говорять про щільності зв'язку змінних, але з причинно-наслідкових зв'язках); наприклад, у сучасному російському суспільстві чим вищий вік, тим нижчий соціальний статус людини; окремі прояви геронтократії цієї закономірності не порушують.

Функціональний впливпередбачає, що зміни незалежної змінної супроводжуються змінами залежної змінної, що все більш прискорюються (причинно-наслідкові зв'язки фіксують вплив незалежної змінної на залежну); наприклад, що більш радикальними політичними поглядами має людина, то більшою мірою не приймає існуючий політичний режим; водночас не можна стверджувати, що чим більшою мірою людина негативно оцінює владу, тим більш радикальними поглядами вона має.

Функціональна залежність - зв'язок змінних, що означає, що зміна однієї змінної впливає зміну інший, що у своє чергу впливає першу змінну, тобто. це зв'язки взаємодії; наприклад, поінформованість людини про політику пов'язана з інтересом до неї; що більше людина політикою цікавиться, то більше в ній розбирається.

Зв'язок може бути нелінійним і немонотонним.

Яким би в результаті виявився тип зв'язку між змінними, необхідно переконатися в її наявності в принципі. Кореляційний аналіз застосовується для з'ясування взаємодії та тенденцій зміни характеристик досліджуваного явища.

Початковою стадією розвитку вважається період 1870- 1880-х років, а автором поняття «коефіцієнт кореляції» - Френсіс Гальтон. Найбільш серйозні розробки у сфері кореляційного аналізу межі XIX-XX ст. виконав Карл Пірсон. Традиційно кбреляційний аналіз використовується для перевірки гіпотези про статистичну залежність двох або кількох змінних. Як допоміжний засіб аналіз кореляцій можна використовувати під час перевірки придатності експериментальних гіпотез і включення змінних у факторний і регресійний аналіз. Кореляційний аналізздійснюється за допомогою порівняння та зіставлення рядів розподілу, побудованих на підставі угруповань за різними ознаками.

Кореляція - наявність статистичного взаємозв'язку ознак, коли кожному певному значенню однієї ознаки X відповідає певне значення У (або комплекс значень К-ряду розподілу). Кореляційний аналіз з'ясовує функціональну залежність між змінними величинами, яка характеризується тим, що кожному значенню однієї з них відповідає цілком певне значення іншої. Однак кореляційний аналіз не передбачає виявлення каузальних зв'язків, тому при інтерпретації результатів формулювання типу «змінна х впливає на змінну у» або «змінна х залежить від змінної у» неприпустимі.

Розрізняють парну і множинну кореляцію. Парна кореляція характеризує тип, форму і щільність зв'язку між двома ознаками, множина між кількома.

Кореляційна залежність виникає найчастіше там, де одне явище перебуває під впливом великої кількості факторів, що діють з різною силою, тому існують спеціальні заходи кореляційного зв'язку, які називаються коефіцієнтами кореляції Коефіцієнти (у статистиці їх загальна кількість обчислюється десятками) показують ступінь взаємозв'язку явищ ( щільність кореляційного зв'язку, іноді дослідники говорять про інтенсивності зв'язку) та характер цього зв'язку ( спрямованість ). Зв'язок може бути прямим і зворотним. Наприклад, що старший виборець, то активніше він бере участь у виборах. Чим вище рівень доходів людей, тим меншою мірою вони схильні брати участь у виборах як виборці (зворотний зв'язок). Чим вищий коефіцієнт кореляції між двома змінними, тим точніше можна передбачити значення однієї з них за значеннями іншої. Характер зв'язку також визначається у категоріях « монотонна » (напрямок зміни однієї змінної не змінюється при зміні другої змінної) та « немонотонна зв'язок. Крім оцінки щільності та спрямованості зв'язку необхідно враховувати надійність (достовірність ) зв'язку.

Кореляційний аналіз послідовно вирішує три практичні завдання:

    визначення кореляційного поля та складання кореляційної (у даному випадкуце комбінована) таблиці;

    обчислення вибіркових кореляційних відносин чи коефіцієнтів кореляції;

    перевірка статистичної гіпотези значущості зв'язку.

Коефіцієнт кореляції не містить інформації про те, чи є зв'язок між ними причинно-наслідковою або супутньою (породженою загальною причиною). Це питання дослідник повинен вирішувати самостійно на основі змістовних уявлень про структуру, динаміку соціальних об'єктів, що вивчаються, кореляцій між досліджуваними ознаками, використовувати інші способи статистичного аналізу(Регресійний, факторний, дискримінантний, шляховий і т.д.). Але величина коефіцієнта дозволяє оцінити щільність зв'язку як меншу (незначну) чи більшу. За знаком коефіцієнта кореляції для порядкових рядів ми можемо сказати, чи є цей зв'язок прямий або зворотний (для номінальних рядів знак коефіцієнта не несе смислового навантаження).

Для встановлення кореляційного зв'язку між двома ознаками необхідно довести, що всі інші змінні не впливають на відносини двох змінних, які є предметом вивчення. Інакше виникає ситуація хибної кореляції. Секрет виникнення хибної кореляції у тому, що з двох явищ, зв'язок яких формально підкріплюється наявністю статистичного зв'язку, є загальна причина, що однаково впливає кожне з них.

Кореляційному аналізу передує стадія розрахунку статистики х 2 - Але на підставі набутого значення статистики х 2 ми нічого не можемо сказати про щільність зв'язку аналізованих змінних. Для вирішення такого завдання необхідно звернутися до коефіцієнтів кореляційного зв'язку.

Традиційним до виконання кореляційного аналізу є звернення до коефіцієнта кореляції Пірсона (Pearson) Р (У літературі він позначається і через р).

Якщо під час опису політичного об'єкта визначається лише наявність чи відсутність ознаки чи якщо вивчається зв'язок між альтернативними ознаками, то кореляційні таблиці (таблиці сполученого ознаки) - 4-клітинні. У цьому випадку застосовуються коефіцієнт Юла(О) і коефіцієнт контингенції (ф). Вони засновані на принципі спільної появи подій (значень ознак об'єкта дослідження) і придатні для аналізу будь-яких ознак (метричних, порядкових і навіть номінальних).

Якщо номінальні шкали мають більше значень, ніж два, то визначення залежності між ознаками користуються коефіцієнтами сполученості Пірсона ( Р ), Чупрова (7) та Крамера (К). У цьому певне значення має розмірність таблиці з на до, в якій відображено значення двох ознак. Коефіцієнти Чупрова і Крамера вважаються «суворішими», ніж коефіцієнт спряженості Пірсона. Але оскільки обчислення у них будуються з урахуванням статистики х 2 , всі пов'язані з нею обмеження поширюються і ці коефіцієнти.

Множинний коефіцієнт кореляції (IV), який іноді називають коефіцієнтом конкордації, застосовується з метою оцінки узгодженості двох чи кількох рядів ранжованих значень змінних.

Варіантів розрахунку коефіцієнтів кореляції між ознаками у статистичному пакеті SPSS два.

При вивченні громадського здоров'я та охорони здоров'я в наукових та практичних цілях досліднику часто доводиться проводити статистичний аналіз зв'язків між факторними та результативними ознаками статистичної сукупності (причинно-наслідковий зв'язок) або визначення залежності паралельних змін кількох ознак цієї сукупності від якоїсь третьої величини (від загальної їх причини ). Необхідно вміти вивчати особливості цього зв'язку, визначати його розміри та напрямок, а також оцінювати його достовірність. І тому використовуються методи кореляції.

  1. Види прояву кількісних зв'язків між ознаками
    • функціональний зв'язок
    • кореляційний зв'язок
  2. Визначення функціонального та кореляційного зв'язку

    Функціональний зв'язок- такий вид співвідношення між двома ознаками, коли кожному значення одного з них відповідає строго певне значення іншого (площа кола залежить від радіуса кола і т.д.). Функціональний зв'язок характерний для фізико-математичних процесів.

    Кореляційний зв'язок- такий зв'язок, при якому кожному певному значенню однієї ознаки відповідає кілька значень іншої взаємопов'язаної з ним ознаки (зв'язок між зростанням і масою тіла людини; зв'язок між температурою тіла та частотою пульсу та ін.). Кореляційний зв'язок й у медико-биологических процесів.

  3. Практичне значення встановлення кореляційного зв'язку. Виявлення причинно-наслідкової між факторними та результативними ознаками (при оцінці фізичного розвитку, Для визначення зв'язку між умовами праці, побуту та станом здоров'я, при визначенні залежності частоти випадків хвороби від віку, стажу, наявності виробничих шкідливостей та ін.)

    Залежність паралельних змін кількох ознак від якоїсь третьої величини. Наприклад, під впливом високої температури в цеху відбуваються зміни кров'яного тиску, в'язкості крові, частоти пульсу та ін.

  4. Величина, що характеризує напрям та силу зв'язку між ознаками. Коефіцієнт кореляції, який одним числом дає уявлення про спрямування та силу зв'язку між ознаками (явами), межі його коливань від 0 до ± 1
  5. Способи подання кореляційного зв'язку
    • графік (діаграма розсіювання)
    • коефіцієнт кореляції
  6. Напрямок кореляційного зв'язку
    • пряма
    • зворотна
  7. Сила кореляційного зв'язку
    • сильна: ±0,7 до ±1
    • середня: ±0,3 до ±0,699
    • слабка: 0 до ±0,299
  8. Методи визначення коефіцієнта кореляції та формули
    • метод квадратів (метод Пірсона)
    • ранговий метод (метод Спірмена)
  9. Методичні вимоги щодо використання коефіцієнта кореляції
    • вимір зв'язку можливий тільки в якісно однорідних сукупностях (наприклад, вимірювання зв'язку між зростанням і вагою в сукупностях, однорідних за статтю та віком)
    • розрахунок може здійснюватися з використанням абсолютних чи похідних величин
    • для обчислення коефіцієнта кореляції використовуються не згруповані варіаційні ряди(Ця вимога застосовується лише при обчисленні коефіцієнта кореляції за методом квадратів)
    • кількість спостережень не менше 30
  10. Рекомендації щодо застосування методу рангової кореляції(метод Спірмена)
    • коли немає необхідності в точному встановленні сили зв'язку, а достатньо орієнтовних даних
    • коли ознаки представлені не лише кількісними, а й атрибутивними значеннями
    • коли ряди розподілу ознак мають відкриті варіанти(наприклад, стаж роботи до 1 року та ін.)
  11. Рекомендації щодо застосування методу квадратів (метод Пірсона)
    • коли потрібне точне встановлення сили зв'язку між ознаками
    • коли ознаки мають лише кількісний вираз
  12. Методика та порядок обчислення коефіцієнта кореляції

    1) Метод квадратів

    2) Ранговий метод

  13. Схема оцінки кореляційного зв'язку за коефіцієнтом кореляції
  14. Обчислення помилки коефіцієнта кореляції
  15. Оцінка достовірності коефіцієнта кореляції, отриманого методом рангової кореляції та методом квадратів

    Спосіб 1
    Достовірність визначається за такою формулою:

    Критерій t оцінюється за таблицею значень t з урахуванням числа ступенів свободи (n – 2), де n – число парних варіантів. Критерій t повинен дорівнювати або більше табличного, що відповідає ймовірності р ≥99%.

    Спосіб 2
    Достовірність оцінюється за спеціальною таблицею стандартних коефіцієнтів кореляції. При цьому достовірним вважається такий коефіцієнт кореляції, коли за певної кількості ступенів свободи (n - 2) він дорівнює або більше табличного, відповідного ступеня безпомилкового прогнозу р ≥95%.

на застосування методу квадратів

Завдання:обчислити коефіцієнт кореляції, визначити напрямок і силу зв'язку між кількістю кальцію у воді та жорсткістю води, якщо відомі такі дані (табл. 1). Оцінити достовірність зв'язку. Зробити висновок.

Таблиця 1

Обґрунтування вибору методу.Аби вирішити завдання обрано метод квадратів (Пірсона), т.к. кожна з ознак (жорсткість води та кількість кальцію) має числове вираження; немає відкритих варіантів.

Рішення.
Послідовність розрахунків викладена у тексті, результати представлені у таблиці. Побудувавши ряди з парних ознак, позначити їх через х (жорсткість води в градусах) і через у (кількість кальцію у воді в мг/л).

Жорсткість води
(у градусах)
Кількість кальцію у воді
(в мг/л)
d х d у d х х d у d x 2 d y 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
М х = Σ х / n М у = Σ у / n Σ d х x d у =7078 Σ d х 2 = 982 Σ d y 2 = 51056
М х = 120/6 = 20 М y = 852/6 = 142
  1. Визначити середні величини M x ряду варіант "х" і М у ряду варіант "у" за формулами:
    М х = Σх/n (графа 1) та
    М у = Σу/n (графа 2)
  2. Знайти відхилення (d х і d у) кожної варіанти від величини обчисленої середньої в ряду "x" та в ряді "у"
    d х = х – М х (графа 3) та d y = у – М у (графа4).
  3. Знайти добуток відхилень d x х d y та підсумувати їх: Σ d х х d у (графа 5)
  4. Кожне відхилення d x і d у звести в квадрат і підсумовувати їх значення по ряду "х" і по ряду "у": d x 2 = 982 (графа 6) і d y 2 = 51056 (графа 7).
  5. Визначити добуток Σ d x 2 х Σ d y 2 і з цього твору витягти квадратний корінь
  6. Отримані величини Σ (d x x d y) та √ (Σd x 2 x Σd y 2)підставляємо у формулу розрахунку коефіцієнта кореляції:
  7. Визначити достовірність коефіцієнта кореляції:
    1-й спосіб. Знайти помилку коефіцієнта кореляції (mr xy) та критерій t за формулами:

    Критерій t = 14,1, що відповідає ймовірності безпомилкового прогнозу р> 99,9%.

    2-й спосіб. Достовірність коефіцієнта кореляції оцінюється за таблицею " Стандартні коефіцієнти кореляції " (див. додаток 1). При числі ступенів свободи (n - 2) = 6 - 2 = 4 наш розрахунковий коефіцієнт кореляції r xу = + 0,99 більше табличного (r табл = + 0,917 при р = 99%).

    Висновок.Чим більше кальцію у воді, тим він жорсткіший (зв'язок пряма, сильна та достовірна: r ху = + 0,99, р> 99,9%).

    на застосування рангового методу

    Завдання:методом рангів встановити напрямок і силу зв'язку між стажем роботи у роках та частотою травм, якщо отримані такі дані:

    Обґрунтування вибору методу:на вирішення завдання можна вибрати лише метод рангової кореляції, т.к. перший ряд ознаки "стаж роботи у роках" має відкриті варіанти (стаж роботи до 1 року та 7 і більше років), що не дозволяє використовувати для встановлення зв'язку між зіставлюваними ознаками. точний метод- Метод квадратів.

    Рішення. Послідовність розрахунків викладено у тексті, результати представлені у табл. 2.

    Таблиця 2

    Стаж роботи у роках Число травм Порядкові номери (ранги) Різниця рангів Квадрат різниці рангів
    X Y d(х-у) d 2
    До 1 року 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 і більше 6 5 1 +4 16
    Σ d 2 = 38,5

    Стандартні коефіцієнти кореляції, які вважаються достовірними (за Л.С. Камінським)

    Число ступенів свободи - 2 Рівень ймовірності р (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Власов В.В. Епідеміологія. – М.: ГЕОТАР-МЕД, 2004. – 464 с.
    2. Лісіцин Ю.П. Громадське здоров'я та охорона здоров'я. Підручник для вишів. – М.: ГЕОТАР-МЕД, 2007. – 512 с.
    3. Медик В.А., Юр'єв В.К. Курс лекцій з громадського здоров'я та охорони здоров'я: Частина 1. Суспільне здоров'я. – М.: Медицина, 2003. – 368 с.
    4. Міняєв В.А., Вишняков Н.І. та ін Соціальна медицина та організація охорони здоров'я (Керівництво у 2 томах). – СПб, 1998. –528 с.
    5. Кучеренко В.З., Агарков Н.М. та ін. Соціальна гігієна та організація охорони здоров'я ( Навчальний посібник) – Москва, 2000. – 432 с.
    6. С. Гланц. Медико-біологічна статистика Пер з англ. – М., Практика, 1998. – 459 с.

Поняття взаємозв'язку досить поширене в психологічних дослідженнях. З ним доводиться оперувати психологу тоді, коли виникає необхідність зіставити виміри двох чи кількох показників ознак чи явищ, щоб зробити будь-які висновки.

Характер взаємозв'язку між досліджуваними явищами то, можливо однозначним, тобто. таким, коли певному значенню одною ознаки відповідає чітке та певне значення іншого. Так, наприклад, у субтесті на пошук закономірностей тестів психічних функцій кількість набраних «сирих» балів визначається за такою формулою:
Xi = Sтз - Sоз / Sтз + Sпз * Sbс,
де Xi – значення варіанти, Sтз – кількість апріорно заданих закономірностей (відповідностей) у субтесті, Sоз – кількість помилково зазначених відповідностей випробуваним, Sоз – кількість не зазначених (пропущених) відповідностей випробуваним, Sbс – кількість всіх переглянутих випробуваними слів у тесті.

Такий взаємозв'язок отримав назву функціональної: тут один показник є функцією іншого, який є аргументом по відношенню до першого.

Однак однозначний чіткий взаємозв'язок зустрічається не завжди. Найчастіше доводиться стикатися з таким становищем, у якому одному значенню ознаки можуть відповідати кілька значень іншого. Ці значення варіюють у межах більш-менш окреслених меж. Такий вид взаємозв'язку отримав назву кореляційної чи співвідносної.

Застосовується кілька видів виразу кореляційного взаємозв'язку. Так, для вираження взаємозв'язку між ознаками, що мають кількісний характер варіювання своїх значень, використовують заходи центральної тенденції: табулювання з подальшим обчисленням коефіцієнта парної кореляції, коефіцієнт множинної та приватної кореляції, коефіцієнт множинної детермінації, кореляційне відношення.

Якщо необхідно вивчити взаємозв'язок між ознаками, варіювання яких має якісний характер (результати проективних методів дослідження особистості, дослідження за методом Семантичного диференціалу, дослідження з використанням Відкритих шкал тощо), то використовують коефіцієнт якісної альтернативної кореляції (тетрахоричний показник), критерій Пірсона x2, показники сполученості (контингенції) Пірсона та Чупрова.

визначення якісно-кількісної кореляції, тобто. такої кореляції, коли одна ознака має якісне варіювання, а інша - кількісне. застосовуються спеціальні методи.

Коефіцієнт кореляції (термін вперше запроваджено Ф. Гальтоном в 1888 р.) - показник сили зв'язку між двома порівнянними варіантами вибірки (вибірок). За якою формулою не обчислювався коефіцієнт кореляції, його величина коливається в межах від -1 до +1. У разі повної позитивної кореляції цей коефіцієнт дорівнює плюс 1, а за повної негативної - мінус 1. Зазвичай це пряма лінія, що проходить через точки перетину значень кожної пари даних.

Якщо значення варіант не вишиковуються на прямий, а утворюють «хмару», то коефіцієнт кореляції по абсолютної величинистає менше одиниці і в міру заокруглення «хмари» наближається до нуля. Якщо коефіцієнт кореляції дорівнює 0, обидві варіанти є повністю незалежними один від одного.

Будь-яке обчислене (емпіричне) значення коефіцієнта кореляції має бути перевірено на достовірність ( статистичну значимість) за відповідними таблицями критичних значень коефіцієнта кореляції. Якщо емпіричне значення менше або дорівнює табличному для 5-відсоткового рівня (Р = 0,05), кореляція не є значущою. Якщо обчислене значення коефіцієнта кореляції більше табличного для Р = 0,01, кореляція статистично значуща (достовірна).

У разі коли величина коефіцієнта укладена між 0,05 > Р > 0.01, на практиці говорять про значущість кореляції для Р = 0,05.

Коефіцієнт кореляції Браве-Пірсона (г) - це запропонований в 1896 параметричний показник, для обчислення якого порівнюють середні арифметичні і середні квадратичні значення варіант. Для обчислення цього коефіцієнта застосовують таку формулу (у різних авторів вона може виглядати по-різному):
r = (E Xi Xi1) - NXap X1ap / N-1 Qx Qx1,

де E Xi Xi1 - сума творів значень попарно співвідносних варіантів, n-кількість порівнюваних пар, NXap, X1ap - середні арифметичні варіант Xi, Xi; відповідно, Qx, Qx, -середні квадратичні відхиленнярозподілів х та х.

Коефіцієнт кореляції рангів Спірмена Rs (коефіцієнт рангової кореляції, коефіцієнт Спірмена) є найпростішою формоюкоефіцієнта кореляції та вимірює зв'язок між рангами (місцями) даної варіанти за різними ознаками, не враховуючи її власного значення. Тут досліджується швидше якісний зв'язок, ніж кількісний.

Зазвичай цей непараметричний критерій використовується у випадках, коли потрібно зробити висновки не стільки про інтервали між даними, скільки про їх ранги, а також тоді, коли криві розподіли вкрай асиметричні і не дозволяють використовувати такі параметричні критерії як коефіцієнт кореляції Браве-Пірсона (у цих буває необхідно перетворити кількісні дані на порядкові). Якщо коефіцієнт Rs близький до +1, це означає, що два ряду ранжированной по тим чи іншим ознакам вибірки практично збігаються, і якщо цей коефіцієнт близький до - 1, можна говорити повної зворотної залежності.

Як і обчислення коефіцієнта кореляції Браве-Пірсона, обчислення коефіцієнта Rs зручніше подавати у табличній формі.

Регресія узагальнює поняття функціонального взаємозв'язку у разі стохастичного (імовірнісного) характеру залежності між значеннями варіант. Метою вирішення категорії регресійних завдань є оцінка значення безперервної вихідної варіативності за значеннями вхідних варіантів.

Будь-який закон природи чи у суспільному розвиткові може бути представлений описом сукупності взаємозв'язків. Якщо ці залежності стохастичні, а аналіз здійснюється за вибіркою з генеральної сукупності, то дана галузь досліджень відноситься до завдань статистичного дослідження залежностей, які включають кореляційний, регресійний, дисперсійний, коваріаційний аналіз та аналіз таблиць сполученості.

    Чи існує зв'язок між змінними, що досліджуються?

    Як виміряти тісноту зв'язків?

Загальна схема взаємозв'язку параметрів під час статистичного дослідження наведено на рис. 1.

На малюнку S – модель досліджуваного реального об'єкта, що пояснюють (незалежні, факторні) змінні описують умови функціонування об'єкта. Випадкові фактори- Це фактори, вплив яких важко врахувати або впливом яких зараз нехтують. Результати (залежні, пояснювані) змінні характеризують результат функціонування об'єкта.

Вибір способу аналізу взаємозв'язку здійснюється з урахуванням природи аналізованих змінних.

Кореляційний аналіз - метод обробки статистичних даних, що полягає у вивченні зв'язку між змінними.

Мета кореляційного аналізу – забезпечити отримання деякої інформації про одну змінну за допомогою іншої змінної. У випадках, коли можливе досягнення мети, кажуть, що змінні корелюють. Кореляція відбиває лише лінійну залежність величин, але з відбиває їх функціональної зв'язності. Наприклад, якщо обчислити коефіцієнт кореляції між величинами A = sin (x) і B = cos (x), він буде близький до нуля, тобто. залежність між величинами відсутня.

При дослідженні кореляції використовуються графічний та аналітичний підходи.

Графічний аналіз починається з побудови кореляційного поля. Кореляційне поле (або діаграма розсіювання) є графічною залежністю між результатами вимірів двох ознак. Для її побудови вихідні дані наносять на графік, відображаючи кожну пару значень (xi, yi) у вигляді точки з координатами xi та yi у прямокутній системі координат.

Візуальний аналіз кореляційного поля дозволяє зробити припущення про форму та напрям взаємозв'язку двох досліджуваних показників. За формою взаємозв'язку кореляційні залежності прийнято розділяти на лінійні (див. рис. 1) та нелінійні (див. рис. 2). При лінійній залежності загальна кореляційного поля близька до еліпса. Лінійний взаємозв'язок двох випадкових величинполягає в тому, що при збільшенні однієї випадкової величини інша випадкова величина має тенденцію зростати (або зменшуватися) за лінійним законом.

Напрямок зв'язку є позитивним, якщо збільшення значення однієї ознаки призводить до збільшення значення другої (див. рис. 3) і негативним, якщо збільшення значення однієї ознаки призводить до зменшення значення другої (див. рис. 4).

Залежності, мають лише позитивні чи лише негативні спрямованості, називаються монотонними.

Основоположником теорії кореляції вважаються англійські біометрики Ф. Гальтон (1822-1911) та К. Пірсон (1857-1936). Термін "кореляція" означає співвідношення, відповідність. Уявлення про кореляцію як про взаємозалежність випадкових змінних величин є основою статистичної теорії кореляції - вивчення залежності варіації ознаки навколишніх умов. Одні ознаки виступають у ролі які впливають (факторних), інші - які впливають, результативних. Залежності між ознаками можуть бути функціональними та кореляційними. Функціональні зв'язки характеризуються повною відповідністю між зміною факторної ознаки та зміною результативної величини. Кожному значенню ознаки-фактора відповідає певне значення результативної ознаки. У кореляційних зв'язках між зміною факторної та результативної ознаки немає повної відповідності. У складній взаємодії знаходиться сама результативна ознака. Тому результати кореляційного аналізу мають значення у зв'язку, а інтерпретація цих результатів у загальному виглядіпотребує побудови системи кореляційних зв'язків. Вони характеризуються безліччю причин і наслідків та з їх допомогою встановлюється тенденція зміни результативної ознаки за зміни величини факторної ознаки. Наприклад, на продуктивність праці впливають фактори ступеня вдосконалення техніки та технології, рівень механізації та автоматизації праці, спеціалізації виробництва, плинність кадрів тощо.

У природі та суспільстві явища та події протікають за характером кореляційного зв'язку, коли при зміні величини однієї ознаки існує тенденція зміни іншої ознаки. Кореляційний зв'язок – це окремий випадокстатистичного зв'язку. Кореляційний аналіз використовується для встановлення тісноти залежності між явищами, процесами, об'єктами.

Метою дослідження часто є встановлення взаємозв'язку (кореляції) між ознаками. Знання залежності дає можливість вирішувати кардинальне завдання будь-якого дослідження – можливість передбачати, прогнозувати розвиток ситуації за зміни впливаючого фактора. З допомогою кореляції можна лише формальну оцінку взаємозв'язків. Тому перш ніж приступати до обчислення коефіцієнтів кореляції між будь-якими ознаками, слід теоретично встановити, чи є між цими ознаками взаємозв'язок. Адже формально статистика може довести неіснуючі зв'язки, наприклад, між висотою будівлі у місті та врожайністю пшениці у фермерських господарствах.

Зв'язок між явищами (кореляція) визначається шляхом постановки дослідів, статистичного аналізу. Кореляцію не слід ототожнювати із причинністю. Однак необхідно мати на увазі, що доказ математичного зв'язку має спиратися на реальну залежністьміж явищами. Наприклад, мінералізація води знижується з півночі на південь Білорусі, у цьому напрямі знижується зміст поживних речовину ґрунті. Між показниками, що розглядаються, може бути отримана позитивна достовірна залежність. Однак ступінь мінералізації води не визначає оптимального вмісту поживних речовин у ґрунті. Інакше в ландшафтах пустель родючість була б максимальною, тому що тут максимальна мінералізація води (ґрунтово-грунтові води солонуваті), а це суперечить істині. Тому проведення такого зв'язку в ландшафтах пустель безглуздо. Найкраща оренда квартир різного рівня комфорту від господарів без комісійних ви зможете знайти на сайті piter.stay24.ru. Зручний пошук дозволить вам легко швидко знайти потрібну квартирупід ваші вимоги, витративши при цьому мінімум часу.

Будь-який показник зв'язку служить наближеною оцінкою аналізованої залежності і є гарантією існування жорсткої (функціональної) соподчиненности. Відсутність жорсткої залежності у природі та суспільстві сприяє саморегуляції процесів, явищ, систем

У напрямку зв'язок може бути прямий та зворотний; за характером - функціональною чи статистичною (кореляційною); за величиною – слабкою, середньою або сильною; за формою - лінійною та нелінійною; за кількістю корелюваних ознак - парної та множинної.

Функціональна залежність характерна для геометричних форм, технічних систем, коли кожному значенню однієї ознаки відповідає точне значенняіншого. Це приклад взаємозв'язку площі прямокутника та довжини його однієї зі сторін. Така залежність повна чи вичерпна.

Виділяють кілька видів парного кореляційного зв'язку:

·паралельно-співвідносну, або асоціативну, коли обидві ознаки змінюються поєднано, частково під дією загальних причин та наслідків (приуроченість рослинності та ґрунтів до певним формамрельєфу; розвитку промисловості та зростання населення до сировинних ресурсів);

субпричинну, коли один фактор постає як окрема причина сполученої зміни ознаки (зв'язок біомаси з кількістю опадів; зростання населення і народжуваності);

Взаємозапобіжну, коли причина і слідство, перебуваючи у стійкому взаємному зв'язку, послідовно впливають один на одного (вологість повітря та опади).

Якщо ознака впливає кілька чинників, то доводиться оцінювати множину кореляцію. Множинна кореляціяслужить основою виявлення зв'язків між ознаками, але потребує суворої нормальності і прямолінійності розподілу, тому використання може бути утруднено. Зі зростанням числа змінних обсяг обчислювальних робіт збільшується пропорційно квадрату числа змінних. І тут важче оцінювати значимість результатів, оскільки збільшуються помилки коефіцієнтів кореляції. Майже у разі обмежуються вивченням лише основних чинників. Проте характер впливу головних чинників на ознаку детальніше і досліджують шляхом факторного аналізу.

У практичної роботищодо встановлення кореляції між ознаками та явищами необхідно дотримуватися наступної послідовності:

· на підставі проведених досліджень попередньо визначають, чи існує зв'язок між ознаками, що розглядаються;

В· якщо зв'язок між ними існує, встановлюють її форму, напрям і тісноту, використовуючи графік.

На початку складаються пов'язані варіаційні ряди, в яких слід визначити аргумент х і функцію у:

За сполученими варіантами будується графік, який допомагає встановити вид залежності між аргументом та функцією. Від форми кореляційного зв'язку залежить подальша обробка експериментальних чи статистичних даних. Лінійна залежністьпередбачає обчислення коефіцієнта кореляції r, а нелінійна – кореляційного відношення η (рис. 5.1). Ступінь розсіювання частот або варіант щодо лінії регресії на графіку вказує орієнтовно на тісноту зв'язку: що менше розсіювання, то сильніший зв'язок (рис. 5.2).

Кореляційний аналіз вирішує такі завдання:

В· встановлення напряму та форми зв'язку,

В· оцінка тісноти зв'язку,

В· оцінка репрезентативності статистичних оцінок взаємозв'язку,

· Визначення величини детермінації (частки взаємовпливу) корелюваних факторів.

Мал. 5.1. Форма кореляційного зв'язку:

а - пряма лінійна; б - зворотна лінійна; в – парабалічна; г - гіперболічна

Для оцінки зв'язку використовують такі чисельні критерії (коефіцієнти) кореляційного зв'язку:

·Коефіцієнт кореляції (r) при лінійній залежності,

В· кореляційне відношення (η) при нелінійній залежності,

· Коефіцієнти множинної регресії,

В· рангові коефіцієнти лінійної кореляціїПірсона чи Кендела.

Схожі статті

2023 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.