Вибірковий коефіцієнт кореляції спірмена. Коефіцієнт рангової кореляції rs Спірмена

Дата публікації: 03.09.2017 13:01

Термін «кореляція» активно використовується у гуманітарних науках, медицині; часто миготить у ЗМІ. Ключову роль кореляції грають у психології. Зокрема, розрахунок кореляцій виступає важливим етапомреалізації емпіричного дослідження при написанні ВКР з психології

Матеріали з кореляцій у мережі надто наукові. Нефахівцеві важко розібратися у формулах. У той самий час розуміння сенсу кореляцій необхідне маркетологу, соціологу, медику, психологу - всім, хто проводить дослідження людей.

У цій статті ми простою мовоюпояснимо суть кореляційного зв'язку, види кореляцій, способи розрахунку, особливості використання кореляції в психологічних дослідженнях, а також при написанні дипломних робіт з психології

Зміст

Що таке кореляція

Кореляція – це зв'язок. Але не будь-яка. У чому її особливість? Розглянемо з прикладу.

Уявіть, що ви їдете автомобілем. Ви натискаєте педаль газу – машина їде швидше. Ви зменшуєте газ - авто сповільнює хід. Навіть не знайома з пристроєм автомобіля людина скаже: «Між педаллю газу та швидкістю машини є прямий зв'язок: чим сильніше натиснута педаль, тим швидкість вища».

Це функціональна залежність - швидкість виступає прямою функцією педалі газу. Фахівець пояснить, що педаль керує подачею палива в циліндри, де відбувається спалювання суміші, що веде до підвищення потужності на вал тощо. Це зв'язок жорсткий, детермінований, що не допускає винятків (за умови, що машина справна).

Тепер уявіть, що ви - директор фірми, співробітники якої продають товари. Ви вирішуєте підвищити продажі за рахунок підвищення окладів працівників. Ви підвищуєте зарплату на 10%, і продаж у середньому по фірмі зростає. Через час підвищуєте ще на 10% і знову зростання. Потім ще на 5% і знову є ефект. Напрошується висновок - між продажами фірми та окладом співробітників є пряма залежність - що вищі оклади, то вищі продажу організації. Такий же це зв'язок, як між педаллю газу та швидкістю авто? У чому ключова відмінність?

Правильно, між окладом та продажами залежність не жорстка. Це означає, що у когось із співробітників продажу могли навіть знизитись, незважаючи на зростання окладу. У когось залишитися незмінними. Але в середньому по фірмі продажі зросли, і ми говоримо – зв'язок продажів та окладу співробітників є, і він кореляційний.

В основі функціонального зв'язку (педаль газу – швидкість) лежить фізичний закон. В основі кореляційного зв'язку (продажу – оклад) знаходиться проста узгодженість зміни двох показників. Жодного закону (у фізичному розумінні цього слова) за кореляцією немає. Є лише ймовірнісна (стохастична) закономірність.

Чисельний вираз кореляційної залежності

Отже, кореляційний зв'язок відбиває залежність між явищами. Якщо ці явища можна виміряти, вона отримує чисельне вираз.

Наприклад, вивчається роль читання у житті людей. Дослідники взяли групу з 40 осіб та виміряли у кожного випробуваного два показники: 1) скільки часу він читає на тиждень; 2) якою мірою вважає себе благополучним (за шкалою від 1 до 10). Вчені занесли ці дані у два стовпчики та за допомогою статистичної програми розрахували кореляцію між читанням та благополуччям. Припустимо, вони одержали наступний результат -0,76. Але що означає це число? Як його проінтерпретувати? Давайте розумітися.

Отримане число називається коефіцієнтом кореляції. Для його правильної інтерпретації важливо враховувати таке:

  1. Знак "+" або "-" відображає напрямок залежності.
  2. Розмір коефіцієнта відбиває силу залежності.

Пряма та зворотна

Знак плюс перед коефіцієнтом свідчить про те, що зв'язок між явищами чи показниками пряма. Тобто чим більше один показник, тим більше й інший. Вище оклад - вищий за продаж. Така кореляція називається прямою, або позитивною.

Якщо коефіцієнт має знак мінус, значить кореляція зворотна, або негативна. У цьому випадку що вищий один показник, то нижчий інший. У прикладі з читанням та благополуччям ми отримали -0,76, і це означає, що чим більше людичитають, тим нижчий рівень їхнього благополуччя.

Сильна та слабка

Кореляційний зв'язок у чисельному вираженні – це число в діапазоні від -1 до +1. Позначається буквою "r". Чим вище число (без урахування знака), тим кореляційний зв'язок сильніший.

Чим нижче чисельне значення коефіцієнта, тим взаємозв'язок між явищами та показниками менший.

Максимально можлива сила залежності – це 1 або -1. Як це зрозуміти та уявити?

Розглянемо приклад. Взяли 10 студентів та виміряли у них рівень інтелекту (IQ) та успішність за семестр. Розташували ці дані у вигляді двох стовпців.

Випробуваний

IQ

Успішність (бали)

Уважно подивіться на дані в таблиці. Від 1 до 10 випробуваного зростає рівень IQ. Але також зростає рівень успішності. З будь-яких двох студентів успішність буде вищою у того, хто має вище IQ. І жодних винятків із цього правила не буде.

Перед нами приклад повної, 100%-но узгодженої зміни двох показників у групі. І це приклад максимально можливого позитивного взаємозв'язку. Тобто кореляційна залежність між інтелектом і успішністю дорівнює 1.

Розглянемо інший приклад. У цих 10-ти студентів за допомогою опитування оцінили, якою мірою вони почуваються успішними у спілкуванні з протилежною статтю (за шкалою від 1 до 10).

Випробуваний

IQ

Успіх у спілкуванні з протилежною статтю (бали)

Дивимося уважно на дані у таблиці. Від 1 до 10 випробуваного зростає рівень IQ. При цьому в останньому стовпці послідовно знижується рівень успішності спілкування з протилежною статтю. З будь-яких двох студентів успіх спілкування з протилежною статтю буде вищим у того, хто має IQ нижче. І жодних винятків із цього правила не буде.

Це приклад повної узгодженості зміни двох показників у групі – максимально можливий негативний взаємозв'язок. Кореляційний зв'язок між IQ та успішністю спілкування з протилежною статтю дорівнює -1.

А як зрозуміти сенс кореляції, що дорівнює нулю (0)? Це означає, що зв'язку між показниками немає. Ще раз повернемося до наших студентів та розглянемо ще один виміряний у них показник – довжину стрибка з місця.

Випробуваний

IQ

Довжина стрибка з місця (м)

Не спостерігається жодної узгодженості між зміною IQ від людини до людини та довгою стрибка. Це свідчить про відсутність кореляції. Коефіцієнт кореляції IQ та довжини стрибка з місця у студентів дорівнює 0.

Ми розглянули крайні випадки. У реальних вимірах коефіцієнти рідко бувають дорівнюють точно 1 або 0. При цьому прийнята наступна шкала:

  • якщо коефіцієнт більше 0,70 – зв'язок між показниками сильний;
  • від 0,30 до 0,70 - зв'язок помірний,
  • менше 0,30 - зв'язок слабкий.

Якщо оцінити за цією шкалою отриману нами вище кореляцію між читанням та благополуччям, то виявиться, що ця залежність сильна та негативна -0,76. Тобто спостерігається сильна негативний зв'язокміж начитаністю та благополуччям. Що ще раз підтверджує біблійну мудрість про співвідношення мудрості та смутку.

Наведена градація дає дуже приблизні оцінки й у вигляді рідко використовуються у дослідженнях.

Найчастіше використовуються градації коефіцієнтів за рівнями значимості. І тут реально отриманий коефіцієнт може бути значним чи значимим. Визначити це можна, порівнявши його значення із критичним значенням коефіцієнта кореляції, взятим із спеціальної таблиці. Причому ці критичні значення залежать від чисельності вибірки (що більший обсяг, то нижче критичне значення).

Кореляційний аналіз у психології

Кореляційний метод виступає одним із основних у психологічних дослідженнях. І це невипадково, адже психологія прагне бути точною наукою. Чи виходить?

У чому особливість законів у точних науках. Наприклад, закон тяжіння у фізиці діє без винятків: що більше маса тіла, то сильніше воно притягує інші тіла. Цей фізичний закон відображає зв'язок маси тіла та сили тяжіння.

У психології інша ситуація. Наприклад, психологи публікують дані про зв'язок теплих відносин у дитинстві з батьками та рівня креативності у дорослому віці. Чи означає це, що кожен з піддослідних з дуже теплими відносинамиз батьками у дитинстві матиме дуже високі творчі здібності? Відповідь однозначна – ні. Тут немає закону, подібного до фізичного. Немає механізму впливу дитячого досвіду на креативність дорослих. Це наші фантазії! Є узгодженість даних (відносини – креативність), але за ними немає закону. А є лише кореляційний зв'язок. Психологи часто називають взаємозв'язки, що виявляються психологічними закономірностями, підкреслюючи їх імовірнісний характер - не жорсткість.

Приклад дослідження на студентах із попереднього розділу добре ілюструє використання кореляцій у психології:

  1. Аналіз взаємозв'язку між психологічними показниками. У нашому прикладі IQ та успішність спілкування з протилежною статтю – це психологічні параметри. Виявлення кореляції між ними розширює уявлення про психічну організацію людини, про взаємозв'язки між різними сторонами її особистості - у даному випадкуміж інтелектом та сферою спілкування.
  2. Аналіз взаємозв'язків IQ з успішністю та стрибками - приклад зв'язку психологічного параметра з непсихологічними. Отримані результати розкривають особливості впливу інтелекту на навчальну та спортивну діяльність.

Ось як могли виглядати короткі висновки щодо результатів вигаданого дослідження на студентах:

  1. Виявлено значну позитивну залежність інтелекту студентів та їх успішності.
  2. Існує негативна значуща взаємозв'язок IQ з успішністю спілкування з протилежною статтю.
  3. Не виявлено зв'язку IQ студентів із вмінням стрибати з місця.

Таким чином, рівень інтелекту студентів виступає позитивним фактором їх академічної успішності, в той же час негативно позначається на відносинах з протилежною статтю і не надаючи значного впливу на спортивні успіхи, зокрема, здатність стрибати з місця.

Як бачимо, інтелект допомагає студентам навчатися, але заважає будувати стосунки із протилежною статтю. При цьому не впливає на їхні спортивні успіхи.

Неоднозначний вплив інтелекту на особистість та діяльність студентів відображає складність цього феномена у структурі особистісних особливостей та важливість продовження досліджень у цьому напрямі. Зокрема, є важливим провести аналіз взаємозв'язків інтелекту з психологічними особливостямита діяльністю студентів з урахуванням їхньої статі.

Коефіцієнти Пірсона та Спірмена

Розглянемо два методи розрахунку.

p align="justify"> Коефіцієнт Пірсона - це особливий метод розрахунку взаємозв'язку показників між вираженістю чисельних значень в одній групі. Дуже спрощено він зводиться до наступного:

  1. Беруться значення двох параметрів у групі випробуваних (наприклад, агресії та перфекціонізму).
  2. Знаходяться середні значення кожного параметра групи.
  3. Знаходяться різниці параметрів кожного випробуваного та середнього значення.
  4. Ці різниці підставляються у спеціальну форму для розрахунку коефіцієнта Пірсона.

Коефіцієнт рангової кореляціїСпірмена розраховується таким чином:

  1. Беруться значення двох індикаторів групи піддослідних.
  2. Знаходяться ранги кожного чинника групи, тобто місце у списку зростання.
  3. Знаходяться різниці рангів, зводяться квадрат і підсумовуються.
  4. Далі різниці рангів підставляються у спеціальну форму для обчислення коефіцієнта Спірмена.

У разі Пірсона розрахунок йшов із використанням середнього значення. Отже, випадкові викиди даних (істотна відмінність від середнього), наприклад, через помилку обробки або недостовірних відповідей можуть суттєво спотворити результат.

У випадку Спірмена абсолютні значення даних не відіграють ролі, тому що враховується лише їх взаємне розташуванняпо відношенню один до одного (ранги). Тобто викиди даних або інші неточності не вплинуть на кінцевий результат.

Якщо результати тестування коректні, то відмінності коефіцієнтів Пірсона і Спірмена незначні, коефіцієнт Пірсона показує більше точне значеннявзаємозв'язку даних.

Як розрахувати коефіцієнт кореляції

Коефіцієнти Пірсона та Спірмена можна розрахувати вручну. Це може знадобитись при поглибленому вивченні статистичних методів.

Однак у більшості випадків при вирішенні прикладних завдань, зокрема й у психології, можна проводити розрахунки з допомогою спеціальних програм.

Розрахунок за допомогою електронних таблиць Microsoft Excel

Повернемося знову наприклад зі студентами і розглянемо дані про рівень їхнього інтелекту та довжину стрибка з місця. Занесемо ці дані (два стовпці) до таблиці Excel.

Перемістивши курсор у порожню комірку, натиснемо опцію «Вставити функцію» та виберемо «КОРРЕЛ» з розділу «Статистичні».

Формат цієї функції передбачає виділення двох масивів даних: Корел (масив 1; масив »). Виділяємо відповідно стовпчик з IQ та довжиною стрибків.

У таблицях Excel реалізовано формулу розрахунку лише коефіцієнта Пірсона.

Розрахунок за допомогою програми STATISTICA

Заносимо дані по інтелекту та довжині стрибка у полі вихідних даних. Далі вибираємо опцію "Непараметричні критерії", "Спірмена". Виділяємо параметри для розрахунку та отримуємо наступний результат.


Як видно, розрахунок дав результат 0,024, що відрізняється від результату за Пірсоном - 0,038, отриманої вище з допомогою Excel. Проте відмінності незначні.

Використання кореляційного аналізу у дипломних роботах з психології (приклад)

Більшість тем випускних кваліфікаційних робітз психології (дипломів, курсових, магістерських) передбачають проведення кореляційного дослідження (інші пов'язані з виявленням відмінностей психологічних показників у різних групах).

Сам термін «кореляція» у назвах тем звучить рідко – він ховається за такими формулюваннями:

  • «Взаємозв'язок суб'єктивного відчуття самотності та самоактуалізації у жінок зрілого віку»;
  • «Особливості впливу життєстійкості менеджерів на успішність їхньої взаємодії з клієнтами у конфліктних ситуаціях»;
  • «Особистісні фактори стресостійкості співробітників МНС».

Таким чином, слова «взаємозв'язок», «вплив» та «чинники» - вірні ознаки того, що методом аналізу даних у емпіричному дослідженнімає бути кореляційний аналіз.

Розглянемо коротко етапи його проведення під час написання дипломної роботиз психології на тему: «Взаємозв'язок особистісної тривожності та агресивності у підлітків».

1. Для розрахунку необхідні сирі дані, як яких зазвичай виступають результати тестування піддослідних. Вони заносяться до зведеної таблиці і поміщаються у додаток. Ця таблиця влаштована так:

  • кожен рядок містить дані на одного випробуваного;
  • кожен стовпець містить показники за однією шкалою всім випробуваних.

№ випробуваного

Особистісна тривожність

Агресивність

2. Необхідно вирішити, який із двох типів коефіцієнтів - Пірсона або Спірмена - використовуватиметься. Нагадуємо, що Пірсон дає більше точний результат, але він чутливий до викидів у даних Коефіцієнти Спірмена можуть використовуватися з будь-якими даними (крім номінативної шкали), тому саме вони найчастіше використовують у дипломах психології.

3. Заносимо таблицю сирих даних у статистичну програму.

4. Розраховуємо значення.



5. На наступному етапіважливо визначити, чи важливий взаємозв'язок. Статистична програма підсвітила результати червоним, що означає, що кореляція статистично значущі за рівня значущості 0,05 (зазначено вище).

Однак, корисно знати, як визначити значущість вручну. І тому знадобиться таблиця критичних значень Спірмена.

Таблиця критичних значень коефіцієнтів Спірмена

Рівень статистичної значимості

Число випробуваних

р = 0,05

р = 0,01

р = 0,001

0,88

0,96

0,99

0,81

0,92

0,97

0,75

0,88

0,95

0,71

0,83

0,93

0,67

0,63

0,77

0,87

0,74

0,85

0,58

0,71

0,82

0,55

0,68

0,53

0,66

0,78

0,51

0,64

0,76

Нас цікавить рівень значущості 0,05 та обсяг нашої вибірки 10 осіб. На перетині цих даних знаходимо значення критичного Спірмена: Rкр = 0,63.

Правило таке: якщо отримане емпіричне значення Спірмена більше чи одно критичному, він статистично значимий. У нашому випадку: Rемп (0,66) > Rкр (0,63), отже, взаємозв'язок між агресивністю і тривожністю групи підлітків статистично значуща.

5. У текст дипломної потрібно вставляти дані у таблиці формату word, а чи не таблицю зі статистичної програми. Під таблицею описуємо отриманий результат та інтерпретуємо його.

Таблиця 1

Коефіцієнти Спірмена агресивності та тривожності у групі підлітків

Агресивність

Особистісна тривожність

0,665*

* - статистично достовірна (р0,05)

Аналіз даних, наведених у таблиці 1, показує, що існує статистично значущий позитивний зв'язок між агресивністю та тривожністю підлітків. Це означає, що чим вище особистісна тривожністьпідлітків, тим вищий рівень їхньої агресивності. Такий результат дає підстави припустити, що агресія для підлітків виступає одним із способів усунення тривожності. Зазнаючи невпевненості у собі, тривогу у зв'язку з загрозами самооцінці, особливо чутливої ​​у підлітковому віці, підліток часто використовує агресивну поведінку, таким непродуктивним способом знижуючи тривогу.

6. Чи можна говорити про вплив при інтерпретації зв'язків? Чи можна сказати, що тривожність впливає агресивність? Строго кажучи, ні. Вище ми показали, що кореляційна зв'язок між явищами носить імовірнісний характері і відбиває лише узгодженість змін ознак групи. При цьому ми не можемо сказати, що ця узгодженість викликана тим, що одне з явищ є причиною іншого, що впливає на нього. Тобто наявність кореляції між психологічними параметрами не дає підстав говорити про існування між ними причинно-наслідкового зв'язку. Однак практика показує, що термін «вплив» часто використовується під час аналізу результатів кореляційного аналізу.

Метод рангової кореляції Спірмена дозволяє визначити тісноту (силу) та напрямок кореляційного зв'язку між двома ознаками або двома профілями (ієрархіями) ознак.

Для підрахунку рангової кореляції необхідно мати два ряди значень,

які можуть бути проранжовані. Такими рядами значень можуть бути:

1) дві ознаки, виміряні в одній і тій же групі випробуваних;

2) дві індивідуальні ієрархії ознак, виявлені у двох піддослідних по одному й тому набору ознак;

3) дві групові ієрархії ознак,

4) індивідуальна та групова ієрархії ознак.

Спочатку показники ранжуються окремо за кожною ознакою.

Як правило, меншим значенням ознаки нараховується менший ранг.

У першому випадку (дві ознаки) ранжуються індивідуальні значення за першою ознакою, отримані різними випробуваними, а потім індивідуальні значення за другою ознакою.

Якщо дві ознаки пов'язані позитивно, то випробувані, що мають низькі ранги по одному з них, матимуть низькі ранги та по іншому, а випробувані, що мають високі ранги за

одній з ознак, матимуть за іншою ознакою також високі ранги. Для підрахунку rs необхідно визначити різниці (d) між рангами, отриманими даним випробуваним за обома ознаками. Потім ці показники d певним чином перетворюються і віднімаються з 1.

менше різниці між рангами, тим більше буде rs, тим ближче він буде до +1.

Якщо кореляція відсутня, всі ранги будуть перемішані і між ними не буде

жодної відповідності. Формула складена так, що в цьому випадку rs виявиться близьким до 0.

У разі негативної кореляції низьким рангам випробуваних за однією ознакою

будуть відповідати високі ранги за іншою ознакою, і навпаки. Чим більший розбіжність між рангами випробуваних за двома змінними, тим ближче rs до -1.

У другому випадку (два індивідуальні профілі), ранжуються індивідуальні

значення, отримані кожним з 2-х випробуваних за певним (однаковим для них обох) набором ознак. Перший ранг отримає ознаку з найнижчим значенням; другий ранг – ознака з вищим значенням тощо. Очевидно, що всі ознаки повинні бути виміряні в тих самих одиницях, інакше ранжування неможливо. Наприклад, неможливо проранжувати показники по опитувальнику Кеттелла (16PF), якщо вони виражені в "сирих" балах, оскільки за різними факторами діапазони значень різні: від 0 до 13, від 0 до

20 і від 0 до 26. Ми не можемо сказати, який із факторів буде займати перше місце за виразністю, поки не наведемо всі значення до єдиної шкали (найчастіше це шкала стін).

Якщо індивідуальні ієрархії двох піддослідних пов'язані позитивно, то ознаки, що мають низькі ранги в одного з них, матимуть низькі ранги і в іншого, і навпаки. Наприклад, якщо в одного випробуваного фактор Е (домінантність) має найнижчий ранг, то й у іншого випробуваного він повинен мати низький ранг, якщо в одного випробуваного фактор С

(емоційна стійкість) має вищий ранг, те й інший випробуваний повинен мати по

цьому чиннику високий ранг тощо.

У третьому випадку (два групових профілю), ранжуються середньогрупові значення, отримані в 2-х групах випробуваних за певним, однаковим для двох груп, набором ознак. Надалі лінія міркувань така сама, як і в попередніх двох випадках.

У випадку 4-му (індивідуальний та груповий профілі), ранжуються окремо індивідуальні значення випробуваного та середньогрупові значення за тим же набором ознак, які отримані, як правило, при виключенні цього окремого випробуваного – він не бере участі в середньогруповому профілі, з яким буде зіставлятися його індивідуальний профіль Рангова кореляція дозволить перевірити, наскільки узгоджено індивідуальний та груповий профілі.

У всіх чотирьох випадках значимість отриманого коефіцієнта кореляції визначається за кількістю ранжованих значень N. У першому випадку ця кількість співпадатиме з обсягом вибірки n. У другому випадку кількістю спостережень буде кількість ознак, що становлять ієрархію. У третьому і четвертому випадку N – це також кількість зіставних ознак, а чи не кількість випробуваних у групах. Детальні пояснення наведено в прикладах. Якщо абсолютна величина rs досягає критичного значення або перевищує його, кореляція є достовірною.

Гіпотези.

Можливі два варіанти гіпотез. Перший відноситься до випадку 1, другий - до трьох інших випадків.

Перший варіант гіпотез

H0: Кореляція між змінними А та Б не відрізняється від нуля.

H1: Кореляція між змінними А та Б достовірно відрізняється від нуля.

Другий варіант гіпотез

H0: Кореляція між ієрархіями А та Б не відрізняється від нуля.

H1: Кореляція між ієрархіями А та Б достовірно відрізняється від нуля.

Обмеження коефіцієнта рангової кореляції

1. По кожній змінній має бути представлено не менше 5 спостережень. Верхня межа вибірки визначається наявними таблицями критичних значень.

2. Коефіцієнт рангової кореляції Спірмена rs при великій кількості однакових рангів по одній або обох змінних, що зіставляються, дає огрублені значення. В ідеалі обидва корелювані ряди повинні являти собою дві послідовності значень, що не збігаються. У разі, якщо цієї умови не дотримується, необхідно вносити поправку на однакові ранги.

Коефіцієнт рангової кореляції Спірмена підраховується за такою формулою:

Якщо в обох порівнюваних рангових рядах присутні групи однакових рангів, перед підрахунком коефіцієнта рангової кореляції необхідно внести поправки на однакові ранги Та і Тв:

Та = Σ (а3 - а) / 12,

Тв = Σ (в3 - в) / 12,

де а – обсяг кожної групи однакових рангів у ранговому ряду А, у – обсяг кожної

групи однакових рангів у ранговому ряду Ст.

Для підрахунку емпіричного значення rs використовують формулу:

Розрахунок коефіцієнта рангової кореляції Спірмена rs

1. Визначити, які дві ознаки або дві ієрархії ознак братимуть участь у

зіставленні як змінні А та Ст.

2. Проранжувати значення змінної А, нараховуючи ранг 1 найменшому значенню, відповідно до правил ранжування (див. П.2.3). Занести ранги у перший стовпець таблиці за порядком номерів випробуваних чи ознак.

3. Проранжувати значення змінної, відповідно до тих самих правил. Занести ранги у другий стовпець таблиці за порядком номерів випробуваних чи ознак.

5. Звести кожну різницю у квадрат: d2. Ці значення занести до четвертого стовпця таблиці.

Та = Σ (а3 - а) / 12,

Тв = Σ (в3 - в) / 12,

де а – обсяг кожної групи однакових рангів у ранговому ряду А; в – обсяг кожної групи

однакових рангів у ранговому ряду Ст.

а) за відсутності однакових рангів

rs  1 − 6 ⋅

б) за наявності однакових рангів

Σd 2  T  T

r  1 − 6 ⋅ a в,

де Σd2 – сума квадратів різниць між рангами; Та і Тв – поправки на однакові

N – кількість випробуваних чи ознак, що брали участь у ранжируванні.

9. Визначити по Таблиці (див. Додаток 4.3) критичні значення rs для даного N. Якщо rs перевищує критичне значення або, принаймні, дорівнює йому, кореляція достовірно відрізняється від 0.

Приклад 4.1.При визначенні ступеня залежності реакції вживання алкоголю на окорухову реакцію в випробуваній групі були отримані дані до вживання алкоголю та після вживання. Чи залежить реакція випробуваного стану сп'яніння?

Результати експерименту:

До:16, 13, 14, 9, 10, 13, 14, 14, 18, 20, 15, 10, 9, 10, 16, 17, 18. Після: 24, 9, 10, 23, 20, 11, 12, 19, 18, 13, 14, 12, 14, 7, 9, 14. Сформулюємо гіпотези:

Н0: кореляція між ступенем залежності реакції до вживання алкоголю і після не відрізняється від нуля.

Н1: кореляція між ступенем залежності реакції до вживання алкоголю та після достовірно відрізняється від нуля.

Таблиця 4.1. Розрахунок d2 для рангового коефіцієнта кореляції Спірмена rs при зіставленні показників окорухової реакції до експерименту та після (N=17)

значення

значення

Оскільки ми маємо повторювані ранги, то в даному випадку будемо застосовувати формулу з поправкою на однакові ранги:

Та = ((23-2) + (33-3) + (23-2) + (33-3) + (23-2) + (23-2)) / 12 = 6

Тb = ((23-2) + (23-2) + (33-3)) / 12 = 3

Знайдемо емпіричне значення коефіцієнта Спірмена:

rs = 1 - 6 * ((767,75 +6 +3) / (17 * (172-1))) = 0,05

За таблицею (додаток 4.3) знаходимо критичні значення коефіцієнта кореляції

0,48 (p ≤ 0,05)

0,62 (p ≤ 0,01)

Отримуємо

rs=0,05∠rкр(0,05)=0,48

Висновок: Н1гіпотеза відкидається і приймається Н0. Тобто. кореляція між ступенем

залежність реакції до вживання алкоголю і після не відрізняється від нуля.

Кореляція Пірсона є мірою лінійного зв'язку між двома змінними. Вона дозволяє визначити, наскільки пропорційна мінливість двох змінних. Якщо змінні пропорційні один одному, то графічно зв'язок між ними можна подати у вигляді прямої лінії з позитивним (пряма пропорція) або негативним (зворотна пропорція) нахилом.

На практиці зв'язок між двома змінними, якщо він є, є імовірнісним і графічно виглядає як хмара розсіювання еліпсоїдної форми. Цей еліпсоїд, однак, можна уявити (апроксимувати) у вигляді прямої лінії, або лінії регресії. Лінія регресії – це пряма, побудована методом найменших квадратів: сума квадратів відстаней (обчислених по осі Y) від кожної точки графіка розсіювання до прямої є мінімальною

Особливе значеннядля оцінки точності передбачення має дисперсія оцінок залежної змінної. По суті, дисперсія оцінок залежної змінної Y - це та частина її повної дисперсії, яка обумовлена ​​впливом незалежної змінної X. Інакше кажучи, відношення дисперсії оцінок залежної змінної до її істинної дисперсії дорівнює квадрату коефіцієнта кореляції.

Квадрат коефіцієнта кореляції залежної та незалежної змінних представляє частку дисперсії залежної змінної, обумовленої впливом незалежної змінної, і називається коефіцієнтом детермінації. Коефіцієнт детермінації, таким чином, показує, якою мірою мінливість однієї змінної обумовлена ​​(детермінована) впливом іншої змінної.

Коефіцієнт детермінації має важливою перевагоюпроти коефіцієнтом кореляції. Кореляція __________не є лінійною функцієюзв'язки між двома змінними. Тому, середнє арифметичне коефіцієнтів кореляції для кількох вибірок не збігається з кореляцією, обчисленою відразу всім випробовуваних із цих вибірок (тобто. коефіцієнт кореляції не аддитивний). Навпаки, коефіцієнт детермінації відбиває зв'язок лінійно і тому аддитивним: допускається його усереднення кількох вибірок.

Додаткову інформаціюпро силу зв'язку дає значення коефіцієнта кореляції у квадраті – коефіцієнт детермінації: це частина дисперсії однієї змінної, яка може бути пояснена впливом іншої змінної. На відміну від коефіцієнта кореляції, коефіцієнт детермінації лінійно зростає зі збільшенням сили зв'язку.

Коефіцієнти кореляції Спірмена та τ-Кендала (рангові кореляції)

Якщо обидві змінні, між якими вивчається зв'язок, представлені у порядковій шкалі, або одна з них – у порядковій, а інша – у метричній, то застосовуються рангові коефіцієнтикореляції: Спірмена або τ-Кендела. І той, і інший коефіцієнт вимагає для застосування попереднього ранжування обох змінних.

p align="justify"> Коефіцієнт рангової кореляції Спірмена - це непараметричний метод, який використовується з метою статистичного вивчення зв'язку між явищами. У цьому випадку визначається фактичний ступінь паралелізму між двома кількісними рядамиознак, що вивчаються, і дається оцінка тісноти встановленого зв'язку за допомогою кількісно вираженого коефіцієнта.

Якщо члени групи чисельністю були ранжировані спочатку змінною x, потім – змінною y, то кореляцію між змінними x і y можна отримати, просто обчисливши коефіцієнт Пірсона для двох рядів рангів. За умови відсутності зв'язків у рангах (тобто відсутності повторюваних рангів) за тією та іншою змінною, формула для Пірсона може бути суттєво спрощена у обчислювальному відношенні та перетворена на формулу, відому як Спірмена.

Потужність коефіцієнта рангової кореляції Спірмена дещо поступається потужністю параметричного коефіцієнта кореляції.

Коефіцієнт рангової кореляції доцільно застосовувати за наявності невеликої кількості спостережень. Цей методможе бути використаний не тільки для кількісно виражених даних, але також і у випадках, коли значення, що реєструються, визначаються описовими ознаками різної інтенсивності.

Коефіцієнт рангової кореляції Спірмена при великій кількості однакових рангів по одній або обох змінним, що зіставляється, дає огрублені значення. В ідеалі обидва корелювані ряди повинні являти собою дві послідовності значень, що не збігаються.

Альтернативу кореляції Спірмена для рангів є кореляція τ-Кендала. В основі кореляції, запропонованої М.Кендаллом, лежить ідея про те, що про напрям зв'язку можна судити, попарно порівнюючи між собою випробуваних: якщо у пари випробуваних зміна x збігається у напрямку зі зміною y, то це свідчить про позитивний зв'язок, якщо не збігається - то про негативний зв'язок.

Насправді визначення тісноти зв'язку двох ознак часто застосовується коефіцієнт рангової кореляції Спірмена (Р). Значення кожної ознаки ранжуються за ступенем зростання (від 1 до n), потім визначається різниця (d) між рангами, які відповідають одному спостереженню.

Приклад №1. Залежність між обсягом промислової продукції та інвестиціями в основний капітал по 10 областях одного з федеральних округів РФ у 2003 році характеризується такими даними.
Обчисліть рангові коефіцієнти кореляції Спірменаі Кендела. Перевірити їх значення при α=0,05. Сформулюйте висновок про залежність між обсягом промислової продукції та інвестиціями в основний капітал за аналізованими областями РФ.

Надамо ранги ознакою Y і фактору X . Знайдемо суму різниці квадратів d 2 .
Використовуючи калькулятор, обчислимо коефіцієнт рангової кореляції Спірмена:

X Y ранг X, d x ранг Y, d y (d x - d y) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

Зв'язок між ознакою Y фактором X сильний і прямий.

Оцінка коефіцієнта рангової кореляції Спірмена



По таблиці Стьюдента знаходимо Tтабл.
T табл = (18; 0.05) = 1.734
Оскільки Tнабл > Tтабл, то відхиляємо гіпотезу про рівність нулю коефіцієнта рангової кореляції. Інакше кажучи, коефіцієнта рангової кореляції Спірмена статистично - значущий.

Інтервальна оцінка для коефіцієнта рангової кореляції (довірчий інтервал)
Довірчий інтервал для коефіцієнта рангової кореляції Спірмена: p (0.5431; 0.9095).

Приклад №2. Початкові дані.

5 4
3 4
1 3
3 1
6 6
2 2
Так як у матриці є пов'язані ранги (однаковий ранговий номер) 1-го ряду, зробимо їх переформування. Переформування рангів здійснюватиметься без зміни важливості рангу, тобто між ранговими номерами повинні зберегтися відповідні співвідношення (більше, менше або рівно). Також не рекомендується ставити ранг вище 1 і нижче значення, що дорівнює кількості параметрів (в даному випадку n = 6). Переформування рангів провадиться в табл.
Нові ранги
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
Так як у матриці є пов'язані ранги 2-го ряду, зробимо їх переформування. Переформування рангів провадиться в табл.
Номери місць у впорядкованому рядіРозташування факторів оцінки експертаНові ранги
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
Матриця рангів.
ранг X, d xранг Y, d y(d x - d y) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
Оскільки серед значень ознак х і зустрічається кілька однакових, тобто. утворюються пов'язані ранги, то у такому разі коефіцієнт Спірмена обчислюється як:

де


j – номери зв'язок по порядку для ознаки х;
А j - число однакових рангів у j-й зв'язці х;
k – номери зв'язок по порядку для ознаки у;
У k - число однакових рангів k-й зв'язціза у.
A = [(2 3 -2)]/12 = 0.5
B = [(2 3 -2)]/12 = 0.5
D = A + B = 0.5 + 0.5 = 1

Зв'язок між ознакою Y та фактором X помірна та пряма.

Цей калькулятор нижче калькуляторів Spearman's rank correlation coefficient між двома кількома variables. The theoretical part is traditional below the calculator.

add import_export mode_edit delete

Changes of random variables

arrow_upwardarrow_downward arrow_upwardarrow_downward
Items per page: 5 10 20 50 100 chevron_left chevron_right

Changes of random variables

Import data Import error

"Один з наступних характерних рис використовує окремі дані поля: tab, semicolon (;) або comma(,)" Sample: -50.5;-50.5

Import Back Cancel

Digits after the decimal point: 4

Calculate

Spearman's correlation coefficient

Save share extension

Метод методу Spearman's rank correlation coefficient calculation is actually pretty simple. ranking values.

We have only understand what is the rank value and why all this is necessary.

Якщо елементи variational series arranged in ascending or descending order, що rank of the element will be his number in ordered series.

Для прикладу, ми маємо variational series (17,26,5,14,21). Let's sort it's elements in a descending order (26,21,17,14,5). 26 has rank of 1, 21 - rank of 2 and so on, Variational series of ranking values ​​will look like this (3,1,5,4,2).

I.e. Коли калькуляція Spearman's coefficient initial variation series are converted in variational series of ranking values ​​and then Pearson's formula is applied to them.
.
Там є одна загальна величина - ступінь зміни величини є такою, як величина ranks. Це, для серії (17, 15, 14, 15) ranking series буде виглядати як (1, 2.5, 4, 2.5), як перший елемент є 15 ha a rank of 2, and the second - rank of 3, and.

Якщо ви не знайдете значення, що є, всі значення ranking series - numbers between 1 and n, the Pearson's formula can be simplified to

Завжди, ця формула є спрямована на формуляра для обчислення Spearman's coefficient.

What is essence of transition from the values ​​themselves to their rank value?
When investigating the correlation of ranking values you can find how well the dependence of the two variables is described by a monotonic function.

Зазначення значних показників direction of relationship між variables. Якщо значок є позитивним значенням Y має тенденцію до збільшення X. Якщо sign negative значення Y має тенденцію до зменшення з збільшенням X. Якщо значення не є тенденцією . Якщо коефіцієнт еквівалентів 1 або -1, відносини між X і Y мають appearance monotonic function, i.e. з збільшенням X, Y такожзбільшується і vice versa.

Це є невідомий Pearson's correlation coefficient, який може помітити тільки linear relationship of one variable from another, Spearman's correlation coefficient може detect monotonic dependence, where the directliner relationship cannot be revealed.

Here's an example.
Поясню з прикладу. Let"s suppose,we examine the function y=10/x.
We have the following measurements of X і Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Для цього data, Pearson correlation coefficient is equal to -0.4686, i.e. the relationship is weak or absent. І Spearman's correlation coefficient є strictly equal to -1, as if it's hints до дослідника, що Y є дуже negative monotonic dependence from X.

Схожі статті

2022 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.