Коефіцієнт кореляції пірсона та спірмена. Рангова кореляція та коефіцієнт рангової кореляції спірмена

Коротка теорія

Рангова кореляція – це метод кореляційного аналізу, що відбиває відносини змінних, упорядкованих зростання їх значення.

Ранги – це порядкові номериодиниць сукупності ранжированном ряду. Якщо проранжувати сукупність за двома ознаками, зв'язок між якими вивчається, повний збіг рангів означає максимально тісний прямий зв'язок, а повна протилежність рангів - максимально тісний Зворотній зв'язок. Ранжувати обидві ознаки необхідно в тому самому порядку: або від менших значень ознаки до великих, або навпаки.

Для практичних цілей використання рангової кореляціїдуже корисно. Наприклад, якщо встановлена ​​висока рангова кореляція між двома якісними ознаками виробів, достатньо контролювати вироби тільки за однією з ознак, що здешевлює і прискорює контроль.

Коефіцієнт кореляції рангів, запропонований К. Спірменом, відноситься до непараметричних показників зв'язку між змінними, виміряними в ранговій шкалі. При розрахунку цього коефіцієнта не потрібно ніяких припущень про характер розподілу ознак у генеральній сукупності. Цей коефіцієнт визначає ступінь тісноти зв'язку порядкових ознак, які у разі є ранги порівнюваних величин.

Розмір коефіцієнта кореляції Спірмена лежить в інтервалі +1 і -1. Він може бути позитивним та негативним, характеризуючи спрямованість зв'язку між двома ознаками, виміряними в ранговій шкалі.

Ранговий коефіцієнт кореляції Спірмена підраховується за такою формулою:

Різниця між рангами за двома змінними

кількість порівняних пар

Першим етапом розрахунку коефіцієнта рангової кореляції є ранжування рядів змінних. Процедура ранжирування починається з розташування змінних за зростанням їх значень. Різним значенням надаються ранги, що позначаються натуральними числами. Якщо трапляється кілька рівних за значенням змінних, їм присвоюється усереднений ранг.

Перевага коефіцієнта кореляції рангів Спірмена полягає в тому, що ранжувати можна і за такими ознаками, які не можна виразити чисельно: можна проранжувати кандидатів на зайняття певної посади за професійному рівню, за вмінням керувати колективом, з особистої чарівності тощо. п. При експертних оцінках можна ранжувати оцінки різних експертів і знайти кореляції друг з одним, щоб потім виключити з розгляду оцінки експерта, слабко корельовані з оцінками інших експертів. Коефіцієнт кореляції рангів Спірмена застосовується з метою оцінки стійкості тенденції динаміки. Недоліком коефіцієнта кореляції рангів і те, що однаковим різницям рангів можуть відповідати цілком відмінні різниці значень ознак (у разі кількісних ознак). Тому для останніх слід вважати кореляцію рангів наближеною мірою тісноти зв'язку, що має меншу інформативність, ніж коефіцієнт кореляції числових значень ознак.

Приклад розв'язання задачі

Умова задачі

Опитування випадково обраних 10 студентів, які проживають у гуртожитку університету, дозволяє виявити залежність між середнім балом за результатами попередньої сесії та кількістю годин на тиждень, витрачених студентом на самостійну підготовку.

Визначте тісноту зв'язку за допомогою коефіцієнта рангової кореляції Спірмена.

Якщо виникли труднощі з вирішенням завдань, сайт сайт надає онлайн допомогу студентам зі статистики з домашніми контрольними або іспитами.

Рішення завдання

Розрахуємо коефіцієнт кореляції рангів.

Ранжування Порівняння рангів Різниця рангів 1 26 4.7 8 1 3.1 1 8 10 -2 4 2 22 4.4 10 2 3.6 2 7 9 -2 4 3 8 3.8 12 3 3.7 3 1 4 -3 9 4 12 3.7 15 4 3.8 4 3 3 0 0 5 15 4.2 17 5 3.9 5 4 7 -3 9 6 30 4.3 20 6 4 6 9 8 1 1 7 20 3.6 22 7 4.2 7 6 2 4 16 8 31 4 26 8 4.3 8 10 6 4 16 9 10 3.1 30 9 4.4 9 2 1 1 1 10 17 3.9 31 10 4.7 10 5 5 0 0 Сума 60

Коефіцієнт рангової кореляції Спірмена:

Підставляючи числові значення, отримуємо:

Висновок до завдання

Зв'язок між середнім балом за результатами попередньої сесії та кількістю годин на тиждень, витрачених студентом на самостійну підготовку, помірної тісноти.

Якщо терміни зі здаванням контрольної роботипіджимають, на сайті завжди можна замовити термінове вирішення завдань зі статистики.

Середнявартість рішення контрольної роботи 700 – 1200 рублів (але не менше 300 руб. за все замовлення). На ціну сильно впливає терміновість рішення (від доби до кількох годин). Вартість онлайн-допомоги на іспиті/заліку – від 1000 руб. за рішення квитка.

Всі питання щодо вартості можете задати прямо в чат, попередньо скинувши умову завдань та повідомивши необхідні вам терміни вирішення. Час відповіді – кілька хвилин.

Приклади близьких на тему завдань

Коефіцієнт Фехнера
Наведено коротка теоріята розглянуто приклад розв'язання задачі на розрахунок коефіцієнта кореляції знаків Фехнера.

Коефіцієнти взаємної сполученості Чупрова та Пірсона
Сторінка містить відомості щодо методів вивчення взаємозв'язків між якісними ознаками за допомогою коефіцієнтів взаємної сполученості Чупрова та Пірсона.

Рангова кореляція Спірмена(Кореляція рангів). Рангова кореляція Спірмена – найпростіший спосіб визначення ступеня зв'язку між факторами. Назва методу свідчить у тому, що зв'язок визначають між рангами, тобто рядами отриманих кількісних значень, ранжированих порядку спадання чи зростання. Треба мати на увазі, що, по-перше, рангове кореляцію Не рекомендується проводити, якщо зв'язок пар менше чотирьох і більше двадцяти; по-друге, рангова кореляція дозволяє визначати зв'язок і в іншому випадку, якщо значення мають напівкількісний характер, тобто не мають числового виразу, що відображають чіткий порядок дотримання цих величин; по-третє, рангову кореляцію доцільно застосовувати у тих випадках, коли достатньо отримати приблизні дані. Приклад розрахунку коефіцієнта рангової кореляції визначення питання: замірюють питання X і Y подібні особисті якості випробуваних. За допомогою двох запитань (X та Y), які вимагають альтернативних відповідей "так" чи "ні", отримали первинні результати - відповіді 15 піддослідних (N = 10). Результати подали у вигляді суми ствердних відповідей окремо для опитувальника X і для опитувальника В. Ці результати зведені у табл. 5.19.

Таблиця 5.19. Табулювання первинних результатів для розрахунку коефіцієнта рангової кореляції за Спірменом (р) *

Аналіз зведеної кореляційної матриці. Метод кореляційних плеяд.

приклад. У табл. 6.18 наведено інтерпретації одинадцяти змінних, які тестуються за методикою Векслера. Дані одержали на однорідній вибірці віком від 18 до 25 років (n = 800).

Перед розшаровуванням кореляційну матрицю доцільно ранжувати. Для цього у вихідній матриці обчислюють середні значення коефіцієнтів кореляції кожної змінної з усіма іншими.

Потім табл. 5.20 визначають допустимі рівнірозшарування кореляційної матриці при заданих довірчої ймовірності 0,95 і n - кількості

Таблиця 6.20. Східна кореляційна матриця

Змінні 1 2 3 4 б 0 7 8 0 10 11 M (rij) Ранг
1 1 0,637 0,488 0,623 0,282 0,647 0,371 0,485 0,371 0,365 0,336 0,454 1
2 1 0,810 0,557 0,291 0,508 0,173 0,486 0,371 0,273 0,273 0,363 4
3 1 0,346 0,291 0,406 0,360 0,818 0,346 0,291 0,282 0,336 7
4 1 0,273 0,572 0,318 0,442 0,310 0,318 0,291 0,414 3
5 1 0,354 0,254 0,216 0,236 0,207 0,149 0,264 11
6 1 0,365 0,405 0,336 0,345 0,282 0,430 2
7 1 0,310 0,388 0,264 0,266 0,310 9
8 1 0,897 0,363 0,388 0,363 5
9 1 0,388 0,430 0,846 6
10 1 0,336 0,310 8
11 1 0,300 10

Позначення: 1 – загальна поінформованість; 2 - поняттєвість; 3 – уважність; 4 - вдатність До узагальнення; б - безпосереднє запам'ятовування (на цифрах) 6 - рівень освоєння рідною мовою; 7 - швидкість оволодіння сенсомоторними навичками (кодування символами) 8 - спостережливість; 9 - комбінаторні здібності (до аналізу та синтезу) 10 - здатність до організації елементів в осмислене ціле; 11 – здатність до евристичного синтезу; M (rij) - середнє значення коефіцієнтів кореляції змінної з рештою змінних спостережень (у нашому випадку n = 800): r(0) - значення нульової "Розсікає" площини - мінімальна значуща абсолютна величинакоефіцієнта кореляції (n – 120, r(0) = 0,236; n = 40, r(0) = 0,407) | Δr | - допустимий крок розшарування (n = 40, | Δr | = 0,558) - допустима кількість рівнів розшарування (n = 40, s = 1; n = 120, s = 2); r(1), r(2), ..., r(9) - абсолютне значення січної площини (n = 40, r(1) = 0,965).

Для n = 800 знаходимо значення гтип і межі гі після чого розшаровує ранжовані кореляційну матрицю, виділяючи кореляційні плеяди всередині шарів, або відокремлюємо частини кореляційної матриці, вимальовуючи об'єднання кореляційних плеяд для вище шарів (рис. 5.5).

Змістовний аналіз отриманих плеяд виходить за межі математичної статистики. Слід зазначити два формальні показники, які допомагають при змістовній інтерпретації плеяд. Одним суттєвим показником є ​​ступінь вершини, тобто кількість ребер, що примикають до вершини. Змінна з найбільшою кількістюребер є " ​​ядром " плеяди і його можна як індикатор інших змінних цієї плеяди. Інший суттєвий показник – щільність зв'язку. Змінна може мати менше зв'язків в одній плеяді, але вже і більше зв'язків в іншій плеяді, проте менш тісних.

Передбачення та оцінки. Рівняння у = b1x + b0 називається загальним рівняннямпрямий. Воно свідчить про те, що пара точок (x, y), які

Мал. 5.5. Кореляційні плеяди, одержані розшаруванням матриці

лежать на деякій прямий, пов'язані так, що для будь-якого значення х величину в знаходиться в ньому в парі, можна знайти, помноживши х на деяке число b1 додавши других, число b0 до цього твору.

p align="justify"> Коефіцієнт регресії дозволяє визначити ступінь зміни слідчого фактора при зміні причинного фактора на одну одиницю. Абсолютні величини характеризують залежність між змінними факторами за їх абсолютними значеннями. Коефіцієнт регресії обчислюють за такою формулою:

Планування та аналіз експериментів. Планування та аналіз експериментів - це третя важлива галузь статистичних методів, розроблених для знаходження та перевірки причинних зв'язківміж змінними.

Для дослідження багатофакторних залежностей Останнім часомдедалі частіше використовують методи математичного планування експерименту.

Можливість одночасного варіювання всіма факторами дозволяє: а) зменшити кількість дослідів;

б) звести помилку експерименту до мінімуму;

в) спростити обробку даних;

г) забезпечити наочність та легкість у порівнянні результатів.

Кожен фактор може набувати певної відповідної кількості різних значень, які називаються рівнями та позначають -1, 0 та 1. Фіксований набір рівнів факторів визначає умови одного з можливих дослідів.

Сукупність всіх можливих поєднань обчислюють за такою формулою:

Повним факторним експериментом називається експеримент, в якому реалізуються всі можливі поєднаннярівнів факторів. Повні факторні експерименти можуть мати властивість ортогональності. При ортогональному плануванні фактори в експерименті є некорельованими, коефіцієнти регресії, що вираховуються в результаті, визначають незалежно один від одного.

Важливою перевагою методу математичного планування експерименту є його універсальність, придатність у багатьох сферах досліджень.

Розглянемо приклад порівняння впливу деяких чинників формування рівня психічного напруги в регулювальників кольорових телевізорів.

В основу експерименту покладено ортогональний План 2 три (три фактори змінюються на двох рівнях).

Експеримент проводили з повною частиною 2+3 з трикратним повторенням.

Ортогональне планування виходить з побудові рівняння регресії. Для трьох факторів воно виглядає так:

Обробка результатів у цьому прикладі включає:

а) побудова ортогонального плану 2+3 таблиці для розрахунку;

б) обчислення коефіцієнтів регресії;

в) перевірку їхньої значущості;

г) інтерпретацію одержаних даних.

Для коефіцієнтів регресії згаданого рівняння треба було поставити N = 2 3 = 8 варіантів, щоб мати можливість оцінити значущість коефіцієнтів, де кількість повторень До дорівнювала 3.

Складена матриця планування експерименту виглядала.

У випадках, якщо вимірювання досліджуваних ознак проводяться в шкалі порядку, або форма взаємозв'язку відрізняється від лінійної, дослідження взаємозв'язку між двома випадковими величинами здійснюється за допомогою рангових коефіцієнтівкореляції. Розглянемо коефіцієнт рангової кореляції Спірмена. За його обчисленні необхідно ранжувати (упорядкувати) варіанти вибірки. Ранжуванням називається угруповання експериментальних даних у певному порядку, або за зростанням, або за зменшенням.

Проведення операції ранжирування здійснюється за таким алгоритмом:

1. Найменшому значенню нараховується менший ранг. Найбільшому значенню нараховується ранг, відповідний кількості значень, що ранжуються. Найменшому значенню нараховується ранг 1. Наприклад, якщо n=7, то найбільше значенняотримає ранг під номером 7, крім випадків, передбачених другим правилом.

2. Якщо кілька значень рівні, то їм нараховується ранг, що є середнім значенням з тих рангів, які вони отримали б, якби не були рівні. Як приклад розглянемо впорядковану за зростанням вибірку, що складається з 7 елементів: 22, 23, 25, 25, 25, 28, 30. Значення 22 і 23 зустрічаються по одному разу, тому їх ранги відповідно дорівнюють R22=1, а R23=2 . Значення 25 трапляється 3 рази. Якби ці значення не повторювалися, їх ранги були б рівними 3, 4, 5. Тому їх ранг R25 дорівнює середньому арифметичному 3, 4 і 5: . Значення 28 та 30 не повторюються, тому їх ранги відповідно дорівнюють R28=6, а R30=7. Остаточно маємо таку відповідність:

3. Загальна сума рангів повинна співпадати з розрахунковою, яка визначається за такою формулою:

де n - Загальна кількістьранжованих значень.

Розбіжність реальної та розрахункової сум рангів свідчить про помилку, допущену при нарахуванні рангів або їх підсумовування. У цьому випадку необхідно знайти та виправити помилку.

Коефіцієнт рангової кореляції Спірмена є методом, що дозволяє визначити силу та спрямованість взаємозв'язку між двома ознаками або двома ієрархіями ознак. Застосування коефіцієнта рангової кореляції має низку обмежень:

  • а) Передбачувана кореляційна залежність повинна мати монотонний характер.
  • б) Обсяг кожної з вибірок має бути більшим або дорівнює 5. Для визначення верхньої межі вибірки користуються таблицями критичних значень (Таблиця 3 Додатка). Максимальне значення n таблиці - 40.
  • в) Під час проведення аналізу можлива можливість появи великої кількості однакових рангов. У цьому випадку необхідно вносити поправку. Найбільш сприятливим є випадок коли обидві досліджувані вибірки являють собою дві послідовності несупадних значень.

Для проведення кореляційного аналізу дослідник повинен мати дві вибірки, які можуть бути ранжовані, наприклад:

  • - Дві ознаки, виміряні в одній і тій же групі піддослідних;
  • - дві індивідуальні ієрархії ознак, виявлені у двох піддослідних по одному й тому набору ознак;
  • - Дві групові ієрархії ознак;
  • - індивідуальна та групова ієрархії ознак.

Розрахунок починаємо з ранжування показників, що вивчаються окремо за кожною з ознак.

Проведемо аналіз випадку з двома ознаками, виміряними в одній і тій же групі випробуваних. Спочатку ранжують індивідуальні значення за першою ознакою, отримані різними випробуваними, а потім індивідуальні значення за другою ознакою. Якщо меншим рангам одного показника відповідають менші ранги іншого показника, а більшим рангам одного показника відповідають більші ранги іншого показника, дві ознаки пов'язані позитивно. Якщо ж більшим рангам одного показника відповідають менші ранги іншого показника, дві ознаки пов'язані негативно. Для знаходження rs визначаємо різниці між рангами (d) по кожному випробуваному. Що менше різниці між рангами, то ближче коефіцієнт рангової кореляції rs буде до «+1». Якщо взаємозв'язок відсутня, то між ними не буде жодної відповідності, отже, rs виявиться близьким до нуля. Чим більше різниці між рангами випробуваних за двома змінними, тим ближче до «-1» буде значення коефіцієнта rs. Таким чином, коефіцієнт рангової кореляції Спірмена є мірою будь-якої монотонної залежності між двома ознаками, що досліджуються.

Розглянемо випадок з двома індивідуальними ієрархіями ознак, виявленими у двох піддослідних по одному й тому набору ознак. У цій ситуації ранжують індивідуальні значення, отримані кожним із двох випробуваних за певною сукупністю ознак. Ознаку з найнижчим значенням необхідно надати перший ранг; ознакою з вищим значенням - другий ранг тощо. Слід звернути особливу увагуна те, щоб усі ознаки були виміряні в одних і тих самих одиницях. Наприклад, неможливо ранжувати показники, якщо вони виражені в різних за «ціною» балах, оскільки неможливо визначити, який із факторів займатиме перше місце за виразністю, доки всі значення не будуть приведені до єдиної шкали. Якщо ознаки, мають низькі ранги в однієї з піддослідних як і мають низькі ранги в іншого, і навпаки, то індивідуальні ієрархії пов'язані позитивно.

У випадку з двома груповими ієрархіями ознак ранжують середньо-групові значення, отримані в двох групах випробуваних за однаковим для досліджуваних груп, набору ознак. Далі слід дотримуватись алгоритму, наведеного у попередніх випадках.

Проведемо аналіз випадку з індивідуальною та груповою ієрархією ознак. Починають з того, що ранжують окремо індивідуальні значення випробуваного та середньо-групові значення за тим же набором ознак, які отримані, за винятком того випробуваного, який не бере участі в середньо-груповій ієрархії, оскільки з нею буде зіставлятися його індивідуальна ієрархія. Рангова кореляція дозволяє оцінити ступінь узгодженості індивідуальної та групової ієрархії ознак.

Розглянемо, як визначається значимість коефіцієнта кореляції у випадках. У разі двох ознак вона визначатиметься обсягом вибірки. Що стосується двома індивідуальними ієрархіями ознак значимість залежить кількості ознак, які входять у ієрархію. У двох останніх випадках значимість обумовлюється числом ознак, що вивчаються, а не чисельністю груп. Таким чином, значимість rs у всіх випадках визначається числом ранжованих значень n.

При перевірці статистичної значущості rs користуються таблицями критичних значень коефіцієнта рангової кореляції, складених різних кількостей ранжируемых значень і різних рівнів значимості. Якщо абсолютна величина rs досягає критичного значення або перевищує його, то кореляція достовірна.

При розгляді першого варіанта (випадок із двома ознаками, виміряними в одній і тій же групі піддослідних) можливі наступні гіпотези.

Н0: Кореляція між змінними x та y не відрізняється від нуля.

Н1: Кореляція між змінними x та y достовірно відрізняється від нуля.

Якщо ми працюємо з будь-яким із трьох випадків, то необхідно висунути іншу пару гіпотез:

Н0: Кореляція між ієрархіями x та y не відрізняється від нуля.

Н1: Кореляція між ієрархіями x та y достовірно відрізняється від нуля.

Послідовність дій під час обчислення коефіцієнта рангової кореляції Спірмена rs така.

  • - Визначити, які дві ознаки або дві ієрархії ознак братимуть участь у зіставленні як змінні x та y.
  • - Ранжувати значення змінної x, нараховуючи ранг 1 найменшого значення, відповідно до правил ранжування. Помістити ранги у першу колонку таблиці по порядку номерів випробуваних чи ознак.
  • - Ранжувати значення змінної y. Помістити ранги у другу колонку таблиці за порядком номерів випробуваних чи ознак.
  • - Обчислити різниці d між рангами x та y по кожному рядку таблиці. Результати помістити до наступної колонки таблиці.
  • - Обчислити квадрати різниць (d2). Отримані значення помістити до четвертої колонки таблиці.
  • – Обчислити суму квадратів різниць? d2.
  • - при виникненні однакових рангів обчислити поправки:

де tx – обсяг кожної групи однакових рангів у вибірці x;

ty - обсяг кожної групи однакових рангів у вибірці y.

Обчислити коефіцієнт рангової кореляції залежно від наявності чи відсутності однакових рангів. За відсутності однакових рангів коефіцієнт рангової кореляції rs розрахувати за такою формулою:

За наявності однакових рангів коефіцієнт рангової кореляції rs розрахувати за такою формулою:

де? d2 – сума квадратів різниць між рангами;

Tx і Ty – поправки на однакові ранги;

n - кількість випробуваних чи ознак, що брали участь у ранжируванні.

Визначити за таблицею 3 Додатки критичні значення rs для даної кількостівипробуваних n. Достовірна відмінність від нуля коефіцієнта кореляції спостерігатиметься за умови, якщо rs не менше критичного значення.

- це кількісна оцінка статистичного вивченнязв'язок між явищами, що використовується в непараметричних методах.

Показник показує, як відрізняється отримана під час спостереження сума квадратів різниць між рангами від відсутності зв'язку.

Призначення сервісу. За допомогою цього онлайн-калькулятора проводиться:

  • розрахунок коефіцієнта рангової кореляції Спірмена;
  • обчислення довірчого інтервалудля коефіцієнта та оцінка його значущості;

Коефіцієнт рангової кореляції Спірменавідноситься до показників оцінки тісноти зв'язку. Якісну характеристикутісноти зв'язку коефіцієнта рангової кореляції, як та інших коефіцієнтів кореляції, можна оцінити за шкалою Чеддока.

Розрахунок коефіцієнтаскладається з наступних етапів:

Властивості коефіцієнта рангової кореляції Спірмена

Галузь застосування. Коефіцієнт кореляції рангіввикористовується з метою оцінки якості зв'язку між двома сукупностями. Крім цього, його статистична значимістьзастосовується при аналізі даних на гетероскедастичність.

Приклад. За вибіркою даних змінних X і Y, що спостерігаються:

  1. скласти рангову таблицю;
  2. знайти коефіцієнт рангової кореляції Спірмена та перевірити його значущість на рівні 2a
  3. оцінити характер залежності
Рішення. Надамо ранги ознакою Y і фактору X .
XYранг X, d xранг Y, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Матриця рангів.
ранг X, d xранг Y, d y(d x - d y) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Перевірка правильності складання матриці на основі обчислення контрольної суми:

Сума по стовпчиках матриці рівні між собою та контрольної суми, отже, матриця складена правильно.
За формулою обчислимо коефіцієнт рангової кореляції Спірмена.


Зв'язок між ознакою Y та фактором X сильний і прямий
Значення коефіцієнта рангової кореляції Спірмена
Для того щоб при рівні значимості α перевірити нульову гіпотезу про рівність нулю генерального коефіцієнта рангової кореляції Спірмена при гіпотезі конкуруючої H i . p ≠ 0, треба обчислити критичну точку:

де n – обсяг вибірки; ρ - вибірковий коефіцієнтрангової кореляції Спірмена: t(α, к) – критична точка двосторонньої критичної області, яку знаходять за таблицею критичних точокрозподілу Стьюдента, за рівнем значущості α та числом ступенів свободи k = n-2.
Якщо |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp – нульову гіпотезу відкидають. Між якісними ознаками існує значний ранговий кореляційний зв'язок.
За таблицею Стьюдента знаходимо t(α/2, k) = (0.1/2; 12) = 1.782

Оскільки T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.

Калькулятор нижче обчислює коефіцієнт рангової кореляції Спірмена між двома випадковими величинами. Теоретична частина, щоб не відволікатися від калькулятора, зазвичай розміщується під ним.

add import_export mode_edit delete

Зміни випадкових величин

arrow_upwardarrow_downward Xarrow_upwardarrow_downward Y
Розмір сторінки: 5 10 20 50 100 chevron_left chevron_right

Зміни випадкових величин

Імпортувати даніПомилка імпорту

Для поділу полів можна використовувати один із цих символів: Tab, ";" або "," Приклад: -50.5;-50.5

Імпортувати Назад Скасувати

Метод розрахунку коефіцієнта рангової кореляції Спірмена насправді описується дуже легко. Це той самий Коефіцієнт кореляції Пірсона, тільки розрахований не для результатів вимірювань випадкових величин, а для них рангових значень.

Тобто,

Залишилося тільки розібратися, що таке рангові значення і для чого це потрібно.

Якщо елементи варіаційного ряду розташувати у порядку зростання чи спадання, то рангомелемент буде його номер у цьому впорядкованому ряду.

Наприклад, нехай ми маємо варіаційний ряд (17,26,5,14,21). Відсортуємо його елементи у порядку зменшення (26,21,17,14,5). 26 має ранг 1, 21 – ранг 2 і т.д. Варіаційний ряд рангових значень виглядатиме так (3,1,5,4,2).

Тобто при розрахунку коефіцієнта Спірмена вихідні варіаційні рядиперетворюються на варіаційні ряди рангових значень, після чого до них застосовується формула Пірсона.

Є одна тонкість - ранг значень, що повторюються, береться як середнє з рангів. Тобто для ряду (17, 15, 14, 15) ряд рангових значень буде виглядати як (1, 2.5, 4, 2.5), так як перший елемент 15 має ранг 2, а другий - ранг 3, і .

Якщо ж повторюваних значень немає, тобто всі значення рангових рядів – числа з діапазону від 1 до n, формулу Пірсона можна спростити до

Ну і до речі, ця формула найчастіше наводиться як формула розрахунку коефіцієнта Спірмена.

У чому ж суть переходу від самих значень до рангових значень?
А суть у тому, що досліджуючи кореляцію рангових значень можна встановити наскільки добре залежність двох змінних описується монотонною функцією.

Знак коефіцієнта свідчить про напрям зв'язок між змінними. Якщо знак позитивний, значення Y мають тенденцію збільшуватися зі збільшенням значень X; якщо знак негативний, то значення Y мають тенденцію зменшуватися зі збільшенням значень X. Якщо коефіцієнт дорівнює 0, ніякої тенденції немає. Якщо коефіцієнт дорівнює 1 або -1, то залежність між X і Y має вигляд монотонної функції - тобто, при збільшенні X, Y також збільшується, або навпаки, при збільшенні X, Y зменшується.

Тобто, на відміну від коефіцієнта кореляції Пірсона, який може виявити лише лінійну залежністьоднією змінною від іншої, коефіцієнт кореляції Спірмена може виявити монотонну залежність, там, де безпосередній лінійний зв'язок не виявляється.

Поясню з прикладу. Припустимо, що досліджуємо функцію y=10/x.
У нас є наступні результати вимірювань X та Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Для цих даних коефіцієнт кореляції Пірсона дорівнює -0.4686, тобто зв'язок слабкий або відсутній. А ось коефіцієнт кореляції Спірмена строго дорівнює -1, що натякає досліднику, що Y має строгу негативну монотонну залежність від X.



Схожі статті

2024 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.