Коефіцієнт рангової кореляції спірмена. Приклад знаходження коефіцієнта рангової кореляції спірмена

Коефіцієнт кореляції Пірсона

Коефіцієнт r-Пірсона застосовується вивчення взаємозв'язку двох метричних змінних, виміряних однією і тієї ж вибірці. Існує безліч ситуацій, у яких доречне його застосування. Чи впливає інтелект на успішність старших курсів університету? Чи пов'язаний розмір заробітної плати працівника із його доброзичливістю до колег? Чи впливає настрій школяра на успішність розв'язання складного арифметичного завдання? Для відповіді на такі питання дослідник повинен виміряти два показники, що його цікавлять, у кожного члена вибірки.

На величину коефіцієнта кореляції впливає те, у яких одиницях виміру представлені ознаки. Отже, будь-які лінійні перетворення ознак (множення на константу, додавання константи) не змінюють значення коефіцієнта кореляції. Винятком є ​​множення однієї з ознак негативну константу: коефіцієнт кореляції змінює свій знак на протилежний.

Застосування кореляції Спірмена та Пірсона.

Кореляція Пірсона є мірою лінійного зв'язку між двома змінними. Вона дозволяє визначити, наскільки пропорційна мінливість двох змінних. Якщо змінні пропорційні один одному, то графічно зв'язок між ними можна подати у вигляді прямої лінії з позитивним (пряма пропорція) або негативним (зворотна пропорція) нахилом.

На практиці зв'язок між двома змінними, якщо він є, є імовірнісним і графічно виглядає як хмара розсіювання еліпсоїдної форми. Цей еліпсоїд, однак, можна уявити (апроксимувати) у вигляді прямої лінії, або лінії регресії. Лінія регресії – це пряма, побудована методом найменших квадратів: сума квадратів відстаней (обчислених по осі Y) від кожної точки графіка розсіювання до прямої є мінімальною.

Особливе значеннядля оцінки точності передбачення має дисперсія оцінок залежної змінної. По суті, дисперсія оцінок залежної змінної Y - це та частина її повної дисперсії, яка обумовлена ​​впливом незалежної змінної X. Інакше кажучи, відношення дисперсії оцінок залежної змінної до її істинної дисперсії дорівнює квадрату коефіцієнта кореляції.

Квадрат коефіцієнта кореляції залежної та незалежної змінних представляє частку дисперсії залежної змінної, обумовленої впливом незалежної змінної, і називається коефіцієнтом детермінації. Коефіцієнт детермінації, таким чином, показує, якою мірою мінливість однієї змінної обумовлена ​​(детермінована) впливом іншої змінної.

Коефіцієнт детермінації має важливою перевагоюпроти коефіцієнтом кореляції. Кореляція не є лінійною функцією зв'язку між двома змінними. Тому, середнє арифметичне коефіцієнтів кореляції для кількох вибірок не збігається з кореляцією, обчисленою відразу всім випробовуваних із цих вибірок (тобто. коефіцієнт кореляції не аддитивний). Навпаки, коефіцієнт детермінації відбиває зв'язок лінійно і тому аддитивним: допускається його усереднення кількох вибірок.

Додаткову інформаціюпро силу зв'язку дає значення коефіцієнта кореляції у квадраті – коефіцієнт детермінації: це частина дисперсії однієї змінної, яка може бути пояснена впливом іншої змінної. На відміну від коефіцієнта кореляції, коефіцієнт детермінації лінійно зростає зі збільшенням сили зв'язку.

Коефіцієнти кореляції Спірмена та τ - Кендалла (рангові кореляції )

Якщо обидві змінні, між якими вивчається зв'язок, представлені у порядковій шкалі, або одна з них – у порядковій, а інша – у метричній, то застосовуються рангові коефіцієнти кореляції: Спірмена або τ - Кенделл. І той, і інший коефіцієнт вимагає для застосування попереднього ранжування обох змінних.

Коефіцієнт рангової кореляції Спірмена – це непараметричний метод, який використовується з метою статистичного вивченнязв'язок між явищами. У цьому випадку визначається фактичний ступінь паралелізму між двома кількісними рядамиознак, що вивчаються, і дається оцінка тісноти встановленого зв'язку за допомогою кількісно вираженого коефіцієнта.

Якщо члени групи чисельністю були ранжировані спочатку змінною x, потім - змінною y, то кореляцію між змінними x і y можна отримати, просто обчисливши коефіцієнт Пірсона для двох рядів рангів. За умови відсутності зв'язків у рангах (тобто відсутності повторюваних рангів) за тією та іншою змінною, формула для Пірсона може бути суттєво спрощена у обчислювальному відношенні та перетворена на формулу, відому як Спірмена.

Потужність коефіцієнта рангової кореляції Спірмена дещо поступається потужністю параметричного коефіцієнта кореляції.

Коефіцієнт рангової кореляції доцільно застосовувати за наявності невеликої кількості спостережень. Даний метод може бути використаний не тільки для кількісно виражених даних, але також і у випадках, коли значення, що реєструються, визначаються описовими ознаками різної інтенсивності.

Коефіцієнт рангової кореляції Спірмена при велику кількістьоднакових рангів по одній або обох змінних, що зіставляються, дає огрублені значення. В ідеалі обидва корелювані ряди повинні являти собою дві послідовності значень, що не збігаються.

Альтернативу кореляції Спірмена для рангів є кореляція τ - Кендалл. В основі кореляції, запропонованої М.Кендаллом, лежить ідея про те, що про напрям зв'язку можна судити, попарно порівнюючи між собою випробуваних: якщо у пари випробуваних зміна x збігається у напрямку зі зміною y, то це свідчить про позитивний зв'язок, якщо не збігається - то про негативний зв'язок.

Коефіцієнти кореляції були спеціально розроблені для чисельного визначення сили та напрями зв'язку між двома властивостями, виміряними у числових шкалах (метричних чи рангових). Як уже згадувалося, максимальній силі зв'язку відповідають значення кореляції +1 (суворий прямий або прямо пропорційний зв'язок) і -1 (суворий зворотний або обернено пропорційний зв'язок), відсутності зв'язку відповідає кореляція, що дорівнює нулю. Додаткову інформацію про силу зв'язку дає значення коефіцієнта детермінації: це частина дисперсії однієї змінної, яка може бути пояснена впливом іншої змінної.

9. Параметричні методи порівняння даних

Параметричні методи порівняння застосовуються у тому випадку, якщо ваші змінні були виміряні у метричній шкалі.

Порівняння дисперсій 2- х вибірок за критерієм Фішера .


Даний метод дозволяє перевірити гіпотезу про те, що дисперсії 2-х генеральних сукупностей, з яких вилучені порівнювані вибірки, відрізняються один від одного. Обмеження методу - розподілу ознаки обох вибірках нічого не винні відрізнятися від нормального.

Альтернативою порівняння дисперсій є критерій Лівена, для якого немає потреби у перевірці на нормальність розподілу. Даний метод може застосовуватися для перевірки припущення про рівність (гомогенність) дисперсій перед перевіркою достовірності відмінності середніх за критерієм Стьюдента для незалежних вибірок різної чисельності.

37. Коефіцієнт рангової кореляції Спірмена.

С. 56 (64) 063.JPG

http://psystat.at.ua/publ/1-1-0-33

Коефіцієнт рангової кореляціїСпірмена використовується у випадках, коли:
- змінні мають рангову шкалувимірювання;
- розподіл даних занадто відрізняється від нормальногочи взагалі невідомо;
- вибірки мають невеликий обсяг (N< 30).

Інтерпретація рангового коефіцієнтаКореляція Спірмена не відрізняється від коефіцієнта Пірсона, проте його сенс дещо відмінний. Щоб зрозуміти відмінність цих методів і логічно обґрунтувати сфери їх застосування порівняємо їх формули.

Коефіцієнт кореляції Пірсона:

Коефіцієнт кореляції Спірмена:

Як бачимо, формули значно різняться. Порівняємо формули

У формулі кореляції Пірсона використовується середнє арифметичне та стандартне відхилення корелюваних рядів, а у формулі Спірмена не використовується. Таким чином, для отримання адекватного результату за формулою Пірсона, необхідно, щоб корелювані ряди були наближені до нормального розподілу (середнє та стандартне відхилення є параметрами нормального розподілу ). Для формули Спірмена це актуально.

Елементом формули Пірсона є стандартизація кожного ряду z-шкалу.

Як бачимо, переведення змінних у Z-шкалу є у формулі коефіцієнта кореляції Пірсона. Відповідно, для коефіцієнта Пірсона абсолютно не має значення масштаб даних: наприклад, ми можемо корелювати дві змінні, одна з яких має хв. = 0 та макс. = 1, а друга хв. = 100 та макс. = 1000. Як би розрізнявся розмах діапазону значень, всі вони будуть переведені в стандартні z-значення однакові за своїм масштабом.

У коефіцієнті Спірмена такої нормалізації немає, тому

ОБОВ'ЯЗКОВИМ УМОВОМ ВИКОРИСТАННЯ КОЕФІЦІЄНТА СПІРМЕНА Є РІВНІСТЬ РОЗМАХУ ДВОХ ЗМІННИХ.

Перед використанням коефіцієнта Спірмена для рядів даних з різним розмахом необхідно обов'язково їх ранжувати. Ранжування призводить до того, що значення цих рядів набувають однакового мінімуму = 1 (мінімальний ранг) і максимум, що дорівнює кількості значень (максимальний, останній ранг = N, тобто. максимальної кількостівипадків у вибірці).

У яких випадках можна обійтись без ранжування

Це випадки, коли дані мають вихідно рангову шкалу. Наприклад, тест ціннісних орієнтаційРокича.

Також, це випадки, коли кількість варіантів значень невелика і у вибірці є фіксовані мінімум і максимум. Наприклад, у семантичному диференціалі мінімум = 1, максимум = 7.

Приклад розрахунку рангового коефіцієнта кореляції Спірмена

Тест ціннісних орієнтацій Рокича провели на двох вибірках Xи Y. Завдання: дізнатися, наскільки близькі ієрархії цінностей даних вибірок (буквально – скільки вони схожі).

Отримане значення r=0,747 перевіряється за таблиці критичних значень. Згідно з таблицею, при N=18, отримане значення достовірно на рівні p<=0,005

Рангові коефіцієнти кореляції за Спірманом та Кендалом

Для змінних, що належать до порядкової шкали або для змінних, що не підкоряються нормальному розподілу, а також для змінних, що належать до інтервальної шкали, замість коефіцієнта Пірсона розраховується рангова кореляція за Спірманом. І тому окремим значенням змінних присвоюються рангові місця, які згодом обробляються з допомогою відповідних формул. Щоб виявити рангову кореляцію, заберіть у діалоговому вікні Bivariate Correlations... (Парні кореляції) позначку для розрахунку кореляції за Пірсоном, встановлену за замовчуванням. Натомість активуйте розрахунок кореляції Спірмана. Це розрахунок дасть такі результати. Коефіцієнти рангової кореляції дуже близькі до відповідних значень коефіцієнтів Пірсона (початкові змінні мають нормальний розподіл).

titkova-matmetody.pdf с. 45

Метод рангової кореляції Спірмена дозволяє визначити тісноту (силу) та напрямок

кореляційного зв'язку між двома ознакамиабо двома профілями (ієрархіями)ознак.

Для підрахунку рангової кореляції необхідно мати два ряди значень,

які можуть бути проранжовані. Такими рядами значень можуть бути:

1) дві ознаки,виміряні в одній і тій же групівипробуваних;

2) дві індивідуальні ієрархії ознак,виявлені у двох піддослідних по тому самому

набору ознак;

3) дві групові ієрархії ознак,

4) індивідуальна та груповаієрархії ознак.

Спочатку показники ранжуються окремо за кожною ознакою.

Як правило, меншим значенням ознаки нараховується менший ранг.

У першому випадку (дві ознаки) ранжуються індивідуальні значення за першим

ознакою, отриманими різними випробуваними, а потім індивідуальними значеннями по другому

ознакою.

Якщо дві ознаки пов'язані позитивно, то випробувані, що мають низькі ранги по

одному з них, будуть мати низькі ранги і по іншому, а випробувані, що мають високі ранги за

одній з ознак, матимуть за іншою ознакою також високі ранги. Для підрахунку rs

необхідно визначити різниці (d)між рангами, отриманими даним випробуваним по обом

ознак. Потім ці показники d певним чином перетворюються і віднімаються з 1.

менше різниці між рангами, тим більше буде rs, тим ближче він буде до +1.

Якщо кореляція відсутня, всі ранги будуть перемішані і між ними не буде

жодної відповідності. Формула складена так, що в цьому випадку rs виявиться близьким до 0.

У разі негативної кореляціїнизьким рангам випробуваних за однією ознакою

будуть відповідати високі ранги за іншою ознакою, і навпаки. Чим більший розбіжність

між рангами випробуваних за двома змінними, тим ближче rs до -1.

У другому випадку (два індивідуальні профілі), ранжуються індивідуальні

значення, отримані кожним з 2-х випробуваних за певним (однаковим для них

обох) набору ознак. Перший ранг отримає ознаку з найнижчим значенням; другий ранг -

ознака з вищим значенням тощо. Очевидно, що всі ознаки повинні бути виміряні в

одних і тих самих одиницях, інакше ранжування неможливе. Наприклад, неможливо

проранжувати показники по опитувальнику Кеттелла (16PF), якщо вони виражені в

"сирих" балах, оскільки з різних факторів діапазони значень різні: від 0 до 13, від 0 до

20 і від 0 до 26. Ми не можемо сказати, який з факторів займатиме перше місце по

виразності, поки не наведемо всі значення до єдиної шкали (найчастіше це шкала стін).

Якщо індивідуальні ієрархії двох піддослідних пов'язані позитивно, ознаки,

мають низькі ранги в одного з них, матимуть низькі ранги і в іншого, і навпаки.

Наприклад, якщо в одного випробуваного фактор Е (домінантність) має найнижчий ранг, то й у

іншого випробуваного він повинен мати низький ранг, якщо в одного випробуваного фактор С

(емоційна стійкість) має вищий ранг, те й інший випробуваний повинен мати по

цьому чиннику високий ранг тощо.

У третьому випадку (два групових профілю), ранжуються середньогрупові значення,

отримані в 2-х групах випробуваних за певним, однаковим для двох груп, набором

ознак. Надалі лінія міркувань така сама, як і в попередніх двох випадках.

У випадку 4-му (індивідуальний та груповий профілі), ранжуються окремо

індивідуальні значення випробуваного та середньогрупові значення за тим же набором

ознак, які отримані, як правило, при виключенні цього окремого випробуваного – він

не бере участі в середньогруповому профілі, з яким зіставлятиметься його індивідуальний

профіль. Рангова кореляція дозволить перевірити, наскільки узгоджені індивідуальні та

груповий профілі.

У всіх чотирьох випадках значимість отриманого коефіцієнта кореляції визначається

за кількістю ранжованих значень N.У першому випадку ця кількість співпадатиме з

обсягом вибірки n. У другому випадку кількістю спостережень буде кількість ознак,

складових ієрархію. У третьому та четвертому випадку N – це також кількість зіставних

ознак, а чи не кількість випробуваних у групах. Детальні пояснення наведено в прикладах. Якщо

абсолютна величина rs досягає критичного значення або перевищує його, кореляція

достовірна.

Гіпотези.

Можливі два варіанти гіпотез. Перший відноситься до випадку 1, другий - до трьох інших

Перший варіант гіпотез

H0: Кореляція між змінними А та Б не відрізняється від нуля.

H2: Кореляція між змінними А та Б достовірно відрізняється від нуля.

Другий варіант гіпотез

H0: Кореляція між ієрархіями А та Б не відрізняється від нуля.

H2: Кореляція між ієрархіями А та Б достовірно відрізняється від нуля.

Обмеження коефіцієнта рангової кореляції

1. По кожній змінній має бути представлено не менше 5 спостережень. Верхня

межа вибірки визначається наявними таблицями критичних значень .

2. Коефіцієнт рангової кореляції Спірмена rs за великої кількості однакових

рангів по одній або обох змінним, що зіставляється, дає огрублені значення. В ідеалі

обидва корелювані ряди повинні являти собою дві послідовності несхожих

значень. У разі, якщо цієї умови не дотримується, необхідно вносити поправку на

однакові ранги.

Коефіцієнт рангової кореляції Спірмена підраховується за такою формулою:

Якщо в обох зіставних рангових рядах присутні групи однакових рангів,

перед підрахунком коефіцієнта рангової кореляції необхідно внести поправки на однакові

ранги Та і Тв:

Та = Σ (а3 - а) / 12,

Тв = Σ (в3 - в) / 12,

де а –обсяг кожної групи однакових рангів у ранговому ряду А, обсяг кожної

групи однакових рангів у ранговому ряду Ст.

Для підрахунку емпіричного значення rs використовують формулу:

38. Точково-бісеріальний коефіцієнт кореляції.

Про кореляцію взагалі див. питання № 36с. 56 (64) 063.JPG

harchenko-korranaliz.pdf

Нехай змінна X виміряна у сильній шкалі, а змінна Y – у дихотомічній. Точковий бісеріальний коефіцієнт кореляції rpb обчислюється за такою формулою:

Тут x 1 - Середнє значення по Х об'єктів зі значенням «одиниця» по Y;

x 0 – середнє значення Х об'єктів зі значенням «нуль» по Y;

s х - Середнє квадратичне відхилення всіх значень по Х;

n 1 – число об'єктів «одиниця» за Y, n 0 – число об'єктів «нуль» за Y;

n = n 1 + n 0 – обсяг вибірки.

Точковий бісеріальний коефіцієнт кореляції можна розрахувати також за допомогою інших еквівалентних виразів:

Тут x– загальне середнє значення змінної Х.

Точковий бісеріальний коефіцієнт кореляції rpbзмінюється не більше –1 до +1. Його значення дорівнює нулю в тому випадку, якщо змінні з одиницею по Yмають середнє по Y, що дорівнює середньому змінних з нулем по Y.

Перевірка гіпотези про значимістьточкового бісеріального коефіцієнта кореляції полягає у перевірці нульової гіпотезиh 0 про рівність генерального коефіцієнта кореляції нулю: ρ = 0, що здійснюється за допомогою критерію Стьюдента. Емпіричне значення

порівнюється з критичними значеннями t a (df) для числа ступенів свободи df = n– 2

Якщо виконується умова | t| ≤ (df), нульова гіпотеза ρ = 0 не відкидається. Точковий бісеріальний коефіцієнт кореляції істотно відрізняється від нуля, якщо емпіричне значення | t| потрапляє у критичну область, тобто якщо виконується умова | t| > (n- 2). Достовірність зв'язку, розрахованого за допомогою точкового бісеріального коефіцієнта кореляції rpb, можна визначити також за допомогою критерію χ 2 для числа ступенів свободи df= 2.

Точково-бісеріальна кореляція

Наступна модифікація коефіцієнта кореляції твору моментів отримала відображення у точково бісеріальному r. Ця стаття. показує зв'язок між двома змінними, одна з яких брало імовірно безперервна і нормально розподілена, а ін. яв-ся дискретної в точному сенсі слова. Точково-бісеріальний коефіцієнт кореляції позначається через r pbisОскільки в r pbisдихотомія відбиває справжню природу дискретної змінної, а чи не яв-ся штучної, як у разі r bisйого знак визначається довільно. Тому всім практ. цілей r pbisрозглядається у діапазоні від 0,00 до +1,00.

Існує і такий випадок, коли дві змінні вважаються безперервними та нормально розподіленими, але обидві штучно дихотомізовані, як у разі бісеріальної кореляції. Для оцінки зв'язку між такими змінними застосовується тетрахоричний коефіцієнт кореляції r tet, який був також виведений Пірсоном. основ. (точні) формули та процедури для обчислення r tetдосить складні. Тому за практ. застосування цього методу використовуються наближення r tet, одержувані з урахуванням скорочених процедур і таблиць.

/on-line/dictionary/dictionary.php?term=511

ТОЧКОВО-БІСЕРІАЛЬНИЙ КОЕФІЦІЄНТ КОРРЕЛЯЦІЇ- це коефіцієнт кореляції між двома змінними, одна з яких виміряна у дихотомічній шкалі, а інша – в інтервальній шкалі. Застосовується в класичній та сучасній тестології як показник якості тестового завдання – надійності-узгодженості із загальним балом за тестом.

Для корелювання змінних, виміряних у дихотомічної та інтервальної шкаливикористовують точково-бісеріальний коефіцієнт кореляції.
Точково-бісеріальний коефіцієнт кореляції - це метод кореляційного аналізу відношення змінних, одна з яких виміряна в шкалі найменувань і приймає лише 2 значення (наприклад, чоловіка/жінки, відповідь вірна/відповідь невірна, ознака є/ознака немає), а друга у шкалі відносин або інтервальної шкали. Формула розрахунку коефіцієнта точково-бісеріальної кореляції:

Де:
m1 і m0 - середні значення Х зі значенням 1 або 0 Y.
σx – стандартне відхилення всіх значень по Х
n1, n0 – кількість значень Х з 1 або 0 Y.
n – Загальна кількістьпар значень

Найчастіше даний видкоефіцієнта кореляції застосовується до розрахунку зв'язку пунктів тесту з сумарною шкалою. Це один із видів перевірки валідності.

39. Рангово-бісеріальний коефіцієнт кореляції.

Про кореляцію взагалі див. питання № 36с. 56 (64) 063.JPG

harchenko-korranaliz.pdf с. 28

Рангово-бісеріальний коефіцієнт кореляції, що використовується у випадках, коли одна із змінних ( Х) представлена ​​в порядковій шкалі, а інша ( Y) – у дихотомічній, обчислюється за формулою

.

Тут – середній ранг об'єктів, що мають одиницю по Y; - Середній ранг об'єктів з нулем по Y, n- Обсяг вибірки.

Перевірка гіпотези про значимістьрангово-бісеріального коефіцієнта кореляції здійснюється аналогічно точковому бісеріальному коефіцієнту кореляції за допомогою критерію Стьюдента із заміною у формулах rpbна rrb.

У тих випадках, коли одна змінна вимірюється у дихотомічній шкалі (змінна X),а інша в ранговій шкалі (змінна У), використовується рангово-бісеріальний коефіцієнт кореляції. Ми пам'ятаємо, що змінна X,виміряна в дихотомічній шкалі, приймає лише два значення (коду) 0 і 1. Особливо підкреслимо: незважаючи на те, що цей коефіцієнт змінюється в діапазоні від -1 до +1, його знак для інтерпретації результатів не має значення. Це ще один виняток із загального правила.

Розрахунок цього коефіцієнта провадиться за формулою:

де ` X 1середній ранг за тими елементами змінної Y, яким відповідає код (ознака) 1 у змінній Х;

`X 0– середній ранг за тими елементами змінної Y,яким відповідає код (ознака) 0 у змінній Х\

N –загальна кількість елементів у змінній X.

Для застосування рангово-бісеріального коефіцієнта кореляції необхідно дотримуватись наступних умов:

1. Змінні змінні повинні бути виміряні в різних шкалах: одна X –у дихотомічній шкалі; інша Y-у ранговій шкалі.

2. Число варіюючих ознак у порівнюваних змінних Xі Yмає бути однаковим.

3. Для оцінки рівня достовірності рангово-бісеріального коефіцієнта кореляції слід користуватися формулою (11.9) та таблицею критичних значень для критерію Стьюдентапрі k = n - 2.

http://psystat.at.ua/publ/drugie_vidy_koehfficienta_korreljacii/1-1-0-38

Випадки, коли одна із змінних представлена ​​в дихотомічній шкалі, а інша в ранговий (порядковий), Вимагають застосування коефіцієнта рангово-бісеріальної кореляції:

rpb = 2 / n * (m1 - m0)

де:
n – кількість об'єктів виміру
m1 та m0 - середній ранг об'єктів з 1 або 0 по другій змінній.
Цей коефіцієнт також застосовується під час перевірки валідності тестів.

40. Коефіцієнт лінійної кореляції.

Про кореляцію взагалі (і зокрема про лінійну саме) див. питання № 36с. 56 (64) 063.JPG

КОЕФІЦІЄНТ КОРРЕЛЯЦІЇ г-ПІРСОНА

r-Пірсона (Pearson r) застосовується для вивчення взаємозв'язку двох метрич-ких змінних, виміряних на одній і тій же вибірці.Існує безліч ситуацій, у яких доречне його застосування. Чи впливає інтелект на успішність на старших курсах університету? Чи пов'язаний розмір заробітної плати працівника з його доброзичливістю до колег? Чи впливає настрій школяра на успішність розв'язання складного арифметичного завдання? Для відповіді на подібні питання дослідник повинен виміряти два цікаві для його показника у кожного члена вибірки. Дані вивчення взаємозв'язку потім зводяться в таблицю, як у наведеному нижче прикладі.

ПРИКЛАД 6.1

У таблиці наведено приклад вихідних даних вимірювання двох показників інтелекту (вербального та невербального) у 20 учнів 8-го класу.

Зв'язок між цими змінними можна зобразити за допомогою діаграми розсіювання (див. рис. 6.3). Діаграма показує, що існує деякий взаємозв'язок виміряних показників: чим більше значення вербального інтелекту, тим (переважно) більше значення невербального інтелекту.

Перш ніж дати формулу коефіцієнта кореляції, спробуємо простежити логіку її виникнення, використовуючи дані прикладу 6.1. Положення кожної /-точки (випробуваного з номером /) на діаграмі розсіювання щодо інших точок (рис. 6.3) може бути задано величинами і знаками відхилень відповідних значень змінних від своїх середніх величин: (xj - MJ і (у, -М у ). Якщо знаки цих відхилень збігаються, це свідчить на користь позитивного взаємозв'язку (великим значенням по хвідповідають великі значення по уабо меншим значенням по хвідповідають менші значення по у).

Для випробуваного № 1 відхилення від середнього по хі по упозитивне, а випробуваного № 3 і те й інше відхилення негативні. Отже, дані того й іншого свідчать про позитивний взаємозв'язок досліджуваних ознак. Навпаки, якщо знаки відхилень від середніх по хі по урізняться, це свідчить про негативної взаємозв'язку між ознаками. Так, для випробуваного № 4 відхилення від середнього по хє негативним, за у -позитивним, а для випробуваного №9 – навпаки.

Таким чином, якщо добуток відхилень (х,- М х ) х (у, - М у ) позитивне, то дані /-випробуваного свідчать про прямий (позитивний) взаємозв'язок, а якщо негативне - то про зворотний (негативний) взаємозв'язок. Відповідно, якщо хwу ъосновному пов'язані прямо пропорційно, більшість творів відхилень буде позитивним, і якщо вони пов'язані зворотним співвідношенням, більшість творів буде негативним. Отже, загальним показникомдля сили та напрями взаємозв'язку може бути сума всіх творів відхилень для даної вибірки:

При прямо пропорційному зв'язку між змінними ця величина є великою і позитивною - для більшості випробуваних відхилення збігаються за знаком (великим значенням однієї змінної відповідають великі значення інший змінної і навпаки). Якщо ж хі умають зворотний зв'язок, то для більшості випробуваних великим значенням однієї змінної будуть відповідати менші значення іншої змінної, тобто знаки творів будуть негативними, а сума творів в цілому буде теж великою абсолютної величиниале негативною за знаком. Якщо систематичного зв'язку між змінними нічого очікувати спостерігатися, то позитивні доданки (твори відхилень) врівноважаться негативними доданками, і сума всіх творів відхилень буде близька до нуля.

Щоб сума творів не залежала від обсягу вибірки, достатньо її усереднити. Але міра взаємозв'язку нас цікавить не як генеральний параметр, бо як його оцінка - статистика. Тому, як і для формули дисперсії, в цьому випадку вчинимо також, ділимо суму творів відхилень не на N, а на TV-1. Виходить міра зв'язку, що широко застосовується у фізиці та технічні науки, яка називається підступністю (Covahance):


У психології, на відміну фізики, більшість змінних вимірюються в довільних шкалах, оскільки психологів цікавить не абсолютне значення ознаки, а взаємне розташуваннявипробуваних у групі. До того ж коваріація дуже чутлива до масштабу шкали (дисперсії), де виміряно ознаки. Щоб зробити міру зв'язку незалежною від одиниць виміру того й іншого ознаки, досить розділити коваріацію на відповідні стандартні відхилення. Таким чином і було отримано фор-мула коефіцієнта кореляції К. Пірсона:

або, після підстановки виразів для х і


Якщо значення тієї та іншої змінної були перетворені на г-значення за формулою


то формула коефіцієнта кореляції r-Пірсона виглядає простіше (071.JPG):

/dict/sociology/article/soc/soc-0525.htm

КОРЕЛЯЦІЯ ЛІНІЙНА- статистичний лінійний зв'язок непричинного характеру між двома кількісними змінними хі у. Вимірюється за допомогою "коефіцієнта К.Л." Пірсона, який є результатом поділу коваріації на стандартні відхилення обох змінних:

,

де s xy- коваріація між змінними хі у;

s x , s y- стандартні відхилення для змінних хі у;

x i , y i- значення змінних хі удля об'єкта з номером i;

x, y- середні арифметичні для змінних хі у.

Коефіцієнт Пірсона rможе набувати значення з інтервалу [-1; +1]. Значення r = 0означає відсутність лінійного зв'язку між змінними хі у(але не виключає статистичного зв'язку нелінійного). Позитивні значеннякоефіцієнта ( r> 0) свідчать про прямий лінійний зв'язок; що ближче його значення до +1, то сильніший зв'язок статистична пряма. Негативні значення коефіцієнта ( r < 0) свидетельствуют об обратной линейной связи; чем ближе его значение к -1, тем сильнее Зворотній зв'язок. Значення r= ±1 означають наявність повного лінійного зв'язку, прямого або зворотного. У разі повного зв'язку всі точки з координатами ( x i , y i) лежать на прямій y = a + bx.

"Коефіцієнт К.Л." Пірсона застосовується також для вимірювання тісноти зв'язку в моделі регресії лінійної парної.

41. Кореляційна матриця та кореляційний граф.

Про кореляцію взагалі див. питання № 36с. 56 (64) 063.JPG

Кореляційна матриця.Часто кореляційний аналізвключає вивчення зв'язків не двох, а безлічі змінних, виміряних в кількісної шкалі на одній вибірці. У цьому випадку обчислюються кореляції для кожної пари з цієї множини змінних. Обчислення зазвичай проводяться на комп'ютері, а результатом є кореляційна матриця.

Кореляційна матриця(Correlation Matrix) - це результат обчислення кореляцій одного типу для кожної пари з множини Рзмінних, виміряних в кількісній шкалі на одній вибірці.

ПРИКЛАД

Припустимо, вивчаються зв'язки між 5 змінними (vl, v2,..., v5; P= 5), виміряними на вибірці чисельністю N=30людина. Нижче наведена таблиця вихідних даних і кореляційна матриця.

І
подібні дані:

Кореляційна матриця:

Неважко помітити, що кореляційна матриця є квадратною, симетричною відносно головної діагоналі (таккакг, у = /) у), з одиницями на головній діагоналі (бо г і = Гу = 1).

Кореляційна матриця є квадратної:число рядків і стовпців дорівнює кількості змінних. Вона симетричнащодо головної діагоналі, оскільки кореляція хз удорівнює кореляції уз х.На її головній діагоналі розташовуються одиниці, оскільки кореляція ознаки із собою дорівнює одиниці. Отже, аналізу підлягають не всі елементи кореляційної матриці, а ті, які знаходяться вище або нижче головної діагоналі.

Кількість коефіцієнтів кореляції,підлягають аналізу щодо зв'язків Рпризнаків визначається формулою: Р(Р- 1)/2. У наведеному прикладі кількість таких коефіцієнтів кореляції 5(5 - 1)/2 = 10.

Основне завдання аналізу кореляційної матриці -виявлення структури взаємозв'язків безлічі ознак. При цьому можливий візуальний аналіз кореляційних плеяд- графічного зображення структури статистичнозначних зв'язків,якщо таких зв'язків дуже багато (до 10-15). Інший спосіб - застосування багатовимірних методів: множинного регресійного, факторного або кластерного аналізу (див. розділ «Багатомірні методи ...»). Застосовуючи факторний або кластерний аналіз, можна виділити угруповання змінних, які тісніше пов'язані один з одним, ніж з іншими змінними. Дуже ефективним є і поєднання цих методів, наприклад, якщо ознак багато і вони не однорідні.

Порівняння кореляцій -додаткове завдання аналізу кореляційної матриці, що має два варіанти. Якщо необхідно порівняння кореляцій в одному з рядків кореляційної матриці (для однієї зі змінних), застосовується метод порівняння для залежних вибірок (с. 148-149). При порівнянні однойменних кореляцій, обчислених для різних вибірок, застосовується метод порівняння для незалежних вибірок (с. 147-148).

Методи порівняннякореляцій у діагоналяхкореляційної матриці (для оцінки стаціонарності випадкового процесу) та порівняння кількохкореляційних матриць, отриманих для різних вибірок (на предмет їх однорідності), є трудомісткими і виходять за рамки цієї книги. Познайомитись з цими методами можна за книгою Г. В. Суходольського 1 .

Проблема статистичної значимостікореляцій.Проблема полягає в тому, що процедура статистичної перевірки гіпотези передбачає одне-кратневипробування, проведене однією вибірці. Якщо той самий метод застосовується багаторазово,нехай навіть щодо різних змінних, то збільшується ймовірність отримати результат чисто випадково. У загальному випадку, якщо ми повторюємо той самий метод перевірки гіпотези разщодо різних змінних або вибірок, то при встановленій величині а ми гарантовано отримаємо підтвердження гіпотези в ахкчисла випадків.

Припустимо, аналізується кореляційна матриця для 15 змінних, тобто обчислено 15(15-1)/2 = 105 коефіцієнтів кореляції. Для перевірки гіпотез встановлено рівень а = 0,05. Перевіряючи гіпотезу 105 разів, ми п'ять разів (!) отримаємо її підтвердження незалежно від того, чи існує зв'язок насправді. Знаючи це і отримавши, скажімо, 15 «статистично достовірних» коефіцієнтів кореляції, чи зможемо ми сказати, які з них отримані випадково, а які - відбивають реальний зв'язок?

Строго кажучи, для ухвалення статистичного рішеннянеобхідно зменшити рівень а в стільки разів, скільки гіпотез перевіряється. Але навряд чи це доцільно, тому що непередбачуваним чином збільшується ймовірність проігнорувати реально існуючий зв'язок (припуститися помилки II роду).

Одна тільки кореляційна матриця не є достатньою основоюдля статистичних висновків щодо входять до неї окремих коефіцієнтів.цієнтів кореляцій!

Можна вказати лише один дійсно переконливий спосіб вирішення цієї проблеми: розділити вибірку випадковим чином на дві частини і приймати до уваги тільки ті кореляції, які статистично значущі в обох частинах вибірки. Альтернативою може бути використання багатовимірних методів (факторного, кластерного або множинного регресійного аналізу) - для виділення і подальшої інтерпретації груп статистично значимо пов'язаних змінних.

Проблема пропущених значень.Якщо даних є пропущені значення, то можливі два варіанти розрахунку кореляційної матриці: а) посрочное видалення значень (Excludecaseslistwise); б) попарне видалення значень (Excludecasespairwise). При порядковому видаленніспостережень з перепустками видаляється весь рядок для об'єкта (випробуваного), який має хоча б одне пропущене значення за однією зі змінних. Цей спосіб призводить до «правильної» кореляційної матриці в тому сенсі, що всі коефіцієнти обчислені по одному і тому ж безлічі об'єктів. Однак якщо пропущені значення розподілені випадковим чином змінних, то даний методможе призвести до того, що в множині даних, що розглядається, не залишиться жодного об'єкта (у кожному рядку зустрінеться, принаймні, одне пропущене значення). Щоб уникнути подібної ситуації, використовують інший спосіб, який називають попарним видаленням.У цьому способі враховуються лише перепустки в кожній вибраній парі стовпців-змінних і ігноруються перепустки в інших змінних. Кореляція для пари змінних обчислюється за тими об'єктами, де немає перепусток. У багатьох ситуаціях, особливо коли кількість перепусток відносно мала, скажімо 10%, і перепустки розподілені досить хаотично, цей метод не призводить до серйозних помилок. Однак, іноді це не так. Наприклад, у систематичному зміщенні (зрушенні) оцінки може «ховатися» систематичне розташування перепусток, що є причиною відмінності коефіцієнтів кореляції, побудованих за різними підмножинами (наприклад - для різних підгруп об'єктів). Інша проблема, пов'язана з кореляційною матрицею, обчисленою при попарномувидалення перепусток, виникає при використанні цієї матриці в інших видах аналізу (наприклад, у множинному регресійному або факторному аналізі). У них передбачається, що використовується «правильна» кореляційна матриця з певним рівнем спроможності та «відповідності» різних коефіцієнтів. Використання матриці з «поганими» (зміщеними) оцінками призводить до того, що програма або не в змозі аналізувати таку матрицю, або результати будуть помилковими. Тому, якщо застосовується попарний метод виключення пропущених даних, необхідно перевірити, чи є чи ні систематичні закономірності у розподілі перепусток.

Якщо попарне виключення пропущених даних не призводить до будь-якого систематичного зсуву середніх значень та дисперсій (стандартних відхилень), то ці статистики будуть схожі на аналогічні показники, обчислені при строковому способі видалення перепусток. Якщо спостерігається значну відмінність, тобто підставу припускати наявність зсуву в оцінках. Наприклад, якщо середнє (або стандартне відхилення) значень змінної А,яке використовувалося при обчисленні її кореляції зі змінною В,набагато менше середнього (або стандартного відхилення) тих же значень змінної А,які використовувалися при обчисленні її кореляції з пе-ременной С, то є всі підстави очікувати, що ці дві кореляції (А-ВнА-С)засновані на різних підмножинах даних. У кореляціях буде зрушення, викликане невипадковим розташуванням перепусток у значеннях змінних.

Аналіз кореляційних плеяд.Після вирішення проблеми статистичної значимості елементів кореляційної матриці статистично значущі кореляції можна представити графічно у вигляді кореляційної плеяди або плеяд. Кореляційна плеядаце фігура, що складається з вершин і ліній, що їх з'єднують. Вершини відповідають ознакам і позначаються зазвичай цифрами - номерами змінних. Лінії відповідають статистично достовірним зв'язкам і графічно виражають знак, інколи ж - і /j-рівень значущості зв'язку.

Кореляційна плеяда може відображати Усестатистично значущі зв'язки кореляційної матриці (іноді називається кореляційним графом ) або тільки їх змістовно виділену частину (наприклад, відповідну одному фактору за результатами факторного аналізу).

ПРИКЛАД ПОБУДУВАННЯ КОРРЕЛЯЦІЙНОЇ ПЛЕЯДИ


Підготовка до проведення державної (підсумкової) атестації випускників: формування бази ЄДІ ( загальний списокучасників ЄДІ всіх категорій із зазначенням предметів) – з урахуванням резервних днів у разі збігу предметів;

  • План роботи (27)

    Рішення

    2. Діяльність ОУ з удосконалення змісту та оцінки якості з предметів природничо-математичної освіти МОУ ЗОШ № 4, Литвинівська, Чапаєвська,

  • Призначення рангового коефіцієнта кореляції

    Метод рангової кореляції Спірмена дозволяє визначити тісноту (силу) та напрямок кореляційного зв'язку між двома ознакамиабо двома профілями (ієрархіями)ознак.

    Опис методу

    Для підрахунку рангової кореляції необхідно розташовувати двома рядами значень, які можна проранжированы. Такими рядами значень можуть бути:

    1) дві ознаки,виміряні в одній і тій же групі випробуваних;

    2) дві індивідуальні ієрархії ознак,виявлені у двох піддослідних за одним і тим же набором ознак (наприклад, особистісні профілі за 16-факторним опитувальником Р. Б. Кеттелла, ієрархії цінностей за методикою Р. Рокіча, послідовності переваг у виборі з кількох альтернатив та ін.);

    3) дві групові ієрархії ознак;

    4) індивідуальна та груповаієрархії ознак.

    Спочатку показники ранжуються окремо за кожною ознакою. Як правило, меншим значенням ознаки нараховується менший ранг.

    Розглянемо випадок 1 (дві ознаки).Тут ранжуються індивідуальні значення за першою ознакою, отримані різними випробуваними, а потім індивідуальні значення за другою ознакою.

    Якщо дві ознаки пов'язані позитивно, то випробувані, що мають низькі ранги по одному з них, матимуть низькі ранги та по іншому, а випробувані, що мають високі ранги за однією з ознак, матимуть за іншою ознакою також високі ранги. Для підрахунку r s необхідно визначити різниці (d) між рангами, отриманими даним випробуваним за обома ознаками. Потім ці показники d певним чином перетворюються і віднімаються з 1. Чим менше різниці між рангами, тим більше буде r s тим ближче він буде до +1.

    Якщо кореляція відсутня, то всі ранги будуть перемішані і між ними не буде відповідності. Формула складена так, що в цьому випадку r s, Виявиться близьким до 0.

    У разі негативної кореляції низьким рангам випробуваних за однією ознакою відповідатимуть високі ранги за іншою ознакою, і навпаки.

    Чим більший розбіжність між рангами випробуваних за двома змінними, тим ближче r s до -1.

    Розглянемо випадок 2 (два індивідуальні профілі).Тут ранжуються індивідуальні значення, отримані кожним із 2-х випробуваним за певним (однаковим їм обох) набору ознак. Перший ранг отримає ознаку з найнижчим значенням; другий ранг - ознака з вищим значенням тощо. Очевидно, що всі ознаки повинні бути виміряні в тих самих одиницях, інакше ранжування неможливо. Наприклад, неможливо проранжувати показники по опитувальнику Кеттелла (16) PF), якщо вони виражені в "сирих" балах, оскільки за різними факторами діапазони значень різні: від 0 до 13, від 0 до 20 і від 0 до 26. Ми не можемо сказати, який з факторів займатиме перше місце за виразністю, поки не наведемо всі значення до єдиної шкали (найчастіше це шкала стін).

    Якщо індивідуальні ієрархії двох піддослідних пов'язані позитивно, то ознаки, що мають низькі ранги в одного з них, матимуть низькі ранги і в іншого, і навпаки. Наприклад, якщо в одного випробуваного фактор Е (домінантність) має найнижчий ранг, то в іншого випробуваного він повинен мати низький ранг, якщо в одного випробуваного фактор С (емоційна стійкість) має вищий ранг, то й інший випробуваний повинен мати за цим фактором високий ранг і т.д.

    Розглянемо випадок 3 (два групові профілі).Тут ранжуються середньогрупові значення, отримані в 2-х групах випробуваних за певним, однаковим для двох груп, набором ознак. Надалі лінія міркувань така сама, як і в попередніх двох випадках.

    Розглянемо випадок 4 (індивідуальний та груповий профілі).Тут ранжуються окремо індивідуальні значення випробуваного і среднегрупповые значення з тієї ж набору ознак, які отримані, зазвичай, крім цього окремого випробуваного - він бере участь у среднегрупповом профілі, з яким зіставлятиметься його індивідуальний профіль. Рангова кореляція дозволить перевірити, наскільки узгоджено індивідуальний та груповий профілі.

    У всіх чотирьох випадках значимість отриманого коефіцієнта кореляції визначається за кількістю ранжованих значень N.У першому випадку ця кількість співпадатиме з обсягом вибірки п. У другому випадку кількістю спостережень буде кількість ознак, що становлять ієрархію. У третьому та четвертому випадку N -це також кількість зіставних ознак, а не кількість випробуваних у групах. Детальні пояснення наведено в прикладах.

    Якщо абсолютна величина r s досягає критичного значення або перевищує його, кореляція є достовірною.

    Гіпотези

    Можливі два варіанти гіпотез. Перший відноситься до випадку 1, другий - до трьох інших випадків.

    Перший варіант гіпотез

    H 0: Кореляція між змінними А та Б не відрізняється від нуля.

    H 1: Кореляція між змінними А та Б достовірно відрізняється від нуля.

    Другий варіант гіпотез

    H 0: Кореляція між ієрархіями А та Б не відрізняється від нуля.

    H 1: Кореляція між ієрархіями А та Б достовірно відрізняється від нуля.

    Графічне подання методу рангової кореляції

    Найчастіше кореляційний зв'язок представляють графічно як хмари точок чи вигляді ліній, що відбивають загальну тенденцію розміщення точок у просторі двох осей: осі ознаки і ознаки Б (див. рис. 6.2).

    Спробуємо зобразити рангову кореляцію як двох рядів ранжованих значень, які попарно з'єднані лініями (Рис. 6.3). Якщо ранги за ознакою А і за ознакою Б збігаються, між ними виявляється горизонтальна лінія, якщо ранги не збігаються, то лінія стає похилою. Чим більше розбіжність рангів, тим похилішою стає лінія. Ліворуч на Мал. 6.3 відображена максимально висока позитивна кореляція (r = +1,0) - практично це "сходи". У центрі відображено нульову кореляцію - плетінку з неправильними переплетеннями. Усі ранги тут переплутані. Праворуч відображено максимально високу негативну кореляцію (r s =-1,0) - павутина з правильним переплетенням ліній.

    Мал. 6.3. Графічне подання рангової кореляції:

    а) висока позитивна кореляція;

    б) нульова кореляція;

    в) висока негативна кореляція

    Обмеженнякоефіцієнта ранговоїкореляції

    1. По кожній змінній має бути представлено не менше 5 спостережень. Верхня межа вибірки визначається наявними таблицями критичних значень (табл. XVI додатка 1), а саме N40.

    2. Коефіцієнт рангової кореляції Спірмена r s при великій кількості однакових рангів по одній або обох змінних, що зіставляються, дає огрублені значення. В ідеалі обидва корелювані ряди повинні являти собою дві послідовності значень, що не збігаються. У разі, якщо цієї умови не дотримується, необхідно вносити поправку на однакові ранги. Відповідна формула наведена в прикладі 4.

    Приклад 1 – кореляціяміж двомаознаками

    У дослідженні, що моделює діяльність авіадиспетчера (Одеришев Б.С., Шамова Є.П., Сидоренко Є.В., Ларченко Н.М., 1978), група піддослідних, студентів фізичного факультету ЛДУ проходила підготовку перед початком роботи на тренажері. Випробувані повинні були вирішувати завдання щодо вибору оптимального типу злітно-посадкової смуги для заданого типу літака. Чи пов'язана кількість помилок, допущених випробуваними у тренувальній сесії, з показниками вербального та невербального інтелекту, виміряними за методикою Д. Векслера?

    Таблиця 6.1

    Показники кількості помилок у тренувальній сесії та показники рівня вербального та невербального інтелекту у студентів-фізиків (N=10)

    Випробуваний

    Кількість помилок

    Показник вербального інтелекту

    Показник невербального інтелекту

    Спочатку спробуємо відповісти на питання, чи пов'язані між собою показники кількості помилок та вербального інтелекту.

    Сформулюємо гіпотези.

    H 0: Кореляція між показником кількості помилок у тренувальній сесії та рівнем вербального інтелекту не відрізняється від нуля.

    H 1 : Кореляція між показником кількості помилок у тренувальній сесії та рівнем вербального інтелекту статистично значуще відрізняється від нуля.

    Далі нам необхідно проранжувати обидва показники, приписуючи меншому значенню менший ранг, потім підрахувати різниці між рангами, які отримав кожен випробуваний за двома змінними (ознаками), і звести ці різниці у квадрат. Зробимо всі необхідні розрахунки у таблиці.

    У Табл. 6.2 у першій колонці зліва представлені значення за показником кількості помилок; у наступній колонці – їх ранги. У третій колонці зліва представлені значення за показником вербального інтелекту; у наступному стовпці – їх ранги. У п'ятому зліва представлені різниці d між рангом за змінною А (кількість помилок) та змінною Б (вербальний інтелект). В останньому стовпці представлені квадрати різниць d 2 .

    Таблиця 6.2

    Розрахунок d 2 для рангового коефіцієнта кореляції Спірмена r s при зіставленні показників кількості помилок та вербального інтелекту у студентів-фізиків (N=10)

    Випробуваний

    Змінна А

    кількість помилок

    Змінна Б

    вербальний інтелект.

    d (ранг А -

    J 2

    Індивідуальні

    значення

    Індивідуальні

    значення

    Коефіцієнт рангової кореляції Спірмена підраховується за такою формулою:

    де d - різницю між рангами за двома змінними для кожного випробуваного;

    N -кількість ранжованих значень, ст. даному випадку кількість випробуваних.

    Розрахуємо емпіричне значення r s:

    Отримане емпіричне значення г s близько до 0. І все ж визначимо критичні значення r s при N = 10 Табл. XVI Додатки 1:

    Відповідь: H0 приймається. Кореляція між показником кількості помилок у тренувальній сесії та рівнем вербального інтелекту не відрізняється від нуля.

    Тепер спробуємо відповісти на питання, чи пов'язані між собою показники кількості помилок та невербального інтелекту.

    Сформулюємо гіпотези.

    H 0: Кореляція між показником кількості помилок у тренувальній сесії та рівнем невербального інтелекту не відрізняється від 0.

    H 1: Кореляція між показником кількості помилок у тренувальній сесії та рівнем невербального інтелекту статистично значуще відрізняється від 0.

    Результати ранжування та зіставлення рангів представлені в Табл. 6.3.

    Таблиця 6.3

    Розрахунок d 2 для рангового коефіцієнта кореляції Спірмена r s при зіставленні показників кількості помилок та невербального інтелекту у студентів-фізиків (N=10)

    Випробуваний

    Змінна А

    кількість помилок

    Змінна Е

    невербальний інтелект

    d (ранг А -

    d 2

    Індивідуальні

    Індивідуальні

    значення

    значення

    Ми пам'ятаємо, що для визначення значущості r s не має значення, чи є він позитивним чи негативним, важлива лише його абсолютна величина. В даному випадку:

    r s емп

    Відповідь: H0 приймається. Кореляція між показником кількості помилок у тренувальній сесії та рівнем невербального інтелекту випадкова, r s не відрізняється від 0.

    Разом з тим ми можемо звернути увагу на певну тенденцію негативноюзв'язки між цими двома змінними. Можливо, ми змогли б підтвердити її на статистично значущому рівні, якби збільшили обсяг вибірки.

    Приклад 2 – кореляція між індивідуальними профілями

    У дослідженні, присвяченому проблемам ціннісної реорієнтації, виявлялися ієрархії термінальних цінностей за методикою М. Рокіча у батьків та їх дорослих дітей (Сидоренко Є.В., 1996). Ранги термінальних цінностей, отримані під час обстеження пари мати-дочка (матері – 66 років, дочки – 42 роки) представлені в Табл. 6.4. Спробуємо визначити, як ці ціннісні ієрархії корелюють одна з одною.

    Таблиця 6.4

    Ранги термінальних цінностей за списком М.Рокича в індивідуальних ієрархіях матері та дочки

    Термінальні цінності

    Ранг цінностей у

    Ранг цінностей у

    d 2

    ієрархії матері

    ієрархії дочки

    1 Активне діяльне життя

    2 Життєва мудрість

    3 Здоров'я

    4 Цікава робота

    5 Краса природи та мистецтво

    7 Матеріально забезпечене життя

    8 Наявність добрих і вірних друзів

    9 Суспільне визнання

    10 Пізнання

    11 Продуктивна життя

    12 Розвиток

    13 Розваги

    14 Свобода

    15 Щасливе сімейне життя

    16 Щастя інших

    17 Творчість

    18 Впевненість у собі

    Сформулюємо гіпотези.

    H 0: Кореляція між ієрархіями термінальних цінностей матері та дочки не відрізняється від нуля.

    H 1: Кореляція між ієрархіями термінальних цінностей матері та дочки статистично значно відрізняється від нуля.

    Оскільки ранжування цінностей передбачається процедурою дослідження, нам залишається лише підрахувати різниці між рангами 18 цінностей у двох ієрархіях. У 3-му та 4-му стовпцях Табл. 6.4 представлені різниці d і квадрати цих різниць d 2 .

    Визначаємо емпіричне значення r s за такою формулою:

    де d - різниці між рангами по кожній із змінних, у даному випадку щодо кожної з термінальних цінностей;

    N- кількість змінних, які утворюють ієрархію, у разі кількість цінностей.

    Для цього прикладу:

    По Табл. XVI Додатки 1 визначаємо критичні значення:

    Відповідь: H0 відкидається. Приймається H1. Кореляція між ієрархіями термінальних цінностей матері та дочки статистично значуща (р<0,01) и является положительной.

    За даними Табл. 6.4 ми можемо визначити, що основні розбіжності припадають на цінності "Щасливе сімейне життя", "Громадське визнання" та "Здоров'я", ранги інших цінностей досить близькі.

    Приклад 3 – кореляція між двома груповими ієрархіями

    Джозеф Вольпе в книзі, написаній спільно з сином (Wolpe J., Wolpe D., 1981) наводить впорядкований перелік з найбільш часто зустрічаються у сучасної людини "некорисних", за його позначенням, страхів, які не несуть сигнального значення і лише заважають повноцінно жити та діяти. У вітчизняному дослідженні, проведеному М.Е. Раховий (1994) 32 піддослідних мали за 10-бальною шкалою оцінити, наскільки актуальним їм є той чи інший вид страху з переліку Вольпе 3 . Обстежена вибірка складалася зі студентів Гідрометеорологічного та Педагогічного інститутів Санкт-Петербурга: 15 юнаків та 17 дівчат віком від 17 до 28 років, середній вік 23 роки.

    Дані, отримані за 10-бальною шкалою, були усереднені за 32 випробуваними, і середні проранжовані. У Табл. 6.5 представлені рангові показники, отримані Дж. Вольпе та М. Е. Рахової. Чи збігаються рангові послідовності 20 видів страху?

    Сформулюємо гіпотези.

    H 0: Кореляція між упорядкованими переліками видів страху в американській та вітчизняних вибірках не відрізняється від нуля.

    H 1: Кореляція між упорядкованими переліками видів страху в американській та вітчизняній вибірках статистично значно відрізняється від нуля.

    Всі розрахунки, пов'язані з обчисленням та зведенням у квадрат різниць між рангами різних видів страху у двох вибірках, представлені в Табл. 6.5.

    Таблиця 6.5

    Розрахунок d для рангового коефіцієнта кореляції Спірмена при зіставленні впорядкованих переліків видів страху в американській та вітчизняній вибірках

    Види страху

    Ранг в американській вибірці

    Ранг у російській

    Страх публічного виступу

    Страх польоту

    Страх зробити помилку

    Страх невдачі

    Страх несхвалення

    Страх відкидання

    Страх злих людей

    Страх самотності

    Страх крові

    Страх відкритих ран

    Страх дантиста

    Страх уколів

    Страх проходження тестів

    Страх поліції міліції)

    Страх висоти

    Страх собак

    Страх павуків

    Страх скалічених людей

    Страх лікарень

    Страх темряви

    Визначаємо емпіричне значення r s:

    По Табл. XVI Додатка 1 визначаємо критичні значення г s при N=20:

    Відповідь: H0 приймається. Кореляція між упорядкованими переліками видів страху в американській та вітчизняній вибірках не досягає рівня статистичної значущості, тобто значуще не відрізняється від нуля.

    Приклад 4 - кореляція між індивідуальним та середньогруповим профілями

    Вибірці петербуржців віком від 20 до 78 років (31 чоловік, 46 жінок), врівноваженою за віком таким чином, що особи віком від 55 років становили в ній 50% 4 , пропонувалося відповісти на запитання: "Який рівень розвитку кожного з наведених нижче якостей необхідний для депутата Міських зборів Санкт-Петербурга? (Сидоренко Є.В., Дерманова І.Б., Анісімова О.М., Вітенберг Є.В., Шульга А.П., 1994). Оцінка проводилася за 10-бальною шкалою. Паралельно з цим обстежувалася вибірка з депутатів та кандидатів у депутати до Міських зборів Санкт-Петербурга (n=14). Індивідуальна діагностика політичних діячів і претендентів проводилася за допомогою Оксфордської системи експрес-відеодіагностики за тим же набором особистісних якостей, які вибирали виборці.

    У Табл. 6.6 представлені середні значення, отримані для кожного з якостей ввибірці виборців ("еталонний ряд") та індивідуальні значення одного з депутатів Міських зборів.

    Спробуємо визначити, наскільки індивідуальний профіль депутата К-ва корелює з еталонним профілем.

    Таблиця 6.6

    Усереднені еталонні оцінки виборців (п=77) та індивідуальні показники депутата К-ва за 18 особистісними якостями експрес-відеодіагностики

    Найменування якості

    Усереднені еталонні оцінки виборців

    Індивідуальні показники депутата К-ва

    1. Загальний рівень культури

    2. Навчання

    4. Здатність до творчості нового

    5.. Самокритичність

    6. Відповідальність

    7. Самостійність

    8. Енергія, активність

    9. Цілеспрямованість

    10. Витримка, самовладання

    І. Стійкість

    12. Особистісна зрілість

    13. Порядність

    14. Гуманізм

    15. Вміння спілкуватися з людьми

    16. Терпимість до чужої думки

    17. Гнучкість поведінки

    18. Здатність справляти сприятливе враження

    Таблиця 6.7

    Розрахунок d 2 для рангового коефіцієнта кореляції Спірмена між еталонним та індивідуальним профілями особистісних якостей депутата

    Найменування якості

    ранг якості в еталонному профілі

    Ряд 2: ранг якості в індивідуальному профілі

    d 2

    1 Відповідальність

    2 Порядність

    3 Вміння спілкуватися з людьми

    4 Витримка, самовладання

    5 Загальний рівень культури

    6 Енергія, активність

    8 Самокритичність

    9 Самостійність

    10 Особистісна зрілість

    І Цілеспрямованість

    12 Навчання

    13 Гуманізм

    14 Терпимість до чужої думки

    15 Стійкість

    16 Гнучкість поведінки

    17 Здатність справляти сприятливе враження

    18 Здатність до творчості нового

    Як видно з табл. 6.6, оцінки виборців та індивідуальні показники депутата варіюють у різних діапазонах. Дійсно оцінки виборців були отримані за 10-бальною шкалою, а індивідуальні показники з експрес-відеодіагностики вимірюються за 20-бальною шкалою. Ранжування дозволяє нам перевести обидві шкали виміру в єдину шкалу, де одиницею виміру буде 1 ранг, а максимальне значення становитиме 18 рангів.

    Ранжування, як ми пам'ятаємо, необхідно зробити окремо по кожному ряду значень. В даному випадку доцільно нараховувати більшому значенню менший ранг, щоб одразу можна було побачити, на якому місці за значимістю (для виборців) або за виразністю (у депутата) є та чи інша якість.

    Результати ранжирування представлені в Табл. 6.7. Якості перераховані у послідовності, що відображає еталонний профіль.

    Сформулюємо гіпотези.

    H 0: Кореляція між індивідуальним профілем депутата К-ва та еталонним профілем, побудованим за оцінками виборців, не відрізняється від нуля.

    H 1: Кореляція між індивідуальним профілем депутата К-ва та еталонним профілем, побудованим за оцінками виборців, статистично значно відрізняється від нуля. Оскільки в обох порівнюваних рангових рядах присутні

    групи однакових рангів, перед підрахунком коефіцієнта рангової

    кореляції необхідно внести поправки на однакові ранги Та і Т b :

    де а -обсяг кожної групи однакових рангів у ранговому ряду А,

    b - обсяг кожної групи однакових рангів у ранговому ряду Ст.

    В даному випадку, в ряду А (еталонний профіль) присутня одна група однакових рангів - якості "навчування" і "гуманізм" мають один і той же ранг 12,5; отже, а=2.

    T а = (23-2) / 12 = 0,50.

    У ряду В (індивідуальний профіль) є дві групи однакових рангів, при цьому b 1 =2 і b 2 =2.

    Ta =[(2 3 -2)+(2 3 -2)]/12=1,00

    Для підрахунку емпіричного значення rs використовуємо формулу

    В даному випадку:

    Зауважимо, що якби поправка на однакові ранги нами не вносилася, то величина r s була б лише (на 0,0002) вище:

    При великих кількостях однакових рангів зміни г 5 можуть виявитися значно суттєвішими. Наявність однакових рангів означає менший ступінь диференційованого упорядкованих змінних і, отже, меншу можливість оцінити ступінь зв'язку між ними (Суходольський Г.В., 1972, с.76).

    По Табл. XVI Додатка 1 визначаємо критичні значення г, при N=18:

    Відповідь: Hq відкидається. Кореляція між індивідуальним профілем депутата К-ва та еталонним профілем, що відповідає вимогам виборців, статистично значуща (р<0,05) и является положи­тельной.

    З Табл. 6.7 видно, що депутат К-в має нижчий ранг за шкалами Вміння спілкуватися з людьми і більш високі ранги за шкалами цілеспрямованості та стійкості, ніж це передбачається виборним еталоном. Цими розбіжностями, головним чином, пояснюється деяке зниження отриманого r s .

    Сформулюємо загальний алгоритм підрахунку rs.

    Дата публікації: 03.09.2017 13:01

    Термін «кореляція» активно використовується у гуманітарних науках, медицині; часто миготить у ЗМІ. Ключову роль кореляції грають у психології. Зокрема, розрахунок кореляцій є важливим етапом реалізації емпіричного дослідження при написанні ВКР з психології.

    Матеріали з кореляцій у мережі надто наукові. Нефахівцеві важко розібратися у формулах. У той самий час розуміння сенсу кореляцій необхідне маркетологу, соціологу, медику, психологу - всім, хто проводить дослідження людей.

    У цій статті ми простою мовою пояснимо суть кореляційного зв'язку, види кореляцій, способи розрахунку, особливості використання кореляції у психологічних дослідженнях, а також при написанні дипломних робіт із психології.

    Зміст

    Що таке кореляція

    Кореляція – це зв'язок. Але не будь-яка. У чому її особливість? Розглянемо з прикладу.

    Уявіть, що ви їдете автомобілем. Ви натискаєте педаль газу – машина їде швидше. Ви зменшуєте газ - авто сповільнює хід. Навіть не знайома з пристроєм автомобіля людина скаже: «Між педаллю газу та швидкістю машини є прямий зв'язок: чим сильніше натиснута педаль, тим швидкість вища».

    Це функціональна залежність - швидкість виступає прямою функцією педалі газу. Фахівець пояснить, що педаль керує подачею палива в циліндри, де відбувається спалювання суміші, що веде до підвищення потужності на вал тощо. Це зв'язок жорсткий, детермінований, що не допускає винятків (за умови, що машина справна).

    Тепер уявіть, що ви - директор фірми, співробітники якої продають товари. Ви вирішуєте підвищити продажі за рахунок підвищення окладів працівників. Ви підвищуєте зарплату на 10%, і продаж у середньому по фірмі зростає. Через час підвищуєте ще на 10% і знову зростання. Потім ще на 5% і знову є ефект. Напрошується висновок - між продажами фірми та окладом співробітників є пряма залежність - що вищі оклади, то вищі продажу організації. Такий же це зв'язок, як між педаллю газу та швидкістю авто? У чому ключова відмінність?

    Правильно, між окладом та продажами залежність не жорстка. Це означає, що у когось із співробітників продажу могли навіть знизитись, незважаючи на зростання окладу. У когось залишитися незмінними. Але в середньому по фірмі продажі зросли, і ми говоримо – зв'язок продажів та окладу співробітників є, і він кореляційний.

    В основі функціонального зв'язку (педаль газу – швидкість) лежить фізичний закон. В основі кореляційного зв'язку (продажу – оклад) знаходиться проста узгодженість зміни двох показників. Жодного закону (у фізичному розумінні цього слова) за кореляцією немає. Є лише ймовірнісна (стохастична) закономірність.

    Чисельний вираз кореляційної залежності

    Отже, кореляційний зв'язок відбиває залежність між явищами. Якщо ці явища можна виміряти, вона отримує чисельне вираз.

    Наприклад, вивчається роль читання у житті людей. Дослідники взяли групу з 40 осіб та виміряли у кожного випробуваного два показники: 1) скільки часу він читає на тиждень; 2) якою мірою вважає себе благополучним (за шкалою від 1 до 10). Вчені занесли ці дані у два стовпчики та за допомогою статистичної програми розрахували кореляцію між читанням та благополуччям. Припустимо, вони одержали наступний результат -0,76. Але що означає це число? Як його проінтерпретувати? Давайте розумітися.

    Отримане число називається коефіцієнтом кореляції. Для його правильної інтерпретації важливо враховувати таке:

    1. Знак "+" або "-" відображає напрямок залежності.
    2. Розмір коефіцієнта відбиває силу залежності.

    Пряма та зворотна

    Знак плюс перед коефіцієнтом свідчить про те, що зв'язок між явищами чи показниками пряма. Тобто чим більше один показник, тим більше й інший. Вище оклад - вищий за продаж. Така кореляція називається прямою, або позитивною.

    Якщо коефіцієнт має знак мінус, значить кореляція зворотна, або негативна. У цьому випадку що вищий один показник, то нижчий інший. У прикладі з читанням та благополуччям ми отримали -0,76, і це означає, що чим більше люди читають, тим нижчий рівень їхнього благополуччя.

    Сильна та слабка

    Кореляційний зв'язок у чисельному вираженні – це число в діапазоні від -1 до +1. Позначається буквою "r". Чим вище число (без урахування знака), тим кореляційний зв'язок сильніший.

    Чим нижче чисельне значення коефіцієнта, тим взаємозв'язок між явищами та показниками менший.

    Максимально можлива сила залежності – це 1 або -1. Як це зрозуміти та уявити?

    Розглянемо приклад. Взяли 10 студентів та виміряли у них рівень інтелекту (IQ) та успішність за семестр. Розташували ці дані у вигляді двох стовпців.

    Випробуваний

    IQ

    Успішність (бали)

    Уважно подивіться на дані в таблиці. Від 1 до 10 випробуваного зростає рівень IQ. Але також зростає рівень успішності. З будь-яких двох студентів успішність буде вищою у того, хто має вище IQ. І жодних винятків із цього правила не буде.

    Перед нами приклад повної, 100%-но узгодженої зміни двох показників у групі. І це приклад максимально можливого позитивного взаємозв'язку. Тобто кореляційна залежність між інтелектом і успішністю дорівнює 1.

    Розглянемо інший приклад. У цих 10-ти студентів за допомогою опитування оцінили, якою мірою вони почуваються успішними у спілкуванні з протилежною статтю (за шкалою від 1 до 10).

    Випробуваний

    IQ

    Успіх у спілкуванні з протилежною статтю (бали)

    Дивимося уважно на дані у таблиці. Від 1 до 10 випробуваного зростає рівень IQ. При цьому в останньому стовпці послідовно знижується рівень успішності спілкування з протилежною статтю. З будь-яких двох студентів успіх спілкування з протилежною статтю буде вищим у того, хто має IQ нижче. І жодних винятків із цього правила не буде.

    Це приклад повної узгодженості зміни двох показників у групі – максимально можливий негативний взаємозв'язок. Кореляційний зв'язок між IQ та успішністю спілкування з протилежною статтю дорівнює -1.

    А як зрозуміти сенс кореляції, що дорівнює нулю (0)? Це означає, що зв'язку між показниками немає. Ще раз повернемося до наших студентів та розглянемо ще один виміряний у них показник – довжину стрибка з місця.

    Випробуваний

    IQ

    Довжина стрибка з місця (м)

    Не спостерігається жодної узгодженості між зміною IQ від людини до людини та довгою стрибка. Це свідчить про відсутність кореляції. Коефіцієнт кореляції IQ та довжини стрибка з місця у студентів дорівнює 0.

    Ми розглянули крайні випадки. У реальних вимірах коефіцієнти рідко бувають дорівнюють точно 1 або 0. При цьому прийнята наступна шкала:

    • якщо коефіцієнт більше 0,70 – зв'язок між показниками сильний;
    • від 0,30 до 0,70 - зв'язок помірний,
    • менше 0,30 - зв'язок слабкий.

    Якщо оцінити за цією шкалою отриману нами вище кореляцію між читанням та благополуччям, то виявиться, що ця залежність сильна та негативна -0,76. Тобто спостерігається сильний негативний зв'язок між начитаністю та благополуччям. Що ще раз підтверджує біблійну мудрість про співвідношення мудрості та смутку.

    Наведена градація дає дуже приблизні оцінки й у вигляді рідко використовуються у дослідженнях.

    Найчастіше використовуються градації коефіцієнтів за рівнями значимості. І тут реально отриманий коефіцієнт може бути значним чи значимим. Визначити це можна, порівнявши його значення із критичним значенням коефіцієнта кореляції, взятим із спеціальної таблиці. Причому ці критичні значення залежать від чисельності вибірки (що більший обсяг, то нижче критичне значення).

    Кореляційний аналіз у психології

    Кореляційний метод виступає одним із основних у психологічних дослідженнях. І це невипадково, адже психологія прагне бути точною наукою. Чи виходить?

    У чому особливість законів у точних науках. Наприклад, закон тяжіння у фізиці діє без винятків: що більше маса тіла, то сильніше воно притягує інші тіла. Цей фізичний закон відображає зв'язок маси тіла та сили тяжіння.

    У психології інша ситуація. Наприклад, психологи публікують дані про зв'язок теплих відносин у дитинстві з батьками та рівня креативності у дорослому віці. Чи означає це, що кожен із піддослідних з дуже теплими стосунками з батьками у дитинстві матиме дуже високі творчі здібності? Відповідь однозначна – ні. Тут немає закону, подібного до фізичного. Немає механізму впливу дитячого досвіду на креативність дорослих. Це наші фантазії! Є узгодженість даних (відносини – креативність), але за ними немає закону. А є лише кореляційний зв'язок. Психологи часто називають взаємозв'язки, що виявляються психологічними закономірностями, підкреслюючи їх імовірнісний характер - не жорсткість.

    Приклад дослідження на студентах із попереднього розділу добре ілюструє використання кореляцій у психології:

    1. Аналіз взаємозв'язку між психологічними показниками. У нашому прикладі IQ та успішність спілкування з протилежною статтю – це психологічні параметри. Виявлення кореляції між ними розширює уявлення про психічну організацію людини, про взаємозв'язки між різними сторонами її особистості - у разі між інтелектом і сферою спілкування.
    2. Аналіз взаємозв'язків IQ з успішністю та стрибками - приклад зв'язку психологічного параметра з непсихологічними. Отримані результати розкривають особливості впливу інтелекту на навчальну та спортивну діяльність.

    Ось як могли виглядати короткі висновки щодо результатів вигаданого дослідження на студентах:

    1. Виявлено значну позитивну залежність інтелекту студентів та їх успішності.
    2. Існує негативна значуща взаємозв'язок IQ з успішністю спілкування з протилежною статтю.
    3. Не виявлено зв'язку IQ студентів із вмінням стрибати з місця.

    Таким чином, рівень інтелекту студентів виступає позитивним фактором їх академічної успішності, в той же час негативно позначається на відносинах з протилежною статтю і не надаючи значного впливу на спортивні успіхи, зокрема, здатність стрибати з місця.

    Як бачимо, інтелект допомагає студентам навчатися, але заважає будувати стосунки із протилежною статтю. При цьому не впливає на їхні спортивні успіхи.

    Неоднозначний вплив інтелекту на особистість та діяльність студентів відображає складність цього феномена у структурі особистісних особливостей та важливість продовження досліджень у цьому напрямі. Зокрема, є важливим провести аналіз взаємозв'язків інтелекту з психологічними особливостями та діяльністю студентів з урахуванням їхньої статі.

    Коефіцієнти Пірсона та Спірмена

    Розглянемо два методи розрахунку.

    p align="justify"> Коефіцієнт Пірсона - це особливий метод розрахунку взаємозв'язку показників між вираженістю чисельних значень в одній групі. Дуже спрощено він зводиться до наступного:

    1. Беруться значення двох параметрів у групі випробуваних (наприклад, агресії та перфекціонізму).
    2. Знаходяться середні значення кожного параметра групи.
    3. Знаходяться різниці параметрів кожного випробуваного та середнього значення.
    4. Ці різниці підставляються у спеціальну форму для розрахунку коефіцієнта Пірсона.

    Коефіцієнт рангової кореляції Спірмена розраховується таким чином:

    1. Беруться значення двох індикаторів групи піддослідних.
    2. Знаходяться ранги кожного чинника групи, тобто місце у списку зростання.
    3. Знаходяться різниці рангів, зводяться квадрат і підсумовуються.
    4. Далі різниці рангів підставляються у спеціальну форму для обчислення коефіцієнта Спірмена.

    У разі Пірсона розрахунок йшов із використанням середнього значення. Отже, випадкові викиди даних (істотна відмінність від середнього), наприклад, через помилку обробки або недостовірних відповідей можуть суттєво спотворити результат.

    У випадку Спірмена абсолютні значення даних не відіграють ролі, тому що враховується лише їхнє взаємне розташування по відношенню один до одного (ранги). Тобто викиди даних або інші неточності не вплинуть на кінцевий результат.

    Якщо результати тестування коректні, відмінності коефіцієнтів Пірсона і Спірмена незначні, причому коефіцієнт Пірсона показує більш точне значення взаємозв'язку даних.

    Як розрахувати коефіцієнт кореляції

    Коефіцієнти Пірсона та Спірмена можна розрахувати вручну. Це може знадобитись при поглибленому вивченні статистичних методів.

    Однак у більшості випадків під час вирішення прикладних завдань, зокрема й у психології, можна проводити розрахунки з допомогою спеціальних програм.

    Розрахунок за допомогою електронних таблиць Microsoft Excel

    Повернемося знову наприклад зі студентами і розглянемо дані про рівень їхнього інтелекту та довжину стрибка з місця. Занесемо ці дані (два стовпці) до таблиці Excel.

    Перемістивши курсор у порожню комірку, натиснемо опцію «Вставити функцію» та виберемо «КОРРЕЛ» з розділу «Статистичні».

    Формат цієї функції передбачає виділення двох масивів даних: Корел (масив 1; масив »). Виділяємо відповідно стовпчик з IQ та довжиною стрибків.

    У таблицях Excel реалізовано формулу розрахунку лише коефіцієнта Пірсона.

    Розрахунок за допомогою програми STATISTICA

    Заносимо дані по інтелекту та довжині стрибка у полі вихідних даних. Далі вибираємо опцію "Непараметричні критерії", "Спірмена". Виділяємо параметри для розрахунку та отримуємо наступний результат.


    Як видно, розрахунок дав результат 0,024, що відрізняється від результату Пірсона - 0,038, отриманої вище за допомогою Excel. Проте відмінності незначні.

    Використання кореляційного аналізу у дипломних роботах з психології (приклад)

    Більшість тем випускних кваліфікаційних робіт з психології (дипломів, курсових, магістерських) передбачають проведення кореляційного дослідження (інші пов'язані з виявленням відмінностей психологічних показників у різних групах).

    Сам термін «кореляція» у назвах тем звучить рідко – він ховається за такими формулюваннями:

    • «Взаємозв'язок суб'єктивного відчуття самотності та самоактуалізації у жінок зрілого віку»;
    • «Особливості впливу життєстійкості менеджерів на успішність їхньої взаємодії з клієнтами у конфліктних ситуаціях»;
    • «Особистісні фактори стресостійкості співробітників МНС».

    Отже, слова «взаємозв'язок», «вплив» і «чинники» - вірні ознаки те, що шляхом аналізу даних у емпіричному дослідженні може бути кореляційний аналіз.

    Розглянемо коротко етапи його проведення під час написання дипломної роботи з психології на тему: «Взаємозв'язок особистісної тривожності та агресивності у підлітків».

    1. Для розрахунку необхідні сирі дані, як яких зазвичай виступають результати тестування піддослідних. Вони заносяться до зведеної таблиці і поміщаються у додаток. Ця таблиця влаштована так:

    • кожен рядок містить дані на одного випробуваного;
    • кожен стовпець містить показники за однією шкалою всім випробуваних.

    № випробуваного

    Особистісна тривожність

    Агресивність

    2. Необхідно вирішити, який із двох типів коефіцієнтів - Пірсона або Спірмена - використовуватиметься. Нагадуємо, що Пірсон дає більш точний результат, але він чутливий до викидів у даних. Коефіцієнти Спірмена можуть використовуватися з будь-якими даними (крім номінативної шкали), тому саме вони найчастіше використовують у дипломах психології.

    3. Заносимо таблицю сирих даних у статистичну програму.

    4. Розраховуємо значення.



    5. На наступному етапі важливо визначити, чи важливий взаємозв'язок. Статистична програма підсвітила результати червоним, що означає, що кореляція статистично значущі за рівня значущості 0,05 (зазначено вище).

    Однак, корисно знати, як визначити значущість вручну. І тому знадобиться таблиця критичних значень Спірмена.

    Таблиця критичних значень коефіцієнтів Спірмена

    Рівень статистичної значимості

    Число випробуваних

    р = 0,05

    р = 0,01

    р = 0,001

    0,88

    0,96

    0,99

    0,81

    0,92

    0,97

    0,75

    0,88

    0,95

    0,71

    0,83

    0,93

    0,67

    0,63

    0,77

    0,87

    0,74

    0,85

    0,58

    0,71

    0,82

    0,55

    0,68

    0,53

    0,66

    0,78

    0,51

    0,64

    0,76

    Нас цікавить рівень значущості 0,05 та обсяг нашої вибірки 10 осіб. На перетині цих даних знаходимо значення критичного Спірмена: Rкр = 0,63.

    Правило таке: якщо отримане емпіричне значення Спірмена більше чи одно критичному, він статистично значимий. У нашому випадку: Rемп (0,66) > Rкр (0,63), отже, взаємозв'язок між агресивністю і тривожністю групи підлітків статистично значуща.

    5. У текст дипломної потрібно вставляти дані у таблиці формату word, а чи не таблицю зі статистичної програми. Під таблицею описуємо отриманий результат та інтерпретуємо його.

    Таблиця 1

    Коефіцієнти Спірмена агресивності та тривожності у групі підлітків

    Агресивність

    Особистісна тривожність

    0,665*

    * - статистично достовірна (р0,05)

    Аналіз даних, наведених у таблиці 1, показує, що існує статистично значущий позитивний зв'язок між агресивністю та тривожністю підлітків. Це означає, що чим вище особистісна тривожність підлітків, тим вищий рівень їхньої агресивності. Такий результат дає підстави припустити, що агресія для підлітків виступає одним із способів усунення тривожності. Зазнаючи невпевненості у собі, тривогу у зв'язку з загрозами самооцінці, особливо чутливої ​​у підлітковому віці, підліток часто використовує агресивну поведінку, таким непродуктивним способом знижуючи тривогу.

    6. Чи можна говорити про вплив при інтерпретації зв'язків? Чи можна сказати, що тривожність впливає агресивність? Строго кажучи, ні. Вище ми показали, що кореляційна зв'язок між явищами носить імовірнісний характері і відбиває лише узгодженість змін ознак групи. При цьому ми не можемо сказати, що ця узгодженість викликана тим, що одне з явищ є причиною іншого, що впливає на нього. Тобто наявність кореляції між психологічними параметрами не дає підстав говорити про існування між ними причинно-наслідкового зв'язку. Однак практика показує, що термін «вплив» часто використовується під час аналізу результатів кореляційного аналізу.

    Калькулятор нижче обчислює коефіцієнт рангової кореляції Спірмена між двома випадковими величинами. Теоретична частина, щоб не відволікатися від калькулятора, зазвичай розміщується під ним.

    add import_export mode_edit delete

    Зміни випадкових величин

    arrow_upwardarrow_downward Xarrow_upwardarrow_downward Y
    Розмір сторінки: 5 10 20 50 100 chevron_left chevron_right

    Зміни випадкових величин

    Імпортувати даніПомилка імпорту

    Для поділу полів можна використовувати один із цих символів: Tab, ";" або "," Приклад: -50.5;-50.5

    Імпортувати Назад Скасувати

    Метод розрахунку коефіцієнта рангової кореляції Спірмена насправді описується дуже легко. Це той самий Коефіцієнт кореляції Пірсона, тільки розрахований не для результатів вимірювань випадкових величин, а для них рангових значень.

    Тобто,

    Залишилося тільки розібратися, що таке рангові значення і для чого це потрібно.

    Якщо елементи варіаційного ряду розташувати у порядку зростання чи спадання, то рангомелемент буде його номер у цьому впорядкованому ряду.

    Наприклад, нехай ми маємо варіаційний ряд (17,26,5,14,21). Відсортуємо його елементи у порядку зменшення (26,21,17,14,5). 26 має ранг 1, 21 – ранг 2 і т.д. Варіаційний ряд рангових значень виглядатиме так (3,1,5,4,2).

    Тобто при розрахунку коефіцієнта Спірмена вихідні варіаційні ряди перетворюються на варіаційні ряди рангових значень, після чого до них застосовується формула Пірсона.

    Є одна тонкість - ранг значень, що повторюються, береться як середнє з рангів. Тобто для ряду (17, 15, 14, 15) ряд рангових значень буде виглядати як (1, 2.5, 4, 2.5), так як перший елемент 15 має ранг 2, а другий - ранг 3, і .

    Якщо ж повторюваних значень немає, тобто всі значення рангових рядів – числа з діапазону від 1 до n, формулу Пірсона можна спростити до

    Ну і до речі, ця формула найчастіше наводиться як формула розрахунку коефіцієнта Спірмена.

    У чому ж суть переходу від самих значень до рангових значень?
    А суть у тому, що досліджуючи кореляцію рангових значень можна встановити наскільки добре залежність двох змінних описується монотонною функцією.

    Знак коефіцієнта свідчить про напрям зв'язок між змінними. Якщо знак позитивний, значення Y мають тенденцію збільшуватися зі збільшенням значень X; якщо знак негативний, то значення Y мають тенденцію зменшуватися зі збільшенням значень X. Якщо коефіцієнт дорівнює 0, ніякої тенденції немає. Якщо коефіцієнт дорівнює 1 або -1, то залежність між X і Y має вигляд монотонної функції - тобто, при збільшенні X, Y також збільшується, або навпаки, при збільшенні X, Y зменшується.

    Тобто, на відміну від коефіцієнта кореляції Пірсона, який може виявити лише лінійну залежність однієї змінної від іншої, коефіцієнт кореляції Спірмена може виявити монотонну залежність там, де безпосередній лінійний зв'язок не виявляється.

    Поясню з прикладу. Припустимо, що досліджуємо функцію y=10/x.
    У нас є наступні результати вимірювань X та Y
    {{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
    Для цих даних коефіцієнт кореляції Пірсона дорівнює -0.4686, тобто зв'язок слабкий або відсутній. А ось коефіцієнт кореляції Спірмена строго дорівнює -1, що натякає досліднику, що Y має строгу негативну монотонну залежність від X.

    Схожі статті

    2023 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.