Статистичне вивчення варіаційних рядів та розрахунок середніх величин. V. Варіаційні ряди, середні величини, варіабельність ознаки

Концепція варіаційного ряду. Першим кроком систематизації матеріалів статистичного спостереження є підрахунок числа одиниць, що мають ту чи іншу ознаку. Розташувавши одиниці в порядку зростання або зменшення їх кількісної ознаки і підрахувавши число одиниць з конкретним значенням ознаки, отримуємо варіаційний ряд. Варіаційний ряд характеризує розподіл одиниць певної статистичної сукупності за якоюсь кількісною ознакою.

Варіаційний ряд є дві колонки, в лівій колонці наводяться значення варіюючого ознаки, іменовані варіантами і позначаються (x), а правої – абсолютні числа, що показують, скільки разів зустрічається кожен варіант. Показники цієї колонки називаються частотами та позначаються (f).

Схематично варіаційний ряд можна подати у вигляді табл.5.1:

Таблиця 5.1

Вид варіаційного ряду

Варіанти (x)

Частоти (f)

У правій колонці можуть використовуватись і відносні показники, що характеризують частку частоти окремих варіантів у загальній сумі частот. Ці відносні показники називають частостями і умовно позначають через , тобто. . Сума всіх частостей дорівнює одиниці. Частини можуть бути виражені і у відсотках, і тоді їх сума дорівнюватиме 100%.

Варіюють ознаки можуть мати різний характер. Варіанти одних ознак виражаються в цілих числах, наприклад, кількість кімнат у квартирі, кількість виданих книг і т.д. Ці ознаки називають перервними, чи дискретними. Варіанти інших ознак можуть набувати будь-яких значень у певних межах, як, наприклад, виконання планових завдань, заробітна плата та ін. Ці ознаки називають безперервними.

Дискретний варіаційний ряд.Якщо варіанти варіаційного ряду виражені у вигляді дискретних величин, то такий варіаційний ряд називають дискретним, його зовнішній виглядпредставлений у табл. 5.2:

Таблиця 5.2

Розподіл студентів за оцінками, отриманими на іспиті

Оцінки (х)

Кількість студентів (f)

% до підсумку ()

Характер розподілу в дискретних рядахзображується графічно як полігону розподілу, рис.5.1.

Мал. 5.1. Розподіл студентів за оцінками, отриманими на іспиті.

Інтервальний варіаційний ряд.Для безперервних ознак варіаційні лави будуються інтервальні, тобто. значення ознаки у яких виражаються як інтервалів «від і до». У цьому мінімальне значення ознаки у такому інтервалі називають нижньої межею інтервалу, а максимальне – верхньою межею інтервалу.

Інтервальні варіаційні ряди будують як для перервних ознак (дискретних), так і для великих у діапазоні. Інтервальні ряди можуть бути з рівними та нерівними інтервалами. В економічній практиці здебільшого застосовуються нерівні інтервали, що прогресивно зростають або спадають. Така необхідність виникає особливо у випадках, коли коливання ознаки здійснюється нерівномірно і великих межах.

Розглянемо вигляд інтервального рядуіз рівними інтервалами, табл. 5.3:

Таблиця 5.3

Розподіл робітників з вироблення

Виробіток, т.р. (х)

Число робітників (f)

Кумулятивна частота (f')

Інтервальний ряд розподілу графічно зображується як гістограми, рис.5.2.

Рис.5.2. Розподіл робітників з вироблення

Накопичена (кумулятивна) частота.У практиці виникає потреба у перетворенні рядів розподілу на кумулятивні ряди,що будуються за накопиченими частотами. З їхньою допомогою можна визначити структурні середні, які полегшують аналіз даних низки розподілу.

Накопичені частоти визначаються шляхом послідовного додавання до частот (або частот) першої групи цих показників наступних груп ряду розподілу. Для ілюстрації рядів розподілу використовуються кумуляти та огива. Для їх побудови на осі абсцис відзначаються значення дискретного ознаки (чи кінці інтервалів), але в осі ординат – наростаючі підсумки частот (кумулята), рис.5.3.

Мал. 5.3. Кумулята розподілу робітників з вироблення

Якщо шкали частот і варіантів міняти місцями, тобто. на осі абсцис відбивати накопичені частоти, але в осі ординат – значення варіантів, то крива, характеризує зміна частот від групи до групи, носить назву огиви розподілу, рис.5.4.

Мал. 5.4. Огива розподілу робітників з вироблення

Варіаційні ряди з рівними інтервалами забезпечують одне з найважливіших вимог, що висуваються до статистичних рядів розподілу, забезпечення порівнянності їх у часі та просторі.

Щільність розподілу.Однак частоти окремих нерівних інтервалів у названих рядах безпосередньо не можна порівняти. У разі для забезпечення необхідної порівняльності обчислюють щільність розподілу, тобто. визначають, скільки одиниць у кожній групі посідає одиницю величини інтервалу.

При побудові графіка розподілу варіаційного ряду з нерівними інтервалами висоту прямокутників визначають пропорційно не частотам, а показникам щільності розподілу значень ознаки, що вивчається, у відповідних інтервалах.

Складання варіаційного ряду та його графічне зображенняє першим кроком обробки вихідних даних та першим ступенем аналізу досліджуваної сукупності. p align="justify"> Наступним кроком в аналізі варіаційних рядів є визначення основних узагальнюючих показників, іменованих характеристиками ряду. Ці характеристики повинні дати уявлення про середнє значення ознаки одиниць сукупності.

Середня величина. Середня величина є узагальнену характеристику досліджуваної ознаки в досліджуваній сукупності, що відображає її типовий рівень у розрахунку на одиницю сукупності в конкретних умовах місця і часу.

Середня величина завжди іменована, має таку ж розмірність, як і ознака в окремих одиниць сукупності.

Перед обчисленням середніх величин необхідно провести угруповання одиниць досліджуваної сукупності, виділивши якісно однорідні групи.

Середня, розрахована за сукупністю загалом називається загальної середньої, а кожної групи – груповими середніми.

Існують два різновиди середніх величин: статечні ( середня арифметична, середня гармонійна, середня геометрична, середня квадратична); структурні (мода, медіана, квартилі, децилі).

Вибір середньої розрахунку залежить від мети.

Види статечних середніх та методи їх розрахунку.У практиці статистичної обробки зібраного матеріалувиникають різні завдання, на вирішення яких потрібні різні середні.

Математична статистика виводить різні середні з формул статечної середньої:

де середня величина; x - окремі варіанти (значення ознак); z – показник ступеня (при z = 1 – середня арифметична, z = 0 середня геометрична, z = - 1 – середня гармонійна, z = 2 – середня квадратична).

Однак питання про те, який вид середньої необхідно застосувати в кожному окремому випадку, вирішується шляхом конкретного аналізу сукупності, що вивчається.

Найбільш часто зустрічається у статистиці видом середніх величин є середня арифметична. Вона обчислюється в тих випадках, коли обсяг ознаки, що осредняется, утворюється як сума його значень в окремих одиниць вивчається статистичної сукупності.

Залежно від характеру вихідних даних середня арифметична визначається різними способами:

Якщо дані несгруповані, то розрахунок ведеться за формулою простої середньої величини

Розрахунок середньої арифметичної в дискретному рядувідбувається за формулою 3.4.

Розрахунок середньої арифметичної в інтервальному ряду.В інтервальному варіаційному ряду, де за величину ознаки у кожній групі умовно приймається середина інтервалу, середня арифметична може відрізнятися від середньої, розрахованої за несгрупованими даними. Причому, чим більше величина інтервалу в групах, тим більше можливі відхилення середньої, обчисленої за згрупованими даними, від середньої, розрахованої за несгрупованими даними.

При розрахунку середньої за інтервальним варіаційним рядом для виконання необхідних обчислень від інтервалів переходять до їх середин. А потім розраховують середню величину за формулою середньої арифметичної зваженої.

Властивості середньої арифметичної.Середня арифметична має деякі властивості, які дозволяють спрощувати обчислення, розглянемо їх.

1. Середня арифметична із постійних чисел дорівнює цьому постійному числу.

Якщо х = а. Тоді .

2. Якщо ваги всіх варіантів пропорційно змінити, тобто. збільшити або зменшити в те саме число разів, то середня арифметична нового ряду від цього не зміниться.

Якщо всі ваги f зменшити у k разів, то .

3. Сума позитивних і від'ємних відхилень окремих варіантів від середньої, помножених на ваги, дорівнює нулю, тобто.

Якщо то . Звідси.

Якщо всі варіанти зменшити або збільшити на якесь число, то середня арифметична нового ряду зменшиться або збільшиться на стільки ж.

Зменшимо всі варіанти xна a, тобто. x´ = xa.

Тоді

Середню арифметичну початкового ряду можна отримати, додаючи до зменшеної середньої раніше вирахуваної з варіантів числа a, тобто. .

5. Якщо всі варіанти зменшити або збільшити в kраз, то середня арифметична нового ряду зменшиться чи збільшиться у стільки ж, тобто. в kразів.

Нехай тоді .

Звідси, тобто. для отримання середньої первісного ряду середню арифметичну нового ряду (зі зменшеними варіантами) треба збільшити kразів.

Середня гармонійна.Середня гармонійна величина, що зворотна середньої арифметичної. Її використовують, коли статистична інформація не містить частот за окремими варіантами сукупності, а представлена ​​як їхнє твір (М = xf). Середня гармонійна розраховуватиметься за формулою 3.5

Практичне застосуваннясередньої гармонійної – до розрахунку деяких індексів, зокрема, індексу цін.

Середня геометрична.При застосуванні середньої геометричної індивідуальні значення ознаки є, як правило, відносні величинидинаміки, побудовані у вигляді ланцюгових величин, як відношення до попереднього рівня кожного рівня у ряді динаміки. Середня характеризує, таким чином, середній коефіцієнтзростання.

Середня геометрична величина використовується також визначення рівновіддаленої величини від максимального і мінімального значень ознаки. Наприклад, страхова компаніяукладає договори надання послуг автострахування. Залежно від конкретного страхового випадку страхова виплата може коливатися від 10000 до 100000 дол. на рік. Середня сума виплат зі страховки становитиме дол.

Середня геометрична це величина, яка використовується як середня із відносин або в рядах розподілу, представлених у вигляді геометричній прогресії, коли z = 0. Цією середньою зручно користуватися, коли приділяється увага не абсолютним різницям, а відносинам двох чисел.

Формули для розрахунку наступні

де - варіанти ознаки, що осредняется; - Добуток варіантів; f- Частота варіантів.

Середня геометрична використовується у розрахунках середньорічних темпів зростання.

Середня квадратична.Формула середньої квадратичної використовується для вимірювання ступеня коливання індивідуальних значень ознаки навколо середньої арифметичної в рядах розподілу. Так, при розрахунку показників варіації середню обчислюють із квадратів відхилень індивідуальних значень ознаки від середньої арифметичної величини.

Середня квадратична величина розраховується за формулою

В економічних дослідженнях середня квадратична у зміненому вигляді широко використовується при розрахунку показників варіації ознаки, таких як дисперсія, середнє відхилення.

Правило мажорантності.Між статечними середніми існує така залежність – що більше показник ступеня, то більше значення середньої, табл.5.4:

Таблиця 5.4

Співвідношення між середніми величинами

значення z

Співвідношення між середніми

Це співвідношення називається правилом мажорантності.

Структурні середні величини.Для характеристики структури сукупності застосовуються спеціальні показники, які можна назвати структурними середніми. До таких показників відносяться мода, медіана, квартілі та децилі.

Мода.Модою (Мо) називається найбільш часто зустрічається значення ознаки одиниць сукупності. Модою називається значення ознаки, яке відповідає максимальній точці теоретичної кривої розподілу.

Мода широко використовується в комерційній практиці щодо купівельного попиту(При визначенні розмірів одягу та взуття, які користуються широким попитом), реєстрації цін. Мод разом може бути кілька.

Розрахунок моди у дискретному ряду.У дискретному ряду мода – це варіанти із найбільшою частотою. Розглянемо знаходження моди у дискретному ряду.

Розрахунок моди в інтервальному рядку.У інтервальному варіаційному ряду модою приблизно вважають центральний варіант модального інтервалу, тобто. того інтервалу, що має найбільшу частоту (частина). У межах інтервалу треба знайти значення ознаки, яке є модою. Для інтервального ряду мода визначатиметься формулою

де – нижня межа модального інтервалу; - Величина модального інтервалу; - Частота, що відповідає модальному інтервалу; - Частота, що передує модальному інтервалу; - Частота інтервалу, наступного за модальним.

Медіана.Медіаною () називається значення ознаки у середньої одиниці ранжованого ряду. Ранжований ряд - це ряд, у якого значення ознаки записані в порядку зростання або спадання. Або медіана це величина, яка поділяє чисельність упорядкованого варіаційного ряду на дві рівні частини: одна частина має значення варіюючого ознаки менші, ніж середній варіант, а інша – більші.

Щоб знайти медіану спочатку визначається її порядковий номер. Для цього при непарному числі одиниць до суми всіх частот додається одиниця і все поділяється на два. При парному числі одиниць медіана перебуває як значення ознаки в одиниці, порядковий номер визначається за загальною сумою частот, поділеної на два. Знаючи порядковий номер медіани, легко за накопиченими частотами знайти її значення.

Розрахунок медіани у дискретному ряду.За даними вибіркового обстеження одержано дані про розподіл сімей за кількістю дітей, табл. 5.5. Для визначення медіани спочатку визначимо її порядковий номер

У цих сім'ях кількість дітей дорівнює 2, отже = 2. Таким чином, у 50% сімей кількість дітей не перевищує 2.

-Частота накопичена, що передує медіанному інтервалу;

З одного боку, це дуже позитивна властивістьт.к. в цьому випадку враховується дія всіх причин, що впливають на всі одиниці сукупності, що вивчається. З іншого боку, навіть одне спостереження, що потрапило у вихідні дані випадково, може істотно спотворити уявлення про рівень розвитку ознаки, що вивчається, в аналізованої сукупності (особливо в коротких рядах).

Квартили та децилі.За аналогією зі знаходженням медіани в варіаційних рядах можна знайти значення ознаки у будь-якій по порядку одиниці ранжованого ряду. Так, зокрема, можна визначити значення ознаки в одиниць, що ділять ряд на 4 рівні частини, на 10 і т.п.

Квартили.Варіанти, які ділять ранжований ряд на чотири рівні частини, називають квартилями.

При цьому розрізняють: нижній (або перший) квартиль (Q1) – значення ознаки у одиниці ранжованого ряду, що розділяє сукупність у співвідношенні ¼ до ¾ і верхній (або третій) квартиль (Q3) – значення ознаки у одиниці ранжованого ряду, що ділить сукупність у співвідношенні ¾ до ¼.

– частоти квартильних інтервалів (нижнього та верхнього)

Інтервали, в яких містяться Q1 і Q3, визначають за накопиченими частотами (або частотами).

Децилі.Крім квартилів розраховують децилі - варіанти, що ділять ранжований ряд на 10 рівних частин.

Позначаються вони через D, перший дециль D1 ділить ряд у співвідношенні 1/10 та 9/10, другий D2 – 2/10 та 8/10 тощо. Обчислюються вони за тією ж схемою, що медіана і квартили.

І медіана, і квартілі, і децилі належать до так званих порядкових статистиків, під яким розуміють варіант, який займає певне порядкове місце у ранжованому ряду.

Варіаційні лави: визначення, види, основні характеристики. Методика розрахунку
моди, медіани, середньої арифметичної у медико-статистичних дослідженнях
(Показати на умовному прикладі).

Варіаційний ряд - це ряд числових значень досліджуваної ознаки, що відрізняються один від одного за своєю величиною і розташованих у певній послідовності (у висхідному або спадному порядку). Кожне числове значення ряду називають варіантом (V), а числа, що показують, як часто зустрічається та чи інша варіанта у складі даного рядуназивається частотою (р).

Загальна кількість випадків спостережень, у тому числі варіаційний ряд складається, позначають буквою n. Відмінність у значенні досліджуваних ознак називається варіацією. У разі якщо варіювальна ознака не має кількісної міри, варіацію називають якісною, а ряд розподілу – атрибутивним (наприклад, розподіл за результатом захворювання, станом здоров'я тощо).

Якщо ознака, що варіює, має кількісне вираження, таку варіацію називають кількісною, а ряд розподілу - варіаційним.

Варіаційні ряди діляться на перервні і безперервні – за характером кількісної ознаки, прості та зважені – за частотою варіант.

У простому варіаційному ряду кожна варіанта зустрічається лише один раз (р = 1), у зваженому - одна й та ж варіанта зустрічається кілька разів (р> 1). Приклади таких рядів будуть розглянуті далі за текстом. Якщо кількісний ознака має безперервний характер, тобто. між цілими величинами є проміжні дробові величини, варіаційний ряд називається безперервним.

Наприклад: 10,0 – 11,9

14,0 - 15,9 і т.д.

Якщо кількісний ознака має перервний характер, тобто. окремі значення (варіанти) відрізняються один від одного на ціле число і не мають проміжних дробових значень, варіаційний ряд називають перервним або дискретним.

Використовуючи дані попереднього прикладу про частоту пульсу

у 21 студентів, збудуємо варіаційний ряд (табл. 1).

Таблиця 1

Розподіл студентів-медиків за частотою пульсу (уд/хв)

Отже, побудувати варіаційний ряд – означає числові значення (варіанти) систематизувати, упорядкувати, тобто. розташувати у певній послідовності (у висхідному або спадному порядку) з відповідними частотами. У прикладі варіанти розташовані у висхідному порядку і виражені у вигляді цілих перервних (дискретних) чисел, кожна варіанта зустрічається кілька разів, тобто. ми маємо справу з виваженим, перервним чи дискретним варіаційним рядом.

Як правило, якщо кількість спостережень у вивчається нами статистичної сукупності не перевищує 30, то достатньо всі значення ознаки, що вивчається, розмістити в варіаційному ряду в наростаючому, як у табл. 1, або спадному порядку.

При велику кількістьспостережень (n>30) кількість варіантів може бути дуже великим, в цьому випадку складається інтервальний або згрупований варіаційний ряд, в якому для спрощення подальшої обробки і з'ясування характеру розподілу варіанти об'єднані в групи.

Зазвичай число групових варіантів коливається від 8 до 15.

Їх має не менше 5, т.к. інакше це буде надто грубе, надмірне укрупнення, що спотворює загальну картину варіювання і дуже позначається на точності середніх величин. При числі групових варіант більше 20-25 збільшується точність обчислення середніх величин, але суттєво спотворюються особливості варіювання ознаки та ускладнюється математична обробка.

При складанні згрупованого ряду необхідно врахувати,

− групи варіант повинні розташовуватися в певному порядку (у висхідному або низхідному);

− інтервали у групах варіант мають бути однаковими;

− значення меж інтервалів нічого не винні збігатися, т.к. неясно буде, до яких груп відносити окремі варіанти;

− необхідно враховувати якісні особливостіматеріалу, що збирається при встановленні меж інтервалів (наприклад, при вивченні ваги дорослих людей інтервал 3-4 кг допустимо, а для дітей перших місяців життя він не повинен перевищувати 100 г)

Побудуємо згрупований (інтервальний) ряд, що характеризує дані про частоту пульсу (число ударів за хвилину) у 55 студентів-медиків перед іспитом: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Для побудови згрупованого ряду необхідно:

1. Визначити величину інтервалу;

2. Визначити середину, початок та кінець груп варіант варіаційного ряду.

● Розмір інтервалу (i) визначається за кількістю передбачуваних груп (r), кількість яких встановлюється залежно від числа спостережень (n) за спеціальною таблицею

Число груп в залежності від числа спостережень:

У нашому випадку, для 55 студентів можна скласти від 8 до 10 груп.

Розмір інтервалу (i) визначається за такою формулою –

i = V max-V min/r

У прикладі величина інтервалу дорівнює 82- 58/8= 3.

Якщо величина інтервалу є дробове числоотриманий результат слід округлити до цілого числа.

Розрізняють кілька видів середніх величин:

● середня арифметична,

● середня геометрична,

● середня гармонійна,

● середня квадратична,

● середня прогресивна,

● медіана

У медичної статистикинайчастіше користуються середніми арифметичними величинами.

Середня арифметична величина(М) є узагальнюючою величиною, що визначає те типове, що притаманно всієї сукупності. Основними способами розрахунку М є: середньоарифметичний спосіб та спосіб моментів (умовних відхилень).

Середньоарифметичний спосіб застосовується для обчислення середньої арифметичної простої та середньої арифметичної зваженої. Вибір методу розрахунку середньої арифметичної величини залежить від виду варіаційного ряду. У разі простого варіаційного ряду, в якому кожен варіант зустрічається лише один раз, визначається середня арифметична проста за формулою:

де: М - Середня арифметична величина;

V - значення варіює ознаки (варіанти);

Σ – вказує дію – підсумовування;

n – загальне числоспостережень.

Приклад розрахунку середньої арифметичної простий. Частота дихання (число дихальних рухів за хвилину) у 9 чоловіків віком 35 років: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Для визначення середнього рівня частоти дихання у чоловіків віком 35 років необхідно:

1. Побудувати варіаційний ряд, розташувавши всі варіанти у зростаючому чи спадному порядку Ми отримали простий варіаційний ряд, т.к. Значення варіант зустрічаються лише один раз.

M = ∑V/n = 171/9 = 19 дихальних рухів за хвилину

Висновок. Частота дихання у чоловіків віком 35 років у середньому дорівнює 19 дихальним рухам за хвилину.

Якщо окремі значення варіант повторюються, нема чого виписувати в лінію кожну варіанту, достатньо перерахувати розміри варіант (V), що зустрічаються, і поруч вказати число їх повторень (р). такий варіаційний ряд, у якому варіанти як би зважуються за кількістю відповідних їм частот, носить назву - зважений варіаційний ряд, а середня величина, що розраховується, - середньої арифметичної зваженої.

Середня арифметична зважена визначається за такою формулою: M= ∑Vp/n

де n – кількість спостережень, рівну сумічастот - Σр.

Приклад розрахунку середньої арифметичної зваженої.

Тривалість непрацездатності (в днях) у 35 хворих на гострі респіраторні захворювання (ГРЗ), які лікувалися у дільничного лікаря протягом I-го кварталу поточного року склала: 6, 7, 5, 3, 9, 8, 7, 5, 6, 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6, 7 днів .

Методика визначення середньої тривалості непрацездатності у хворих на ГРЗ наступна:

1. Побудуємо зважений варіаційний ряд, т.к. окремі значення варіанта повторюються кілька разів. Для цього можна розмістити всі варіанти у зростаючому або спадному порядку з відповідними частотами.

У нашому випадку варіанти розташовані у зростаючому порядку

2. Розрахуємо середню арифметичну виважену за формулою: M = ∑Vp/n = 233/35 = 6,7 днів

Розподіл хворих з ГРЗ за тривалістю непрацездатності:

Тривалість непрацездатності (V) Число хворих (p) Vp
∑p = n = 35 ∑Vp = 233

Висновок. Тривалість непрацездатності у хворих на гострі респіраторні захворювання склала в середньому 6,7 днів.

Мода (Мо) – варіанти, що найчастіше зустрічаються в варіаційному ряду. Для розподілу, представленого в таблиці, моді відповідає варіанта, що дорівнює 10, вона зустрічається частіше за інших - 6 разів.

Розподіл хворих за тривалістю перебування на лікарняному ліжку (в днях)

V
p

Іноді точну величину моди встановити важко, оскільки в даних може існувати кілька спостережень, що зустрічаються «найчастіше».

Медіана (Ме) - непараметричний показник, що ділить варіаційний ряд на дві рівні половини: в обидві сторони від медіани розташовується однакова кількість варіантів.

Наприклад, для розподілу, зазначеного в таблиці, медіана дорівнює 10 т.к. по обидві сторони цієї величини розташовується по 14 варіант, тобто. число 10 займає центральне положення у цьому ряду і є його медіаною.

Враховуючи, що кількість спостережень у цьому прикладі парна (n=34), медіану можна визначити таким чином:

Me = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Це означає, що середина ряду посідає сімнадцяту за рахунком варіанта, якій відповідає медіана, що дорівнює 10. Для розподілу, представленого в таблиці, середня арифметична дорівнює:

M = ∑Vp/n = 334/34 = 10,1

Отже, для 34 спостережень із табл. 8 ми отримали: Мо=10, Ме=10, середня арифметична (М) дорівнює 10,1. У нашому прикладі всі три показники виявилися рівними або близькими один до одного, хоча вони абсолютно різні.

Середня арифметична є результативною сумою всіх впливів, у формуванні її беруть участь усі без винятку варіанти, у тому числі й крайні, часто нетипові для даного явища чи сукупності.

Мода і медіана, на відміну від середньої арифметичної, не залежать від величини всіх індивідуальних значень ознаки, що варіює (значень крайніх варіант і ступеня розсіювання ряду). Середня арифметична характеризує всю масу спостережень, мода та медіана – основну масу

Варіаційний ряд - ряд, в якому зіставлені (за ступенем зростання або спадання) варіантита відповідні їм частоти

‚Варіанти – окремі кількісні вирази ознаки. Позначаються латинською літерою V . Класичне розуміння терміну "варіанту" передбачає, що варіантом називається кожне унікальне значення ознаки, без урахування кількості повторів.

Наприклад, у варіаційному ряді показників систолічного артеріального тиску, виміряного у десяти пацієнтів:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

варіантами є лише 6 значень:

110, 120, 130, 140, 160, 170.

Частота – число, що показує, скільки разів повторюється варіанта. Позначається латинською літерою P . Сума всіх частот (яка, зрозуміло, дорівнює числу всіх досліджуваних) позначається як n.

    У прикладі частоти прийматимуть такі значения:
  • для варіанти 110 частота Р = 1 (значення 110 зустрічається в одного пацієнта),
  • для варіанти 120 частота Р = 2 (значення 120 зустрічається у двох пацієнтів),
  • для варіанти 130 частота Р = 3 (значення 130 зустрічається у трьох пацієнтів),
  • для варіанти 140 частота Р = 2 (значення 140 зустрічається у двох пацієнтів),
  • для варіанти 160 частота Р = 1 (значення 160 зустрічається в одного пацієнта),
  • для варіанти 170 частота Р = 1 (значення 170 зустрічається в одного пацієнта),

Види варіаційних рядів:

  1. простий- це ряд, у якому кожна варіанта зустрічається лише з одного разу (всі частоти у своїй рівні 1);
  2. зважений- Ряд, в якому одна або кілька варіант зустрічаються неодноразово.

Варіаційний ряд служить для опису великих масивів чисел, саме у цій формі спочатку видаються зібрані дані більшості медичних досліджень. Для того, щоб охарактеризувати варіаційний ряд, розраховуються спеціальні показники, у тому числі середні величини, показники варіабельності (так званої дисперсії), показники репрезентативності вибіркових даних.

Показники варіаційного ряду

1) Середня арифметична - це узагальнюючий показник, що характеризує розмір ознаки, що вивчається. Середня арифметична позначається як M , являє собою найпоширеніший вид середньої. Середня арифметична розраховується як відношення суми значень показників всіх одиниць спостереження до всіх досліджуваних. Методика розрахунку середньої арифметичної відрізняється для простого та виваженого варіаційного ряду.

Формула для розрахунку простий середньої арифметичної:

Формула для розрахунку зваженої середньої арифметичної:

M = Σ(V * P) / n

2) Мода – ще одна середня величина варіаційного ряду, що відповідає найбільш часто повторюваному варіанті. Або, якщо висловитися інакше, це варіанта, якій відповідає максимальна частота. Позначається як Мо . Мода розраховується тільки для зважених рядів, тому що в простих рядах жодна з варіантів не повторюється і всі частоти рівні одиниці.

Наприклад, у варіаційному ряді значень частоти серцевих скорочень:

80, 84, 84, 86, 86, 86, 90, 94;

значення моди становить 86, оскільки ця варіанта зустрічається 3 разу, отже її частота - найбільша.

3) Медіана – значення варіанти, що ділить варіаційний ряд навпіл: по обидва боки від неї перебуває рівну кількість варіант. Медіана також, як і середня арифметична та мода, відноситься до середніх величин. Позначається як Me

4) Середнє квадратичне відхилення (синоніми: стандартне відхилення, сигмальне відхилення, сигма) - міра варіабельності варіаційного ряду. Є інтегральним показником, що поєднує усі випадки відхилення варіант від середньої. Фактично відповідає на запитання: наскільки далеко і як часто варіанти поширюються від середньої арифметичної. Позначається грецькою літерою σ ("сигма").

При чисельності сукупності понад 30 одиниць стандартне відхилення розраховується за такою формулою:

Для малих сукупностей – 30 одиниць спостереження та менше – стандартне відхилення розраховується за іншою формулою:

В результаті освоєння дайного розділу студент повинен: знати

  • показники варіації та їх взаємозв'язок;
  • основні закони розподілу ознак;
  • сутність критеріїв згоди; вміти
  • розраховувати показники варіації та критерії згоди;
  • визначати характеристики розподілу;
  • оцінювати основні числові характеристики статистичних рядіврозподілу;

володіти

  • методами статистичного аналізу рядів розподілу;
  • основами дисперсійного аналізу;
  • прийомами перевірки статистичних рядів розподілу відповідність основним законам розподілу.

Показники варіації

При статистичному дослідженні ознак різних статистичних сукупностей великий інтерес представляє вивчення варіації ознаки окремих статистичних одиниць сукупності, і навіть характеру розподілу одиниць за цією ознакою. Варіація -це відмінності індивідуальних значень ознаки в одиниць сукупності, що вивчається. Дослідження варіації має велике практичне значення. За рівнем варіації можна будувати висновки про межі варіації ознаки, однорідності сукупності за цією ознакою, типовості середньої, взаємозв'язку чинників, визначальних варіацію. Показники варіації використовуються для характеристики та впорядкування статистичних сукупностей.

Результати зведення та угруповання матеріалів статистичного спостереження, оформлені у вигляді статистичних рядів розподілу, являють собою впорядкований розподіл одиниць сукупності, що вивчається, на групи за групувальною (варіюючою) ознакою. Якщо за основу угруповання взято якісну ознаку, то такий ряд розподілу називають атрибутивним(Розподіл за професією, за статтю, за кольором і т.д.). Якщо ряд розподілу побудований за кількісною ознакою, то такий ряд називають варіаційним(розподіл за зростанням, вагою, за розміром заробітної платиі т.д.). Побудувати варіаційний ряд - отже впорядкувати кількісний розподіл одиниць сукупності за значеннями ознаки, підрахувати число одиниць сукупності із цими значеннями (частоту), результати оформити до таблиці.

Замість частоти варіанта можливе застосування її ставлення до загального обсягу спостережень, що називається частотою (відносною частотою).

Виділяють два види варіаційного ряду: дискретний та інтервальний. Дискретний ряд- це такий варіаційний ряд, основою побудови якого покладено ознаки з перервним зміною (дискретні ознаки). До останніх можна віднести кількість працівників на підприємстві, тарифний розряд, кількість дітей у сім'ї тощо. Дискретний варіаційний ряд представляє таблицю, що складається із двох граф. У першій графі вказується конкретне значення ознаки, тоді як у другий - число одиниць сукупності з певним значенням ознаки. Якщо ознака має безперервну зміну (розмір доходу, стаж роботи, вартість основних фондів підприємства тощо, які у певних межах можуть приймати будь-які значення), то для цієї ознаки можлива побудова інтервального варіаційного ряду.Таблиця під час побудови інтервального варіаційного ряду також має дві графи. У першій вказується значення ознаки в інтервалі від - до (варіанти), у другій - число одиниць, що входять в інтервал (частота). Частота (частота повторення) – число повторень окремого варіанта значень ознаки. Інтервали можуть бути закриті та відкриті. Закриті інтервали обмежені по обидва боки, тобто. мають межу як нижню («від»), і верхню («до»). Відкриті інтервали мають якусь одну межу: або верхню, або нижню. Якщо варіанти розташовані за зростанням або спаданням, то ряди називаються ранжованими.

Для варіаційних рядів існує два типи варіантів частотних характеристик: накопичена частота та накопичена частота. Накопичена частота показує, у скількох спостереженнях величина ознаки прийняла значення менше заданого. Накопичена частота визначається шляхом підсумовування значень частоти ознаки цієї групи з усіма частотами попередніх груп. Накопичена частина характеризує питома вагаодиниць спостереження, які мають значення ознаки не перевищують верхню межу дайної групи. Таким чином, накопичена частина показує питому вагу варіант у сукупності, що мають значення не більше даного. Частота, частота, абсолютна та відносна щільності, накопичені частота та частота є характеристиками величини варіанта.

Варіації ознаки статистичних одиниць сукупності, і навіть характер розподілу вивчаються з допомогою показників і показників варіаційного ряду, до яких ставляться середній рівень низки, середнє лінійне відхилення, середнє квадратичне відхилення, дисперсія, коефіцієнти осциляції, варіації, асиметрії, ексцесу та інших.

Для характеристики центру розподілу використовуються середні величини. Середня являє собою узагальнюючу статистичну характеристику, в якій отримує кількісне вираження типовий рівень ознаки, яким володіють члени сукупності, що вивчається. Однак можливі випадки збігу середніх арифметичних при різному характері розподілу, тому як статистичні характеристики варіаційних рядів розраховуються так звані структурні середні - мода, медіана, а також квантили, які ділять ряд розподілу на рівні частини (квартилі, децилі, перцентілі тощо). ).

Модаце значення ознаки, що зустрічається у ряді розподілу частіше, ніж інші його значення. Для дискретних рядів – це варіанти, що мають найбільшу частоту. В інтервальних варіаційних рядах з метою визначення моди необхідно визначити насамперед інтервал, в якому вона знаходиться, так званий модальний інтервал. У варіаційному ряду з рівними інтервалами модальний інтервал визначається за найбільшою частотою, в рядах з нерівними інтервалами - але найбільшої щільностірозподілу. Потім для визначення моди в рядах із рівними інтервалами застосовують формулу

де Мо – значення моди; х Мо - нижня межа модального інтервалу; h -ширина модального інтервалу; / Мо - частота модального інтервалу; / Mo j - частота домодального інтервалу; / Мо+1 - частота післямодального інтервалу, а для ряду з нерівними інтервалами в даній формулі розрахунку замість частот / Мо, / Мо, / Мо слід використовувати густини розподілу Розум 0 _| , Розум 0> Умо+"

Якщо є єдина мода, то розподіл ймовірностей випадкової величининазивається унімодальним; якщо є більш ніж одна мода, воно називається багатомодальним (полімодальним, мультимодальним), у разі двох мод – бімодальним. Як правило, багатомодальність вказує, що розподіл, що досліджується, не підпорядковується закону нормального розподілу. Для однорідних сукупностей, зазвичай, характерні одновершинні розподіли. Багатовершинність свідчить також про неоднорідність сукупності, що вивчається. Поява двох і більше вершин робить необхідним перегрупування даних з метою виділення однорідніших груп.

В інтервальному варіаційному ряді моду можна визначити графічно за допомогою гістограми. Для цього з верхніх точок найвищого стовпця гістограми до верхніх точок двох суміжних стовпців проводять дві лінії, що перетинаються. Потім із точки їх перетину опускають перпендикуляр на вісь абсцис. Значення ознаки на осі абсцис, що відповідає перпендикуляру, є модою. У багатьох випадках при характеристиці сукупності як узагальнений показник віддається перевагу моді, а не середній арифметичній.

Медіана -це центральне значення ознаки, ним має центральний член ранжованого ряду розподілу. У дискретних рядах, щоб знайти значення медіани, спочатку визначається її порядковий номер. Для цього при непарному числі одиниць до суми всіх частот додається одиниця, число поділяється на два. При парному числі одиниць у ряду буде дві медіані одиниці, тому в цьому випадку медіана визначається як середня із значень двох медіанних одиниць. Таким чином, медіаною дискретному варіаційному ряду є значення, яке ділить ряд на дві частини, що містять однакове число варіантів.

В інтервальних рядах після визначення порядкового номера медіани знаходиться медіальний інтервал за накопиченими частотами (частотами), а потім за допомогою формули розрахунку медіани визначається значення самої медіани:

де Me – значення медіани; х Ме -нижня межа медіанного інтервалу; h -ширина медіанного інтервалу; - Сума частот ряду розподілу; /Д - накопичена частота домедіанного інтервалу; / Ме – частота медіанного інтервалу.

Медіану можна знайти графічно за допомогою кумуляти. Для цього на шкалі накопичених частот (частин) кумуляти з точки, що відповідає порядковому номерумедіани, проводиться пряма, паралельна осі абсцис, до перетину з кумулятою. Далі з точки перетину зазначеної прямої з кумулятою опускається перпендикуляр на вісь абсцис. Значення ознаки на осі абсцис, що відповідає проведеній ординаті (перпендикуляру), є медіаною.

Медіана характеризується такими властивостями.

  • 1. Вона залежить від тих значень ознаки, які розташовані з обох боків від неї.
  • 2. Вона має властивість мінімальності, яка полягає в тому, що сума абсолютних відхилень значень ознаки від медіани є мінімальною величиною порівняно з відхиленням значень ознаки від будь-якої іншої величини.
  • 3. При об'єднанні двох розподілів із відомими медіанами неможливо заздалегідь передбачити величину медіани нового розподілу.

Ці властивості медіани широко використовуються при проектуванні розташування пунктів. масового обслуговування- шкіл, поліклінік, автозаправних станцій, водозабірні колонки і т.д. Наприклад, якщо у певному кварталі міста передбачається побудувати поліклініку, то розташувати її доцільніше у такій точці кварталу, яка ділить навпіл не довжину кварталу, а кількість жителів.

Співвідношення моди, медіани та середньої арифметичної вказує на характер розподілу ознаки в сукупності, що дозволяє оцінити симетричність розподілу. Якщо x Me має місце правостороння асиметрія ряду. При нормальному розподілі х - Me - Мо.

К. Пірсон на основі вирівнювання різних типівкривих визначив, що для помірно асиметричних розподілів справедливі такі наближені співвідношення між середньою арифметичною, медіаною та модою:

де Me – значення медіани; Мо – значення моди; х арифм - значення середньої арифметичної.

Якщо виникає необхідність вивчити структуру варіаційного ряду докладніше, то обчислюють значення ознаки, аналогічні медіані. Такі значення ознаки ділять усі одиниці розподілу на рівні чисельності, їх називають квантилями чи градієнтами. Квантилі поділяються на квартілі, децилі, перцентілі тощо.

Квартілі ділять сукупність чотирма рівні частини. Першу квартиль обчислюють аналогічно медіані за формулою розрахунку першої квартілі, попередньо визначивши перший квартальний інтервал:

де Qi – значення першої квартілі; x Q^-нижня межа першого квартильного інтервалу; h- Ширина першого квартального інтервалу; /, - Частоти інтервального ряду;

Накопичена частота в інтервалі, що передує першому квартільї інтервалу; Jq (- Частота першого квартильного інтервалу.

Перша квартиль показує, що 25% одиниць сукупності менше за її значення, а 75% - більше. Друга квартиль дорівнює медіані, тобто. Q 2 = Me.

За аналогією розраховують третю квартиль, попередньо знайшовши третій квартальний інтервал:

де – нижня межа третього квартильного інтервалу; h- Ширина третього квартильного інтервалу; /, - Частоти інтервального ряду; /X" -накопичена частота в інтервалі, що передує

г

третьому квартільйому інтервалу; Jq – частота третього квартильного інтервалу.

Третя квартиль показує, що 75% одиниць сукупності менше за її значення, а 25% - більше.

Різниця між третьою і першою квартилями є міжквартильний інтервал:

де Aq – значення міжквартильного інтервалу; Q 3 -значення третьої квартири; Q - значення першої квартілі.

Децилі ділять сукупність на 10 рівних частин. Дециль - це значення ознаки у ряді розподілу, якому відповідають десяті частки чисельності сукупності. За аналогією з квартилями перший дециль показує, що 10% одиниць сукупності менше його значення, а 90% - більше, а дев'ятий дециль виявляє, що 90% одиниць сукупності менше його значення, а 10% - більше. Співвідношення дев'ятого та першого децилей, тобто. децильний коефіцієнт, широко застосовується щодо диференціації доходів для виміру співвідношення рівнів доходів 10% найбільш забезпеченого і 10% найменш забезпеченого населення. Перцентілі ділять ранжовану сукупність на 100 рівних частин. Розрахунок, значення та застосування перцентилів аналогічні децилям.

Квартили, децилі та інші структурні характеристикиможна визначити графічно за аналогією з медіаною за допомогою кумуляти.

Для виміру розміру варіації використовуються наступні показники: розмах варіації, середнє лінійне відхилення, середнє квадратичне відхилення, дисперсія. Розмір розмаху варіації цілком залежить від випадковості розподілу крайніх членів низки. Цей показник становить інтерес у випадках, коли важливо знати, яка амплітуда коливань значень ознаки:

де R -значення розмаху варіації; х тах – максимальне значення ознаки; х тт -мінімальне значення ознаки.

При розрахунку розмаху варіації значення переважної більшості членів низки не враховується, тоді як варіація пов'язані з кожним значенням члена ряду. Цього недоліку позбавлені показники, що є середніми, отриманими з відхилень індивідуальних значень ознаки від їх середньої величини: середнє лінійне відхилення та середнє квадратичне відхилення. Між індивідуальними відхиленнями від середньої та коливання конкретної ознаки існує пряма залежність. Чим сильніша коливання, тим більші абсолютні розміри відхилень від середньої.

Середнє лінійне відхилення є середню арифметичну з абсолютних величин відхилень окремих варіантів від їх середньої величини.

Середнє лінійне відхилення для несгрупованих даних

де / пр – значення середнього лінійного відхилення; х, - значення ознаки; х - п -кількість одиниць сукупності.

Середнє лінійне відхилення згрупованого ряду

де / вз – значення середнього лінійного відхилення; х - значення ознаки; х -середнє значення ознаки для досліджуваної сукупності; / - Число одиниць сукупності в окремій групі.

Знаки відхилень у даному випадкуігноруються, інакше сума всіх відхилень дорівнюватиме нулю. Середнє лінійне відхилення залежно від угруповання аналізованих даних розраховується за різним формулам: для згрупованих та негрунірованих даних. Середнє лінійне відхилення в силу його умовності окремо від інших показників варіації застосовується практично порівняно рідко (зокрема, для характеристики виконання договірних зобов'язань щодо рівномірності поставки; в аналізі обороту зовнішньої торгівлі, складу працюючих, ритмічності виробництва, якості продукції з урахуванням технологічних особливостейвиробництва тощо).

Середнє квадратичне відхилення характеризує, наскільки в середньому відхиляються індивідуальні значення ознаки, що вивчається від середнього значення за сукупністю, і виражається в одиницях вимірювання ознаки, що вивчається. Середнє квадратичне відхилення, будучи однією з основних заходів варіації, широко використовується в оцінці меж варіації ознаки в однорідної сукупності, щодо значень ординат кривої нормального розподілу, соціальній та розрахунках, що з організацією вибіркового спостереження і встановленням точності вибіркових характеристик. Середнє квадратичне відхилення але необгрунтованим даним обчислюється за наступним алгоритмом: кожне відхилення від середньої зводиться в квадрат, всі квадрати підсумовуються, після чого сума квадратів ділиться на число членів ряду і з приватного витягується квадратний корінь:

де a Iip – значення середнього квадратичного відхилення; Xj -значення ознаки; х- Середнє значення ознаки для досліджуваної сукупності; п -кількість одиниць сукупності.

Для згрупованих аналізованих даних середнє відхилення даних розраховується за зваженою формулою

де - значення середнього квадратичного відхилення; Xj -значення ознаки; х -середнє значення ознаки для досліджуваної сукупності; f x -кількість одиниць сукупності в окремій групі.

Вираз під коренем в обох випадках зветься дисперсією. Таким чином, дисперсія обчислюється як середній квадрат відхилень значень ознаки їх середньої величини. Для незважених (простих) значень ознаки дисперсія визначається так:

Для зважених значень ознаки

Існує також спеціальний спрощений спосіб розрахунку дисперсії: у загальному вигляді

для невважених (простих) значень ознаки для зважених значень ознаки
з використанням методу відліку від умовного нуля

де а 2 – значення дисперсії; х, - значення ознаки; х -середнє значення ознаки, h -величина групового інтервалу, т 1 -ваги (А =

Дисперсія має самостійний вираз у статистиці і належить до найважливіших показників варіації. Вона вимірюється в одиницях, що відповідають квадрату одиниць вимірювання ознаки, що вивчається.

Дисперсія має такі властивості.

  • 1. Дисперсія постійної величини дорівнює нулю.
  • 2. Зменшення всіх значень ознаки на ту саму величину Л не змінює величини дисперсії. Це означає, що середній квадрат відхилень можна обчислити за заданими значеннями ознаки, а, по відхиленням їх від якогось постійного числа.
  • 3. Зменшення вєх значень ознаки kраз зменшує дисперсію в k 2 рази, а середнє квадратичне відхилення - у kразів, тобто. всі значення ознаки можна розділити якесь постійне число (скажімо, на величину інтервалу ряду), обчислити середнє квадратичне відхилення, та був помножити їх у постійне число.
  • 4. Якщо обчислити середній квадрат відхилень від будь-якої величини А утією чи іншою мірою відрізняється від середньої арифметичної, він завжди буде більше середнього квадрата відхилень, обчисленого від середньої арифметичної. Середній квадрат відхилень при цьому буде більшим на цілком певну величину - на квадрат різниці середньої і цієї умовно взятої величини.

Варіація альтернативної ознаки полягає в наявності або відсутності досліджуваної властивості одиниць сукупності. Кількісно варіація альтернативної ознаки виражається двома значеннями: наявність у одиниці досліджуваної властивості позначається одиницею (1), яке відсутність - нулем (0). Частку одиниць, які мають досліджувану властивість, позначають через Р, а частку одиниць, що не володіють цією властивістю, - через G.Таким чином, дисперсія альтернативної ознаки дорівнює добутку частки одиниць, що володіють даною властивістю (Р), на частку одиниць, що даною властивістю не мають (G).Найбільша варіація сукупності досягається у випадках, коли частина сукупності, що становить 50% від усього обсягу сукупності, має ознаку, а інша частина сукупності, також рівна 50%, не має даної ознаки, при цьому дисперсія досягає максимального значення, Що дорівнює 0,25, тобто. Р = 0,5, G = 1 - Р = 1 - 0,5 = 0,5 та про 2 = 0,5 0,5 = 0,25. Нижня межа цього показника дорівнює нулю, що відповідає ситуації, коли у сукупності відсутня варіація. Практичне застосування дисперсії альтернативної ознаки полягає у побудові довірчих інтервалівпід час проведення вибіркового спостереження.

Чим менше значеннядисперсії та середнього квадратичного відхилення, тим однорідніша сукупність і тим більш типовою буде середня величина. У практиці статистики часто виникає необхідність порівняння варіацій різних ознак. Наприклад, цікавим є порівняння варіацій віку робітників та їх кваліфікації, стажу роботи та розміру заробітної плати, собівартості та прибутку, стажу роботи та продуктивності праці тощо. Для таких зіставлень показники абсолютної коливань ознак непридатні: не можна порівнювати коливання стажу роботи, вираженого в роках, з варіацією заробітної плати, вираженої в рублях. Для здійснення таких порівнянь, а також порівнянь коливання однієї й тієї ж ознаки в кількох сукупностях з різними середніми арифметичними використовуються показники варіації - коефіцієнт осциляції, лінійний коефіцієнтваріації та коефіцієнт варіації, що показують міру коливань крайніх значень навколо середньої.

Коефіцієнт осциляції:

де V R -значення коефіцієнта осциляції; R- Значення розмаху варіації; х -

Лінійний коефіцієнт варіації.

де Vj -значення лінійного коефіцієнта варіації; I -значення середнього лінійного відхилення; х -середнє значення ознаки для сукупності, що вивчається.

Коефіцієнт варіації:

де V a -значення коефіцієнта варіації; а – значення середнього квадратичного відхилення; х -середнє значення ознаки для сукупності, що вивчається.

Коефіцієнт осциляції - це відсоткове відношення розмаху варіації до середнього значення ознаки, що досліджується, а лінійний коефіцієнт варіації - це відношення середнього лінійного відхилення до середнього значення досліджуваної ознаки, виражене у відсотках. Коефіцієнт варіації є відсоткове відношення середнього квадратичного відхилення до середнього значення досліджуваної ознаки. Як відносна величина, виражена у відсотках, коефіцієнт варіації застосовується для порівняння ступеня варіації різних ознак. З допомогою коефіцієнта варіації оцінюється однорідність статистичної сукупності. Якщо коефіцієнт варіації менше 33%, то досліджувана сукупність є однорідною, а варіація слабкою. Якщо коефіцієнт варіації більше 33%, то досліджувана сукупність є неоднорідною, варіація сильною, а середня величина – нетиповою і її не можна використовувати як узагальнюючий показник цієї сукупності. Крім того, коефіцієнти варіації використовуються для порівняння коливання однієї ознаки в різних сукупностях. Наприклад, з метою оцінки варіації стажу роботи працівників на двох підприємствах. Чим більше значення коефіцієнта, тим варіація ознаки суттєвіша.

На основі розрахованих квартилів є можливість розрахувати також відносний показникквартальної варіації за формулою

де Q 2 і

Міжквартильний розмах визначається за формулою

Квартильне відхилення застосовується замість розмаху варіації, щоб уникнути недоліків, пов'язаних із використанням крайніх значень:

Для нерівноінтервальпих варіаційних рядів розраховується також густина розподілу. Вона визначається як окреме від поділу відповідної частоти або частоти на величину інтервалу. У нерівноінтервальних рядах використовуються абсолютна та відносна щільності розподілу. Абсолютна щільність розподілу – це частота, що припадає на одиницю довжини інтервалу. Відносна густина розподілу - частота, що припадає на одиницю довжини інтервалу.

Все вищезазначене справедливо для розподілу, закон розподілу яких добре описується нормальним законом розподілу або близький до нього.

Статистичний ряд розподілу– це впорядкований розподіл одиниць сукупності на групи за певною ознакою, що варіює.
Залежно від ознаки, покладеної в основу утворення ряду розподілу, розрізняють атрибутивні та варіаційні ряди розподілу.

Наявність загальної ознаки є основою для утворення статистичної сукупності, яка є результатами опису або вимірювання загальних ознакоб'єктів дослідження.

Предметом вивчення в статистиці є ознаки, що змінюються (варіюють) або статистичні ознаками.

Види статистичних ознак.

Атрибутивними називають ряди розподілу, побудовані за якісними ознаками Атрибутивний- Це ознака, що має найменування, (наприклад професія: швачка, вчитель і т.д.).
Ряд розподілу прийнято оформляти як таблиць. У табл. 2.8 наведено атрибутивний ряд розподілу.
Таблиця 2.8 – Розподіл видів юридичної допомоги, наданої адвокатами громадянам одного з регіонів РФ.

Варіаційний ряд- Це значення ознаки (або інтервали значень) та їх частоти.
Варіаційними рядами називають ряди розподілу, побудовані за кількісною ознакою Будь-який варіаційний ряд складається з двох елементів: варіантів та частот.
Варіантами вважаються окремі значення ознаки, які він набуває в варіаційному ряду.
Частоти – це чисельності окремих варіантів чи кожної групи варіаційного низки, тобто. це числа, що показують, як часто зустрічаються ті чи інші варіанти у розподілі. Сума всіх частот визначає чисельність усієї сукупності, її обсяг.
Частинами називаються частоти, виражені у частках одиниці чи відсотках до результату. Відповідно сума частостей дорівнює 1 або 100%. Варіаційний ряд дозволяє за фактичними даними оцінити форму закону розподілу.

Залежно від характеру варіації ознаки розрізняють дискретні та інтервальні варіаційні ряди.
Приклад дискретного варіаційного ряду наведено у табл. 2.9.
Таблиця 2.9 - Розподіл сімей за кількістю кімнат в окремих квартирах в 1989 р. в РФ.

У першій колонці таблиці представлені варіанти дискретного варіаційного ряду, у другій – вміщено частоти варіаційного ряду, у третій – показники частоти.

Варіаційний ряд

У генеральної сукупностідосліджується деяка кількісна ознака. З неї випадково витягується вибірка обсягу n, тобто кількість елементів вибірки дорівнює n. На першому етапі статистичної обробки виробляють ранжуваннявибірки, тобто. упорядкування чисел x 1 , x 2 , …, x nза зростанням. Кожне значення, що спостерігається x iназивається варіантом. Частота m i- Це число спостережень значення x iу вибірці. Відносна частота (частина) w i- Це відношення частоти m iдо обсягу вибірки n: .
При вивченні варіаційного ряду також використовують поняття накопиченої частоти та накопиченої частоти. Нехай xкілька. Тоді кількість варіантів , значення яких менше xназивається накопиченою частотою: для x i nназивається накопиченою частиною w i max.
Ознака називається дискретно варіюється, якщо його окремі значення (варіанти) відрізняються один від одного на деяку кінцеву величину (зазвичай ціле число). Варіаційний ряд такої ознаки називається дискретним варіаційним рядом.

Таблиця 1. Загальний вигляд дискретного варіаційного ряду частот

Значення ознакиx i x 1 x 2 x n
Частотиm i m 1 m 2 m n

Ознака називається безперервно варіюючим, якщо його значення відрізняються один від одного на скільки завгодно малу величину, тобто. ознака може набувати будь-яких значень у певному інтервалі. Безперервний варіаційний ряд для такої ознаки називається інтервальною.

Таблиця 2. Загальний вигляд інтервального варіаційного ряду частот

Таблиця 3. Графічні зображення варіаційного ряду

РядПолігон чи гістограмаЕмпірична функція розподілу
Дискретний
Інтервальний
Переглядаючи результати проведених спостережень, визначають, скільки значень варіантів потрапило до кожного конкретного інтервалу. Передбачається, що кожному інтервалу належить один із його кінців: або у всіх випадках ліві (частіше), або у всіх випадках праві, а частоти чи частоти показують кількість варіантів, укладених у зазначених межах. Різниці a i – a i +1називаються частковими інтервалами. Для полегшення наступних розрахунків інтервальний варіаційний ряд можна замінити умовно дискретним. У цьому випадку середнє значення i-го інтервалу приймають за варіант x i, а відповідну інтервальну частоту m i- За частоту цього інтервалу.
Для графічного зображення варіаційних рядів найчастіше використовуються полігон, гістограма, крива кумулятивна і емпірична функція розподілу.

У табл. 2.3 (Угруповання населення Росії за розміром середньодушового доходу у квітні 1994р.) представлений інтервальний варіаційний ряд.
Зручно ряди розподілу аналізувати за допомогою графічного зображення, що дозволяє судити і про форму розподілу. Наочне уявлення про характер зміни частот варіаційного ряду дають полігон та гістограма.
Полігон використовується при зображенні дискретних варіаційних рядів.
Зобразимо, наприклад, графічно розподіл житлового фонду за типом квартир (табл. 2.10).
Таблиця 2.10 – Розподіл житлового фонду міського району за типом квартир (цифри умовні).


Мал. Полігон розподілу житлового фонду


На осі ординат можуть наноситися як значення частот, а й частостей варіаційного ряду.
Гістограма приймається для зображення інтервального варіаційного ряду. При побудові гістограми осі абсцис відкладаються величини інтервалів, а частоти зображуються прямокутниками, побудованими на відповідних інтервалах. Висота стовпчиків у разі рівних інтервалів має бути пропорційна частотам. Гістограма - графік, на якому ряд зображений у вигляді суміжних один з одним стовпчиків.
Зобразимо графічно інтервальний ряд розподілу, наведений у таблиці. 2.11.
Таблиця 2.11 – Розподіл сімей за розміром житлової площі, що припадає на одну особу (цифри умовні).
N п/п Групи сімей за розміром житлової площі, що припадає на одну особу Число сімей з цим розміром житлової площі Накопичена кількість сімей
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ВСЬОГО 115 ----


Мал. 2.2. Гістограма розподілу сімей за розміром житлової площі, що припадає на одну особу


Використовуючи дані накопиченого ряду (табл. 2.11), збудуємо кумуляту розподілу.


Мал. 2.3. Кумулята розподілу сімей за розміром житлової площі, що припадає на одну особу


Зображення варіаційного ряду у вигляді кумуляти є особливо ефективним для варіаційних рядів, частоти яких виражені в частках або відсотках до суми частот ряду.
Якщо при графічному зображенні варіаційного ряду у вигляді кумуляти осі поміняти, ми отримаємо огиву. На рис. 2.4 наведено огива, побудована на основі даних табл. 2.11.
Гістограма може бути перетворена на полігон розподілу, якщо знайти середини сторін прямокутників і потім ці точки з'єднати прямими лініями. Отриманий полігон розподілу зображено на рис. 2.2 пунктирною лінією.
При побудові гістограми розподілу варіаційного ряду з нерівними інтервалами по осі ординат наносять частоти, а щільність розподілу ознаки у відповідних інтервалах.
Щільність розподілу – це частота, розрахована одиницю ширини інтервалу, тобто. скільки одиниць у кожній групі посідає одиницю величини інтервалу. Приклад розрахунку густини розподілу представлений у табл. 2.12.
Таблиця 2.12 – Розподіл підприємств за кількістю зайнятих (цифри умовні)
N п/п Групи підприємств за кількістю зайнятих, чол. Число підприємств Розмір інтервалу, чол. Щільність розподілу
А 1 2 3=1/2
1 До 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ВСЬОГО 147 ---- ----

Для графічного зображення варіаційних рядів може також використовуватися кумулятивна крива. За допомогою кумуляти (кривий сум) зображується ряд накопичених частот. Накопичені частоти визначаються шляхом послідовно підсумовування частот за групами і показують, скільки одиниць сукупності мають значення ознаки не більше ніж розглянуте значення.


Мал. 2.4. Огива розподілу сімей за розміром житлової площі, що припадає на одну особу

При побудові кумуляти інтервального варіаційного ряду осі абсцис відкладаються варіанти ряду, а по осі ординат накопичені частоти.



Схожі статті

2024 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.