Варіаційні лави. Середні величини. стандартне відхилення. середня помилка середньої арифметичної. Статистичне розподілення вибірки. Основні характеристики варіаційного ряду

Статистичний рядрозподілу– це впорядкований розподіл одиниць сукупності на групи за певною ознакою, що варіює.
Залежно від ознаки, покладеної в основу утворення ряду розподілу, розрізняють атрибутивні та варіаційні ряди розподілу.

Наявність загальної ознаки є основою для утворення статистичної сукупності, яка є результатами опису або вимірювання загальних ознакоб'єктів дослідження.

Предметом вивчення в статистиці є ознаки, що змінюються (варіюють) або статистичні ознаками.

Види статистичних ознак.

Атрибутивними називають ряди розподілу, побудовані за якісними ознаками Атрибутивний- Це ознака, що має найменування, (наприклад професія: швачка, вчитель і т.д.).
Ряд розподілу прийнято оформляти як таблиць. У табл. 2.8 наведено атрибутивний ряд розподілу.
Таблиця 2.8 – Розподіл видів юридичної допомоги, наданої адвокатами громадянам одного з регіонів РФ.

Варіаційний ряд- Це значення ознаки (або інтервали значень) та їх частоти.
Варіаційними рядами називають ряди розподілу, побудовані за кількісною ознакою Будь-який варіаційний ряд складається з двох елементів: варіантів та частот.
Варіантами вважаються окремі значення ознаки, які він набуває в варіаційному ряду.
Частоти – це чисельності окремих варіантів чи кожної групи варіаційного ряду, тобто. це числа, що показують, як часто зустрічаються ті чи інші варіанти у розподілі. Сума всіх частот визначає чисельність усієї сукупності, її обсяг.
Частинами називаються частоти, виражені у частках одиниці чи відсотках до результату. Відповідно сума частостей дорівнює 1 або 100%. Варіаційний ряд дозволяє за фактичними даними оцінити форму закону розподілу.

Залежно від характеру варіації ознаки розрізняють дискретні та інтервальні варіаційні ряди.
Приклад дискретного варіаційного ряду наведено у табл. 2.9.
Таблиця 2.9 - Розподіл сімей за кількістю кімнат в окремих квартирах в 1989 р. в РФ.

У першій колонці таблиці представлені варіанти дискретного варіаційного ряду, у другій – вміщено частоти варіаційного ряду, у третій – показники частоти.

Варіаційний ряд

У генеральної сукупностідосліджується деяка кількісна ознака. З неї випадково витягується вибірка обсягу n, тобто кількість елементів вибірки дорівнює n. На першому етапі статистичної обробки виробляють ранжуваннявибірки, тобто. упорядкування чисел x 1 , x 2 , …, x nза зростанням. Кожне значення, що спостерігається x iназивається варіантом. Частота m i- Це число спостережень значення x iу вибірці. Відносна частота (частина) w i- Це відношення частоти m iдо обсягу вибірки n: .
При вивченні варіаційного ряду також використовують поняття накопиченої частоти та накопиченої частоти. Нехай xкілька. Тоді кількість варіантів , значення яких менше xназивається накопиченою частотою: для x i nназивається накопиченою частиною w i max.
Ознака називається дискретно варіюється, якщо його окремі значення (варіанти) відрізняються один від одного на деяку кінцеву величину (зазвичай ціле число). Варіаційний ряд такої ознаки називається дискретним варіаційним рядом.

Таблиця 1. Загальний вигляд дискретного варіаційного ряду частот

Значення ознакиx i x 1 x 2 x n
Частотиm i m 1 m 2 m n

Ознака називається безперервно варіюючим, якщо його значення відрізняються один від одного на скільки завгодно малу величину, тобто. ознака може набувати будь-яких значень у певному інтервалі. Безперервний варіаційний ряд для такої ознаки називається інтервальною.

Таблиця 2. Загальний вигляд інтервального варіаційного ряду частот

Таблиця 3. Графічні зображення варіаційного ряду

РядПолігон чи гістограмаЕмпірична функція розподілу
Дискретний
Інтервальний
Переглядаючи результати проведених спостережень, визначають, скільки значень варіантів потрапило до кожного конкретного інтервалу. Передбачається, що кожному інтервалу належить один із його кінців: або у всіх випадках ліві (частіше), або у всіх випадках праві, а частоти чи частоти показують кількість варіантів, укладених у зазначених межах. Різниці a i – a i +1називаються частковими інтервалами. Для полегшення наступних розрахунків інтервальний варіаційний ряд можна замінити умовно дискретним. У цьому випадку середнє значення i-го інтервалу приймають за варіант x i, а відповідну інтервальну частоту m i- За частоту цього інтервалу.
Для графічного зображення варіаційних рядів найчастіше використовуються полігон, гістограма, крива кумулятивна і емпірична функція розподілу.

У табл. 2.3 (Угруповання населення Росії за розміром середньодушового доходу у квітні 1994р.) представлений інтервальний варіаційний ряд.
Зручно ряди розподілу аналізувати за допомогою графічного зображення, що дозволяє судити і про форму розподілу. Наочне уявлення про характер зміни частот варіаційного ряду дають полігон та гістограма.
Полігон використовується при зображенні дискретних варіаційних рядів.
Зобразимо, наприклад, графічно розподіл житлового фонду за типом квартир (табл. 2.10).
Таблиця 2.10 – Розподіл житлового фонду міського району за типом квартир (цифри умовні).


Мал. Полігон розподілу житлового фонду


На осі ординат можуть наноситися як значення частот, а й частостей варіаційного ряду.
Гістограма приймається для зображення інтервального варіаційного ряду. При побудові гістограми осі абсцис відкладаються величини інтервалів, а частоти зображуються прямокутниками, побудованими на відповідних інтервалах. Висота стовпчиків у разі рівних інтервалів має бути пропорційна частотам. Гістограма - графік, на якому ряд зображений у вигляді суміжних один з одним стовпчиків.
Зобразимо графічно інтервальний ряд розподілу, наведений у таблиці. 2.11.
Таблиця 2.11 – Розподіл сімей за розміром житлової площі, що припадає на одну особу (цифри умовні).
N п/п Групи сімей за розміром житлової площі, що припадає на одну особу Число сімей з цим розміром житлової площі Накопичена кількість сімей
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ВСЬОГО 115 ----


Мал. 2.2. Гістограма розподілу сімей за розміром житлової площі, що припадає на одну особу


Використовуючи дані накопиченого ряду (табл. 2.11), збудуємо кумуляту розподілу.


Мал. 2.3. Кумулята розподілу сімей за розміром житлової площі, що припадає на одну особу


Зображення варіаційного ряду у вигляді кумуляти є особливо ефективним для варіаційних рядів, частоти яких виражені в частках або відсотках до суми частот ряду.
Якщо при графічному зображенні варіаційного ряду у вигляді кумуляти осі поміняти, ми отримаємо огиву. На рис. 2.4 наведено огива, побудована на основі даних табл. 2.11.
Гістограма може бути перетворена на полігон розподілу, якщо знайти середини сторін прямокутників і потім ці точки з'єднати прямими лініями. Отриманий полігон розподілу зображено на рис. 2.2 пунктирною лінією.
При побудові гістограми розподілу варіаційного ряду з нерівними інтервалами по осі ординат наносять частоти, а щільність розподілу ознаки у відповідних інтервалах.
Щільність розподілу – це частота, розрахована одиницю ширини інтервалу, тобто. скільки одиниць у кожній групі посідає одиницю величини інтервалу. Приклад розрахунку густини розподілу представлений у табл. 2.12.
Таблиця 2.12 – Розподіл підприємств за кількістю зайнятих (цифри умовні)
N п/п Групи підприємств за кількістю зайнятих, чол. Число підприємств Розмір інтервалу, чол. Щільність розподілу
А 1 2 3=1/2
1 До 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ВСЬОГО 147 ---- ----

Для графічного зображення варіаційних рядів може також використовуватися кумулятивна крива. За допомогою кумуляти (кривий сум) зображується ряд накопичених частот. Накопичені частоти визначаються шляхом послідовно підсумовування частот за групами і показують, скільки одиниць сукупності мають значення ознаки не більше ніж розглянуте значення.


Мал. 2.4. Огива розподілу сімей за розміром житлової площі, що припадає на одну особу

При побудові кумуляти інтервального варіаційного ряду осі абсцис відкладаються варіанти ряду, а по осі ординат накопичені частоти.

Ряди, збудовані за кількісною ознакою, називаються варіаційним.

Ряди розподілів складаються з варіантів(значень ознаки) та частот(Кількості груп). Частоти, виражені як відносних величин (часток, відсотків) називаються частостями. Сума всіх частот називається обсягом низки розподілів.

На вигляд ряди розподілу поділяються на дискретні(побудовані за перервними значеннями ознаки) та інтервальні(Побудовані на безперервних значеннях ознаки).

Варіаційний рядє дві колонки (або рядки); в одній з яких наводяться окремі значення варіює ознаки, іменовані варіантами і позначаються Х; а в іншій - абсолютні числа, що показують скільки разів (як часто) зустрічається кожен варіант. Показники другої колонки називаються частотами та умовно позначають через f. Ще раз зауважимо, що у другій колонці можуть використовуватись і відносні показники, що характеризують частку частоти окремих варіантів у загальній сумі частот. Ці відносні показники називаються частостями і умовно позначають через ω Сума всіх частостей у разі дорівнює одиниці. Однак частоти можна виражати і у відсотках, і тоді сума всіх частостей дає 100%.

Якщо варіанти варіаційного ряду виражені як дискретних величин, такий варіаційний ряд називають дискретним.

Для безперервних ознак варіаційні ряди будуються як інтервальнітобто значення ознаки в них виражаються «від ... до ...». У цьому мінімальні значення ознаки у такому інтервалі називають нижньої межею інтервалу, а максимальне – верхньою кордоном.

Інтервальні варіаційні ряди будують і для дискретних ознак, що варіюють у великому діапазоні. Інтервальні ряди можуть бути з рівнимиі нерівнимиінтервалами.

Розглянемо, як визначається величина рівних інтервалів. Введемо такі позначення:

i- Величина інтервалу;

- максимальне значення ознаки одиниць сукупності;

- Мінімальне значення ознаки у одиниць сукупності;

n –кількість груп, що виділяються.

якщо n відомо.

Якщо кількість груп, що виділяються, важко заздалегідь визначити, то для розрахунку оптимальної величини інтервалу при достатньому обсязі сукупності може бути рекомендована формула, запропонована Стерджесом в 1926 році:

n = 1+ 3.322 lg N, де N – число одиниць у сукупності.

Розмір нерівних інтервалів визначається кожному окремому разі з урахуванням особливостей об'єкта вивчення.

Статистичним розподілом вибіркиназивають перелік варіантів і відповідних їм частот (або відносних частот).

Статистичне розподіл вибірки можна задати як таблиці, у першій графі якої розташовуються варіанти, тоді як у другий - відповідні цим варіантам частоти ni, або відносні частоти Pi .

Статистичне розподілення вибірки

Інтервальними називаються варіаційні ряди, у яких значення ознак, покладених в основу їх утворення, виражені у певних межах (інтервалах). Частоти в цьому випадку відносяться не до окремих значень ознаки, а до всього інтервалу.

Інтервальні ряди розподілу будуються за безперервними кількісними ознаками, а також дискретними ознаками, що варіюють у значних межах.

Інтервальний ряд можна подати статистичним розподілом вибірки із зазначенням інтервалів та відповідних частот. При цьому як частота інтервалу приймають суму частот варіант, що потрапили в цей інтервал.

При угрупованні за кількісними безперервними ознаками важливе значення має визначення розміру інтервалу.

Крім вибіркової середньої та вибіркової дисперсії застосовуються інші характеристики варіаційного ряду.

Модоюназивають варіантом, який має найбільшу частоту.

Варіаційний ряд - це статистичний ряд, що показує розподіл досліджуваного явища за величиною будь-якої кількісної ознаки. Наприклад, хворих за віком, термінами лікування, новонароджених за вагою тощо.

Варіанту - окремі значення ознаки, за якою проводиться угруповання (позначається V ) .

Частота- число, що показує, як часто зустрічається та чи інша варіанта (позначається P ) . Сума всіх частот показує загальне число спостережень та позначається n . Різниця між найбільшою та найменшою варіантою варіаційного ряду називається розмахом чи амплітудою .

Розрізняють варіаційні ряди:

1. Перервні (дискретні) та безперервні.

Ряд вважається безперервним, якщо групувальна ознака може виражатися дробовими величинами (вага, зростання тощо), перервною, якщо групувальна ознака виражається лише цілим числом (дні непрацездатності, число ударів пульсу тощо).

2.Прості та зважені.

Простий варіаційний ряд є рядом, у якому кількісне значення варіюючого ознаки зустрічається один раз. У зваженому варіаційному ряду кількісні значення ознаки, що варіює, повторюються з певною частотою.

3. Згруповані (інтервальні) та несгруповані.

Згрупований ряд має варіанти, об'єднані групи, що об'єднують їх за величиною в межах певного інтервалу. У несгрупованому ряду кожної окремої варіанті відповідає певна частота.

4. Парні та непарні.

У парних варіаційних рядах сума частот або загальна кількість спостережень виражена парним числом, у непарних - непарним.

5. Симетричні та асиметричні.

У симетричному варіаційному ряду всі види середніх величин збігаються або дуже близькі (мода, медіана, арифметичне середнє).

Залежно від характеру досліджуваних явищ, від конкретних завдань та цілей статистичного дослідження, а також від змісту вихідного матеріалу у санітарній статистиці застосовуються такі види середніх величин:

структурні середні (мода, медіана);

середня арифметична;

середня гармонійна;

середня геометрична;

середня прогресивна.

Мода (М о ) - величина варіюючого ознаки, що найчастіше зустрічається у досліджуваної сукупності тобто. варіанта, що відповідає найбільшій частоті. Знаходять її безпосередньо за структурою варіаційного ряду, не вдаючись до будь-яких обчислень. Вона зазвичай є дуже близькою до середньої арифметичної і дуже зручна в практичній діяльності.

Медіана (М е ) - ділить варіаційний ряд (ранжований, тобто значення варіант розташовуються в порядку зростання або спадання) на дві рівні половини. Медіана обчислюється за допомогою так званого непарного ряду, який одержують шляхом послідовного підсумовування частот. Якщо сума частот відповідає парному числу, тоді за медіану умовно приймають середню арифметичну із двох середніх значень.

Мода і медіана застосовують у разі незамкнутої сукупності, тобто. коли найбільша чи найменша варіанти немає точної кількісної характеристики (наприклад, до 15 років, 50 і більше тощо.). У цьому випадку середню арифметичну (параметричні характеристики) не можна розрахувати.

Середня я арифметична - Найпоширеніша величина. Середня арифметична позначається частіше через М.

Розрізняють середню арифметичну просту та зважену.

Середня арифметична проста обчислюється:

― у тих випадках, коли сукупність представлена ​​простим переліком знань ознаки у кожної одиниці;

― якщо кількість повторень кожної варіанти немає можливості визначити;

― якщо числа повторень кожної варіанти близькі між собою.

Середня арифметична проста обчислюється за такою формулою:

де V – індивідуальні значення ознаки; n – число індивідуальних значень;
- Знак підсумовування.

Таким чином, проста середня являє собою відношення суми варіант до спостережень.

Приклад: визначити середню тривалість перебування на ліжку 10 хворих на пневмонію:

16 днів – 1 хворий; 17-1; 18-1; 19-1; 20-1; 21-1; 22-1; 23-1; 26-1; 31-1.

ліжко-дня.

Середня арифметична зважена обчислюється у випадках, коли індивідуальні значення ознаки повторюються. Її можна обчислювати двояким способом:

1. Безпосереднім (середньоарифметичним або прямим способом) за формулою:

,

де P - частота (кількість випадків) спостережень кожної варіанти.

Таким чином, середня арифметична зважена являє собою відношення суми творів варіант на частоти до спостережень.

2. За допомогою обчислення відхилень від умовної середньої (за способом моментів).

Основою для обчислення виваженої середньої арифметичної є:

― згрупований матеріал за варіантами кількісної ознаки;

― всі варіанти повинні розташовуватися в порядку зростання або зменшення величини ознаки (ранжований ряд).

Для обчислення способом моментів обов'язковою умовою є однаковий розмір всіх інтервалів.

За способом моментів середня арифметична обчислюється за формулою:

,

де М про - умовна середня, яку частіше приймають величину ознаки, відповідну найбільшої частоті, тобто. яка найчастіше повторюється (Мода).

i – величина інтервалу.

a - умовне відхилення від умов середньої, що є послідовним рядом чисел (1, 2 і т.д.) зі знаком + для варіант великих умовної середньої і зі знаком-(-1, -2 і т.д.) для варіант, які нижчі від умовної середньої. Умовне відхилення від варіанти, прийнятої за умовну середню дорівнює 0.

P – частоти.

- загальна кількість спостережень чи n.

Приклад: визначити середнє зростання хлопчиків 8 років у безпосередній спосіб (таблиця1).

Таблиця 1

Зростання в см

хлопчиків P

Центральна

варіанта V

Центральна варіанта - середина інтервалу - визначається як напів сума початкових значень двох сусідніх груп:

;
і т.д.

Добуток VP отримують шляхом множення центральних варіантів на частоти
;
і т.д. Потім отримані твори складають та отримують
, Яку ділять на число спостережень (100) і отримують середню арифметичну зважену.

див.

Це завдання вирішимо за способом моментів, навіщо складається наступна таблиця 2:

Таблиця 2

Зростання см (V)

хлопчиків P

n=100

Як М приймаємо 122, т.к. зі 100 спостережень у 33 чоловік зростання було 122см. Знаходимо умовні відхилення (a) від умовної середньої відповідно до вищесказаного. Потім отримуємо добуток умовних відхилень на частоти (aP) і підсумовуємо отримані величини (
). У підсумку вийде 17. Нарешті дані підставляємо у формулу:

При вивченні ознаки, що варіює, не можна обмежуватися тільки обчисленням середніх величин. Необхідно обчислювати і показники, що характеризують ступінь різноманітності ознак, що вивчаються. Величина тієї чи іншої кількісної ознаки неоднакова у всіх одиниць статистичної сукупності.

Характеристикою варіаційного ряду є середнє квадратичне відхилення ( ), яке показує розкид (розсіювання) досліджуваних ознак щодо середньої арифметичної, тобто. характеризує коливання варіаційного ряду. Воно може визначатися безпосереднім способом за такою формулою:

Середнє квадратичне відхилення дорівнює квадратному кореню із суми творів квадратів відхилень кожної варіанти від середньої арифметичної (V-M) 2 на свої частоти поділеної на суму частот (
).

Приклад обчислення: визначити середню кількість лікарняних листів, що видаються в поліклініці протягом дня (таблиця 3).

Таблиця 3

Число лікарняних

листів, виданих

лікарем за день (V)

Число лікарів (Р)

;

У знаменнику при числі спостережень менше 30 необхідно від
забирати одиницю.

Якщо ряд згрупований з рівними інтервалами, тоді можна визначити середнє відхилення за способом моментів:

,

де i – величина інтервалу;

- Умовне відхилення від умовної середньої;

P - частоти варіант відповідних інтервалів;

- загальна кількість спостережень.

Приклад обчислення : Визначити середню тривалість перебування хворих на терапевтичному ліжку (за способом моментів) (таблиця 4):

Таблиця 4

Число днів

перебування на ліжку (V)

хворих (Р)

;

Бельгійський статистик А. Кетле виявив, що варіації масових явищ підпорядковуються закону розподілу помилок, відкритому майже одночасно К. Гауссом та П. Лапласом. Крива, що відображає цей розподіл, має вигляд дзвону. За нормальним законом розподілу коливання індивідуальних значень ознаки знаходиться в межах
що охоплює 99,73% всіх одиниць сукупності.

Підраховано, що якщо до середньої арифметичної додати і забрати , то в межах отриманих величин знаходиться 95,45% всіх членів варіаційного ряду і, нарешті, якщо до середньої арифметичної додати і забрати , то в межах отриманих величин перебуватиме 68,27% всіх членів даного варіаційного ряду. У медицині з величиною
1пов'язане поняття норми. Відхилення від середньої арифметичної більше, ніж на 1 , але менше, ніж на 2 є субнормальним, а відхилення більше, ніж на 2 ненормальним (вище чи нижче за норму).

У санітарній статистиці правило трьох сигм застосовується щодо фізичного розвитку, оцінці діяльності закладів охорони здоров'я, оцінці здоров'я населення. Це правило широко застосовується у народному господарстві щодо стандартів.

Таким чином, середнє квадратичне відхилення служить для:

― вимірювання дисперсії варіаційного ряду;

― характеристики ступеня різноманітності ознак, що визначаються коефіцієнтом варіації:

Якщо коефіцієнт варіації більше 20% – сильна різноманітність, від 20 до 10% – середня, менше 10% – слабка різноманітність ознак. Коефіцієнт варіації певною мірою є критерієм надійності середньої арифметичної.

Метод угруповань дозволяє також виміряти варіацію(мінливість, коливання) ознак. При відносно малому числі одиниць сукупності варіація вимірюється з урахуванням ранжованого низки одиниць, що утворюють сукупність. Ряд називається ранжованим,якщо одиниці розташовані за зростанням (зменшенням) ознаки.

Однак ранжировані ряди досить малопоказові тоді, коли потрібна порівняльна характеристика варіації. Крім того, в багатьох випадках доводиться мати справу зі статистичними сукупностями, що складаються з великої кількості одиниць, які важко уявити у вигляді конкретного ряду. У зв'язку з цим для початкового загального ознайомлення зі статистичними даними і особливо полегшення вивчення варіації ознак досліджувані явища і процеси зазвичай поєднують у групи, а результати угруповання оформляють як групових таблиць.

Якщо груповий таблиці є лише дві графи - групи за виділеним ознакою (варіанти) і чисельності груп (частоти чи частоти), вона називається поряд розподілу.

Ряд розподілу -найпростіший різновид структурного угруповання за однією ознакою, відображена в груповій таблиці з двома графами, в яких містяться варіанти та частоти ознаки. У багатьох випадках з такого структурного угруповання, тобто. із складання рядів розподілу, починається вивчення вихідного статистичного матеріалу.

Структурне угруповання у вигляді ряду розподілу може бути перетворено на справжнє структурне угруповання, якщо виділені групи будуть охарактеризовані не тільки частотами, а й іншими статистичними показниками. Головне призначення рядів розподілу – вивчення варіації ознак. Теорію рядів розподілу детально розробляє математична статистика.

Ряди розподілу ділять на атрибутивні(угруповання за атрибутивними ознаками, наприклад розподіл населення за статтю, національністю, сімейним станом тощо) і варіаційні(Угруповання за кількісними ознаками).

Варіаційний рядявляє собою групову таблицю, яка містить дві графи: угруповання одиниць за однією кількісною ознакою та чисельність одиниць у кожній групі. Інтервали у варіаційному ряду утворюються зазвичай рівні та закриті. Варіаційним рядом є наступне угруповання населення Росії за величиною середньодушових грошових доходів (табл. 3.10).

Таблиця 3.10

Розподіл чисельності населення Росії за величиною середньодушових доходів у 2004-2009 роках.

Групи населення за величиною середньодушових грошових доходів, руб./міс.

Чисельність населення групи, в % до результату

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Понад 25 000,0

Все населення

Варіаційні ряди у свою чергу поділяються на дискретні та інтервальні. Дискретніваріаційні ряди поєднують варіанти дискретних ознак, що змінюються у вузьких межах. Прикладом дискретного варіаційного ряду може бути розподіл російських сімей за кількістю наявних дітей.

Інтервальніваріаційні ряди поєднують варіанти або безперервних ознак або змінюються в широких межах дискретних ознак. Інтервальним є варіаційний ряд розподілу населення Росії за величиною середньодушових грошових доходів.

Дискретні варіаційні ряди практично застосовуються не надто часто. Тим часом складання їх нескладно, оскільки склад груп визначається конкретними варіантами, якими реально мають досліджувані групувальні ознаки.

Найбільш поширені інтервальні варіаційні ряди. При їх складанні виникає складне питання кількості груп, а також про величину інтервалів, які повинні бути встановлені.

Принципи вирішення цього питання викладено у розділі про методологію побудови статистичних угруповань (див. параграф 3.3).

Варіаційні ряди являють собою засіб згортання або стиснення різноманітної інформації в компактну форму, за ними можна скласти досить чітке судження про характер варіації, вивчити відмінності ознак явищ, що входять досліджувану сукупність. Але найважливіше значення варіаційних рядів у тому, що у основі обчислюються особливі узагальнюючі характеристики варіації (див. главу 7).

Різні вибіркові значення назвемо варіантамиряду значень та позначимо: х 1 , х 2, …. Насамперед зробимо ранжуванняваріантів, тобто. розташування їх у порядку зростання чи спадання. До кожного варіанта вказується свою вагу, тобто. число, яке характеризує внесок цього варіанта у загальну сукупність. Як ваги виступають частоти або частоти.

Частотою n i варіанти х iназивається число, що показує скільки разів зустрічається даний варіант у аналізованій вибірковій сукупності.

Частотою чи відносною частотою w i варіанти х iназивається число, що дорівнює відношенню частоти варіанта до суми частот усіх варіантів. Частина показує, яка частина одиниць вибіркової сукупності має цей варіант.

Послідовність варіантів з відповідними їм вагами (частотами або частотами), записана в порядку зростання (або спадання), називається варіаційним рядом.

Варіаційні ряди бувають дискретними та інтервальними.

Для дискретного варіаційного ряду задаються точкові значення ознаки, для інтервального значення ознаки задаються у вигляді інтервалів. Варіаційні ряди можуть показувати розподіл частот чи відносних частот (частин), залежно від цього, яка величина вказується кожному за варіанта – частота чи частота.

Дискретний варіаційний ряд розподілу частотмає вигляд:

Частини знаходяться за формулою , i = 1, 2, …, m.

w 1 +w 2 + … + w m = 1.

приклад 4.1. Для цієї сукупності чисел

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

побудувати дискретні варіаційні ряди розподілу частот та частот.

Рішення . Обсяг сукупності дорівнює n= 10. Дискретний ряд розподілу частот має вигляд

Аналогічну форму запису мають інтервальні ряди.

Інтервальний варіаційний ряд розподілу частотзаписується у вигляді:

Сума всіх частот дорівнює загальній кількості спостережень, тобто. обсягу сукупності: n = n 1 +n 2 + … + n m.

Інтервальний варіаційний ряд розподілу відносних частот (частин)має вигляд:

Частина знаходиться за формулою , i = 1, 2, …, m.

Сума всіх частостей дорівнює одиниці: w 1 +w 2 + … + w m = 1.

Найчастіше практично застосовуються інтервальні ряди. Якщо статистичних вибіркових даних дуже багато і їх значення відрізняються один від одного на скільки завгодно малу величину, дискретний ряд для цих даних буде досить громіздким і незручним для подальшого дослідження. І тут застосовують угруповання даних, тобто. проміжок, що містить всі значення ознаки, розбивають на кілька часткових інтервалів і, підрахувавши частоту кожного інтервалу, отримують інтервальний ряд. Запишемо докладніше схему побудови інтервального ряду, припустивши, що довжини часткових інтервалів будуть однаковими.

2.2 Побудова інтервального ряду

Для побудови інтервального ряду необхідно:

Визначити кількість інтервалів;

Визначити довжину інтервалів;

Визначити розташування інтервалів на осі.

Для визначення числа інтервалів k існує формула Стерджеса, за якою

,

де n- Обсяг всієї сукупності.

Наприклад, якщо є 100 значень ознаки (варіант), рекомендується для побудови інтервального ряду взяти кількість інтервалів рівним інтервалам.

Однак дуже часто на практиці кількість інтервалів вибирає сам дослідник, враховуючи, що це число не повинно бути дуже великим, щоб ряд не був громіздким, але й не дуже маленьким, щоб не втратити деяких властивостей розподілу.

Довжина інтервалу h визначається за такою формулою:

,

де x max та x min - це відповідно найбільше і найменше значення варіантів.

Величину називають розмахомряду.

Для побудови самих інтервалів надходять по-різному. Один із найпростіших способів полягає в наступному. За початок першого інтервалу приймають величину
. Тоді інші межі інтервалів перебувають за такою формулою . Очевидно, що кінець останнього інтервалу a m+1 повинен задовольняти умову

Після того, як знайдено всі межі інтервалів, визначають частоти (або частоти) цих інтервалів. Для вирішення цього завдання переглядають всі варіанти і визначають число варіантів, що потрапили в той чи інший інтервал. Повну побудову інтервального ряду розглянемо з прикладу.

приклад 4.2. Для наступних статистичних даних, записаних у порядку зростання, побудувати інтервальний ряд із числом інтервалів, що дорівнює 5:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

Рішення. Усього n=50 значень варіантів.

Число інтервалів поставлено за умови завдання, тобто. k=5.

Довжина інтервалів дорівнює
.

Визначимо межі інтервалів:

a 1 = 11 − 8,5 = 2,5; a 2 = 2,5 + 17 = 19,5; a 3 = 19,5 + 17 = 36,5;

a 4 = 36,5 + 17 = 53,5; a 5 = 53,5 + 17 = 70,5; a 6 = 70,5 + 17 = 87,5;

a 7 = 87,5 +17 = 104,5.

Для визначення частоти інтервалів зважаємо на кількість варіантів, що потрапили в даний інтервал. Наприклад, перший інтервал від 2,5 до 19,5 потрапляють варіанти 11, 12, 12, 14, 14, 15. Їх число дорівнює 6, отже, частота першого інтервалу дорівнює n 1 =6. Частина першого інтервалу дорівнює . У другий інтервал від 19,5 до 36,5 потрапляють варіанти 21, 21, 22, 23, 25, число яких дорівнює 5. Отже, частота другого інтервалу дорівнює n 2 = 5, а частота . Знайшовши аналогічним чином частоти і частоти всім інтервалів, отримаємо такі інтервальні ряди.

Інтервальний ряд розподілу частот має вигляд:

Сума частот дорівнює 6+5+9+11+8+11=50.

Інтервальний ряд розподілу частостей має вигляд:

Сума частостей дорівнює 0,12+0,1+0,18+0,22+0,16+0,22=1. ■

При побудові інтервальних рядів, залежно від конкретних умов завдання, можуть застосовуватися й інші правила, а саме

1. Інтервальні варіаційні ряди можуть складатися з часткових інтервалів різної довжини. Нерівні довжини інтервалів дозволяють виділити властивості статистичної сукупності з нерівномірним розподілом ознаки. Наприклад, якщо межі інтервалів визначають чисельність мешканців у містах, то доцільно у цій задачі використовувати нерівні за довжиною інтервали. Очевидно, що для невеликих міст має значення і невелика різниця у числі жителів, а для великих міст різниця в десятки та сотні жителів не має суттєвого значення. Інтервальні ряди з нерівними довжинами часткових інтервалів досліджуються, переважно, у загальній теорії статистики та його розгляд виходить поза рамки даного посібника.

2. У математичній статистиці іноді розглядають інтервальні ряди, для яких лівий кордон першого інтервалу вважають рівним –∞, а правий кордон останнього інтервалу +∞. Це робиться для того, щоб наблизити статистичний розподіл до теоретичного.

3. При побудові інтервальних рядів може виявитися, що значення якогось варіанта збігається точно з межею інтервалу. Найкраще в цьому випадку вчинити так. Якщо такий збіг лише одне, то вважати, що аналізований варіант зі своєю частотою потрапив в інтервал, що знаходиться ближче до середини інтервального ряду, якщо таких варіантів кілька, то всі їх віднести до правих від цих варіант інтервалів, або всі - до лівих.

4. Після визначення числа інтервалів та їх довжини, розташування інтервалів можна робити і за іншим способом. Знаходять середнє арифметичне всіх розглянутих значень варіантів хпор. і будують перший інтервал таким чином, щоб це середнє вибіркове було б усередині якогось інтервалу. Таким чином, отримуємо інтервал від хпор. - 0,5 hдо хпор. + 0,5 h. Потім вліво і вправо, додаючи довжину інтервалу, будуємо інші інтервали доти, доки x min та x max не потраплять відповідно у перший та останній інтервали.

5. Інтервальні ряди за великої кількості інтервалів зручно записувати вертикально, тобто. інтервали записувати над першому рядку, а першому стовпці, а частоти (чи частоти) у другому стовпці.

Вибіркові дані можуть розглядатися як значення деякої випадкової величини Х. Випадкова величина має власний закон розподілу. З теорії ймовірностей відомо, що закон розподілу дискретної випадкової величини можна задати у вигляді ряду розподілу, а безперервної – за допомогою густини розподілу. Однак існує універсальний закон розподілу, який має місце і для дискретної і безперервної випадкових величин. Цей закон розподілу задається як функції розподілу F(x) = P(X<x). Для вибіркових даних можна зазначити аналог функції розподілу – емпіричну функцію розподілу.


Подібна інформація.


Схожі статті

2023 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.