Як скласти варіаційний ряд розподілу. Правила побудови дискретних та інтервальних рядів розподілу

Статистичний рядрозподілу– це впорядкований розподіл одиниць сукупності на групи за певною ознакою, що варіює.
Залежно від ознаки, покладеної в основу утворення ряду розподілу, розрізняють атрибутивні та варіаційні ряди розподілу.

Наявність загальної ознаки є основою для утворення статистичної сукупності, яка є результатами опису або вимірювання загальних ознакоб'єктів дослідження.

Предметом вивчення в статистиці є ознаки, що змінюються (варіюють) або статистичні ознаками.

Види статистичних ознак.

Атрибутивними називають ряди розподілу, побудовані за якісними ознаками Атрибутивний- Це ознака, що має найменування, (наприклад професія: швачка, вчитель і т.д.).
Ряд розподілу прийнято оформляти як таблиць. У табл. 2.8 наведено атрибутивний ряд розподілу.
Таблиця 2.8 – Розподіл видів юридичної допомоги, наданої адвокатами громадянам одного з регіонів РФ.

Варіаційний ряд - Це значення ознаки (або інтервали значень) та їх частоти.
Варіаційними рядами називають ряди розподілу, побудовані за кількісною ознакою Будь-який варіаційний ряд складається з двох елементів: варіантів та частот.
Варіантами вважаються окремі значення ознаки, які він набуває в варіаційному ряду.
Частоти – це чисельності окремих варіантів чи кожної групи варіаційного низки, тобто. це числа, що показують, як часто зустрічаються ті чи інші варіанти у розподілі. Сума всіх частот визначає чисельність усієї сукупності, її обсяг.
Частинами називаються частоти, виражені у частках одиниці чи відсотках до результату. Відповідно сума частостей дорівнює 1 або 100%. Варіаційний ряд дозволяє за фактичними даними оцінити форму закону розподілу.

Залежно від характеру варіації ознаки розрізняють дискретні та інтервальні варіаційні ряди.
Приклад дискретного варіаційного ряду наведено у табл. 2.9.
Таблиця 2.9 - Розподіл сімей за кількістю кімнат в окремих квартирах в 1989 р. в РФ.

У першій колонці таблиці представлені варіанти дискретного варіаційного ряду, у другій – вміщено частоти варіаційного ряду, у третій – показники частоти.

Варіаційний ряд

У генеральної сукупностідосліджується деяка кількісна ознака. З неї випадково витягується вибірка обсягу n, тобто кількість елементів вибірки дорівнює n. На першому етапі статистичної обробки виробляють ранжуваннявибірки, тобто. упорядкування чисел x 1 , x 2 , …, x nза зростанням. Кожне значення, що спостерігається x iназивається варіантом. Частота m i- Це число спостережень значення x iу вибірці. Відносна частота (частина) w i- Це відношення частоти m iдо обсягу вибірки n: .
При вивченні варіаційного ряду також використовують поняття накопиченої частоти та накопиченої частоти. Нехай xкілька. Тоді кількість варіантів , значення яких менше xназивається накопиченою частотою: для x i nназивається накопиченою частиною w i max.
Ознака називається дискретно варіюється, якщо його окремі значення (варіанти) відрізняються один від одного на деяку кінцеву величину (зазвичай ціле число). Варіаційний ряд такої ознаки називається дискретним варіаційним рядом.

Таблиця 1. Загальний вигляд дискретного варіаційного ряду частот

Значення ознакиx i x 1 x 2 x n
Частотиm i m 1 m 2 m n

Ознака називається безперервно варіюючим, якщо його значення відрізняються один від одного на скільки завгодно малу величину, тобто. ознака може набувати будь-яких значень у певному інтервалі. Безперервний варіаційний ряд для такої ознаки називається інтервальною.

Таблиця 2. Загальний вигляд інтервального варіаційного ряду частот

Таблиця 3. Графічні зображення варіаційного ряду

РядПолігон чи гістограмаЕмпірична функція розподілу
Дискретний
Інтервальний
Переглядаючи результати проведених спостережень, визначають, скільки значень варіантів потрапило до кожного конкретного інтервалу. Передбачається, що кожному інтервалу належить один із його кінців: або у всіх випадках ліві (частіше), або у всіх випадках праві, а частоти чи частоти показують кількість варіантів, укладених у зазначених межах. Різниці a i – a i +1називаються частковими інтервалами. Для полегшення наступних розрахунків інтервальний варіаційний ряд можна замінити умовно дискретним. У цьому випадку середнє значення i-го інтервалу приймають за варіант x i, а відповідну інтервальну частоту m i- За частоту цього інтервалу.
Для графічного зображення варіаційних рядів найчастіше використовуються полігон, гістограма, крива кумулятивна і емпірична функція розподілу.

У табл. 2.3 (Угруповання населення Росії за розміром середньодушового доходу у квітні 1994р.) представлений інтервальний варіаційний ряд.
Зручно ряди розподілу аналізувати за допомогою графічного зображення, що дозволяє судити і про форму розподілу. Наочне уявлення про характер зміни частот варіаційного ряду дають полігон та гістограма.
Полігон використовується при зображенні дискретних варіаційних рядів.
Зобразимо, наприклад, графічно розподіл житлового фонду за типом квартир (табл. 2.10).
Таблиця 2.10 – Розподіл житлового фонду міського району за типом квартир (цифри умовні).


Мал. Полігон розподілу житлового фонду


На осі ординат можуть наноситися як значення частот, а й частостей варіаційного ряду.
Гістограма приймається для зображення інтервального варіаційного ряду. При побудові гістограми осі абсцис відкладаються величини інтервалів, а частоти зображуються прямокутниками, побудованими на відповідних інтервалах. Висота стовпчиків у разі рівних інтервалів має бути пропорційна частотам. Гістограма - графік, на якому ряд зображений у вигляді суміжних один з одним стовпчиків.
Зобразимо графічно інтервальний ряд розподілу, наведений у таблиці. 2.11.
Таблиця 2.11 – Розподіл сімей за розміром житлової площі, що припадає на одну особу (цифри умовні).
N п/п Групи сімей за розміром житлової площі, що припадає на одну особу Число сімей з цим розміром житлової площі Накопичена кількість сімей
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ВСЬОГО 115 ----


Мал. 2.2. Гістограма розподілу сімей за розміром житлової площі, що припадає на одну особу


Використовуючи дані накопиченого ряду (табл. 2.11), збудуємо кумуляту розподілу.


Мал. 2.3. Кумулята розподілу сімей за розміром житлової площі, що припадає на одну особу


Зображення варіаційного ряду у вигляді кумуляти є особливо ефективним для варіаційних рядів, частоти яких виражені в частках або відсотках до суми частот ряду.
Якщо при графічному зображенні варіаційного ряду у вигляді кумуляти осі поміняти, ми отримаємо огиву. На рис. 2.4 наведено огива, побудована на основі даних табл. 2.11.
Гістограма може бути перетворена на полігон розподілу, якщо знайти середини сторін прямокутників і потім ці точки з'єднати прямими лініями. Отриманий полігон розподілу зображено на рис. 2.2 пунктирною лінією.
При побудові гістограми розподілу варіаційного ряду з нерівними інтервалами по осі ординат наносять частоти, а щільність розподілу ознаки у відповідних інтервалах.
Щільність розподілу – це частота, розрахована одиницю ширини інтервалу, тобто. скільки одиниць у кожній групі посідає одиницю величини інтервалу. Приклад розрахунку густини розподілу представлений у табл. 2.12.
Таблиця 2.12 – Розподіл підприємств за кількістю зайнятих (цифри умовні)
N п/п Групи підприємств за кількістю зайнятих, чол. Число підприємств Розмір інтервалу, чол. Щільність розподілу
А 1 2 3=1/2
1 До 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ВСЬОГО 147 ---- ----

Для графічного зображення варіаційних рядів може також використовуватися кумулятивна крива. За допомогою кумуляти (кривий сум) зображується ряд накопичених частот. Накопичені частоти визначаються шляхом послідовно підсумовування частот за групами і показують, скільки одиниць сукупності мають значення ознаки не більше ніж розглянуте значення.


Мал. 2.4. Огива розподілу сімей за розміром житлової площі, що припадає на одну особу

При побудові кумуляти інтервального варіаційного ряду осі абсцис відкладаються варіанти ряду, а по осі ординат накопичені частоти.

Ознаки, вивчені статистикою, варіюються (відрізняються друг від друга) в різних одиниць сукупності у той самий період чи час. Наприклад, величина зовнішньоторговельного обороту варіюється за підрозділами ФМС; величина експорту (імпорту) варіюється за напрямами експорту (за різними країнами-партнерами із зовнішньої торгівлі), за видами товарів тощо.

Причиною варіаціїІснують різні умови існування різних одиниць сукупності. Наприклад, безліч причин впливає на масштаби зовнішньої торгівлі різних країн світу.

Для управління та вивчення варіації статистикою розроблено спеціальні методи дослідження варіації, система показників, за допомогою якої варіація вимірюється, характеризуються її властивостями.

Першим етапом статистичного вивчення варіації є побудова ряду розподілу(або варіаційного ряду) – упорядкованого розподілу одиниць сукупності за зростаючим (частіше) чи з спадним (рідше) значенням ознаки і підрахунок числа одиниць із тим чи іншим значенням ознаки.

Існує 3 видуряду розподілу:

1) ранжований ряд– це перелік окремих одиниць сукупності у порядку зростання досліджуваної ознаки (наприклад, таблиця 11); якщо чисельність одиниць сукупності досить велика ранжований ряд стає громіздким, й у випадках ряд розподілу будується з допомогою групування одиниць сукупності за значеннями досліджуваного ознаки (якщо ознака приймає невелике число значень, то будується дискретний ряд, інакше – інтервальний ряд);

2) дискретний ряд- Це таблиця, що складається з двох стовпців (рядків) - конкретних значень варіює ознаки Xiта числа одиниць сукупності з даним значенням ознаки fi- Частот; число груп у дискретному ряду визначається числом реально існуючих значень ознаки, що варіює;

3) інтервальний ряд- Це таблиця, що складається з двох стовпців (рядків) - інтервалів варіює ознаки Xiі числа одиниць сукупності, які у цей інтервал (частот), чи часткою цього числа у кількості сукупностей (частин).

Побудуємо ряд розподілу зовнішньоторговельного обороту (ВО) за митними постами Росії, навіщо необхідно провести статистичне спостереження, тобто зібрати первинний статистичний матеріал, який є величину ВО з митних постах.

Результати спостереження ВО за 35 митними постами регіону за звітний період подаємо у вигляді ранжованого за зростанням величини ВО ряду розподілу (таблиця 11).

Таблиця 11. Зовнішньоторговельний оборот (ВО) за 35 митними постами, млн.дол.

№ поста

№ поста

№ поста

Визначимо середній розмір ВО за формулою (10), прийнявши за Xвеличину ВО, а за N- Чисельність постів:

= = 2100/35 = 60 (млн.дол.)

Дисперсію (про неї буде розказано трохи пізніше – на 4-му етапі аналізу варіації у цій темі) визначимо за формулою (28):

= = 445,778 (млн.дол.2)

Побудуємо інтервальний ряд розподілу ВО за митними постами, для чого необхідно вибрати оптимальну кількість груп (інтервалів ознаки) та встановити довжину (розмах) інтервалу. Оскільки при аналізі ряду розподілу порівнюють частоти різних інтервалах, необхідно, щоб довжина інтервалів була постійною . Оптимальне число груп вибирається так, щоб достатньою мірою відбилося різноманітність значень ознаки в сукупності і в той же час закономірність розподілу, його форма не спотворювалася випадковими коливаннями частот. Якщо груп буде замало, не виявиться закономірність варіації; якщо груп буде надмірно багато, випадкові стрибки частот спотворять форму розподілу.

Найчастіше число груп у ряді розподілу визначають за формулою Стерждесса (19) або (20):

(19) або ,(20)

де k- Число груп (округлюється до найближчого цілого числа); N- Чисельність сукупності.

З формули Стерджеса видно, що кількість груп – функція обсягу даних ( N).

Знаючи число груп, розраховують довжину (розмах) інтервалу за формулою (21):

,(21)

де Xмаx і X min - максимальне та мінімальне значення в сукупності.

У прикладі для ВО за формулою Стерждесса (19) визначимо число груп:

k = 1 + 3,322lg 35 = 1+ 3,322*1,544 = 6,129 ≈ 6.

Розрахуємо довжину (розмах) інтервалу за формулою (21):

h= (111,16 - 24,16) / 6 = 87 / 6 = 14,5 (млн.дол.).

Тепер збудуємо інтервальний ряд із 6 групами з інтервалом 14,5 млн.дол. (Див. перші 3 стовпці табл. 12).

Таблиця 12 Інтервальний рядрозподілу ВО з митних постів, млн.дол.

Групи постів за величиною ВО

Число постів

Середина інтервалу

Х i’ fi

Накопл. частота

| Хі- |fi

(Хi- )2 fi

(Хi- )3 fi

(Хi- )4 fi

96,66 – 111,16

Істотну допомогу в аналізі низки розподілу та її властивостей надає графічне зображення. Інтервальний ряд зображується стовпчиковою діаграмою, в якій основи стовпчиків, розташовані по осі абсцис, - це інтервали значень ознаки, що варіює, а висоти стовпчиків - частоти, що відповідають масштабу по осі ординат. Графічне зображення розподілу митних постів у вибірці за величиною ВО наведено на рис. 4. Діаграма такого типу називається гістограмою .

Мал. 4. Гістограма розподілу Мал. 5. Полігон розподілу

Дані таблиці. 12 та рис. 4 показують характерну для багатьох ознак форму розподілу: частіше зустрічаються значення середніх інтервалів ознаки, рідше крайні (малі та великі) значення ознаки. Форма цього розподілу близька до нормального закону розподілу, який утворюється, якщо на змінну, що варіює, впливає велика кількість факторів, жоден з яких не має переважаючого значення.

Якщо є дискретний ряд розподілу або використовуються середини інтервалів (як у нашому прикладі для ВО – у таблиці 12 у 4-му стовпці розраховані середини інтервалів як напівсума значень початку та кінця інтервалу), то графічне зображення такого ряду називається полігоном(див. рис. 5), яке виходить з'єднанням прямими точок з координатами Xiі fi.

Угруповання- Це розбиття сукупності на групи, однорідні за якоюсь ознакою.

Призначення сервісу. За допомогою онлайн-калькулятора Ви зможете:

  • побудувати варіаційний ряд, побудувати гістограму та полігон;
  • знайти показники варіації (середню, моду (зокрема і графічним способом), медіану, розмах варіації, квартили, децили, квартильний коефіцієнт диференціації, коефіцієнт варіації та інші показники);

Інструкція. Для групування ряду необхідно вибрати вид варіаційного ряду, що отримується (дискретний або інтервальний) і вказати кількість даних (кількість рядків). Отримане рішення зберігається у файлі Word (див. приклад угруповання статистичних даних).

Кількість вихідних даних
",0);">

Якщо угруповання вже здійснено та задані дискретний варіаційний рядабо інтервальний ряд, то необхідно скористатися онлайн-калькулятором Показники варіації. Перевірка гіпотези про вид розподілупроводиться за допомогою сервісу Вивчення форми розподілу.

Види статистичних угруповань

Варіаційний ряд. У разі спостережень дискретної випадкової величини те саме значення можна зустріти кілька разів. Такі значення x i випадкової величини записують із зазначенням n i числа разів його появи в n спостереженнях, і є частота даного значення.
У разі безперервної випадкової величини практично застосовують угруповання.
  1. Типологічне угруповання- Це поділ досліджуваної якісно різнорідної сукупності на класи, соціально-економічні типи, однорідні групи одиниць. Для побудови цього угруповання використовуйте параметр Дискретний варіаційний ряд.
  2. Структурним називається угруповання, в якій відбувається поділ однорідної сукупності на групи, що характеризують її структуру за якою-небудь ознакою, що варіює. Для побудови цього угруповання використовуйте параметр Інтервальний ряд.
  3. Угруповання, що виявляє взаємозв'язки між досліджуваними явищами та їх ознаками, називається аналітичним угрупованням(Див. аналітичне угруповання ряду).

Принципи побудови статистичних угруповань

Ряд спостережень, упорядкованих за зростанням, називається варіаційним рядом. Групувальною ознакоюназивається ознака, яким виробляється розбивка сукупності деякі групи. Його називають основою угруповання. В основі угруповання можуть бути покладені як кількісні, так і якісні ознаки.
Після визначення підстави угруповання слід вирішити питання кількості груп, куди треба розбити досліджувану сукупність.

У разі використання персональних комп'ютерів для обробки статистичних даних групування одиниць об'єкта здійснюється за допомогою стандартних процедур.
Одна з таких процедур базується на використанні формули Стерджесу для визначення оптимальної кількості груп:

k = 1+3,322*lg(N)

Де k – кількість груп, N – число одиниць сукупності.

Довжину часткових інтервалів обчислюють як h=(x max -x min)/k

Потім підраховують числа попадань спостережень у ці інтервали, які приймають за частоти n i . Нечисленні частоти, значення яких менше 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
В якості нових значень варіант беруть середини інтервалів x i = (c i-1 + c i) /2.

Дискретний варіаційний ряд будується для дискретних ознак.

Для того, щоб побудувати дискретний варіаційний ряд, потрібно виконати наступні дії: 1) упорядкувати одиниці спостереження за зростанням досліджуваного значення ознаки,

2) визначити всі можливі значення ознаки x i, упорядкувати їх за зростанням,

значенням ознаки, i .

частота значення ознаки і позначають f i . Сума всіх частот ряду дорівнює кількості елементів у сукупності, що вивчається.

Приклад 1 .

Список оцінок, отриманих студентами на іспитах: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

Тут число Х - Оцінкає дискретною випадковою величиноюа отриманий список оцінок -статистичні (спостерігаються) дані .

    упорядкувати одиниці спостереження щодо зростання досліджуваного значення ознаки:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) визначити всі можливі значення ознаки x i, упорядкувати їх за зростанням:

У цьому прикладі всі оцінки можна розділити чотирма групи з такими значеннями: 2; 3; 4; 5.

Значення випадкової величини, що відповідає окремій групі даних, що спостерігаються, називають значенням ознаки, варіантом (варіантою) і визначають x i .

Число, яке показує, скільки разів зустрічається відповідне значення ознаки в ряді спостережень називають частота значення ознаки і позначають f i .

Для нашого прикладу

оцінка 2 зустрічається - 8 разів,

оцінка 3 зустрічається - 12 разів,

оцінка 4 зустрічається - 23 рази,

оцінка 5 зустрічається – 17 разів.

Усього 60 оцінок.

4) записати отримані дані в таблицю з двох рядків (стовпців) - x i і f i.

З цих даних можна побудувати дискретний варіаційний ряд

Дискретний варіаційний ряд - це таблиця, в якій вказані значення, що вивчається ознаки як окремі значення за зростанням та їх частоти

  1. Побудова інтервального варіаційного ряду

Крім дискретного варіаційного ряду, часто зустрічається такий спосіб групування даних, як інтервальний варіаційний ряд.

Інтервальний ряд будується якщо:

    ознака має безперервний характер зміни;

    дискретних значень вийшло дуже багато (більше 10)

    частоти дискретних значень дуже малі (не перевищують 1-3 за відносно більшої кількості одиниць спостереження);

    багато дискретних значень ознаки з однаковими частотами.

Інтервальний варіаційний ряд – це спосіб угруповання даних як таблиці, що має дві графи (значення ознаки як інтервалу значень і частота кожного інтервалу).

На відміну від дискретного ряду значення ознаки інтервального ряду представлені окремими значеннями, а інтервалом значень («від - до»).

Число, яке показує, скільки одиниць спостереження потрапило до кожного виділеного інтервалу, називається частота значення ознаки і позначають f i . Сума всіх частот ряду дорівнює кількості елементів (одиниць спостереження) в сукупності, що вивчається.

Якщо одиниця має значення ознаки, що дорівнює величині верхньої межі інтервалу, то її слід відносити до наступного інтервалу.

Наприклад, дитина зі зростанням 100 см потрапить у другий інтервал, а не в перший; а дитина зі зростом 130 см потрапить в останній інтервал, а не в третій.

З цих даних можна побудувати інтервальний варіаційний ряд.

У кожного інтервалу є нижня межа (х н), верхня межа (х в) та ширина інтервалу ( i).

Кордон інтервалу – це значення ознаки, що лежить межі двох інтервалів.

зростання дітей (см)

зростання дітей (см)

кількість дітей

більше 130

Якщо інтервал має верхню і нижню межу, він називається закритий інтервал. Якщо інтервал має лише нижній або тільки верхній кордон, то це – відкритий інтервал.Відкритим може бути тільки перший або останній інтервал. У наведеному прикладі останній інтервал – відкритий.

Ширина інтервалу (i) - Різниця між верхнім і нижнім кордоном.

i = х н - х в

Ширина відкритого інтервалу приймається такою самою, як ширина сусіднього закритого інтервалу.

зростання дітей (см)

кількість дітей

Ширина інтервалу (i)

для розрахунків 130 +20 = 150

20 (бо ширина сусіднього закритого інтервалу – 20)

Усі інтервальні ряди поділяються на інтервальні ряди з рівними інтервалами та інтервальні ряди з нерівними інтервалами . У інтервальних рядах із рівними інтервалами ширина всіх інтервалів однакова. В інтервальних рядах із нерівними інтервалами ширина інтервалів різна.

У прикладі - інтервальний ряд з нерівними інтервалами.

Лабораторна робота №1. Первинна обробка статистичних даних

Побудова рядів розподілу

Упорядкований розподіл одиниць сукупності на групи за якоюсь однією ознакою називається поруч розподілу . При цьому ознака може бути як кількісною, тоді ряд називається варіаційним , так і якісним, тоді ряд називають атрибутивним . Так, наприклад, населення міста може бути розподілене за віковими групами в варіаційний ряд, або за професійною приналежністю до атрибутивного ряду (звісно, ​​можна запропонувати ще безліч якісних та кількісних ознак для побудови рядів розподілу, вибір ознаки визначається завданням статистичного дослідження).

Будь-який ряд розподілу характеризується двома елементами:

- варіанти(х i) - Це окремі значення ознаки одиниць вибіркової сукупності. Для варіаційного ряду варіанта набуває числові значення, для атрибутивного – якісні (наприклад, х = «державний службовець»);

- частота(n i) - Число, що показує, скільки разів зустрічається те чи інше значення ознаки. Якщо частота виражена відносним числом (тобто частиною елементів сукупності, відповідних даному значенню варіанти, у загальному обсязі сукупності), то вона називається відносною частотоюабо частістю.

Варіаційний ряд може бути:

- дискретним, коли досліджуваний ознака характеризується певним числом (зазвичай цілим).

- інтервальним, коли визначено межі «від» і «до» для безперервно варіюється ознаки. Інтервальний ряд також будують якщо безліч значень дискретно ознаки, що варіюється, велике.

Інтервальний ряд може будуватися як із інтервалами рівної довжини(Рівноінтервальний ряд) так і з неоднаковими інтервалами, якщо це диктується умовами статистичного дослідження. Наприклад, може розглядатися низка розподілу доходів населення з такими інтервалами:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



де k - Число інтервалів, n - обсяг вибірки. (Звичайно, формула зазвичай дає число дробове, а як число інтервалів вибирається найближче ціле до отриманого число.) Довжина інтервалу в такому випадку визначається за формулою

.

Графічно варіаційні ряди можуть бути подані у вигляді гістограми(Над кожним інтервалом інтервального ряду вибудовується «стовпчик» висоти, що відповідає частоті в цьому інтервалі), полігону розподілу(Ламана лінія, що з'єднує точки ( х i;n i) або кумуляти(Будується за накопиченими частотами, тобто для кожного значення ознаки береться частота появи в сукупності об'єктів зі значенням ознаки меншою від даного).

При роботі в Excel для побудови варіаційних рядів можуть бути використані такі функції:

РАХУНОК( масив даних) – визначення обсягу вибірки. Аргументом є діапазон осередків, у якому перебувають вибіркові дані.

ЗЛІЧИЛИ( діапазон; критерій) – може бути використана для побудови атрибутивного чи варіаційного ряду. Аргументами є діапазон масиву вибіркових значень ознаки та критерій – числове чи текстове значення ознаки чи номер комірки, де вона перебуває. Результатом є частота появи цього значення вибірці.

ЧАСТОТА( масив даних; масив інтервалів) – на побудову варіаційного ряду. Аргументами є діапазон масиву вибіркових даних та стовпець інтервалів. Якщо потрібно побудувати дискретний ряд, то вказуються значення варіанти, якщо інтервальний – то верхні межі інтервалів (їх ще називають «кишенями»). Оскільки результатом є стовпець частот, введення функції слід завершити натисканням клавіш CTRL+SHIFT+ENTER. Зауважимо, що задаючи масив інтервалів при введенні функції, останнє значення в ньому можна і не вказувати – у відповідну «кишеню» будуть поміщені всі значення, які не потрапили до попередніх «кишень». Іноді це допомагає уникнути помилки, яка полягає в тому, що найбільше вибіркове значення не поміщається автоматично в останню «кишеню»

Крім того, для складних угруповань (за декількома ознаками) використовують інструмент «зведені таблиці». Для побудови атрибутивних та варіаційних рядів їх також можна використовувати, але це надмірно ускладнює завдання. Також для побудови варіаційного ряду та гістограми існує процедура "гістограма" з надбудови "Пакет аналізу" (щоб використовувати надбудови в Excel, їх потрібно спочатку завантажити, за замовчуванням вони не встановлюються)

Проілюструємо процес первинної обробки даних на прикладах.

Приклад 1.1. є дані про кількісний склад 60 сімей.

Побудувати варіаційний ряд та полігон розподілу

Рішення.

Відкриємо таблиці Excel. Введемо масив даних діапазон А1:L5. Якщо Ви вивчаєте документ в електронній формі (у форматі Word, наприклад), для цього достатньо виділити таблицю з даними та скопіювати її в буфер, потім виділити комірку А1 та вставити дані – вони автоматично займуть відповідний діапазон. Підрахуємо обсяг вибірки n – число вибіркових даних, при цьому в осередок В7 введемо формулу =РАХУНОК(А1:L5). Зауважимо, що для того, щоб у формулу ввести потрібний діапазон, необов'язково вводити його позначення з клавіатури, достатньо його виділити. Визначимо мінімальне та максимальне значення у вибірці, ввівши в комірку В8 формулу = МІН (А1: L5), і в комірку В9: = МАКС (А1: L5).

Рис.1.1 Приклад 1. Первинна обробка статистичних даних у таблицях Excel

Далі, підготуємо таблицю для побудови варіаційного ряду, ввівши назви для стовпця інтервалів (значень варіанти) та стовпця частот. У стовпець інтервалів введемо значення ознаки від мінімальної (1) до максимальної (6), зайнявши діапазон В12: В17. Виділимо стовпець частот, введемо формулу = ЧАСТОТА (А1: L5; В12: В17) і натиснемо клавіші CTRL + SHIFT + ENTER

Рис.1.2 Приклад 1. Побудова варіаційного ряду

Для контролю обчислимо суму частот за допомогою функції СУМ (значок функції S у групі "Редагування" на вкладці "Головна"), обчислена сума повинна збігтися з раніше обчисленим обсягом вибірки в комірці В7.

Тепер побудуємо полігон: виділивши отриманий діапазон частот, виберемо команду Графік на вкладці Вставка. За замовчуванням значеннями на горизонтальній осі будуть порядкові числа - у разі від 1 до 6, що збігається зі значеннями варіанти (номерами тарифних розрядів).

Назва ряду діаграми "ряд 1" можна або змінити, скориставшись тією ж опцією "вибрати дані" вкладки "Конструктор", або просто видалити.

Рис.1.3. Приклад 1. Побудова полігону частот

Приклад 1.2. Є дані про викиди забруднюючих речовин із 50 джерел:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Скласти рівноінтервальний ряд, побудувати гістограму

Рішення

Внесемо масив даних у лист Excel, він займе діапазон А1: J5 Як і в попередній задачі, визначимо обсяг вибірки n, мінімальне та максимальне значення у вибірці. Оскільки тепер потрібно не дискретний, а інтервальний ряд, і кількість інтервалів у задачі не задано, обчислимо кількість інтервалів k за формулою Стерджесса. Для цього в комірку В10 введемо формулу = 1 +3,322 * LOG10 (B7).

Рис.1.4. Приклад 2. Побудова рівноінтервального ряду

Отримане значення не є цілим, воно дорівнює приблизно 6,64. Оскільки при k=7 довжина інтервалів виражатиметься цілим числом (на відміну від випадку k=6) виберемо k=7, ввівши це значення в комірку С10. Довжину інтервалу d обчислимо в осередку В11, ввівши формулу = (В9-В8)/С10.

Задамо масив інтервалів, вказуючи для кожного з 7 інтервалів верхню межу. Для цього в комірці Е8 обчислимо верхню межу першого інтервалу, ввівши формулу B8 + B11; у осередку Е9 верхню межу другого інтервалу, ввівши формулу =E8+B11. Для обчислення значень верхніх меж інтервалів, що залишилися, зафіксуємо номер комірки В11 у введеній формулі за допомогою знака $, так що формула в комірці Е9 набуде вигляду =E8+B$11, і скопіюємо вміст комірки Е9 в комірки Е10-Е14. Останнє отримане значення дорівнює обчисленому раніше в осередку В9 максимальному значенню у вибірці.

Рис.1.5. Приклад 2. Побудова рівноінтервального ряду


Тепер заповнимо масив "кишень" за допомогою функції ЧАСТОТА, як це було зроблено в прикладі 1.

Рис.1.6. Приклад 2. Побудова рівноінтервального ряду

По отриманому варіаційному ряду збудуємо гістограму: виділимо стовпець частот і виберемо на вкладці «Вставка» «Гістограма». Отримавши гістограму, змінимо в ній підписи горизонтальної осі на значення в діапазоні інтервалів, для цього виберемо опцію "Вибрати дані" вкладки "Конструктор". У вікні виберемо команду «Змінити» для розділу «Підписи горизонтальної осі» і введемо діапазон значень варіанти, виділивши його «мишею».

Рис.1.7. Приклад 2. Побудова гістограми

Рис.1.8. Приклад 2. Побудова гістограми



Схожі статті

2024 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.