Побудова варіаційного ряду. Види рядів. Ранжування даних. Поняття про варіаційні ряди. Ранжований ряд

Працюючи з даними часто виникає потреба з'ясувати, яке місце посідає у сукупному переліку за величиною той чи інший показник. У статистиці це називається ранжируванням. В Excel є інструменти, які дозволяють користувачам швидко і легко зробити цю процедуру. Давайте з'ясуємо, як ними користуватися.

Функції ранжирування

Для виконання ранжирування в Екселі передбачені спеціальні функції. У старих версіях програми був один оператор, призначений для вирішення цього завдання – РАНГ. З метою сумісності він залишений у окремої категоріїформул і в сучасних версіях програми, але в них все ж таки бажано працювати з новішими аналогами, якщо є така можливість. До них відносяться статистичні оператори РАНГ.РВ та РАНГ.СР. Про відмінності та алгоритм роботи з ними ми поговоримо далі.

Спосіб 1: функція РАНГ.РВ

Оператор РАНГ.РВ проводить обробку даних і виводить у вказану комірку порядковий номерзаданого аргументу із сукупного списку. Якщо кілька значень мають однаковий рівень, то оператор виводить вищий із переліку значень. Якщо, наприклад, два значення матимуть однакову величину, їм обом буде присвоєно другий номер, а вже наступне за величиною значення матиме четвертий. До речі, цілком аналогічно надходить і оператор РАНГ у більш старих версіях Екселю, так що дані функції можна вважати ідентичними.

Синтаксис цього оператора записується так:

Аргументи «число» та «посилання» є обов'язковими, а «порядок» – необов'язковим. Як аргумент «число» потрібно ввести посилання на ту комірку, де міститься значення, порядковий номер якого потрібно дізнатися. Аргумент "посилання" містить адресу всього діапазону, який ранжується. Аргумент «порядок» може мати два значення – «0» та «1». У першому випадку відлік порядку йде за спадною, а в другому – за зростаючою. Якщо цей аргумент не вказано, він автоматично вважається програмою рівним нулю.

Дану формулу можна записувати вручну, в ту комірку, де ви хочете, щоб виводився результат обробки, але для багатьох користувачів зручніше задавати вступні через вікно Майстра функцій.


Урок: Майстер функцій в Excel

Спосіб 2: функція РАНГ.

Другою функцією, яка здійснює операцію ранжирування в Екселі, є РАНГ.СР. На відміну від функцій РАНГ і РАНГ.РВ при збігу значень кількох елементів даний оператор видає середній рівень. Тобто, якщо два значення мають рівну величину і йдуть після значення під номером 1, їм обом буде присвоєний номер 2,5.

Синтаксис РАНГ.СР дуже нагадує схему попереднього оператора. Виглядає він так:

Формулу можна вводити вручну або через Майстер функцій. На останньому варіанті ми докладніше та зупинимося.

  1. Виробляємо виділення осередку на аркуші для виведення результату. Так само, як і в попередній раз, переходимо в Майстер функцій через кнопку «Вставити функцію».
  2. Після відкриття вікна Майстра функцій виділяємо в переліку категорії "Статистичні" найменування РАНГ.СР і тиснемо на кнопку "OK".
  3. Активується вікно аргументів. Аргументи у даного оператора такі самі, як і у функції РАНГ.РВ:
    • Число (адреса осередку містить елемент, рівень якого слід визначити);
    • Посилання (координати діапазону, ранжування всередині якого виконується);
    • Порядок (необов'язковий аргумент).

    Внесення даних у поля відбувається таким самим способом, як і в попереднього оператора. Після того, як всі налаштування виконані, натискаємо на кнопку «OK».

  4. Як бачимо, після виконаних дій результат розрахунку був виведений у комірку, зазначену у першому пункті даної інструкції. Сам результат є місцем, яке займає конкретне значення серед інших величин діапазону. На відміну від результату РАНГ.РВ, результат оператора РАНГ.СР може мати дробове значення.
  5. Як і у випадку з попередньою формулою, за допомогою зміни посилань з відносних на абсолютні та маркери виділення, шляхом автозаповнення можна проранжувати весь діапазон даних. Алгоритм дій такий самий.

Урок: Інші статистичні функції у Microsoft Excel

Урок: Як зробити автозаповнення в Ексель

Як бачимо, в Екселі існує дві функції для визначення ранжування конкретного значення в діапазоні даних: РАНГ.РВ та РАНГ.СР. Для старіших версій програми використовується оператор РАНГ, який, насправді, є повним аналогом функції РАНГ.РВ. Головна відмінність формул РАНГ.РВ і РАНГ.СР у тому, що з них вказує найвищий рівень при збігу значень, а друга виводить середній показник як десяткового дробу. Це єдина різниця між цими операторами, але його потрібно враховувати при виборі того, якою функцією користувачу краще скористатися.

Ми раді, що змогли допомогти Вам у вирішенні проблеми.

Задайте своє питання у коментарях, детально розписавши суть проблеми. Наші фахівці намагатимуться відповісти максимально швидко.

Чи допомогла вам ця стаття?

Навчимося ранжувати числові дані в Excelза допомогою стандартного сортування, а також функції РАНГ та її окремих випадках (РАНГ.РВ і РАНГ.СР), які допоможуть в автоматизації сортування.

Вітаю всіх, дорогі читачі блогу TutorExcel.Ru.

Завдання ранжирування числових даних постійно виникає у роботі з метою пошуку найбільших чи найменших значень у списку.
В Excel з цим завданням можна впоратися двома способами: стандартним інструментом сортуваннята за допомогою функцій.

Для прикладу візьмемо просту таблицю зі списком числових значень, в якій надалі ранжуватимемо дані:

Сортування даних

Почнемо з найпростішого та найдоступнішого варіанту - сортування.

Ми вже частково розбирали як можна структурувати дані за допомогою фільтра та сортування.
Коротко, для сортування необхідно виділити діапазон даних і на панелі вкладок вибрати Головна -> Редагування -> Сортування та фільтр, а далі вказати за яким критерієм потрібно зробити сортування.

В даному випадку оберемо Сортування за зменшенням, де значення будуть розташовані від більшого до меншого:


Мінусом цього способу є зміна структури вихідних даних, так як у процесі сортування даних рядки та стовпці можуть змінюватися місцями, що в деяких випадках незручно чи неможливо зробити.
Також до важливих вад цього варіанта можна віднести відсутність можливості автоматизувати сортування. Тому щоразу при зміні даних сортування доведеться робити ще раз.

Як розв'язання цієї проблеми розглянемо інший спосіб ранжирування, який можна розглядати і окремо від вирішення цього завдання.

Ранжування даних

За відсутності можливості зміни структури документа ми можемо створити додатковий ряд даних, де будуть порядкові номери вихідних даних.
Отримати ці порядкові номери нам допоможе функція РАНГ(а також РАНГ.РВі РАНГ.СР).

Функція РАНГ в Excel

Синтаксис та опис функції:

  • Число(обов'язковий аргумент) – число для якого обчислюється ранг;
  • Посилання(обов'язковий аргумент) - масив чи посилання масив чисел;
  • Порядок(Необов'язковий аргумент) – спосіб упорядкування. Якщо аргумент дорівнює 0 або не вказаний, то значення 1 присвоюється максимальному елементу в списку (умовно кажучи, сортуємо за спаданням), в іншому випадку значення 1 присвоюється мінімального елемента (сортуємо за зростанням).

Ця функція доступна у всіх версіях Excel, проте починаючи з Excel 2010 на її заміну додані РАНГ.РВі РАНГ.СР, а РАНГзалишена для сумісності з Excel 2007, давайте докладніше зупинимося на їхній роботі.

Функції РАНГ.РВ та РАНГ.СР в Excel

Синтаксис та опис функцій:

РАНГ.РВ(число; посилання;)
Повертає ранг числа у списку чисел: його порядковий номер щодо інших чисел у списку; якщо кілька значень мають однаковий ранг, повертається вищий ранг із цього набору значень.

Аргументи в усіх трьох функцій однакові, тобто. кардинально вони майже не відрізняються, є невелика різниця в деталях.
На прикладі вихідної таблиці подивимося як працює з даними кожна з функцій:


Як бачимо відмінність полягають лише тип ранжування збігаються елементів даних.

У випадку з РАНГ.РВрівним елементам присвоюється вищий ранг.
У нашому прикладі категоріям Ноутбукиі Мультиваркивідповідає однакове значення елемента - 710, який є 3 по порядку спадання, відповідно до обох значень присвоюється вищий ранг - 3.
Для РАНГ.СРтих самих значень встановлюється їхній середній ранг, тобто. середнє між 3 та 4 порядковими номерами - 3,5.

На цьому відмінності між ними закінчуються, тому, залежно від ваших завдань, можна використовувати ту чи іншу функцію.
Якщо потрібно відсортувати значення за зростанням, то як аргумент Порядокпотрібно вказати значення 1:

Автоматичне сортування

Трохи ускладнимо завдання і уявимо, що нам надалі потрібно скласти відсортовану таблицю, яка автоматично оновлювалася при зміні даних у вихідній таблиці.

Наприклад, це можна зробити за допомогою функції ВПР, або комбінації ІНДЕКС та ПОШУКПОЗ, однак у разі наявності однакових значень у списку ми не зможемо коректно підтягнути дані та отримаємо помилку:


У цьому випадку можна скористатися простим прийомому вигляді невеликої хитрості.
Додамо до кожного значення вихідної таблиці випадкові числа, що не збігаються, близькі до нуля, наприклад, я для цих цілей використовую функції РЯДКУ або СТБЛ, поділені на свідомо велику величину.

Цей крок дозволить нам отримати різні числа у вихідних даних, уникнути збігу рангів та помилки при підтягуванні даних:

Тепер для всіх елементів таблиці (навіть які збігаються) визначено свій індивідуальний ранг відмінний від інших, тому помилок при автоматичному ранжируванні даних вдасться уникнути.

Завантажити файл з прикладом.

Дякую за увагу!
Якщо у вас залишилися питання – пишіть у коментарях.

Успіхів вам і до швидких зустрічей на сторінках блогу TutorExcel.Ru!

Для ранжування даних у Excel застосовуються статистичні функції РАНГ, РАНГ.РВ, РАНГ.СР. Усі вони повертають номер числа у ранжованому списку числових значень. Розглянемо докладніше синтаксис, приклади.

Приклад функції РАНГ у Excel

Функція використовується під час ранжирування в переліку чисел. Тобто дозволяє дізнатися величину числа щодо інших числових значень. Якщо відсортувати список за зростанням, функція поверне позицію числа. Наприклад, у масиві чисел (30; 2; 26) число 2 матиме ранг 1; 26 -2; 30 -3 (як найбільше значенняу списку).

Синтаксис функції:

  1. Число. Для якого необхідно визначити номер у ранжируванні.
  2. Посилання. На масив чисел чи діапазон осередків із числовими значеннями. Якщо задати як аргумент просто числа, то функція поверне помилку. Нечисловим значенням номер не надається.
  3. Порядок. Спосіб упорядкування чисел у списку. Варіанти: аргумент дорівнює «0» чи опущений – значення 1 присвоюється максимальному числу у списку (начебто список відсортований гаразд зменшення); аргумент дорівнює будь-якому нерівному нулю числу – номер ранжирування 1 присвоюється мінімальному числу у списку (начебто список відсортований у порядку зростання).

Визначимо ранжування чисел у списку без повторів:

Аргумент, що визначає спосіб упорядкування чисел, дорівнює «0». Отже, у цій функції номери надавали значенням від більшого до меншого. Максимальному числу 87 надано номер 1.

У третьому стовпці наведено формулу з рангом зростання.

Визначимо номери значень у списку, де присутні значення, що повторюються.

Жовтим кольором виділені числа, що повторюються. Для них визначається той самий номер. Наприклад, числу 7 у другому стовпці надано номер 9 (і в другому рядку, і в дев'ятому); у третьому стовпці – 3. Але жодне з чисел у другому стовпці не матиме 10, а третьому – 4.

Щоб ранги не повторювалися (іноді це заважає користувачеві вирішити поставлене завдання), використовується така формула:

Для роботи функції можна встановити межі. Наприклад, необхідно ранжувати лише значення від 0 до 30. Щоб розв'язати задачу, застосуємо функцію ЯКЩО (=ЯКЩО(A2

Сірим кольором виділено значення, які відповідають заданій умові. Для чисел більше 30 виводиться порожній рядок.

Приклад функції РАНГ.РВ Excel

У версіях Excel з 2010 року з'явилася функція РАНГ.РВ. Це абсолютний аналог попередньої функції. Синтаксис такий самий. Літери «РВ» у назві вказують на те, що при виявленні формулою однакових значень функція поверне найвищий номер ранжирування (тобто першого виявленого елемента у переліку рівних).

Як видно з прикладу, дана функціяобробляє повторювані числа у списку так само, як і у звичайній формулі. Якщо потрібно уникнути повторень рангів, використовуємо іншу формулу (див. вище).

Приклад функції РАНГ.СР в Excel

Повертає номери числового значення у списку (порядковий номер щодо інших значень). Тобто виконує те саме завдання. Тільки за виявлення ідентичних значень повертає середній показник.

Ось результат роботи функції:

Формула в стовпці «за спаданням»: = РАНГ.СР (A2; $ A $ 2: $ A $ 9; 0). Так, функція значення 87 привласнила середній номер 1,5.

Припустимо, у списку чисел три значення, що повторюються (виділені помаранчевим кольором).

Функція надала кожному з них ранг 5, що є середнім для 4, 5 і 6.

Порівняємо роботу двох функцій:

Нагадаємо, що ці дві функції працюють лише в Excel 2010 та вище. У ранніх версіях цих цілей можна задіяти формулу масиву.

Завантажити приклади функції ранжування РАНГ у Excel.

Таким чином, усі вищенаведені приклади дозволяють автоматизувати роботу з ранжирування даних та складання рейтингу значень без застосування сортування.

Поняття зведення, угруповання, класифікації

Зведення- Систематизація та підбиття підсумків: метеозведення, зведення з полів. Зведення не дозволяє детально проаналізувати інформацію. Будь-яке зведення має спиратися на угруповання даних, тобто. спочатку угруповання, та був зведення даних.

Угруповання- Поділ сукупностей на ряд груп за найбільш суттєвими ознаками.

Розрізняють якісне та кількісне угруповання. Якісна- атрибутивна, кількісна- Варіаційна. У свою чергу варіаційна ділиться на структурну та аналітичну. . Структурнаугруповання передбачає розрахунок частки кожної групи. Приклад: для підприємства 80% - робітники, 20% - службовці, їх 5% - керівники, 3% - службовці,12% - фахівці. Ціль аналітичноїугруповання – виявити взаємозв'язок між ознаками: стажем роботи та середнім заробітком, стажем та виробленням та іншими.

Під час проведення угруповання необхідно:

Проведення всебічного аналізу природи явища, що вивчається;

Виявлення групувального ознаки (одного чи кількох);

Встановити межі груп таким чином, щоб групи суттєво відрізнялися один від одного, і в кожній групі об'єднувалися однорідні елементи.

За ступенем складності угруповання можуть бути прості та комбінаційні (за ознаками).

за вихідної інформаціїрозрізняють первинне та вторинне угруповання, первинназдійснюється на основі вихідних даних спостереження, вториннавикористовує дані первинного угруповання.

Кількість груп визначається за формулою Стерджеса:

де n- кількість груп, N- Генеральна сукупність.

Якщо використовуються рівні інтервали, то величина інтервалудорівнює .

Інтервалиможуть бути рівні та нерівні. Останні, у свою чергу, діляться на арифметичній або геометричній прогресії, що змінюються за законом. Перші та останні інтервали можуть бути відкриті або закриті. Закриті інтервали включають або не включають межі інтервалу.

Якщо інтервали закриті, і нічого не сказано про включення верхніх меж, то вважаємо, що верхні межі включені.

Якщо інтервали відкриті, то орієнтуємося на останній інтервал.

Ознака цих інтервалах може вимірюватися дискретно і безперервно (тобто. дробитися). При безперервній ознакі кордону стуляються 1 - 10, 10 - 20, 20 - 30; якщо ознака змінюється дискретно, можна використовувати наступний запис: 1 – 10, 11 – 20, 21 – 30.

Якщо інтервали відкриті, то величина останнього інтервалу дорівнює попередньому, а першого - другого.

Класифікація- Угруповання за якісною ознакою. Вона щодо стійка, стандартизована та затверджується органами державної статистики.


3.2. Ряди розподілу: види та основні характеристики

Під поряд розподілурозуміється ряд даних, що характеризують якесь соціально-економічне явище за однією ознакою. Це найпростіший виглядугруповання за двома ознаками.

Ряди розподілу поділяються на якісні та кількісні, на ранжировані та не ранжовані, на згруповані та не згруповані, з дискретним та безперервним розподіломознаки.

Прикладом не згрупованого, не ранжованого ряду із заробітної плати є відомість заробітної плати. У той же час, список працівників може бути ранжований за алфавітом або за табельними номерами. Приклад ранжованого ряду є список команд, рейтинг тенісистів.

Ранжований рядрозподілу - ряд даних, розташованих у порядку зменшення або зростання ознаки.

Для згрупованих ранжованих рядів виділяють такі характеристики: варіант, частоту або частоту, кумуляту і щільність розподілу.

Варіанту ()- Середнє інтервальне значення ознаки. Т.к. при створенні угруповання повинен виконуватися принцип рівномірного розподілу ознаки в кожному інтервалі, то варіант можна розраховувати як напівсуму меж інтервалів.

Частота() Показує скільки разів зустрічається дане значення ознаки. Відносне вираз частоти є Частота(.) , тобто. частку, питома вага від суми частот.

Кумулята() - Накопичена частота або частота, розрахунок наростаючим підсумком. Кумулятивно підраховуються обсяг, витрати, прибутки, тобто. результати діяльності.

Таблиця 1

Угруповання кредитних організацій, що діють
за величиною зареєстрованого статутного капіталу

2008 року в РФ

Першим етапом статистичного вивченняваріації є побудова варіаційного ряду - упорядкованого розподілу одиниць сукупності за зростаючим (частіше) чи з спадним (рідше) значенням ознаки і підрахунок числа одиниць із тим чи іншим значенням ознаки.

Існує три форми варіаційного ряду: ранжований ряд, дискретний ряд, інтервальний ряд. Варіаційний ряд часто називають поряд розподілу.Цей термін використовується щодо варіації як кількісних, і некількісних ознак. Ряд розподілу є структурне угруповання(Див. гл. 6).

Ранжований ряд -це перелік окремих одиниць сукупності у порядку зростання (зменшення) досліджуваного ознаки.

Прикладом ранжованого ряду може бути табл. 5.5.

Таблиця 5.5

Великі банки Санкт-Петербурга, ранжовані за розмірамивласного капіталу на 01.07.96

Якщо чисельність одиниць сукупності досить велика, ранжований ряд стає громіздким, яке побудова, навіть з допомогою ЕОМ, займає тривалий час. У разі варіаційний ряд будується з допомогою групування одиниць сукупності за значенням досліджуваного ознаки.

Якщо ознака набуває невеликої кількості значень, будується дискретний варіаційний ряд. Прикладом такого ряду є розподіл футбольних матчів за кількістю забитих м'ячів (табл. 5.1). Дискретний варіаційний рядце таблиця, що складається з двох рядків або граф: конкретних значень ознаки, що варіює хiта числа одиниць сукупності з даним значенням ознаки f iчастот (f - початкова літера англ. Слова frequency).

Визначення числа груп

Число груп у дискретному варіаційному ряду визначається числом реально існуючих значень ознаки, що варіює. Якщо ж ознака може набувати хоч і дискретних значень, але їх кількість дуже велика (наприклад, поголів'я худоби на 1 січня року в різних сільгосппідприємствах може становити від нуля до десятків тисяч голів), тоді будується інтервальний варіаційний ряд. Інтервальний варіаційний ряд будується і вивчення ознак, які можуть набувати будь-які, як цілі, і дробові, значення у сфері свого існування. Такі, наприклад, рентабельність реалізованої продукції, собівартість одиниці продукції, дохід на 1 жителя міста, частка осіб з вищою освітоюсеред населення різних територій та взагалі всі вторинні ознаки, значення яких розраховуються шляхом розподілу величини однієї первинної ознаки на величину іншої (див. гл. 3).

Інтервальний варіаційний рядявляє собою таблицю (що складається з двох граф (або рядків) - інтервалів ознаки, варіація якого вивчається, та числа одиниць сукупності, що потрапляють в даний інтервал (частот), або часткою цього числа від загальної чисельності сукупності (частин).

При побудові інтервального варіаційного ряду необхідно вибрати оптимальну кількість груп (інтервалів ознаки) та встановити довжину інтервалу. Оскільки при аналізі варіаційного ряду порівнюють частоти різних інтервалах, необхідно, щоб величина інтервалу була постійною. Оптимальне число груп вибирається так, щоб у достатній мірі відбилося різноманітність значень ознаки в сукупності і в той же час закономірність розподілу, його форма не спотворювалася випадковими коливаннями частот. Якщо груп буде замало, не виявиться закономірність варіації; якщо груп буде надмірно багато, випадкові стрибки частот спотворять форму розподілу.

Найчастіше кількість груп у варіаційному ряду встановлюють, дотримуючись формули, рекомендованої американським статистиком Стерджесом (Sturgess):

де k- Число груп; n- Чисельність сукупності.

Ця формула показує, що кількість груп – функція обсягу даних.

Припустимо, необхідно збудувати варіаційний ряд розподілу підприємств області за врожайністю зернових культур за якийсь рік. Число сільгосппідприємств, які мали посіви зернових культур, становило 143; найменше значення врожайності дорівнює 10,7 ц/га, найбільше – 53,1 ц/га. Маємо:

Оскільки число груп ціле, отже, рекомендується побудувати 8 чи 9 груп.

Визначення величини інтервалу

Знаючи число груп, розраховують величину інтервалу:

У прикладі величина інтервалу становить:

а) при 8 групах

б) при 9 групах

Для побудови ряду та аналізу варіації значно краще мати по можливості округлені значення величини інтервалу та його меж. Тому найкращим рішенням буде побудова варіаційного ряду з 9 групами з інтервалом 5 ц/га. Цей варіаційний ряд наведено у табл. 5.6, яке графічне зображення дано на рис. 5.1.

Межі інтервалів можуть вказуватись різним чином: верхня межа попереднього інтервалу повторює нижню межу наступного, як показано в табл. 5.6 або не повторює.

У разі другий інтервал буде позначений як 15,1-20, третій як 20,1-25 тощо., тобто. передбачається, що це значення врожайності обов'язково округлені до однієї десятої. Крім того, виникає небажане ускладнення з серединою інтервалу 15,1-20, яка, строго кажучи, вже дорівнюватиме не 17,5, а 17,55; відповідно при заміні округленого інтервалу 40-60 на 40,1-6,0 замість округленого значення його середини 50 отримаємо 50,5, Тому краще залишити інтервали з повторюваним округленим кордоном і домовитися, що одиниці сукупності, що мають значення ознаки, дорівнює межі інтервалу, включаються до того інтервалу, де це точне значення вперше вказується. Так, господарство, що має врожайність, що дорівнює 15 ц/га, включається до першої групи, значення 20 ц/га -у другу і т.д.

Рис. 5.1. Розподіл господарств за врожайністю

Таблиця 5.6

Розподіл господарств області з урожайності зернових культур

Групи господарств з урожайності,

ц/га хj

Число господарств

Середина інтервалу,

ц/га хj"

Накопичена частота f ’ j

Графічне зображення варіаційного ряду

Істотну допомогу в аналізі варіаційного ряду та його властивостей надає графічне зображення. Інтервальний рядзображується стовпчикової діаграмою, в якій основи стовпчиків, розташовані на осі абсцис, - це інтервали значень варіюючої ознаки, а висоти стовпчиків - частоти, - відповідні масштабу по осі ординат. Графічне зображення розподілу господарств області з урожайності зернових культур наведено на рис. 5.1. Діаграма цього роду часто називається гістограмою(Від грецького слова «гістос» - тканина, будова).

Дані таблиці. 5.5 та рис. 5.1 показують характерну для багатьох ознак форму розподілу: частіше зустрічаються значення середніх інтервалів ознаки, рідше крайні; малі та великі значення ознаки. Форма цього розподілу близька до закону, що розглядається в курсі математичної статистики. нормального розподілу. Великий російський математик А. М. Ляпунов (1857 - 1918) довів, що нормальний розподіл утворюється, якщо на змінну, що варіює, впливає велика кількість факторів, жоден з яких не має переважаючого впливу. Випадкове поєднання безлічі приблизно рівних факторів, що впливають на варіацію врожайності зернових культур, як природних, так і агротехнічних, економічних, створює близьке до нормального закону розподілу господарств області за врожайністю.

Якщо є дискретний варіаційний ряд або використовуються середини інтервалів, то графічне зображення такого варіаційного ряду називається полігоном(Від грец. Слова - багатокутник). Кожен із вас легко побудує цей графік, з'єднуючи прямими точками з координатами х,та /.

Відношення висоти полігону або діаграми до їхньої підстави рекомендується в пропорції приблизно 5:8.

Поняття частості

Якщо табл. 5.6 кількість господарств з тим чи іншим рівнем врожайності виразити у відсотках до результату, приймаючи все число господарств (143) за 100%, то середня врожайність може бути обчислена так:

де w- Частина 7-ї категорії варіаційного ряду;

Кумулятивний розподіл

Перетвореною формою варіаційного ряду є ряд накопичених частот,наведений у табл. 5.6, графа 5. Це ряд значень числа одиниць сукупності з меншими та рівними нижній межі відповідного інтервалу значеннями ознаки. Такий ряд називається кумулятивним.Можна побудувати кумулятивний розподіл не менше, ніж, а можна більше, ніж. У першому випадку графік кумулятивного розподілу називається кумулята,у другому - огивою(Рис. 5.2).

Щільність, розподіли

Якщо доводиться мати справу з варіаційним поруч із нерівними інтервалами, то для сумісності потрібно частоти чи частоти призвести до одиниці інтервалу. Отримане ставлення називається щільністю розподілу:

Щільність розподілу використовується як розрахунку узагальнюючих показників, так графічного зображення варіаційних рядів з нерівними інтервалами.

Рис. 5.2. Огива та кумулята розподілу за врожайністю

5.7. Структурні характеристики варіаційного ряду

Медіана розподілу

При вивченні варіації застосовують такі характеристики варіаційного ряду, які описують кількісно його структуру, будову. Така, наприклад, медіана-величина варіює ознаки, що ділить сукупність на дві рівні частини ~ зі значеннями ознаки менше медіани І зі значеннями ознаки більше медіани (третього банку з п'яти в табл. 5.5, тобто 196 млрд руб.).

Приклад табл. 5.5 видно принципову різницю між медіаною і середньої величиною. Медіана залежить від значень ознаки на краях ранжированного ряду. Якби навіть капітал найбільшого банку Санкт-Петербурга був удесятеро більшим, величина медіани не змінилася б. Тому часто медіану використовують як надійніший показник типового значення ознаки, ніж арифметична середня, якщо ряд значень неоднорідний, включає різкі відхилення від середньої. У даному рядусередня величина власного капіталу, що дорівнює 269 млрд руб., Склалася під великим впливом найбільшої варіанти. 80% банків мають капітал менший за середній і лише 20% - більше. Навряд чи таку середню вважатимуться типовою величиною. При парному числі одиниць сукупності за медійну приймають арифметичну середню величину двох центральних варіант, наприклад при десяти значеннях ознаки - середню з п'ятого і шостого значень в ранжированном ряду.

В інтервальному варіаційному ряду для знаходження медіани застосовується формула (5.14).

де Me – медіана;

х 0 -нижня межа інтервалу, в якому знаходиться медіана;

f M е-1 - накопичена частота в інтервалі, що передує медіанному;

f Me- Частота в медіанному інтервалі;

i- Величина інтервалу;

k - кількість груп.

У табл. 5,6 медіанним є середнє зі 143 значень, тобто. сімдесят-друге від початку низки значення врожайності. Як видно з низки накопичених частот, воно знаходиться у четвертому інтервалі. Тоді

При непарному числі одиниць сукупності номер медіани, як бачимо, дорівнює не , як у формулі (5.14), a , але це відмінність несуттєво і зазвичай ігнорується практично.

У дискретному варіаційному ряду медіаною слід вважати значення ознаки у тій групі, у якій накопичена частота;

перевищує половину чисельності сукупності. Наприклад, для даних табл. 5.1 медіаною числа забитих за гру м'ячів буде 2.

Квартили розподілу

Аналогічно медіани обчислюються значення ознаки, що ділять сукупність на чотири рівні за кількістю одиниць частини. Ці величини називаються квартилямиі позначаються великою латинською буквою Qз номером квартилю значок «підпис». Зрозуміло, що Q 2 збігається з Me. Для першого та третього квартилів наводимо формули та розрахунок за даними табл. 5.6.

Так як Q 2 = Me = 29,5 ц/га, видно, що різницю між першим квартилем і медіаною менше, ніж між медіаною і третім квартилем. Цей факт свідчить про наявність деякої несиметричності у середній галузі розподілу, що помітно і рис. 5.1.

Значення ознаки, що ділять ряд на п'ять рівних частин, називають квінтилями,на десять частин - децилями,на сто частин - перцентилями.Оскільки ці характеристики застосовуються лише за необхідності докладного вивчення структури варіаційного ряду, наводити їх формули та розрахунок не будемо.

Мода розподілу

Безперечно, важливе значення має така величина ознаки, яка зустрічається в ряді, що вивчається, в сукупності найчастіше. Таку величину прийнято називати модоюта позначати Мо. У дискретному рядумода визначається без обчислення значення ознаки з найбільшою частотою. Наприклад, за даними табл. 5.1 найчастіше за футбольний матч було забито 2 м'ячі – 71 раз. Модою є число 2. Зазвичай трапляються ряди з одним модальним значенням ознаки. Якщо два або кілька рівних (і навіть кілька різних, але більших, ніж сусідні) значень ознаки є в варіаційному ряду, він вважається відповідно бімодальним (верблюдоподібним) або мультимодальним. Це говорить про неоднорідність сукупності, можливо, що представляє собою агрегат кількох сукупностей з різними модами.

Так і в натовпі туристів, які приїхали з різних країн, замість однієї, яка переважає серед місцевих жителів модного одягуможна зустріти суміш різних "мод", прийнятих у різних народів світу.

В інтервальному варіаційному ряду, тим більше при безперервній варіації ознаки, строго кажучи, кожне значення ознаки зустрічається лише один раз. Модальним інтервалом є інтервал із максимальною частотою.. Усередині цього інтервалу знаходять умовне значення ознаки, поблизу якого щільність розподілу, тобто. число одиниць сукупності, що припадає на одиницю виміру ознаки, що варіює, досягає максимуму. Це умовне значення і вважається точковою модою.Логічно припустити, що така точкова мода розташовується ближче до тієї межі інтервалу, за якою частота в сусідньому інтервалі більше частоти в інтервалі за іншою межею модального інтервалу. Звідси маємо зазвичай застосовувану формулу (5.15):

де x 0 - нижня межа модального інтервалу;

f Mo - частота в модальному інтервалі;

f Mo -1 - Частота в попередньому інтервалі;

f Mo +1 - Частота в наступному інтервалі за модальним;

i - величина інтервалу.

За даними табл. 5.6 розрахуємо моду:

Обчислення моди в інтервальному ряду дуже умовне. Приблизно Мо можна визначити графічно (див. рис. 5.1).

До вивчення структури варіаційного ряду середня арифметична величина також має відношення, хоча основне значення цього узагальнюючого показника інше. Серед розподілу господарств за врожайністю (табл. 5.6) середня величина врожайності обчислюється як зважена за частотою середина інтервалів х(За формулою (5.2)):

Співвідношення між середньою величиною, медіаною та модою

Відмінність між середньою арифметичною величиною, медіаною та модою в даному розподілі невелика. Якщо розподіл за формою близький до нормального закону, то медіана знаходиться між модою і середньою величиною, причому ближче до середньої, ніж до моди.

При правосторонній асиметрії х̅ > Me > Mo;

при лівосторонній асиметрії х̅ < Me< Mo.

Для помірно асиметричних розподілів справедлива рівність:

5.8. Показники розміру та інтенсивності варіації

Абсолютні середні розміри варіації

Наступним етапом вивчення варіації ознаки у сукупності є вимірювання характеристик сили, величини варіації. Найпростішим може служити розмахабо амплітуда варіації -абсолютна різниця між максимальним і мінімальним значеннями ознаки з наявних у досліджуваній сукупності значень. Таким чином, розмах варіації обчислюється за формулою

Оскільки величина розмаху характеризує лише максимальне відмінність значень ознаки, вона може вимірювати закономірну силу його варіації у всій сукупності. Призначений для цієї мети показник повинен враховувати та узагальнювати всі відмінності значень ознаки разом без винятку. Число таких відмінностей дорівнює числу поєднань по два з усіх одиниць сукупності; за даними табл. 5.6 воно становитиме: С^= 10 153. Однак немає необхідності розглядати, обчислювати та середити всі відхилення. Простіше використовувати середню з відхилень окремих значень ознаки від середньої арифметичного значенняознаки, а таких всього 143. Але середнє відхилення значень ознаки від середньої арифметичної величинизгідно відомої властивості останньої дорівнює нулю. Тому показником сили варіації виступає не середня алгебраїчна відхилень, а середній модуль відхилень:

За даними табл. 5.6 середній модуль, або середнє лінійне відхилення,по абсолютній величині обчислюється як зважене частотою відхилення по модулю середин інтервалів від середньої арифметичної величини, тобто. за формулою

Це означає, що в середньому врожайність у сукупності господарств, що вивчається, відхилялася від середньої врожайності по області на 6,85 ц/га. Простота розрахунку та інтерпретації становлять позитивні сторониданого показника, проте математичні властивості модулів «погані»: їхне можна поставити у відповідність до будь-якого імовірнісного закону, в тому числі і з нормальним розподілом, параметром якого є не середній модуль відхилень, а середнє квадратичне відхилення(в англомовних програмах для ЕОМ зване the standard deviation, скорочено s.d. або просто « s», у російськомовних – СКО). У статистичній літературі середнє квадратичне відхилення від середньої величини прийнято позначати малою (рядковою) грецькою літерою сигма (ст) або s(див. гл. 7):

для ранжованого ряду

для інтервального ряду

За даними табл. 5.6 середнє квадратичне відхилення врожайності зернових становило:

Слід зазначити, що деяке округлення середньої величини та середин інтервалів, наприклад до цілих, мало відбивається на величині σ, яка склала б при цьому 8,55 ц/га.

Середнє квадратичне відхилення за величиною реальних сукупностях завжди більше середнього модуля відхилень. Співвідношення (у: азалежить від наявності в сукупності різких відхилень, що виділяються і може служити індикатором «засміченості» сукупності неоднорідними з основною масою елементами: чим це співвідношення більше, тим сильніше подібна «засміченість». Для нормального закону розподілу σ: а = 1,2.

Поняття дисперсії

Квадрат середнього квадратичного відхилення дає величину дисперсії σ 2 .Формула дисперсії:

проста (для несгрупованих даних):

зважена (для згрупованих даних):

На дисперсії ґрунтуються практично всі методи математичної статистики. Велике практичне значеннямає правило додавання дисперсій (див. гл. 6).

Інші заходи варіації

Ще одним показником сили варіації, що характеризує її не по всій сукупності, а лише в її центральній частині, служить середня квартальна відстань,тобто. середня величина різниці між квартилями, що позначається далі як q:

Для розподілу сільгосппідприємств щодо врожайності у табл. 5.2

q= (36,25 – 25,09): 2 = 5,58 ц/га. Сила варіації в центральній частині сукупності, як правило, менша, ніж загалом по всій сукупності. Співвідношення між середнім модулем відхилень та середнім квартальним відхиленням також служить для вивчення структури варіації: велике значеннятакого співвідношення говорить про наявність слабоваріюючого «ядра» і сильно розсіяного навколо цього ядра оточення, або «гало» в сукупності, що вивчається. Для даних табл. 5.6 співвідношення а: q= 1,23, що говорить про невелику відмінність сили варіації в центральній частині сукупності та на її периферії.

Для оцінки інтенсивності варіації та для порівняння її в різних сукупностях і тим паче для різних ознак необхідні відносні показники варіації.Вони обчислюються як відносини абсолютних показниківсили варіації, розглянутих раніше, до середньої арифметичної величини ознаки. Отримуємо такі показники:

1) відносний розмах варіації р:

2) відносне відхилення по модулю т:

3) коефіцієнт варіації як відносне квадратичне відхилення v:

4) відносна квартальна відстань d:

де q - середня квартильна відстань.

Для варіації врожайності за даними табл. 5,6 ці показники становлять:

ρ = 42,4: 30,3 = 1,4, або 140%;

т= 6,85: 30,3 = 0,226, або 22,6%;

v = 8,44: 30,3 = 0,279, або 27,9%;

d= 5,58: 30,3 = 0,184, або 18,4%.

Оцінка ступеня інтенсивності варіації можлива тільки для кожного окремого ознак сукупності певного складу. Так, для сукупності сільгосппідприємств варіація врожайності в тому самому природному регіоні може бути оцінена як слабка, якщо v < 10%, умеренная при 10% < v < 25% и сильная при v > 25%.

Навпаки, варіація зростання в сукупності дорослих чоловіків або жінок вже при коефіцієнті, що дорівнює 7%, має бути оцінена і сприймається людьми як сильна. Таким чином, оцінка інтенсивності варіації полягає в порівнянні варіації з деякою звичайною її інтенсивністю, що приймається за норматив. Ми звикли до того, що врожайність, заробіток чи дохід на душу житлових кімнату будівлі можуть різнитися у кілька і навіть десятки разів, але відмінність зростання людей хоча б у півтора рази вже сприймається як дуже сильна.

Різна сила, інтенсивність варіації обумовлені об'єктивними причинами. Наприклад, ціна продажу долара США в комерційних банках Санкт-Петербурга на 24 січня 1997 варіювала від 5675 до 5640 руб. при середньої ціни 5664 руб. Відносний розмах варіації ρ = 35:5664 = 0,6%. Така мала варіація викликана тим, що при значній відмінності курсу долара негайно відбувся відплив покупців з «дорогого» банку на «дешевші». Навпаки, ціна кілограма картоплі або яловичини в різних регіонахРосії дуже сильно варіює - на десятки відсотків і більше. Це різними витратами на доставку товару з регіону-виробника до регіону-споживача, тобто. прислів'ям «телушка за морем - полушка, і рубль перевезення».

5.9. Моменти розподілу та показники його форми

Центральні моменти розподілу

Для вивчення характеру варіації використовуються середні значення різних ступенів відхилень окремих величин ознаки з його середньої арифметичної величини. Ці показники отримали назву центральних моментіврозподіл порядку, відповідного ступеня, в який зводяться відхилення (табл. 5.7), або просто моментів (нецентральні моменти використовуються рідко і тут не будуть розглядатися). Розмір третього моменту ц-, залежить, як та її символ, від переважання позитивних кубів відхилень над негативними кубами чи навпаки. При нормальному та будь-якому іншому строго симетричному розподілі сума позитивних кубів строго дорівнює сумі негативних кубів.

Показники асиметрії

На основі моменту третього порядку можна побудувати показник, що характеризує ступінь асиметричності розподілу:

Asназивають коефіцієнтом асиметрії.Він може бути розрахований як за згрупованими, так і за несгрупованими даними. За даними табл. 5.6 показник асиметрії становив:

тобто. асиметрія незначна. Англійський статистик К. Пірсон на основі різниці між середньою величиною та модою запропонував інший показник асиметрії

Таблиця 5.7

Центральні моменти

За даними табл. 5.6 показник Пірсона становив:

Показник Пірсона залежить від ступеня асиметричності в середній частині ряду розподілу, а показник асиметрії, що ґрунтується на моменті третього порядку, - від крайніх значень ознаки. Таким чином, у нашому прикладі в середній частині розподілу асиметрія більша, що видно і за графіком (рис. 5.1). Розподіли з сильною правосторонньою та лівосторонньою (позитивною та негативною) асиметрією показані на рис. 5.3.

Характеристика ексцесу розподілу

За допомогою моменту четвертого порядку характеризується ще більш складна властивість рядів розподілу, ніж асиметрія, яка називається ексцесом.


Рис. 5.3. Асиметрія, розподіли

Показник ексцесу розраховується за формулою

(5.30)

Часто ексцес інтерпретується як "крутість" розподілу, але це неточно і неповно. Графік розподілу може виглядати як завгодно крутим в залежності від сили варіації ознаки: чим слабша варіація, тим крутіша крива розподілу при даному масштабі. Не кажучи вже про те, що, змінюючи масштаби по осі абсцис і по осі ординат, будь-який розподіл можна штучно зробити «крутим» і «пологим». Щоб показати, у чому полягає ексцес розподілу, і правильно його інтерпретувати, потрібно порівняти ряди з однаковою силою варіації (одною і тією самою величиною?) різними показникамиексцесу. Щоб не змішати ексцес з асиметрією, всі порівнювані ряди мають бути симетричними. Таке порівняння зображено на рис. 5.4.

Рис.5.4. Ексцес розподілу

Для варіаційного ряду з нормальним розподілом значно i ний ознаки показник ексцесу, розрахований за формулою (5.30), j дорівнює трьом.

Однак такий показник не слід називати терміном ексцес, що в перекладі означає надмірність. Термін «ексцес» слід застосовувати не до самого відношення за формулою (5.30), а до порівняння такого відношення для розподілу, що вивчається, з величиною даного відношення нормального розподілу, тобто. з величиною 3. Звідси остаточні формули показника ексцесу, тобто. надмірності в порівнянні з нормальним розподілом при тій же силі варіації, мають вигляд:

для ранжованого ряду

для інтервального та дискретного варіаційного ряду

Наявність позитивного ексцесу, як і раніше зазначеної значної різниці між малою квартальною відстанню і великим середнім квадратичним відхиленням, означає, що в масі явищ, що вивчається, існує слабо варіює за даною ознакою «ядро», оточене розсіяним «гало». За суттєвого негативного ексцесу такого «ядра» немає зовсім.

За значеннями показників асиметрії та ексцесу розподілу можна судити про близькість розподілу до нормального, що буває суттєво важливо для оцінки результатів кореляційного та регресійного аналізу, можливостей імовірнісної оцінки прогнозів (див. глави 7,8,9) Розподіл можна вважати нормальним, а точніше - не відкидати гіпотезу про схожість фактичного розподілу з нормальним, якщо показники асиметрії та ексцесу не перевищують своїх дворазових середніх квадратичних відхилень Стц. Ці середні квадратичні відхилення обчислюються за формулами:

5.10. Гранично можливі значення показників варіації та їх застосування

Застосовуючи будь-який вид статистичних показників, корисно знати, які гранично можливі значення даного показника для системи, що вивчається, і яке відношення фактично спостерігаються значень до гранично можливим. Особливо актуальна ця проблема щодо варіації об'ємних показників, як-от обсяг виробництва певного виду продукції, наявність певних ресурсів, розподіл капіталовкладень, доходів, прибутку. Розглянемо теоретично та практично це питанняна прикладі розподілу виробництва овочів між сільгосппідприємствами у районі.

Очевидно, що мінімально можливе значення показників варіації досягається при рівномірному розподілі об'ємного ознаки між усіма одиницями сукупності, тобто при однаковому обсязі виробництва в кожному з сільгосппідприємств. У такому граничному (звичайно, вельми малоймовірному на практиці) розподілі варіація відсутня і всі показники, варіації дорівнюють нулю.

Максимально можливе значення показників варіації досягається при такому розподілі об'ємної ознаки в сукупності, при якому весь обсяг зосереджений в одній одиниці сукупності; наприклад, весь обсяг виробництва овочів - в одному сільгосппідприємств району за відсутності їхнього виробництва в інших господарствах. Ймовірність такого максимально можливого зосередження обсягу ознаки в одній одиниці сукупності не така вже мала; принаймні вона набагато більша за ймовірність строго рівномірного розподілу.

Розглянемо показники варіації за вказаного граничного випадку її максимальності. Позначимо кількість одиниць сукупності п,середню величину ознаки х̅ , тоді загальний обсяг ознаки в сукупності виразиться як х̅ п.Весь цей обсяг зосереджений в однієї одиниці сукупності, отже хmax= х̅ п. хmin = 0, звідки випливає, що максимальне значення амплітуди (розмаху варіації) дорівнює:

Для обчислення максимальних значеньсередніх відхилень за модулем і квадратичним побудуємо таблицю відхилень (табл. 5.8).

Таблиця5.8

Модулі та квадрати відхилень від середньої при максимальноможливої ​​варіації

Номери одиниць сукупності

Значення ознаки

Відхилення від середньої

x i - x̅

Модулі відхилень

|x i - x̅|

Квадрати відхилень

i- х̅ ) 2

х̅ п

х̅ (п - 1)

-x̅

-x̅

-x̅

х̅ (п - 1)

х̅

х̅

х̅

х̅ 2 (п - 1) 2

х̅ 2

х̅ 2

х̅ 2

х̅ п

2х̅ (п - 1)

х̅ 2 [(п - 1) 2 +(n-1)]

Виходячи з виразів, що стоять у підсумковому рядку табл. 5.8 отримуємо наступні максимально можливі значення показників варіації.

Середній модуль відхилень, або середнє лінійне відхилення:

Середнє квадратичне відхилення:

Відносне модульне (лінійне) відхилення:

Коефіцієнт варіації:

Що стосується квартальної відстані, то система максимально можливою варіацієюмає вироджену структуру розподілу ознаки, в якій не існують («не працюють») характеристики структури: медіана, квартілі та їм подібні.

Виходячи з отриманих формул максимально можливих значень основних показників варіації, перш за все слідує висновок про залежність цих значень від обсягу сукупності п.Ця залежність узагальнена у табл. 5.9.

Найбільш вузькі межі зміни та слабку залежність від чисельності сукупності виявляють середній модуль та відносне лінійне відхилення. Навпаки, середнє відхилення і коефіцієнт варіації сильно залежать від чисельності одиниць сукупності. Цю залежність слід враховувати у порівнянні сили інтенсивності варіації в сукупності різної чисельності. Якщо в сукупності шести підприємств коефіцієнт варіації обсягу продукції становив 0,58, а в сукупності з 20 підприємств він становив 0,72, то чи справедливо робити висновок про більшу нерівномірність обсягу продукції в другій сукупності? Адже першою, меншою, він становив 0,58: 2,24 = 25,9% максимально можливого, тобто. граничного рівня концентрації виробництва в одному підприємстві з шести, а в другій, більшій сукупності, спостерігається коефіцієнт варіації склав тільки 0,72: 4,36 = 16,5% максимально можливого.

Таблиця 5.9

Граничні значення показників варіації об'ємної ознаки за різних чисельностей сукупності

Чисельність сукупностей

Максимальні значення показників

х̅

х̅

1,5х̅

1,73х̅

1,67х̅

2,24х̅

1,80х̅

3х̅

1,90х̅

4,36х̅

1,96х̅

7х̅

1,98х̅

9,95х̅

2х̅

Має практичне значення і такий показник, як відношення фактичного середнього модуля відхилень до гранично можливого. Так, для сукупності шести підприємств це співвідношення становило: 0,47: 1,67 = 0,281, або 28,1%. Інтерпретація отриманого показника така: для переходу від розподілу обсягу продукції, що спостерігається, між підприємствами, до рівномірного розподілу потрібно було б перерозподілити

, або 23,4% від загального обсягу продукції в сукупності. Якщо рівень фактичної концентрації виробництва (фактична величина σ або v) становить деяку частку граничного значення при монополізації виробництва на одному підприємстві, то відношення фактичного показникадо граничного може характеризувати рівень концентрації (чи монополізації) виробництва.

Відносини фактичних значень показників варіації або зміни структури до гранично можливих використовуються також під час аналізу структурних зрушень (див. розділ 11).

1. Джіні До.Середні величини. - М: Статистика, 1970.

2. Кривенкова Л. Н., Юзбашев М. М.Область існування показників варіації та її застосування // Вісник статистики. – 1991. – №6. – С. 66-70.

3. Пасхавер І. ​​С.Середні величини у статистиці. - М: Статистика. 1979.

4. Шураков Ст Ст, Дайітбегов Д. М. та ін.Автоматизоване робоче місце статистичної обробки даних (Глава 4. Попередня статистична обробка даних). - М.: Фінанси та статистика, 1990.

Варіаційний ряд є розташування значень ознаки кожної статистичної одиниці у певному порядку. При цьому окремі значення ознаки прийнято називати варіантом (варіантом). . Кожен член варіаційного ряду (варіанту) називається порядковою статистикою, а номер варіанти – рангом (порядком) статистики.

Найважливішими характеристиками варіаційного ряду є його варіанти (Х 1 =Хmin; Х n =Хmax) і розмах варіації (Rх = Хn - Х 1).

Варіаційні ряди знаходять широке застосування під час первинної обробки статистичної інформації, отриманої в результаті статистичного спостереження. Вони є базою побудови емпіричної функції розподілу статистичних одиниць у складі статистичної сукупності. Тому варіаційні ряди називають рядами розподілу.

У статистиці розрізняє наступні видиваріаційних рядів: ранжований, дискретний, інтервальний.

Ранжований (від латинського rang – чин) ряд- це ряд розподілу одиниць статистичної сукупності, у якому варіанти ознаки порядку зростання чи спадання. Будь-який ранжований ряд складається з рангових номерів (1 до n) та відповідних варіантів. Число варіант у ранжированому ряду, сформованому за суттєвою ознакою, зазвичай дорівнює числу одиниць у статистичній сукупності.

Для формування ранжованого ряду за заданою ознакою (наприклад, за кількістю працівників тваринництва у 100 сільськогосподарських підприємствах) можна скористатися макетом табл. 5.1.

Таблиця 5.1. Порядок формування ранжованого ряду

Кінець роботи -

Ця тема належить розділу:

Статистика

І продовольства республіки Білорусь.. департамент освіти науки і кадрів.

Якщо вам потрібно додатковий матеріална цю тему, або Ви не знайшли те, що шукали, рекомендуємо скористатися пошуком по нашій базі робіт:

Що робитимемо з отриманим матеріалом:

Якщо цей матеріал виявився корисним для Вас, Ви можете зберегти його на свою сторінку в соціальних мережах:

Всі теми цього розділу:

Шундалов Б.М
Загальна теорія статистики. Навчальний посібникдля економічних спеціальностей вищих сільськогосподарських навчальних закладів Навчальний посібник зі

Предмет статистики
Слово "статистика" походить від латинського "статус" (status), яке означає стан, стан речей. Це дає можливість підкреслити теоретичну пізнавальну сутність

Сутність статистичного спостереження
Будь-яке статистичне дослідження, як було зазначено вище (тема 1), завжди починається зі збору первинної (вихідної) інформації про кожну одиницю статистичної сукупності. Однак, не кожний

Програма статистичного спостереження
У першому розділі було звернено увагу на те, що кожна статистика одиниця, як об'єкт в цілому, має безліч різних властивостей, якостей, специфічних особливостей, які прийнято називати

Перелік ознак, що реєструються у процесі спостереження, прийнято називати програмою статистичного спостереження
Розробка програми – одне з найважливіших теоретичних та практичних питань статистичного спостереження. Добротність програми багато в чому визначає якість зібраного матеріалу, його надійність та

Форми статистичного спостереження
Все різноманіття статистичних спостережень зводить до двох форм: статистичної звітності та спеціально організованих статистичних спостережень. Статистична звітність

Статистичні формуляри
Статистичний формуляр – це банк, що містить питання програми статистичного спостереження і місце відповідей них. формуляр є носієм статистичної інформації, отриманої в результаті

Види статистичного спостереження
Статистичні спостереження класифікуються за видами, які можуть бути різними за різними принципами. Так, залежно від ступеня охоплення об'єкта, що вивчається, статистичні спостереження можуть подраз

Способи проведення статистичних спостережень
Статистичні спостереження можуть проводитись різними способами, серед яких нерідко зустрічаються такі: звітний, експедиційний, самочислення, самореєстрації, анкетний, кореспондентський.

Місце, терміни та період проведення статистичних спостережень
У плані будь-якого статистичного спостереження має бути чітко визначено місце цього спостереження, тобто. те місце, де проводиться реєстрація інформації, що збирається, заповнення статистично

Помилки статистичного спостереження та заходи боротьби з ними
Одним з найбільш важливих вимог, що пред'являються до результатів статистичного спостереження, є їх точність, під якою розуміється міра відповідності статистичних знань,

Первинне статистичне зведення
Результати статистичного спостереження містять різнобічні відомості про кожну одиницю сукупності чи об'єкта і зазвичай мають невпорядкований характер. Цей вихідний матеріалнеобхідно, перш за все

Сутність та значення відносних статистичних показників
Відносні показники – це статистичні величини, що виражають міру кількісного співвідношення абсолютних значень ознаки та відображають відносні розміри явищ та процесів. Про

Види відносних показників. Відносні показники динаміки
Залежно від завдань, які вирішуються за допомогою відносних величин, Розрізняють такі види відносних показників: динаміки, структури, координації, інтенсивності, порівняння, виконання замовлення,

Відносні показники структури
Одна з найважливіших особливостейвсіх явищ полягає у їх складності. Навіть молекула дистильованої води складається з атомів водню та кисню. Багато ж явищ природи, суспільства, людського

Відносні показники координації
Відносні показники координації – це співвідношення між собою абсолютних розмірів складових частин у певному абсолютному цілому. Для розрахунку цих показників одну із складових

Відносні показники інтенсивності
Відносні показники інтенсивності (ступеня) є співвідношенням абсолютних розмірів двох якісно різних, але взаємопов'язаних ознак у статистичній совоку

Відносні показники порівняння
Відносні показники порівняння (співставлення) отримують шляхом співвідношення однойменних абсолютних показників, що відносяться до різних статистичних одиниць, сов

Відносні показники виконання замовлення
Відносні показники виконання замовлення (завдання, плану) є співвідношенням абсолютних, фактично досягнутих показників за певний період або станом на

Відносні показники рівня економічного розвитку
Відносними показниками рівня економічного розвитку називають співвідношення абсолютних розмірів двох якісно різних (різноіменних), але взаємопов'язаних ознак. При цьому

Сутність та значення графічного методу
Абсолютні статистичні показники, отримані в результаті статистичних спостережень, і розраховані на цій основі різноманітні відносні показники можуть бути кращими, глибшими, доступнішими.

Основні вимоги до побудови координатних діаграм
Найбільш поширеним та зручним способомграфічного зображення абсолютних та відносних показників динаміки, показників порівняння та ін. вважається координатна діаграма.

Способи графічного зображення показників динаміки та структури
У багатьох випадках є необхідність на одній і тій же координатній діаграмі відобразити не одну, а кілька ліній, що характеризують динаміку різних абсолютних чи відносних показників ліб

Способи графічного зображення показників порівняння
У широкому розумінні порівняння показників проводиться як у часі, і у просторі, тобто. прийомами порівняння може бути охоплені і динаміка, і структура, і територіальні об'єкти. Тому пр

Сутність та значення картограм та картодіаграми
У багатьох випадках є необхідність графічно зобразити найважливіші ознаки, характерні для територіальних об'єктів. У системі АПК це може бути населені пункти, сільськогосподарське

Контрольна питання до теми 4
1. Що являє собою графічний метод і на чому він ґрунтується? 2. З якими основними цілями використовується графічний метод. 3. Яким чином класифікуються

Сутність варіації. Види варіаційних ознак
Варіація (від латинського variatio – зміна) є зміна ознаки (варіант) у статистичної сукупності, тобто. прийняття одиницями сукупності або їх групами різних знань

За кількістю працівників тваринництва
Ранговий номер (№) варіанти Варіанту, що відповідає ранговому номеру (№) Символ Число працівників тваринництва

Дискретний ряд розподілу
Дискретний (розділовий) ряд є такий варіаційний ряд, у якому його групи сформовані за ознакою, що змінюється перервно, тобто. через певну кількість єдиний

Працівників тваринництва
№ варіанти Варіанта (значення ознаки), Х Частотні знаки Локальні частоти, fл Накопичувальні частоти, fн

Інтервальний ряд розподілу
У багатьох випадках, кота статистична сукупність включає велике або тим більше нескінченне число варіант, що найчастіше зустрічається при безперервній варіації, практично неможливо і недоцільно.

Сутність середніх величин
Варіаційні ряди відображають велику різноманітність явищ і процесів, що становлять сутність нашої дійсності. Для більш повного, поглибленого вивчення явищ і процесів навколишнього світу

Середня арифметична величина
Якщо формулу 6.2 підставити значення К=1, виходить середня арифметична величина, тобто. .

У ранжованому ряду розподілу
Рангові №№ Варіанти (значення ознаки) Символи Посівна площа, га

Ряду розподілу
№ п.п. Варіанти Локальні частоти Зважені середні варіанти Символи Урожайн

Основні властивості середньої арифметичної величини
Середня арифметична величина має багато математичними властивостями, що мають важливе математичне значення за її розрахунку. Знання цих властивостей допомагають контролювати правильність і точно.

Середня хронологічна величина
Одним із різновидів середньої арифметичної величини є середня хронологічна. Середню величину, обчислену за сукупністю значень ознаки в різні моменти або за різні періоди

Середня квадратична величина
За умови встановлення значення К=2 у формулу 6.2. отримуємо середню квадратичну величину. У ранжованому ряду середня квадратична величина розраховується за незваженою (пр

Середня геометрична величина
Якщо формулу 6.2 підставити значення К=0, то результаті отримуємо середню геометричну величину, що має просту (невзвешенную) і зважену форми. Середня геометрична проста

Середня гармонійна величина
За умови підстановки в загальну формулу 6.2 значення К=-1 можна отримати середню гармонійну величину, яка має просту та виважену форми. Назва середньої гармонії

Структурне середнє. Сутність та значення моди
У деяких випадках для отримання узагальнюючої характеристики статистичної сукупності за якоюсь ознакою доводиться користуватися т.зв. структурними середніми. До них відносять

Сутність та значення медіани
Медіана - варіанти, що знаходяться в середині варіаційного ряду. Медіана в ранжированому ряду знаходиться в такий спосіб. По-перше, розраховують номер медіаної варіанти:

Поняття про найпростіші показники варіації
Сутність варіації було розглянуто у 5 главі підручника, де зазначалося, що варіація – це коливання, зміна величини ознаки у статистичної сукупності, тобто. прийняття одиницями сукупності

Середнє квадратичне відхилення
Середнє квадратичне відхиленнярозраховується з урахуванням середньої квадратичної величини. Воно виступає у не зваженій (простій) та зваженій формах. Для ранжованого р

Коефіцієнт варіації
Коефіцієнт варіації є відносним показником, який можна розрахувати за такою формулою:

Контрольна питання до теми 6
1. Що таке середня величина та що вона виражає? 2. Що є визначальне властивість сукупності і навіщо його застосовують у статистиці? 3. Які основні види середні

Сутність генеральної та вибіркової сукупності
У статистиці порівняно рідко зустрічається суцільний вид спостереження, яким є, наприклад, загальний перепис населення. Все-таки найчастіше доводиться використовувати непогані спостереження, як

Поняття про стохастичну сукупність
У реальних умовах порівняно рідко трапляються випадки статистичної роботи з генеральною сукупністю і, отже, далеко не завжди можна отримати основні статистичні характеристики

Сутність вибіркового методу
Статистична робота здебільшого так чи інакше пов'язана з даними, отриманими внаслідок застосування вибіркового методу. Багато досліджень були б нездійсненні, якби не використовували

Переваги та недоліки вибіркового методу
Вибірковий метод має низку переваг перед суцільним спостереженням. По - перше, вибіркове спостереження дозволяє суттєво економити працю, кошти, час його проведення. Сові

Способи відбору, їх переваги та недоліки
Відбір статистичних одиниць з генеральної сукупності може бути зроблений no-різному і залежить від багатьох умов. Вибірковий метоп включає такі способи відбору статистичних одиниць

Сутність помилок репрезентативності та порядок їх розрахунку
Одним з центральних питань за вибірковим методом вважається теоретичний розрахунок основних статистичних характеристик і насамперед середнього значення ознаки в генеральній статистичній совок

Поняття про малу вибірку. Точкова оцінка основних статистичних характеристик
Застосування вибіркового методу може базуватися на відборі з генеральної сукупності теоретично будь-якої кількості статистичних об'єднань. Математично доведено, що вибіркові сукупності можуть бути

Гранична помилка вибірки. Інтервальна опіка основних статистичних характеристик
Гранична помилка вибірки є розбіжністю між статистичними характеристиками, отриманими у вибірковій та генеральній сукупності Як було показано вище (формула

Прийоми розрахунку чисельності вибірки за різних способів відбору
Підготовча роботадо проведення вибіркового спостереження безпосередньо пов'язана з визначенням необхідної чисельності вибірки, яка залежить від способу відбору та чисельності одиниць у генераль

Поняття про вторинне (складне) статистичне зведення
Результати простої зведення, зміст якої розглянуто у темі 2, який завжди можуть задовольнити дослідника, оскільки вони дають лише загальне уявлення про досліджуваному об'єкті, тобто. від статистики т

Типологічні угруповання
Типологічна угруповання є розчленування статистичної сукупності на одно-якісних у значному відношенні типологічних групи. Типологічне угруповання

Структурні угруповання
Структурне угруповання полягає у розчленуванні однорідної та якісному відношенні сукупності статистичних одиниць на групи, що характеризує склад складного об'єкта. За допомогою структурної

Сутність та порядок проведення простого та аналітичного угруповання
Аналітичне угруповання, коли він статистична сукупність розбивається на однорідні групи з одного якомусь факторному ознакою, називається простий.

Аналітичного угруповання
№п.п. Групи селянських господарств з доз добрив, т/га. Частотні знаки у групах (кількість одиниць сукупності групи)

Результативними показниками у картоплярстві
№ п.п. Показники Групи господарств за дозою добрив, т/га Разом (в середньому) 10-20

Сутність та значення статистичних таблиць
Результати обробки даних спостереження за допомогою різноманітних статистичних методів (зведення, відносних, середніх величин, формувань, варіаційних рядів, показників варіації, аналітичних

Елементарний склад статистичних таблиць
Комплексна статистична обробка результатів спостереження зазвичай пов'язані з використанням численних таблиць. Тому кожній таблиці надається індивідуальний номер.

Види та форми статистичних таблиць
Залежно від будови табличного підлягає розрізняють такі види статистичних таблиць: прості, групові та комбінаційні. Проста статистична таблиця - хара

Допоміжні та результативні статистичні таблиці
Статистичні таблиці можуть виконувати різну функціональну роль. Одні з них служать наприклад, для узагальнення результатів статистичного спостереження і сприяють виконання первинної функції

Результатами виробництва, 2003 р.
(Комбінаційна таблиця) № п.п. Групи господарств по навантаженню сільгоспугідь на 1 трактор, га Підгрупи господарств по навантаженню

Льонопереробних підприємств АПК у 2003 р.
(Робоча таблиця) № п.п. Річний обсяг переробки трести, т Чисельність працівників, осіб Вантажопідйомність а

Оформлення статистичних таблиць
Досягнення поставленої мети з допомогою табличного методу можливе у випадках, коли витримані необхідні вимоги щодо оформлення статистичних таблиць. Зазвичай всі таблиці повинні мати

Поняття про дисперсійний метод
Назва методу обумовлена широким використаннямрізних видів дисперсій, сутність та способи розрахунку яких розглянуті у шостій темі підручника. Доцільно зазначити, що дисперсія кількості

Ознака-результату
№ под/п Індивідуальні варіанти Лінійні відхилення індивід. варіант від середньої Квадрати лінійних відхилень

Селянських господарствах
№ п/п Урожайність, ц/га Лінійні відхилення індивідуальної врожайності від середньої, ц/га Квадрати лінійних відхилень урожайність

Фітофтороза, на врожайність картоплі
№ п/п Групи господарств за питомою вагою оброблених посівів, % Кількість господарств у групі Середня питома вага оброблених посівів,

Ознака-результату
№ групи Інтервали за факторною ознакою Локальна частота Середня варіанта результативної ознаки

Види дисперсії. Правило складання дисперсій
Принцип розрахунку дисперсії (середнього квадрата відхилень) у загальному вигляді розглянуто у темі 6. Щодо дисперсійного методу це означає, що кожному виду варіації відповідає певна

Врожайність картоплі (перша група)
№ п.п. Урожайність, ц/га Лінійне відхилення від середньої групової врожайності Квадрати лінійних відхилень

Поняття про критерії Р. Фішера
Дисперсійний метод полягає в оцінці відношення виправленої дисперсії, що характеризує систематичні коливання групових середніх значень досліджуваної результативної ознаки, до виправленої диспе

Двофакторний дисперсійний комплекс
Рішення цього комплексу спрямовано вивчення якісного впливу двох факторних ознак впливу двох факторних ознак однією чи кілька результативних ознак. Двофакторний комплекс

Зернових культур
№ підгрупи Число господарств у підгрупі Середня врожайність ц/га Лінійні відхилення врожайності в підгрупі від середньої

Особливості багатофакторного дисперсійного комплексу
Вивчення якості зв'язку, тобто. суттєвості впливу кількох (трьох, чотирьох і більше) факторних ознак на результативні показники, по суті є тривалості прийому комбінування

Врожайність зернових культур
№ п.п. Елементи варіацій Символи Загальна варіація Систематична варіація Залишкова варіація

Сутність та види кореляцій
У попередньому розділі було показано, що якість (суттєвість) залежності між факторними та результативними ознаками у статистичній сукупності визначається та оцінюється за допомогою дисперсії.

Основні форми кореляційного зв'язку між ознаками
Виявленню форми зв'язку між ознаками передує визначення причинної залежності з-поміж них. Це найбільш важливий і відповідальний момент для правильного використаннякореляційний метод. за

Показники тісноти кореляційних зв'язків. Кореляційне ставлення
Одним із центральних питань, які вирішуються за допомогою кореляційного методу, є визначення та оцінка кількісної міри тісноти зв'язку між факторними та результативними ознаками. При

Коефіцієнти прямолінійної парної кореляції
Якщо взаємозв'язок між ознаками досліджуваної парою ознак виражається у формі, близькій до прямої, то ступінь тісноти зв'язку між цими ознаками можна розрахувати за допомогою коефіцієнта пр.

Ранговий коефіцієнт кореляції
Основні статистичні характеристики у випадках, коли генеральна сукупність, з якої береться вибірка, виявляється за межами параметрів нормального або близького до нього закону

Коефіцієнт множинної кореляції
При вивченні тісноти зв'язку між декількома факторними та результативними ознаками розраховують сукупний коефіцієнт множинної кореляції. Так, при визначенні сукупної м

Показники детермінації
При вивченні кількісного впливу ознак – факторів на результати важливо визначити, яка частина коливання результативної ознаки безпосередньо обумовлена ​​впливом варіації.

Сутність, види та значення рівнянь регресії
Під регресією розуміється функція, призначена для опису залежності зміни результативних ознак під впливом коливання ознак – факторів. Поняття регресії введено у статистиці

Рівняння прямолінійної регресії
Кореляційний зв'язок у формі, близькій до прямолінійної, можна подати у вигляді рівняння прямої лінії:

Рівняння гіперболічної регресії
Якщо форма зв'язку між ознакою-фактором та ознакою-результатом, виявлена ​​за допомогою координатної діаграми (поля кореляції), наближається до гіперболічної, то необхідно скласти та вирішити ур

Регресії
№ п.п. Ознака-фактор Ознака-результат Зворотне значенняознаки-фактора Квадрат зворотного значення

Гіперболічної регресії
№ п.п. Урожайність гороху, ц/га Х Собівартість гороху, тис. руб./ц У Розрахункові величини

Рівняння параболічної регресії
У деяких випадках емпіричні дані статистичної сукупності, зображені наочно за допомогою координатної діаграми, показують, що збільшення фактора супроводжуються випереджальним зростанням рез

Параболічній регресії
№ п.п. Х У ХУ Х2 Х2У Х4

Параболічній регресії
№ п.п. Питома вага посівів картоплі, Х. Урожай картоплі, тис. ц. Розрахунки величини

Рівняння множинної регресії
Застосування кореляційного методу щодо залежності ознаки – результату від кількох факторних ознак формується за схемою, аналогічної простої (парної) кореляції. Одною з

Коефіцієнти еластичності
Для змістовного та доступного опису (інтерпретації) результатів, що відображають кореляційно – регресійну залежністьміж ознаками за допомогою різних рівнянь регресії, зазвичай викорис

Сутність динамічного ряду
Усі явища навколишнього світу зазнають безперервних змін у часі; з часом, тобто. у поступовій динаміці змінюється їх обсяг, рівень, склад, структура тощо. доцільно зазначити, що за

Сільськогосподарських підприємствах
(на початок року; тис. фізичних одиниць) Показники 2000 2001 2002 2003

Основні показники динамічного ряду
Всебічний аналіз динамічного ряду дозволить розкрити і характеризувати закономірності, що виявляють різних етапахрозвитку явищ, виявити тенденції та особливості розвитку цих явищ. У про

Абсолютні прирости рівнів
Одним із найпростіших показників розвитку динаміки є абсолютний приріст рівня. Абсолютним приростом називається різниця двох рівнів динамічного ряду.

Темпи зростання рівнів
Для характеристики відносної швидкості зміни – показник темпу зростання. Темп зростання – це ставлення рівня динамічного низки до іншого, прийнятому за основу порівняння. темп зростання може бути

Темп приросту рівнів
Якщо абсолютна швидкість приросту рівнів динамічного ряду характеризується величиною абсолютних приростів, відносна швидкість приросту рівнів – темпами приросту. Темп при

Абсолютне значення одного відсотка приросту
При аналізі динамічних рядів нерідко ставиться завдання: з'ясувати, яким абсолютними значеннями виражається 1% приросту (зниження) рівнів, так як у ряді випадків при зниженні (уповільненні) темпів ро

За 1999-2003 рр.
Роки Урожайність, ц/га Абсолютні прирости врожайності., ц/га Темп зростання % Темп приросту %

Прийоми вирівнювання динамічних рядів
Для виявлення тимчасових закономірностей вимагає, зазвичай, досить велика кількість рівнів, динамічного ряду. Якщо ж динамічний ряд складається з обмеженої кількості рівнів, то його вирівнюють.

Способи аналітичного вирівнювання динамічного рядів
Виявлення загальної тенденціїрозвитку рівнів динамічного ряду може бути проведено із застосуванням різних прийомів аналітичного вирівнювання, яке найбільш часто здійснюється

Аналітичне вирівнювання за показовою кривою
У деяких випадках, наприклад, у процесі введення в дію та освоєння нових виробничих потужностей, для динамічного ряду може бути характерна зміна рівнів, що швидко зростає, тобто. ланцюгові ті

Аналітичне вирівнювання по параболі другого порядку
Якщо динамічний ряд, що вивчається, характеризується позитивними абсолютними приростами, з прискоренням розвитку рівнів, то вирівнювання ряду може бути проведено по параболі другого порядку.

Аналітичне вирівнювання за рівнянням гіперболи
Якщо динамічного ряду характерні згасаючі абсолютні зниження рівнів (наприклад, динаміка трудомісткості продукції, працезабезпеченості виробництва, у сільське господарство та інших.), то вирівнюваний

Поняття про інтерполяцію та екстраполяцію рівнів динамічного ряду
У деяких випадках необхідно знайти значення відсутніх проміжних рівнів динамічного ряду на основі його відомих значень. У таких випадках може бути використаний прийом інтерполяції,

Першим етапом статистичного вивчення варіації є побудова варіаційного ряду - упорядкованого розподілу одиниць сукупності за зростаючим (частіше) чи з спадним (рідше) значенням ознаки і підрахунок числа одиниць із тим чи іншим значенням ознаки.

Існують три форми варіаційного ряду: ранжований, дискретний, інтервальний. Варіаційний ряд часто називають поряд розподілу. Цей термін вживається щодо варіації як кількісних, і некількісних ознак. Ряд розподілу є структурне угруповання (гл. 6).

Ранжированный ряд - це перелік окремих одиниць сукупності порядку зростання (зменшення) досліджуваного ознаки.

Нижче наведено відомості про великі банки Санкт-Петербурга, ранжировані за розмірами власного капіталу на 01.10.1999 р.

Назва банку Власний капітал, млн. руб.

Балтонексім банк 169

Банк «Санкт-Петербург» 237

Петровський 268

Балтійський 290

Промбудбанк 1007

Якщо чисельність одиниць сукупності досить велика, ранжований ряд стає громіздким, яке побудова, навіть з допомогою комп'ютера, займає тривалий час. У разі варіаційний ряд будується з допомогою групування одиниць сукупності за значенням досліджуваного ознаки.

Визначення числа груп

Число груп у дискретному варіаційному ряду визначається числом реально існуючих значень ознаки, що варіює. Якщо ознака набуває дискретних значень, але їх кількість дуже велика (наприклад, поголів'я худоби на 1 січня року в різних сільськогосподарських підприємствах може становити від нуля до десятків тисяч голів), то будується інтервальний варіаційний ряд. Інтервальний варіаційний ряд будується і вивчення ознак, які можуть набувати будь-які, як цілі, і дробові значення у сфері свого існування. Такі, наприклад, рентабельність реалізованої продукції, собівартість одиниці виробленої продукції, дохід однієї жителя міста, частка осіб із вищою освітою серед населення різних територій і взагалі всі вторинні ознаки, значення яких розраховуються шляхом розподілу величини однієї первинної ознаки на величину іншого (див. гл. 3).

Інтервальний варіаційний ряд є таблицею, що складається з двох граф (або рядків) - інтервалів ознаки, варіація якого вивчається, та числа одиниць сукупності, що потрапляють у даний інтервал (частот), або часткою цього числа від загальної чисельності сукупності (частин).

Найчастіше використовуються два види інтервальних варіаційних рядів: рівноінтервальний та рівночастотний. Рівноінтервальний ряд застосовується, якщо варіація ознаки дуже сильна, тобто. для однорідної сукупності, розподіл якої за цією ознакою близький до нормального закону. (Такий ряд представлений у табл. 5.6). Рівночастотний ряд застосовується, якщо варіація ознаки дуже сильна, проте розподіл не є нормальним, а, наприклад, гіперболічним (табл. 5.5).

При побудові рівноінтервального ряду число груп вибирається так, щоб достатньою мірою відбилися різноманітність значень ознаки в сукупності і в той же час закономірність розподілу, його форма не спотворювалася випадковими коливаннями частот. Якщо груп буде замало, не виявиться закономірність варіації; якщо груп буде надмірно багато, випадкові стрибки частот спотворять форму розподілу.


Межі інтервалів можуть вказуватись різним чином: верхня межа попереднього інтервалу повторює нижню межу наступного, як показано в табл. 5.5 або не повторює.

У разі другий інтервал буде позначений як 15,1-20, третій - як 20,1-25 тощо., тобто. передбачається, що це значення врожайності обов'язково округлені до однієї десятої. Крім того, виникає небажане ускладнення з серединою інтервалу 15,1-20, яка, строго кажучи, вже дорівнюватиме не 17,5, а 17,55; відповідно при заміні заокругленого інтервалу 40-60 на 40,1-60 замість заокругленого значення його середини 50 отримаємо 50,5. Тому краще залишити інтервали з округленим кордоном, що повторюється, і домовитися, що одиниці сукупності, що мають значення ознаки, рівне межі інтервалу, включаються в той інтервал, де це точне значення вперше вказується. Так, господарство, що має врожайність, що дорівнює 15 ц/га, включається до першої групи, значення 20 ц/га - у другу і т.д.

Рівночастотний варіаційний ряд необхідний при дуже сильній варіації ознаки тому, що при рівноінтервальному розподілі більша частина одиниць сукупності ока-

Таблиця 5.5

Розподіл 100 банків Росії з балансової оцінки активів на 01.01.2000 р.

Межі інтервалів при рівночастотному розподілі - це фактичні величини активів першого, десятого, одинадцятого, двадцятого тощо банків.

Графічне зображення варіаційного ряду

Істотну допомогу в аналізі варіаційного ряду та його властивостей надає графічне зображення. Інтервальний ряд зображується стовпчиковою діаграмою, в якій підстави стовпчиків, розташовані на осі абсцис, - це інтервали значень ознаки, що варіює, а висота стовпчиків - частоти, що відповідають масштабу по осі ординат. Графічне зображення розподілу господарств області з урожайності зернових культур наведено на рис. 5.1. Діаграма цього роду часто називається гістограмою (гр. histos – тканина).

Дані таблиці. 5.6 та рис. 5.1 показують характерну для багатьох ознак форму розподілу: частіше зустрічаються значення середніх інтервалів ознаки, рідше – крайні, малі та великі значення ознаки. Форма цього розподілу близька до математичної статистики, що розглядається в курсі, закону нормального розподілу. Великий російський математик А. М. Ляпунов (1857-1918) довів, що нор-

Таблиця 5.6 Розподіл господарств області з урожайності зернових культур

мальний розподіл утворюється, якщо на змінну, що варіює, впливає велика кількість факторів, жоден з яких не має переважаючого впливу. Випадкове поєднання безлічі приблизно рівних факторів, що впливають на варіації врожайності зернових культур, як природних, так і агротехнічних, економічних, створює близьке до нормального закону розподілу господарств області за врожайністю.

Рис. 5.2. Кумулята та огива розподілу господарств за врожайністю

Такий ряд називається кумулятивним. Можна побудувати кумулятивний розподіл не менше, ніж, а можна більше, ніж. У першому випадку графік кумулятивного розподілу називається кумулятою, у другому – огивою (рис. 5.2).

Щільність розподілу

Якщо доводиться мати справу з варіаційним поруч із нерівними інтервалами, то для сумісності потрібно частоти, або частоти, привести до одиниці інтервалу. Отримане відношення називається щільністю розподілу:

Щільність розподілу використовується як розрахунку узагальнюючих показників, так графічного зображення варіаційних рядів з нерівними інтервалами.

Схожі статті

2022 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.