Статистичне зведення та угруповання. Статистичний ряд розподілу. Приклади розв'язання задач. Ряди розподілу

Надіслати свою гарну роботу до бази знань просто. Використовуйте форму нижче

гарну роботуна сайт">

Студенти, аспіранти, молоді вчені, які використовують базу знань у своєму навчанні та роботі, будуть вам дуже вдячні.

Розміщено на http:// www. allbest. ru/

Завдання №1

На підставі даних статистичного спостереження, наведених у таблиці, побудувати ранжований, інтервальний та кумулятивний ряди розподілу сільськогосподарських підприємств за факторною ознакою, зобразити їх графічно.

Провести зведення даних. За допомогою методу угруповань визначте залежність результативної ознаки у сільськогосподарських підприємствах від факторної. Побудувати таблиці та графіки залежності. Висновок.

угруповання ряд розподіл факторний

Якість ґрунту, бали (х)

(у)

Рішення:

Побудоваранжованогорядурозподілу передбачає розташування всіх варіантів низки порядку зростання досліджуваного ознаки (якості грунту). Проведення сортування проводилося у програмі ТП Excel із використанням функції "Сортування".

Якість ґрунту

Врожайність овочів відкритого ґрунту

Графічне зображення ранжованого ряду розподілу

Лінія на рис.1 зветься огів Гальтона. Ця огива має тенденцію плавного зростання з невеликими стрибками в деяких точках. Для перетворення ранжованого ряду на інтервальний краще виконати розбивку на групи вручну.

Побудоваінтервальногорядурозподілу підприємств за ознакою, що вивчається, передбачає визначення числа груп (інтервалів).

Для розрахунку числа груп скористаємося формулою:

n=2 де N- загальне числоодиниць досліджуваної сукупності.

n = 2 Ig30 = 2,95424251?3.

Величина рівного інтервалуобчислюється за такою формулою:

i = = = 16,33333

Кумулятивнийряд- це ряд, у якому підраховуються накопичені частоти. Він показує скільки одиниць сукупності мають значення ознаки не більше, ніж дане значення, і обчислюється шляхом послідовного додавання до частоти першого інтервалу частот наступних інтервалів.

Інтервальний та кумулятивний ряди

частота- Число підприємств у групі;

Питома вага підприємств в групі- знаходиться за формулою:

(числопідприємстввгрупі * 100%)/m, де m-число експериментальних даних;

Накопичена частота- знаходиться за формулою: числопідприємстввпопередньоюгрупі+частотаданоїгрупи.

Гістограма частот

Кумулята розподілу якості ґрунту

Зведені показники

№ групи

Число підприємств у групі

Врожайність овочів відкритого ґрунту (всього за групами)

Якість ґрунту (всього за групами)

II 61,33333-77,33333

III 77,33333-94,1

Середні характеристики груп

№ Групи

Врожайність овочів відкритого ґрунту

Якість ґрунту

II 61,33333-77,33333

III 77,33333-94,1

У середньому за сукупністю

де, стовпець "врожайність овочів" знаходиться за формулою: УУiгрупі) / числопідприємстввгрупі;

стовпець "Якість грунту" знаходиться за формулою: УХiгрупі)/числопідприємстввгрупі.

Залежність урожайності овочів відкритого ґрунту від якості ґрунту.

У прикладі можна зробити висновок: зі зростанням якості ґрунту збільшується врожайність овочів відкритого ґрунту, отже можна припустити наявність прямого зв'язку між аналізованими параметрами.

Розміщено на Allbest.ru

Подібні документи

    Аналітичне угруповання за факторною ознакою. Побудова варіаційного частотного та кумулятивного рядів розподілу на основі дорівнює інтервальному структурному угрупованню результативної ознаки – дивідендів, нарахованих за результатами діяльності.

    контрольна робота , доданий 07.05.2009

    Основні показники чисельності населення та його розміщення по Калузька область. Побудова ранжованого та інтервального рядів розподілу за однією групувальною факторною ознакою. Аналіз типових груп за показниками в середньому за сукупністю.

    курсова робота , доданий 11.10.2010

    Побудова за допомогою формули Стержесу. Побудова рядів розподілу із довільними інтервалами. Побудова рядів розподілу за допомогою середнього відхилення квадратичного. Класифікація рядів розподілу. Розрахунок основних показників варіації.

    курсова робота , доданий 22.11.2013

    Аналіз, розрахунок та побудова вихідних динамічних рядівознаки-функції та ознаки-фактора. Розрахунок показників варіації динамічних рядів. Кількісний виміртісноти зв'язку ознаки-функції та ознак-факторів методом парної кореляції.

    курсова робота , доданий 24.09.2014

    Оцінка сукупності щодо її однорідності. Побудова ранжованого та інтервального рядів розподілу. Аналіз рядів динаміки методами укрупнення інтервалів та ковзної середньої, аналітичне вирівнювання за рівнянням прямої та параболи.

    курсова робота , доданий 10.09.2014

    Розрахунок середнього балу успішності за даними результатів сесії, визначення показника варіацій рівня знань та структури чисельності студентів за успішністю. Побудова інтервального ряду розподілу підприємств. Оцінка коефіцієнтів кореляції.

    контрольна робота , доданий 21.08.2009

    Поняття та види статистичного угруповання, що виробляється з метою встановлення статистичних зв'язків та закономірностей, виявлення структури досліджуваної сукупності. Побудова інтервального ряду розподілу підприємств за ознакою "торговельна площа".

    дипломна робота , доданий 14.02.2016

    Основні категорії статистики. Угруповання – основа наукової обробки даних статистики. Зміст зведення та статистична сукупність. Побудова варіаційного, ранжованого та дискретного рядів розподілу. Угруповання підприємств за кількістю робітників.

    контрольна робота , доданий 17.03.2015

    Проведення розрахунку абсолютних, відносних, середніх величин, коефіцієнтів регресії та еластичності, показників варіації, дисперсії, побудова та аналіз рядів розподілу. Характеристика аналітичного вирівнювання ланцюгових та базисних рядів динаміки.

    курсова робота , доданий 20.05.2010

    Проведення експериментального статистичного дослідження соціально-економічних явищ та процесів Смоленської області на основі заданих показників. Побудова статистичних графіків, рядів розподілу, варіаційних рядів, їх узагальнення та оцінка.

Найважливішою частиною статистичного аналізу є побудова рядів розподілу (структурного угруповання) з метою виділення характерних властивостейта закономірностей досліджуваної сукупності. Залежно від цього, який ознака (кількісний чи якісний) взятий за основу угруповання даних, розрізняють відповідно типи рядів розподілу.

Якщо за основу угруповання взято якісну ознаку, то такий ряд розподілу називають атрибутивним(розподіл за видами праці, за статтю, за професією, за релігійною ознакою, національною належністю тощо).

Якщо ряд розподілу побудований за кількісною ознакою, то такий ряд називають варіаційним. Побудувати варіаційний ряд - отже впорядкувати кількісний розподіл одиниць сукупності за значеннями ознаки, та був підрахувати числа одиниць сукупності із цими значеннями (побудувати групову таблицю).

Виділяють три форми варіаційного ряду: ранжований ряд, дискретний ряд та інтервальний ряд.

Ранжований ряд- це розподіл окремих одиниць сукупності у порядку зростання чи спадання досліджуваного ознаки. Ранжування дозволяє легко розділити кількісні дані по групам, відразу виявити найменше та найбільше значення ознаки, виділити значення, які найчастіше повторюються.

Інші форми варіаційного ряду - групові таблиці, складені характером варіації значень досліджуваного ознаки. За характером варіації розрізняють дискретні (перервні) та безперервні ознаки.

Дискретний ряд- це такий варіаційний ряд, основою побудови якого покладено ознаки з перервним зміною (дискретні ознаки). До останніх можна віднести тарифний розряд, кількість дітей у сім'ї, кількість працівників для підприємства тощо. Ці ознаки можуть набувати лише кінцеве число певних значень.

Дискретний варіаційний ряд представляє таблицю, що складається із двох граф. У першій графі вказується конкретне значення ознаки, тоді як у другий - число одиниць сукупності з певним значенням ознаки.

Якщо ознака має безперервну зміну (розмір доходу, стаж роботи, вартість основних фондів підприємства і т.д., які у певних межах можуть набувати будь-яких значень), то для цієї ознаки потрібно будувати інтервальний варіаційний ряд.

Групова таблиця також має дві графи. У першій вказується значення ознаки в інтервалі від - до (варіанти), у другій - число одиниць, що входять в інтервал (частота).

Частота (частота повторення) - число повторень окремого варіанта значень ознаки, що позначається fi , а сума частот, що дорівнює обсягу досліджуваної сукупності, позначається

де k - число варіантів значень ознаки

Дуже часто таблиця доповнюється графою, в якій підраховуються накопичені частоти S, які показують, скільки одиниць сукупності має значення ознаки не більше, ніж дане значення.

Частоти ряду f можуть замінюватись частотами w, вираженими у відносних числах (частках або відсотках). Вони є відношення частот кожного інтервалу до їх загальної суми, тобто:

При побудові варіаційного ряду з інтервальними значеннями насамперед необхідно встановити величину інтервалу i, яка визначається як відношення розмаху варіації R до груп m:

де R = xmax - xmin; m = 1 + 3,322 lgn (формула Стерджес); n - загальна кількість одиниць сукупності.

Для визначення структури сукупності використовують спеціальні середні показники, до яких відносяться медіана та мода, або так звані структурні середні. Якщо середня арифметична розраховується з урахуванням використання всіх варіантів значень ознаки, то медіана і мода характеризують величину того варіанта, який займає певне середнє положення ранжированном варіаційному ряду.

Медіана (Ме)- це величина, яка відповідає варіанту, що знаходиться в середині ранжованого ряду.

Для ранжованого ряду з непарним числом індивідуальних величин (наприклад, 1, 2, 3, 3, 6, 7, 9, 9, 10) медіаною буде величина, розташована в центрі ряду, тобто. п'ята величина.

Для ранжованого ряду з парним числом індивідуальних величин (наприклад, 1, 5, 7, 10, 11, 14) медіаною буде середня арифметична величинаяка розраховується з двох суміжних величин.

Тобто для знаходження медіани спочатку необхідно визначити її порядковий номер(її положення в ранжированому ряду) за формулою

де n – число одиниць у сукупності.

Чисельне значення медіани визначають за накопиченими частотами дискретному варіаційному ряду. Для цього спочатку слід зазначити інтервал знаходження медіани в інтервальному ряду розподілу. Медіанним називають перший інтервал, де сума накопичених частот перевищує половину спостережень від загальної кількості всіх спостережень.

Чисельне значення медіани

де xМе – нижня межа медіанного інтервалу; i – величина інтервалу; S-1 - накопичена частота інтервалу, яка передує медіанному; f – частота медіанного інтервалу.

Модою (Мо)називають значення ознаки, що зустрічається найчастіше в одиниць сукупності. Для дискретного рядумодою буде варіант з найбільшою частотою. Для визначення моди інтервального ряду спочатку визначають модальний інтервал (інтервал, що має найбільшу частоту). Потім у межах цього інтервалу знаходять значення ознаки, яке може бути модою.

Щоб знайти конкретне значення моди, необхідно використати формулу

де xМо - нижня межа модального інтервалу; iМо – величина модального інтервалу; fМо – частота модального інтервалу; fМо-1 - частота інтервалу, що передує модальному; fМо+1 - частота інтервалу, наступного за модальним.

Мода має широке розповсюдженняв маркетингової діяльностіпри вивченні купівельного попиту, Особливо при визначенні найбільших попитів розмірів одягу та взуття, при регулюванні цінової політики.

Основною метою аналізу варіаційних рядів є виявлення закономірності розподілу, виключаючи у своїй вплив випадкових для цього розподілу чинників. Цього можна досягти, якщо збільшувати обсяг досліджуваної сукупності та одночасно зменшувати інтервал ряду. При спробі зображення цих даних графічно ми отримаємо деяку плавну криву лінію, яка для полігону частот буде деякою межею. Цю лінію називають кривою розподілу.

Іншими словами, крива розподілує графічне зображення у вигляді безперервної лінії зміни частот у варіаційному ряду, яке функціонально пов'язане зі зміною варіант. Крива розподілу відображає закономірність зміни частот за відсутності випадкових факторів. Графічне зображення полегшує аналіз рядів розподілу.

Відомо досить багато форм кривих розподілу, якими може вирівнюватися варіаційний ряд, але у практиці статистичних досліджень найчастіше використовуються такі форми, як нормальний розподіл і розподіл Пуассона.

Нормальний розподіл залежить від двох параметрів: середньої арифметичної та середнього квадратичного відхилення. Його крива виражається рівнянням

де у - ордината кривої нормального розподілу; - стандартизовані відхилення; е та π - математичні постійні; x – варіанти варіаційного ряду; - їх середня величина; - Середнє квадратичне відхилення.

Якщо потрібно отримати теоретичні частоти f" при вирівнюванні варіаційного ряду за кривою нормального розподілу, то можна скористатися формулою

де – сума всіх емпіричних частот варіаційного ряду; h - величина інтервалу у групах; - Середнє квадратичне відхилення; - нормоване відхилення варіантів від середньої арифметичної; всі інші величини легко обчислюються за спеціальними таблицями.

За допомогою цієї формули ми отримуємо теоретичний (імовірнісний) розподіл, замінюючи їм емпіричний (фактичний) розподілЗа характером вони не повинні відрізнятися один від одного.

Проте в ряді випадків, якщо варіаційний ряд є розподілом за дискретною ознакою, де при збільшенні значень ознаки х частоти починають різко зменшуватися, а середня арифметична, у свою чергу, дорівнює або близька за значенням до дисперсії (), такий ряд вирівнюється за кривою Пуассона.

Криву Пуассонаможна висловити ставленням

де Px – ймовірність настання окремих значень х; - Середня арифметична ряду.

При вирівнюванні емпіричних даних теоретичні частоти можна визначити за формулою

де f" - теоретичні частоти; N - загальна кількість одиниць ряду.

Порівнюючи отримані величини теоретичних частот f" c емпіричними (фактичними) частотами f, переконуємося, що їх розбіжності можуть бути невеликими.

Об'єктивна характеристика відповідності теоретичних та емпіричних частот може бути отримана за допомогою спеціальних статистичних показників, які називають критеріями згоди

Для оцінки близькості емпіричних та теоретичних частот застосовуються критерій згоди Пірсона, критерій згоди Романовського, критерій згоди Колмогорова.

Найбільш поширеним є критерій згоди К. Пірсона, Який можна представити як суму відносин квадратів розбіжностей між f" і f до теоретичних частот:

Обчислене значення критерію слід порівняти з табличним (критичним) значенням . Табличне значеннявизначається за спеціальною таблиці, воно залежить від прийнятої ймовірності Р та числа ступенів свободи k (при цьому k = m – 3, де m – число груп у ряді розподілу для нормального розподілу). При розрахунку критерію згоди Пірсона має дотримуватися така умова: досить великою має бути кількість спостережень (n 50), при цьому якщо в деяких інтервалах теоретичні частоти< 5, то интервалы объединяют для условия > 5.

Якщо розбіжності між емпіричними і теоретичними частотами розподілу можуть бути випадковими і припущення про близькість емпіричного розподілу до нормального не може бути відкинуто.

У тому випадку, якщо відсутні таблиці для оцінки випадковості розходження теоретичних та емпіричних частот, можна використовувати критерій згоди В.І. РомановськогоКРом, який, використовуючи величину, запропонував оцінювати близькість емпіричного розподілу кривої нормального розподілу за допомогою відношення

де m – число груп; k = (m – 3) – число ступенів свободи при обчисленні частот нормального розподілу.

Якщо вищезазначене ставлення< 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение >3, то розбіжності можуть бути досить суттєвими і гіпотезу про нормальний розподіл слід відкинути.

Критерій згоди О.М. Колмогоровавикористовується при визначенні максимальної розбіжності між частотами емпіричного та теоретичного розподілу, що обчислюється за формулою

де D - максимальне значеннярізниці між накопиченими емпіричними та теоретичними частотами; - Сума емпіричних частот.

По таблицях значень ймовірностей -критерію можна визначити величину , відповідну ймовірності Р. Якщо величина ймовірності Р значна стосовно знайденої величини , можна припустити, що розбіжності між теоретичним і емпіричним розподілами несуттєві.

Необхідною умовою при використанні критерію згоди Колмогорова є достатньо велике числоспостережень (щонайменше сто).

Першим етапом статистичного вивченняВаріації є побудова варіаційного ряду - упорядкованого розподілу одиниць сукупності за зростаючим (частіше) або за спадаючим (рідше) значенням ознаки та підрахунок числа одиниць з тим чи іншим значенням ознаки.

Існують три форми варіаційного ряду: ранжований, дискретний, інтервальний. Варіаційний ряд часто називають поряд розподілу. Цей термін вживається щодо варіації як кількісних, і некількісних ознак. Ряд розподілу є структурне угруповання (гл. 6).

Ранжированный ряд - це перелік окремих одиниць сукупності порядку зростання (зменшення) досліджуваного ознаки.

Нижче наведено відомості про великі банки Санкт-Петербурга, ранжировані за розмірами власного капіталу на 01.10.1999 р.

Назва банку Власний капітал, млн. руб. Балтонексім банк 169

Банк «Санкт-Петербург» 237

Петровський 268

Балтійський 290

Промбудбанк 1007

Якщо чисельність одиниць сукупності досить велика, ранжований ряд стає громіздким, яке побудова, навіть з допомогою комп'ютера, займає довгий час. У разі варіаційний ряд будується з допомогою групування одиниць сукупності за значенням досліджуваного ознаки.


Визначення числа груп

Число груп у дискретному варіаційному ряду визначається числом реально існуючих значень ознаки, що варіює. Якщо ознака набуває дискретних значень, але їх кількість дуже велика (наприклад, поголів'я худоби на 1 січня року в різних сільськогосподарських підприємствах може становити від нуля до десятків тисяч голів), то будується інтервальний варіаційний ряд. Інтервальний варіаційний ряд будується і для вивчення ознак, які можуть приймати будь-які, як цілі, так і дробові значення

сфери свого існування. Такі, наприклад, рентабельність реалізованої продукції, собівартість одиниці продукції, дохід на одного жителя міста, частка осіб з вищою освітоюсеред населення різних територій та взагалі всі вторинні ознаки, значення яких розраховуються шляхом розподілу величини однієї первинної ознаки на величину іншої (див. гл. 3).

Інтервальний варіаційний ряд є таблицею, що складається з двох граф (або рядків) - інтервалів ознаки, варіація якого вивчається, та числа одиниць сукупності, що потрапляють у даний інтервал (частот), або часткою цього числа від загальної чисельності сукупності (частин).

Найчастіше використовуються два види інтервальних варіаційних рядів: рівноінтервальний та рівночастотний. Рівноінтервальний ряд застосовується, якщо варіація ознаки дуже сильна, тобто. для однорідної сукупності, розподіл якої за цією ознакою близький до нормального закону. (Такий ряд представлений у табл. 5.6). Рівночастотний ряд застосовується, якщо варіація ознаки дуже сильна, проте розподіл не є нормальним, а, наприклад, гіперболічним (табл. 5.5).

При побудові рівноінтервального ряду число груп вибирається так, щоб достатньою мірою відбилися різноманітність значень ознаки в сукупності і в той же час закономірність розподілу, його форма не спотворювалася випадковими коливаннями частот. Якщо груп буде замало, не виявиться закономірність варіації; якщо груп буде надмірно багато, випадкові стрибки частот спотворять форму розподілу.



Межі інтервалів можуть вказуватись різним чином: верхня межа попереднього інтервалу повторює нижню межу наступного, як показано в табл. 5.5 або не повторює.

У разі другий інтервал буде позначений як 15,1-20, третій - як 20,1-25 тощо., тобто. передбачається, що це значення врожайності обов'язково округлені до однієї десятої. Крім того, виникає небажане ускладнення з серединою інтервалу 15,1-20, яка, строго кажучи, вже дорівнюватиме не 17,5, а 17,55; відповідно при заміні заокругленого інтервалу 40-60 на 40,1-60 замість заокругленого значення його середини 50 отримаємо 50,5. Тому краще залишити інтервали з округленим кордоном, що повторюється, і домовитися, що одиниці сукупності, що мають значення ознаки, рівне межі інтервалу, включаються в той інтервал, де це точне значеннявперше вказується. Так, господарство, що має врожайність, що дорівнює 15 ц/га, включається до першої групи, значення 20 ц/га

По-друге і т.д.

Рівночастотний варіаційний ряд необхідний за дуже сильної варіації ознаки тому, що при рівноінтервальному розподілі більшість одиниць сукупності ока-


Таблиця 5.5

Розподіл 100 банків Росії з балансової оцінки активів на 01.01.2000 р.


Межі інтервалів при рівночастотному розподілі - це фактичні величини активів першого, десятого, одинадцятого, двадцятого тощо банків.

Графічне зображення варіаційного ряду

Істотну допомогу в аналізі варіаційного ряду та його властивостей надає графічне зображення. Інтервальний ряд зображується стовпчиковою діаграмою, в якій підстави стовпчиків, розташовані на осі абсцис, - це інтервали значень ознаки, що варіює, а висота стовпчиків - частоти, що відповідають масштабу по осі ординат. Графічне зображення розподілу господарств області з урожайності зернових культур наведено на рис.

5.1. Діаграма цього роду часто називається гістограмою (гр. histos – тканина).

Дані таблиці. 5.6 та рис. 5.1 показують характерну для багатьох ознак форму розподілу: частіше зустрічаються значення середніх інтервалів ознаки, рідше – крайні, малі та великі значення ознаки. Форма цього розподілу близька до аналізованого в курсі математичної статистикизакону нормального розподілу. Великий російський математик А. М. Ляпунов (1857-1918) довів, що нор-

Таблиця 5.6 Розподіл господарств області з урожайності зернових культур


мальний розподіл утворюється, якщо на змінну, що варіює, впливає велика кількість факторів, жоден з яких не має переважаючого впливу. Випадкове поєднання безлічі приблизно рівних факторів, що впливають на варіації врожайності зернових культур, як природних, так і агротехнічних, економічних, створює близьке до нормального закону розподілу господарств області за врожайністю.


Мал. 5.2. Кумулята та огива розподілу господарств по

врожайності

Такий ряд називається кумулятивним. Можна побудувати кумулятивний розподіл «не менше, ніж», а можна

"більше ніж". У першому випадку графік кумулятивного розподілу називається кумулятою, у другому – огивою (рис. 5.2).

Щільність розподілу

Якщо доводиться мати справу з варіаційним рядомз нерівними інтервалами, то порівнянності потрібно частоти, чи частоти, призвести до одиниці інтервалу. Отримане відношення називається щільністю розподілу:


Щільність розподілу використовується як для розрахунку узагальнюючих показників, так і графічного зображенняваріаційних рядів із нерівними інтервалами.

Подаються у вигляді рядів розподілу та оформляються у вигляді.

Ряд розподілу одна із видів угруповань.

Ряд розподілу— є впорядкованим розподілом одиниць досліджуваної сукупності на групи за певною ознакою, що варіює.

Залежно від ознаки, покладеної в основу освіти, ряду розподілу розрізняють атрибутивні та варіаційніряди розподілу:

  • Атрибутивними- Називають ряди розподілу, побудовані за якісними ознаками.
  • Ряди розподілу, побудовані в порядку зростання або зменшення значень кількісної ознаки називаються варіаційними.
Варіаційний ряд розподілу складається із двох стовпців:

У першому стовпці наводяться кількісні значення ознаки, що називаються, які називаються варіантамиі позначаються. Дискретна варіанта - виражається цілим числом. Інтервальний варіант знаходиться в межах від і до. Залежно від типу варіанти, можна побудувати дискретний або інтервальний варіаційний ряд.
У другому стовпці міститься кількість конкретний варіант , Виражене через частоти або частоти:

Частоти- Це абсолютні числа, що показують стільки разів у сукупності зустрічається дане значення ознаки, які позначають . Сума всіх частот дорівнює повинна дорівнювати чисельності одиниць всієї сукупності.

Частини() - Це частоти виражені у відсотках до підсумку. Сума всіх частостей виражених у відсотках повинна дорівнювати 100% у частках одиниці.

Графічне зображення рядів розподілу

Наочно ряди розподілу надаються за допомогою графічних зображень.

Ряди розподілу зображуються у вигляді:
  • Полігона
  • Гістограми
  • Кумуляти
  • Огіви

Полігон

При побудові полігону на горизонтальній осі (вісь абсцис) відкладають значення ознаки, що варіює, а на вертикальній осі (вісь ординат) — частоти або частоти.

Полігон на рис. 6.1 побудований за даними мікроперепису населення Росії у 1994 р.

6.1. Розподіл домогосподарств за розміром

Умова: Наводяться дані про розподіл 25 працівників одного з підприємств за тарифними розрядами:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Завдання: Побудувати дискретний варіаційний ряд та зобразити його графічно у вигляді полігону розподілу
Рішення:
У даному прикладіВипадками є тарифний розряд працівника. Для визначення частот необхідно розрахувати кількість працівників, які мають відповідний тарифний розряд.

Полігон використовують для дискретних варіаційних рядів.

Для побудови полігону розподілу (рис 1) по осі абсцис (X) відкладаємо кількісні значення ознаки, що варіює, - варіанти, а по осі ординат - частоти або частоти.

Якщо значення ознаки виражені як інтервалів, такий ряд називається інтервальним.
Інтервальні рядирозподіли зображують графічно у вигляді гістограми, кумуляти або огива.

Статистична таблиця

Умова: Наведено дані про розміри вкладів 20 фізичних осібв одному банку (тис.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Завдання: Побудувати інтервальний варіаційний ряд із рівними інтервалами.
Рішення:

  1. Вихідна сукупність складається з 20 одиниць (N = 20).
  2. За формулою Стерджеса визначимо необхідна кількістьвикористовуваних груп: n=1+3,322*lg20=5
  3. Обчислимо величину рівного інтервалу: i = (152 - 2) / 5 = 30 тис.руб
  4. Розчленуємо вихідну сукупність на 5 груп з величиною інтервалу в 30 тис. руб.
  5. Результати угруповання подаємо у таблиці:

При такому записі безперервної ознаки, коли та сама величина зустрічається двічі (як верхня межа одного інтервалу і нижня межа іншого інтервалу), то ця величина відноситься до тієї групи, де ця величина виступає в ролі верхньої межі.

Гістограма

Для побудови гістограми по осі абсцис вказують значення меж інтервалів і на їх підставі будують прямокутники, висота яких пропорційна до частот (або частот).

На рис. 6.2. зображено гістограму розподілу населення Росії у 1997 р. за віковими групами.

Мал. 6.2. Розподіл населення Росії за віковими групами

Умова: Наводиться розподіл 30 працівників фірми за розміром місячної заробітної плати

Завдання: Зобразити інтервальний варіаційний ряд графічно у вигляді гістограми та кумуляти.
Рішення:

  1. Невідома межа відкритого (першого) інтервалу визначається за величиною другого інтервалу: 7000 - 5000 = 2000 руб. З тією ж величиною знаходимо нижню межу першого інтервалу: 5000 - 2000 = 3000 руб.
  2. Для побудови гістограми прямокутної системі координат по осі абсцис відкладаємо відрізки, величини яких відповідають інтервалам варицонного ряду.
    Ці відрізки служать нижньою основою, а відповідна частота (частина) - висотою прямокутників, що утворюються.
  3. Побудуємо гістограму:

Для побудови кумуляти необхідно розрахувати накопичені частоти (частини). Вони визначаються шляхом послідовного підсумовування частот (частин) попередніх інтервалів і позначаються S. Накопичені частоти показують, скільки одиниць сукупності мають значення ознаки не більше, ніж аналізоване.

Кумулята

Розподіл ознаки у варіаційному ряду за накопиченими частотами (частинами) зображується за допомогою кумуляти.

Кумулятаабо кумулятивна крива, на відміну від полігону, будується за накопиченими частотами або частотами. У цьому на осі абсцис поміщають значення ознаки, але в осі ординат — накопичені частоти чи частоти (рис. 6.3).

Мал. 6.3. Кумулята розподілу домогосподарств за розміром

4. Розрахуємо накопичені частоти:
Наколінна частота першого інтервалу розраховується так: 0 + 4 = 4, для другого: 4 + 12 = 16; для третього: 4+12+8=24 і т.д.

При побудові кумуляти накопичена частота (частина) відповідного інтервалу присвоюється його верхній межі:

Огіва

Огівабудується аналогічно кумуляті з тією різницею, що накопичені частоти поміщають на осі абсцис, а значення ознаки - на осі ординат.

Різновидом кумуляти є крива концентрації чи графік Лоренца. Для побудови кривої концентрації на обидві осі прямокутної системикоординат наноситься масштабна шкала у відсотках від 0 до 100. У цьому осі абсцис вказують накопичені частоти, але в осі ординат — накопичені значення частки (у відсотках) за обсягом ознаки.

Рівномірному розподілу ознаки відповідає графік діагональ квадрата (рис. 6.4). При нерівномірному розподілі графік є увігнутою кривою залежно від рівня концентрації ознаки.

6.4. Крива концентрації

Працюючи з даними часто виникає потреба з'ясувати, яке місце посідає у сукупному переліку за величиною той чи інший показник. У статистиці це називається ранжируванням. В Excel є інструменти, які дозволяють користувачам швидко і легко зробити цю процедуру. Давайте з'ясуємо, як ними користуватися.

Функції ранжирування

Для виконання ранжирування в Екселі передбачені спеціальні функції. У старих версіях програми був один оператор, призначений для вирішення цього завдання – РАНГ. З метою сумісності він залишений у окремої категоріїформул і в сучасних версіях програми, але в них все ж таки бажано працювати з новішими аналогами, якщо є така можливість. До них відносяться статистичні оператори РАНГ.РВ та РАНГ.СР. Про відмінності та алгоритм роботи з ними ми поговоримо далі.

Спосіб 1: функція РАНГ.РВ

Оператор РАНГ.РВ здійснює обробку даних і виводить у вказану комірку порядковий номер заданого аргументу із сукупного списку. Якщо кілька значень мають однаковий рівень, то оператор виводить вищий із переліку значень. Якщо, наприклад, два значення матимуть однакову величину, їм обом буде присвоєно другий номер, а вже наступне за величиною значення матиме четвертий. До речі, цілком аналогічно надходить і оператор РАНГ у більш старих версіях Екселю, так що дані функції можна вважати ідентичними.

Синтаксис цього оператора записується так:

Аргументи «число» та «посилання» є обов'язковими, а «порядок» – необов'язковим. Як аргумент «число» потрібно ввести посилання на ту комірку, де міститься значення, порядковий номер якого потрібно дізнатися. Аргумент "посилання" містить адресу всього діапазону, який ранжується. Аргумент «порядок» може мати два значення – «0» та «1». У першому випадку відлік порядку йде за спадною, а в другому – за зростаючою. Якщо цей аргумент не вказано, він автоматично вважається програмою рівним нулю.

Дану формулу можна записувати вручну, в ту комірку, де ви хочете, щоб виводився результат обробки, але для багатьох користувачів зручніше задавати вступні через вікно Майстра функцій.


Урок: Майстер функцій в Excel

Спосіб 2: функція РАНГ.

Другою функцією, яка здійснює операцію ранжирування в Екселі, є РАНГ.СР. На відміну від функцій РАНГ і РАНГ.РВ при збігу значень кількох елементів даний оператор видає середній рівень. Тобто, якщо два значення мають рівну величину і йдуть після значення під номером 1, їм обом буде присвоєний номер 2,5.

Синтаксис РАНГ.СР дуже нагадує схему попереднього оператора. Виглядає він так:

Формулу можна вводити вручну або через Майстер функцій. На останньому варіанті ми докладніше та зупинимося.

  1. Виробляємо виділення осередку на аркуші для виведення результату. Так само, як і в попередній раз, переходимо в Майстер функцій через кнопку «Вставити функцію».
  2. Після відкриття вікна Майстра функцій виділяємо в переліку категорії "Статистичні" найменування РАНГ.СР і тиснемо на кнопку "OK".
  3. Активується вікно аргументів. Аргументи у даного оператора такі самі, як і у функції РАНГ.РВ:
    • Число (адреса осередку містить елемент, рівень якого слід визначити);
    • Посилання (координати діапазону, ранжування всередині якого виконується);
    • Порядок (необов'язковий аргумент).

    Внесення даних у поля відбувається таким самим способом, як і в попереднього оператора. Після того, як всі налаштування виконані, натискаємо на кнопку «OK».

  4. Як бачимо, після виконаних дій результат розрахунку був виведений у комірку, зазначену у першому пункті даної інструкції. Сам результат є місцем, яке займає конкретне значення серед інших величин діапазону. На відміну від результату РАНГ.РВ, результат оператора РАНГ.СР може мати дробове значення.
  5. Як і у випадку з попередньою формулою, за допомогою зміни посилань з відносних на абсолютні та маркери виділення, шляхом автозаповнення можна проранжувати весь діапазон даних. Алгоритм дій такий самий.

Урок: Інші статистичні функції у Microsoft Excel

Урок: Як зробити автозаповнення в Ексель

Як бачимо, в Екселі існує дві функції для визначення ранжування конкретного значення в діапазоні даних: РАНГ.РВ та РАНГ.СР. Для старіших версій програми використовується оператор РАНГ, який, насправді, є повним аналогом функції РАНГ.РВ. Головна відмінність формул РАНГ.РВ та РАНГ.СР полягає в тому, що перша з них вказує найвищий рівеньпри збігу значень, а друга виводить середній показнику вигляді десяткового дробу. Це єдина різниця між цими операторами, але його потрібно враховувати при виборі того, якою функцією користувачу краще скористатися.

Ми раді, що змогли допомогти Вам у вирішенні проблеми.

Задайте своє питання у коментарях, детально розписавши суть проблеми. Наші фахівці намагатимуться відповісти максимально швидко.

Чи допомогла вам ця стаття?

Навчимося ранжувати числові дані в Excelза допомогою стандартного сортування, а також функції РАНГ та її окремих випадках (РАНГ.РВ і РАНГ.СР), які допоможуть в автоматизації сортування.

Вітаю всіх, дорогі читачі блогу TutorExcel.Ru.

Завдання ранжирування числових даних постійно виникає у роботі з метою пошуку найбільших чи найменших значень у списку.
В Excel з цим завданням можна впоратися двома способами: стандартним інструментом сортуваннята за допомогою функцій.

Для прикладу візьмемо просту таблицю зі списком числових значень, в якій надалі ранжуватимемо дані:

Сортування даних

Почнемо з найпростішого і доступного варіанта- Сортування.

Ми вже частково розбирали як можна структурувати дані за допомогою фільтра та сортування.
Коротко, для сортування необхідно виділити діапазон даних і на панелі вкладок вибрати Головна -> Редагування -> Сортування та фільтр, а далі вказати за яким критерієм потрібно зробити сортування.

В даному випадку оберемо Сортування за зменшенням, де значення будуть розташовані від більшого до меншого:


Мінусом даного способує зміна структури вихідних даних, оскільки в процесі сортування даних рядки та стовпці можуть змінюватися місцями, що в деяких випадках незручно чи неможливо зробити.
Також до важливим недолікамцього варіанта можна віднести відсутність можливості автоматизувати сортування. Тому щоразу при зміні даних сортування доведеться робити ще раз.

Як розв'язання цієї проблеми розглянемо інший спосіб ранжирування, який можна розглядати і окремо від вирішення цього завдання.

Ранжування даних

За відсутності можливості зміни структури документа ми можемо створити додатковий ряд даних, де будуть порядкові номери вихідних даних.
Отримати ці порядкові номери нам допоможе функція РАНГ(а також РАНГ.РВі РАНГ.СР).

Функція РАНГ в Excel

Синтаксис та опис функції:

  • Число(обов'язковий аргумент) – число для якого обчислюється ранг;
  • Посилання(обов'язковий аргумент) - масив чи посилання масив чисел;
  • Порядок(Необов'язковий аргумент) – спосіб упорядкування. Якщо аргумент дорівнює 0 або не вказаний, то значення 1 присвоюється максимальному елементу в списку (умовно кажучи, сортуємо за спаданням), в іншому випадку значення 1 присвоюється мінімального елемента (сортуємо за зростанням).

Ця функція доступна у всіх версіях Excel, проте починаючи з Excel 2010 на її заміну додані РАНГ.РВі РАНГ.СР, а РАНГзалишена для сумісності з Excel 2007, давайте докладніше зупинимося на їхній роботі.

Функції РАНГ.РВ та РАНГ.СР в Excel

Синтаксис та опис функцій:

РАНГ.РВ(число; посилання;)
Повертає ранг числа у списку чисел: його порядковий номер щодо інших чисел у списку; якщо кілька значень мають однаковий ранг, повертається вищий ранг із цього набору значень.

Аргументи в усіх трьох функцій однакові, тобто. кардинально вони майже не відрізняються, є невелика різниця в деталях.
На прикладі вихідної таблиці подивимося як працює з даними кожна з функцій:


Як бачимо відмінність полягають лише тип ранжування збігаються елементів даних.

У випадку з РАНГ.РВрівним елементам присвоюється вищий ранг.
У нашому прикладі категоріям Ноутбукиі Мультиваркивідповідає однакове значення елемента - 710, який є 3 по порядку спадання, відповідно до обох значень присвоюється вищий ранг - 3.
Для РАНГ.СРтих самих значень встановлюється їхній середній ранг, тобто. середнє між 3 та 4 порядковими номерами - 3,5.

На цьому відмінності між ними закінчуються, тому, залежно від ваших завдань, можна використовувати ту чи іншу функцію.
Якщо потрібно відсортувати значення за зростанням, то як аргумент Порядокпотрібно вказати значення 1:

Автоматичне сортування

Трохи ускладнимо завдання і уявимо, що нам надалі потрібно скласти відсортовану таблицю, яка автоматично оновлювалася при зміні даних у вихідній таблиці.

Наприклад, це можна зробити за допомогою функції ВПР, або комбінації ІНДЕКС та ПОШУКПОЗ, однак у разі наявності однакових значень у списку ми не зможемо коректно підтягнути дані та отримаємо помилку:


У цьому випадку можна скористатися простим прийомому вигляді невеликий хитрощі.
Додамо до кожного значення вихідної таблиці випадкові числа, що не збігаються, близькі до нуля, наприклад, я для цих цілей використовую функції РЯДКУ або СТБЛ, поділені на свідомо велику величину.

Цей крок дозволить нам отримати різні числау вихідних даних, уникнути збігу рангів та помилки при підтягуванні даних:

Тепер для всіх елементів таблиці (навіть які збігаються) визначено свій індивідуальний ранг відмінний від інших, тому помилок при автоматичному ранжируванні даних вдасться уникнути.

Завантажити файл з прикладом.

Дякую за увагу!
Якщо у вас залишилися питання – пишіть у коментарях.

Успіхів вам і до швидких зустрічей на сторінках блогу TutorExcel.Ru!

Для ранжування даних у Excel застосовуються статистичні функції РАНГ, РАНГ.РВ, РАНГ.СР. Усі вони повертають номер числа у ранжованому списку числових значень. Розглянемо докладніше синтаксис, приклади.

Приклад функції РАНГ у Excel

Функція використовується під час ранжирування в переліку чисел. Тобто дозволяє дізнатися величину числа щодо інших числових значень. Якщо відсортувати список за зростанням, функція поверне позицію числа. Наприклад, у масиві чисел (30; 2; 26) число 2 матиме ранг 1; 26 -2; 30 -3 (як найбільше значенняв списку).

Синтаксис функції:

  1. Число. Для якого необхідно визначити номер у ранжируванні.
  2. Посилання. На масив чисел чи діапазон осередків із числовими значеннями. Якщо задати як аргумент просто числа, то функція поверне помилку. Нечисловим значенням номер не надається.
  3. Порядок. Спосіб упорядкування чисел у списку. Варіанти: аргумент дорівнює «0» чи опущений – значення 1 присвоюється максимальному числу у списку (начебто список відсортований гаразд зменшення); аргумент дорівнює будь-якому нерівному нулю числу – номер ранжирування 1 присвоюється мінімальному числу у списку (начебто список відсортований у порядку зростання).

Визначимо ранжування чисел у списку без повторів:

Аргумент, що визначає спосіб упорядкування чисел, дорівнює «0». Отже, у цій функції номери надавали значенням від більшого до меншого. Максимальному числу 87 надано номер 1.

У третьому стовпці наведено формулу з рангом зростання.

Визначимо номери значень у списку, де присутні значення, що повторюються.

Жовтим кольором виділені числа, що повторюються. Для них визначається той самий номер. Наприклад, числу 7 у другому стовпці надано номер 9 (і в другому рядку, і в дев'ятому); у третьому стовпці – 3. Але жодне з чисел у другому стовпці не матиме 10, а третьому – 4.

Щоб ранги не повторювалися (іноді це заважає користувачеві вирішити поставлене завдання), використовується така формула:

Для роботи функції можна встановити межі. Наприклад, необхідно ранжувати лише значення від 0 до 30. Щоб розв'язати задачу, застосуємо функцію ЯКЩО (=ЯКЩО(A2

Сірим кольором виділено значення, які відповідають заданій умові. Для чисел більше 30 виводиться порожній рядок.

Приклад функції РАНГ.РВ Excel

У версіях Excel з 2010 року з'явилася функція РАНГ.РВ. Це абсолютний аналог попередньої функції. Синтаксис такий самий. Літери «РВ» у назві вказують на те, що при виявленні формулою однакових значень функція поверне найвищий номер ранжирування (тобто першого виявленого елемента у переліку рівних).

Як видно з прикладу, дана функціяобробляє повторювані числа у списку так само, як і у звичайній формулі. Якщо потрібно уникнути повторень рангів, використовуємо іншу формулу (див. вище).

Приклад функції РАНГ.СР в Excel

Повертає номери числового значення у списку (порядковий номер щодо інших значень). Тобто виконує те саме завдання. Тільки за виявлення ідентичних значень повертає середній показник.

Ось результат роботи функції:

Формула в стовпці «за спаданням»: = РАНГ.СР (A2; $ A $ 2: $ A $ 9; 0). Так, функція значення 87 привласнила середній номер 1,5.

Припустимо, у списку чисел три значення, що повторюються (виділені помаранчевим кольором).

Функція надала кожному з них ранг 5, що є середнім для 4, 5 і 6.

Порівняємо роботу двох функцій:

Нагадаємо, що ці дві функції працюють лише в Excel 2010 та вище. У ранніх версіях цих цілей можна задіяти формулу масиву.

Завантажити приклади функції ранжування РАНГ у Excel.

Таким чином, усі вищенаведені приклади дозволяють автоматизувати роботу з ранжирування даних та складання рейтингу значень без застосування сортування.

Схожі статті

2023 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.