Скласти інтервальний варіаційний ряд та побудувати гістограму. Побудова інтервального варіаційного ряду для безперервних кількісних даних

Лабораторна робота №1. Первинна обробка статистичних даних

Побудова рядів розподілу

Упорядкований розподіл одиниць сукупності на групи за якоюсь однією ознакою називається поряд розподілу . При цьому ознака може бути як кількісною, тоді ряд називається варіаційним , так і якісним, тоді ряд називають атрибутивним . Так, наприклад, населення міста може бути розподілене за віковими групами в варіаційний ряд, або за професійною приналежністю до атрибутивного ряду (звісно, ​​можна запропонувати ще безліч якісних та кількісних ознак для побудови рядів розподілу, вибір ознаки визначається завданням статистичного дослідження).

Будь-який ряд розподілу характеризується двома елементами:

- варіанти(х i) - Це окремі значення ознаки одиниць вибіркової сукупності. Для варіаційного рядуваріанти приймає числові значення, для атрибутивного - якісні (наприклад, х = "державний службовець");

- частота(n i) - Число, що показує, скільки разів зустрічається те чи інше значення ознаки. Якщо частота виражена відносним числом (тобто частиною елементів сукупності, відповідних даному значенню варіанти, у загальному обсязі сукупності), то вона називається відносною частотоюабо частістю.

Варіаційний ряд може бути:

- дискретним, коли досліджуваний ознака характеризується певним числом (зазвичай цілим).

- інтервальним, коли визначено межі «від» і «до» для безперервно варіюється ознаки. Інтервальний ряд також будують якщо безліч значень дискретно ознаки, що варіюється, велике.

Інтервальний ряд може будуватися як із інтервалами рівної довжини(Рівноінтервальний ряд) так і з неоднаковими інтервалами, якщо це диктується умовами статистичного дослідження. Наприклад, може розглядатися низка розподілу доходів населення з такими інтервалами:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



де k - Число інтервалів, n - обсяг вибірки. (Звичайно, формула зазвичай дає число дробове, а як число інтервалів вибирається найближче ціле до отриманого число.) Довжина інтервалу в такому випадку визначається за формулою

.

Графічно варіаційні ряди можуть бути подані у вигляді гістограми(Над кожним інтервалом інтервального ряду вибудовується «стовпчик» висоти, що відповідає частоті в цьому інтервалі), полігону розподілу(Ламана лінія, що з'єднує точки ( х i;n i) або кумуляти(Будується за накопиченими частотами, тобто для кожного значення ознаки береться частота появи в сукупності об'єктів зі значенням ознаки меншою від даного).

При роботі в Excel для побудови варіаційних рядів можуть бути використані такі функції:

РАХУНОК( масив даних) – визначення обсягу вибірки. Аргументом є діапазон осередків, у якому перебувають вибіркові дані.

ЗЛІЧИЛИ( діапазон; критерій) – може бути використана для побудови атрибутивного чи варіаційного ряду. Аргументами є діапазон масиву вибіркових значень ознаки та критерій – числове чи текстове значення ознаки чи номер комірки, де вона перебуває. Результатом є частота появи цього значення вибірці.

ЧАСТОТА( масив даних; масив інтервалів) – на побудову варіаційного ряду. Аргументами є діапазон масиву вибіркових даних та стовпець інтервалів. Якщо потрібно побудувати дискретний ряд, то вказуються значення варіанти, якщо інтервальний – то верхні межі інтервалів (їх ще називають «кишенями»). Оскільки результатом є стовпець частот, введення функції слід завершити натисканням клавіш CTRL+SHIFT+ENTER. Зауважимо, що задаючи масив інтервалів при введенні функції, останнє значення в ньому можна і не вказувати – у відповідну «кишеню» будуть поміщені всі значення, які не потрапили до попередніх «кишень». Іноді це допомагає уникнути помилки, яка полягає в тому, що найбільше вибіркове значення не поміщається автоматично в останню «кишеню»

Крім того, для складних угруповань (за декількома ознаками) використовують інструмент «зведені таблиці». Для побудови атрибутивних та варіаційних рядів їх також можна використовувати, але це надмірно ускладнює завдання. Також для побудови варіаційного ряду та гістограми існує процедура "гістограма" з надбудови "Пакет аналізу" (щоб використовувати надбудови в Excel, їх потрібно спочатку завантажити, за замовчуванням вони не встановлюються)

Проілюструємо процес первинної обробки даних на прикладах.

Приклад 1.1. є дані про кількісний склад 60 сімей.

Побудувати варіаційний ряд та полігон розподілу

Рішення.

Відкриємо таблиці Excel. Введемо масив даних діапазон А1:L5. Якщо Ви вивчаєте документ в електронній формі (у форматі Word, наприклад), для цього достатньо виділити таблицю з даними та скопіювати її в буфер, потім виділити комірку А1 та вставити дані – вони автоматично займуть відповідний діапазон. Підрахуємо обсяг вибірки n – число вибіркових даних, при цьому в комірку В7 введемо формулу =РАХУНОК(А1:L5). Зауважимо, що для того, щоб у формулу ввести потрібний діапазон, необов'язково вводити його позначення з клавіатури, достатньо його виділити. Визначимо мінімальне та максимальне значення у вибірці, ввівши в комірку В8 формулу = МІН (А1: L5), і в комірку В9: = МАКС (А1: L5).

Рис.1.1 Приклад 1. Первинна обробка статистичних даних у таблицях Excel

Далі, підготуємо таблицю для побудови варіаційного ряду, ввівши назви для стовпця інтервалів (значень варіанти) та стовпця частот. У стовпець інтервалів введемо значення ознаки від мінімальної (1) до максимальної (6), зайнявши діапазон В12: В17. Виділимо стовпець частот, введемо формулу = ЧАСТОТА (А1: L5; В12: В17) і натиснемо клавіші CTRL + SHIFT + ENTER

Рис.1.2 Приклад 1. Побудова варіаційного ряду

Для контролю обчислимо суму частот за допомогою функції СУМ (значок функції S у групі "Редагування" на вкладці "Головна"), обчислена сума повинна збігтися з раніше обчисленим обсягом вибірки в комірці В7.

Тепер побудуємо полігон: виділивши отриманий діапазон частот, виберемо команду Графік на вкладці Вставка. За замовчуванням значеннями на горизонтальній осі будуть порядкові числа - у разі від 1 до 6, що збігається зі значеннями варіанти (номерами тарифних розрядів).

Назва ряду діаграми "ряд 1" можна або змінити, скориставшись тією ж опцією "вибрати дані" вкладки "Конструктор", або просто видалити.

Рис.1.3. Приклад 1. Побудова полігону частот

Приклад 1.2. Є дані про викиди забруднюючих речовин із 50 джерел:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Скласти рівноінтервальний ряд, побудувати гістограму

Рішення

Внесемо масив даних у лист Excel, він займе діапазон А1: J5 Як і в попередній задачі, визначимо обсяг вибірки n, мінімальне та максимальне значення у вибірці. Оскільки тепер потрібно не дискретний, а інтервальний ряд, і кількість інтервалів у задачі не задано, обчислимо кількість інтервалів k за формулою Стерджесса. Для цього в комірку В10 введемо формулу = 1 +3,322 * LOG10 (B7).

Рис.1.4. Приклад 2. Побудова рівноінтервального ряду

Отримане значення не є цілим, воно дорівнює приблизно 6,64. Оскільки при k=7 довжина інтервалів виражатиметься цілим числом (на відміну від випадку k=6) виберемо k=7, ввівши це значення в комірку С10. Довжину інтервалу d обчислимо в осередку В11, ввівши формулу = (В9-В8)/С10.

Задамо масив інтервалів, вказуючи для кожного з 7 інтервалів верхню межу. Для цього в комірці Е8 обчислимо верхню межу першого інтервалу, ввівши формулу B8 + B11; у осередку Е9 верхню межу другого інтервалу, ввівши формулу =E8+B11. Для обчислення значень верхніх меж інтервалів, що залишилися, зафіксуємо номер комірки В11 у введеній формулі за допомогою знака $, так що формула в комірці Е9 набуде вигляду =E8+B$11, і скопіюємо вміст комірки Е9 в комірки Е10-Е14. Останнє отримане значення дорівнює обчисленому раніше в осередку В9 максимальному значенню у вибірці.

Рис.1.5. Приклад 2. Побудова рівноінтервального ряду


Тепер заповнимо масив "кишень" за допомогою функції ЧАСТОТА, як це було зроблено в прикладі 1.

Рис.1.6. Приклад 2. Побудова рівноінтервального ряду

По отриманому варіаційному ряду збудуємо гістограму: виділимо стовпець частот і виберемо на вкладці «Вставка» «Гістограма». Отримавши гістограму, змінимо в ній підписи горизонтальної осі на значення в діапазоні інтервалів, для цього виберемо опцію "Вибрати дані" вкладки "Конструктор". У вікні виберемо команду «Змінити» для розділу «Підписи горизонтальної осі» і введемо діапазон значень варіанти, виділивши його «мишею».

Рис.1.7. Приклад 2. Побудова гістограми

Рис.1.8. Приклад 2. Побудова гістограми

Математична статистика- розділ математики, присвячений математичним методам обробки, систематизації та використання статистичних даних для наукових та практичних висновків.

3.1. ОСНОВНІ ПОНЯТТЯ МАТЕМАТИЧНОЇ СТАТИСТИКИ

У медико-біологічних завданнях часто доводиться досліджувати розподіл тієї чи іншої ознаки для великої кількості індивідуумів. У різних індивідуумів ця ознака має різне значення, тому вона є випадковою величиною. Наприклад, будь-який лікувальний препарат має різну ефективність при його застосуванні до різних пацієнтів. Однак для того, щоб скласти уявлення про ефективність даного препарату, немає необхідності застосовувати його до всімхворим. Можна простежити результати застосування препарату до порівняно невеликої групи хворих та на підставі отриманих даних виявити суттєві риси (ефективність, протипоказання) процесу лікування.

Генеральна сукупність- Підлягає вивченню сукупність однорідних елементів, що характеризуються певною ознакою. Ця ознака є безперервнийвипадковою величиною із щільністю розподілу f(x).

Наприклад, якщо нас цікавить поширеність будь-якого захворювання в деякому регіоні, то генеральна сукупність – все населення регіону. Якщо ж ми хочемо з'ясувати схильність до цього захворювання чоловіків і жінок окремо, слід розглядати дві генеральні сукупності.

Для вивчення властивостей генеральної сукупностівідбирають деяку частину її елементів.

Вибірка- частина генеральної сукупності, яка обирається для обстеження (лікування).

Якщо це не викликає непорозумінь, то вибіркою називають як сукупність об'єктів,відібраних для обстеження, так і сукупність

значеньдосліджуваного ознаки, отриманих під час обстеження. Ці значення можуть бути декількома способами.

Простий статистичний ряд -значення досліджуваного ознаки, записані у порядку, де вони були отримані.

Приклад простого статистичного ряду, отриманого при вимірюванні швидкості поверхневої хвилі (м/с) у шкірі чола у 20 пацієнтів наведено у табл. 3.1.

Таблиця 3.1.Простий статистичний ряд

Простий статистичний ряд - основний і найповніший спосіб запису результатів обстеження. Він може містити сотні елементів. Окинути таку сукупність одним поглядом дуже важко. Тому великі вибірки зазвичай розбиваються на групи. Для цього область зміни ознаки розбивають на декілька (N) інтерваліврівної ширини та підраховують відносні частоти (n/n) попадання ознаки в ці інтервали. Ширина кожного інтервалу дорівнює:

Межі інтервалів мають такі значення:

Якщо якийсь елемент вибірки є межею між двома сусідніми інтервалами, його відносять до лівомуінтервалу. Згруповані таким чином дані називають інтервальним статистичним рядом.

- це таблиця, в якій наведено інтервали значень ознаки та відносні частоти влучення ознаки в ці інтервали.

У нашому випадку можна утворити, наприклад, такий інтервальний статистичний ряд (N = 5, d= 4), табл. 3.2.

Таблиця 3.2.Інтервальний статистичний ряд

Тут до інтервалу 28-32 віднесено два значення, рівні 28 (табл. 3.1), а до інтервалу 32-36 - значення 32, 33, 34 і 35.

Інтервальний статистичний ряд можна зобразити графічно. Для цього по осі абсцис відкладають інтервали значень ознаки і на кожному з них, як на підставі, будують прямокутник з висотою, що дорівнює відносній частоті. Отримана стовпцева діаграма називається гістограмою.

Рис. 3.1.Гістограма

На гістограмі статистичні закономірності розподілу ознаки проглядаються досить чітко.

При великому обсязі вибірки (кілька тисяч) та малій ширині стовпців форма гістограми близька до форми графіка густини розподілуознаки.

Число стовпців гістограми можна вибрати за такою формулою:

Побудова гістограми вручну – процес довгий. Тому розроблені комп'ютерні програми їх автоматичного побудови.

3.2. ЧИСЛОВІ ХАРАКТЕРИСТИКИ СТАТИСТИЧНОГО РЯДУ

Багато статистичних процедур використовують вибіркові оцінки для математичного очікування та дисперсії (або СКО) генеральної сукупності.

Вибіркове середнє(Х) - це середнє арифметичне всіх елементів простого статистичного ряду:

Для нашого прикладу Х= 37,05 (м/с).

Вибіркове середнє - ценайкращаоцінка генерального середньогоМ.

Вибіркова дисперсія s 2дорівнює сумі квадратів відхилень елементів від вибіркового середнього, поділеної на n- 1:

У прикладі s 2 = 25,2 (м/с) 2 .

Зверніть увагу, що при обчисленні вибіркової дисперсії у знаменнику формули стоїть не обсяг вибірки n, а n-1. Це з тим, що з обчисленні відхилень у формулі (3.3) замість невідомого математичного очікування використовується його оцінка - вибіркове середнє.

Вибіркова дисперсія – це найкращаоцінка генеральної дисперсії (? 2).

Вибіркове середньоквадратичне відхилення(s) - це квадратний корінь із вибіркової дисперсії:

Для нашого прикладу s= 5,02 (м/с).

Вибіркове середньоквадратичневідхилення – це найкраща оцінка генерального СКО (σ).

При необмеженому збільшенні обсягу вибірки всі вибіркові характеристики прагнуть відповідним характеристикам генеральної сукупності.

Для обчислення вибіркових показників застосовують комп'ютерні формули. У додатку Excel ці обчислення виконують статистичні функції СРЗНАЧ, ДИСП. СТАНДОТКЛОН.

3.3. ІНТЕРВАЛЬНА ОЦІНКА

Всі вибіркові характеристики є випадковими величинами.Це означає, що для іншої вибірки того ж обсягу значення вибіркових характеристик вийдуть іншими. Таким чином, вибіркові

характеристики є лише оцінкамивідповідних показників генеральної сукупності.

Недоліки вибіркового оцінювання компенсує інтервальна оцінка,представляюча числовий інтервал,всередині якого із заданою ймовірністю Р дзнаходиться справжнє значення параметра, що оцінюється.

Нехай U r – деякий параметр генеральної сукупності (генеральна середня, генеральна дисперсія тощо).

Інтервальною оцінкоюпараметра U r називається інтервал (U 1 , U 2),що задовольняє умові:

P(U < Ur < U2) = Рд. (3.5)

Ймовірність Р дназивається довірчою ймовірністю.

Довірча ймовірність Рд - ймовірність того, що справжнє значення оцінюваної величини знаходиться всерединівказаного інтервалу.

При цьому інтервал (U 1, U 2)називається довірчим інтерваломдля параметра, що оцінюється.

Часто замість довірчої ймовірності використовують зв'язану з нею величину α = 1 – Р д, яка називається рівнем значимості.

Рівень значущості- це ймовірність того, що справжнє значення параметра, що оцінюється, знаходиться за межамидовірчого інтервалу.

Іноді α і Р д виражають у відсотках, наприклад, 5% замість 0,05 та 95% замість 0,95.

При інтервальному оцінюванні спочатку вибирають відповідну довірчу ймовірність(зазвичай 0,95 або 0,99), а потім знаходять відповідний інтервал значень параметра, що оцінюється.

Зазначимо деякі загальні властивості інтервальних оцінок.

1. Чим нижчий рівень значущості (чим більше Р д),тим ширше інтервальна оцінка. Так, якщо за рівня значимості 0,05 інтервальна оцінка генерального середнього становить 34,7< М< 39,4, то для уровня 0,01 она будет гораздо шире: 33,85 < М< 40,25.

2. Чим більший обсяг вибірки n,Тим більше що інтервальна оцінка з обраним рівнем значимості. Нехай, наприклад, 5 - процентна оцінка генеральної середньої (?=0,05), отримана за вибіркою з 20 елементів, тоді 34,7< М< 39,4.

Збільшивши обсяг вибірки до 80, ми при тому рівні значимості отримаємо більш точну оцінку: 35,5< М< 38,6.

У випадку побудова надійних довірчих оцінок вимагає знання закону, яким оцінюваний випадковий ознака розподілено у генеральній сукупності. Розглянемо, як будується інтервальна оцінка генерального середньогоознаки, яка розподілена в генеральній сукупності за нормальномузакону.

3.4. ІНТЕРВАЛЬНА ОЦІНКА ГЕНЕРАЛЬНОГО СЕРЕДНЬОГО ДЛЯ НОРМАЛЬНОГО ЗАКОНУ РОЗПОДІЛУ

Побудова інтервальної оцінки генерального середнього М для генеральної сукупності з нормальним законом розподілу ґрунтується на наступній властивості. Для вибірки обсягу nставлення

підпорядковується розподілу Стьюдента з числом ступенів свободи = n- 1.

Тут Х- вибіркове середнє, а s- Вибіркове СКО.

Використовуючи таблиці розподілу Стьюдента або їх комп'ютерний аналог, можна знайти таке граничне значення, що з заданою довірчою ймовірністю виконується нерівність:

Цій нерівності відповідає нерівність для М:

де ε - напівширина довірчого інтервалу.

Таким чином, побудова довірчого інтервалу М проводиться в наступній послідовності.

1. Вибирають довірчу ймовірність Р д (зазвичай 0,95 або 0,99) і для неї за таблицею розподілу Стьюдента знаходять параметр t

2. Розраховують напівширину довірчого інтервалу ε:

3. Отримують інтервальну оцінку генерального середнього з обраною довірчою ймовірністю:

Коротко це записується так:

Для знаходження інтервальних оцінок розроблено комп'ютерні процедури.

Пояснимо, як скористатися таблицею розподілу Стьюдента. Ця таблиця має два «входи»: лівий стовпець, який називається числом ступенів свободи ν = n- 1, і верхній рядок – рівень значущості α. На перетині відповідного рядка та стовпця знаходять коефіцієнт Стьюдента t.

Застосуємо цей метод до нашої вибірки. Фрагмент таблиці розподілу Стьюдента наведено нижче.

Таблиця 3.3. Фрагмент таблиці розподілу Стьюдента

Простий статистичний ряд для вибірки із 20 осіб (n= 20, =19) представлений в табл. 3.1. Для цього ряду розрахунки за формулами (3.1-3.3) дають: Х= 37,05; s= 5,02.

Виберемо α = 0,05 (Р д = 0,95). На перетині рядка «19» та стовпця «0,05» знайдемо t= 2,09.

Обчислимо точність оцінки за формулою (3.6): ε = 2,09?5,02/λ/20 = 2,34.

Побудуємо інтервальну оцінку: з ймовірністю 95% невідоме генеральне середнє задовольняє нерівність:

37,05 - 2,34 < М< 37,05 + 2,34, или М= 37,05 ± 2,34 (м/с), Р д = 0,95.

3.5. МЕТОДИ ПЕРЕВІРКИ СТАТИСТИЧНИХ ГІПОТЕЗ

Статистичні гіпотези

Перш ніж сформулювати, що таке статистична гіпотеза, розглянемо такий приклад.

Для порівняння двох методик лікування деякого захворювання було відібрано дві групи пацієнтів по 20 осіб, лікування яких проводилось за цими методиками. Для кожного пацієнта фіксувалося кількість процедур,після якого досягався позитивний ефект. За цими даними кожної групи знаходилися вибіркові середні (Х), вибіркові дисперсії (s 2)та вибіркові СКО (s).

Результати представлені у табл. 3.4.

Таблиця 3.4

Кількість процедур, необхідне отримання позитивного ефекту, - випадкова величина, вся інформація про яку на даний момент міститься в наведеній вибірці.

З табл. 3.4 видно, що вибіркове середнє у першій групі менше, ніж у другій. Чи означає це, що й для генеральних середніх має місце таке саме співвідношення: М 1< М 2 ? Достаточно ли статистических данных для такого вывода? Ответы на эти вопросы и дает статистична перевірка гіпотез.

Статистична гіпотеза- це припущення щодо властивостей генеральних сукупностей.

Ми розглядатимемо гіпотези про властивості двохгенеральних сукупностей.

Якщо генеральні сукупності мають відомі, однаковірозподілу оцінюваної величини, а припущення стосуються величин деякого параметрацього розподілу, то гіпотези називаються параметричними.Наприклад, вибірки вилучені з генеральних сукупностей нормальним закономрозподілу та однаковою дисперсією. Потрібно з'ясувати, чи однаковігенеральні середні ці сукупності.

Якщо про закони розподілу генеральних сукупностей нічого не відомо, то гіпотези про їхні властивості називають непараметричними.Наприклад, чи однаковізакони розподілу генеральних сукупностей, у тому числі вилучені вибірки.

Нульова та альтернативна гіпотези.

Завдання перевірки гіпотез. Рівень значущості

Познайомимося з термінологією, що застосовується під час перевірки гіпотез.

Н 0 – нульова гіпотеза (гіпотеза скептика) – це гіпотеза про відсутність відмінностейміж порівнюваними вибірками. Скептик вважає, що різницю між вибірковими оцінками, отриманими за результатами досліджень, - випадкові;

Н 1- Альтернативна гіпотеза (гіпотеза оптиміста) - це гіпотеза про наявність відмінностей між порівнюваними вибірками. Оптиміст вважає, що різницю між вибірковими оцінками викликані об'єктивними причинами і відповідають відмінностям генеральних сукупностей.

Перевірка статистичних гіпотез здійсненна лише тоді, коли з елементів порівнюваних вибірок можна скласти деяку величину(критерій), закон розподілу якої у разі справедливості Н 0відомий. Тоді для цієї величини можна вказати довірчий інтервал,в який із заданою ймовірністю Р дпопадає її значення. Цей інтервал називають критичною областю.Якщо значення критерію потрапляє у критичну область, то приймається гіпотеза Н0.В іншому випадку приймається гіпотеза Н1.

У медичних дослідженнях використовують Р д = 0,95 або Р д = 0,99. Цим значенням відповідають рівні значущостіα = 0,05 або α = 0,01.

Під час перевірки статистичних гіпотезрівнем значимості(α) називається ймовірність відхилення нульової гіпотези, коли вона вірна.

Зверніть увагу на те, що за своєю суттю процедура перевірки гіпотез спрямована на виявлення відмінностей,а не на підтвердження їхньої відсутності. При виході значення критерію межі критичної області ми можемо з чистим серцем сказати «скептику» - ну що, Ви ще хочете?! Якби відмінностей не було, то з ймовірністю 95% (або 99%) розрахункове значення було б у зазначених межах. Адже ні!..

Ну а якщо значення критерію потрапляє в критичну область, то немає підстав вважати, що гіпотеза Н 0 вірна. Це, швидше за все, вказує на одну із двох можливих причин.

1. Обсяги вибірок недостатньо великі, щоб виявити наявні відмінності. Цілком ймовірно, що продовження експериментів принесе успіх.

2. Відмінності є. Але вони настільки малі, що немає практичного значення. І тут продовження експериментів немає сенсу.

Перейдемо до розгляду деяких статистичних гіпотез, які у медичних дослідженнях.

3.6. ПЕРЕВІРКА ГІПОТЕЗ ПРО РІВНІСТЬ ДИСПЕРСІЙ, F-КРИТЕРІЙ ФІШЕРА

У деяких клінічних дослідженнях про позитивний ефект свідчить не так величинадосліджуваного параметра, скільки його стабілізація,зменшення його коливань. І тут виникає питання порівняння двох генеральних дисперсій за результатами вибіркового обстеження. Це завдання може бути вирішено за допомогою критерію Фішера.

Постановка задачі

нормальним закономрозподілу. Обсяги вибірок -

n 1і n 2 ,а вибіркові дисперсіїрівні s 1 та s 2 2 генеральні дисперсії.

Перевірені гіпотези:

Н 0- генеральні дисперсії однакові;

Н 1- генеральні дисперсії різні.

Показано, якщо вибірки вилучені з генеральних сукупностей нормальним закономрозподілу, то за справедливості гіпотези Н 0Відношення вибіркових дисперсій підпорядковується розподілу Фішера. Тому як критерій для перевірки справедливості Н 0береться величина F,обчислювана за формулою:

де s 1 та s 2 - вибіркові дисперсії.

Це відношення підпорядковується розподілу Фішера з числом ступенів свободи чисельника ν 1 = n 1- 1 та числом ступенів свободи знаменника ν 2 = n 2 - 1. Кордони критичної області знаходяться за таблицями розподілу Фішера або за допомогою комп'ютерної функції БРАСПОБР.

Наприклад, поданого у табл. 3.4, отримаємо: 1 = 2 = 20 - 1 = 19; F= 2,16/4,05 = 0,53. При α = 0,05 межі критичної області рівні відповідно: = 0,40 = 2,53.

Значення критерію потрапило у критичну область, тому приймається гіпотеза Н 0:генеральні дисперсії вибірок однакові.

3.7. ПЕРЕВІРКА ГІПОТЕЗ ЩОДО РІВНОСТІ СЕРЕДНІХ, t-КРИТЕРІЙ СТЬЮДЕНТА

Завдання порівняння середніхдвох генеральних сукупностей виникає, коли практичне значення має саме величинадосліджуваного ознаки. Наприклад, коли порівнюються терміни лікування двома різними методами або кількість ускладнень, що виникають при їх застосуванні. І тут можна використовувати t-критерій Стьюдента.

Постановка задачі

Отримано дві вибірки (Х 1 ) і (Х 2 ), вилучені з генеральних сукупностей нормальним закономрозподілу та однаковими дисперсіями.Обсяги вибірок - n 1 і n 2 вибіркові середнірівні Х1 і Х2, а вибіркові дисперсії- s 1 2 та s 2 2відповідно. Потрібно порівняти між собою генеральні середні.

Перевірені гіпотези:

Н 0- генеральні середні однакові;

Н 1- генеральні середні різні.

Показано, що у разі справедливості гіпотези Н 0величина t, що обчислюється за формулою:

розподілено згідно із законом Стьюдента з числом ступенів свободи ν = ν 1 + + ν2 - 2.

Тут де ν 1 = n 1 - 1 - число ступенів свободи першої вибірки; ν 2 = n 2 – 1 – число ступенів свободи для другої вибірки.

Межі критичної області знаходять за таблицями t-розподілу або за допомогою комп'ютерної функції СТЬЮДРАСПОБР. Розподіл Стьюдента симетрично щодо нуля, тому ліва і права межі критичної області однакові за модулем і протилежні за знаком: -і

Наприклад, поданого у табл. 3.4, отримаємо:

ν 1 = ν 2 = 20 - 1 = 19; ν = 38, t= -2,51. При α = 0,05 = 2,02.

Значення критерію виходить за лівий кордон критичної області, тому приймаємо гіпотезу Н 1:генеральні середні різні.При цьому середня генеральна сукупність першої вибіркиМЕНШЕ.

Застосовність t-критерію Стьюдента

Критерій Стьюдента застосовний тільки до вибірок з нормальнихсукупностей з однаковими генеральними дисперсіями.Якщо хоча б одну з умов порушено, то застосовність критерію сумнівна. Вимога нормальності генеральної сукупності зазвичай ігнорують, посилаючись на центральну граничну теорему.Дійсно, різниця вибіркових середніх, що стоїть у чисельнику (3.10), може вважатися нормально розподіленою при ν > 30. Але питання про рівність дисперсій перевірці не підлягає, і посилання на те, що критерій Фішера не виявив відмінностей, брати до уваги не можна. Проте t-критерій досить широко застосовується виявлення відмінностей у середніх значеннях генеральних сукупностей, хоча й без достатніх підстав.

Нижче розглядається непараметричний критерій,який з успіхом використовують для цих же цілей і який не вимагає жодного нормальності,ні рівності дисперсій

3.8. НЕПАРАМЕТРИЧНЕ ПОРІВНЯННЯ ДВОХ ВИБІРОК: КРИТЕРІЙ МАННА-УИТНІ

Непараметричні критерії призначені виявлення відмінностей у законах розподілу двох генеральних сукупностей. Критерії, які чутливі до відмінностей генеральних середніх,називають критеріями зсуву.Критерії, які чутливі до відмінностей генеральних дисперсій,називають критеріями масштабу.Критерій Манна-Уітні відноситься до критеріїв зсувуі використовується для виявлення відмінностей у середніх значеннях двох генеральних сукупностей, вибірки з яких представлені в ранговій шкалі.Виміряні ознаки розташовуються на цій шкалі в порядку зростання, а потім нумеруються цілими числами 1, 2... Ці числа називаються рангами.Рівним величинам надають однакові ранги. Значення має сама величина ознаки, а лише порядкове місце,що вона займає серед інших величин.

У табл. 3.5. перша група з таблиці 3.4 представлена ​​в розгорнутому вигляді (рядок 1), піддана ранжируванню (стоку 2), а потім ранги однакових величин замінені середньоарифметичними значеннями. Наприклад, елементи 4 і 4, що стоять у першому рядку, отримали ранги 2 і 3, які замінені на однакові значення 2,5.

Таблиця 3.5

Постановка задачі

Незалежні вибірки (Х 1)і (Х 2)вилучені з генеральних сукупностей із невідомими законами розподілу. Обсяги вибірок n 1і n 2відповідно. Значення елементів вибірок представлені в ранговій шкалі.Потрібно перевірити, чи різняться ці генеральні сукупності між собою?

Перевірені гіпотези:

Н 0- вибірки належать до однієї генеральної сукупності; Н 1- вибірки належать до різних генеральних сукупностей.

Для перевірки таких гіпотез застосовується (/- критерій Манна-Уітні).

Спочатку двох вибірок складається об'єднана вибірка (X), елементи якої ранжируются. Потім перебуває сума рангів, відповідних елементам першої вибірки. Ця сума є критерієм для перевірки гіпотез.

U= Сумі рангів першої вибірки. (3.11)

Для незалежних вибірок, обсяги яких більші за 20, величина Uпідкоряється нормальному розподілу, математичне очікуваннята СКО якого рівні:

Тому межі критичної області перебувають у таблицях нормального розподілу.

Наприклад, поданого у табл. 3.4, отримаємо: ν 1 = ν 2 = 20 - 1 = 19, U= 339, μ = 410, σ = 37. Для α = 0,05 отримаємо: і лев = 338, і прав = 482.

Значення критерію виходить за ліву межу критичної області, тому приймається гіпотеза Н1: генеральні сукупності мають різні закони розподілу. При цьому середня генеральна сукупність першої вибіркиМЕНШЕ.

Подаються у вигляді рядів розподілу та оформляються у вигляді.

Ряд розподілу одна із видів угруповань.

Ряд розподілу— є впорядкованим розподілом одиниць досліджуваної сукупності на групи за певною ознакою, що варіює.

Залежно від ознаки, покладеної в основу освіти, ряду розподілу розрізняють атрибутивні та варіаційніряди розподілу:

  • Атрибутивними- Називають ряди розподілу, побудовані за якісними ознаками.
  • Ряди розподілу, побудовані в порядку зростання або зменшення значень кількісної ознаки називаються варіаційними.
Варіаційний ряд розподілу складається із двох стовпців:

У першому стовпці наводяться кількісні значення ознаки, що називаються, які називаються варіантамиі позначаються. Дискретна варіанта - виражається цілим числом. Інтервальний варіант знаходиться в межах від і до. Залежно від типу варіанти, можна побудувати дискретний або інтервальний варіаційний ряд.
У другому стовпці міститься кількість конкретний варіант , Виражене через частоти або частоти:

Частоти- Це абсолютні числа, що показують стільки разів у сукупності зустрічається дане значення ознаки, які позначають . Сума всіх частот дорівнює повинна дорівнювати чисельності одиниць всієї сукупності.

Частини() - Це частоти виражені у відсотках до підсумку. Сума всіх частостей виражених у відсотках повинна дорівнювати 100% у частках одиниці.

Графічне зображення рядів розподілу

Наочно ряди розподілу надаються за допомогою графічних зображень.

Ряди розподілу зображуються у вигляді:
  • Полігона
  • Гістограми
  • Кумуляти
  • Огіви

Полігон

При побудові полігону на горизонтальній осі (вісь абсцис) відкладають значення ознаки, що варіює, а на вертикальній осі (вісь ординат) — частоти або частоти.

Полігон на рис. 6.1 побудований за даними мікроперепису населення Росії у 1994 р.

6.1. Розподіл домогосподарств за розміром

Умова: Наводяться дані про розподіл 25 працівників одного з підприємств за тарифними розрядами:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Завдання: Побудувати дискретний варіаційний ряд та зобразити його графічно у вигляді полігону розподілу
Рішення:
У даному прикладіваріантами є тарифний розрядпрацівника. Для визначення частот необхідно розрахувати кількість працівників, які мають відповідний тарифний розряд.

Полігон використовують для дискретних варіаційних рядів.

Для побудови полігону розподілу (рис 1) по осі абсцис (X) відкладаємо кількісні значення ознаки, що варіює, - варіанти, а по осі ординат - частоти або частоти.

Якщо значення ознаки виражені як інтервалів, такий ряд називається інтервальним.
Інтервальні рядирозподіли зображують графічно у вигляді гістограми, кумуляти або огива.

Статистична таблиця

Умова: Наведено дані про розміри вкладів 20 фізичних осібв одному банку (тис.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Завдання: Побудувати інтервальний варіаційний ряд із рівними інтервалами.
Рішення:

  1. Вихідна сукупність складається з 20 одиниць (N = 20).
  2. За формулою Стерджеса визначимо необхідна кількістьвикористовуваних груп: n=1+3,322*lg20=5
  3. Обчислимо величину рівного інтервалу: i = (152 - 2) / 5 = 30 тис.руб
  4. Розчленуємо вихідну сукупність на 5 груп з величиною інтервалу в 30 тис. руб.
  5. Результати угруповання подаємо у таблиці:

При такому записі безперервної ознаки, коли та сама величина зустрічається двічі (як верхня межа одного інтервалу і нижня межа іншого інтервалу), то ця величина відноситься до тієї групи, де ця величина виступає в ролі верхньої межі.

Гістограма

Для побудови гістограми по осі абсцис вказують значення меж інтервалів і на їх підставі будують прямокутники, висота яких пропорційна до частот (або частот).

На рис. 6.2. зображено гістограму розподілу населення Росії у 1997 р. за віковими групами.

Рис. 6.2. Розподіл населення Росії за віковими групами

Умова: Наводиться розподіл 30 працівників фірми за розміром місячної заробітної плати

Завдання: Зобразити інтервальний варіаційний ряд графічно у вигляді гістограми та кумуляти.
Рішення:

  1. Невідома межа відкритого (першого) інтервалу визначається за величиною другого інтервалу: 7000 - 5000 = 2000 руб. З тією ж величиною знаходимо нижню межу першого інтервалу: 5000 - 2000 = 3000 руб.
  2. Для побудови гістограми прямокутної системі координат по осі абсцис відкладаємо відрізки, величини яких відповідають інтервалам варицонного ряду.
    Ці відрізки служать нижньою основою, а відповідна частота (частина) - висотою прямокутників, що утворюються.
  3. Побудуємо гістограму:

Для побудови кумуляти необхідно розрахувати накопичені частоти (частини). Вони визначаються шляхом послідовного підсумовування частот (частин) попередніх інтервалів і позначаються S. Накопичені частоти показують, скільки одиниць сукупності мають значення ознаки не більше, ніж аналізоване.

Кумулята

Розподіл ознаки у варіаційному ряду за накопиченими частотами (частинами) зображується за допомогою кумуляти.

Кумулятаабо кумулятивна крива, на відміну від полігону, будується за накопиченими частотами або частотами. У цьому на осі абсцис поміщають значення ознаки, але в осі ординат — накопичені частоти чи частоти (рис. 6.3).

Рис. 6.3. Кумулята розподілу домогосподарств за розміром

4. Розрахуємо накопичені частоти:
Наколінна частота першого інтервалу розраховується так: 0 + 4 = 4, для другого: 4 + 12 = 16; для третього: 4+12+8=24 і т.д.

При побудові кумуляти накопичена частота (частина) відповідного інтервалу присвоюється його верхній межі:

Огіва

Огівабудується аналогічно кумуляті з тією різницею, що накопичені частоти поміщають на осі абсцис, а значення ознаки - на осі ординат.

Різновидом кумуляти є крива концентрації чи графік Лоренца. Для побудови кривої концентрації на обидві осі прямокутної системикоординат наноситься масштабна шкала у відсотках від 0 до 100. У цьому осі абсцис вказують накопичені частоти, але в осі ординат — накопичені значення частки (у відсотках) за обсягом ознаки.

Рівномірному розподілу ознаки відповідає графік діагональ квадрата (рис. 6.4). При нерівномірному розподілі графік є увігнутою кривою залежно від рівня концентрації ознаки.

6.4. Крива концентрації

Найважливішим етапом дослідження соціально-економічних явищ та процесів є систематизація первинних даних та отримання на цій основі зведеної характеристики всього об'єкта за допомогою узагальнюючих показників, що досягається шляхом зведення та угруповання первинного статистичного матеріалу.

Статистичне зведення - це комплекс послідовних операцій із узагальнення конкретних одиничних фактів, що утворюють сукупність, виявлення типових рис і закономірностей, властивих досліджуваному явище загалом. Проведення статистичного зведення включає наступні етапи :

  • вибір групувального ознаки;
  • визначення порядку формування груп;
  • розробка системи статистичних показників для характеристики груп та об'єкта загалом;
  • розробка макетів статистичних таблиць для представлення результатів зведення.

Статистичним угрупованням називається розчленування одиниць сукупності, що вивчається, на однорідні групи за певними істотними для них ознаками. Угруповання є найважливішим статистичним методомузагальнення статистичних даних, основою правильного обчислення статистичних показників.

Розрізняють наступні видиугруповань: типологічні, структурні, аналітичні. Всі ці угруповання поєднує те, що одиниці об'єкта поділені на групи за якоюсь ознакою.

Групувальною ознакою називається ознака, яким проводиться розбиття одиниць сукупності деякі групи. Від правильного виборугрупувальні ознаки залежать висновки статистичного дослідження. Як основу угруповання необхідно використовувати суттєві, теоретично обґрунтовані ознаки (кількісні чи якісні).

Кількісні ознаки угруповання мають числове вираження (обсяг торгів, вік людини, дохід сім'ї тощо), а якісні ознаки угруповання відображають стан одиниці сукупності (підлога, сімейний стан, галузева приналежність підприємства, його форма власності тощо).

Після того, як визначено підставу угруповання, слід вирішити питання про кількість груп, на які треба розбити досліджувану сукупність. Число груп залежить від завдань дослідження та виду показника, покладеного в основу угруповання, обсягу сукупності, ступеня варіації ознаки.

Наприклад, угруповання підприємств за формами власності враховує муніципальну, федеральну та власність суб'єктів федерації. Якщо угруповання проводиться за кількісною ознакою, тоді необхідно звернути особливу увагуна число одиниць досліджуваного об'єкта та ступінь коливання групувального ознаки.

Коли визначено кількість груп, слід визначити інтервали угруповання. Інтервал - Це значення варіює ознаки, що лежать у певних межах. Кожен інтервал має свою величину, верхню та нижню межі або хоча б одну з них.

Нижнім кордоном інтервалу називається найменше значення ознаки в інтервалі, а верхнім кордоном - Найбільше значення ознаки в інтервалі. Величина інтервалу є різницею між верхньою та нижньою межами.

Інтервали угруповання залежно від їхньої величини бувають: рівні та нерівні. Якщо варіація ознаки проявляється у порівняно вузьких межах і розподіл має рівномірний характер, то будують угруповання з рівними інтервалами. Величина рівного інтервалу визначається за такою формулою :

де Хmax, Хmin - максимальне та мінімальне значення ознаки в сукупності; n – число груп.

Найпростіше угруповання, у якому кожна виділена група характеризується одним показником є ​​ряд розподілу.

Статистичний рядрозподілу - це упорядкований розподіл одиниць сукупності на групи за певною ознакою. Залежно від ознаки, покладеної основою освіти низки розподілу, розрізняють атрибутивні і варіаційні ряди розподілу.

Атрибутивними називають ряди розподілу, побудовані за якісними ознаками, тобто ознаками, що не мають числового виразу (розподіл за видами праці, за статтю, за професією тощо). Атрибутивні ряди розподілу характеризують склад сукупності за тими чи іншими суттєвими ознаками. Взяті за кілька періодів ці дані дозволяють досліджувати зміну структури.

Варіаційними рядами називають ряди розподілу, побудовані за кількісним ознакою. Будь-який варіаційний ряд складається з двох елементів: варіантів та частот. Варіантами називаються окремі значення ознаки, які він приймає в варіаційному ряду, тобто конкретне значення ознаки, що варіює.

Частотами називаються чисельності окремих варіантів або кожної групи варіаційного ряду, тобто це числа, які показують, як часто зустрічаються ті чи інші варіанти у ряді розподілу. Сума всіх частот визначає чисельність усієї сукупності, її обсяг. Частинами називаються частоти, виражені у частках одиниці чи відсотках до результату. Відповідно сума частостей дорівнює 1 чи 100%.

Залежно від характеру варіації ознаки розрізняють три форми варіаційного ряду: ранжований ряд, дискретний ряд та інтервальний ряд.

Ранжований варіаційний ряд - це розподіл окремих одиниць сукупності у порядку зростання чи спадання досліджуваного ознаки. Ранжування дозволяє легко розділити кількісні дані по групах, відразу виявити найменше та найбільше значенняознаки, виділити значення, які найчастіше повторюються.

Дискретний варіаційний ряд характеризує розподіл одиниць сукупності за дискретною ознакою, що приймає лише цілі значення. Наприклад, тарифний розряд, кількість дітей у сім'ї, кількість працівників для підприємства та інших.

Якщо ознака має безперервну зміну, які в певних межах можуть набувати будь-яких значень («від - до»), то для цієї ознаки потрібно будувати інтервальний варіаційний ряд . Наприклад, розмір доходу, стаж роботи, вартість основних фондів підприємства та ін.

Приклади розв'язання задач на тему «Статистичне зведення та угруповання»

Завдання 1 . Є інформація про кількість книг, отриманих студентами за абонементом за минулий навчальний рік.

Побудувати ранжований та дискретний варіаційні ряди розподілу, позначивши елементи ряду.

Рішення

Ця сукупність є безліч варіантів кількості одержуваних студентами книг. Підрахуємо кількість таких варіантів та упорядкуємо у вигляді варіаційного ранжованого та варіаційного дискретних рядіврозподілу.

Завдання 2 . Є дані про вартість основних фондів у 50 підприємств, тис. руб.

Побудувати низку розподілу, виділивши 5 груп підприємств (з рівними інтервалами).

Рішення

Для вирішення оберемо найбільше та найменше значення вартості основних фондів підприємств. Це 30,0 та 10,2 тис. руб.

Знайдемо розмір інтервалу: h = (30,0-10,2): 5 = 3,96 тис. руб.

Тоді до першої групи входитимуть підприємства, розмір основних фондів яких становить від 10,2 тис. руб. до 10,2 +3,96 = 14,16 тис. руб. Таких підприємств буде 9. До другої групи увійдуть підприємства, розмір основних фондів яких складе від 14,16 тис. руб. до 14,16 +3,96 = 18,12 тис. руб. Таких підприємств буде 16. Аналогічно знайдемо кількість підприємств, що входять до третьої, четвертої та п'ятої групи.

Отриманий ряд розподілу помістимо до таблиці.

Завдання 3 . По ряду підприємств легкої промисловостіотримані такі дані:

Здійсніть угруповання підприємств за кількістю робітників, утворюючи 6 груп з рівними інтервалами. Підрахуйте по кожній групі:

1. кількість підприємств
2. число робітників
3. обсяг виробленої продукції протягом року
4. середнє фактичне вироблення одного робітника
5. обсяг основних засобів
6. середній розмір основних засобів одного підприємства
7. середню величину виробленої продукції одним підприємством

Результати розрахунку оформіть у таблиці. Зробіть висновки.

Рішення

Для вирішення виберемо найбільше та найменше значення середньооблікового числа робітників на підприємстві. Це 43 та 256.

Знайдемо розмір інтервалу: h = (256-43): 6 = 35,5

Тоді до першої групи входитимуть підприємства, середньооблікова кількість робітників на яких становить від 43 до 43 +35,5 = 78,5 чоловік. Таких підприємств буде 5. До другої групи увійдуть підприємства, середньооблікова кількість робітників на яких складе від 78,5 до 78,5 +35,5 = 114 осіб. Таких підприємств буде 12. Аналогічно знайдемо кількість підприємств, що входять до третьої, четвертої, п'ятої та шостої групи.

Отриманий ряд розподілу помістимо до таблиці та обчислимо необхідні показники по кожній групі:

Висновок : Як видно з таблиці, друга група підприємств є найчисленнішою До неї входять 12 підприємств. Найменшими є п'ята і шоста групи (по два підприємства). Це найбільші підприємства (за кількістю робітників).

Оскільки друга група найчисленніша, обсяг виробленої продукції за рік підприємствами цієї групи та обсяг основних засобів значно вищий за інші. Водночас середній фактичний вироблення одного робітника на підприємствах цієї групи найбільшого не є. Тут лідирують підприємства четвертої групи. На цю групу припадає досить великий обсяг основних засобів.

На закінчення відзначимо, що середній розмір основних засобів і середня величинавиробленої продукції одного підприємства прямо пропорційні розмірам підприємства (за кількістю робітників).

Лабораторна робота №1

за математичної статистики

Тема: Первинна обробка експериментальних даних

3. Оцінка у балах. 1

5. Контрольні питання.. 2

6. Методика виконання лабораторної роботи.. 3

Мета роботи

Набуття навичок первинної обробки емпіричних даних методами математичної статистики.

На основі сукупності дослідних даних виконати такі завдання:

Завдання 1.Побудувати інтервальний варіаційний ряд розподілу.

Завдання 2.Побудувати гістограму частот інтервального варіаційного ряду.

Завдання 3.Скласти емпіричну функцію розподілу та побудувати графік.

а) моду та медіану;

б) умовні початкові моменти;

в) вибіркову середню;

г) вибіркову дисперсію, виправлену дисперсію генеральної сукупності, виправлене середнє квадратичне відхилення;

д) коефіцієнт варіації;

е) асиметрію;

ж) ексцес;

Завдання 5.Визначити межі істинних значень числових характеристик, що вивчається випадкової величиниіз заданою надійністю.

Завдання 6.Змістовна інтерпретація результатів первинної обробки за умовою завдання.

Оцінка в балах

Завдання 1-56 балів

Завдання 62 бали

Захист лабораторної роботи(Усна співбесіда з контрольних питань та лабораторної роботи) - 2 бали

Робота здається у письмовій формі на аркушах формату А4 та включає:

1) Титульна сторінка(Додаток 1)

2) Вихідні дані.

3) Подання роботи за вказаним зразком.

4) Результати розрахунків (виконані вручну та/або за допомогою MS Excel) у зазначеному порядку.

5) Висновки – змістовна інтерпретація результатів первинної обробки за умовою завдання.

6) Усна співбесідаз роботи та контрольних питань.



5. Контрольні питання


Методика виконання лабораторної роботи

Завдання 1. Побудувати інтервальний варіаційний ряд розподілу

Для того, щоб статистичні дані подати у вигляді варіаційного ряду з рівновіддаленими варіантами необхідно:

1.У вихідній таблиці даних знайти найменше та найбільше значення.

2.Визначити розмах варіювання :

3. Визначити довжину інтервалу h, якщо у вибірці до 1000 даних використовують формулу: , де n - обсяг вибірки - кількість даних у вибірці; для обчислень беруть lgn).

Обчислене ставлення округляють до зручного цілого значення .

4. Визначити початок першого інтервалу для парного числа інтервалів рекомендують брати величину; а для непарного числа інтервалів.

5. Записати інтервали угруповань та розташувати їх у порядку зростання кордонів

, ,………., ,

де – нижня межа першого інтервалу. Забереться зручне число не більше, верхня межа останнього інтервалу повинна бути не меншою. Рекомендується, щоб інтервали містили у собі вихідні значення випадкової величини та виділяти від 5 до 20інтервалів.

6. Записати вихідні дані щодо інтервалів угруповань, тобто. підрахувати за вихідною таблицею число значень випадкової величини, які у зазначені інтервали. Якщо деякі значення збігаються з межами інтервалів, то їх відносять або лише до попереднього, або лише до подальшого інтервалу.

Зауваження 1.Інтервали необов'язково брати рівними за довжиною. На ділянках, де значення розташовуються густіше, зручніше брати дрібніші короткі інтервали, а там де рідше - більші.

Зауваження 2.Якщо деяких значень отримані “нульові”, чи малі значення частот , необхідно перегрупувати дані, укрупнюючи інтервали (збільшуючи крок ).

Схожі статті

2022 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.