Побудуйте дискретний варіаційний ряд. Ряди розподілу та угруповання

Лабораторна робота №1

За математичною статистикою

Тема: Первинна обробка експериментальних даних

3. Оцінка у балах. 1

5. Контрольні питання.. 2

6. Методика виконання лабораторної роботи.. 3

Мета роботи

Набуття навичок первинної обробки емпіричних даних методами математичної статистики.

На основі сукупності дослідних даних виконати такі завдання:

Завдання 1.Побудувати інтервальний варіаційний рядрозподілу.

Завдання 2.Побудувати гістограму частот інтервального варіаційного ряду.

Завдання 3.Скласти емпіричну функцію розподілу та побудувати графік.

а) моду та медіану;

б) умовні початкові моменти;

в) вибіркову середню;

г) вибіркову дисперсію, виправлену дисперсію генеральної сукупності, виправлене середнє квадратичне відхилення;

д) коефіцієнт варіації;

е) асиметрію;

ж) ексцес;

Завдання 5.Визначити межі істинних значень числових характеристик, випадкової величини, що вивчається, із заданою надійністю.

Завдання 6.Змістовна інтерпретація результатів первинної обробки за умовою завдання.

Оцінка в балах

Завдання 1-56 балів

Завдання 62 бали

Захист лабораторної роботи(Усна співбесіда з контрольних питань та лабораторної роботи) - 2 бали

Робота здається у письмовій формі на аркушах формату А4 та включає:

1) Титульний лист(Додаток 1)

2) Вихідні дані.

3) Подання роботи за вказаним зразком.

4) Результати розрахунків (виконані вручну та/або за допомогою MS Excel) у зазначеному порядку.

5) Висновки – змістовна інтерпретація результатів первинної обробки за умовою завдання.

6) Усна співбесідаз роботи та контрольних питань.



5. Контрольні питання


Методика виконання лабораторної роботи

Завдання 1. Побудувати інтервальний варіаційний ряд розподілу

Для того, щоб статистичні дані подати у вигляді варіаційного ряду з рівновіддаленими варіантами необхідно:

1.У вихідній таблиці даних знайти найменше та найбільше значення.

2.Визначити розмах варіювання :

3. Визначити довжину інтервалу h, якщо у вибірці до 1000 даних використовують формулу: , де n - обсяг вибірки - кількість даних у вибірці; для обчислень беруть lgn).

Обчислене ставлення округляють до зручного цілого значення .

4. Визначити початок першого інтервалу для парного числа інтервалів рекомендують брати величину; а для непарного числа інтервалів.

5. Записати інтервали угруповань та розташувати їх у порядку зростання кордонів

, ,………., ,

де – нижня межа першого інтервалу. Забереться зручне число не більше, верхня межа останнього інтервалу повинна бути не меншою. Рекомендується, щоб інтервали містили у собі вихідні значення випадкової величини та виділяти від 5 до 20інтервалів.

6. Записати вихідні дані щодо інтервалів угруповань, тобто. підрахувати за вихідною таблицею число значень випадкової величини, які у зазначені інтервали. Якщо деякі значення збігаються з межами інтервалів, то їх відносять або лише до попереднього, або лише до подальшого інтервалу.

Зауваження 1.Інтервали необов'язково брати рівними за довжиною. На ділянках, де значення розташовуються густіше, зручніше брати дрібніші короткі інтервали, а там де рідше - більші.

Зауваження 2.Якщо деяких значень отримані “нульові”, чи малі значення частот , необхідно перегрупувати дані, укрупнюючи інтервали (збільшуючи крок ).

Опис змін варіює ознаки здійснюється за допомогою рядів розподілу.

Статистичний ряд розподілу- це впорядкований розподіл одиниць статистичної сукупності на окремі групи за певною ознакою, що варіює.

Статистичні ряди, побудовані за якісною ознакою називають атрибутивними. Якщо в основі ряду розподілу лежить кількісна ознака, то ряд є варіаційним.

У свою чергу варіаційні ряди ділять на дискретні та інтервальні. В основі дискретногонизки розподілу лежить дискретний (перервний) ознака, який набуває конкретних числові значення (кількість правопорушень, кількість звернень громадян за юридичною допомогою). Інтервальнийряд розподілу будується на основі безперервної ознаки, яка може набувати будь-яких значень із заданого діапазону (вік засудженого, термін позбавлення волі і т.д.)

Будь-який статистичний рядрозподілу містить два обов'язкових елементів- Варіанти ряду і частоти. Варіанти (x i) – окремі значення ознаки, що він приймає у низці розподілу. Частоти (f i) - це числові значення, що показують скільки разів зустрічаються ті чи інші варіанти у ряді розподілу. Сума всіх частот називається обсягом сукупності.

Частоти, виражені в відносних одиницях(частках або відсотках) називаються частостями ( w i). Сума частостей дорівнює одиниці, якщо Частини виражені у частках одиниці, або 100, якщо вони виражаються у відсотках. Використання частостей дозволяє порівняти варіаційні ряди з різним обсягом сукупності. Частини визначаються за такою формулою:

Для побудови дискретного ряду ранжуються всі індивідуальні значення ознаки, що зустрічаються в ряду, а потім підраховуються частоти повторень кожного значення. Оформляється ряд розподілу в ідеї таблиці, що складається з двох рядків та стовпців, в одному з яких наводяться значення варіантів ряду x i, у другій – значення частот f i.

Розглянемо приклад побудови дискретного варіаційного ряду.

Приклад 3.1 . За даними УМВС зареєстровано злочини, скоєні у місті N неповнолітніми у віці.

17 13 15 16 17 15 15 14 16 13 14 17 14 15 15 16 16 15 14 15 15 14 16 16 14 17 16 15 16 15 13 15 15 13 15 14 15 13 17 14.

Побудувати дискретний рядрозподілу.

Рішення .

Спочатку потрібно проранжувати дані про вік неповнолітніх, тобто. записати їх у порядку зростання.

13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17



Таблиця 3.1

Таким чином, частоти відображають кількість людей даного віку, наприклад, 5 осіб мають вік 13 років, 8 осіб – 14 років тощо.

Побудова інтервальнихрядів розподілу здійснюють аналогічно до виконання рівноінтервального угруповання за кількісною ознакою, тобто спочатку визначають оптимальне число груп, на які буде розбита сукупність, встановлюються межі інтервалів по групах і підраховуються частоти.

Проілюструємо побудову інтервального ряду розподілу на прикладі.

Приклад 3.2 .

Побудувати інтервальний ряд за наступною статистичною сукупністю - заробітною платою юриста в конторі, тис. руб.

16,0 22,2 25,1 24,3 30,5 32,0 17,0 23,0 19,8 27,5 22,0 18,9 31,0 21,5 26,0 27,4

Рішення.

Приймемо оптимальну кількість груп рівноінтервального угруповання для даної статистичної сукупності, що дорівнює 4 (у нас 16 варіантів). Отже, чисельність кожної групи дорівнює:

а величина кожного інтервалу дорівнюватиме:

Межі інтервалів визначаємо за формулами:

,

де - відповідно нижня та верхня межі i-го інтервалу.

Опускаючи проміжні обчислення меж інтервалів, заносимо їх значення (варіанти) та кількість юристів (частоти), що мають зарплатню в межах кожного інтервалу, до таблиці 3.2, яка ілюструє отриманий інтервальний ряд.

Таблиця 3.2

Аналіз статистичних рядів розподілу може проводитись з використанням графічного методу. Графічне уявлення рядів розподілу дозволяє наочно проілюструвати закономірності розподілу досліджуваної сукупності шляхом її зображення у вигляді полігону, гістограми та кумуляти. Зупинимося кожному з перелічених графіків.

Полігон- ламана, відрізки якої з'єднують точки з координатами ( x i;f i). Зазвичай полігон використовують зображення дискретних рядів розподілу. Для його побудови на осі абсцис відкладають ранжовані індивідуальні значення ознаки x i, Осі ординат – відповідні цим значенням частоти. В результаті, з'єднавши відрізками крапки, відповідні даним, позначеним по осях абсцис і ординат, одержують ламану, яка називається полігоном. Наведемо приклад побудови полігону частот.

Для ілюстрації побудови полігону візьмемо результат рішення прикладу 3.1 на побудову дискретного ряду – рисунок 1. По осі абсцис відкладено вік засуджених, по осі ординат – кількість неповнолітніх засуджених, які мають цей вік. Аналізуючи цей полігон, можна сказати, що найбільша кількістьзасуджених – 14 осіб, віком 15 років.

Рисунок 3.1 – Полігон частот дискретного ряду.

Полігон можна побудувати і для інтервального ряду, в цьому випадку осі абсцис відкладають середини інтервалів, а по осі ординат - відповідні їм частоти.

Гістограма– ступінчаста фігура, що складається з прямокутників, основами яких є інтервали значення ознаки, а висоти дорівнюють відповідним частотам. Гістограма застосовується лише зображення інтервальних рядів розподілу. Якщо інтервали є нерівними, то побудови гістограми на осі ординат відкладають не частоти, а відношення частоти до ширини відповідного інтервалу. Гістограму можна перетворити на полігон розподілу, якщо середини її стовпчиків з'єднати між собою відрізками.

Для ілюстрації побудови гістограми візьмемо результати побудови інтервального ряду з прикладу 3.2 – рисунок 3.2.

Рисунок 3.2 – Гістограма розподілу заробітної платиюристів.

Для графічного зображення варіаційних рядів використовують кумуляту. Кумулята- крива, що зображує ряд накопичених частот і з'єднує точки з координатами ( x i;f i нак). Накопичені частоти обчислюються послідовним підсумовуванням всіх частот ряду розподілу та показують число одиниць сукупності, що мають значення ознаки не більше, ніж зазначене. Проілюструємо обчислення накопичених частот для варіаційного інтервального ряду, поданого на прикладі 3.2 – таблиця 3.3.

Таблиця 3.3

Для побудови кумуляти дискретного ряду розподілу осі абсцис відкладають ранжировані індивідуальні значення ознаки, а по осі ординат - відповідні їм накопичені частоти. При побудові кумулятивної кривої інтервального ряду перша точка матиме абсцису, рівну нижній межі першого інтервалу, а ординату, що дорівнює 0. Усі наступні точки повинні відповідати верхнім межа інтервалів. Побудуємо кумуляту, використовуючи дані таблиці 3.3 – рисунок 3.3.

Рисунок 3.3 – Кумулятивна крива розподілу заробітної плати юристів.

Контрольні питання

1. Поняття статистичного ряду розподілу, його основні елементи.

2. Види статистичних рядів розподілу. Їхня коротка характеристика.

3. Дискретні та інтервальні ряди розподілу.

4. Методика побудови дискретних рядів розподілу.

5. Методика побудови інтервальних рядів розподілу.

6. Графічне зображення дискретних рядів розподілу.

7. Графічне зображення інтервальних рядів розподілу.

Завдання

Завдання 1. Є такі дані про успішність 25 студентів групи з ТГП у сесію: 5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5, 5, 2, 3 3, 5, 4, 2, 3, 3. Побудуйте дискретний варіаційний ряд розподілу студентів за балами оцінок, отриманих у сесію. Для отриманого ряду розрахуйте Частини, накопичені Частини, накопичені частоти. Зробіть висновки.

Завдання 2. У колонії утримуються 1000 засуджених, їх розподіл за віком представлений у таблиці:

Зобразіть даний рядграфічно. Зробіть висновки.

Завдання 3. Є такі дані про строки позбавлення волі ув'язнених:

5; 4; 2; 1; 6; 3; 4; 3; 2; 2; 3; 1; 17; 6; 2; 8; 5; 11; 9; 3; 5; 6; 4; 3; 10; 5; 25; 1; 12; 3; 3; 4; 9; 6; 5; 3; 4; 3; 5; 12; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 3; 12; 6.

Побудуйте інтервальний ряд розподілу ув'язнених за строками позбавлення волі. Зробіть висновки.

Завдання 4. Є такі дані про розподіл засуджених в області за період, що вивчається, за віковими групами:

Намалюйте цей ряд графічно, зробіть висновки.

Дискретний варіаційний ряд будується для дискретних ознак.

Для того, щоб побудувати дискретний варіаційний ряд, потрібно виконати наступні дії: 1) упорядкувати одиниці спостереження за зростанням досліджуваного значення ознаки,

2) визначити всі можливі значення ознаки x i, упорядкувати їх за зростанням,

значенням ознаки, i .

частота значення ознаки і позначають f i . Сума всіх частот ряду дорівнює кількості елементів у сукупності, що вивчається.

Приклад 1 .

Список оцінок, отриманих студентами на іспитах: 3; 4; 3; 5; 4; 2; 2; 4; 4; 3; 5; 2; 4; 5; 4; 3; 4; 3; 3; 4; 4; 2; 2; 5; 5; 4; 5; 2; 3; 4; 4; 3; 4; 5; 2; 5; 5; 4; 3; 3; 4; 2; 4; 4; 5; 4; 3; 5; 3; 5; 4; 4; 5; 4; 4; 5; 4; 5; 5; 5.

Тут число Х - Оцінкає дискретною випадковою величиноюа отриманий список оцінок -статистичні (спостерігаються) дані .

    упорядкувати одиниці спостереження щодо зростання досліджуваного значення ознаки:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) визначити всі можливі значення ознаки x i, упорядкувати їх за зростанням:

У цьому прикладі всі оцінки можна розділити чотирма групи з такими значеннями: 2; 3; 4; 5.

Значення випадкової величини, що відповідає окремій групі даних, що спостерігаються, називають значенням ознаки, варіантом (варіантою) і визначають x i .

Число, яке показує, скільки разів зустрічається відповідне значення ознаки в ряді спостережень називають частота значення ознаки і позначають f i .

Для нашого прикладу

оцінка 2 зустрічається - 8 разів,

оцінка 3 зустрічається - 12 разів,

оцінка 4 зустрічається - 23 рази,

оцінка 5 зустрічається – 17 разів.

Усього 60 оцінок.

4) записати отримані дані в таблицю з двох рядків (стовпців) - x i і f i.

З цих даних можна побудувати дискретний варіаційний ряд

Дискретний варіаційний ряд - це таблиця, в якій вказані значення, що вивчається ознаки як окремі значення за зростанням та їх частоти

  1. Побудова інтервального варіаційного ряду

Крім дискретного варіаційного ряду, часто зустрічається такий спосіб групування даних, як інтервальний варіаційний ряд.

Інтервальний ряд будується якщо:

    ознака має безперервний характер зміни;

    дискретних значень вийшло дуже багато (більше 10)

    частоти дискретних значень дуже малі (не перевищують 1-3 за відносно більшої кількості одиниць спостереження);

    багато дискретних значень ознаки з однаковими частотами.

Інтервальний варіаційний ряд – це спосіб угруповання даних як таблиці, що має дві графи (значення ознаки як інтервалу значень і частота кожного інтервалу).

На відміну від дискретного ряду значення ознаки інтервального ряду представлені окремими значеннями, а інтервалом значень («від - до»).

Число, яке показує, скільки одиниць спостереження потрапило до кожного виділеного інтервалу, називається частота значення ознаки і позначають f i . Сума всіх частот ряду дорівнює кількості елементів (одиниць спостереження) в сукупності, що вивчається.

Якщо одиниця має значення ознаки, що дорівнює величині верхньої межі інтервалу, то її слід відносити до наступного інтервалу.

Наприклад, дитина зі зростанням 100 см потрапить у другий інтервал, а не в перший; а дитина зі зростом 130 см потрапить в останній інтервал, а не в третій.

З цих даних можна побудувати інтервальний варіаційний ряд.

У кожного інтервалу є нижня межа (х н), верхня межа (х в) та ширина інтервалу ( i).

Кордон інтервалу – це значення ознаки, що лежить межі двох інтервалів.

зростання дітей (см)

зростання дітей (см)

кількість дітей

більше 130

Якщо інтервал має верхню і нижню межу, він називається закритий інтервал. Якщо інтервал має лише нижній або тільки верхній кордон, то це – відкритий інтервал.Відкритим може бути тільки перший або останній інтервал. У наведеному прикладі останній інтервал – відкритий.

Ширина інтервалу (i) - Різниця між верхнім і нижнім кордоном.

i = х н - х в

Ширина відкритого інтервалу приймається такою самою, як ширина сусіднього закритого інтервалу.

зростання дітей (см)

кількість дітей

Ширина інтервалу (i)

для розрахунків 130 +20 = 150

20 (бо ширина сусіднього закритого інтервалу – 20)

Усі інтервальні ряди поділяються на інтервальні ряди з рівними інтервалами та інтервальні ряди з нерівними інтервалами . У інтервальних рядах із рівними інтервалами ширина всіх інтервалів однакова. У інтервальних рядах із нерівними інтервалами ширина інтервалів різна.

У прикладі - інтервальний ряд з нерівними інтервалами.

У багатьох випадках, кота статистична сукупність включає велику або тим більше нескінченну кількість варіантів, що найчастіше зустрічається при безперервній варіації, практично неможливо і недоцільно формувати групу одиниць для кожної варіанти. У разі об'єднання статистичних одиниць групи можливо лише з урахуванням інтервалу, тобто. такої групи, яка має певні межі значень ознаки, що варіює. Ці межі позначаються двома числами, що вказують верхню та нижню межі кожної групи. Застосування інтервалів призводить до формування ряду інтервального розподілу.

Інтервальний рад- це варіаційний ряд, варіанти якого представлені у вигляді інтервалів.

Інтервальний ряд може формуватися з рівними і нерівними інтервалами, причому вибір принципу побудови цього ряду залежить головним чином від ступеня представницькості і зручності статистичної сукупності. Якщо сукупність досить велика (представницька) за кількістю одиниць і цілком однорідна за складом, то основою формування інтервального ряду доцільно покласти рівності інтервалів. Зазвичай з цього принципу утворюють інтервальний ряд за тими сукупностями, де розмах варіації порівняно невеликий, тобто. максимальна та мінімальна варіанти різняться між собою зазвичай у кілька разів. При цьому величина рівних інтервалів розраховується ставленням розмаху варіації ознаки до заданого числа інтервалів, що утворюються. Для визначення рівного іінтервалу може бути використана формула Стерджесса (зазвичай при невеликій варіації інтервальних ознак і великому числіодиниць у статистичній сукупності):

де х i - величина рівного інтервалу; X max, X min - максимальна та мінімальна варіанти в статистичній сукупності; n . - Число одиниць в сукупності.

приклад. Доцільно розрахувати розмір рівного інтервалу за щільністю радіоактивного забруднення цезієм – 137 у 100 населених пунктах Краснопільського району Могилівської області, якщо відомо, що початкова (мінімальна) варіанта дорівнює I км/км 2 , кінцева (максимальна) - 65 ки/км 2 . Скориставшись формулою 5.1. отримаємо:

Отже, щоб сформувати інтервальний ряд із рівними інтервалами за щільністю забруднення цезієм – 137 населених пунктів Краснопільського району, розмір рівного інтервалу може становити 8 ки/км 2 .

У разі нерівномірного розподілу тобто. коли максимальна та мінімальна варіанти сотні разів, при формуванні інтервального ряду можна застосувати принцип нерівнихінтервалів. Нерівні інтервали зазвичай збільшуються в міру початку великих значень ознаки.

За формою інтервали можуть бути закритими та відкритими. Закритимиприйнято називати інтервали, у яких позначені як нижня, і верхня межі. Відкритіінтервали мають лише одну межу: у першому інтервалі – верхня, в останньому – нижня межа.

Оцінку інтервальних рядів, особливо з нерівним інтервалами, доцільно проводити з урахуванням щільності розподілу, Найпростішим способом розрахунку якого є відношення локальної частоти (або частоти) до розміру інтервалу.

Для практичного формуванняінтервального ряду можна користуватися макетом табл. 5.3.

Таблиця 5.3. Порядок формування інтервального ряду населених пунктівКраснопільського району за щільністю радіоактивного забруднення цезієм -137

Основна перевага інтервального ряду – його гранична компактність.в той же час в інтервальному ряду розподілу індивідуальні варіанти ознаки приховані у відповідних інтервалах

При графічному зображенні інтервального ряду у системі прямокутних координатна осі абсцис відкладають верхні межі інтервалів, на осординат – локальні частоти ряду. Графічна побудова інтервального ряду відрізняється від побудови полігону розподілу тим, що кожен інтервал має нижню та верхню межі, а одному якомусь значенню ординати відповідають дві абсциси. Тому на графіку інтервального ряду відзначається не точка, як у полігоні, а лінія, що з'єднує дві точки. Ці горизонтальні лініїз'єднуються один з одним вертикальними лініями і виходить фігура ступінчастого багатокутника, який прийнято називати гістограмоюрозподілу (рис.5.3).

При графічній побудові інтервального ряду за досить великою статистичною сукупністю гістограма наближається до симетричноюформі розподілу. У тих випадках, де статистична сукупність невелика, зазвичай, формується асиметричнагістограма.

У деяких випадках є доцільність у формуванні низки накопичених частот, тобто. кумулятивногоряду. Кумулятивний ряд можна утворити з урахуванням дискретного чи інтервального низки розподілу. При графічному зображенні кумулятивного ряду системі прямокутних координат на осі абсцис відкладають варіанти, на осі ординат - накопичені частоти (частини). Отриману при цьому криву лінію прийнято називати кумулятоїрозподілу (рис.5.4).

Формування та графічне зображення різних видівваріаційних рядів сприяє спрощеному розрахунку основних статистичних характеристик, які докладно розглядаються у темі 6, допомагає краще зрозуміти сутність законів розподілу статистичної сукупності. Аналіз варіаційного ряду набуває особливого значення в тих випадках, коли необхідно виявити та простежити залежність між варіантами та частотами (частинами). Ця залежність проявляється в тому, що число випадків, що припадають на кожну версію, певним чином пов'язане з величиною цієї варіації, тобто. зі зростанням значень варіює ознаки частоти (частини) цих значень зазнають певних, систематичних змін. Це означає, що числа в стовпці частот (частин) схильні не до хаотичних коливань, а змінюються в певному напрямку, в певному порядку і послідовності.

Якщо частоти у своїх змінах виявляють певну систематичність, це означає, що ми знаходимося на шляху до виявлення закономірності. Система, порядок, послідовність у зміні частот – це відображення загальних причин, загальних умов, Характерні для всієї сукупності.

Не слід вважати, що закономірність розподілу завжди дається в готовому вигляді. Зустрічається чимало варіаційних рядів, у яких частоти химерно скачуть, то зростаючи, то зменшуючись. У таких випадках доцільно з'ясувати, з яким розподілом має справу дослідник: чи цьому розподілу зовсім не притаманні закономірності, то його характер ще не виявлено: Перший випадок зустрічається рідко, другий же, другий випадок - явище досить часто і досить поширене.

Так, при формуванні інтервального ряду загальна кількістьстатистичних одиниць може бути невеликим, і в кожен інтервал потрапляє невелика кількість варіантів (наприклад, 1-3 одиниці). У разі розраховувати прояв будь-якої закономірності годі й говорити. Щоб на основі випадкових спостережень вийшов закономірний результат, необхідно набрання чинності закону великих чисел, тобто. щоб на кожен інтервал припадало б не кілька, а десятки та сотні статистичних одиниць. З цією метою треба намагатися, наскільки можна збільшувати кількість спостережень. Це самий вірний спосібвиявлення закономірності в масових процесах. Якщо ж не видається реальна можливість збільшити кількість спостережень, то виявлення закономірності може бути досягнуто зменшенням кількості інтервалів у ряді розподілу. Зменшуючи кількість інтервалів у варіаційному ряду, цим збільшується чисельність частот у кожному інтервалі. Це означає, що випадкові коливання кожної статистичної одиниці накладаються один на одного, "згладжується", перетворюючись на закономірність.

Формування та побудова варіаційних рядів дозволяє отримати лише загальну, наближену картину розподілу статистичної сукупності. Наприклад, гістограма лише в грубій формі виражає залежність між значеннями ознаки та її частотами (частинами). Тому варіаційні ряди по суті є лише основою для подальшого, поглибленого вивчення внутрішньої закономірності статичного розподілу.

КОНТРОЛЬНІ ПИТАННЯ ДО ТЕМИ 5

1. Що таке варіація? Чим викликається варіація ознаки у статистичній сукупності?

2. Які види ознак можуть мати місце в статистиці?

3. Що таке варіаційний ряд? Які можуть бути види варіаційних рядів?

4. Що таке ранжированный ряд? Які його переваги та недоліки?

5. Що таке дискретний ряд і які його переваги та недоліки?

6. Який порядок формування інтервального ряду, які його переваги та недоліки?

7. Що являє собою графічне зображення ранжованого, дискретного, інтервальних рядіврозподілу?

8. Що таке кумуляти розподілу та що вона характеризує?

Предмет математичної статистики. Генеральна та вибіркова сукупність.

— Математична статистика- Розділ математики, який вивчає способи відбору, угруповання, систематизації та аналізу статистичних даних, для отримання науково обґрунтованих висновків.

— Статистичні дані– числові значення аналізованої ознаки об'єктів, що вивчаються, отримані як результат випадкового експерименту.

Математична статистика тісно пов'язана з теорією ймовірностей, але, на відміну від теорії ймовірностей, математична модель експерименту невідома. У математичній статистиці за статистичними даними необхідно встановити невідомий розподіл ймовірностей чи об'єктивно оцінити параметри розподілу.

Методи математичної статистики дозволяють будувати оптимальні математичні моделімасових, повторюваних явищ. Сполучною ланкою між теорією ймовірностей та математичною статистикоює граничні теореми теорії ймовірностей.

В даний час статистичні методивикористовуються практично у всіх галузях народного господарства.

— Генеральна сукупність– статистичні дані всіх об'єктів, що вивчаються (іноді – самі об'єкти). Часто генеральну сукупність розглядають як НВХ.

— Вибірка(вибіркова сукупність) – статистичні дані об'єктів, обраних випадково із генеральної сукупності.

— Обсяг вибірки n(Обсяг генеральної сукупності N) - кількість об'єктів, обраних для вивчення з генеральної сукупності (кількість об'єктів у генеральній сукупності).

Приклади.

а) Статистичними данимиможуть бути: зростання студентів; кількість дієслів (чи інших частин мови) уривку тексту певної довжини; середній балатестата; рівень інтелекту; число помилок, допущених диспетчером тощо.

б) Генеральною сукупністюможливо: зростання всіх людей, розряди всіх робітників заводу, частота вживання певної частини мови у всіх творах автора, що вивчається, середній бал атестата всіх випускників і т.п.



в) Вибіркоюможе бути: – зростання 20 студентів, кількість дієслів у вибраних довільно 50 однорідних уривках тексту завдовжки 500 слововжитків, середній бал атестату 100 випускників, вибраних випадково зі шкіл міста тощо.

Вибірка називається репрезентативної,якщо вона чітко відбиває якість генеральної сукупності. Репрезентативність вибірки досягається випадковістю відбору, коли всі об'єкти генеральної сукупності мають однакову можливість бути відібраними.

Для того щоб вибірка була репрезентативною застосовують різні способидобору об'єктів вивчення.

Види відборуКабіна: простий, механічний, серійний, типовий.

Простий. Довільно відбираються елементи з усієї генеральної сукупності.

Механічний відбір. Вибирають кожен 10 (25, 30 тощо) об'єкт із генеральної сукупності.

Серійний. Проводиться дослідження кожної серії (наприклад, з тексту вибирають 10 уривків по 500 слововжитків- 10 серій).

Типовий. Генеральну сукупність за певною ознакою поділяють типові групи. Кількість серій, які витягуються з кожної такої групи, визначається питомою вагою цієї групи в генеральній сукупності.

Статистичне розподіл вибірки та її графічне зображення.

Нехай вивчається СВ Х ( генеральна сукупність) щодо деякої ознаки. Проводиться ряд незалежних випробувань. В результаті дослідів СВ Х набуває деяких значень. Сукупність отриманих значень є вибіркою, а самі значення є статистичними даними.

Спочатку проводять ранжування вибірки - розташування статистичних даних вибірки з незменшення. Отримуємо варіаційний ряд.

Варіаційний ряд- Проранжована вибірка.

Дискретний статистичний ряд

Якщо генеральна сукупність дискретної СВ, будується дискретний статистичний ряд (статистичний розподіл).

Нехай значення з'явилося у вибірці разів,

Разa, …, - раз.

I-та варіантивибірки; - частота i-тій варіанти Частота показує, скільки разів дана варіанта з'явилася у вибірці.

- відносна частота i-тої варіанти

(Показує яку частину вибірки становить ).

Статистичне розподіл – це відповідність між варіантами вибірки та його частотами чи відносними частотами.

Для ДСВ статистичний розподіл можна у вигляді таблиці – статистичного низки частот чи статистичного низки відносних частот.

Статистичний ряд частот Статистичний ряд

відносних частот

........
........
........
........

Для наочності уявлення статистичного розподілувибірки будують «графіки» статистичного розподілу: полігон та гістограму.

Полігон частот(відносних частот) – графічне зображення дискретного статистичного ряду - ламана лінія, що послідовно з'єднує точки [ для полігону відносних частот].

приклад.Дослідника цікавлять знання абітурієнтів з математики. Обирають 10 абітурієнтів та записують їх шкільні оцінки з цього предмету. Отримано наступну вибірку: 5;4;4;3;2;5;4;3;4;5.

а) Подати вибірку у вигляді варіаційного ряду;

б) побудувати статистичний ряд частот та відносних частот;

в) зобразити полігон відносних частот для одержаного ряду.

а) Проведемо ранжування вибірки, тобто. розташуємо члени вибірки з невтрати. Отримуємо варіаційний ряд: 2; 3; 3; 4; 4; 4; 4; 5; 5;5.

б) Побудуємо статистичний ряд частот (відповідність між варіантами вибірки та їх частотами) та статистичний ряд відносних частот (відповідність між варіантами вибірки та їх відносними частотами)

0,1 0,2 0,4 0,3

Статистичний ряд частот Статистичний ряд отн. частот

1+2+4+3=10=n 0,1+0,2+0,4+0,3=1.

Полігон відносних частот.




Схожі статті

2024 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.