Як розраховується середнє відхилення квадратичне. Геометрична проста

Середнє квадратичне відхилення

Найбільш досконалою характеристикою варіації є середнє квадратичне відкладення, яке називають стандартом (або стандартним відхилення). Середнє квадратичне відхилення() дорівнює квадратному кореню із середнього квадрата відхилень окремих значень ознаки від середньої арифметичної:

Середнє квадратичне відхилення просте:

Середнє зважене квадратичне відхилення застосовується для згрупованих даних:

Між середнім квадратичним і середнім лінійним відхиленнями в умовах нормального розподілу має місце наступне співвідношення: ~ 1,25.

Середнє квадратичне відхилення, будучи основною абсолютною мірою варіації, використовується при визначенні значень ординат кривої нормального розподілу, в розрахунках, пов'язаних з організацією вибіркового спостереження та встановленням точності вибіркових характеристик, а також при оцінці меж варіації ознаки в однорідній сукупності.

18. Дисперсія, її види, середньоквадратичне відхилення.

Дисперсія випадкової величини- міра розкиду цієї випадкової величини, т. е. її відхилення від математичного очікування. У статистиці часто використовується позначення чи . Квадратний коріньз дисперсії прийнято називати середньоквадратичним відхиленням, стандартним відхиленнямабо стандартним розкидом.

Загальна дисперсія (σ 2) вимірює варіацію ознаки у всій сукупності під впливом всіх факторів, що зумовили цю варіацію. Разом з тим, завдяки методу угруповань можна виділити та виміряти варіацію, зумовлену групувальною ознакою, та варіацію, що виникає під впливом неврахованих факторів.

Міжгрупова дисперсія (σ 2 м.гр) характеризує систематичну варіацію, тобто відмінності у величині досліджуваної ознаки, що виникають під впливом ознаки - фактора, покладеного в основу угруповання.

Середньоквадратичне відхилення(синоніми: середнє квадратичне відхилення, середньоквадратичне відхилення, квадратичне відхилення; близькі терміни: стандартне відхилення, стандартний розкид) - Теоретично ймовірностей і статистиці найбільш поширений показник розсіювання значень випадкової величини щодо її математичного очікування. При обмежених масивах вибірок значень замість математичного очікування використовується середнє арифметичне сукупності вибірок.

p align="justify"> Середньоквадратичне відхилення вимірюється в одиницях вимірювання самої випадкової величини і використовується при розрахунку стандартної помилки середнього арифметичного, при побудові довірчих інтервалів, при статистичній перевірці гіпотез, при вимірі лінійного взаємозв'язку між випадковими величинами. Визначається як квадратний корінь з дисперсії випадкової величини.

Середньоквадратичне відхилення:

Стандартне відхилення (Оцінка середньоквадратичного відхилення випадкової величини xщодо її математичного очікування з урахуванням незміщеної оцінки її дисперсії):

де – дисперсія; - i-й елемент вибірки; - Обсяг вибірки; - середня арифметичне вибірки:

Слід зазначити, що обидві оцінки зміщені. У загальному випадкунезміщену оцінку збудувати неможливо. При цьому оцінка на основі оцінки незміщеної дисперсії є заможною.

19. Сутність, сфера застосування та порядок визначення моди та медіани.

Крім статечних середніх у статистиці для відносної характеристики величини варіює ознаки і внутрішньої будовирядів розподілу користуються структурними середніми, які представлені, в основному, модою та медіаною.

Мода- це варіант ряду, що найчастіше зустрічається. Мода застосовується, наприклад, при визначенні розміру одягу, взуття, що користується найбільшим попитом у покупцем. Модою для дискретного ряду є варіанти, що володіє найбільшою частотою. При обчисленні моди для інтервального варіаційного рядудуже важливо спочатку визначити модальний інтервал (за максимальною частотою), а потім - значення модальної величини ознаки за формулою:

§ - значення моди

§ - нижня межа модального інтервалу

§ - величина інтервалу

§ - частота модального інтервалу

§ - частота інтервалу, що передує модальному

§ - частота інтервалу, наступного за модальним

Медіана -це значення ознаки, ĸᴏᴛᴏᴩᴏᴇ лежить в базі ранжованого ряду і ділить даний рядна дві рівні за чисельністю частини.

Для визначення медіани в дискретному ряду за наявності частот спочатку обчислюють напівсуму частот, а потім визначають, яке значення варіанта припадає на неї. (Якщо відсортований ряд містить непарну кількість ознак, то номер медіани обчислюють за формулою:

М е = (n (число ознак у сукупності) + 1)/2,

у разі парного числа ознак медіана дорівнюватиме середній з двох ознак що знаходяться в середині ряду).

При обчисленні медіани для інтервального варіаційного рядуспочатку визначають медіанний інтервал, у межах якого знаходиться медіана, а потім - значення медіани за формулою:

§ - шукана медіана

§ - нижня межа інтервалу, що містить медіану

§ - величина інтервалу

§ - сума частот або число членів ряду

§ - сума накопичених частот інтервалів, що передують медіанному

§ - частота медіанного інтервалу

приклад. Знайти моду та медіану.

Рішення: В даному прикладімодальний інтервал перебуває у межах вікової групи 25-30 років, оскільки цей інтервал припадає максимальна частота (1054).

Розрахуємо величину моди:

Це означає, що модальний вік студентів дорівнює 27 рокам.

Обчислимо медіану. Медіанний інтервал знаходиться у віковій групі 25-30 років, тому що в межах цього інтервалу розташована варіанта, яка ділить сукупність на дві рівні частини (?f i /2 = 3462/2 = 1731). Далі підставляємо у формулу необхідні числові дані та отримуємо значення медіани:

Це означає, що одна половина студентів має вік до 27,4 року, а інша понад 27,4 роки.

Крім моди та медіани бувають використані такі показники, як квартілі, що ділять ранжований ряд на 4 рівні частини, децилі -10 частин та перцентілі - на 100 частин.

20. Поняття вибіркового спостереження та сфера його застосування.

Вибіркове спостереженнязастосовується, коли застосування суцільного спостереження фізично неможливочерез великий масив даних або економічно нецільово. Фізична неможливість має місце, наприклад, щодо пасажиропотоків, ринкових цін, сімейних бюджетів. Економічна нецелесообразность має місце в оцінці якості товарів, що з їх знищенням, наприклад, дегустація, випробування цегли на міцність тощо.

Статистичні одиниці, відібрані для спостереження, становлять вибіркову сукупністьабо вибірку, а весь їх масив - генеральну сукупність(ДС). При цьому кількість одиниць у вибірціпозначають n, а у всій ГС - N. Ставлення n/Nприйнято називати відносний розмірабо частка вибірки.

Якість результатів вибіркового спостереження залежить від репрезентативності вибіркитобто від того, наскільки вона представницька в ГС. Для забезпечення репрезентативності вибірки вкрай важливо дотримуватися принцип випадковості відбору одиниць, який передбачає, що у включення одиниці ГС у вибірку неспроможна вплинути якийсь інший чинник крім випадку.

Існує 4 способи випадкового відборуу вибірку:

  1. Власне випадковийвідбір або «метод лото», коли статистичним величинам присвоюються порядкові номери, що заносяться на певні предмети (наприклад, барильця), які потім перемішуються в деякій ємності (наприклад, в мішку) і вибираються навмання. На практиці даний спосібздійснюють за допомогою генератора випадкових чисел чи математичних таблиць випадкових чисел.
  2. Механічнийвідбір, за яким відбирається кожна ( N/n)-я величина генеральної сукупності. Наприклад, якщо вона містить 100 000 величин, а потрібно вибрати 1 000, то вибірку потрапить кожна 100 000 / 1000 = 100-а величина. Причому якщо вони не ранжовані, то перша вибирається навмання з першої сотні, а номери інших будуть на сотню більше. Наприклад, якщо першою виявилася одиниця № 19, то наступною має бути № 119, потім № 219, потім № 319 і т.д. Якщо одиниці генеральної сукупності ранжовані, то першої вибирається № 50, потім № 150, потім № 250 і так далі.
  3. Відбір величин із неоднорідного масиву даних ведеться стратифікованим(Розшарованим) способом, коли генеральна сукупність попередньо розбивається на однорідні групи, до яких застосовується випадковий або механічний відбір.
  4. Особливий спосіб складання вибірки є серійнийвідбір, у якому випадково чи механічно вибирають окремі величини, які серії (послідовності з якогось номера за якийсь поспіль), всередині яких ведуть суцільне спостереження.

Якість вибіркових спостережень залежить і від типу вибірки: повторнаабо безповторна.При повторному відборістатистичні величини, що потрапили у вибірку, або їх серії після використання повертаються в генеральну сукупність, маючи шанс потрапити в нову вибірку. При цьому у всіх величин генеральної сукупності однакова ймовірність включення у вибірку. Неповторний відбірозначає, що статистичні величини, що потрапили у вибірку, або їх серії після використання не повертаються в генеральну сукупність, а тому для інших величин останньої підвищується ймовірність потрапляння в наступну вибірку.

Безповторний відбір дає більше точні результати, у зв'язку з цим застосовується частіше. Але є ситуації, коли його не можна застосувати (вивчення пасажиропотоків, споживчого попиту тощо) і тоді ведеться повторний відбір.

21. Гранична помилка вибірки спостереження, середня помилкавибірки, порядок їхнього розрахунку.

Розглянемо докладно перераховані вище способи формування вибіркової сукупності і помилки репрезентативності, що виникають при цьому. Власне-випадковаВибірка ґрунтується на відборі одиниць з генеральної сукупності навмання без будь-яких елементів системності. Технічно власне-випадковий відбір проводять шляхом жеребкування (наприклад, розіграші лотерей) або за таблицею випадкових чисел.

Власно-випадковий відбір «в чистому вигляді«У практиці вибіркового спостереження застосовується рідко, але він є вихідним серед інших видів відбору, у ньому реалізуються основні засади вибіркового спостереження. Розглянемо деякі питання теорії вибіркового методу та формули помилок для простої випадкової вибірки.

Помилка вибіркового спостереження- Це різниця між величиною параметра в генеральній сукупності, та її величиною, обчисленої за результатами вибіркового спостереження. Важливо зауважити, що для середньої кількісної ознаки помилка вибірки визначається

Показник прийнято називати граничною помилкою вибірки. Вибіркова середня є випадковою величиною, яка може приймати різні значеннявиходячи з того, які одиниці потрапили у вибірку. Отже, помилки вибірки також є випадковими величинами і можуть набувати різних значень. З цієї причини визначають середню можливих помилоксередню помилку вибіркияка залежить від:

· Обсягу вибірки: чим більше чисельність, тим менше величина середньої помилки;

· ступеня зміни досліджуваного ознаки: що менше варіація ознаки, отже, і дисперсія, тим менше середня помилка вибірки.

При випадковому повторному відборісередня помилка розраховується. Практично генеральна дисперсія точно не відома, але теоретично ймовірності доведено, що . Оскільки величина при досить великих n близька до 1, вважатимуться, що . Тоді середня помилка вибірки має бути розрахована: . Але у випадках малої вибірки (при n<30) коэффициент крайне важно учитывать, и среднюю ошибку малой выборки рассчитывать по формуле .

При випадковій безповторній вибірцінаведені формули коригуються на величину. Тоді середня помилка безповторної вибірки: і . Т.к. завжди менше , то множник () завжди менше 1. Це означає, що середня помилка при безповторному відборі завжди менше, ніж при повторному. Механічна вибірказастосовується, коли генеральна сукупність у будь-який спосіб упорядкована (наприклад, списки виборців за алфавітом, телефонні номери, номери будинків, квартир). Відбір одиниць здійснюється через певний інтервал, що дорівнює зворотному значенню відсотка вибірки. Так за 2% вибірці відбирається кожна 50 одиниця =1/0,02 , при 5% кожна 1/0,05=20 одиниця генеральної сукупності.

Початок відліку вибирається різними способами: випадковим чином, із середини інтервалу, зі зміною початку відліку. Головне у своїй – уникнути систематичної помилки. Наприклад, при 5% вибірці, якщо першою одиницею обрана 13-та, то наступні 33, 53, 73 і т.д.

За точністю механічний відбір близький до власно-випадкової вибірки. З цієї причини для визначення середньої помилки механічної вибірки використовують формули власне-випадкового відбору.

При типовому відборіобстежувана сукупність попередньо розбивається на однорідні, однотипні групи. Наприклад, під час обстеження підприємств це бувають галузі, підгалузі, щодо населення – райони, соціальні чи вікові групи. Далі здійснюється незалежний вибір із кожної групи механічним або власне-випадковим способом.

Типова вибірка дає більш точні результати проти іншими способами. Типізація генеральної сукупності забезпечує представництво у вибірці кожної типологічної групи, що дозволяє виключити вплив міжгрупової дисперсії на середню помилку вибірки. Отже, при знаходженні помилки типової вибірки згідно з правилом складання дисперсій () дуже важливо врахувати лише середню з групових дисперсій. Тоді середня помилка вибірки: при повторному відборі, при неповторному відборі , де - Середня з внутрішньогрупових дисперсій у вибірці.

Серійний (або гніздовий) відбірзастосовується у разі, коли генеральна сукупність розбита на серії чи групи на початок вибіркового обстеження. Цими серіями бувають упаковки готової продукції, студентські групи, бригади. Серії для обстеження вибираються механічним чи власне-випадковим способом, а всередині серії проводиться суцільне обстеження одиниць. Тому середня помилка вибірки залежить тільки від міжгрупової (міжсерійної) дисперсії, яка обчислюється за формулою: де r - Число відібраних серій; - Середня і-тої серії. Середня помилка серійної вибірки розраховується: при повторному відборі, при неповторному відборі , де R - загальна кількість серій. Комбінованийвідбір є поєднанням розглянутих способів відбору.

Середня помилка вибірки за будь-якого способу відбору залежить головним чином абсолютної чисельності вибірки й у меншою мірою – від відсотка вибірки. Припустимо, що проводиться 225 спостережень у першому випадку з генеральної сукупності 4500 одиниць і у другому – 225000 одиниць. Дисперсії в обох випадках дорівнюють 25. Тоді в першому випадку при 5% відборі помилка вибірки складе: У другому випадку при 0,1% відборі вона дорівнюватиме:

Τᴀᴋᴎᴎᴩᴀᴈᴏᴍ, при зменшенні відсотка вибірки в 50 разів, помилка вибірки збільшилася незначно, оскільки чисельність вибірки не змінилася. Припустимо, що кількість вибірки збільшили до 625 спостережень. У цьому випадку помилка вибірки дорівнює: Збільшення вибірки в 2,8 разу за однієї й тієї ж чисельності генеральної сукупності знижує розміри помилки вибірки більш як 1,6 разу.

22.Методи та способи формування вибіркової сукупності.

У статистиці застосовуються різні способи формування вибіркових сукупностей, що обумовлюється завданнями дослідження та залежить від специфіки об'єкта вивчення.

Основною умовою проведення вибіркового обстеження є запобігання виникненню систематичних помилок, що виникають внаслідок порушення принципу рівних можливостей потрапляння у вибірку кожної одиниці генеральної сукупності. Попередження систематичних помилок досягається внаслідок застосування науково обґрунтованих способів формування вибіркової сукупності.

Існують такі способи відбору одиниць із генеральної сукупності: 1) індивідуальний відбір - у вибірку відбираються окремі одиниці; 2) груповий відбір - у вибірку потрапляють якісно однорідні групи або серії одиниць, що вивчаються; 3) комбінований відбір - це комбінація індивідуального та групового відбору. Способи відбору визначаються правилами формування вибіркової сукупності.

Вибірка має бути:

  • власне-випадковаполягає в тому, що вибіркова сукупність утворюється в результаті випадкового (ненавмисного) відбору окремих одиниць із генеральної сукупності. При цьому кількість відібраних у вибіркову сукупність одиниць зазвичай визначається, виходячи з прийнятої частки вибірки. Частка вибірки є відношення числа одиниць вибіркової сукупності n до чисельності одиниць генеральної сукупності N, н.
  • механічнаполягає в тому, що відбір одиниць у вибіркову сукупність виробляється з генеральної сукупності, розбитої на рівні інтервали (групи). При цьому розмір інтервалу в генеральній сукупності дорівнює зворотній величині частки вибірки. Так, при 2% вибірці відбирається кожна 50-а одиниця (1:0,02), при 5% вибірці - кожна 20 одиниця (1:0,05) і т.д. Τᴀᴋᴎᴎᴩᴀᴈᴏᴍ, відповідно до прийнятої часткою відбору, генеральна сукупність механічно розбивається на рівновеликі групи. З кожної групи у вибірку відбирається лише одна одиниця.
  • типова -при якій генеральна сукупність спочатку розчленовується на однорідні типові групи. Далі з кожної типової групи власне-випадковою або механічною вибіркою проводиться індивідуальний відбір одиниць у вибіркову сукупність. Важливою особливістю типової вибірки і те, що вона дає точніші результати проти іншими способами відбору одиниць у вибіркову сукупність;
  • серійна- за якої генеральну сукупність ділять на однакові за обсягом групи - серії. У вибіркову сукупність відбираються серії. Усередині серій проводиться суцільне спостереження одиниць, що потрапили до серії;
  • комбінована- вибірка має бути двоступінчастою. У цьому генеральна сукупність спочатку розбивається групи. Далі здійснюють відбір груп, а всередині останніх здійснюється відбір окремих одиниць.

У статистиці розрізняють такі методи відбору одиниць у вибіркову сукупність:

  • одноступінчаставибірка - кожна відібрана одиниця відразу ж піддається вивченню за заданою ознакою (власне-випадкова та серійна вибірки);
  • багатоступінчаставибірка - виробляють підбір з генеральної сукупності окремих груп, та якщо з груп вибираються окремі одиниці (типова вибірка з механічним способом відбору одиниць у вибіркову сукупність).

Крім того розрізняють:

  • повторний відбір- За схемою повернутої кулі. При цьому кожна одиниця, що потрапила у вибірку, іди серія повертається в генеральну сукупність і у зв'язку з цим має шанс знову потрапити у вибірку;
  • безповторний відбір- За схемою неповернутої кулі. Він має більш точні результати при тому самому об'ємі вибірки.

23. Визначення вкрай важливого обсягу вибірки (використання таблиці Стьюдента).

Одним із наукових принципів у теорії вибіркового методу є забезпечення достатньої кількості відібраних одиниць. Теоретично вкрай важливість дотримання цього принципу представлена ​​в доказах граничних теорем теорії ймовірностей, які дозволяють встановити, який обсяг одиниць слід вибрати з генеральної сукупності, щоб він був достатнім і забезпечував репрезентативність вибірки.

Зменшення стандартної помилки вибірки, а отже, збільшення точності оцінки завжди пов'язане зі збільшенням обсягу вибірки, у зв'язку з цим вже на стадії організації вибіркового спостереження доводиться вирішувати питання про те, яким має бути обсяг вибіркової сукупності, щоб була забезпечена необхідна точність результатів спостережень. . Розрахунок вкрай важливого обсягу вибірки будується за допомогою формул, виведених з формул граничних помилок вибірки (А), відповідних тому чи іншому виду та способу відбору. Так, для випадкового повторного обсягу вибірки (n) маємо:

Суть цієї формули - у тому, що при випадковому повторному відборі вкрай важливою чисельністю обсяг вибірки прямо пропорційний квадрату коефіцієнта довіри. (t2)і дисперсії варіаційної ознаки (?2) і обернено пропорційний квадрату граничної помилки вибірки (?2). Зокрема, зі збільшенням граничної помилки вдвічі необхідна чисельність вибірки має бути зменшена вчетверо. З трьох параметрів два (t і?) задаються дослідником. У цьому дослідник з мети

та завдань вибіркового обстеження має вирішити питання: у якому кількісному поєднанні краще включити ці параметри для забезпечення оптимального варіанта? В одному випадку його може більше влаштовувати надійність отриманих результатів (t), ніж міра точності (?), В іншому – навпаки. Складніше вирішити питання щодо величини граничної помилки вибірки, оскільки цим показником дослідник на стадії проектування вибіркового спостереження не має, у зв'язку з цим у практиці прийнято ставити величину граничної помилки вибірки, як правило, в межах до 10% передбачуваного середнього рівня ознаки . До встановлення передбачуваного середнього рівня можна підходити по-різному: використовувати дані подібних раніше проведених обстежень або скористатися даними основи вибірки і зробити невелику пробну вибірку.

Найбільш складно встановити під час проектування вибіркового спостереження третій параметр у формулі (5.2) – дисперсію вибіркової сукупності. У цьому випадку дуже важливо використовувати всю інформацію, наявну в розпорядженні дослідника, отриману в раніше проведених подібних та пробних обстеженнях.

Питання про визначення вкрай важливої ​​чисельності вибірки ускладнюється, якщо вибіркове обстеження передбачає вивчення кількох ознак одиниць відбору. У цьому випадку середні рівні кожної з ознак та їх варіація, як правило, різні, і у зв'язку з цим вирішити питання про те, дисперсії якої з ознак віддати перевагу, можливо лише з урахуванням мети та завдань обстеження.

При проектуванні вибіркового спостереження передбачаються заздалегідь задана величина припустимої помилки вибірки відповідно до завдань конкретного дослідження та ймовірність висновків за результатами спостереження.

Загалом формула граничної помилки вибіркової середньої величини дозволяє визначати:

‣‣‣ величину можливих відхилень показників генеральної сукупності від показників вибіркової сукупності;

‣‣‣ необхідну чисельність вибірки, що забезпечує необхідну точність, коли межі можливої ​​помилки не перевищать деякої заданої величини;

‣‣‣ ймовірність того, що у проведеній вибірці помилка матиме задану межу.

Розподіл Стьюдентатеоретично ймовірностей - це однопараметричне сімейство абсолютно безперервних розподілів.

24. Ряди динаміки (інтервальні, моментні), змикання рядів динаміки.

Ряди динаміки- це значення статистичних показників, які представлені в певній хронологічній послідовності.

Кожен динамічний ряд містить дві складові:

1) показники періодів часу(Роки, квартали, місяці, дні або дати);

2) показники, що характеризують досліджуваний об'єктза тимчасові періоди або на відповідні дати, які називають рівнями ряду.

Рівні низки виражаються як абсолютними, і середніми чи відносними величинами. Враховуючи залежність від характеру показників будують динамічні ряди абсолютних, відносних і середніх величин. Ряди динаміки з відносних і середніх величин будують з урахуванням похідних рядів абсолютних величин. Розрізняють інтервальні та моментні ряди динаміки.

Динамічний інтервальний рядмістить значення показників за певні періоди часу. У інтервальному ряду рівні можна підсумовувати, отримуючи обсяг явища за триваліший період, або звані накопичені результати.

Динамічний моментний рядвідображає значення показників на певний момент часу (дату часу). У моментних рядах дослідника може цікавити тільки різниця явищ, що відображає зміну рівня ряду між певними датами, оскільки сума рівнів тут не має реального змісту. Накопичені результати тут не розраховуються.

Найважливішою умовою правильної побудови динамічних рядів є сумісність рівнів рядів, що належать до різних періодів. Рівні повинні бути представлені в однорідних величинах, повинна мати місце однакова повнота охоплення різних частин явища.

Щоб уникнути спотворення реальної динаміки, у статистичному дослідженні проводяться попередні розрахунки (змикання рядів динаміки), які передують статистичного аналізу динамічних рядів. Під змиканням рядів динамікиприйнято розуміти об'єднання в один ряд двох і більше рядів, рівні яких розраховані за різною методологією або не відповідають територіальним кордонам тощо. Змикання рядів динаміки може припускати також приведення абсолютних рівнів рядів динаміки до загальної основи, що нівелює непорівнянність рівнів динаміки.

25. Поняття сумісності рядів динаміки, коефіцієнти, темпи зростання та приросту.

Ряди динаміки- це ряди статистичних показників, що характеризують розвиток явищ природи та суспільства в часі. Статистичні збірники, що публікуються Держкомстатом Росії, містять велику кількість рядів динаміки в табличній формі. Ряди динаміки дозволяють виявити закономірності розвитку явищ, що вивчаються.

Ряди динаміки містять два види показників. Показники часу(Роки, квартали, місяці та ін) або моменти часу (на початок року, на початок кожного місяця і т.п.). Показники рівнів ряду. Показники рівнів рядів динаміки бувають виражені абсолютними величинами (виробництво продукту в тоннах або рублях), відносними величинами (питома вага міського населення в %) та середніми величинами (середня зарплата працівників галузі за роками тощо). У табличній формі ряд динаміки містить два стовпці або два рядки.

Правильне побудова рядів динаміки передбачає виконання низки вимог:

  1. усі показники низки динаміки мають бути науково обґрунтованими, достовірними;
  2. показники низки динаміки мають бути зіставні за часом, тобто. мають бути обчислені за однакові періоди часу чи однакові дати;
  3. показники низки динаміки мають бути зіставні територією;
  4. показники низки динаміки мають бути зіставні за змістом, тобто. обчислені за єдиною методологією, однаковим способом;
  5. показники низки динаміки мають бути зіставні по колу господарств, що враховуються. Усі показники низки динаміки повинні бути наведені в одних і тих самих одиницях вимірювання.

Статистичні показники можуть характеризувати або результати досліджуваного процесу за період часу, або стан досліджуваного явища на певний момент часу, тобто. показники бувають інтервальними (періодичними) та моментними. Відповідно спочатку ряди динаміки бувають або інтервальними, або моментними. Моментні ряди динаміки у свою чергу бувають з рівними та нерівними проміжками часу.

Початкові ряди динаміки бувають перетворені на ряд середніх величин і відносних величин (ланцюговий і базисний). Такі ряди динаміки називають похідними рядами динаміки.

Методика розрахунку середнього рівня серед динаміки різна, обумовлена ​​виглядом низки динаміки. На прикладах розглянемо види рядів динаміки та формули для розрахунку середнього рівня.

Абсолютні прирости (Δy) показують, скільки одиниць змінився наступний рівень низки проти попереднім (гр.3. - ланцюгові абсолютні прирости) чи порівняно з початковим рівнем (гр.4. - базисні абсолютні прирости). Формули розрахунку можна записати так:

При зменшенні абсолютних значень ряду буде відповідно "зменшення", "зниження".

Показники абсолютного приросту свідчать, що, наприклад, 1998 року. виробництво товару " А " збільшилося проти 1997 року. на 4 тис. т, а проти 1994 року. - на 34 тис. т; за рештою років див. табл. 11.5 гр.
Розміщено на реф.
3 та 4.

Коефіцієнт зростанняпоказує, скільки разів змінився рівень низки проти попереднім (гр.5 - ланцюгові коефіцієнти зростання чи зниження) чи проти початковим рівнем (гр.6 - базисні коефіцієнти зростання чи зниження). Формули розрахунку можна записати так:

Темпи зростанняпоказують, скільки відсотків становить наступний рівень низки проти попереднім (гр.7 - ланцюгові темпи зростання) чи проти початковим рівнем (гр.8 - базисні темпи зростання). Формули розрахунку можна записати так:

Приміром, 1997 року. обсяг виробництва товару " А " проти 1996 року. становив 105,5 % (

Темпи прироступоказують, скільки відсотків збільшився рівень звітного періоду проти попереднім (гр.9- ланцюгові темпи приросту) чи проти початковим рівнем (гр.10- базисні темпи приросту). Формули розрахунку можна записати так:

Т пр = Т р - 100% або Т пр = абсолютний приріст / рівень попереднього періоду * 100%

Приміром, 1996 року. проти 1995 року. товару " А " вироблено на 3,8 % (103,8 %- 100%) чи (8:210)х100%, а проти 1994 год. - на 9% (109% – 100%).

Якщо абсолютні рівні в ряду зменшуються, то темп буде менше 100% і відповідно буде темп зниження (темп приросту зі знаком мінус).

Абсолютне значення 1% приросту(Гр.
Розміщено на реф.
11) показує, скільки одиниць необхідно зробити у цьому періоді, щоб рівень попереднього періоду збільшився на 1 %. У прикладі, в 1995 року. Треба було зробити 2,0 тис. т., а 1998 року. - 2,3 тис. т., н. значно більше.

Визначити величину абсолютного значення 1% приросту можна двома способами:

§ рівень попереднього періоду розділити на 100;

§ абсолютні ланцюгові прирости розділити на відповідні ланцюгові темпи приросту.

Абсолютне значення 1% приросту =

У динаміці, особливо протягом тривалого періоду, важливий спільний аналіз темпів приросту зі змістом кожного відсотка приросту чи зниження.

Зауважимо, що розглянута методика аналізу рядів динаміки застосовна як для рядів динаміки, рівні яких виражені абсолютними величинами (т, тис. руб., Число працівників і т.д.), так і для рядів динаміки, рівні яких виражені відносними показниками (% шлюбу , % Зольність вугілля та ін) або середніми величинами (середня врожайність у ц/га, середня зарплата і т.п.).

Поряд з розглянутими аналітичними показниками, що обчислюються за кожен рік у порівнянні з попереднім або початковим рівнем, при аналізі рядів динаміки вкрай важливо обчислити середні за період аналітичні показники: середній рівень ряду, середній річний абсолютний приріст (зменшення) та середній річний темп зростання та темп .

Методи розрахунку середнього рівня низки динаміки було розглянуто вище. У аналізованому нами інтервальному ряду динаміки середній рівень ряду обчислюється за формулою середньої арифметичної простий:

Середньорічний обсяг виробництва товару за 1994-1998 р. становив 218,4 тис. т.

Середньорічний абсолютний приріст обчислюється також за формулою середньої арифметичної

Середнє квадратичне відхилення - поняття та види. Класифікація та особливості категорії "Середнє квадратичне відхилення" 2017, 2018.

Заняття №4

Тема: «Описова статистика. Показники різноманітності ознаки у сукупності»

Основними критеріями різноманітності ознаки у статистичній сукупності є: ліміт, амплітуда, середнє квадратичне відхилення, коефіцієнт осциляції та коефіцієнт варіації. На попередньому занятті обговорювалося, що середні величини дають лише узагальнюючу характеристику ознаки, що вивчається, в сукупності і не враховують значення окремих його варіант: мінімальне і максимальне значення, вище середнього, нижче середнього і т.д.

приклад. Середні величини двох різних числових послідовностей: -100; -20; 100; 20 та 0,1; -0,2; 0,1 абсолютно однакові та рівніО.Однак, діапазони розкиду цих послідовностей відносного середнього значення сильно різні.

Визначення перелічених критеріїв різноманітності ознаки насамперед здійснюється з урахуванням його значення окремих елементів статистичної сукупності.

Показники виміру варіації ознаки бувають абсолютніі відносні. До абсолютних показників варіації відносять: розмах варіації, ліміт, середнє відхилення, дисперсію. Коефіцієнт варіації та коефіцієнт осциляції відносяться до відносних показників варіації.

Ліміт (lim) -це критерій, який визначається крайніми значеннями варіант у варіаційному ряду. Іншими словами, даний критерій обмежується мінімальною та максимальною величинами ознаки:

Амплітуда (Am)або розмах варіації –це різниця крайніх варіантів. Розрахунок даного критерію здійснюється шляхом віднімання з максимального значення ознаки його мінімального значення, що дозволяє оцінити ступінь розкиду варіант:

Недоліком ліміту та амплітуди як критеріїв варіабельності є те, що вони повністю залежать від крайніх значень ознаки варіаційного ряду. У цьому не враховуються коливання значень ознаки всередині ряду.

Найбільш повну характеристику різноманітності ознаки у статистичній сукупності дає середнє квадратичне відхилення(сигма), яке є загальним заходом відхилення варіант від своєї середньої величини. Середнє квадратичне відхилення часто називають також стандартним відхиленням.

У основі середнього квадратичного відхилення лежить зіставлення кожної варіанти із середньої арифметичної цієї сукупності. Оскільки в сукупності завжди будуть варіанти як менше, і більше, ніж вона, то сума відхилень , мають знак " " , погашатиметься сумою відхилень, мають знак " " , тобто. сума всіх відхилень дорівнює нулю. А, щоб уникнути впливу символів різниць беруть відхилення варіант від середнього арифметичного у квадраті, тобто. . Сума квадратів відхилень не дорівнює нулю. Щоб отримати коефіцієнт, здатний виміряти мінливість, беруть середнє від суми квадратів – це величина називається дисперсії:

За змістом дисперсія – це середній квадрат відхилень індивідуальних значень ознаки від його середньої величини. Дисперсія квадрат середнього квадратичного відхилення.

Дисперсія є розмірною величиною (іменованою). Так, якщо варіанти числового ряду виражені в метрах, дисперсія дає квадратні метри; якщо варіанти виражені у кілограмах, то дисперсія дає квадрат цього заходу (кг 2), і т.д.

Середнє квадратичне відхилення- Квадратний корінь з дисперсії:

, то при розрахунку дисперсії та середнього квадратичного відхилення у знаменнику дробу замістьнеобхідно ставити.

Розрахунок середнього квадратичного відхилення можна розбити на шість етапів, які необхідно здійснити у певній послідовності:

Застосування середньоквадратичного відхилення:

а) для судження про коливання варіаційних рядів та порівняльної оцінки типовості (представницькості) середніх арифметичних величин. Це необхідно в диференціальній діагностиці щодо стійкості ознак.

б) на реконструкцію варіаційного ряду, тобто. відновлення його частотної характеристики на основі правила «трьох сигм». В інтервалі (М±3σ) знаходиться 99,7% всіх варіантів ряду, в інтервалі (М±2σ) - 95,5% та в інтервалі (М±1σ) - 68,3% варіант ряду(Рис.1).

в) для виявлення «вискакуючих» варіант

г) для визначення параметрів норми та патології за допомогою сигмальних оцінок

д) для розрахунку коефіцієнта варіації

е) до розрахунку середньої помилки середньої арифметичної величини.

Для характеристики будь-якої генеральної сукупності, що маєнормальний тип розподілу , достатньо знати два параметри: середню арифметичну та середнє квадратичне відхилення.

Малюнок 1. Правило "трьох сигм"

приклад.

У педіатрії середньоквадратичне відхилення використовують для оцінки фізичного розвитку дітей шляхом порівняння даних конкретної дитини з відповідними стандартними показниками. За стандарт беруться середні арифметичні показники фізичного розвитку здорових дітей. Порівняння показників зі стандартами проводять за спеціальними таблицями, в яких стандарти наводяться разом із відповідними їм сигмальними шкалами. Вважається, що якщо показник фізичного розвитку дитини знаходиться в межах стандарту (середнє арифметичне) ±σ, то фізичний розвиток дитини (за цим показником) відповідає нормі. Якщо показник знаходиться в межах стандарту ±2σ, то є незначне відхилення від норми. Якщо показник виходить за ці межі, то фізичний розвиток дитини різко відрізняється від норми (можлива патологія).

Крім показників варіації, що у абсолютних величинах, у статистичному дослідженні використовуються показники варіації, виражені у відносних величинах. Коефіцієнт осциляції -це відношення розмаху варіації до середньої величини ознаки. Коефіцієнт варіації -це відношення середнього квадратичного відхилення до середньої величини ознаки. Як правило, ці величини виражаються у відсотках.

Формули розрахунку відносних показників варіації:

З наведених формул видно, що чим більший коефіцієнт V наближений до нуля, тим менша варіація значень ознаки. Чим більше V, тим паче мінливий ознака.

У статистичній практиці найчастіше застосовується коефіцієнт варіації. Він використовується як для порівняльної оцінки варіації, але й характеристики однорідності сукупності. Сукупність вважається однорідною, якщо коефіцієнт варіації вбирається у 33% (для розподілів, близьких до нормального). Арифметично ставлення і середньої арифметичної нівелює вплив абсолютної величини цих характеристик, а відсоткове співвідношення робить коефіцієнт варіації величиною безрозмірною (неіменованою).

Отримане значення коефіцієнта варіації оцінюється відповідно до орієнтовних градацій ступеня різноманітності ознаки:

Слабке - до 10%

Середнє - 10 - 20%

Сильне – понад 20 %

Використання коефіцієнта варіації є доцільним у випадках, коли доводиться порівнювати ознаки різні за своєю величиною та розмірністю.

Відмінність коефіцієнта варіації з інших критеріїв розкиду наочно демонструє приклад.

Таблиця 1

Склад працівників промислового підприємства

З наведених у прикладі статистичних показників можна дійти невтішного висновку щодо відносної однорідності вікового складу та освітнього рівня працівників підприємства за низької професійної стійкості обстеженого контингенту. Неважко помітити, що спроба судити про ці соціальні тенденції за середнім квадратичним відхиленням призвела б до помилкового висновку, а спроба порівняння облікових ознак «стаж роботи» та «вік» з обліковою ознакою «освіта» взагалі була б некоректною через різнорідність цих ознак.

Медіана та перцентілі

Для порядкових (рангових) розподілів, де критерієм середини ряду є медіана, середньоквадратичне відхилення та дисперсія не можуть бути характеристиками розсіювання варіант.

Те саме властиво і для відкритих варіаційних рядів. Зазначена обставина пов'язана з тим, що відхилення, за якими обчислюються дисперсія та σ, відраховуються від середнього арифметичного, яке не обчислюється у відкритих варіаційних рядах та у рядах розподілів якісних ознак. Тому для стисненого опису розподілів використовується інший параметр розкиду – квантиль(синонім - «nерцентиль»), придатний для опису якісних та кількісних ознак за будь-якої форми їх розподілу. Цей параметр може використовуватися і для переведення кількісних ознак у якісні. І тут такі оцінки присвоюються залежно від цього, якому порядку квантилю відповідає та чи інша конкретна варіанта.

У практиці медико-біологічних досліджень найчастіше використовуються такі кванти:

- Медіана;

, – квартили (чверті), де – нижній квартиль, верхній квартиль.

Квантилі ділять область можливих змін варіантів у варіаційному ряду на певні інтервали. Медіана (квантиль) - це варіанта, яка знаходиться в середині варіаційного ряду і ділить цей ряд навпіл, на дві рівні частини ( 0,5 і 0,5 ). Квартиль ділить ряд на чотири частини: перша частина (нижній квартиль) - це варіанти, що відокремлює варіанти, числові значення яких не перевищують 25% максимально можливого в даному ряду, квартиль відокремлює варіанти з числовим значенням до 50% максимально можливого. Верхній квартиль () відокремлює варіанти завбільшки до 75% від максимально можливих значень.

У разі асиметричності розподілу змінної щодо середнього арифметичного для його характеристики використовуються медіана та квартилі.І тут використовується наступна форма відображення середньої величини – Ме (;). Наприклад, Досліджуваний ознака – «термін, у якому дитина почав самостійно ходити» - у досліджуваній групі має асиметричний розподіл. При цьому нижньому квартилю () відповідає термін початку ходьби – 9,5 місяців, медіані – 11 місяців, верхньому квартилю () – 12 місяців. Відповідно, характеристика середньої тенденції зазначеної ознаки буде представлена ​​як 11 (9,5; 12) місяців.

Оцінка статистичної значущості результатів дослідження

Під статистичної значимістю даних розуміють ступінь відповідності відображуваної дійсності, тобто. статистично значимими даними вважаються ті, які спотворюють і правильно відбивають об'єктивну реальність.

Оцінити статистичну значимість результатів дослідження – означає визначити, з якою ймовірністю можна перенести результати, отримані на вибірковій сукупності, всю генеральну сукупність. Оцінка статистичної значущості необхідна розуміння того, наскільки щодо явища можна будувати висновки про явище загалом і його закономірностях.

Оцінка статистичної значущості результатів дослідження складається з:

1. помилок репрезентативності (помилок середніх та відносних величин) - m;

2. довірчих меж середніх чи відносних величин;

3. достовірності різниці середніх чи відносних величин за критерієм t.

Стандартна помилка середньої арифметичноїабо помилка репрезентативностіхарактеризує коливання середньої. При цьому необхідно відзначити, що чим більший обсяг вибірки, тим менше розкид середніх величин. Стандартна помилка середнього обчислюється за такою формулою:

У сучасній науковій літературі середня арифметична записується разом із помилкою репрезентативності:

або разом із середньоквадратичним відхиленням:

Як приклад розглянемо дані щодо 1500 міських поліклінік країни (генеральна сукупність). Середня кількість пацієнтів, які обслуговуються в поліклініці, дорівнює 18150 осіб. Випадковий відбір 10% об'єктів (150 поліклінік) дає середню кількість пацієнтів, що дорівнює 20051 чоловік. Помилка вибірки, очевидно пов'язана з тим, що не всі 1500 поліклінік потрапили у вибірку, дорівнює різниці між цими середніми – генеральним середнім ( Mген) та вибірковим середнім ( Мвиб). Якщо сформувати іншу вибірку того самого обсягу з нашої генеральної сукупності, то вона дасть іншу величину помилки. Всі ці вибіркові середні за досить великих вибірках розподілені нормально навколо генеральної середньої за досить великої кількості повторень вибірки однієї й тієї кількості об'єктів з генеральної сукупності. Стандартна помилка середнього m- це неминучий розкид вибіркових середніх довкола генеральної середньої.

У разі коли результати дослідження представлені відносними величинами (наприклад, відсотковими частками) – розраховується стандартна помилка частки:

де P – показник %, n – кількість спостережень.

Результат відображається у вигляді (P±m)%. Наприклад,відсоток одужання серед хворих становив (95,2±2,5)%.

У тому випадку, якщо кількість елементів сукупності, то при розрахунку стандартних помилок середнього та частки у знаменнику дробу замістьнеобхідно ставити.

Для нормального розподілу (розподіл вибіркових середніх є нормальним) відомо, яка частина сукупності потрапляє у будь-який інтервал навколо середнього значення. Зокрема:

Насправді проблема полягає в тому, що характеристики генеральної сукупності нам невідомі, а вибірка робиться саме з метою їх оцінки. Це означає, що якщо ми робитимемо вибірки одного і того ж обсягу nіз генеральної сукупності, то в 68,3% випадків на інтервалі буде знаходитись значення M(воно ж у 95,5% випадків перебуватиме на інтервалі та у 99,7% випадків – на інтервалі).

Оскільки реально робиться лише одна вибірка, то формулюється це твердження у термінах ймовірності: з ймовірністю 68,3% середнє значення ознаки у генеральній сукупності укладено в інтервалі, з ймовірністю 95,5% - в інтервалі та ін.

На практиці навколо вибіркового значення будується такий інтервал, який із заданою (досить високою) ймовірністю – довірчою ймовірністю –«накривав» справжнє значення цього параметра в генеральній сукупності. Цей інтервал називається довірчим інтервалом.

Довірча ймовірністьP це ступінь упевненості в тому, що довірчий інтервал справді міститиме справжнє (невідоме) значення параметра в генеральній сукупності.

Наприклад, якщо довірча ймовірність Рдорівнює 90%, це означає, що 90 вибірок зі 100 дадуть правильну оцінку параметра в генеральній сукупності. Відповідно, можливість помилки, тобто. неправильної оцінки генерального середнього за вибіркою, що дорівнює у відсотках: . Для цього це означає, що 10 вибірок зі 100 дадуть неправильну оцінку.

Очевидно, що ступінь впевненості (довірча ймовірність) залежить від величини інтервалу: чим ширший інтервал, тим вища впевненість, що до нього потрапить невідоме значення для генеральної сукупності. Насправді для побудови довірчого інтервалу береться, як мінімум, подвоєна помилка вибірки, щоб забезпечити впевненість щонайменше 95,5%.

Визначення довірчих меж середніх і відносних величин дозволяє знайти два їх крайніх значення - мінімально можливе і максимально можливе, в межах яких показник може зустрічатися у всій генеральній сукупності. Виходячи з цього, довірчі межі (або довірчий інтервал)- це межі середніх чи відносних величин, вихід межі яких унаслідок випадкових коливань має незначну ймовірність.

Довірчий інтервал може бути переписаний у вигляді: , де t- Довірчий критерій.

Довірчі межі середньої арифметичної величини в генеральній сукупності визначають за такою формулою:

М ген = М виб + t m M

для відносної величини:

Р ген = Р виб + t m Р

де М гені Р ген- значення середньої та відносної величини для генеральної сукупності; М вибі Р виб- значення середньої та відносної величини, отримані на вибірковій сукупності; m Mі m P- помилки середньої та відносної величин; t- довірчий критерій (критерій точності, який встановлюється при плануванні дослідження і може дорівнювати 2 або 3); t m- це довірчий інтервал або Δ – гранична помилка показника, отриманого під час вибіркового дослідження.

Слід зазначити, що величина критерію tПевною мірою пов'язана з ймовірністю безпомилкового прогнозу (р), вираженої в %. Її обирає сам дослідник, керуючись необхідністю отримати результат із потрібним ступенем точності. Так, для ймовірності безпомилкового прогнозу 95,5% величина критерію tстановить 2, для 99,7% – 3.

Наведені оцінки довірчого інтервалу прийнятні лише статистичних сукупностей із кількістю спостережень понад 30. При меншому обсязі сукупності (малих вибірках) визначення критерію t користуються спеціальними таблицями. У даних таблицях шукане значення перебуває на перетині рядка, відповідної чисельності сукупності (n-1), та стовпця, що відповідає рівню ймовірності безпомилкового прогнозу (95,5%; 99,7%), обраному дослідником. У медичних дослідженнях при встановленні довірчих кордонів будь-якого показника прийнято можливість безпомилкового прогнозу 95,5% і більше. Це означає, що величина показника, отримана на вибірковій сукупності, повинна зустрічатися в генеральній сукупності як мінімум у 95,5% випадків.

    Запитання по темі заняття:

    Актуальність показників різноманітності ознаки у статистичній сукупності.

    Загальна характеристика абсолютних показників варіації.

    Середнє квадратичне відхилення, розрахунок, застосування.

    Відносні показники варіації.

    Медіана, квартильна оцінка.

    Оцінка статистичної значущості результатів дослідження.

    Стандартна помилка середньої арифметичної, формула розрахунку, приклад використання.

    Розрахунок частки та її стандартної помилки.

    Концепція довірчої ймовірності, приклад використання.

10. Поняття довірчого інтервалу, його застосування.

    Тестові завдання на тему з зразками відповідей:

1. ДО АБСОЛЮТНИХ ПОКАЗНИКІВ ВАРІАЦІЇ ВІДНОСИТЬСЯ

1) коефіцієнт варіації

2) коефіцієнт осциляції

4) медіана

2. ДО ВІДНОСНИХ ПОКАЗНИКІВ ВАРІАЦІЇ ВІДНОСИТЬСЯ

1) дисперсія

4) коефіцієнт варіації

3. КРИТЕРІЙ, ЯКИЙ ВИЗНАЧАЄТЬСЯ КРАЙНІМИ ЗНАЧЕННЯМИ ВАРІАНТ У ВАРІАЦІЙНОМУ РЯДУ

2) амплітуда

3) дисперсія

4) коефіцієнт варіації

4. РІЗНІСТЬ КРАЙНІХ ВАРІАНТ - ЦЕ

2) амплітуда

3) середнє квадратичне відхилення

4) коефіцієнт варіації

5. СЕРЕДНІЙ КВАДРАТ ВІДКЛОНЕНЬ ІНДИВІДУАЛЬНИХ ЗНАЧЕНЬ ОЗНАКУ ВІД ЙОГО СЕРЕДНЬОЇ ВЕЛИЧИНИ – ЦЕ

1) коефіцієнт осциляції

2) медіана

3) дисперсія

6. ВІДНОСЕННЯ РОЗМАХУ ВАРІАЦІЇ ДО СЕРЕДНЬОЇ ВЕЛИЧИНИ ПРИЗНАКУ – ЦЕ

1) коефіцієнт варіації

2) середнє квадратичне відхилення

4) коефіцієнт осциляції

7. ВІДНОСІННЯ СЕРЕДНЬОГО КВАДРАТИЧНОГО ВІДКЛОНЕННЯ ДО СЕРЕДНЬОЇ ВЕЛИЧИНИ ОЗНАКУ – ЦЕ

1) дисперсія

2) коефіцієнт варіації

3) коефіцієнт осциляції

4) амплітуда

8. ВАРІАНТА, ЯКА ЗНАХОДИТЬСЯ В СЕРЕДИНІ ВАРІАЦІЙНОГО РЯДУ І ДІЛИТЬ ЙОГО НА ДВІ РІВНІ ЧАСТИНИ – ЦЕ

1) медіана

3) амплітуда

9. У МЕДИЧНИХ ДОСЛІДЖЕННЯХ ПРИ ВСТАНОВЛЕННІ ДОВЕРЧИХ КОРДОНІВ БУДЬ-ЯКОГО ПОКАЗНИКА ПРИЙНЯТА ІМОВІТНІСТЬ БЕЗПРИМИЛНОГО ПРОГНОЗУ

10. ЯКЩО 90 ВИБІРОК ЗІ 100 ДАЮТЬ ПРАВИЛЬНУ ОЦІНКУ ПАРАМЕТРА В ГЕНЕРАЛЬНІЙ СУКУПНОСТІ, ТО ЦЕ ОЗНАЧАЄ, ЩО ДОВЕРЧА ІМОВІРНІСТЬ PРІВНА

11. У РАЗІ, ЯКЩО 10 ВИБІРОК З 100 ДАЮТЬ НЕВЕРНУ ОЦІНКУ, ІМОВІТНІСТЬ ПОМИЛКИ РІВНА

12. КОРДОНИ СЕРЕДНІХ АБО ВІДНОСНИХ ВЕЛИЧИН, ВИХІД ЗА МЕЖИ ЯКИХ ВСЛІДСТВО ВИПАДКОВИХ КОЛИВАНЬ МАЄ НЕЗНАЧНУ ІМОВІРНІСТЬ – ЦЕ

1) довірчий інтервал

2) амплітуда

4) коефіцієнт варіації

13. МАЛИЙ ВИБІРКОЮ ВВАЖАЄТЬСЯ ТА СУКУПНІСТЬ, У ЯКІЙ

1) n менше або дорівнює 100

2) n менше або дорівнює 30

3) n менше або дорівнює 40

4) n близько до 0

14. ДЛЯ ймовірності безпомилкового прогнозу 95% ВЕЛИЧИНА КРИТЕРІЯ tСкладає

15. ДЛЯ ймовірності безпомилкового прогнозу 99% ВЕЛИЧИНА КРИТЕРІЯ tСкладає

16. ДЛЯ РОЗПОДІЛ, БЛИЗЬКИХ ДО НОРМАЛЬНОГО, СУКУПНІСТЬ ВВАЖАЄТЬСЯ ОДНОРІДНОЮ, ЯКЩО КОЕФІЦІЄНТ ВАРІАЦІЇ НЕ ПЕРЕВИЩУЄ

17. ВАРІАНТА, ЩО ВІДДІЛЮЄ ВАРІАНТИ, ЧИСЛОВІ ЗНАЧЕННЯ ЯКИХ НЕ ПЕРЕВИЩУЮТЬ 25% МАКСИМАЛЬНО МОЖЛИВОГО У ДАНОМУ РЯДУ – ЦЕ

2) нижній квартиль

3) верхній квартиль

4) квартиль

18. ДАНІ, ЯКІ НЕ СПОКАЖУЮТЬ І ПРАВИЛЬНО ВІДБИЛЯЮТЬ ОБ'ЄКТИВНУ РЕАЛЬНІСТЬ, НАЗИВАЮТЬСЯ

1) неможливі

2) рівноможливі

3) достовірні

4) випадкові

19. ЗГОДНО ПРАВИЛУ "ТРОХ СИГМ", ПРИ НОРМАЛЬНОМУ РОЗПОДІЛІ ОЗНАКУ У МЕЖАХ
БУДЕ ЗНАХОДИТИСЯ

1) 68,3% варіант

Дисперсія. Середнє квадратичне відхилення

Дисперсія- це середня арифметична квадратів відхилень кожного значення ознаки від загальної середньої. Залежно від вихідних даних, дисперсія може бути незваженою (простою) або зваженою.

Дисперсія розраховується за такими формулами:

· Для несгрупованих даних

· Для згрупованих даних

Порядок розрахунку дисперсії зважену:

1. визначають середню арифметичну зважену

2. визначаються відхилення варіант від середньої

3. зводять у квадрат відхилення кожної варіанти від середньої

4. множать квадрати відхилень на ваги (частоти)

5. підсумовують отримані твори

6. отриману суму ділять на суму ваг

Формула для визначення дисперсії може бути перетворена на таку формулу:

- проста

Порядок розрахунку дисперсії простий:

1. визначають середню арифметичну

2. зводять у квадрат середню арифметичну

3. зводять у квадрат кожну варіанту ряду

4. знаходимо суму квадратів варіант

5. ділять суму квадратів варіант з їхньої число, тобто. визначають середній квадрат

6. визначають різницю між середнім квадратом ознаки та квадратом середньої

Також формула для визначення дисперсії зваженої може бути перетворена на таку формулу:

тобто. дисперсія дорівнює різниці середньої з квадратів значень ознаки та квадрата середньої арифметичної. При користуванні перетвореною формулою виключається додаткова процедура з розрахунку відхилень індивідуальних значень ознаки від х та виключається помилка у розрахунку, пов'язана із округленням відхилень

Дисперсія має ряд властивостей, деякі з них дозволяють спростити її обчислення:

1) дисперсія постійної величини дорівнює нулю;

2) якщо всі варіанти значень ознаки зменшити на те саме число, то дисперсія не зменшиться;

3) якщо всі варіанти значень ознаки зменшити в те саме число раз (раз), то дисперсія зменшиться в раз

Середнє квадратичне відхилення S- являє собою квадратний корінь з дисперсії:

· Для несгрупованих даних:

;

· Для варіаційного ряду:

Розмах варіації, середнє лінійне та середнє квадратичне відхилення є іменованими величинами. Вони мають самі одиниці виміру, як і індивідуальні значення ознаки.

Дисперсія та середнє квадратичне відхилення найбільш широко застосовуваних показників варіації. Пояснюється це тим, що вони входять до більшості теорем теорії ймовірності, яка є фундаментом математичної статистики. Крім того, дисперсія може бути розкладена на складові елементи, що дозволяють оцінити вплив різних факторів, що зумовлюють варіацію ознаки.

Розрахунок показників варіації для банків, згрупованих за розміром прибутку, показано у таблиці.

Розмір прибутку, млн. руб. Число банків розрахункові показники
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Разом: 121,70 17,640 23,126

Середнє лінійне та середнє квадратичне відхилення показують на скільки в середньому коливається величина ознаки у одиниць та досліджуваної сукупності. Так, у разі середня величина коливання розміру прибутку становить: по середньому лінійному відхилення 0,882 млн. крб.; за середнім квадратичним відхиленням - 1,075 млн. руб. Середнє квадратичне відхилення завжди більше середнього лінійного відхилення. Якщо розподіл ознаки, близький до нормального, між S і d існує взаємозв'язок: S=1,25d, або d=0,8S. Середнє квадратичне відхилення показує, як розташована основна маса одиниць сукупності щодо середньої арифметичної. Незалежно від форми розподілу 75 значень ознаки потрапляють в інтервал х 2S, а принаймні 89 всіх значень потрапляють в інтервал х 3S (теорема П.Л.Чебишева).

Отримані з досвіду величини неминуче містять похибки, зумовлені найрізноманітнішими причинами. Серед них слід розрізняти похибки систематичні та випадкові. Систематичні помилки зумовлюються причинами, що діють цілком певним чином, і можуть бути завжди усунуті або досить точно враховані. Випадкові помилки викликаються дуже великою кількістю окремих причин, які не піддаються точному обліку і діють у кожному окремому вимірі по-різному. Ці помилки неможливо виключити; врахувати їх можна лише у середньому, навіщо необхідно знати закони, яким підпорядковуються випадкові помилки.

Означатимемо вимірювану величину через А, а випадкову помилку при вимірюванні х. Так як помилка х може набувати будь-яких значень, то вона є безперервною випадковою величиною, яка цілком характеризується своїм законом розподілу.

Найбільш простим і досить точно відображає дійсність (у переважній більшості випадків) є так званий нормальний закон розподілу помилок:

Цей закон розподілу може бути отриманий з різних теоретичних передумов, зокрема, з вимоги, щоб найбільш ймовірним значенням невідомої величини, для якої безпосереднім виміром отримано ряд значень з однаковим ступенем точності, було середнє арифметичне цих значень. Величина 2 називається дисперсієюцього нормального закону.

Середнє арифметичне

Визначення дисперсії за дослідними даними. Якщо для будь-якої величини А безпосереднім виміром отримано n значень a i з однаковим ступенем точності і якщо помилки величини А підпорядковані нормальному закону розподілу, то найімовірнішим значенням буде А середнє арифметичне:

a - середнє арифметичне,

a i - виміряне значення на i-му кроці.

Відхилення значення (для кожного спостереження) a i величини А від середнього арифметичного: a i - a.

Для визначення дисперсії нормального закону розподілу помилок у цьому випадку користуються формулою:

2 - дисперсія,
a - середнє арифметичне,
n - кількість вимірювань параметра,

Середньоквадратичне відхилення

Середньоквадратичне відхиленняпоказує абсолютне відхилення виміряних значень від середньоарифметичного. Відповідно до формули для міри точності лінійної комбінації середня квадратична помилкасереднього арифметичного визначається за такою формулою:

, де


a - середнє арифметичне,
n - кількість вимірювань параметра,
a i - виміряне значення на i-му кроці.

Коефіцієнт варіації

Коефіцієнт варіаціїхарактеризує відносну міру відхилення виміряних значень від середньоарифметичного:

, де

V - коефіцієнт варіації,
- середньоквадратичне відхилення,
a – середнє арифметичне.

Чим більше значення коефіцієнта варіаціїтим більший розкид і менша вирівняність досліджуваних значень. Якщо коефіцієнт варіаціїменше 10%, то мінливість варіаційного ряду прийнято вважати незначною, від 10% до 20% відноситься до середньої, більше 20% і менше 33% до значної і якщо коефіцієнт варіаціїперевищує 33%, то це говорить про неоднорідність інформації та необхідність виключення найбільших і найменших значень.

Середнє лінійне відхилення

Один із показників розмаху та інтенсивності варіації - середнє лінійне відхилення(Середній модуль відхилення) від середнього арифметичного. Середнє лінійне відхиленнярозраховується за формулою:

, де

_
a - середнє лінійне відхилення,
a - середнє арифметичне,
n - кількість вимірювань параметра,
a i - виміряне значення на i-му кроці.

Для перевірки відповідності досліджуваних значень закону нормального розподілузастосовують відношення показника асиметріїдо його помилки та ставлення показника ексцесудля його помилки.

Показник асиметрії

Показник асиметрії(A) та його помилка (m a) розраховується за такими формулами:

, де

А – показник асиметрії,
- середньоквадратичне відхилення,
a - середнє арифметичне,
n - кількість вимірювань параметра,
a i - виміряне значення на i-му кроці.

Показник ексцесу

Показник ексцесу(E) та його помилка (m e) розраховується за такими формулами:

, де

Середньоквадратичне відхилення(синоніми: середнє квадратичне відхилення, середньоквадратичне відхилення, квадратичне відхилення; близькі терміни: стандартне відхилення, стандартний розкид) - в теорії ймовірностей і статистиці найбільш поширений показник розсіювання значень випадкової величини щодо її математичного очікування. При обмежених масивах вибірок значень замість математичного очікування використовується середня арифметична сукупність вибірок.

Енциклопедичний YouTube

  • 1 / 5

    Середньоквадратичне відхилення вимірюється в одиницях вимірювання самої випадкової величини і використовується при розрахунку стандартної помилки середнього арифметичного, при побудові довірчих інтервалів, при статистичній перевірці гіпотез, при вимірюванні лінійної зв'язки. Визначається як квадратний корінь з дисперсії випадкової величини .

    Середньоквадратичне відхилення:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ;
    • Примітка: Дуже часто зустрічаються різночитання в назвах СКО (Середньоквадратичного відхилення) та СТО (Стандартного відхилення) за їх формулами. Наприклад, у модулі numPy мови програмування Python функція std() описується як "standart deviation", тоді як формула відображає СКО (розподіл на корінь з вибірки). У Excel функція СТАНДОТКЛОН() інша (розподіл на корінь з n-1).

    Стандартне відхилення(Оцінка середньоквадратичного відхилення випадкової величини xщодо її математичного очікування на основі незміщеної оцінки її дисперсії) s (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 .

    де (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar(x))\right) ^(2))).)σ 2 (\displaystyle \sigma ^(2)) - дисперсія; - i x i (\displaystyle x_(i)) -й елемент вибірки; n (\displaystyle n)

    - Обсяг вибірки;

    - середня арифметична вибірки:

    x = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) .

    (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+ldots +x_(n)).)

    (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+ldots +x_(n)).) (Слід зазначити, що обидві оцінки зміщені. У загальному випадку незміщену оцінку побудувати неможливо. Однак оцінка на основі оцінки незміщеної дисперсії є заможною.Відповідно до ГОСТ Р 8.736-2011 середньоквадратичне відхилення вважається за другою формулою цього розділу. Будь ласка, звірте результати. Правило трьох сигм 3 σ (\displaystyle 3\sigma ) ) - практично всі значення нормально розподіленої випадкової величини лежать в інтервалі(x − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right))

    . Суворіше - приблизно з ймовірністю 0,9973 значення нормально розподіленої випадкової величини лежить у зазначеному інтервалі (за умови, що величина ) - практично всі значення нормально розподіленої випадкової величини лежать в інтервалі x ¯ (\displaystyle (\bar(x))) справжня, а чи не отримана внаслідок обробки вибірки).Якщо ж справжня величина невідома, то слід користуватися неσ (\displaystyle \sigma ) невідома, то слід користуватися не .

    , а

    s

    Наприклад, у нас є три числові множини: (0, 0, 14, 14), (0, 6, 8, 14) і (6, 6, 8, 8). У всіх трьох множин середні значення дорівнюють 7, а середньоквадратичні відхилення, відповідно, дорівнюють 7, 5 і 1. У останньої множини середньоквадратичне відхилення маленьке, тому що значення у множині згруповані навколо середнього значення; у першої множини найбільше значення середньоквадратичного відхилення - значення всередині множини сильно розходяться із середнім значенням.

    У загальному сенсі середньоквадратичне відхилення вважатимуться мірою невизначеності. Наприклад, у фізиці середньоквадратичне відхилення використовується визначення похибки серії послідовних вимірів будь-якої величини. Це значення дуже важливо для визначення правдоподібності досліджуваного явища в порівнянні з передбаченим теорією значенням: якщо середнє значення вимірювань сильно відрізняється від передбачених теорією значень (велике значення середньоквадратичного відхилення), то отримані значення або метод їх отримання слід перевіряти ще раз. ототожнюється із ризиком портфеля.

    Клімат

    Припустимо, існують два міста з однаковою максимальною середньої денною температурою, але одне розташоване на узбережжі, а інше на рівнині. Відомо, що в містах, розташованих на узбережжі, безліч різних максимальних денних температур менше, ніж у міст, розташованих усередині континенту. Тому середньоквадратичне відхилення максимальних денних температур у прибережного міста буде менше, ніж у другого міста, незважаючи на те, що середнє значення цієї величини у них однакове, що на практиці означає, що ймовірність того, що максимальна температура повітря кожного конкретного дня в році буде сильнішою. відрізнятиметься від середнього значення, вище у міста, розташованого всередині континенту.

    Спорт

    Припустимо, що є кілька футбольних команд, які оцінюються за деяким набором параметрів, наприклад, кількістю забитих і пропущених голів, гольових моментів і т.п. Чим менше у команди середньоквадратичне відхилення по кожному з представлених параметрів, тим більш передбачуваним є результат команди, такі команди є збалансованими. З іншого боку, у команди з великим значенням середньоквадратичного відхилення складно передбачити результат, що пояснюється дисбалансом, наприклад, сильним захистом, але слабким нападом.

    Використання середньоквадратичного відхилення параметрів команди дозволяє в тій чи іншій мірі передбачити результат матчу двох команд, оцінюючи сильні та слабкі сторони команд, а отже, і способів боротьби, що вибираються.



    Схожі статті

2024 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.