Обчислити середнє відхилення. Середньоквадратичне відхилення формули в excel

При статистичній перевірці гіпотез, при вимірі лінійного взаємозв'язку між випадковими величинами.

Середньо квадратичне відхилення:

Стандартне відхилення(Оцінка середньоквадратичного відхилення випадкової величиниПідлога, стіни навколо нас і стеля, xщодо її математичного очікуванняна основі незміщеної оцінки її дисперсії):

де - дисперсія; - Підлога, стіни навколо нас і стеля, i-й елемент вибірки; - Обсяг вибірки; - середнє арифметичне вибірки:

Слід зазначити, що обидві оцінки є зміщеними. У загальному випадкунезміщену оцінку збудувати неможливо. Однак оцінка на основі оцінки незміщеної дисперсії є заможною.

Правило трьох сигм

Правило трьох сигм() - Практично всі значення нормально розподіленої випадкової величини лежать в інтервалі. Більш строго - не менше ніж з 99,7% достовірністю значення нормально розподіленої випадкової величини лежить у зазначеному інтервалі (за умови, що величина істинна, а не отримана в результаті обробки вибірки).

Якщо ж справжня величина невідома, слід користуватися не , а Підлога, стіни навколо нас і стеля, s. Таким чином, правило трьох сигм перетворюється в правило трьох Підлога, стіни навколо нас і стеля, s .

Інтерпретація величини середньоквадратичного відхилення

Велике значення середньоквадратичного відхилення показує великий розкид значень у представленій множині середньою величиноюмножини; Маленьке значення, відповідно, показує, що значення у множині згруповані навколо середнього значення.

Наприклад, у нас є три числові множини: (0, 0, 14, 14), (0, 6, 8, 14) і (6, 6, 8, 8). У всіх трьох множин середні значення дорівнюють 7, а середньоквадратичні відхилення, відповідно, дорівнюють 7, 5 і 1. У останньої множини середньоквадратичне відхилення маленьке, тому що значення у множині згруповані навколо середнього значення; у першої множини саме велике значеннясередньоквадратичного відхилення - значення всередині множини сильно розходяться із середнім значенням.

Загалом середньоквадратичне відхилення вважатимуться мірою невизначеності. Наприклад, у фізиці середньоквадратичне відхилення використовується визначення похибки серії послідовних вимірів будь-якої величини. Це значення дуже важливо для визначення правдоподібності досліджуваного явища в порівнянні з передбаченим теорією значенням: якщо середнє значення вимірювань сильно відрізняється від передбачених теорією значень (велике значення середньоквадратичного відхилення), то отримані значення або метод їх отримання слід перевіряти ще раз.

Практичне застосування

На практиці середньоквадратичне відхилення дозволяє визначити, наскільки значення у множині можуть відрізнятися від середнього значення.

Клімат

Припустимо, існують два міста з однаковою максимальною середньою денною температурою, але одне розташоване на узбережжі, а інше всередині континенту. Відомо, що в містах, розташованих на узбережжі, безліч різних максимальних денних температур менше, ніж у міст, розташованих усередині континенту. Тому середньоквадратичне відхилення максимальних денних температур у прибережного міста буде менше, ніж у другого міста, незважаючи на те, що середнє значення цієї величини у них однакове, що на практиці означає, що ймовірність того, що максимальна температураповітря кожного конкретного дня на рік сильніше відрізнятиметься від середнього значення, вище у міста, розташованого всередині континенту.

Спорт

Припустимо, що є кілька футбольних команд, які оцінюються за деяким набором параметрів, наприклад, кількістю забитих і пропущених голів, гольових моментів тощо. Найімовірніше, що найкраща команда в цій групі матиме найкращі значенняза більшою кількістю параметрів. Чим менше у команди середньоквадратичне відхилення по кожному з представлених параметрів, тим більш передбачуваним є результат команди, такі команди є збалансованими. З іншого боку, у команди з великим значенням середньоквадратичного відхилення складно передбачити результат, що пояснюється дисбалансом, наприклад, сильним захистомале слабким нападом.

Використання середньоквадратичного відхилення параметрів команди дозволяє в тій чи іншій мірі передбачити результат матчу двох команд, оцінюючи сильні та слабкі стороникоманд, отже, і обираються способів боротьби.

Технічний аналіз

Див. також

Література

* Боровиків, Ст. STATISTICA. Мистецтво аналізу даних на комп'ютері: Для професіоналів/В. Боровиков. - СПб. : Пітер, 2003. – 688 с. - ISBN 5-272-00078-1.

$X$. Для початку нагадаємо таке визначення:

Визначення 1

Генеральна сукупність- Сукупність випадково відібраних об'єктів даного виду, над якими проводять спостереження з метою отримання конкретних значень випадкової величини, що проводяться в незмінних умовах щодо однієї випадкової величини даного виду.

Визначення 2

Генеральна дисперсія-- середнє арифметичне квадратів відхилень значень варіант генеральної сукупностівід їхнього середнього значення.

Нехай значення варіант $x_1, \ x_2, \ dots, x_k $ мають, відповідно, частоти $ n_1, \ n_2, \ dots, n_k $. Тоді генеральна дисперсія обчислюється за такою формулою:

Розглянемо окремий випадок. Нехай всі варіанти $ x_1, \ x_2, \ dots, x_k $ різні. І тут $n_1,\ n_2,\dots ,n_k=1$. Виходить, що в цьому випадку генеральна дисперсія обчислюється за формулою:

З цим поняттям також пов'язане поняття генерального середнього відхилення квадратичного.

Визначення 3

Генеральне середнє квадратичне відхилення

\[(\sigma)_г=\sqrt(D_г)\]

Вибіркова дисперсія

Нехай нам дано вибіркову сукупність щодо випадкової величини $X$. Для початку нагадаємо таке визначення:

Визначення 4

Вибіркова сукупність- частина відібраних об'єктів із генеральної сукупності.

Визначення 5

Вибіркова дисперсія- Середнє арифметичне значень варіант вибіркової сукупності.

Нехай значення варіант $x_1, \ x_2, \ dots, x_k $ мають, відповідно, частоти $ n_1, \ n_2, \ dots, n_k $. Тоді вибіркова дисперсія обчислюється за такою формулою:

Розглянемо окремий випадок. Нехай всі варіанти $ x_1, \ x_2, \ dots, x_k $ різні. І тут $n_1,\ n_2,\dots ,n_k=1$. Отримуємо, що у цьому випадку вибіркова дисперсія обчислюється за такою формулою:

З цим поняттям пов'язане поняття вибіркового середнього квадратичного відхилення.

Визначення 6

Вибіркове середнє квадратичне відхилення- Квадратний корінь з генеральної дисперсії:

\[(\sigma )_в=\sqrt(D_в)\]

Виправлена ​​дисперсія

Для знаходження виправленої дисперсії $S^2$ необхідно помножити вибіркову дисперсію на дріб $\frac(n)(n-1)$, тобто

З цим поняттям також пов'язане поняття виправленого середнього квадратичного відхилення, яке знаходиться за формулою:

У разі, коли значення варіант не є дискретними, а являють собою інтервали, то в формулах для обчислення генеральної або вибіркової дисперсій за значення $x_i$ приймається значення середини інтервалу, якому належить $x_i.$

Приклад завдання на знаходження дисперсії та середнього квадратичного відхилення

Приклад 1

Вибіркова сукупність задана наступною таблицею розподілу:

Малюнок 1.

Знайдемо для неї вибіркову дисперсію, вибіркове середнє квадратичне відхилення, виправлену дисперсію та виправлене середнє квадратичне відхилення.

Для вирішення цього завдання для початку зробимо розрахункову таблицю:

Малюнок 2.

Величина $\overline(x_в)$ (середнє вибіркове) у таблиці знаходиться за формулою:

\[\overline(x_в)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)\]

\[\overline(x_в)=\frac(\sum\limits^k_(i=1)(x_in_i))(n)=\frac(305)(20)=15,25\]

Знайдемо вибіркову дисперсію за формулою:

Вибіркове середнє квадратичне відхилення:

\[(\sigma)_в=\sqrt(D_в)\approx 5,12\]

Виправлена ​​дисперсія:

\[(S^2=\frac(n)(n-1)D)_в=\frac(20)(19)\cdot 26,1875\approx 27,57\]

Виправлене середнє квадратичне відхилення.

Для розрахунків середньої геометричної простий використовується формула:

Геометрична зважена

Для визначення середньої зваженої геометричної застосовується формула:

Середні діаметри коліс, труб, середні сторони квадратів визначаються за допомогою середньої квадратичної.

Середньоквадратичні величини використовуються для розрахунку деяких показників, наприклад, коефіцієнт варіації, що характеризує ритмічність випуску продукції. Тут визначають середньоквадратичне відхилення від планового випуску продукції за певний період за такою формулою:

Ці величини точно характеризують зміну економічних показників проти їх базисної величиною, взяте у його усередненої величині.

Квадратична проста

Середня квадратична проста обчислюється за такою формулою:

Квадратична зважена

Середня квадратична зважена дорівнює:

22. Абсолютні показники варіації включають:

розмах варіації

середнє лінійне відхилення

дисперсію

середнє квадратичне відхилення

Розмах варіації (r)

Розмах варіації- це різниця між максимальним та мінімальним значеннями ознаки

Він показує межі, в яких змінюється величина ознаки в сукупності, що вивчається.

Досвід роботи у п'яти претендентів на попередній роботі складає: 2,3,4,7 та 9 років. Рішення: розмах варіації = 9 – 2 = 7 років.

Для узагальненої характеристики відмінностей значення ознаки обчислюють середні показники варіації, засновані на обліку відхилень від середньої арифметичної. За відхилення від середньої приймається різниця.

При цьому, щоб уникнути перетворення на нуль суми відхилень варіантів ознаки від середньої (нульова властивість середньої) доводиться або не враховувати знаки відхилення, тобто брати цю суму за модулем , або зводити значення відхилень у квадрат

Середнє лінійне та квадратичне відхилення

Середнє лінійне відхилення- це середня арифметична з абсолютних відхилень окремих значень ознаки від середньої.

Середнє лінійне відхилення просте:

Досвід роботи у п'яти претендентів на попередній роботі складає: 2,3,4,7 та 9 років.

У прикладі: років;

Відповідь: 2,4 роки.

Середнє лінійне відхилення зваженезастосовується для згрупованих даних:

Середнє лінійне відхилення з його умовності застосовується практично порівняно рідко (зокрема, для характеристики виконання договірних зобов'язань щодо рівномірності поставки; в аналізі якості продукції з урахуванням технологічних особливостей виробництва).

Середнє квадратичне відхилення

Найбільш досконалою характеристикою варіації є середнє квадратичне відкладення, яке називають стандартом (або стандартним відхиленням). Середнє квадратичне відхилення() дорівнює квадратному кореню із середнього квадрата відхилень окремих значень ознаки від середньої арифметичної:

Середнє квадратичне відхилення просте:

Середнє зважене квадратичне відхилення застосовується для згрупованих даних:

Між середнім квадратичним та середнім лінійним відхиленнями в умовах нормального розподілу має місце таке співвідношення: ~ 1,25.

Середнє квадратичне відхилення, будучи основною абсолютною мірою варіації, використовується щодо значень ординат кривої нормального розподілу, у розрахунках, пов'язаних з організацією вибіркового спостереження та встановленням точності вибіркових характеристик, і навіть в оцінці меж варіації ознаки в однорідної сукупності.

Визначається як узагальнююча характеристика розмірів варіації ознаки у сукупності. Воно дорівнює квадратному кореню із середнього квадрата відхилень окремих значень ознаки середньої арифметичної, тобто. корінь і може бути знайдена так:

1. Для первинного ряду:

2. Для варіаційного ряду:

Перетворення формули середнього квадратичного відхилення наводить її до вигляду, зручнішого для практичних розрахунків:

Середнє квадратичне відхилення визначає на скільки в середньому відхиляються конкретні варіантивід їхнього середнього значення, і до того ж є абсолютною мірою коливання ознаки і виражається в тих же одиницях, що і варіанти, і тому добре інтерпретується.

Приклади знаходження середнього квадратичного відхилення: ,

Для альтернативних ознак формула середнього квадратичного відхилення виглядає так:

де р - частка одиниць у сукупності, які мають певну ознаку;

q - частка одиниць, які не мають цієї ознаки.

Поняття середнього лінійного відхилення

Середнє лінійне відхиленнявизначається як середня арифметична абсолютних значень відхилень окремих варіантів від .

1. Для первинного ряду:

2. Для варіаційного ряду:

де сума n - сума частот варіаційного ряду.

Приклад знаходження середнього лінійного відхилення:

Перевага середнього абсолютного відхилення як міри розсіювання перед розмахом варіації, очевидно, оскільки цей захід заснований на обліку всіх можливих відхилень. Але цей показник має значні недоліки. Довільні відкидання знаків алгебри відхилень можуть призвести до того, що математичні властивостіцього показника далеко не елементарними. Це ускладнює використання середнього абсолютного відхилення під час вирішення завдань, що з ймовірнісними розрахунками.

Тому середнє лінійне відхилення як міра варіації ознаки застосовується у статистичній практиці рідко, саме тоді, коли підсумовування показників без урахування знаків має економічний сенс. З його допомогою, наприклад, аналізується оборот зовнішньої торгівлі, склад працюючих, ритмічність виробництва тощо.

Середнє квадратичне

Середнє квадратичне застосовуєтьсянаприклад, для обчислення середньої величини сторін n квадратних ділянок, середніх діаметрів стволів, труб і т. д. Вона поділяється на два види.

Середня квадратична проста. Якщо при заміні індивідуальних величин ознаки на середню величину необхідно зберегти незмінною суму квадратів вихідних величин, то середня буде квадратичною середньою величиною.

Вона є квадратним коренеміз частки від поділу суми квадратів окремих значень ознаки з їхньої число:

Середня зважена квадратична обчислюється за формулою:

де f – ознака ваги.

Середня кубічна

Середня кубічна застосовується, наприклад, щодо середньої довжини боку і кубів. Вона поділяється на два види.
Середня кубічна проста:

При розрахунку середніх величин та дисперсії в інтервальних рядахрозподілу справжні значення ознаки замінюються центральними значеннями інтервалів, які відмінні від середньої арифметичних значень, включених до інтервалу. Це призводить до виникнення систематичної похибкипід час розрахунку дисперсії. В.Ф. Шеппард визначив, що похибка у розрахунку дисперсії, Викликана застосуванням згрупованих даних, становить 1/12 квадрата величини інтервалу як у бік підвищення, так і в бік зниження величини дисперсії.

Виправлення Шеппардаповинна застосовуватися, якщо розподіл близький до нормального, відноситься до ознаки з безперервним характером варіації, побудовано за значною кількістю вихідних даних (n > 500). Однак, виходячи з того, що в ряді випадків обидві похибки, діючи в різних напрямках компенсують один одного, можна іноді відмовитися від введення поправок.

Чим менше значеннядисперсії та середнього квадратичного відхилення, тим однорідніша сукупність і тим більш типовою буде середня величина.
У практиці статистики часто виникає необхідність порівняння варіацій різних ознак. Наприклад, великий інтерес представляє порівняння варіацій віку робітників та їх кваліфікації, стажу роботи та розміру заробітної плати, собівартості та прибутку, стажу роботи та продуктивності праці і т.д. Для таких зіставлень показники абсолютної коливань ознак непридатні: не можна порівнювати коливання стажу роботи, вираженого в роках, з варіацією заробітної плати, вираженої в рублях.

Для здійснення таких порівнянь, а також порівнянь коливання однієї й тієї ж ознаки в кількох сукупностях з різними середнім арифметичним використовується відносний показникваріації – коефіцієнт варіації.

Структурні середні

Для характеристики центральної тенденції в статистичних розподілахне рідко раціонально разом із середньою арифметичною використовувати деяке значення ознаки X, яке в силу певних особливостей розташування у ряді розподілу може характеризувати його рівень.

Це особливо важливо тоді, коли серед розподілу крайні значення ознаки мають нечіткі межі. У зв'язку з цим точне визначеннясередньої арифметичної, як правило, неможливо або дуже складно. У таких випадках середній рівень можна визначити, взявши, наприклад, значення ознаки, яке розташоване в середині ряду частот або найчастіше зустрічається в поточному ряду.

Такі значення залежать лише від характеру частот, тобто від структури розподілу. Вони типові за місцем розташування у ряді частот, тому такі значення розглядаються як характеристики центру розподілу і тому одержали визначення структурних середніх. Вони використовуються для вивчення внутрішньої будовита структури рядів розподілу значень ознаки До таких показників відносяться.

Середньоквадратичне відхилення(синоніми: середнє квадратичне відхилення, середньоквадратичне відхилення, квадратичне відхилення; близькі терміни: стандартне відхилення, стандартний розкид) - в теорії ймовірностей і статистиці найбільш поширений показник розсіювання значень випадкової величини щодо її математичного очікування. При обмежених масивах вибірок значень замість математичного очікування використовується середня арифметична сукупність вибірок.

Енциклопедичний YouTube

  • 1 / 5

    Середньоквадратичне відхилення вимірюється в одиницях вимірювання самої випадкової величини і використовується при розрахунку стандартної помилки середнього арифметичного, при побудові довірчих інтервалів, при статистичній перевірці гіпотез, при вимірюванні лінійної зв'язки. Визначається як квадратний корінь з дисперсії випадкової величини .

    Середньоквадратичне відхилення:

    s = n n − 1 σ 2 = 1 n − 1 ∑ i = 1 n (x i − x ¯) 2 ; (\displaystyle s=(\sqrt ((\frac(n)(n-1))\sigma ^(2)))=(\sqrt ((\frac(1)(n-1))\sum _( i=1)^(n)\left(x_(i)-(\bar (x))\right)^(2)));)
    • Примітка: Дуже часто зустрічаються різночитання у назвах СКО (Середньоквадратичного відхилення) та СТО ( Стандартне відхилення) з їхніми формулами. Наприклад, у модулі numPy мови програмування Python функція std() описується як "standart deviation", тоді як формула відображає СКО (розподіл на корінь з вибірки). У Excel функція СТАНДОТКЛОН() інша (розподіл на корінь з n-1).

    Стандартне відхилення(Оцінка середньоквадратичного відхилення випадкової величини xщодо її математичного очікування на основі незміщеної оцінки її дисперсії) s (\displaystyle s):

    σ = 1 n ∑ i = 1 n (x i − x ¯) 2 . (\displaystyle \sigma =(\sqrt ((\frac (1)(n))\sum _(i=1)^(n)\left(x_(i)-(\bar(x))\right) ^(2))).)

    де σ 2 (\displaystyle \sigma ^(2))- Дисперсія; x i (\displaystyle x_(i)) - i-й елемент вибірки; n (\displaystyle n)- Обсяг вибірки; - середня арифметична вибірки:

    x = 1 n ∑ i = 1 n x i = 1 n (x 1 + … + x n) . (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\ldots +x_(n)).)

    Слід зазначити, що обидві оцінки є зміщеними. У загальному випадку незміщену оцінку побудувати неможливо. Однак оцінка на основі оцінки незміщеної дисперсії є заможною.

    Відповідно до ГОСТ Р 8.736-2011 середньоквадратичне відхилення вважається за другою формулою цього розділу. Будь ласка, звірте результати.

    Правило трьох сигм

    Правило трьох сигм (3 σ (\displaystyle 3\sigma )) - практично всі значення нормально розподіленої випадкової величини лежать в інтервалі (x − 3 σ ; x ¯ + 3 σ) (\displaystyle \left((\bar (x))-3\sigma ;(\bar (x))+3\sigma \right)). Суворіше - приблизно з ймовірністю 0,9973 значення нормально розподіленої випадкової величини лежить у зазначеному інтервалі (за умови, що величина x ¯ (\displaystyle (\bar(x)))справжня, а чи не отримана внаслідок обробки вибірки).

    Якщо ж справжня величина x ¯ (\displaystyle (\bar(x)))невідома, то слід користуватися не σ (\displaystyle \sigma ), а s. Таким чином, правило трьох сигм перетворюється на правило трьох s .

    Інтерпретація величини середньоквадратичного відхилення

    Більше значення середньоквадратичного відхилення показує більший розкид значень у представленій множині із середньою величиною множини; менше значення, відповідно, показує, що значення у множині згруповані навколо середнього значення.

    Наприклад, у нас є три числові множини: (0, 0, 14, 14), (0, 6, 8, 14) і (6, 6, 8, 8). У всіх трьох множин середні значення дорівнюють 7, а середньоквадратичні відхилення, відповідно, дорівнюють 7, 5 і 1. У останньої множини середньоквадратичне відхилення маленьке, тому що значення у множині згруповані навколо середнього значення; у першої множини найбільше значення середньоквадратичного відхилення - значення всередині множини сильно розходяться із середнім значенням.

    У загальному сенсі середньоквадратичне відхилення вважатимуться мірою невизначеності. Наприклад, у фізиці середньоквадратичне відхилення використовується визначення похибки серії послідовних вимірів будь-якої величини. Це значення дуже важливо для визначення правдоподібності досліджуваного явища в порівнянні з передбаченим теорією значенням: якщо середнє значення вимірювань сильно відрізняється від передбачених теорією значень (велике значення середньоквадратичного відхилення), то отримані значення або метод їх отримання слід перевіряти ще раз. ототожнюється із ризиком портфеля.

    Клімат

    Припустимо, існують два міста з однаковою максимальною середньої денною температурою, але одне розташоване на узбережжі, а інше на рівнині. Відомо, що в містах, розташованих на узбережжі, безліч різних максимальних денних температур менше, ніж у міст, розташованих усередині континенту. Тому середньоквадратичне відхилення максимальних денних температур у прибережного міста буде менше, ніж у другого міста, незважаючи на те, що середнє значення цієї величини у них однакове, що на практиці означає, що ймовірність того, що максимальна температура повітря кожного конкретного дня в році буде сильнішою. відрізнятиметься від середнього значення, вище у міста, розташованого всередині континенту.

    Спорт

    Припустимо, що є кілька футбольних команд, які оцінюються за деяким набором параметрів, наприклад, кількістю забитих і пропущених голів, гольових моментів тощо. Найімовірніше, що найкраща в цій групі команда матиме найкращі значення за більшою кількістю параметрів. Чим менше у команди середньоквадратичне відхилення по кожному з представлених параметрів, тим більш передбачуваним є результат команди, такі команди є збалансованими. З іншого боку, у команди з великим значенням середньоквадратичного відхилення складно передбачити результат, що пояснюється дисбалансом, наприклад, сильним захистом, але слабким нападом.

    Використання середньоквадратичного відхилення параметрів команди дозволяє в тій чи іншій мірі передбачити результат матчу двох команд, оцінюючи сильні та слабкі сторони команд, а отже, і способів боротьби, що вибираються.

    Схожі статті

2023 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.