Як порахувати довірчий інтервал хімії. Обчислення довірчого інтервалу в Microsoft Excel

Одним із методів вирішення статистичних завдань є обчислення довірчого інтервалу. Він використовується як краща альтернатива точковій оцінці при невеликому обсязі вибірки. Слід зазначити, що процес обчислення довірчого інтервалу досить складний. Але інструменти програми Ексель дозволяють дещо спростити його. Давайте дізнаємось, як це виконується на практиці.

Цей метод використовується для інтервальної оцінки різних статистичних величин. Головне завдання цього розрахунку – позбавиться невизначеностей точкової оцінки.

В Екселі існують два основні варіанти зробити обчислення за допомогою даного методу: коли дисперсія відома і коли вона невідома. У першому випадку для обчислень застосовується функція ДОВІР.НОРМ, а в другому - ДОВЕРИТ.СТЮДЕНТ.

Спосіб 1: функція ДОВЕРИТ.НОРМ

Оператор ДОВІР.НОРМ, що відноситься до статистичної групи функцій, вперше з'явився в Excel 2010. У попередніх версіях цієї програми використовується його аналог ДОВЕРИТЬ. Завданням цього оператора є розрахунок довірчого інтервалу з нормальним розподілом для середнього генеральної сукупності.

Його синтаксис виглядає так:

ДОВІР.НОРМ(альфа;стандартне_вимк.;розмір)

"Альфа"- аргумент, що вказує на рівень значущості, який застосовується для розрахунку довірчого рівня. Довірчий рівень дорівнює наступному виразу:

(1-«Альфа») * 100

"Стандартне відхилення"- Це аргумент, суть якого зрозуміла з найменування. Це стандартне відхиленняпропонованої вибірки.

«Розмір»- Аргумент, що визначає величину вибірки.

Усі аргументи цього оператора є обов'язковими.

Функція ДОВЕРИТЬмає такі самі аргументи і можливості, що й попередня. Її синтаксис такий:

ДОВЕРИТ(альфа;стандартное_откл;размер)

Як бачимо, відмінності лише у найменуванні оператора. Вказана функціяз метою сумісності залишена в Excel 2010 і новіших версіях у спеціальній категорії «Сумісність». У версіях Excel 2007 і раніше вона присутня в основній групі статистичних операторів.

Кордон довірчого інтервалу визначається за допомогою формули наступного виду:

X+(-)ДОВЕРИТ.НОРМ

Де X– це середнє вибіркове значення, розташоване посередині обраного діапазону.

Тепер давайте розглянемо, як розрахувати довірчий інтервал на конкретному прикладі. Було проведено 12 випробувань, внаслідок яких було отримано різні результати, занесені до таблиці. Це і є наша сукупність. Стандартне відхилення дорівнює 8. Нам потрібно розрахувати інтервал довіри при рівні довіри 97%.

  1. Виділяємо комірку, куди виводитиметься результат обробки даних. Клацаємо по кнопці "Вставити функцію".
  2. З'являється Майстер функцій. Переходимо до категорії «Статистичні»та виділяємо найменування «ДОВЕРИТ.НОРМ». Після цього клацаємо по кнопці "OK".
  3. Відкривається віконце аргументів. Його поля закономірно відповідають найменуванням аргументів.
    Встановлюємо курсор у перше поле – "Альфа". Тут слід вказати рівень значимості. Як ми пам'ятаємо, рівень довіри в нас дорівнює 97%. Водночас ми говорили, що він розраховується таким шляхом:

    (1-рівень довіри)/100

    Тобто, підставивши значення, отримуємо:

    Шляхом нехитрих розрахунків дізнаємось, що аргумент "Альфа"дорівнює 0,03 . Вводимо це значення в полі.

    Як відомо, за умовою стандартне відхилення одно 8 . Тому в полі "Стандартне відхилення"просто записуємо це число.

    В полі «Розмір»Необхідно запровадити кількість елементів проведених випробувань. Як ми пам'ятаємо, їх 12 . Але щоб автоматизувати формулу і не редагувати її щоразу під час проведення нового випробування, давайте задамо дане значення не звичайним числом, а за допомогою оператора РАХУНОК. Отже, встановлюємо курсор у полі «Розмір», а потім клацаємо по трикутнику, який розміщений ліворуч від рядка формул.

    З'являється список функцій, що нещодавно використовуються. Якщо оператор РАХУНОКзастосовувався вами нещодавно, то він має бути в цьому списку. У такому разі потрібно просто клікнути за його найменуванням. В іншому випадку, якщо ви його не виявите, то переходите по пункту «Інші функції…».

  4. З'являється вже знайомий нам Майстер функцій. Знову переміщуємося до групи «Статистичні». Виділяємо там найменування «РАХУНОК». Клацаємо по кнопці "OK".
  5. З'являється вікно аргументів вищезазначеного оператора. Ця функція призначена для того, щоб обчислювати кількість осередків у вказаному діапазоні, що містять числові значення. Синтаксис її наступний:

    РАХУНОК (значення1; значення2; ...)

    Група аргументів «Значення»є посилання на діапазон, в якому потрібно розрахувати кількість заповнених числовими даними осередків. Усього може налічуватися до 255 подібних аргументів, але в нашому випадку знадобиться лише один.

    Встановлюємо курсор у полі «Значення1»і, затиснувши ліву кнопку миші, виділяємо на аркуші діапазон, який містить нашу сукупність. Потім його адреса буде відображено у полі. Клацаємо по кнопці "OK".

  6. Після цього додаток здійснить обчислення і виведе результат у той осередок, де він знаходиться сам. У конкретному випадку формула вийшла такого виду:

    ДОВЕРИТ.НОРМ(0,03;8;РАХУНОК(B2:B13))

    Загальний результат обчислень склав 5,011609 .

  7. Але це ще не все. Як ми пам'ятаємо, межа довірчого інтервалу обчислюється шляхом складання та віднімання від середнього вибіркового значення результату обчислення ДОВІР.НОРМ. У такий спосіб розраховується відповідно права та ліва межа довірчого інтервалу. Саме середнє вибіркове значення можна розрахувати за допомогою оператора Відмінник.

    Цей оператор призначений для розрахунку середнього арифметичного значеннявибраного діапазону чисел. Він має наступний досить простий синтаксис:

    СРЗНАЧ(число1; число2; ...)

    Аргумент «Кількість»може бути як окремим числовим значенням, так і посиланням на комірки або навіть цілі діапазони, що їх містять.

    Отже, виділяємо комірку, в яку виводитиметься розрахунок середнього значення, і клацаємо по кнопці "Вставити функцію".

  8. Відкривається Майстер функцій. Знову переходимо до категорії «Статистичні»та вибираємо зі списку найменування «СРЗНАЧ». Як завжди, клацаємо по кнопці "OK".
  9. Запускається вікно аргументів. Встановлюємо курсор у полі «Число1»і із затиснутою лівою кнопкою миші виділяємо весь діапазон значень. Після того, як координати відобразились у полі, клацаємо по кнопці "OK".
  10. Після цього Відмінниквиводить результат розрахунку елемент листа.
  11. Проводимо розрахунок правої межі довірчого інтервалу. Для цього виділяємо окремий осередок, ставимо знак «=» і складаємо вміст елементів аркуша, у яких розташовані результати обчислень функцій Відмінникі ДОВІР.НОРМ. Для того, щоб виконати розрахунок, натискаємо на клавішу Enter. У нашому випадку вийшла така формула:

    Результат обчислення: 6,953276

  12. Таким же чином робимо обчислення лівої межі довірчого інтервалу, тільки цього разу від результату обчислення Відмінникзабираємо результат обчислення оператора ДОВІР.НОРМ. Виходить формула для прикладу наступного типу:

    Результат обчислення: -3,06994

  13. Ми спробували докладно описати всі дії щодо обчислення довірчого інтервалу, тому детально розписали кожну формулу. Але можна всі дії поєднати в одній формулі. Обчислення правого кордону довірчого інтервалу можна записати так:

    СРЗНАЧ(B2:B13)+ДОВЕРИТ.НОРМ(0,03;8;РАХУНОК(B2:B13))

  14. Аналогічне обчислення лівого кордону виглядатиме так:

    СРЗНАЧ(B2:B13)-ДОВЕРИТ.НОРМ(0,03;8;РАХУНОК(B2:B13))

Спосіб 2: функція ДОВЕРИТ.СТЮДЕНТ

Крім того, в Екселі є ще одна функція, яка пов'язана з обчисленням довірчого інтервалу ДОВЕРИТ.СТЮДЕНТ. Вона з'явилася лише починаючи з Excel 2010. Цей оператор виконує обчислення довірчого інтервалу генеральної сукупності з використанням розподілу Стьюдента. Його дуже зручно використовувати у тому випадку, коли дисперсія та, відповідно, стандартне відхилення невідомі. Синтаксис оператора такий:

ДОВЕРИТ.СТЬЮДЕНТ(альфа;стандартне_вимк.;розмір)

Як бачимо, назви операторів і в цьому випадку залишилися незмінними.

Подивимося, як розрахувати межі довірчого інтервалу з невідомим стандартним відхиленням на прикладі тієї самої сукупності, що ми розглядали в попередньому способі. Рівень довіри, як і минулого разу, візьмемо 97%.

  1. Виділяємо комірку, в яку проводитиметься розрахунок. Клацаємо по кнопці "Вставити функцію".
  2. У відкритому Майстри функційпереходимо до категорії «Статистичні». Вибираємо найменування «ДОВЕРИТ.СТЮДЕНТ». Клацаємо по кнопці "OK".
  3. Здійснюється запуск вікна аргументів зазначеного оператора.

    В полі "Альфа", враховуючи, що рівень довіри становить 97%, записуємо число 0,03 . Вдруге на принципах розрахунку даного параметра зупинятись не будемо.

    Після цього встановлюємо курсор у полі "Стандартне відхилення". На цей раз даний показникнам невідомий і його потрібно розрахувати. Робиться це за допомогою спеціальної функції – СТАНДОТКЛОН.. Щоб викликати вікно цього оператора, клацаємо по трикутнику ліворуч від рядка формул. Якщо в списку не знаходимо потрібного найменування, то переходимо по пункту «Інші функції…».

  4. Запускається Майстер функцій. Переміщуємось до категорії «Статистичні»і відзначаємо в ній найменування «СТАНДОТКЛОН.В». Потім клацаємо по кнопці "OK".
  5. Відкриється вікно аргументів. Завданням оператора СТАНДОТКЛОН.є визначення стандартного відхилення під час вибірки. Його синтаксис виглядає так:

    СТАНДОТКЛОН.В(число1;число2;…)

    Неважко здогадатися, що аргумент «Кількість»- Це адреса елемента вибірки. Якщо вибірка розміщена єдиним масивом, можна, використавши лише один аргумент, дати посилання даний діапазон.

    Встановлюємо курсор у полі «Число1»і, як завжди, затиснувши ліву кнопку миші, виділяємо сукупність. Після того, як координати потрапили в поле, не поспішаємо натискати на кнопку "OK", оскільки результат вийде некоректним. Насамперед нам потрібно повернутися до вікна аргументів оператора ДОВЕРИТ.СТЮДЕНТ, щоб зробити останній аргумент. Для цього клацаємо за відповідним найменуванням у рядку формул.

  6. Знову відкривається вікно аргументів вже знайомої функції. Встановлюємо курсор у полі «Розмір». Знову тиснемо на вже знайомий нам трикутник для переходу до вибору операторів. Як ви зрозуміли, нам потрібна найменування «РАХУНОК». Тому що ми використовували цю функціюпри обчислення в попередньому способі, в даному списку вона присутня, так що просто клацаємо по ній. Якщо ж ви її не виявите, то дійте за алгоритмом, описаним у першому способі.
  7. Потрапивши у вікно аргументів РАХУНОК, ставимо курсор у полі «Число1»і із затиснутою кнопкою миші виділяємо сукупність. Потім клацаємо по кнопці "OK".
  8. Після цього програма здійснює розрахунок і виводить значення довірчого інтервалу.
  9. Для визначення кордонів знову потрібно буде розрахувати середнє значення вибірки. Але, враховуючи те, що алгоритм розрахунку за допомогою формули Відмінниктой самий, що й у попередньому способі, і навіть результат не змінився, не будемо на цьому докладно зупинятись вдруге.
  10. Склавши результати обчислення Відмінникі ДОВЕРИТ.СТЮДЕНТ, отримуємо правий кордон довірчого інтервалу
  11. Відібравши від результатів розрахунку оператора Відмінникрезультат розрахунку ДОВЕРИТ.СТЮДЕНТ, маємо ліву межу довірчого інтервалу
  12. Якщо розрахунок записати однією формулою, то обчислення правого кордону в нашому випадку виглядатиме так:

    СРЗНАЧ(B2:B13)+ДОВЕРИТ.СТЬЮДЕНТ(0,03;СТАНДОТКЛОН.В(B2:B13);РАХУНОК(B2:B13))

  13. Відповідно, формула розрахунку лівої межі виглядатиме так:

    СРЗНАЧ(B2:B13)-ДОВЕРИТ.СТЬЮДЕНТ(0,03;СТАНДОТКЛОН.В(B2:B13);РАХУНОК(B2:B13))

Як бачимо, інструменти програми Excelдозволяють суттєво полегшити обчислення довірчого інтервалу та його меж. Для цього використовуються окремі оператори для вибірок, у яких дисперсія відома і невідома.

та інших. Усі є оцінками своїх теоретичних аналогів, які можна було б отримати, якби у розпорядженні була вибірка, а генеральна сукупність. Але на жаль, генеральна сукупність - це дуже дорого і часто недоступне.

Поняття про інтервальне оцінювання

Будь-яка вибіркова оцінка має деякий розкид, т.к. є випадковою величиною, що залежить від значень у конкретній вибірці. Отже, для надійніших статистичних висновків слід знати не лише точкову оцінку, а й інтервал, який з високою ймовірністю γ (гама) накриває оцінюваний показник θ (Тета).

Формально це два таких значення (статистики) T 1 (X)і T 2 (X), що T 1< T 2 для яких при заданому рівні ймовірності γ виконується умова:

Коротше, з ймовірністю γ або більше істинний показник знаходиться між точками T 1 (X)і T 2 (X), які називаються нижнім та верхнім кордоном довірчого інтервалу.

Однією з умов побудови довірчих інтервалів його максимальна вузькість, тобто. він має бути наскільки це можливо коротким. Бажання цілком природно, т.к. дослідник намагається точніше локалізувати знаходження шуканого параметра.

Звідси випливає, що інтервал довіри повинен накривати максимальні ймовірності розподілу. а сама оцінка бути у центрі.

Тобто ймовірність відхилення (справжнього показника від оцінки) у більшу сторону дорівнює ймовірності відхилення у менший бік. Слід зазначити, що з несиметричних розподілів інтервал справа дорівнює інтервалузліва.

На малюнку вище чітко видно, що чим більша довірча ймовірність, тим ширший інтервал – пряма залежність.

Це була невелика вступна частина в теорію інтервального оцінюванняневідомі параметри. Перейдемо до знаходження довірчих кордонів для математичного очікування.

Довірчий інтервал для математичного очікування

Якщо вихідні дані розподілені по , то середнє буде нормальною величиною. Це випливає з того правила, що лінійна комбінація нормальних величин також має нормальний розподіл. Отже, для розрахунку можливостей ми могли б використовувати математичний апарат нормального закону розподілу.

Однак для цього потрібно знати два параметри – матожидання та дисперсію, які зазвичай не відомі. Можна, звичайно, замість параметрів використовувати оцінки (середню арифметичну і ), але тоді розподіл середньої буде не зовсім нормальним, він буде трохи приплюснутий донизу. Цей факт спритно помітив громадянин Вільям Госсет з Ірландії, опублікувавши своє відкриття у березневому випуску журналу Biometrica за 1908 рік. З метою конспірації Держсет підписався Стьюдентом. Так виник t-розподіл Стьюдента.

Однак нормальний розподіл даних, що використовувався К. Гауссом при аналізі помилок астрономічних спостережень, у земному житті зустрічається вкрай рідко і встановити це досить складно. високої точностінеобхідно близько 2 тисяч спостережень). Тому припущення про нормальність найкраще відкинути та використовувати методи, які не залежать від розподілу вихідних даних.

Виникає питання: який же розподіл середньої арифметичної, якщо він розрахований за даними невідомого розподілу? Відповідь дає відома у теорії ймовірностей Центральна гранична теорема(ЦПТ). У математиці існує кілька її варіантів (протягом довгих роківформулювання уточнювалися), але всі вони, грубо кажучи, зводяться до твердження, що сума великої кількостінезалежних випадкових величин підпорядковується нормальному закону розподілу.

При розрахунку середньої арифметичної використовується сума випадкових величин. Звідси виходить, що середнє арифметичне має нормальний розподіл, у якого матожидання – це маточування вихідних даних, а дисперсія – .

Розумні людивміють доводити ЦПТ, але ми переконаємося з допомогою експерименту, проведеного в Excel. Змоделюємо вибірку із 50-ти рівномірно розподілених випадкових величин (за допомогою функції ExcelВИПАДМІЖ). Потім зробимо 1000 таких вибірок і кожної розрахуємо середню арифметичну. Подивимося з їхньої розподіл.

Видно, що розподіл середньої близько до нормального закону. Якщо обсяг вибірок та їх кількість зробити ще більше, то подібність буде ще кращою.

Тепер, коли ми переконалися в справедливості ЦПТ, можна, використовуючи , розрахувати довірчі інтервали для середньої арифметичної, які з заданою ймовірністюнакривають справжнє середнє чи математичне очікування.

Для встановлення верхньої та нижньої межі потрібно знати параметри нормального розподілу. Як правило, їх немає, тому використовують оцінки: середню арифметичнуі вибіркову дисперсію. Повторюся, такий спосіб дає гарне наближення лише за великих вибірках. Коли вибірки малі, часто рекомендують використовувати розподіл Стьюдента. Не вірте! Розподіл Стьюдента для середньої буває лише тоді, коли вихідні дані мають нормальний розподіл, тобто майже ніколи. Тому краще відразу поставити мінімальну планку за кількістю необхідних даних та використовувати асимптотично коректні методи. Говорять, достатньо 30 спостережень. Беріть 50 – не помилитеся.

T 1,2– нижня та верхня межа довірчого інтервалу

– вибіркове середнє арифметичне

s 0- Середнє квадратичне відхилення за вибіркою (незміщене)

n - Розмір вибірки

γ - Довірча ймовірність (зазвичай дорівнює 0,9, 0,95 або 0,99)

c γ =Φ -1 ((1+γ)/2)зворотне значенняфункції стандартного нормального розподілу Простіше кажучи, це кількість стандартних помилок від середньої арифметичної до нижньої або верхньої межі (вказаним трьома ймовірностями відповідають значення 1,64, 1,96 і 2,58).

Суть формули в тому, що береться середнє арифметичне і далі від неї відкладається кілька ( з γ) стандартних помилок ( s 0 /√n). Все відомо, бери і рахуй.

До масового використанняПЕОМ для отримання значень функції нормального розподілу та зворотної їй використовували. Їх і зараз використовують, але ефективніше звернутися до готових формул Excel. Всі елементи формули вище ( , і ) можна легко розрахувати в Excel. Але є і готова формула для розрахунку довірчого інтервалу ДОВІР.НОРМ. Її синтаксис наступний.

ДОВІР.НОРМ(альфа;стандартне_вимк.;розмір)

альфа– рівень значущості чи довірчий рівень, що у прийнятих вище позначеннях дорівнює 1- γ, тобто. ймовірність того, що математичнеочікування опиниться поза довірчого інтервалу. При довірчої ймовірності 0,95, альфа дорівнює 0,05 і т.д.

стандартне_відкл- Середнє квадратичне відхилення вибіркових даних. Стандартну помилку не треба розраховувати, Excel сам розділить на корінь з n.

розмір- Розмір вибірки (n).

Результат функції ДОВЕРИТ.НОРМ – це другий доданок з формули розрахунку довірчого інтервалу, тобто. напівінтервал. Відповідно, нижня та верхня точка – це середнє ± отримане значення.

Отже, можна побудувати універсальний алгоритм розрахунку довірчих інтервалів для середньої арифметичної, який залежить від розподілу вихідних даних. Платою за універсальність є його асимптотичність, тобто. необхідність використання щодо великих вибірок. Однак у вік сучасних технологійзібрати потрібна кількістьданих зазвичай не становить труднощів.

Перевірка статистичних гіпотез за допомогою довірчого інтервалу

(Module 111)

Однією з основних завдань, вирішуваних у статистиці, є . Її суть коротко така. Висувається припущення, наприклад, що матожидання генеральної сукупності дорівнює якомусь значенню. Потім будується розподіл вибіркових середніх, які можуть спостерігатися при даному матожиданні. Далі дивляться, де цього умовного розподілу перебуває справжня середня. Якщо вона виходить за допустимі межі, то поява такого середнього дуже малоймовірна, а при одноразовому повторенні експерименту майже неможливо, що суперечить висунутій гіпотезі, яка успішно відхиляється. Якщо ж середнє не виходить за критичний рівень, то гіпотеза не відхиляється (але й доводиться!).

Так ось за допомогою довірчих інтервалів, у нашому випадку для матожидання, також можна перевіряти деякі гіпотези. Це дуже просто зробити. Припустимо, середня арифметична за деякою вибіркою дорівнює 100. Перевіряється гіпотеза про те, що матожидання одно, припустимо, 90. Тобто, якщо поставити питання примітивно, то він звучить так: чи може таке бути, щоб при істинному значенні середньої рівної 90, спостерігається середня виявилася дорівнює 100?

Для відповіді на це питання додатково знадобиться інформація про середнє квадратичному відхиленніта розмір вибірки. Допустимо середньоквадратичне відхиленнядорівнює 30, а кількість спостережень 64 (щоб легко витягти корінь). Тоді стандартна помилка середньої дорівнює 30/8 чи 3,75. Для розрахунку 95% довірчого інтервалу потрібно відкласти в обидві сторони від середньої по дві стандартні помилки(точніше, 1,96). Довірчий інтервал вийде приблизно 100±7,5 або 92,5 до 107,5.

Далі міркування такі. Якщо перевірене значення потрапляє у довірчий інтервал, воно не суперечить гіпотезі, т.к. укладається у межі випадкових коливань (з ймовірністю 95%). Якщо точка, що перевіряється, виходить за межі довірчого інтервалу, то ймовірність такої події дуже маленька, принаймні нижче допустимого рівня. Отже, гіпотезу відхиляють, як таку, що суперечить спостережуваним даним. У нашому випадку гіпотеза про маточування знаходиться за межами довірчого інтервалу (перевірене значення 90 не входить до інтервалу 100±7,5), тому її слід відхилити. Відповідаючи на примітивне питання вище, слід сказати: ні не може, принаймні таке трапляється вкрай рідко. Часто при цьому вказують конкретну ймовірність помилкового відхилення гіпотези (p-level), а не заданий рівень, яким будувався довірчий інтервал, але про це в інший раз.

Як бачимо, побудувати довірчий інтервал для середнього (або математичного очікування) нескладно. Головне, вловити суть, а далі йтиметься. На практиці в більшості випадків використовуються 95% довірчий інтервал, який має завширшки приблизно дві стандартні помилки по обидва боки від середньої.

На цьому поки що все. Всіх благ!

Довірчі інтервали (англ. Confidence Intervals) однією з типів інтервальних оцінок які у статистиці, які розраховуються для заданого рівня значимості. Вони дозволяють зробити твердження, що справжнє значення невідомого статистичного параметра генеральної сукупності перебуває в отриманому діапазоні значень із ймовірністю, що задана вибраним рівнем статистичної значимості.

Нормальний розподіл

Коли відома варіація (σ 2) генеральної сукупності даних, для розрахунку довірчих меж (граничних точок довірчого інтервалу) може бути використана z-оцінка. Порівняно із застосуванням t-розподілу, використання z-оцінки дозволить побудувати не лише вужчий довірчий інтервал, а й отримати більш надійні оцінки математичного очікування та середньоквадратичного (стандартного) відхилення (σ), оскільки Z-оцінка ґрунтується на нормальному розподілі.

Формула

Для визначення граничних точок довірчого інтервалу, за умови, що відомо середньоквадратичне відхилення генеральної сукупності даних, використовується наступна формула

L = X - Z α/2 σ
√n

приклад

Припустимо, що розмір вибірки налічує 25 спостережень, математичне очікування вибірки дорівнює 15, а середньоквадратичне відхилення генеральної сукупності становить 8. Для рівня значущості = 5% Z-оцінка дорівнює Z / 2 = 1,96. У цьому випадку нижня та верхня межа довірчого інтервалу становитимуть

L = 15 – 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Таким чином, ми можемо стверджувати, що з ймовірністю 95% математичне очікування генеральної сукупності потрапить до діапазону від 11,864 до 18,136.

Методи звуження довірчого інтервалу

Припустимо, що діапазон є надто широким для цілей нашого дослідження. Зменшити діапазон довірчого інтервалу можна двома способами.

  1. Зменшити рівень статистичної значущості α.
  2. Збільшити обсяг вибірки.

Зменшивши рівень статистичної значущості до α=10%, ми отримаємо Z-оцінку рівну Z α/2 =1,64. У цьому випадку нижня та верхня межа інтервалу становитимуть

L = 15 – 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

А сам довірчий інтервал може бути записаний у вигляді

У цьому випадку ми можемо зробити припущення, що з ймовірністю 90% математичне очікування генеральної сукупності потрапить у діапазон .

Якщо ми хочемо не знижувати рівень статистичної значущості α, то єдиною альтернативою залишається збільшення обсягу вибірки. Збільшивши її до 144 спостережень, отримаємо такі значення довірчих меж

L = 15 – 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Сам довірчий інтервал матиме такий вигляд

Таким чином, звуження довірчого інтервалу без зниження рівня статистичної значимості можливе лише за рахунок збільшення обсягу вибірки. Якщо збільшення обсягу вибірки неможливо, то звуження довірчого інтервалу може досягатися виключно з допомогою зниження рівня статистичної значимості.

Побудова довірчого інтервалу при розподілі відмінному від нормального

Якщо середньоквадратичне відхилення генеральної сукупності не відоме або розподіл відмінно від нормального, для побудови довірчого інтервалу використовується t-розподіл. Ця методика є більш консервативною, що виявляється у ширших довірчих інтервалах, порівняно з методикою, що базується на Z-оцінці.

Формула

Для розрахунку нижньої та верхньої межі довірчого інтервалу на підставі t-розподілу застосовуються наступні формули

L = X - t α σ
√n

Розподіл Стьюдента або t-розподіл залежить тільки від одного параметра – кількості ступенів свободи, яка дорівнює кількості індивідуальних значень ознаки (кількість спостережень у вибірці). Значення t-критерію Стьюдента для заданої кількості ступенів свободи (n) та рівня статистичної значущості α можна дізнатися з довідкових таблиць.

приклад

Припустимо, що розмір вибірки становить 25 індивідуальних значень, математичне очікування вибірки дорівнює 50, а середньоквадратичне відхилення вибірки дорівнює 28. Необхідно побудувати довірчий інтервал рівня статистичної значимості α=5%.

У нашому випадку кількість ступенів свободи дорівнює 24 (25-1), отже відповідне табличне значення t-критерію Стьюдента рівня статистичної значимості α=5% становить 2,064. Отже, нижня та верхня межа довірчого інтервалу становитимуть

L = 50 – 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

А сам інтервал може бути записаний у вигляді

Таким чином, ми можемо стверджувати, що з ймовірністю 95% математичне очікування генеральної сукупності опиниться в діапазоні .

Використання t-розподілу дозволяє звузити довірчий інтервал за рахунок зниження статистичної значимості, або за рахунок збільшення розміру вибірки.

Зменшивши статистичну значущість з 95% до 90% в умовах нашого прикладу, ми отримаємо відповідне табличне значення t-критерію Стьюдента 1,711.

L = 50 – 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

І тут ми можемо стверджувати, що з ймовірністю 90% математичне очікування генеральної сукупності опиниться у діапазоні .

Якщо ми не хочемо знижувати статистичну значущість, то єдиною альтернативою буде збільшення обсягу вибірки. Припустимо, що він становить 64 індивідуальні спостереження, а не 25 як у початковій умові прикладу. Табличне значення t-критерію Стьюдента для 63 ступенів свободи (64-1) та рівня статистичної значущості α=5% становить 1,998.

L = 50 – 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Це дає можливість стверджувати, що з ймовірністю 95% математичне очікування генеральної сукупності опиниться в діапазоні .

Вибірки великого обсягу

До вибірок великого обсягу відносяться вибірки з генеральної сукупності даних, кількість індивідуальних спостережень у яких перевищує 100. Статистичні дослідження показали, що вибірки більшого обсягу мають тенденцію бути нормально розподіленими, навіть якщо розподіл генеральної сукупності відрізняється від нормального. Крім того, для таких вибірок застосування z-оцінки та t-розподілу дають приблизно однакові результати при побудові довірчих інтервалів. Таким чином, для вибірок великого обсягу допускається застосування z-оцінки для нормального розподілу замість t-розподілу.

Підведемо підсумки

Побудуємо в MS EXCEL довірчийінтервал для оцінки середнього значення розподілу у разі відомого значеннядисперсії.

Зрозуміло, вибір рівня довіриповністю залежить від розв'язуваного завдання. Так, ступінь довіри авіапасажира до надійності літака, безсумнівно, має бути вищим за ступінь довіри покупця до надійності електричної лампочки.

Формулювання завдання

Припустимо, що з генеральної сукупностімає взята вибіркарозміру n. Передбачається, що стандартне відхиленняцього розподілу відомо. Необхідно на підставі цієї вибіркиоцінити невідоме середнє значення розподілу(μ, ) та побудувати відповідний двосторонній довірчий інтервал.

Точкова оцінка

Як відомо з , статистика(позначимо її Х ср) є незміщеною оцінкою середньогоцією генеральної сукупностіта має розподіл N(μ;σ 2 /n).

Примітка: Що робити, якщо потрібно збудувати довірчий інтервалу разі розподілу, який не є нормальним?У цьому випадку на допомогу приходить , яка говорить, що за достатньо великому розмірі вибірки n із розподілу що не є нормальним, вибірковий розподіл статистики Х порбуде приблизновідповідати нормальному розподілуіз параметрами N(μ;σ 2 /n).

Отже, точкова оцінка середнього значення розподілуу нас є – це середнє значення вибірки, тобто. Х ср. Тепер займемося довірчим інтервалом.

Побудова довірчого інтервалу

Зазвичай, знаючи розподіл та його параметри, ми можемо обчислити ймовірність того, що випадкова величина набуде значення заданого нами інтервалу. Зараз зробимо навпаки: знайдемо інтервал, у який випадкова величина потрапить із заданою ймовірністю. Наприклад, із властивостей нормального розподілувідомо, що з ймовірністю 95%, випадкова величина, розподілена по нормальному закону, потрапить в інтервал приблизно +/- 2 від середнього значення(Див. статтю про ). Цей інтервал, послужить нам прототипом для довірчого інтервалу.

Тепер розберемося, чи ми знаємо розподіл , щоб визначити цей інтервал? Для відповіді на запитання ми маємо вказати форму розподілу та його параметри.

Форму розподілу ми знаємо – це нормальний розподіл(нагадаємо, що йдеться про вибірковому розподілі статистики Х ср).

Параметр μ нам невідомий (його якраз потрібно оцінити за допомогою довірчого інтервалу), але у нас є його оцінка Х пор,обчислена на основі вибірки,яку можна використати.

Другий параметр – стандартне відхилення вибіркового середнього будемо вважати відомим, Він дорівнює σ/√n.

Т.к. ми не знаємо μ, то будуватимемо інтервал +/- 2 стандартних відхиленьне від середнього значення, а від відомої його оцінки Х ср. Тобто. при розрахунку довірчого інтервалуми не будемо вважати, що Х српотрапить в інтервал +/- 2 стандартних відхиленьвід μ з ймовірністю 95%, а вважатимемо, що інтервал +/- 2 стандартних відхиленьвід Х срз ймовірністю 95% накриє μ - Середня генеральна сукупність,з якого взято вибірка. Ці два твердження еквівалентні, але друге твердження нам дозволяє побудувати довірчий інтервал.

Крім того, уточнимо інтервал: випадкова величина, розподілена по нормальному закону, з ймовірністю 95% потрапляє в інтервал +/- 1,960 стандартних відхилень,а не+/- 2 стандартних відхилень. Це можна розрахувати за допомогою формули =НОРМ.СТ.ОБР((1+0,95)/2), Див. файл прикладу Лист Інтервал.

Тепер ми можемо сформулювати ймовірнісне твердження, яке послужить нам для формування довірчого інтервалу:
«Ймовірність того, що середня генеральна сукупністьзнаходиться від середньої вибіркив межах 1,960 « стандартних відхилень вибіркового середнього», дорівнює 95%».

Значення ймовірності, згадане у твердженні, має спеціальну назву , який пов'язаний зрівнем значимості α (альфа) простим виразом рівень довіри =1 . У нашому випадку рівень значущості α =1-0,95=0,05 .

Тепер на основі цього ймовірнісного твердження запишемо вираз для обчислення довірчого інтервалу:

де Z α/2 стандартного нормального розподілу(Таке значення випадкової величини z, що P(z>=Z α/2 )=α/2).

Примітка: Верхній α/2-квантильвизначає ширину довірчого інтервалув стандартних відхиленнях вибіркового середнього. Верхній α/2-квантиль стандартного нормального розподілузавжди більше 0, що дуже зручно.

У нашому випадку при α=0,05, верхній α/2-квантиль дорівнює 1,960. Для інших рівнів значення α (10%; 1%) верхній α/2-квантиль Z α/2 можна обчислити за допомогою формули =НОРМ.СТ.ОБР(1-α/2) або, якщо відомий рівень довіри, =НОРМ.СТ.ОБР((1+ур.довіри)/2).

Зазвичай при побудові довірчих інтервалів для оцінки середньоговикористовують тільки верхній α/2-квантильі не використовують нижній α/2-квантиль. Це можливо тому, що стандартне нормальний розподілсиметрично щодо осі х ( щільність його розподілусиметрична щодо середнього, тобто. 0). Тому немає потреби обчислювати нижній α/2-квантиль(його називають просто α /2-квантиль), т.к. він дорівнює верхньому α/2-квантилюзі знаком мінус.

Нагадаємо, що, незважаючи на форму розподілу величини х, відповідна випадкова величина Х сррозподілено приблизно нормально N(μ;σ 2 /n) (див. статтю про ). Отже, в загальному випадку, вищезгадане вираз для довірчого інтервалує лише наближеним. Якщо величина х розподілена по нормальному закону N(μ;σ 2 /n), то вираз для довірчого інтервалує точним.

Розрахунок довірчого інтервалу в MS EXCEL

Розв'яжемо завдання.
Час відгуку електронного компонента на вхідний сигнал є важливою характеристикоюпристрої. Інженер хоче побудувати довірчий інтервал для середнього відгуку при рівні довіри 95%. З попереднього досвідуІнженер знає, що стандартне відхилення час відгуку становить 8 мсек. Відомо, що з оцінки часу відгуку інженер зробив 25 вимірів, середнє значення становило 78 мсек.

Рішення: Інженер хоче знати час відгуку. електронного пристроюале він розуміє, що час відгуку не фіксованою, а випадковою величиною, яка має свій розподіл. Отже, найкраще, на що він може розраховувати, це визначити параметри та форму цього розподілу.

На жаль, з умови завдання форма розподілу часу відгуку нам не відома (вона не обов'язково має бути нормальним). , цього розподілу також невідомо. Відомо лише його стандартне відхиленняσ=8. Тому, поки ми не можемо порахувати ймовірності та побудувати довірчий інтервал.

Однак, незважаючи на те, що ми не знаємо розподілу часу окремого відгуку, ми знаємо, що згідно ЦПТ, вибірковий розподіл середнього часу відгукує приблизно нормальним(вважатимемо, що умови ЦПТвиконуються, т.к. розмір вибіркидосить великий (n=25)) .

Більш того, середняцього розподілу дорівнює середнього значеннярозподілу одиничного відгуку, тобто. μ. А стандартне відхиленняцього розподілу (σ/√n) можна обчислити за формулою =8/КОРІНЬ(25) .

Також відомо, що інженером було отримано точкова оцінкапараметра μ дорівнює 78 мсек (Х пор). Тому, ми можемо обчислювати ймовірності, т.к. нам відома форма розподілу ( нормальне) та його параметри (Х ср і σ/√n).

Інженер хоче знати математичне очікуванняμ розподілу часу відгуку. Як було сказано вище, це μ дорівнює математичного очікуваннявибіркового розподілу середнього часу відгуку. Якщо ми скористаємося нормальним розподілом N(Х ср; σ/√n), то шукане μ перебуватиме в інтервалі +/-2*σ/√n з ймовірністю приблизно 95%.

Рівень значущостідорівнює 1-0,95 = 0,05.

Нарешті, знайдемо лівий та правий кордон довірчого інтервалу.
Ліва межа: =78-НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25) = 74,864
Права межа: =78+НОРМ.СТ.ОБР(1-0,05/2)*8/КОРІНЬ(25)=81,136

Ліва межа: =НОРМ.ОБР(0,05/2; 78; 8/КОРІНЬ(25))
Права межа: =НОРМ.ОБР(1-0,05/2; 78; 8/КОРІНЬ(25))

Відповідь: довірчий інтервалпри рівні довіри 95% та σ=8мсекдорівнює 78+/-3,136 мсек.

У файл прикладу на аркуші Сигмавідома створена форма для розрахунку та побудови двостороннього довірчого інтервалудля довільних вибірокіз заданим σ та рівнем значимості.

Функція ДОВЕРИТ.НОРМ()

Якщо значення вибіркизнаходяться в діапазоні B20: B79 , а рівень значущостідорівнює 0,05; то формула MS EXCEL:
=СРЗНАЧ(B20:B79)-ДОВЕРИТ.НОРМ(0,05;σ; РАХУНОК(B20:B79))
поверне лівий кордон довірчого інтервалу.

Цей же кордон можна обчислити за допомогою формули:
=СРЗНАЧ(B20:B79)-НОРМ.СТ.ОБР(1-0,05/2)*σ/КОРІНЬ(РАХУНОК(B20:B79))

Примітка: Функція ДОВЕРИТ.НОРМ() з'явилася в MS EXCEL 2010. У попередніх версіях MS EXCEL використовувалася функція ДОВЕРИТ() .

ДОВІРНІ ІНТЕРВАЛИ ДЛЯ ЧАСТОТ І ДОЛІЙ

© 2008 р.

Національний інститут громадського здоров'я, м. Осло, Норвегія

У статті описується та обговорюється розрахунок довірчих інтервалів для частот та часток за методами Вальда, Вілсона, Клоппера – Пірсона, за допомогою кутового перетворенняі методом Вальда з корекцією по Агрести – Коуллу. Викладений матеріал дає загальні відомостіпро способи розрахунку довірчих інтервалів для частот і часток і покликаний викликати інтерес читачів журналу як до використання довірчих інтервалів при поданні результатів власних досліджень, а й до прочитання спеціалізованої літератури перед початком роботи над майбутніми публікаціями.

Ключові слова : довірчий інтервал, частота, частка

В одній з попередніх публікацій коротко згадувалося опис якісних даних і повідомлялося, що їх інтервальна оцінка переважно точковою для опису частоти народження характеристики, що вивчається в генеральній сукупності . Справді, оскільки дослідження проводяться з використанням вибіркових даних, проекція результатів на генеральну сукупність має містити елемент неточності вибіркової оцінки. Довірчий інтервал є мірою точності параметра, що оцінюється. Цікаво, що у деяких книгах з основ статистики для медиків тема довірчих інтервалів для частот повністю ігнорується. У статті ми розглянемо кілька способів розрахунку довірчих інтервалів для частот, маючи на увазі такі характеристики вибірки, як безповторність і репрезентативність, і навіть незалежність спостережень друг від друга. Під частотою в цій статті розуміється не абсолютне число, що показує, скільки разів зустрічається в сукупності те чи інше значення, а відносна величина, що визначає частку учасників дослідження, у яких зустрічається ознака, що вивчається.

У біомедичних дослідженнях найчастіше використовуються 95% довірчі інтервали. Цей довірчий інтервал є область, у яку потрапляє справжнє значення частки 95 % випадків. Іншими словами, можна з 95% надійністю сказати, що справжнє значення частоти народження ознаки в генеральній сукупності перебуватиме в межах 95% довірчого інтервалу.

У більшості посібників зі статистики для дослідників від медицини повідомляється, що помилка частоти розраховується за допомогою формули

де p – частота народження ознаки у вибірці (величина від 0 до 1). У більшості вітчизняних наукових статей вказується значення частоти ознак ознаки у вибірці (р), а також її помилка (s) у вигляді p ± s. Доцільніше, проте, представляти 95% довірчий інтервал для частоти ознак ознаки в генеральній сукупності, який включатиме значення від

до.

У деяких посібниках рекомендується при малих вибірках замінювати значення 1,96 значення t для N – 1 ступенів свободи, де N – кількість спостережень у вибірці. Значення t знаходиться за таблицями для t-розподілу, що є практично у всіх посібниках зі статистики. Використання розподілу t для методу Вальда не дає видимих ​​переваг у порівнянні з іншими методами, розглянутими нижче, і тому деякими авторами не вітається.

Наведений вище метод розрахунку довірчих інтервалів для частот або часток носить ім'я Вальда на честь Авраама Вальда (Abraham Wald, 1902-1950), оскільки широке застосуванняйого почалося після публікації Вальда та Вольфовіца в 1939 році. Однак сам метод був запропонований П'єром Симоном Лапласом (1749-1827) ще 1812 року.

Метод Вальда дуже популярний, проте його застосування пов'язане із суттєвими проблемами. Метод не рекомендується при малих обсягах вибірок, а також у випадках, коли частота народження ознаки прагне до 0 або 1 (0 % або 100 %) і просто неможливо для частот 0 і 1. Крім того, апроксимація нормального розподілу, яка використовується при розрахунку помилки , «не працює» у випадках, коли n · p< 5 или n · (1 – p) < 5 . Более консервативные статистики считают, что n · p и n · (1 – p) должны быть не менее 10 . Более детальное рассмотрение метода Вальда показало, что полученные с его помощью доверительные интервалы в большинстве случаев слишком узки, то есть их применение ошибочно создает слишком оптимистичную картину, особенно при удалении частоты встречаемости признака от 0,5, или 50 % . К тому же при приближении частоты к 0 или 1 доверительный интревал может принимать отрицательные значения или превышать 1, что выглядит абсурдно для частот. Многие авторы совершенно справедливо не рекомендуют применять данный метод не только в уже упомянутых случаях, но и тогда, когда частота встречаемости признака менее 25 % или более 75 % . Таким образом, несмотря на простоту расчетов, метод Вальда может применяться лишь в очень ограниченном числе случаев. Зарубежные исследователи более категоричны в своих выводах и однозначно рекомендуют не применять этот метод для небольших выборок , а ведь именно с такими выборками часто приходится иметь дело исследователям-медикам.

Оскільки нова змінна має нормальний розподіл, нижня та верхня межі 95 % довірчого інтервалу для змінної φ дорівнюватимуть φ-1,96 і φ+1,96left">

Замість 1,96 для малих вибірок рекомендується підставляти значення t для N – 1 ступенів свободи. Цей методне дає негативних значеньі дозволяє точніше оцінити довірчі інтервали для частот, ніж метод Вальда. Крім того, він описаний у багатьох вітчизняних довідниках по медичної статистикищо, щоправда, не призвело до його широкому використаннюу медичних дослідженнях. Розрахунок довірчих інтервалів з використанням кутового перетворення не рекомендується за частот, що наближаються до 0 або 1 .

На цьому опис способів оцінки довірчих інтервалів у більшості книг з основ статистики для дослідників-медиків зазвичай закінчується, причому ця проблема характерна не тільки для вітчизняної, а й для зарубіжної літератури. Обидва методи ґрунтуються на центральній граничній теоремі, яка має на увазі наявність великої вибірки.

Зважаючи на недоліки оцінки довірчих інтервалів за допомогою вищезазначених методів, Клоппер (Clopper) та Пірсон (Pearson) запропонували у 1934 році спосіб розрахунку так званого точного довірчого інтервалу з урахуванням біномного розподілудосліджуваного ознаки. Цей метод доступний у багатьох онлайн-калькуляторах, проте довірчі інтервали, отримані таким чином, здебільшого надто широкі. У той самий час цей метод рекомендується застосовувати у випадках, коли необхідна консервативна оцінка. Ступінь консервативності методу збільшується зі зменшенням обсягу вибірки, особливо при N< 15 . описывает применение функции биномиального распределения для анализа качественных данных с использованием MS Excel, в том числе и для определения доверительных интервалов, однако расчет последних для частот в электронных таблицах не «затабулирован» в удобном для пользователя виде, а потому, вероятно, и не используется большинством исследователей.

На думку багатьох статистиків, найбільш оптимальну оцінку довірчих інтервалів для частот здійснює метод Вілсона (Wilson), запропонований ще в 1927 році, але практично не використовується у вітчизняних біомедичних дослідженнях. Даний метод не тільки дозволяє оцінити довірчі інтервали як для дуже малих і дуже великих частот, але і застосовується для малого числа спостережень. У загальному виглядідовірчий інтервал за формулою Вілсона має вигляд від



де приймає значення 1,96 при розрахунку 95% довірчого інтервалу, N - кількість спостережень, а р - частота ознаки у вибірці. Цей метод доступний в онлайн-калькуляторах, тому його застосування не є проблематичним. і не рекомендують використовувати цей метод при n · p< 4 или n · (1 – p) < 4 по причине слишком грубого приближения распределения р к нормальному в такой ситуации, однако зарубежные статистики считают метод Уилсона применимым и для малых выборок .

Вважається, що крім методу Вілсон метод Вальда з корекцією по Агресті - Коуллу також дає оптимальну оцінку довірчого інтервалу для частот. Корекція по Агрести – Коуллу являє собою заміну у формулі Вальда частоти народження ознаки у вибірці (р) на р`, при розрахунку якої до чисельника додається 2, а до знаменника додається 4, тобто p` = (X + 2) / (N + 4), де Х - кількість учасників дослідження, у яких є ознака, що вивчається, а N - обсяг вибірки . Така модифікація призводить до результатів, дуже схожих на результати застосування формули Вілсона, за винятком випадків, коли частота події наближається до 0% або 100%, а вибірка мала. Крім вищезгаданих способів розрахунку довірчих інтервалів для частот були запропоновані поправки на безперервність як для методу Вальда, так і для методу Вілсона для малих вибірок, проте дослідження показали, що їхнє застосування недоцільно.

Розглянемо застосування вищеописаних методів розрахунку довірчих інтервалів на двох прикладах. У першому випадку ми вивчаємо велику вибірку, що складається з 1 000 випадково відібраних учасників дослідження, з яких 450 мають ознаку, що вивчається (це може бути фактор ризику, результат або будь-яка інша ознака), що становить частоту 0,45, або 45%. У другому випадку дослідження проводиться з використанням малої вибірки, припустимо, всього 20 осіб, причому ознака, що вивчається, є всього у 1 учасника дослідження (5%). Довірчі інтервали методом Вальда, методом Вальда з корекцією по Агрести – Коуллу, методом Вілсона розраховувалися з допомогою онлайн-калькулятора, розробленого Jeff Sauro (http://www. /wald. htm). Довірчі інтервали за методом Вілсона з поправкою на безперервність розраховувалися за допомогою калькулятора, запропонованого порталом Wassar Stats: http://faculty.vassar.edu/lowry/prop1.html. Розрахунки за допомогою кутового перетворення Фішера проводилися «вручну» з використанням критичного значення t для 19 та 999 ступенів свободи відповідно. Результати розрахунків представлені у таблиці для обох прикладів.

Довірчі інтервали, розраховані шістьма різними способамидля двох прикладів, описаних у тексті

Спосіб розрахунку довірчого інтервалу

Р=0,0500, чи 5%

95% ДІ для X=450, N=1000, Р=0,4500, або 45%

–0,0455–0,2541

Вальда з корекцією по Агресті – Коуллу

<,0001–0,2541

Вілсона з корекцією на безперервність

«Точний метод» Клоппера – Пірсона

Кутове перетворення

<0,0001–0,1967

Як видно з таблиці, для першого прикладу довірчий інтервал, розрахований за «загальноприйнятим» методом Вальда входить у негативну область, для частот бути неспроможна. На жаль, подібні казуси нерідкі у вітчизняній літературі. Традиційний спосіб представлення даних у вигляді частоти та її помилки частково маскує цю проблему. Наприклад, якщо частота народження ознаки (у відсотках) представлена ​​як 2,1 ± 1,4, то це не настільки «ріже око», як 2,1 % (95 % ДІ: –0,7; 4,9), хоч і означає те саме. Метод Вальда з корекцією по Агресті - Коуллу і розрахунок за допомогою кутового перетворення дають нижню межу, що прагне нуля. Метод Вілсона з поправкою на безперервність і «точний метод» дають ширші довірчі інтервали ніж метод Вілсона. Для другого прикладу всі методи дають приблизно однакові довірчі інтервали (відмінності з'являються тільки в тисячних), що не дивно, так як частота події в цьому прикладі не сильно відрізняється від 50%, а обсяг вибірки досить великий.

Для читачів, що зацікавилися даною проблемою, можна порекомендувати роботи R. G. Newcombe та Brown, Cai та Dasgupta, в яких наводяться плюси та мінуси застосування 7 та 10 різних методів розрахунку довірчих інтервалів відповідно. З вітчизняних посібників рекомендується книга і , в якій, крім докладного опису теорії, представлені методи Вальда, Вілсона, а також спосіб розрахунку довірчих інтервалів з урахуванням біномного розподілу частот. Крім безкоштовних онлайн-калькуляторів (http://www. /wald. htm та http://faculty. vassar. edu/lowry/prop1.html) довірчі інтервали для частот (і не тільки!) можна розраховувати за допомогою програми CIA ( Confidence Intervals Analysis), яку можна завантажити з http://www. medschool. soton. ac. uk/cia/ .

У наступній статті будуть розглянуті одновимірні методи порівняння якісних даних.

Список літератури

Банержі А.Медична статистика зрозумілою мовою: вступний курс / А. Банержі. - М.: Практична медицина, 2007. - 287 с. Медична статистика/. - М.: Медичне інформаційне агентство, 2007. - 475 с. Гланц.Медико-біологічна статистика/С. Гланц. - М.: Практика, 1998. Типи даних, перевірка розподілу та описова статистика // Екологія людини – 2008. – № 1. – С. 52–58. Жіжин К. С. Медична статистика: навчальний посібник / . - Ростов н / Д: Фенікс, 2007. - 160 с. Прикладна медична статистика / . - СПб. : Фоліант, 2003. - 428 с. Лакін Г. Ф. Біометрія/. - М.: Вища школа, 1990. - 350 с. Медик В. А. Математична статистика у медицині / , . - М.: Фінанси та статистика, 2007. - 798 с. Математична статистика у клінічних дослідженнях / , . - М.: ГЕОТАР-МЕД, 2001. - 256 с. Юнкерів В. І. Медико-статистична обробка даних медичних досліджень / . - СПб. : ВмедА, 2002. - 266 с. Agresti A. Approximate is better than exact for interval estimation of binomial proportions / A. Agresti, B. Coull // American statistician. - 1998. - N 52. - С. 119-126. Altman D. Statistics with confidence // D. Altman, D. Machin, T. Bryant, M. J. Gardner. - London: BMJ Books, 2000. - 240 p. Brown L. D. Interval estimation for binomial proportion / L. D. Brown, T. T. Cai, A. Dasgupta // Statistical science. - 2001. - N 2. - P. 101-133. Clopper CJ.Використання confidence або fiducial limits ілюструється в випадку binomial / C. J. Clopper, E. S. Pearson / / Biometrika. - 1934. - N 26. - P. 404-413. Garcia-Perez M. A. На конфіденційний період для binomial parameter / M. A. Garcia-Perez // Quality and quantity. - 2005. - N 39. - P. 467-481. Motulsky H. Intuitive biostatistics // H. Motulsky. - Oxford: Oxford University Press, 1995. - 386 p. Newcombe R. G.Двоє-сиденних confidence intervals for single proportion: Comparison of Seven Methods / R. G. Newcombe // Statistics in Medicine. - 1998. - N. 17. - P. 857-872. Sauro J.Прийнятий монтаж швидких слів від невеликих випадків, використовуючи індивідуальні confidence intervals: comparisons and recomendations / J. Sauro, J. R. Lewis // Proceedings of human factors and ergonomics social annual meeting. - Orlando, FL, 2005. Wald A.Конфіденційні обмеження для постійного розповсюдження функцій // A. Wald, J. Wolfovitz // Annals of Mathematical Statistics. - 1939. - N 10. - P. 105-118. Wilson E. B. Досвідчена інформація, право визнання, і статистична інформація / E. B. Wilson // Journal of American Statistical Association. - 1927. - N 22. - P. 209-212.

CONFIDENCE INTERVALS FOR PROPORTIONS

A. M. Grjibovski

National Institute of Public Health, Oslo, Norway

article presents several methods for calculations confidence intervals for binomial proportions, namely, Wald, Wilson, arcsine, Agresti-Coull and exact Clopper-Pearson methods. Уроки тільки загальні введення в проблему confidence interval estimation of binomial proportion and its aim is notly to stimulate the readers to used confidence intervals when presenting results of own empirical research, but also to encourage them to consult statistics books prior analysing own data and preparing manuscripts.

Key words: confidence interval, proportion

Контактна інформація:

старший радник Національного інституту громадського здоров'я, м. Осло, Норвегія

Схожі статті

2023 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.