Довірчий інтервал для частки онлайн. Довірчий інтервал для оцінки середнього (дисперсія відома) у MS EXCEL

Ціль– навчити студентів алгоритмів обчислення довірчих інтервалів статистичних параметрів.

При статистичній обробці даних обчислені середня арифметична, коефіцієнт варіації, коефіцієнт кореляції, критерії відмінності та інші точкові статистики повинні отримати кількісні межі довіри, які позначають можливі коливання показника меншу і більшу сторону в межах довірчого інтервалу.

Приклад 3.1 . Розподіл кальцію у сироватці крові мавп, як було встановлено раніше, характеризується такими вибірковими показниками: = 11,94 мг%; = 0,127 мг%; n= 100. Потрібно визначити довірчий інтервал для генеральної середньої ( ) при довірчій ймовірності P = 0,95.

Генеральна середня знаходиться з певною ймовірністю в інтервалі:

, де - Вибіркова середня арифметична; t– критерій Стьюдента; - Помилка середньої арифметичної.

За таблицею «Значення критерію Стьюдента» знаходимо значення при довірчій ймовірності 0,95 та числі ступенів свободи k= 100-1 = 99. Воно дорівнює 1,982. Разом зі значеннями середньої арифметичної та статистичної помилки підставляємо його у формулу:

або 11,69
12,19

Таким чином, з ймовірністю 95%, можна стверджувати, що генеральна середня цього нормального розподілу знаходиться між 11,69 і 12,19 мг%.

Приклад 3.2 . Визначте межі 95% довірчого інтервалу для генеральної дисперсії ( ) розподілу кальцію в крові мавп, якщо відомо, що
= 1,60, при n = 100.

Для вирішення задачі можна скористатися такою формулою:

Де - Статистична помилка дисперсії.

Знаходимо помилку вибіркової дисперсії за формулою:
. Вона дорівнює 0,11. Значення t- критерію при довірчій ймовірності 0,95 та числі ступенів свободи k= 100-1 = 99 відомо з попереднього прикладу.

Скористаємося формулою та отримаємо:

або 1,38
1,82

Точніше довірчий інтервалгенеральної дисперсії можна побудувати із застосуванням (хі-квадрат) – критерію Пірсона. Критичні точки при цьому критерію наводяться у спеціальній таблиці. При використанні критерію для побудови довірчого інтервалу застосовують двосторонній рівень значущості. Для нижньої межі рівень значущості розраховується за формулою
, для верхньої –
. Наприклад, для довірчого рівня = 0,99= 0,010,= 0,990. Відповідно до таблиці розподілу критичних значень , при розрахованих довірчих рівнях та числі ступенів свободи k= 100 - 1 = 99, знайдемо значення
і
. Отримуємо
одно 135,80, а
рівно70,06.

Щоб знайти довірчі межі генеральної дисперсії за допомогою скористаємося формулами: для нижньої межі
для верхнього кордону
. Підставимо ці завдання знайдені значення у формули:
= 1,17;
= 2,26. Таким чином, за довірчої ймовірності P= 0,99 або 99% генеральна дисперсія лежатиме в інтервалі від 1,17 до 2,26 мг% включно.

Приклад 3.3 . Серед 1000 насіння пшениці з партії, що надійшла на елеватор, виявлено 120 насіння заражених ріжків. Необхідно визначити можливі межі генеральної частки зараженого насіння у цій партії пшениці.

Довірчі кордони для генеральної часткипри всіх можливих її значеннях доцільно визначати за такою формулою:

,

Де n - Число спостережень; m- Абсолютна чисельність однієї з груп; t– нормоване відхилення.

Вибіркова частка зараженого насіння дорівнює
чи 12%. За довірчої ймовірності Р= 95% нормоване відхилення ( t-критерій Стьюдента при k =
)t = 1,960.

Підставляємо наявні дані у формулу:

Звідси межі довірчого інтервалу дорівнюють = 0,122-0,041 = 0,081, або 8,1%; = 0,122 + 0,041 = 0,163, чи 16,3%.

Таким чином, з довірчою ймовірністю 95% можна стверджувати, що генеральна частка зараженого насіння знаходиться між 8,1 та 16,3%.

Приклад 3.4 . Коефіцієнт варіації, що характеризує варіювання кальцію (мг%) у сироватці крові мавп, дорівнював 10,6%. Обсяг вибірки n= 100. Необхідно визначити межі 95% довірчого інтервалу для генерального параметра Cv.

Кордони довірчого інтервалу для генерального коефіцієнта варіації Cv визначаються за такими формулами:

і
, де K проміжна величина, що обчислюється за формулою
.

Знаючи, що за довірчої ймовірності Р= 95% нормоване відхилення (критерій Стьюдента при k =
)t = 1,960, попередньо розрахуємо величину До:

.

або 9,3%

або 12,3%

Таким чином, генеральний коефіцієнт варіації з довірчою ймовірністю 95% лежить в інтервалі від 93 до 123%. При повторних вибірках коефіцієнт варіації не перевищить 12,3% і не виявиться нижчим за 9,3% у 95 випадках зі 100.

Запитання для самоконтролю:

Завдання для самостійного вирішення.

1. Середній відсоток жиру у молоці за лактацію корів холмогорських помісей був таким: 3,4; 3,6; 3,2; 3,1; 2,9; 3,7; 3,2; 3,6; 4,0; 3,4; 4,1; 3,8; 3,4; 4,0; 3,3; 3,7; 3,5; 3,6; 3,4; 3,8. Встановіть довірчі інтервали для середньої середньої при довірчій ймовірності 95% (20 балів).

2. На 400 рослинах гібридного жита перші квітки з'явилися в середньому на 70,5 день після посіву. Середнє відхилення було 6,9 дня. Визначте помилку середньої та довірчі інтервали для генеральної середньої та дисперсії при рівні значущості W= 0,05 та W= 0,01 (25 балів).

3. При вивченні довжини листя 502 екземплярів садової суниці були отримані такі дані: = 7,86 див; σ = 1,32 см, =± 0,06 см. Визначте довірчі інтервали для середньої арифметичної генеральної сукупності з рівнями значущості 0,01; 0,02; 0,05. (25 балів).

4. При обстеженні 150 дорослих чоловіків середній зріст дорівнював 167 см, а σ = 6 см. У яких межах знаходиться генеральна середня та генеральна дисперсія з довірчою ймовірністю 0,99 та 0,95? (25 балів).

5. Розподіл кальцію у сироватці крові мавп характеризується такими вибірковими показниками: = 11,94 мг%, σ = 1,27, n = 100. Побудуйте 95% довірчий інтервал для генеральної середньої цього розподілу. Розрахуйте коефіцієнт варіації (25 балів).

6. Було вивчено загальний вміст азоту в плазмі крові щурів-альбіносів у віці 37 та 180 днів. Результати виражені у грамах на 100 см 3 плазми. У віці 37 днів 9 щурів мали: 0,98; 0,83; 0,99; 0,86; 0,90; 0,81; 0,94; 0,92; 0,87. У віці 180 днів 8 щурів мали: 1,20; 1,18; 1,33; 1,21; 1,20; 1,07; 1,13; 1,12. Встановіть довірчі інтервали для різниці з вірогідністю 0,95 (50 балів).

7. Визначте межі 95% довірчого інтервалу для генеральної дисперсії розподілу кальцію (мг%) у сироватці крові мавп, якщо для цього розподілу обсяг вибірки n = 100, статистична помилка вибіркової дисперсії s σ 2 = 1,60 (40 балів).

8. Визначте межі 95% довірчого інтервалу для генеральної дисперсії розподілу 40 колосків пшениці по довжині (σ 2 = 40, 87 мм 2). (25 балів).

9. Куріння вважають основним фактором, що привертає до обструктивних захворювань легень. Пасивне куріння таким фактором не вважається. Вчені засумнівалися у нешкідливості пасивного куріння та досліджували прохідність дихальних шляхів у курців, що не палять, пасивних та активних. Для характеристики стану дихальних шляхів взяли один із показників функції зовнішнього дихання – максимальну об'ємну швидкість середини видиху. Зменшення цього показника – ознака порушення прохідності дихальних шляхів. Дані обстеження наведені у таблиці.

Число обстежених

Максимальна об'ємна швидкістьсередини видиху, л/с

Стандартне відхилення

Некурці

працюють у приміщенні, де не курять

працюють у накуреному приміщенні

Курці

викурювальні не велика кількістьцигарок

викурюють середню кількість сигарет

викурюють велику кількість сигарет

За даними таблиці знайдіть 95% довірчі інтервали для генеральної середньої та генеральної дисперсії для кожної групи. У чому різниця між групами? Результати подайте графічно (25 балів).

10. Визначте межі 95%-ного та 99%-ного довірчого інтервалу для генеральної дисперсії чисельності поросят у 64 опоросах, якщо статистична помилка вибіркової дисперсії s σ 2 = 8, 25 (30 балів).

11. Відомо, що середня маса кролів становить 2,1 кг. Визначте межі 95%-ного та 99%-ного довірчого інтервалу для генеральної середньої та дисперсії при n= 30, σ = 0,56 кг (25 балів).

12. У 100 колосків вимірювали озерненість колосу ( Х), довжину колосу ( Y) та масу зерна в колосі ( Z). Знайти довірчі інтервали для генеральної середньої та дисперсії при P 1 = 0,95, P 2 = 0,99, P 3 = 0,999, якщо = 19, = 6,766 див, = 0,554 р; x 2 = 29, 153, y 2 = 2, 111, z 2 = 0,064. (25 балів).

13. У відібраних випадковим чином 100 колосках озимої пшениціпідраховувалося число колосків. Вибіркова сукупність характеризувалася наступними показниками: = 15 колосків та σ = 2,28 шт. Визначте, з якою точністю отримано середній результат ( ) та побудуйте довірчий інтервал для генеральної середньої та дисперсії при 95% та 99% рівнях значущості (30 балів).

14. Число ребер на раковинах викопного молюска Orthambonites calligramma:

Відомо, що n = 19, σ = 4,25. Визначте межі довірчого інтервалу для генеральної середньої та генеральної дисперсії при рівні значущості W = 0,01 (25 балів).

15. Для визначення надої молока на молочно-товарній фермі щодня визначалася продуктивність 15 корів. За даними протягом року кожна корова давала загалом на добу таку кількість молока (л): 22; 19; 25; 20; 27; 17; 30; 21; 18; 24; 26; 23; 25; 20; 24. Побудуйте довірчі інтервали для генеральної дисперсії та середньої арифметичної. Чи можна очікувати, що середньорічний надій на кожну корову складе 10000 літрів? (50 балів).

16. З метою визначення врожаю пшениці в середньому по агрогосподарству були проведені укоси на пробних ділянках площею 1, 3, 2, 5, 2, 6, 1, 3, 2, 11 та 2 га. Урожайність (ц/га) з ділянок становила 39,4; 38; 35,8; 40; 35; 42,7; 39,3; 41,6; 33; 42; 29 відповідно. Побудуйте довірчі інтервали для генеральних дисперсії та середньої арифметичної. Чи можна очікувати, що в середньому в агрогосподарстві врожай складе 42 ц/га? (50 балів).

та інших. Усі є оцінками своїх теоретичних аналогів, які можна було б отримати, якби у розпорядженні була вибірка, а генеральна сукупність. Але на жаль, генеральна сукупність - це дуже дорого і часто недоступне.

Поняття про інтервальне оцінювання

Будь-яка вибіркова оцінка має деякий розкид, т.к. є випадковою величиною, що залежить від значень у конкретній вибірці. Отже, для більш надійних статистичних висновків слід знати не лише точкову оцінку, але й інтервал, який з високою ймовірністю γ (гама) накриває оцінюваний показник θ (Тета).

Формально це два таких значення (статистики) T 1 (X)і T 2 (X), що T 1< T 2 для яких при заданому рівні ймовірності γ виконується умова:

Коротше, з ймовірністю γ або більше істинний показник знаходиться між точками T 1 (X)і T 2 (X), які називаються нижнім та верхнім кордоном довірчого інтервалу.

Однією з умов побудови довірчих інтервалів його максимальна вузькість, тобто. він має бути наскільки це можливо коротким. Бажання цілком природно, т.к. дослідник намагається точніше локалізувати знаходження шуканого параметра.

Звідси випливає, що інтервал довіри повинен накривати максимальні ймовірності розподілу. а сама оцінка бути у центрі.

Тобто ймовірність відхилення (справжнього показника від оцінки) у більшу сторону дорівнює ймовірності відхилення у менший бік. Слід зазначити, що з несиметричних розподілів інтервал справа дорівнює інтервалуліворуч.

На малюнку вище чітко видно, що чим більше довірча ймовірність, Тим ширше інтервал - пряма залежність.

Це була невелика вступна частина в теорію інтервального оцінювання невідомих параметрів. Перейдемо до знаходження довірчих кордонів для математичного очікування.

Довірчий інтервал для математичного очікування

Якщо вихідні дані розподілені по , то середнє буде нормальною величиною. Це випливає з того правила, що лінійна комбінація нормальних величин також має нормальний розподіл. Отже, для розрахунку можливостей ми могли б використовувати математичний апарат нормального закону розподілу.

Однак для цього потрібно знати два параметри – матожидання та дисперсію, які зазвичай не відомі. Можна, звичайно, замість параметрів використовувати оцінки (середню арифметичну і ), але тоді розподіл середньої буде не зовсім нормальним, він буде трохи приплюснутий донизу. Цей факт спритно помітив громадянин Вільям Госсет з Ірландії, опублікувавши своє відкриття у березневому випуску журналу Biometrica за 1908 рік. З метою конспірації Держсет підписався Стьюдентом. Так виник t-розподіл Стьюдента.

Однак нормальний розподіл даних, що використовувався К. Гауссом при аналізі помилок астрономічних спостережень, у земному житті зустрічається вкрай рідко і встановити це досить складно. високої точностінеобхідно близько 2 тисяч спостережень). Тому припущення про нормальність найкраще відкинути та використовувати методи, які не залежать від розподілу вихідних даних.

Виникає питання: який же розподіл середньої арифметичної, якщо він розрахований за даними невідомого розподілу? Відповідь дає відома у теорії ймовірностей Центральна гранична теорема(ЦПТ). У математиці існує кілька її варіантів (протягом довгих роківформулювання уточнювалися), але всі вони, грубо кажучи, зводяться до твердження, що сума великої кількостінезалежних випадкових величин підпорядковується нормальному закону розподілу.

При розрахунку середньої арифметичної використовується сума випадкових величин. Звідси виходить, що середнє арифметичне має нормальний розподіл, у якого матожидання – це маточування вихідних даних, а дисперсія – .

Розумні людивміють доводити ЦПТ, але ми переконаємося з допомогою експерименту, проведеного в Excel. Змоделюємо вибірку із 50-ти рівномірно розподілених випадкових величин (за допомогою функції ExcelВИПАДМІЖ). Потім зробимо 1000 таких вибірок і кожної розрахуємо середню арифметичну. Подивимося з їхньої розподіл.

Видно, що розподіл середньої близько до нормального закону. Якщо обсяг вибірок та їх кількість зробити ще більше, то подібність буде ще кращою.

Тепер, коли ми переконалися в справедливості ЦПТ, можна, використовуючи , розрахувати довірчі інтервали для середньої арифметичної, які з заданою ймовірністюнакривають справжнє середнє чи математичне очікування.

Для встановлення верхньої та нижньої межі потрібно знати параметри нормального розподілу. Як правило, їх немає, тому використовують оцінки: середню арифметичнуі вибіркову дисперсію. Повторюся, такий спосіб дає гарне наближення лише за великих вибірках. Коли вибірки малі, часто рекомендують використовувати розподіл Стьюдента. Не вірте! Розподіл Стьюдента для середньої буває лише тоді, коли вихідні дані мають нормальний розподіл, тобто майже ніколи. Тому краще відразу поставити мінімальну планку за кількістю необхідних даних та використовувати асимптотично коректні методи. Говорять, достатньо 30 спостережень. Беріть 50 – не помилитеся.

T 1,2– нижня та верхня межа довірчого інтервалу

– вибіркове середнє арифметичне

s 0- Середнє квадратичне відхилення за вибіркою (незміщене)

n - Розмір вибірки

γ - Довірча ймовірність (зазвичай дорівнює 0,9, 0,95 або 0,99)

c γ =Φ -1 ((1+γ)/2)зворотне значенняфункції стандартного нормального розподілу Простіше кажучи, це кількість стандартних помилок від середньої арифметичної до нижньої або верхньої межі (вказаним трьома ймовірностями відповідають значення 1,64, 1,96 і 2,58).

Суть формули в тому, що береться середнє арифметичне і далі від неї відкладається кілька ( з γ) стандартних помилок ( s 0 /√n). Все відомо, бери і рахуй.

До масового використанняПЕОМ для отримання значень функції нормального розподілу та зворотної їй використовували. Їх і зараз використовують, але ефективніше звернутися до готових формулам Excel. Всі елементи формули вище ( , і ) можна легко розрахувати в Excel. Але є і готова формула для розрахунку довірчого інтервалу ДОВЕРИТ.НОРМ. Її синтаксис наступний.

ДОВІР.НОРМ(альфа;стандартне_вимк.;розмір)

альфа– рівень значущості чи довірчий рівень, що у прийнятих вище позначеннях дорівнює 1- γ, тобто. ймовірність того, що математичнеочікування опиниться поза довірчого інтервалу. За довірчої ймовірності 0,95, альфа дорівнює 0,05 і т.д.

стандартне_відкл- Середнє квадратичне відхилення вибіркових даних. Стандартну помилку не треба розраховувати, Excel сам розділить на корінь з n.

розмір- Розмір вибірки (n).

Результат функції ДОВЕРИТ.НОРМ – це другий доданок з формули розрахунку довірчого інтервалу, тобто. напівінтервал. Відповідно, нижня та верхня точка – це середнє ± отримане значення.

Отже, можна побудувати універсальний алгоритм розрахунку довірчих інтервалів для середньої арифметичної, який залежить від розподілу вихідних даних. Платою за універсальність є його асимптотичність, тобто. необхідність використання щодо великих вибірок. Однак у вік сучасних технологійзібрати потрібна кількістьданих зазвичай не становить труднощів.

Перевірка статистичних гіпотез за допомогою довірчого інтервалу

(Module 111)

Однією з основних завдань, вирішуваних у статистиці, є . Її суть коротко така. Висувається припущення, наприклад, що матожидання генеральної сукупностіі якесь значення. Потім будується розподіл вибіркових середніх, які можуть спостерігатися при даному матожиданні. Далі дивляться, де цього умовного розподілу перебуває справжня середня. Якщо вона виходить за допустимі межі, то поява такого середнього дуже малоймовірна, а при одноразовому повторенні експерименту майже неможливо, що суперечить висунутій гіпотезі, яка успішно відхиляється. Якщо ж середнє не виходить за критичний рівень, то гіпотеза не відхиляється (але й доводиться!).

Так ось за допомогою довірчих інтервалів, у нашому випадку для матожидання, також можна перевіряти деякі гіпотези. Це дуже просто зробити. Припустимо, середня арифметична за деякою вибіркою дорівнює 100. Перевіряється гіпотеза про те, що матожидання одно, припустимо, 90. Тобто, якщо поставити питання примітивно, то він звучить так: чи може таке бути, щоб при істинному значенні середньої рівної 90, спостерігається середня виявилася дорівнює 100?

Для відповіді на це питання додатково знадобиться інформація про середнє квадратичному відхиленніта розмір вибірки. Допустимо середньоквадратичне відхилення дорівнює 30, а кількість спостережень 64 (щоб легко витягти корінь). Тоді стандартна помилка середньої дорівнює 30/8 чи 3,75. Для розрахунку 95% довірчого інтервалу потрібно відкласти в обидві сторони від середньої по дві стандартні помилки(точніше, 1,96). Довірчий інтервал вийде приблизно 100±7,5 або 92,5 до 107,5.

Далі міркування такі. Якщо перевірене значення потрапляє у довірчий інтервал, воно не суперечить гіпотезі, т.к. укладається у межі випадкових коливань (з ймовірністю 95%). Якщо точка, що перевіряється, виходить за межі довірчого інтервалу, то ймовірність такої події дуже маленька, принаймні нижче допустимого рівня. Отже, гіпотезу відхиляють, як таку, що суперечить спостережуваним даним. У нашому випадку гіпотеза про маточування знаходиться за межами довірчого інтервалу (перевірене значення 90 не входить до інтервалу 100±7,5), тому її слід відхилити. Відповідаючи на примітивне питання вище, слід сказати: ні не може, принаймні таке трапляється вкрай рідко. Часто при цьому вказують конкретну ймовірність помилкового відхилення гіпотези (p-level), а не заданий рівень, яким будувався довірчий інтервал, але про це в інший раз.

Як бачимо, побудувати довірчий інтервал для середнього (або математичного очікування) нескладно. Головне, вловити суть, а далі йтиметься. На практиці в більшості випадків використовуються 95% довірчий інтервал, який має завширшки приблизно дві стандартні помилки по обидва боки від середньої.

На цьому поки що все. Усіх благ!

Довірчий інтервал прийшов до нас із галузі статистики. Це певний діапазон, який слугує для оцінки невідомого параметра з високим ступенем надійності. Найпростіше це пояснити на прикладі.

Припустимо, слід досліджувати якусь випадкову величину, наприклад, швидкість відгуку сервера на запит клієнта. Щоразу, коли користувач набирає адресу конкретного сайту, сервер реагує на це різною швидкістю. Таким чином, час відгуку, що досліджується, має випадковий характер. Так ось, довірчий інтервал дозволяє визначити межі цього параметра, і потім можна буде стверджувати, що з ймовірністю 95% сервера буде знаходитися в розрахованому нами діапазоні.

Або ж потрібно дізнатися, якій кількості людей відомо про торговій марціфірми. Коли буде підрахований довірчий інтервал, можна буде, наприклад, сказати що з 95% часткою ймовірності частка споживачів, знають про цю перебуває у діапазоні від 27% до 34%.

З цим терміном тісно пов'язана така величина як довірча ймовірність. Вона є ймовірністю того, що шуканий параметр входить у довірчий інтервал. Від цієї величини залежить те, наскільки більшим виявиться наш пошуковий діапазон. Що більше значення вона набуває, то вже стає довірчий інтервал, і навпаки. Зазвичай її встановлюють рівним 90%, 95% або 99%. Величина 95% найпопулярніша.

на даний показниктакож впливає дисперсія спостережень і Його визначення ґрунтується на тому припущенні, що досліджувана ознака підкоряється. Це твердження відоме також як Закон Гауса. Згідно з ним, нормальним називається такий розподіл усіх ймовірностей безперервної випадкової величини, яке можна описати густиною ймовірностей. Якщо припущення про нормальному розподілівиявилося помилковим, то оцінка може виявитися неправильною.

Спочатку розберемося з тим, як обчислити довірчий інтервал. Тут можливі два випадки. Дисперсія (ступінь розкиду випадкової величини) може бути відома чи ні. Якщо вона відома, то наш довірчий інтервал обчислюється за допомогою наступної формули:

хср - t*σ / (sqrt(n))<= α <= хср + t*σ / (sqrt(n)), где

α - ознака,

t - параметр таблиці розподілу Лапласа,

σ – квадратний корінь дисперсії.

Якщо дисперсія невідома, її можна розрахувати, якщо нам відомі всі значення шуканої ознаки. Для цього використовується така формула:

σ2 = х2ср - (хср)2 де

х2ср - середнє значення квадратів досліджуваної ознаки,

(ХСР)2 - квадрат даної ознаки.

Формула, за якою в цьому випадку розраховується довірчий інтервал, трохи змінюється:

хср - t * s / (sqrt (n))<= α <= хср + t*s / (sqrt(n)), где

хср - вибіркове середнє,

α - ознака,

t - параметр, який знаходять за допомогою таблиці розподілу Стьюдента t = t(?;n-1),

sqrt(n) - квадратний корінь загального обсягу вибірки,

s – квадратний корінь дисперсії.

Розглянь такий приклад. Припустимо, що за результатами 7 вимірів було визначено досліджуваного ознаки, що дорівнює 30 і дисперсія вибірки, що дорівнює 36. Потрібно знайти з ймовірністю 99% довірчий інтервал, який містить справжнє значення параметра, що вимірюється.

Спочатку визначимо чому t: t = t (0,99; 7-1) = 3.71. Використовуємо наведену вище формулу, отримуємо:

хср - t * s / (sqrt (n))<= α <= хср + t*s / (sqrt(n))

30 - 3.71*36 / (sqrt(7))<= α <= 30 + 3.71*36 / (sqrt(7))

21.587 <= α <= 38.413

Довірчий інтервал дисперсії розраховується як у випадку з відомим середнім, так і тоді, коли немає жодних даних про математичне очікування, а відомо лише значення точкової незміщеної оцінки дисперсії. Ми не наводитимемо тут формули його розрахунку, оскільки вони досить складні і за бажання їх завжди можна знайти в мережі.

Відзначимо лише, що довірчий інтервал зручно визначати за допомогою програми Excel або мережевого сервісу, що так і називається.

Довірчий інтервал(ДІ; в англ, confidence interval - CI) отриманий у дослідженні при вибірці дає міру точності (або невизначеності) результатів дослідження, для того щоб робити висновки про популяцію всіх таких пацієнтів (генеральна сукупність). Правильне визначення 95% ДІ можна сформулювати так: 95% таких інтервалів міститиме справжню величину в популяції. Дещо менш точна така інтерпретація: ДІ - діапазон величин, у межах якого можна на 95% бути впевненим у тому, що він містить справжню величину. При використанні ДІ акцент робиться на визначенні кількісного ефекту, на противагу величині Р, яка у результаті перевірки статистичної значимості. Величина Р не оцінює жодної кількості, а служить швидше мірою сили свідчення проти нульової гіпотези «ніякого ефекту». Величина Р сама по собі не говорить нам нічого ні про величину відмінності, ні навіть про його спрямування. Тому самостійні величини Р абсолютно неінформативні у статтях чи рефератах. На відміну від них ДІ вказує і кількість ефекту, що становить безпосередній інтерес, наприклад на корисність лікування, і силу доказів. Тому ДІ безпосередньо має відношення до практики ДМ.

Підхід оцінки до статистичного аналізу, що ілюструється ДІ, спрямований на вимірювання кількості цікавого для нас ефекту (чутливість діагностичного тесту, частота прогнозованих випадків, скорочення відносного ризику при лікуванні тощо), а також на вимірювання невизначеності в цьому ефекті. Найчастіше ДІ - діапазон величин з обох боків оцінки, у якому, ймовірно, лежить справжня величина, і можна бути впевненим у цьому 95%. Угода використовувати 95% можливість довільно, так само як і величину Р<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

ДІ заснований на ідеї, що те саме дослідження, виконане на інших вибірках пацієнтів, не призвело б до ідентичних результатів, але що їх результати будуть розподілені навколо істинної, проте невідомої величини. Іншими словами, ДІ описує це як «варіабельність, яка залежить від вибірки». ДІ не відображає додаткову невизначеність, обумовлену іншими причинами; зокрема, він не включає вплив селективної втрати пацієнтів під час відстеження, поганого комплайнсу або неточного вимірювання результату, відсутності засліплення тощо. ДІ, таким чином, завжди недооцінює загальну кількість невизначеності.

Обчислення довірчого інтервалу

Таблиця А1.1. Стандартні помилки та довірчі інтервали для деяких клінічних вимірювань

Зазвичай ДІ обчислюють з оцінки кількісного показника, такого, як відмінність (d) між двома пропорціями, і стандартної помилки (SE) в оцінці цієї відмінності. Приблизний 95% ДІ, що отримується таким чином, - d ± 1,96 SE. Формула змінюється відповідно до природи заходу та охоплення ДІ. Наприклад, у рандомізованому плацебо-контрольованому випробуванні безклітинної коклюшної вакцини кашлюк розвивався у 72 з 1670 (4,3%) немовлят, які отримали вакцину, і у 240 з 1665 (14,4%) у групі контролю. Відмінність у відсотках відома як абсолютне зниження ризику становить 10,1%. SE цієї відмінності дорівнює 0,99%. Відповідно 95% ДІ становить 10,1% + 1,96 x 0,99%, тобто. від 8,2 до 12,0.

Незважаючи на різні філософські підходи, ДІ та тести на статистичну значущість тісно пов'язані математично.

Отже, величина Р «значна», тобто. Р<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

Невизначеність (неточність) оцінки, що виражається в ДІ, великою мірою пов'язана з квадратним коренем із розміру вибірки. Невеликі вибірки надають менше інформації, ніж більші, і ДІ відповідно ширше в меншій вибірці. Наприклад, стаття, яка порівнює характеристики трьох тестів, що застосовуються для діагностики інфекції Helicobacter pylori, повідомила про чутливість дихальної проби з сечовиною 95,8% (95% ДІ 75-100). У той час як число 95,8% виглядає переконливо, маленька вибірка з 24 дорослих пацієнтів з Я. pylori означає, що є значна невизначеність у цій оцінці, як показує широкий ДІ. Справді, нижня межа 75% набагато нижча, ніж оцінка 95,8%. Якби така ж чутливість спостерігалася у вибірці 240 осіб, то 95% ДІ становив би 92,5-98,0, даючи більше гарантій, що тест високочутливий.

У рандомізованих контрольованих випробуваннях (РКД) незначні результати (тобто ті, де Р> 0,05) особливо схильні до неправильного тлумачення. ДІ особливо корисний тут, оскільки він показує, наскільки сумісні результати клінічно корисним справжнім ефектом. Наприклад, у РКІ, що порівнює накладення анастомозу швом і скріпками на товстій кишці, ранова інфекція розвинулася у 10,9% та 13,5% пацієнтів відповідно (Р = 0,30). 95% ДІ для цього відмінності становить 2,6% (від -2 до +8). Навіть у цьому дослідженні, що включало 652 пацієнти, залишається ймовірність, що існує помірна відмінність у частоті інфекцій, що виникають внаслідок цих двох процедур. Чим менше дослідження, тим більша невпевненість. Сунг та співавт. виконали РКІ, щоб порівняти інфузію октреотиду з терміновою склеротерапією при гострій кровотечі з варикозно-розширених вен на 100 пацієнтів. У групі октреотиду частота зупинки кровотечі становила 84%; у групі склеротерапії - 90%, що дає Р = 0,56. Зауважимо, що показники кровотечі, що триває, аналогічні таким при рановій інфекції у згаданому дослідженні. В цьому випадку, однак, 95% ДІ для відмінності втручань дорівнює 6% (від -7 до +19). Цей інтервал досить широкий порівняно з 5% відмінністю, яка представляла б клінічний інтерес. Зрозуміло, дослідження не виключає значної різниці в ефективності. Тому висновок авторів «інфузія октреотиду та склеротерапія однаково ефективні при лікуванні кровотечі з варикозно-розширених вен» безумовно невалідно. У подібних випадках, коли, як тут, 95% ДІ для абсолютного зниження ризику (АСР) включає нуль, ДІ для ПВПП (NNT - number needed to treat, англ.) є досить скрутним для тлумачення . ЧПЛП та її ДІ отримують з величин, зворотних АСР (помножуючи їх у 100, якщо ці величини дані у вигляді процентов). Тут ми отримуємо ПВП = 100: 6 = 16,6 з 95% ДІ від -14,3 до 5,3. Як видно із виноски «d» у табл. А1.1, цей ДІ включає величини ПВПЛ від 5,3 до нескінченності і ПВПЛ від 14,3 до нескінченності.

ДІ можна побудувати більшості зазвичай уживаних статистичних оцінок чи порівнянь. Для РКІ він включає різницю між середніми пропорціями, відносними ризиками, відносинами шансів та ПВПЛ. Аналогічно ДІ можна отримати для всіх головних оцінок, зроблених у дослідженнях точності діагностичних тестів - чутливості, специфічності, прогностичної значущості позитивного результату (всі вони є простими пропорціями), і відносини правдоподібності - оцінок, які отримують метааналізах і дослідженнях типу порівняння з контролем. Комп'ютерна програма для персональних комп'ютерів, яка покриває багато цих способів використання ДІ, доступна з другим виданням «Statistics with Confidence». Макроси для обчислення ДІ для пропорцій безкоштовно доступні для Excel та статистичних програм SPSS та Minitab на http://www.uwcm.ac.uk/study/medicine/epidemiology_ statistics/research/statistics/proportions, htm.

Численні оцінки ефекту лікування

У той час як побудова ДІ бажана для первинних результатів дослідження, вони не є обов'язковими для всіх результатів. ДІ стосується клінічно важливих порівнянь. Наприклад, при порівнянні двох груп правильний той ДІ, що побудований для відмінності між групами, як показано вище в прикладах, а не ДІ, який можна побудувати для оцінки кожної групи. Мало того, що марно давати окремі ДІ для оцінок у кожній групі, це уявлення може вводити в оману. Так само правильний підхід при порівнянні ефективності лікування в різних підгрупах - порівняння двох (або більше) підгруп безпосередньо. Неправильно припускати, що лікування ефективне лише в одній підгрупі, якщо її ДІ виключає величину, що відповідає відсутності ефекту, а інші – ні. ДІ корисні також при порівнянні результатів у кількох підгрупах. На рис. А 1.1 показаний відносний ризик еклампсії у жінок з прееклампсією в підгрупах жінок із плацебо-контрольованого РКІ сульфату магнію.

Мал. А1.2. Лісовий графік показує результати 11 рандомізованих клінічних випробувань бичачої ротавірусної вакцини для профілактики діареї порівняно з плацебо. При оцінці відносного ризику діареї використано 95% довірчий інтервал. Розмір чорного квадрата пропорційний обсягу інформації. Крім того, показано сумарну оцінку ефективності лікування та 95% довірчого інтервалу (позначається ромбом). У метааналізі використана модель випадкових ефектів перевищує деякі попередньо встановлені; наприклад, це може бути розмір, використаний для обчислення величини вибірки. Відповідно до суворішого критерію весь діапазон ДІ повинен показувати користь, що перевищує встановлений мінімум.

Ми вже обговорювали помилку, коли відсутність статистичної значущості сприймають як вказівку на те, що два способи лікування однаково ефективні. Так само важливо не зрівнювати статистичну значимість із клінічною важливістю. Клінічну важливість можна припускати, коли результат статистично значимий і величина оцінки ефективності лікування

Дослідження можуть показати, чи значущі результати статистично і які клінічно важливі, які - ні. На рис. А1.2 наведено результати чотирьох випробувань, для яких весь ДІ<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Довірчий інтервал

Довірчий інтервал- термін, який використовується в математичній статистиці при інтервальній (на відміну від точкової) оцінки статистичних параметрів, що краще при невеликому обсязі вибірки. Довірчим називають інтервал, який покриває невідомий параметр із заданою надійністю.

Метод довірчих інтервалів розробив американський статистик Єжи Нейман, виходячи з ідей англійського статистика Рональда Фішера.

Визначення

Довірчим інтервалом параметра θ розподілу випадкової величини Xз рівнем довіри 100 p%, породженим вибіркою ( x 1 ,…,x n), називається інтервал з межами ( x 1 ,…,x n) та ( x 1 ,…,x n), які є реалізаціями випадкових величин L(X 1 ,…,X n) та U(X 1 ,…,X n), таких, що

.

Граничні точки довірчого інтервалу і називаються довірчими межами.

Інтерпретація довірчого інтервалу, заснована на інтуїції, буде такою: якщо pвелике (скажімо, 0,95 або 0,99), то довірчий інтервал майже напевно містить справжнє значення θ .

Ще одне тлумачення поняттю довірчого інтервалу: його можна як інтервал значень параметра θ , сумісні з досвідченими даними і не суперечать їм.

Приклади

  • Довірчий інтервал для математичного очікування нормальної вибірки;
  • Довірчий інтервал для дисперсії нормальної вибірки.

Байєсовський довірчий інтервал

У байєсовской статистиці існує схоже, але визначення деяких ключових деталях визначення довірчого інтервалу. Тут параметр, що оцінюється, сам вважається випадковою величиною з деяким заданим апріорним розподілом (у найпростішому випадку - рівномірним), а вибірка фіксована (у класичній статистиці все в точності навпаки). Байєсовський -довірчий інтервал - це інтервал, що покриває значення параметра з апостеріорною ймовірністю:

.

Як правило, класичний та байєсовський довірчі інтервали різняться. В англомовній літературі байєсівський довірчий інтервал прийнято називати терміном credible interval, а класичний - confidence interval.

Примітки

Джерела

Wikimedia Foundation. 2010 .

  • Дітки (фільм)
  • Колоніст

Дивитись що таке "Довірчий інтервал" в інших словниках:

    Довірчий інтервал- інтервал, обчислений за вибірковими даними, який із заданою ймовірністю (довірчою) накриває невідоме справжнє значення параметра розподілу, що оцінюється. Джерело: ГОСТ 20522 96: Ґрунти. Методи статистичної обробки результатів … Словник-довідник термінів нормативно-технічної документації

    довірчий інтервал- для скалярного параметра генеральної сукупності - це відрізок, що з великою ймовірністю містить цей параметр. Ця фраза без подальших уточнень безглузда. Оскільки межі довірчого інтервалу оцінюються за вибіркою, природно його… Словник соціологічної статистики

    ДОВІРНИЙ ІНТЕРВАЛ- метод оцінювання параметрів, який відрізняється від точкового оцінювання. Нехай задана вибірка x1, . . ., хn з розподілу з густиною ймовірності f(x, α), і а*=а*(x1, . . ., хn) оцінка α, g(a*, α) густина ймовірності оцінки. Шукаємо ... ... Геологічна енциклопедія

    ДОВІРНИЙ ІНТЕРВАЛ- (confidence interval) Інтервал, в якому достовірність значення параметра населення, отриманого на основі вибіркового обстеження, має певний ступінь ймовірності, наприклад 95%, що обумовлено самою вибіркою (sample). Ширина… … Економічний словник

    довірчий інтервал- – інтервал, у якому перебуває справжнє значення визначається величини із заданою довірчою ймовірністю. Загальна хімія: підручник / А. В. Жолнін … Хімічні терміни

    Довірчий інтервал ДІ- довірчий інтервал, ДІ * даверальний інтервал, ДІ * confidence interval інтервал значення ознаки, розрахований для к. л. параметра розподілу (напр., середнього значення ознаки) за вибіркою та з певною ймовірністю (напр., 95% для 95% … Генетика. Енциклопедичний словник

    ДОВІРНИЙ ІНТЕРВАЛ- поняття, що виникає в оцінці параметра статистич. розподілу інтервалом значень. Д. в. для параметра q, відповідний даному коеф. довіри Р, дорівнює такому інтервалу (q1, q2), що з будь-якому розподілі ймовірності нерівності… … Фізична енциклопедія

    довірчий інтервал- - Тематики електрозв'язок, основні поняття EN confidence interval ... Довідник технічного перекладача

    довірчий інтервал- pasikliovimo intervalas statusas T sritis Standartizacija ir metrologija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultato vertė. atitikmenys: англ. confidence interval vok. Vertrauensbereich, m rus. Penkiakalbis aiškinamasis metrologijos terminų žodynas

    довірчий інтервал- pasikliovimo intervalas statusas T sritis chemija apibrėžtis Dydžio verčių intervalas, kuriame su pasirinktąja tikimybe yra matavimo rezultatų vertė. atitikmenys: англ. confidence interval rus. довірча область; довірчий інтервал … Chemijos terminų aiškinamasis žodynas



Схожі статті

2024 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.