Довірчий інтервал навколо відсотка. Побудова довірчого інтервалу для математичного очікування генеральної сукупності

Довірчий інтервал– граничні значення статистичної величини, яка із заданою довірчою ймовірністю γ буде у цьому інтервалі при вибірці більшого обсягу. Позначається як P(θ - ε. На практиці вибирають довірчу ймовірність γ з досить близьких до одиниці значень γ = 0.9, γ = 0.95, γ = 0.99.

Призначення сервісу. За допомогою цього сервісу визначаються:

  • довірчий інтервал для генерального середнього; довірчий інтервал для дисперсії;
  • довірчий інтервал для середнього квадратичного відхилення; довірчий інтервал для генеральної частки;
Отримане рішення зберігається в файлі Word(Див. приклад). Нижче наведено відеоінструкцію, як заповнювати вихідні дані.

Приклад №1. У колгоспі із загального стада у 1000 голів овець вибірковій контрольній стрижці зазнали 100 овець. В результаті було встановлено середній настриг вовни 4,2 кг на одну вівцю. Визначити з ймовірністю 0,99 середню квадратичну помилку вибірки щодо середнього настригу вовни однією вівцю і межі, у яких укладена величина настрига, якщо дисперсія дорівнює 2,5 . Вибірка неповторна.
Приклад №2. З партії імпортованої продукції посаді Московської Північної митниці було взято як випадкової повторної вибірки 20 проб продукту «А». В результаті перевірки встановлено середню вологість продукту «А» у вибірці, яка дорівнювала 6 % при середньому квадратичному відхиленні 1 %.
Визначте з ймовірністю 0,683 межі середньої вологості продукту в усій партії імпортованої продукції.
Приклад №3. Опитування 36 студентів показало, що середня кількість підручників, прочитаних ними за навчальний рік, виявилося рівним 6. Вважаючи, що кількість підручників, прочитаних студентом за семестр, має нормальний закон розподілу із середнім квадратичним відхиленням, рівним 6, знайти: А) з надійністю 0,99 інтервальну оцінку для математичного очікуванняцієї випадкової величини; Б) з якою ймовірністю можна стверджувати, що середня кількість підручників, прочитаних студентом за семестр, обчислена за даною вибіркою, відхилиться від математичного очікування з абсолютної величинине більше ніж на 2.

Класифікація довірчих інтервалів

По виду оцінюваного параметра:

За типом вибірки:

  1. Довірчий інтервал для безкінечної вибірки;
  2. Довірчий інтервал для кінцевої вибірки;
Вибірка називається повторноюякщо відібраний об'єкт перед вибором наступного повертається в генеральну сукупність. Вибірка називається безповторноюякщо відібраний об'єкт у генеральну сукупність не повертається. Насправді зазвичай мають справу з безповторними вибірками.

Розрахунок середньої помилки вибірки при випадковому відборі

Розбіжність між значеннями показників, отриманих за вибіркою, та відповідними параметрами генеральної сукупності називається помилкою репрезентативності.
Позначення основних параметрів генеральної та вибіркової сукупності.
Формули середньої помилки вибірки
повторний відбірбезповторний відбір
для середньоїдля часткидля середньоїдля частки
Співвідношення між межею помилки вибірки (Δ), що гарантується з деякою ймовірністю Р(t),та середньою помилкою вибірки має вигляд: або Δ = t·μ, де t- Коефіцієнт довіри, що визначається залежно від рівня ймовірності Р(t) по таблиці інтегральної функції Лапласа.

Формули розрахунку чисельності вибірки при власне-випадковому способі відбору

Нехай у нас є велика кількістьпредметів з нормальним розподілом деяких характеристик (наприклад, повний склад однотипних овочів, розмір і вага яких варіюється). Ви хочете знати середні характеристики всієї партії товару, але у Вас немає ні часу, ні бажання вимірювати та зважувати кожен овоч. Ви розумієте, що в цьому немає потреби. Але скільки треба було б взяти на вибіркову перевірку?

Перш ніж дати кілька корисних для цієї ситуації формул нагадаємо деякі позначення.

По-перше, якби ми все-таки проміряли весь склад овочів (це безліч елементів називається генеральною сукупністю), то ми дізналися б з усією доступною нам точністю середнє значення ваги всієї партії. Назвемо це середнє значення Х ср .г він . - Генеральним середнім. Ми вже знаємо, що визначається повністю, якщо відомо його середнє значення та відхилення s . Щоправда, поки що ми ні Х ср.ген., ні s генеральної сукупності не знаємо. Ми можемо тільки взяти деяку вибірку, заміряти потрібні нам значення і порахувати для цієї вибірки як середнє значення Х порівн. виб., так і середнє квадратичне відхилення S виб.

Відомо, що якщо наша вибіркова перевірка містить велику кількість елементів (зазвичай n більше 30) і вони взяті дійсно випадковим чином, то s генеральної сукупності майже не відрізнятиметься від S виб..

Крім того, для випадку нормального розподілуми можемо користуватися такими формулами:

Імовірно 95%


Імовірно 99%



У загальному вигляді c ймовірністю Р(t)


Зв'язок значення t із значенням ймовірності Р(t), з якою ми хочемо знати довірчий інтервал, можна взяти з наступної таблиці:


Отже, ми визначили, у якому діапазоні перебуває середнє значення для генеральної сукупності (з цією ймовірністю).

Якщо ми не маємо достатньо великої вибірки, ми не можемо стверджувати, що генеральна сукупність має s = S виб. Крім того, у цьому випадку проблематична близькість вибірки до нормального розподілу. У цьому випадку також користуються S виб замість s у формулі:




але значення t для фіксованої ймовірності Р(t) залежатиме від кількості елементів у вибірці n. Чим більше n, тим ближчим буде отриманий довірчий інтервал до значення, що дається формулою (1). Значення t у разі беруться з іншої таблиці ( t-критерій Стьюдента), яку ми наводимо нижче:

Значення t-критерію Стьюдента для ймовірності 0,95 та 0,99


приклад 3.З працівників фірми випадково відібрано 30 осіб. За вибіркою виявилося, що середня зарплата (на місяць) становить 30 тис. рублів за середнього квадратичного відхилення 5 тис. рублів. Імовірно 0,99 визначити середню зарплату у фірмі.

Рішення:За умовою маємо n = 30, Х порівн. = 30000, S = 5000, Р = 0,99. Для знаходження довірчого інтервалускористаємося формулою, що відповідає критерію Стьюдента. По таблиці для n = 30 і Р = 0,99 знаходимо t = 2,756, отже,


тобто. шуканий довірчийінтервал 27484< Х ср.ген < 32516.

Отже, ймовірністю 0,99 можна стверджувати, що інтервал (27484; 32516) містить у собі середню зарплату у фірмі.

Ми сподіваємося, що Ви користуватиметеся цим методом, при цьому не обов'язково, щоб при Вас щоразу була таблиця. Підрахунки можна проводити в Excel автоматично. Перебуваючи в файлі Excel, натисніть кнопку fx у верхньому меню. Потім, виберіть серед функцій тип "статистичні", та із запропонованого переліку у віконці - СТЬЮДРАСПОБР. Потім, за підказкою, поставивши курсор у полі "імовірність", наберіть значення зворотної ймовірності (тобто в нашому випадку замість ймовірності 0,95 треба набирати ймовірність 0,05). Мабуть, електронна таблиця складена отже результат відповідає питанням, з якою ймовірністю ми можемо помилитися. Аналогічно в полі "ступінь свободи" введіть значення (n-1) для вибірки.

Довірчі інтервали.

Обчислення довірчого інтервалу виходить з середньої помилці відповідного параметра. Довірчий інтервал показує, в яких межах із ймовірністю (1-a) знаходиться справжнє значення параметра, що оцінюється. Тут a – рівень значущості (1-a) називають також довірчою ймовірністю.

У першому розділі ми показали, що, наприклад, для середнього арифметичного, справжнє середнє за сукупністю приблизно 95% випадків лежить у межах 2 середніх помилок середнього. Таким чином, межі 95% довірчого інтервалу для середнього відстоятиме від вибіркового середнього на подвійну. середню помилкусереднього, тобто. ми множимо середню помилку середнього на певний коефіцієнт, що залежить від довірчої ймовірності. Для середнього та різниці середніх береться коефіцієнт Стьюдента (критичне значення критерію Стьюдента), для частки та різниці часток критичне значення критерію z. Добуток коефіцієнта на середню помилку можна назвати граничною помилкою цього параметра, тобто. максимальну, яку ми можемо отримати при оцінці.

Довірчий інтервал для середнього арифметичного : .

Тут – вибіркове середнє;

Середня помилка середньої арифметичної;

s –вибіркове середнє квадратичне відхилення;

n

f = n-1 (Коефіцієнт Стьюдента).

Довірчий інтервал для різниці середніх арифметичних :

Тут – різниця вибіркових середніх;

- середня помилка різниці середніх арифметичних;

s 1 ,s 2 –вибіркові середні квадратичні відхилення;

n 1 ,n 2

Критичне значення критерію Стьюдента при заданому рівні значимості a та числі ступенів свободи f=n 1 +n 2-2 (Коефіцієнт Стьюдента).

Довірчий інтервал для частки :

.

Тут d – вибіркова частка;

- Середня помилка частки;

n- Обсяг вибірки (чисельність групи);

Довірчий інтервал для різниці часток :

Тут - різниця вибіркових часток;

- Середня помилка різниці середніх арифметичних;

n 1 ,n 2- Обсяги вибірок (чисельності груп);

Критичне значення критерію z за заданого рівня значущості a ( , , ).

Обчислюючи довірчі інтервали для різниці показників, ми, по-перше, безпосередньо бачимо можливі значення ефекту, а не лише його точкову оцінку. По-друге, можемо зробити висновок про прийняття чи спростування нульової гіпотези і, по-третє, можемо зробити висновок про потужність критерію.

При перевірці гіпотез за допомогою довірчих інтервалів слід дотримуватись наступного правила:

Якщо 100(1-a)-відсотковий довірчий інтервал різниці середніх немає нуля, то відмінності статистично значимі лише на рівні значимості a; навпаки, якщо цей інтервал містить нуль, то відмінності статистично значущі.

Справді, якщо цей інтервал містить нуль, то, отже, порівнюваний показник може бути як і більше, і менше у одній із груп, проти інший, тобто. спостерігаються відмінності випадкові.

За місцем, де знаходиться нуль усередині довірчого інтервалу, можна судити про потужність критерію. Якщо нуль близький до нижньої чи верхньої межі інтервалу, то можливо за більшої чисельності порівнюваних груп, відмінності досягли б статистичної значимості. Якщо нуль близький до середини інтервалу, то, отже, рівноймовірне збільшення і зменшення показника в експериментальній групі, і, ймовірно, відмінностей дійсно немає.

Приклади:

Порівняти операційну летальність при застосуванні двох різних видів анестезії: із застосуванням першого виду анестезії оперувалося 61 особа, померло 8, із застосуванням другого – 67 осіб, померло 10.

d 1 = 8/61 = 0,131; d 2 = 10/67 = 0,149; d1-d2 = - 0,018.

Різниця летальностей порівнюваних методів перебуватиме в інтервалі (-0,018 - 0,122; -0,018 + 0,122) або (-0,14; 0,104) з ймовірністю 100(1-a) = 95%. Інтервал містить нуль, тобто. гіпотезу про однакову летальність при двох різних видаханестезії відкинути не можна.

Отже, летальність може зменшиться до 14% і збільшитися до 10,4% з ймовірністю 95%, тобто. нуль знаходиться приблизно посередині інтервалу, тому можна стверджувати, що, швидше за все, дійсно не відрізняються за летальністю ці два методи.

У розглянутому прикладі порівнювався середній час натискання при теппинг-тесті в чотирьох групах студентів, що відрізняються за екзаменаційною оцінкою. Обчислимо довірчі інтервали середнього часу натискання для студентів, які склали іспит на 2 та 5 і довірчий інтервал для різниці цих середніх.

Коефіцієнти Стьюдента знаходимо за таблицями розподілу Стьюдента (див. додаток): першої групи: = t(0,05;48) = 2,011; для другої групи: = t(0,05; 61) = 2,000. Таким чином, довірчі інтервали для першої групи: = (162,19-2,011*2,18 ; 162,19+2,011*2,18) = (157,8 ; 166,6) , для другої групи (156,55- 2,000 * 1,88; 156,55 +2,000 * 1,88) = (152,8; 160,3). Отже, для тих, хто склав іспит на 2, середній час натискання лежить в межах від 157,8 мс до 166,6 мс з ймовірністю 95%, для тих, хто склав іспит на 5 - від 152,8 мс до 160,3 мс з ймовірністю 95%.

Перевіряти нульову гіпотезу можна і за довірчими інтервалами для середніх, а не лише для різниці середніх. Наприклад, як і нашому разі, якщо довірчі інтервали для середніх перекриваються, то нульову гіпотезу відкинути не можна. Для того, щоб відкинути гіпотезу на вибраному рівні значущості, відповідні довірчі інтервали не повинні перекриватися.

Знайдемо довірчий інтервал для різниці середнього часу натискання у групах, які склали іспит на 2 і 5. Різниця середніх: 162,19 – 156,55 = 5,64. Коефіцієнт Стьюдента: = t(0,05; 49 +62-2) = t (0,05; 109) = 1,982. Групові середні квадратичні відхилення дорівнюватимуть: ; . Обчислюємо середню помилку різниці середніх: . Довірчий інтервал: = (5,64-1,982 * 2,87; 5,64 +1,982 * 2,87) = (-0,044; 11,33).

Отже, різниця середнього часу натискання в групах, які склали іспит на 2 і 5, буде в інтервалі від -0,044 мс до 11,33 мс. До цього інтервалу входить нуль, тобто. Середній час натискання у добре склали іспит, може збільшитися і зменшиться проти незадовільно склали, тобто. нульову гіпотезу відкинути не можна. Але нуль знаходиться дуже близько до нижньої межі, час натискання набагато швидше все-таки зменшується у добре здали. Таким чином, можна зробити висновок, що відмінності в середньому часу натискання між тими, хто здав на 2 і на 5 все-таки є, просто ми не змогли їх виявити при даній зміні середнього часу, розкид середнього часу та обсягах вибірок.



Потужність критерію – це можливість відкинути неправильну нульову гіпотезу, тобто. знайти відмінності там, де вони є.

Потужність критерію визначається з рівня значимості, величини відмінностей між групами, розкиду значень у групах та обсягу вибірок.

Для критерію Стьюдента та дисперсійного аналізуможна користуватися діаграмами чутливості.

Потужність критерію можна використовувати при попередньому визначенні необхідної кількості груп.

Довірчий інтервал показує, у яких межах з заданою ймовірністюзнаходиться справжнє значення параметра, що оцінюється.

За допомогою довірчих інтервалів можна перевіряти статистичні гіпотези та робити висновки про чутливість критеріїв.

ЛІТЕРАТУРА.

Гланц С. - Розділ 6,7.

Реброва О.Ю. - С.112-114, с.171-173, с.234-238.

Сидоренко Є. В. – с.32-33.

Запитання для самоперевірки студентів.

1. Що таке потужність критерію?

2. У яких випадках слід оцінити потужність критеріїв?

3. Методи розрахунку потужності.

6. Як перевірити статистичну гіпотезу за допомогою довірчого інтервалу?

7. Що можна сказати про потужність критерію при розрахунку довірчого інтервалу?

Завдання.

Будь-яка вибірка дає лише наближене уявлення про генеральну сукупність, і всі вибіркові статистичні характеристики (середня, мода, дисперсія…) є деяким наближенням або говорять оцінкою генеральних параметрів, які обчислити в більшості випадків неможливо через недоступність генеральної сукупності (Малюнок 20). .

Малюнок 20. Помилка вибірки

Але можна зазначити інтервал, у якому з певною часткою ймовірності лежить справжнє (генеральне) значення статистичної характеристики. Цей інтервал називається д перевірливий інтервал (ДІ).

Так генеральне середнє значення з ймовірністю 95% лежить у межах

від до, (20)

де t - Табличне значення критерію Ст'юдента для α =0,05 та f= n-1

Може бути знайдено і 99% ДІ, у цьому випадку t вибирається для α =0,01.

Яке практичне значення має довірчий інтервал?

    Широкий довірчий інтервал показує, що середня вибіркова неточно відображає генеральну середню. Зазвичай це з недостатнім обсягом вибірки, чи з її неоднорідністю, тобто. великою дисперсією. І те, й інше дають велику помилкусереднього і, відповідно, ширший ДІ. І це є підставою повернутись на етап планування дослідження.

    Верхні та нижні межі ДІ дають оцінку, чи будуть результати клінічно значущі

Зупинимося дещо докладніше на питанні статистичної та клінічної значущості результатів дослідження групових властивостей. Згадаймо, що завдання статистики є виявлення хоч якихось відмінностей у генеральних сукупностях, спираючись на вибіркові дані. Завданням клініцистів є виявлення таких (не будь-яких) відмінностей, які допоможуть діагностиці чи лікуванню. І не завжди статистичні висновки є основою клінічних висновків. Так, статистично значуще зниження гемоглобіну на 3 г/л не є приводом для занепокоєння. І, навпаки, якщо якась проблема в організмі людини не має масового характеру на рівні всієї популяції, це не є підставою для того, щоб цією проблемою не займатися.

Це положення розглянемо на прикладі.

Дослідники поцікавилися, чи не відстають у зростанні від своїх однолітків хлопчики, які перенесли якесь інфекційне захворювання. З цією метою було проведено вибіркове дослідження, в якому взяли участь 10 хлопчиків, які перенесли хворобу. Результати представлені у таблиці 23.

Таблиця 23. Результати статообробки

нижня межа

верхня межа

Нормативи (см)

середнього

З цих розрахунків випливає, що вибіркове середнє зростання хлопчиків 10 років, які перенесли якесь інфекційне захворюванняблизький до норми (132,5 см). Проте нижня межа довірчого інтервалу (126,6 див) свідчить про наявність 95% ймовірність те, що справжнє середнє зростання цих дітей відповідає поняттю «низьке зростання», тобто. ці діти відстають у зростанні.

У цьому вся прикладі результати розрахунків довірчого інтервалу клінічно значущі.

Довірчі інтервали ( англ. Confidence Intervals) однією з типів інтервальних оцінок які у статистиці, які розраховуються для заданого рівня значимості. Вони дозволяють зробити твердження, що справжнє значення невідомого статистичного параметра генеральної сукупності перебуває у отриманому діапазоні значень із ймовірністю, що задана обраним рівнем статистичної значимості.

Нормальний розподіл

Коли відома варіація (σ 2) генеральної сукупності даних, для розрахунку довірчих меж (граничних точок довірчого інтервалу) може бути використана z-оцінка. Порівняно із застосуванням t-розподілу, використання z-оцінки дозволить побудувати не лише вужчий довірчий інтервал, а й отримати більш надійні оцінки математичного очікування та середньоквадратичного (стандартного) відхилення (σ), оскільки Z-оцінка ґрунтується на нормальному розподілі.

Формула

Для визначення граничних точок довірчого інтервалу, за умови, що відомо середньоквадратичне відхилення генеральної сукупності даних, використовується наступна формула

L = X - Z α/2 σ
√n

приклад

Припустимо, що розмір вибірки налічує 25 спостережень, математичне очікування вибірки дорівнює 15, а середньоквадратичне відхилення генеральної сукупності становить 8. Для рівня значущості = 5% Z-оцінка дорівнює Z / 2 = 1,96. У цьому випадку нижня та верхня межа довірчого інтервалу становитимуть

L = 15 – 1,96 8 = 11,864
√25
L = 15 + 1,96 8 = 18,136
√25

Таким чином, ми можемо стверджувати, що з ймовірністю 95% математичне очікування генеральної сукупності потрапить до діапазону від 11,864 до 18,136.

Методи звуження довірчого інтервалу

Припустимо, що діапазон є надто широким для цілей нашого дослідження. Зменшити діапазон довірчого інтервалу можна двома способами.

  1. Зменшити рівень статистичної значущості α.
  2. Збільшити обсяг вибірки.

Зменшивши рівень статистичної значущості до α=10%, ми отримаємо Z-оцінку рівну Z α/2 =1,64. У цьому випадку нижня та верхня межа інтервалу становитимуть

L = 15 – 1,64 8 = 12,376
√25
L = 15 + 1,64 8 = 17,624
√25

А сам довірчий інтервал може бути записаний у вигляді

У цьому випадку ми можемо зробити припущення, що з ймовірністю 90% математичне очікування генеральної сукупності потрапить у діапазон .

Якщо хочемо не знижувати рівень статистичної значимості α, то єдиною альтернативою залишається збільшення обсягу вибірки. Збільшивши її до 144 спостережень, отримаємо такі значення довірчих меж

L = 15 – 1,96 8 = 13,693
√144
L = 15 + 1,96 8 = 16,307
√144

Сам довірчий інтервал матиме такий вигляд

Таким чином, звуження довірчого інтервалу без зниження рівня статистичної значимості можливе лише за рахунок збільшення обсягу вибірки. Якщо збільшення обсягу вибірки неможливо, то звуження довірчого інтервалу може досягатися виключно з допомогою зниження рівня статистичної значимості.

Побудова довірчого інтервалу при розподілі відмінному від нормального

У разі якщо середньоквадратичне відхиленняГенеральної сукупності не відоме чи розподіл відмінно від нормального, для побудови довірчого інтервалу використовується t-розподіл. Ця методика є більш консервативною, що виявляється у ширших довірчих інтервалах, порівняно з методикою, що базується на Z-оцінці.

Формула

Для розрахунку нижньої та верхньої межі довірчого інтервалу на підставі t-розподілу застосовуються наступні формули

L = X - t α σ
√n

Розподіл Стьюдента або t-розподіл залежить тільки від одного параметра – кількості ступенів свободи, яка дорівнює кількості індивідуальних значень ознаки (кількість спостережень у вибірці). Значення t-критерію Стьюдента для заданої кількості ступенів свободи (n) та рівня статистичної значущості α можна дізнатися з довідкових таблиць.

приклад

Припустимо, що розмір вибірки становить 25 індивідуальних значень, математичне очікування вибірки дорівнює 50, а середньоквадратичне відхилення вибірки дорівнює 28. Необхідно побудувати довірчий інтервал рівня статистичної значимості α=5%.

У нашому випадку кількість ступенів свободи дорівнює 24 (25-1), отже відповідне табличне значення t-критерію Стьюдента рівня статистичної значимості α=5% становить 2,064. Отже, нижня та верхня межа довірчого інтервалу становитимуть

L = 50 – 2,064 28 = 38,442
√25
L = 50 + 2,064 28 = 61,558
√25

А сам інтервал може бути записаний у вигляді

Таким чином, ми можемо стверджувати, що з ймовірністю 95% математичне очікування генеральної сукупності опиниться в діапазоні .

Використання t-розподілу дозволяє звузити довірчий інтервал за рахунок зниження статистичної значимості, або за рахунок збільшення розміру вибірки.

Зменшивши статистичну значущість з 95% до 90% в умовах нашого прикладу, ми отримаємо відповідне табличне значення t-критерію Стьюдента 1,711.

L = 50 – 1,711 28 = 40,418
√25
L = 50 + 1,711 28 = 59,582
√25

І тут ми можемо стверджувати, що з ймовірністю 90% математичне очікування генеральної сукупності опиниться у діапазоні .

Якщо ми не хочемо знижувати статистичну значущість, то єдиною альтернативою буде збільшення обсягу вибірки. Припустимо, що він становить 64 індивідуальні спостереження, а не 25 як у початковій умові прикладу. Табличне значення t-критерію Стьюдента для 63 ступенів свободи (64-1) та рівня статистичної значущості α=5% становить 1,998.

L = 50 – 1,998 28 = 43,007
√64
L = 50 + 1,998 28 = 56,993
√64

Це дає можливість стверджувати, що з ймовірністю 95% математичне очікування генеральної сукупності опиниться в діапазоні .

Вибірки великого обсягу

До вибірок великого обсягу відносяться вибірки з генеральної сукупності даних, кількість індивідуальних спостережень у яких перевищує 100. Статистичні дослідження показали, що вибірки більшого обсягу мають тенденцію бути нормально розподіленими, навіть якщо розподіл генеральної сукупності відрізняється від нормального. Крім того, для таких вибірок застосування z-оцінки та t-розподілу дають приблизно однакові результати при побудові довірчих інтервалів. Таким чином, для вибірок великого обсягу допускається застосування z-оцінки для нормального розподілу замість t-розподілу.

Підведемо підсумки

Схожі статті

2023 parki48.ru. Будуємо каркасний будинок. Ландшафтний дизайн. Будівництво. Фундамент.