Що таке статистичне значення. Основні терміни та поняття медичної статистики

Рівень значимості у статистиці є важливим показником, Що відбиває ступінь впевненості в точності, істинності отриманих (прогнозованих) даних. Поняття широко застосовується в різних сферах: від проведення соціологічних досліджень, до статистичного тестування наукових гіпотез

Визначення

Рівень статистичної значущості (або статистично значущий результат) показує, якою є ймовірність випадкового виникнення досліджуваних показників. Загальна статистична значущість явища виражається коефіцієнтом р-value (p-рівень). У будь-якому експерименті чи спостереженні існує ймовірність, що отримані дані виникли через помилки вибірки. Особливо це актуально для соціології.

Тобто статистично значимої є величина, чия ймовірність випадкового виникнення вкрай мала чи прагне крайності. Крайністю у цьому контексті вважають ступінь відхилення статистики від нуль-гіпотези (гіпотези, яку перевіряють на узгодженість із отриманими вибірковими даними). У науковій практиці рівень значущості вибирається перед збиранням даних, як правило, його коефіцієнт становить 0,05 (5 %). Для систем, де дуже важливі точні значення, цей показник може становити 0,01 (1%) та менше.

Історія питання

Поняття рівня значимості було запроваджено британським статистиком і генетиком Рональдом Фішером 1925 року, що він розробляв методику перевірки статистичних гіпотез. При аналізі будь-якого процесу існує певна можливість тих чи інших явищ. Проблеми з'являються під час роботи з невеликими (чи очевидними) відсотками ймовірностей, які під поняття «похибка вимірів».

Працюючи зі статистичними даними, недостатньо конкретними, щоб їх перевірити, вчені стикалися з проблемою нульової гіпотези, яка «заважає» оперувати малими величинами. Фішер запропонував для таких систем визначити ймовірність подій у 5% (0,05) як зручний вибірковий зріз, що дозволяє відхилити нуль-гіпотезу при розрахунках.

Введення фіксованого коефіцієнта

У 1933 році вчені ЄжиНейман та Егон Пірсон у своїх роботах рекомендували заздалегідь (до збору даних) встановлювати певний рівень значущості. Приклади використання цих правил добре помітні під час проведення виборів. Припустимо, є два кандидати, один із яких дуже популярний, а другий – маловідомий. Очевидно, що перший кандидат вибори виграє, а шанси другого прагнуть нуля. Прагнуть - але не рівні: завжди є ймовірність форс-мажорних обставин, сенсаційної інформації, несподіваних рішень, які можуть змінити прогнозовані результати виборів.

Нейман і Пірсон погодилися, що запропонований Фішером рівень значущості 0,05 (який позначається символом α) найбільш зручний. Проте сам Фішер у 1956 році виступив проти фіксації цього значення. Він вважав, що рівень α має встановлюватись відповідно до конкретних обставин. Наприклад, у фізиці частинок він становить 0,01.

Значення p-рівня

Термін р-value вперше використаний у роботах Браунлі у 1960 році. P-рівень (p-значення) є показником, який знаходиться у зворотній залежності від істинності результатів. Найвищий коефіцієнт р-value відповідає найменшому рівню довіри до проведеної вибірки залежності між змінними.

Це значення відображає ймовірність помилок, пов'язаних з інтерпретацією результатів. Припустимо, p-рівень = 0,05 (1/20). Він показує п'ятивідсоткову ймовірність того, що знайдений у вибірці зв'язок між змінними – лише випадкова особливість проведеної вибірки. Тобто, якщо ця залежність відсутня, то при багаторазових подібних експериментах у середньому в кожному двадцятому дослідженні очікується така вже або більша залежність між змінними. Часто p-рівень розглядається як «допустима межа» рівня помилок.

До речі, р-value може не відображати реальну залежністьміж змінними, лише показує якесь середнє значення не більше припущень. Зокрема, остаточний аналіз даних також залежатиме від обраних значень даного коефіцієнта. При p-рівні = 0,05 будуть одні результати, а при коефіцієнті, що дорівнює 0,01, інші.

Перевірка статистичних гіпотез

Рівень статистичної значущості особливо важливий при перевірці гіпотез, що висуваються. Наприклад, при розрахунках двостороннього тесту область відторгнення розділяють порівну на обох кінцях вибіркового розподілу (щодо нульової координати) і обчислюють істинність даних.

Припустимо, при моніторингу якогось процесу (яви) з'ясувалося, що нова статистична інформація свідчить про невеликі зміни щодо попередніх значень. У цьому розбіжності у результатах малі, не очевидні, але важливі дослідження. Перед фахівцем постає дилема: зміни реально відбуваються, чи це помилки вибірки (неточність вимірів)?

У цьому випадку застосовують або відкидають нульову гіпотезу (списують все на похибку, або визнають зміну системи як факт, що відбувся). Процес розв'язання задачі базується на співвідношенні загальної статистичної значущості (р-value) та рівня значущості (α). Якщо р-рівень< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

Використовувані значення

Рівень значущості залежить від аналізованого матеріалу. На практиці використовують такі фіксовані значення:

α = 0,1 (або 10%);
α = 0,05 (або 5%);
α = 0,01 (або 1%);
α = 0,001 (або 0,1%).

Чим більш точними потрібні розрахунки, тим менший коефіцієнт використовується. Природно, що статистичні прогнози у фізиці, хімії, фармацевтиці, генетиці потребують більшої точності, ніж у політології, соціології.

Пороги значимості у конкретних областях

У високоточних областях, таких як фізика частинок та виробнича діяльність, статистична значущість часто виражається як співвідношення середньоквадратичного відхилення (позначається коефіцієнтом сигма – σ) щодо нормального розподілуймовірностей (розподіл Гауса). σ – це статистичний показник, що визначає розсіювання значень певної величини щодо математичних очікувань. Використовується для складання графіків ймовірності подій.

Залежно від галузі знань, коефіцієнт σ сильно відрізняється. Наприклад, при прогнозуванні існування бозона Хіггса параметр дорівнює п'яти (σ=5), що відповідає значенню р-value=1/3,5 млн. При дослідженнях геномів рівень значущості може становити 5×10 -8 , що не є рідкістю для цієї області.

Ефективність

Необхідно враховувати, що коефіцієнти і р-value не є точними характеристиками. Яким би не був рівень значущості у статистиці досліджуваного явища, він не є безумовною основою для прийняття гіпотези. Наприклад, чим менше значенняα, тим більший шанс, що встановлювана гіпотеза є значущою. Проте існує ризик помилитися, що зменшує статистичну потужність (значущість) дослідження.

Дослідники, які зациклюються виключно на статистично значимих результатах, можуть одержати хибні висновки. При цьому перевіряти ще раз їх роботу важко, тому що ними застосовуються припущення (якими фактично і є значення α і р-value). Тому рекомендується завжди, поряд із обчисленням статистичної значущості, визначати інший показник – величину статистичного ефекту. Величина ефекту – це кількісна міра сили ефекту.

Дослідження зазвичай починається з деякого припущення, що вимагає перевірки із залученням фактів. Це припущення - гіпотеза - формулюється щодо зв'язку явищ або властивостей в деякій сукупності об'єктів.

Для перевірки подібних припущень на фактах необхідно виміряти відповідні властивості їх носіїв. Але неможливо виміряти тривожність у всіх жінок і чоловіків, як неможливо виміряти агресивність у всіх підлітків. Тому під час проведення дослідження обмежуються лише відносно невеликою групою представників відповідних сукупностей людей.

Генеральна сукупність- Це все безліч об'єктів, щодо якого формулюється дослідницька гіпотеза.

Наприклад, усі чоловіки; чи всі жінки; або всі мешканці будь-якого міста. Генеральні сукупності, стосовно яких дослідник збирається зробити висновки за результатами дослідження, можуть бути за чисельністю і більш скромними, наприклад, всі першокласники даної школи.

Таким чином, генеральна сукупність - це хоча і не нескінченне за чисельністю, але, як правило, недоступне для суцільного дослідження безліч потенційних піддослідних.

Вибірка чи вибіркова сукупність— це обмежена за чисельністю група об'єктів (у психології — випробуваних, респондентів), яка спеціально відбирається з генеральної сукупностівивчення її властивостей. Відповідно, вивчення на вибірці властивостей генеральної сукупності називається вибірковим дослідженням. Практично все психологічні дослідженняє вибірковими, які висновки поширюються на генеральні сукупності.

Таким чином, після того, як сформульована гіпотеза і визначені відповідні генеральні сукупності, перед дослідником виникає проблема організації вибірки. Вибірка має бути такою, щоб було обґрунтовано генералізацію висновків вибіркового дослідження — узагальнення, поширення їх на генеральну сукупність. Основні критерії обгрунтованості висновків дослідження— це репрезентативність вибірки та статистична достовірність (емпіричних) результатів.

Репрезентативність вибірки— іншими словами, її представництво — це здатність вибірки представляти явища, що вивчаються, досить повно — з точки зору їх мінливості в генеральній сукупності.

Звичайно, повне уявлення про явище, що вивчається, у всьому його діапа-зоні і нюансах мінливості, може дати тільки генеральна сукупність. Тому репрезентативність завжди обмежена тією мірою, якою обмежена вибірка. І саме репрезентативність вибірки є основним критерієм при визначенні меж генералізації висновків дослідження. Тим не менш, існують прийоми, що дозволяють отримати достатню для дослідника репрезентативність вибірки (Ці прийоми вивчаються в курсі «Експериментальна психологія»).

Перший та основний прийом – це простий випадковий (рандомізований) відбір. Він передбачає забезпечення таких умов, щоб кожен член генеральної сукупності мав рівні з іншими шанси потрапити у вибірку. Випадковий відбір забезпечує можливість потрапляння у вибірку найрізноманітніших представників генеральної сукупності. При цьому вживаються спеціальні заходи, що виключають появу будь-якої закономірності при відборі. І це дозволяє сподіватися на те, що в кінцевому підсумку у вибірці досліджувана властивість буде представлена якщо і не в усьому, то в максимально можливому його різноманітті.

Другий спосіб забезпечення репрезентативності - це стратифікований випадковий відбір, або відбір за властивостями генеральної сукупності. Він передбачає попереднє визначення тих якостей, які можуть впливати на мінливість досліджуваної властивості (це може бути стать, рівень доходу або освіти і т. д.). Потім визначається відсоткове співвідношення чисельності розрізняються за цими якостями груп (страт) в генеральній сукупності і забезпечується ідентичне відсоткове співвідношення відповідних груп у вибірці. Далі в кожну підгрупу вибірки випробувані підбираються за принципом простого випадкового відбору.

Статистична достовірністьабо статистична значимість, результатів дослідження визначається за допомогою методів статистичного виводу.

Чи ми застраховані від прийняття помилок при прийнятті рішень, при тих чи інших висновках з результатів дослідження? Звичайно, ні. Адже наші рішення спираються на результати дослідження вибіркової сукупності, а також рівень наших психологічних знань. Цілком ми не застраховані від помилок. У статистиці такі помилки вважаються допустимими, якщо вони мають місце не частіше ніж в одному випадку з 1000 (імовірність помилки α=0,001 або пов'язана з цим величина довірча ймовірністьправильного виведення р = 0,999); в одному випадку зі 100 (імовірність помилки α=0,01 або пов'язана з цим величина довірча вірогідність правильного виведення р=0,99) або в п'яти випадках зі 100 (імовірність помилки α=0,05 або пов'язана з цим величина довірча ймовірність правильного виведення р = 0,95). Саме на двох останніх рівнях і прийнято ухвалювати рішення у психології.

Іноді, говорячи про статистичної достовірностівикористовують поняття «рівень значущості» (позначається як α). Чисельні значення р і α доповнюють один одного до 1,000 - повний набір подій: або ми зробили правильний висновок, або ми помилилися. Ці рівні не розраховуються, вони поставлені. Рівень значущості можна розуміти як «червону» лінію», перетин якої дозволить говорити про дану подію як про невипадкову. У кожному грамотному науковому звіті чи публікації зроблені висновки мають супроводжуватися зазначенням значень р або α, у яких зроблено висновки.

Методи статистичного висновку докладно розглядаються у курсі « Математична статистика». Зараз лише зазначимо, що вони висувають певні вимоги до чисельності, або обсягу вибірки.

На жаль, строгих рекомендацій щодо попереднього визначення необхідного обсягу вибірки не існує. Більше того, відповідь на питання про необхідну і достатню її чисельність дослідник зазвичай отримує надто пізно — тільки після аналізу даних вже обстеженої вибірки. Проте, можна сформулювати найзагальніші рекомендації:

1. Найбільший обсяг вибірки необхідний при розробці діагностичної методики - від 200 до 1000-2500 осіб.

2. Якщо необхідно порівнювати 2 вибірки, їхня загальна чисельність повинна бути не менше 50 осіб; чисельність порівнюваних вибірок має бути приблизно однаковою.

3. Якщо вивчається взаємозв'язок між будь-якими властивостями, то обсяг вибірки має бути не менше 30-35 осіб.

4. Чим більше мінливістьдосліджуваної властивості , тим більше має бути обсяг вибірки. Тому мінливість можна зменшити, збільшуючи однорідність вибірки, наприклад, за статтю, віком тощо. буд. У цьому, природно, зменшуються можливості генералізації висновків.

Залежні та незалежні вибірки.Звичайна ситуація дослідження, коли дослідника, що цікавить, властивість вивчається на двох або більше вибірках з метою їх подальшого порівняння. Ці вибірки можуть бути у різних співвідношеннях — залежно від процедури їх організації. Незалежні вибірки характеризуються тим, що ймовірність відбору будь-якого випробуваного однієї вибірки не залежить від відбору будь-якого з випробуваних іншої вибірки. Навпаки, залежні вибіркихарактеризуються тим, що кожному випробуваному однієї вибірки поставлено у відповідність до певному критеріювипробуваний з іншої вибірки.

У загальному випадкузалежні вибірки припускають попарний підбір досліджуваних у порівнювані вибірки, а незалежні вибірки - незалежний відбір піддослідних.

Слід зазначити, що випадки «частково залежних» (або «частково незалежних») вибірок неприпустимі: це непередбачуваним чином порушує їхню репрезентативність.

На закінчення відзначимо, що можна виділити дві парадигми психологічного дослідження.

Так звана R-методологіяпередбачає вивчення мінливості деякої якості (психологічного) під впливом деякого впливу, чинника чи іншого характеристики. Вибіркою є безліч піддослідних.

Інший підхід, Q-методологія,передбачає дослідження мінливості суб'єкта (одиничного) під впливом різних стимулів (умов, ситуацій і т. д.). Їй відповідає ситуація, коли вибіркою є безліч стимулів.

Сьогодні це дійсно занадто просто: ви можете підійти до комп'ютера і практично без знання того, що ви робите, створювати розумне і нісенітницю з воістину дивовижною швидкістю. (Дж. Бокс)

Основні терміни та поняття медичної статистики

У цій статті ми наведемо деякі ключові поняття статистики, які є актуальними при проведенні медичних досліджень. Докладніше терміни розбираються у відповідних статтях.

Варіація

Визначення.Ступінь розсіювання даних (значень ознаки) по області значень

Ймовірність

Визначення. Імовірність (probability) - ступінь можливості прояву будь-якої певної події в тих чи інших умовах.

приклад. Пояснимо визначення терміна на пропозиції «Вірогідність одужання при застосуванні лікарського препаратуАрімідекс дорівнює 70%». Подією є «видужання хворого», умовою «хворий приймає Арімідекс», ступенем можливості - 70% (грубо кажучи, зі 100 осіб, які приймають Арімідекс, одужують 70).

Кумулятивна ймовірність

Визначення.Кумулятивна ймовірність виживання (Cumulative Probability of surviving) в момент часу t - це те саме, що частка пацієнтів, що вижили, до цього моменту часу.

приклад. Якщо говориться, що кумулятивна ймовірність виживання після проведення п'ятирічного курсу лікування дорівнює 0.7, то це означає, що з групи пацієнтів, що розглядається, в живих залишилося 70% від початкової кількості, а 30% померло. Іншими словами, з кожної сотні людей 30 померли протягом перших 5 років.

Час до події

Визначення.Час до події - це час, виражений у деяких одиницях, що минув з початкового моменту часу до настання деякої події.

Пояснення. Як одиниці часу в медичних дослідженнях виступають дні, місяці та роки.

Типові приклади початкових моментів часу:

початок спостереження за пацієнтом

проведення хірургічного лікування

Типові приклади подій, що розглядаються:

прогресування хвороби

виникнення рецидиву

смерть пацієнта

Вибірка

Визначення.Частина популяції, одержана шляхом відбору.

За результатами аналізу вибірки роблять висновки про всю популяцію, що правомірно лише у разі, якщо відбір був випадковим. Оскільки випадковий відбір із популяції здійснити практично неможливо, слід прагнути до того, щоб вибірка була, принаймні, репрезентативна стосовно популяції.

Залежні та незалежні вибірки

Визначення.Вибірки, у яких об'єкти дослідження набиралися незалежно друг від друга. Альтернатива незалежним вибіркам – залежні (зв'язкові, парні) вибірки.

Гіпотеза

Двостороння та одностороння гіпотези

Спочатку пояснимо застосування терміна гіпотезу у статистиці.

Мета більшості досліджень – перевірка істинності деякого твердження. Метою тестування лікарських препараторів найчастіше є перевірка гіпотези, що одні ліки ефективніші за інші (наприклад, Арімідекс ефективніший за Тамоксифен).

Для переказу строгості дослідження, твердження, що перевіряється, виражають математично. Наприклад, якщо А - це кількість років, що проживе пацієнт, який приймає Арімідекс, а Т - це кількість років, що проживе пацієнт, який приймає Тамоксифен, то гіпотезу, що перевіряється, можна записати як А>Т.

Визначення.Гіпотеза називається двосторонньою (2-sided), якщо вона полягає у рівності двох величин.

Приклад двосторонньої гіпотези: A=T.

Визначення. Гіпотеза називається односторонньою (1-sided), якщо вона полягає у нерівності двох величин.

Приклади односторонніх гіпотез:

Дихотомічні (бінарні) дані

Визначення.Дані, що виражаються лише двома допустимими альтернативними значеннями

Приклад: Пацієнт «здоровий» - «хворий». Набряк "є" - "ні".

Довірчий інтервал

Визначення.Довірчий інтервал (confidence interval) для деякої величини - це діапазон навколо значення величини, в якому знаходиться дійсне значення цієї величини (з певним рівнем довіри).

приклад. Нехай досліджуваною величиною є кількість пацієнтів на рік. У середньому їх кількість дорівнює 500, а 95% - довірчий інтервал- (350, 900). Це означає, що, швидше за все (з ймовірністю 95%), протягом року в клініку звернуться щонайменше 350 і більше 900 людина.

Позначення. Найчастіше використовуються скорочення: ДІ 95% (CI 95%) – це довірчий інтервал із рівнем довіри 95%.

Достовірність, статистична значимість (P – рівень)

Визначення. Статистична значимістьрезультату - це міра впевненості у його "істинності".

Будь-яке дослідження проходить з урахуванням лише частини об'єктів. Дослідження ефективності лікарського препарату проводиться на основі не взагалі всіх хворих на планеті, а лише певної групи пацієнтів (провести аналіз на основі всіх хворих просто неможливо).

Припустимо, що в результаті аналізу було зроблено деякий висновок (наприклад, використання як адекватну терапію препарату Арімідекс в 2 рази ефективніше, ніж препарат Тамоксифен).

Питання, яке необхідно при цьому ставити: "Наскільки можна довіряти цьому результату?"

Уявіть, що ми проводили дослідження на основі двох пацієнтів. Звичайно ж, у цьому випадку до результатів потрібно ставитись з побоюванням. Якщо ж було обстежено велику кількість хворих (чисельне значення « великої кількості»залежить від ситуації), то зробленим висновкам вже можна довіряти.

Так ось, ступінь довіри визначається значенням p-рівня (p-value).

p align="justify"> Більш високий p-рівень відповідає більш низькому рівню довіри до результатів, отриманих при аналізі вибірки. Наприклад, p-рівень, що дорівнює 0.05 (5%) показує, що зроблений при аналізі деякої групи висновок є лише випадковою особливістю цих об'єктів з ймовірністю лише 5%.

Інакше кажучи, дуже ймовірно (95%) висновок можна поширити попри всі об'єкти.

У багатьох дослідженнях 5% сприймається як прийнятне значення p-уровня. Це означає, що й, наприклад, p= 0.01, то результатам довіряти можна, і якщо p=0.06, то нельзя.

Дослідження

Проспективне дослідження- це дослідження, у якому вибірки виділяються з урахуванням вихідного чинника, а вибірках аналізується деякий результуючий чинник.

Ретроспективне дослідження- це дослідження, у якому вибірки виділяються з урахуванням результуючого чинника, а вибірках аналізується деякий вихідний чинник.

приклад. Вихідний фактор - вагітна жінка молодша/старша 20 років. Результуючий фактор - дитина легша/важча 2,5 кг. Аналізуємо, чи залежить вага дитини від віку матері.

Якщо ми набираємо 2 вибірки, в одній - матері віком до 20 років, в іншій - старше, а потім аналізуємо масу дітей у кожній групі, то це проспективне дослідження.

Якщо ми набираємо 2 вибірки, в одній – матері, що народили дітей легше 2,5 кг, в іншій – важче, а потім аналізуємо вік матерів у кожній групі, то це ретроспективне дослідження (природно, таке дослідження можна провести, тільки коли досвід закінчено, тобто всі діти народилися).

Вихід

Визначення.Клінічно значуще явище, лабораторний показник чи ознака, що є об'єктом інтересу дослідника. При проведенні клінічних випробувань результати є критеріями оцінки ефективності лікувального або профілактичного впливу.

Клінічна епідеміологія

Визначення.Наука, що дозволяє здійснювати прогнозування того чи іншого результату для кожного конкретного хворого на підставі вивчення клінічного перебігу хвороби в аналогічних випадках із використанням суворих наукових методіввивчення хворих задля забезпечення точності прогнозів.

Когорта

Визначення.Група учасників дослідження, об'єднаних будь-яким загальною ознакоюу момент її формування та досліджуваних протягом тривалого періоду часу.

Контроль

Контроль історичний

Визначення.Контрольна група, сформована та обстежена в період, що передує дослідженню.

Контроль паралельний

Визначення.Контрольна група, що формується одночасно з формуванням основної групи.

Кореляція

Визначення.Статистичний зв'язок двох ознак (кількісних або порядкових), що показує, що більшому значенню однієї ознаки у певній частині випадків відповідає більше – у разі позитивної (прямої) кореляції – значення іншої ознаки або менше значення – у разі негативної (зворотної) кореляції.

приклад. Між рівнем тромбоцитів та лейкоцитів у крові пацієнта виявлено значну кореляцію. Коефіцієнт кореляції дорівнює 0,76.

Коефіцієнт ризику (КР)

Визначення. p align="justify"> Коефіцієнт ризику (hazard ratio) - це відношення ймовірності настання деякої («нехорошої») події для першої групи об'єктів до ймовірності настання цієї ж події для другої групи об'єктів.

приклад. Якщо ймовірність появи раку легень у некурців дорівнює 20%, а у курців - 100%, то КР дорівнюватиме одній п'ятій. У цьому прикладі першою групою об'єктів є люди, що не палять, другою групою - курці, а в якості «нехорошої» події розглядається виникнення раку легенів.

Очевидно, що:

1) якщо КР=1, то ймовірність настання події у групах однакова

2) якщо КР>1, то подія частіше відбувається з об'єктами з першої групи, ніж із другої

3) якщо КР<1, то событие чаще происходит с объектами из второй группы, чем из первой

Мета-аналіз

Визначення. Зтатистичний аналіз, що узагальнює результати кількох досліджень, що досліджують одну й ту саму проблему (зазвичай ефективність методів лікування, профілактики, діагностики). Об'єднання досліджень забезпечує велику вибірку для аналізу та більшу статистичну потужність об'єднаних досліджень. Використовується підвищення доказовості чи впевненості у висновку про ефективність досліджуваного методу.

Метод Каплана - Мейєра (Множинні оцінки Каплана - Мейєра)

Цей метод придумали статистиками Е.Л.Капланом і Полем Мейером.

Метод використовується для обчислення різних величин, пов'язаних із часом спостереження за пацієнтом. Приклади таких величин:

ймовірність одужання протягом одного року при застосуванні лікарського препарату

шанс виникнення рецидиву після операції на протязі трьох років після операції

кумулятивна ймовірність виживання протягом п'яти років серед пацієнтів із раком простати при ампутації органу

Пояснимо переваги використання методу Каплана – Мейєра.

Значення величин при «звичайному» аналізі (що не використовує метод Каплана-Мейєра) розраховуються на основі розбиття тимчасового інтервалу, що розглядається, на проміжки.

Наприклад, якщо ми досліджуємо ймовірність смерті пацієнта протягом 5 років, то часовий інтервал може бути поділений як на 5 частин (менше 1 року, 1-2 роки, 2-3 роки, 3-4 роки, 4-5 років), так та на 10 (по півроку кожен), або на іншу кількість інтервалів. Результати ж за різних розбиття вийдуть різні.

Вибір найбільш відповідного розбиття - складне завдання.

Оцінки значень величин, отриманих методом Каплана- Мейера не залежить від розбиття часу спостереження на інтервали, а залежить тільки від часу життя кожного окремого пацієнта.

Тому досліднику простіше проводити аналіз, та й результати нерідко виявляються якіснішими за результати «звичайного» аналізу.

Крива Каплана-Мейєра (Kaplan - Meier curve)-це графік кривої виживання, отриманої за методом Каплана-Мейєра.

Модель Коксу

Ця модель була придумана сером Девідом Роксбі Коксом (р.1924), відомим англійським статистиком, автором понад 300 статей та книг.

Модель Кокса використовується у ситуаціях, коли досліджувані під час аналізу виживання величини залежить від функцій часу. Наприклад, ймовірність виникнення рецидиву через t років (t=1,2,…) може залежати від логарифму часу log(t).

Важливою перевагою методу, запропонованого Коксом, є застосування цього методу у великій кількості ситуацій (модель не накладає жорстких обмежень на природу або форму розподілу ймовірностей).

На основі моделі Коксу можна проводити аналіз (званий аналізом Коксу (Cox analysis)), результатом проведення якого є значення коефіцієнта ризику та довірчого інтервалу для коефіцієнта ризику.

Непараметричні методи статистики

Визначення.Клас статистичних методів, що використовуються головним чином для аналізу кількісних даних, що не утворюють нормальний розподіл, а також для аналізу якісних даних.

приклад. Для виявлення значущості відмінностей тиску систоли пацієнтів залежно від типу лікування скористаємося непараметричним критерієм Манна-Уітні.

Ознака (змінна)

Визначення. Характеристика об'єкта дослідження (спостереження) Розрізняють якісні та кількісні ознаки.

Рандомізація

Визначення.Спосіб випадкового розподілу об'єктів дослідження в основну та контрольну групи з використанням спеціальних засобів (таблиць або лічильника випадкових чисел, підкидання монети та інших способів випадкового призначення номера групи, що включається спостереженню). За допомогою рандомізації зводяться до мінімуму відмінності між групами за відомими і невідомими ознаками, що потенційно впливають на результат, що вивчається.

Ризик

Атрибутивний- додатковий ризик виникнення несприятливого результату (наприклад, захворювання) у зв'язку з наявністю певної характеристики (фактору ризику) об'єкта дослідження. Це частина ризику розвитку хвороби, яка пов'язана з цим фактором ризику, пояснюється ним і може бути усунена, якщо цей фактор ризику усунути.

Відносний ризик- Відношення ризику виникнення несприятливого стану в одній групі до ризику цього стану в іншій групі. Використовується у проспективних та спостережних дослідженнях, коли групи формуються заздалегідь, а виникнення досліджуваного стану ще не відбулося.

Ковзаючий іспит

Визначення.Метод перевірки стійкості, надійності, працездатності (валідності) статистичної моделі шляхом почергового видалення спостережень та перерахунку моделі. Чим подібніші отримані моделі, тим стійкіша, надійніша модель.

Подія

Визначення.Клінічний результат, що спостерігається у дослідженні, наприклад виникнення ускладнення, рецидиву, настання одужання, смерті.

Стратифікація

Визначення. Метод формування вибірки, у якому сукупність всіх учасників, відповідних критеріям включення до дослідження, спочатку поділяється на групи (страти) з урахуванням однієї чи кількох характеристик (зазвичай статі, віку), потенційно які впливають досліджуваний результат, та був із кожної із цих груп ( страт) незалежно проводиться набір учасників до експериментальної та контрольної групи. Це дозволяє досліднику дотримуватися балансу важливих характеристик між експериментальною та контрольною групами.

Таблиця сполученості

Визначення.Таблиця абсолютних частот (кількості) спостережень, стовпці якої відповідають значенням однієї ознаки, а рядки - значенням іншої ознаки (у разі двовимірної таблиці сполученості). Значення абсолютних частот розташовуються у клітинах на перетині рядів та колонок.

Наведемо приклад таблиці спряженості. Операцію на аневризмі було зроблено 194 пацієнтам. Відомий показник виразності набряку у пацієнтів перед операцією.

Набряк\ Вихід
немає набряку	20	6	26
помірний набряк	27	15	42
виражений набряк	8	21	29
m j	55	42	194

Таким чином, із 26 пацієнтів, які не мають набряку, після операції вижило 20 пацієнтів, померло – 6 пацієнтів. З 42 пацієнтів, які мають помірний набряк, вижило 27 пацієнтів, померло - 15 і т.д.

Критерій хі-квадрат для таблиць сполученості

Для визначення значущості (достовірності) відмінностей однієї ознаки в залежності від іншої (наприклад, результату операції в залежності від вираженості набряку) застосовується критерій хі-квадрат для таблиць сполученості:

Шанс

Нехай ймовірність деякої події дорівнює p. Тоді ймовірність того, що подія не відбудеться, дорівнює 1-p.

Наприклад, якщо ймовірність того, що хворий залишиться живим через п'ять років дорівнює 0.8 (80%), то ймовірність того, що він за цей часовий проміжок помре дорівнює 0.2 (20%).

Визначення.Шанс – це відношення ймовірності того, що події відбудеться до ймовірності того, що подія не станеться.

приклад. У прикладі (про хворого) шанс дорівнює 4, оскільки 0.8/0.2=4

Таким чином, ймовірність одужання в 4 рази більша за ймовірність смерті.

Інтерпретація значення величини.

1) Якщо Шанс = 1, то ймовірність настання події дорівнює ймовірності того, що подія не відбудеться;

2) якщо Шанс >1, то ймовірність настання події більша за ймовірність того, що подія не відбудеться;

3) якщо Шанс<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

Відношення шансів

Визначення.Відношення шансів (odds ratio) - це відношення шансів першої групи об'єктів до відношення шансів другої групи об'єктів.

приклад. Допустимо, що деяке лікування проходять і чоловіки, і жінки.

Імовірність того, що хворий чоловічої статі залишиться живим через п'ять років дорівнює 0.6 (60%); ймовірність того, що він за цей часовий проміжок помре дорівнює 0.4 (40%).

Аналогічні ймовірності для жінок дорівнюють 0.8 та 0.2.

Відношення шансів у цьому прикладі рівне

Інтерпретація значення величини.

1) Якщо відношення шансів = 1, то шанс для першої групи дорівнює шансу для другої групи

2) Якщо відношення шансів >1, то шанс для першої групи більший за шанс для другої групи

3) Якщо ставлення шансів<1, то шанс для первой группы меньше шанса для второй группы

Статистика давно вже стала невід'ємною частиною життя. З нею люди стикаються усюди. На основі статистики робляться висновки про те, де і які захворювання поширені, що більш затребуване у конкретному регіоні чи серед певного прошарку населення. На ґрунтуються навіть побудови політичних програм кандидатів до органів влади. Ними ж користуються і торговельні мережі при закупівлі товарів, а виробники керуються цими даними у пропозиціях.

Статистика відіграє важливу роль у житті суспільства та впливає на кожного його окремого члена навіть у дрібницях. Наприклад, якщо більшість людей воліють темні кольори в одязі в конкретному місті або регіоні, то знайти яскравий жовтий плащ з квітковим принтом в місцевих торгових точках буде вкрай важко. Але з яких величин складаються ці дані, які так впливають? Наприклад, що є «статистична значимість»? Що саме розуміється під цим визначенням?

Що це?

Статистика як наука складається з поєднання різних величин та понять. Одним із них і є поняття «статистична значимість». Так називається значення змінних величин, ймовірність появи інших показників у яких дуже мала.

Приміром, 9 із 10 осіб одягають на ноги гумове взуття під час ранкової прогулянки грибами в осінній ліс після дощової ночі. Імовірність того, що в якийсь момент 8 з них взуються в парусинові мокасини - мізерно мала. Таким чином, у даному конкретному прикладі число 9 є величиною, яка називається «статистична значимість».

Відповідно, якщо розвивати далі наведений практичний приклад, взуттєві магазини закуповують до кінця літнього сезону гумові чобітки у великій кількості, ніж у інший час року. Так, величина статистичного значення впливає на звичайне життя.

Зрозуміло, у складних підрахунках, припустимо, за прогнозом поширення вірусів, враховується велика кількість змінних. Але сама суть визначення значущого показника статистичних даних – аналогічна, незалежно від складності підрахунків та кількості непостійних величин.

Як вираховують?

Використовуються для обчислення значення показника «статистична значимість» рівняння. Тобто, можна стверджувати, що в цьому випадку все вирішує математика. Найпростішим варіантом обчислення є ланцюг математичних дій, у якому беруть участь такі параметри:

два типи результатів, отриманих при опитуваннях або вивченні об'єктивних даних, наприклад, сум на які здійснюються покупки, що позначаються а та b;
показник для обох груп – n;
значення частки об'єднаної вибірки – p;
поняття "стандартна помилка" - SE.

Наступним етапом визначається загальний тестовий показник - t його значення порівнюється з числом 1,96. 1,96 - це усереднене значення, що передає діапазон 95%, відповідно до функції t-розподілу Стьюдента.

Часто виникає питання, у чому відмінність значень n і p. Цей аспект просто прояснити за допомогою прикладу. Допустимо, обчислюється статистична значущість лояльності до будь-якого товару чи бренду чоловіків та жінок.

У цьому випадку за літерними позначеннями стоятиме таке:

n – число опитаних;
p – число задоволених продуктом.

Чисельність опитаних жінок у разі буде позначено, як n1. Відповідно, чоловіків – n2. Те саме значення матимуть цифри «1» та «2» у символу p.

Порівняння тестового показника з усередненими значеннями розрахункових таблиць Стьюдента стає тим, що називається «статистична значимість».

Що розуміється під перевіркою?

Результати будь-якого математичного обчислення можна перевірити, цьому навчають дітей ще у початкових класах. Логічно припустити, що коли статистичні показники визначаються за допомогою ланцюга обчислень, то й перевіряються.

Проте перевірка статистичної значущості – не лише математика. Статистика має справу з великою кількістю змінних величин і різних ймовірностей, які далеко не завжди піддаються розрахунку. Тобто якщо повернуться до наведеного на початку статті прикладу з гумовим взуттям, то логічна побудова статистичних даних, на які спиратимуться закупівлі товарів для магазинів, може бути порушена сухою та спекотною погодою, яка не є типовою для осені. Внаслідок цього явища кількість людей, які купують гумові чоботи, знизиться, а торгові точки зазнають збитків. Передбачити погодну аномалію математична формула, зрозуміло, неспроможна. Цей момент називається – «помилка».

Ось ймовірність таких помилок і враховує перевірка рівня обчисленої значущості. У ньому враховуються як обчислені показники, і прийняті рівні значимості, і навіть величини, умовно звані гіпотезами.

Що таке рівень значущості?

Поняття «рівень» входить до основних критеріїв статистичної значимості. Використовується воно у прикладній та практичній статистиці. Це свого роду величина, яка враховує можливість можливих відхилень чи помилок.

Рівень ґрунтується на виявленні відмінностей у готових вибірках, дозволяє встановити їх суттєвість або ж, навпаки, випадковість. Це поняття не лише цифрові значення, а й їх своєрідні розшифровки. Вони пояснюють те, як треба розуміти значення, а сам рівень визначається порівнянням результату із усередненим індексом, це й виявляє ступінь достовірності відмінностей.

Таким чином, можна уявити поняття рівня просто - це показник допустимої, ймовірної похибки або помилки у зроблених з отриманих статистичних даних висновках.

Які рівні значення використовуються?

Статистична значимість коефіцієнтів ймовірності допущеної помилки практично відштовхується від трьох базових рівнів.

Першим рівнем вважається поріг, у якому значення дорівнює 5 %. Тобто ймовірність похибки вбирається у рівня значимості 5 %. Це означає, що впевненість у бездоганності та безпомилковості висновків, зроблених на основі даних статистичних досліджень, становить 95%.

Другим рівнем є поріг 1%. Відповідно, ця цифра означає, що керуватися отриманими за статистичних розрахунків даними можна з упевненістю в 99 %.

Третій рівень – 0,1 %. За такого значення ймовірність наявності помилки дорівнює частці відсотка, тобто похибки практично виключаються.

Що таке гіпотеза у статистиці?

Помилки як поняття поділяються за двома напрямками, що стосуються прийняття або відхилення нульової гіпотези. Гіпотеза - це поняття, за яким ховається, згідно з визначенням, набір інших даних або тверджень. Тобто опис ймовірнісного розподілу чогось, що відноситься до предмета статистичного обліку.

Гіпотез при простих розрахунках буває дві – нульова та альтернативна. Різниця між ними в тому, що нульова гіпотеза бере за основу уявлення про відсутність принципових відмінностей між вибірками, що беруть участь у визначенні статистичної значущості, а альтернативна їй повністю протилежна. Тобто альтернативна гіпотеза заснована на наявності вагомої різниці у цих вибірках.

Якими є помилки?

Помилки як поняття у статистиці перебувають у прямій залежності від прийняття за істинну ту чи іншу гіпотезу. Їх можна розділити на два напрямки або типу:

перший тип обумовлений прийняттям нульової гіпотези, що виявилася неправильною;
другий - викликаний дотриманням альтернативної.

Перший тип помилок називається хибнопозитивним і зустрічається досить часто у всіх сферах, де використовуються статистичні дані. Відповідно, помилка другого типу називається хибнонегативною.

Навіщо потрібна регресія у статистиці?

Статистична значимість регресії у цьому, що з її допомогою можна встановити, наскільки відповідає реальності обчислена з урахуванням даних модель різних залежностей; дозволяє виявити достатність або брак чинників для обліку та висновків.

Визначається регресивне значення за допомогою порівняння результатів з наведеними в таблицях Фішера даними. Або за допомогою дисперсійного аналізу. Важливе значення показники регресії мають за складних статистичних дослідженнях і розрахунках, у яких бере участь багато змінних величин, випадкових даних, і можливих змін.

Завданням статистичного дослідження є виявлення закономірностей, що у природі досліджуваних явищ. Показники та середні величини мають бути відображенням дійсності, для чого необхідно визначати ступінь їх достовірності. Правильне відображення вибірковою сукупністю генеральної сукупності називається репрезентативністю . Мірою точності та достовірності вибіркових статистичних величин є середні помилки представницькості (репрезентативності), які залежать від чисельності вибірки та ступеня різноманітності вибіркової сукупності за досліджуваною ознакою.

Тому для визначення ступеня достовірності результатів статистичного дослідження необхідно для кожної відносної та середньої величини обчислити відповідну середню помилку. Середня помилка показника m p обчислюється за такою формулою:

При числі спостережень менше 30, де

P - величина показника у відсотках, проміле тощо.

q - доповнення цього показника до 100, якщо він у відсотках, до 1000, якщо % 0 і т.д. (тобто q = 100-P, 1000-P і т.д.)

Наприклад, відомо, що в районі протягом року захворіло на дизентерію 224 особи. Чисельність населення ― 33000. Показник захворюваності на дизентерію на

Середня помилка цього показника

Для вирішення питання про ступінь достовірності показника визначають довірчий коефіцієнт (t), що дорівнює відношенню показника для його середньої помилки, тобто.

У нашому прикладі

Що вище t, то більше вписувалося ступінь достовірності. При t = 1, ймовірність достовірності показника дорівнює 68,3%, при t = 2 - 95,5%, при t = 3 - 99,7%. У медико-статистичних дослідженнях зазвичай використовують довірчу ймовірність (надійність), рівну 95,5%-99,0%, а найбільш відповідальних випадках - 99,7%. Таким чином, у нашому прикладі показник захворюваності достовірний.

При числі спостережень менше 30 значення критерію визначається за таблицею Стьюдента. Якщо отримана величина буде вищою або дорівнює табличній – показник достовірний. Якщо нижче – не достовірний.

При необхідності порівняння двох однорідних показників достовірність їх відмінностей визначається за такою формулою:

(від більшого числа забирають менше),

де P 1 -P 2 ― різниця двох порівнюваних показників,

― середня помилка різниці двох показників.

Наприклад, у районі Б протягом року захворіло на дизентерію 270 осіб. Населення району ― 45000. Звідси захворюваність на дизентерію:

тобто. показник захворюваності достовірний.

Як видно, захворюваність у районі Б нижче, ніж у районі А. Визначаємо за формулою достовірність різниці двох показників:

За наявності великої кількості спостережень (понад 30) різниця показників є статистично достовірною, якщо t = 2 чи більше. Отже, у прикладі захворюваність у районі А достовірно вище, т.к. довірчий коефіцієнт (t) більший за 2.

Знаючи величину середньої помилки показника, можна визначити довірчі межі цього в залежності від впливу причин випадкового характеру. Довірчі межі визначаються за такою формулою:

P - показник;

m ― його середня помилка;

t ― довірчий коефіцієнт вибирається залежно від необхідної величини надійності: t=1 відповідає надійності результату у 68,3% випадків, t=2 – 95,5%, t=2,6 – 99%, t=3 – 99,7 %, t = 3,3 - 99,9 Величина називається граничною помилкою.

Наприклад, в районі Б показник захворюваності на дизентерію з точністю до 99,7 9 % може коливатися у зв'язку з випадковими факторами в межах тобто. від 49,1 до 70,9.

Схожі статті

Обговорюють:

Що таке помилка в кадастровому паспорті, як виправити технічну та кадастрову помилку:- заява або постанова суду; - свідоцтво про...
Індичка: склад, калорійність та харчова цінність Калорійність бульйону з індички: 2.7 з 5 Про користь бульйонів відомо з найдавніших часів. Їх рекомендували...
Смачний та ситний салат коктейль з куркою та фруктами:Якщо спробувати додати в трохи соковитого м'яса курочки, то вийде...
Слов'яно-арійські веди коротко:Веди - безперечно цінне джерело інформації. Тут менше хронологічних...