Закон рідкісних подій. Розподіл Пуассон. Дискретні розподіли у MS EXCEL

Розглянемо розподіл Пуассона, обчислимо його математичне очікування, дисперсію, моду За допомогою функції MS EXCEL ПУАССОН.РАСП() побудуємо графіки функції розподілу та щільності ймовірності. Зробимо оцінку параметра розподілу, його математичного очікуваннята стандартного відхилення.

Спочатку дамо сухе формальне визначення розподілу, потім наведемо приклади ситуацій, коли розподіл Пуассона(англ. Poissondistribution) є адекватною моделлю для опису випадкової величини.

Якщо випадкові події відбуваються в заданий період часу (або певному обсязі речовини) із середньою частотою λ( лямбда), то кількість подій x, що відбулися за цей період часу, матиме розподіл Пуассона.

Застосування розподілу Пуассона

Приклади, коли Розподіл Пуассонає адекватною моделлю:

кількість дзвінків, що надійшли на телефонну станцію за певний період часу;
кількість частинок, що зазнали радіоактивного розпаду за певний період часу;
число дефектів у шматку тканини фіксованої довжини.

Розподіл Пуассонає адекватною моделлю, якщо виконуються такі умови:

події відбуваються незалежно друг від друга, тобто. ймовірність наступної події не залежить від попередньої;
середня частота подій стала. Як наслідок, ймовірність події пропорційна довжині інтервалу спостереження;
дві події не можуть статися одночасно;
число подій має набувати значення 0; 1; 2…

Примітка: Хорошою підказкою, що спостерігається випадкова величинамає розподіл Пуассона,є той факт, що приблизно одно (див. нижче).

Нижче наведено приклади ситуацій, коли Розподіл Пуассона не можебути застосовано:

кількість студентів, які виходять з університету протягом години (бо середній потік студентів не постійний: під час занять студентів мало, а в перерві між заняттями кількість студентів різко зростає);
число землетрусів амплітудою 5 балів на рік у Каліфорнії (бо один землетрус може викликати повторні поштовхи подібної амплітуди – події не незалежні);
число днів, які пацієнти проводять у відділенні інтенсивної терапії (бо число днів, яке пацієнти проводять у відділенні інтенсивної терапії, завжди більше 0).

Примітка: Розподіл Пуассонає наближенням точніших дискретних розподілів: і .

Примітка: Про взаємозв'язок розподілу Пуассонаі Біноміального розподілуможна прочитати у статті. Про взаємозв'язок розподілу Пуассонаі Експонентного розподілуможна прочитати у статті про .

Розподіл Пуассона у MS EXCEL

У MS EXCEL, починаючи з версії 2010, для Розподілу Пуассонає функція ПУАССОН.РАСП() , англійська назва- POISSON.DIST(), яка дозволяє вирахувати не тільки ймовірність того, що за заданий період часу відбудеться хподій (функцію щільності ймовірності p(x), див. формулу вище), але і (ймовірність того, що за заданий період часу станеться не менше xподій).

До MS EXCEL 2010 EXCEL була функція ПУАССОН() , яка також дозволяє обчислити функцію розподілуі щільність імовірності p(x). Пуассон () залишена в MS EXCEL 2010 для сумісності.

У файлі прикладу наведено графіки густини розподілу ймовірностіі інтегральної функції розподілу.

Розподіл Пуассонамає скошену форму (довгий хвіст праворуч у функції ймовірності), але при збільшенні параметра стає все більш симетричним.

Примітка: Середнєі дисперсія(квадрат) рівні параметру розподілу Пуассона- λ (див. файл приклад лист Приклад).

Завдання

Типовим застосуванням Розподіл Пуассонау контролі якості є модель кількості дефектів, які можуть з'явитися у приладі чи пристрої.

Наприклад, при середній кількості дефектів в мікросхемі λ (лямбда), що дорівнює 4, ймовірність, що випадково обрана мікросхема буде мати 2 або менше дефектів, дорівнює: = ПУАССОН.РАСП(2; 4; ІСТИНА) = 0,2381

Третій параметр у функції встановлений = ІСТИНА, тому функція поверне інтегральну функцію розподілу, тобто ймовірність того, що число випадкових подійопиниться в діапазоні від 0 до 4 включно.

Обчислення в цьому випадку провадяться за формулою:

Імовірність того, що випадково обрана мікросхема матиме рівно 2 дефекти, дорівнює: = ПУАССОН.РАСП(2;4;БРЕХНЯ)=0,1465

Третій параметр у функції встановлений = БРЕХНЯ, тому функція поверне щільність імовірності.

Імовірність того, що випадково обрана мікросхема матиме більше 2-х дефектів, дорівнює: =1-ПУАССОН.РАСП(2;4;ІСТИНА) =0,8535

Примітка: Якщо xне є цілим числом, то при обчисленні формули . Формули = Пуассон. 2 ; 4; БРЕХНЯ)і = Пуассон. 2,9 ; 4; БРЕХНЯ)повернуть однаковий результат.

Генерація випадкових чисел та оцінка λ

При значеннях λ >15 , Розподіл Пуассонадобре апроксимується Нормальним розподілом з наступними параметрами: μ =λ , σ 2 =λ .

Докладніше про зв'язок цих розподілів можна прочитати у статті . Там же наведено приклади апроксимації, і пояснено умови, коли вона можлива і з якоюсь точністю.

ПОРАДА: Про інші розподіли MS EXCEL можна прочитати у статті .

Наприклад, реєструється кількість дорожніх пригод протягом тижня на певній ділянці дороги. Це число є випадковою величиною, яка може приймати значення: (верхньої межі немає). Число дорожніх пригод може бути будь-яким великим. Якщо розглянути якийсь короткий часовий проміжок протягом тижня, скажімо хвилину, то подія або станеться на її протязі, або ні. Імовірність дорожньої пригоди протягом окремої хвилини дуже мала, і приблизно така ж вона для всіх хвилин.

Розподіл ймовірностей числа подій описується формулою:

де m – середня кількість подій за тиждень на певній ділянці дороги; е - константа, що дорівнює 2,718...

Характерні особливості даних, для яких найкращим чиномпідходить розподіл Пуассона, наступні:

1. Кожен малий інтервал часу може розглядатися як досвід, результатом якого є одна з двох: або подія ("успіх") або його відсутність ("невдача"). Інтервали настільки малі, що може бути лише один "успіх" в одному інтервалі, ймовірність якого мала і незмінна.

2. Число "успіхів" в одному великому інтервалі не залежить від їх числа в іншому, тобто "успіхи" безладно розкидані за тимчасовими проміжками.

3. Середня кількість “успіхів” завжди протягом усього часу. Розподіл ймовірностей Пуассона може бути використаний не тільки під час роботи з випадковими величинами на тимчасових інтервалах, але і при обліку дефектів дорожнього покриттяна кілометр шляху або друкарська помилка на сторінку тексту. Загальна формуларозподілу ймовірностей Пуассона:

де m – середня кількість “успіхів” на одиницю.

У таблицях розподілу ймовірностей Пуассона значення табульовані для певних значень m та

приклад 2.7. У середньому на телефонній станції замовляють три телефонні розмови протягом п'яти хвилин. Якою є ймовірність, що буде замовлено 0, 1,2, 3, 4 або більше чотирьох розмов протягом п'яти хвилин?

Застосуємо розподіл ймовірностей Пуассона, оскільки:

1. Існує необмежену кількість дослідів, тобто. Маленьких відрізків часу, коли може з'явитися замовлення на телефонну розмову, можливість чого мінімальна і постійна.

2. Вважається, що попит на телефонні розмови безладно розподілено у часі.

3. Вважається, що середня кількість телефонних розмову будь-якому -хвилинному відрізку часу однаково.

У цьому прикладі середня кількість замовлень дорівнює 3 за 5 хвилин. Звідси розподіл Пуассона:

При розподілі ймовірностей Пуассона, знаючи середню кількість "успіхів" на 5-хвилинному проміжку (наприклад як у прикладі 2.7), для того щоб дізнатися середню кількість "успіхів" за одну годину, потрібно просто помножити на 12. У прикладі 2.7 середня кількість замовлень година складе: 3 х 12 = 36. Аналогічно, якщо потрібно визначити середню кількість замовлень за хвилину:

приклад 2.8. У середньому за п'ять днів робочого тижня на автоматичної лініївідбуваються 3,4 неполадки. Яка ймовірність двох неполадок у кожний день роботи? Рішення.

Можна застосувати розподіл Пуассон:

1. Існує необмежену кількість дослідів, тобто. малих проміжків часу протягом кожного з них може статися або не статися неполадка на автоматичній лінії. Імовірність цього кожному проміжку часу мала і постійна.

2. Передбачається, що неполадки розташовані в часі.

3. Передбачається, що середня кількість неполадок протягом п'яти днів постійно.

Середня кількість неполадок дорівнює 3, 4 за п'ять днів. Звідси кількість несправностей на день:

Отже,

Як відразу почали надходити запити: Де Пуассон? Де завдання на формулу Пуассона? і т.п. І тому я почну з приватного застосуваннярозподілу Пуассона - через велику популярність матеріалу.

Завдання до болю ейфорії знайоме:

І такі два завдання принципово відрізняються від попередніх:

Приклад 4

Випадкова величина підпорядкована закону Пуассона з математичним очікуванням. Знайти ймовірність того, що ця випадкова величина набуде значення, меншого, ніж її математичне очікування.

Відмінність полягає в тому, що тут йде САМЕ про розподіл Пуассона.

Рішення: випадкова величина набуває значення з ймовірностями:

За умовою, і тут все просто: подія полягає в трьох несумісних наслідків:

Імовірність того, що випадкова величина набуде значення, меншого, ніж її математичне очікування.

Відповідь:

Аналогічне завдання розуміння:

Приклад 5

Випадкова величина підпорядкована закону Пуассона з математичним очікуванням. Знайти ймовірність того, що ця випадкова величина прийме позитивне значення.

Рішення та відповідь наприкінці уроку.

Крім наближеннябіномного розподілу(Приклади 1-3), розподіл Пуассон знайшов широке застосуванняв теорії масового обслуговування для імовірнісної характеристики найпростішогопотоку подій. Постараюся бути лаконічним:

Нехай до певної системи надходять заявки ( телефонні дзвінки, клієнти, що приходять і т.д.). Потік заявок називають найпростішимякщо він задовольняє умовам стаціонарності, відсутності наслідківі ординарності. Стаціонарність має на увазі те, що інтенсивність заявок постійнаі не залежить від часу доби, дня тижня чи інших тимчасових рамок. Іншими словами, не буває «години пік» і не буває «мертвого годинника». Відсутність наслідків означає, що можливість появи нових заявок залежить від «передісторії», тобто. немає такого, що «одна бабця розповіла» та інші «набігли» (або навпаки, розбіглися). І, нарешті, властивість ординарності характеризується тим, що за досить малийпроміжок часу практично неможливо поява двох або більшої кількості заявок. «Дві старенькі у двері?» - Ні, звільніть.

Отже, нехай до певної системи надходить найпростіший потік заявок із середньою інтенсивністюзаявок на хвилину (у годину, на день або у довільний проміжок часу). Тоді ймовірність того, що за цей проміжок часу, В систему надійде рівно заявок, дорівнює:

Приклад 6

Дзвінки в диспетчерську таксі є найпростішим пуассонівським потоком із середньою інтенсивністю 30 викликів на годину. Знайти ймовірність того, що: а) за 1 хв. надійде 2-3 виклики; б) протягом п'яти хвилин буде хоча б один дзвінок.

Рішення: використовуємо формулу Пуассона:

а) Враховуючи стаціонарність потоку, обчислимо середню кількість дзвінків за 1 хвилину:
дзвінка – в середньому за одну хвилину.

За теоремою складання ймовірностей несумісних подій:
- Імовірність того, що за 1 хвилину в диспетчерську надійде 2-3 виклики.

б) Обчислимо середню кількість викликів за п'ять хвилин:

Багато завдань практики доводиться мати справу з випадковими величинами, розподіленими за своєрідним законом, який називається законом Пуассона.

Розглянемо перервну випадкову величину, яка може набувати лише цілі, невід'ємні значення:

причому послідовність цих значень теоретично не обмежена.

Кажуть, що випадкова величина розподілена за законом Пуассона, якщо ймовірність того, що вона набуде певного значення, виражається формулою

де а – деяка позитивна величина, яка називається параметром закону Пуассона.

Ряд розподілу випадкової величини, розподіленої за законом Пуассона, має вигляд:

Переконаємося, передусім, що послідовність ймовірностей, що задається формулою (5.9.1), може бути ряд розподілу, тобто. що сума всіх ймовірностей дорівнює одиниці. Маємо:

На рис. 5.9.1 показано багатокутники розподілу випадкової величини , розподіленої за законом Пуассона, відповідні різним значеннямпараметра. У таблиці 8 додатка наведено значення для різних.

Визначимо основні характеристики – математичне очікування та дисперсію – випадкової величини, розподіленої згідно із законом Пуассона. За визначенням математичного очікування

Перший член суми (відповідний) дорівнює нулю, отже, підсумовування можна почати з:

Позначимо; тоді

. (5.9.2)

Таким чином, параметр є не що інше, як математичне очікування випадкової величини .

Для визначення дисперсії знайдемо спочатку другий початковий момент величини:

За раніше доведеним

Крім того,

Таким чином, дисперсія випадкової величини, розподіленої за законом Пуассона, дорівнює її математичному очікуванню.

Ця властивість розподілу Пуассона часто застосовується на практиці для вирішення питання, чи є правдоподібною гіпотеза про те, що випадкова величина розподілена за законом Пуассона. І тому визначають з досвіду статистичні характеристики – математичне очікування і дисперсію – випадкової величини. Якщо їх значення близькі, це може бути доказом на користь гіпотези про пуассонівському розподілі; різка відмінність цих показників, навпаки, свідчить проти гіпотези.

Визначимо для випадкової величини , розподіленої за законом Пуассона, ймовірність того, що вона набуде значення не менше заданого . Позначимо цю ймовірність:

Очевидно, ймовірність може бути обчислена як сума

Однак значно простіше визначити її з ймовірності протилежної події:

(5.9.4)

Зокрема, ймовірність того, що величина набуде позитивного значення, виражається формулою

(5.9.5)

Ми вже згадували, що багато завдань практики призводять до розподілу Пуассона. Розглянемо одне з типових завдань такого роду.

Нехай на осі абсцис Ох випадково розподіляються точки (рис. 5.9.2). Припустимо, що випадковий розподілточок задовольняє наступним умовам:

1. Імовірність влучення того чи іншого числа точок на відрізок залежить тільки від довжини цього відрізка, але не залежить від його положення на осі абсцис. Іншими словами, точки розподіляються на осі абсцис з однаковою середньою густиною. Позначимо цю густину (тобто математичне очікування числа точок, що припадають на одиницю довжини) через .

2. Крапки розподіляються на осі абсцис незалежно друг від друга, тобто. ймовірність попадання того чи іншого числа точок на заданий відрізок не залежить від того, скільки їх потрапило на будь-який інший відрізок, що не перекривається з ним.

3. Імовірність попадання на малу ділянку двох або більше точок зневажливо мала в порівнянні з ймовірністю попадання однієї точки (ця умова означає практичну неможливість збігу двох або більше точок).

Виділимо на осі абсцис певний відрізок довжини та розглянемо дискретну випадкову величину – кількість точок, що потрапляють на цей відрізок. Можливі значення величини будуть

Оскільки крапки потрапляють на відрізок незалежно друг від друга, теоретично не виключено, що й там виявиться скільки завгодно багато, тобто. ряд (5.9.6) продовжується необмежено.

Доведемо, що випадковий розмір має закон розподілу Пуассона. Для цього обчислимо можливість того, що на відрізок потрапить рівно крапок.

Спочатку вирішимо більше просте завдання. Розглянемо на осі Ох мала ділянка і обчислимо ймовірність того, що на цю ділянку потрапить хоча б одна точка. Будемо міркувати так. Математичне очікування числа точок, що потрапляють на цю ділянку, очевидно, дорівнює (бо на одиницю довжини потрапляє в середньому точок). Згідно з умовою 3 для малого відрізка можна знехтувати можливістю попадання на нього двох або більше крапок. Тому математичне очікування числа точок, що потрапляють на ділянку , буде приблизно дорівнює ймовірності попадання на нього однієї точки (або, що в наших умовах рівнозначно, хоча б однієї).

Таким чином, з точністю до нескінченно малих вищого порядку, можна вважати ймовірність того, що на ділянку потрапить одна (хоча б одна) точка, що дорівнює , а ймовірність того, що не потрапить жодної, рівної .

Скористайтеся цим для обчислення ймовірності попадання на відрізок рівно крапок. Розділимо відрізок на рівних частин завдовжки. Умовимося називати елементарний відрізок «порожнім», якщо до нього не потрапило жодної точки, і «зайнятим», якщо до нього потрапила хоча б одна. Згідно з вищедоведеним ймовірність того, що відрізок виявиться «зайнятим», приблизно дорівнює ; ймовірність того, що він виявиться "порожнім", дорівнює . Оскільки, згідно з умовою 2, попадання точок у відрізки, що не перекриваються, незалежні, то наші n відрізків можна розглянути як незалежних «досвідів», у кожному з яких відрізок може бути «зайнятий» з ймовірністю . Знайдемо ймовірність того, що серед відрізків буде рівно «зайнятих». За теоремою про повторення дослідів ця ймовірність дорівнює

або, позначаючи ,

(5.9.7)

При досить великому ця ймовірність приблизно дорівнює ймовірності попадання на відрізок рівно крапок, так як попадання двох або більше точок на відрізок має малу ймовірність. Для того, щоб знайти точне значення, потрібно у виразі (5.9.7) перейти до межі при:

(5.9.8)

Перетворимо вираз, що стоїть під знаком межі:

(5.9.9)

Перший дріб і знаменник останнього дробу у виразі (5.9.9) при , очевидно, прагнуть одиниці. Вираз не залежить. Чисельник останнього дробу можна перетворити так:

(5.9.10)

При і вираз (5.9.10) прагне . Таким чином, доведено, що ймовірність попадання рівно крапок у відрізок виражається формулою

де, тобто. величина Х розподілена згідно із законом Пуассона з параметром.

Зазначимо, що величина за змістом є середньою кількістю точок, що припадає на відрізок .

Величина (ймовірність того, що величина Х набуде позитивного значення) в даному випадкувисловлює ймовірність того, що на відрізок потрапить хоча б одна точка:

Таким чином, ми переконалися, що розподіл Пуассона виникає там, де якісь точки (або інші елементи) займають випадкове положення незалежно один від одного, і підраховується кількість цих точок, які потрапили до якоїсь області. У нашому випадку такою "областю" був відрізок на осі абсцис. Однак, наш висновок легко поширити і на випадок розподілу точок на площині (випадкове плоске поле точок) і в просторі (випадкове просторове поле точок). Неважко довести, що якщо дотримані умови:

1) точки розподілені в полі статистично рівномірно із середньою щільністю;

2) точки потрапляють у області, що не перекриваються, незалежним чином;

3) точки з'являються поодинці, а не парами, трійками і т.д., то точок, що потрапляють в будь-яку область (плоску або просторову), розподіляються за законом Пуассона:

де – середня кількість точок, які у область .

Для плоского випадку

де - площа області; для просторового

де - обсяг області.

Зауважимо, що з пуассоновского розподілу числа точок, які у відрізок чи область, умова постійної щільності () несуттєво. Якщо виконані дві інші умови, то закон Пуассона все одно має місце, тільки параметр а в ньому набуває іншого виразу: він виходить не простим множення густини на довжину, площу або об'єм області, а інтегруванням змінної густини за відрізком, площею або обсягом. (Докладніше про це див. n° 19.4)

Наявність випадкових точок, розкиданих на лінії, на площині чи об'ємі – не єдина умова, за якої виникає розподіл Пуассона. Можна, наприклад, довести, що закон Пуассона є граничним для біномного розподілу:

, (5.9.12)

якщо одночасно спрямовувати кількість дослідів до нескінченності, а ймовірність – до нуля, причому їхній твір зберігає постійне значення:

Справді, цю граничну властивість біномного розподілу можна записати у вигляді:

. (5.9.14)

Але з умови (5.9.13) випливає, що

Підставляючи (5.9.15) до (5.9.14), отримаємо рівність

, (5.9.16)

яке щойно було доведено нами з іншого приводу.

Ця гранична властивість біномного закону часто знаходить застосування практично. Припустимо, що робиться велика кількістьнезалежних дослідів, у кожному з яких подія має дуже малу ймовірність. Тоді для обчислення ймовірності того, що подія з'явиться рівно раз, можна скористатися наближеною формулою:

, (5.9.17)

де - параметр того закону Пуассона, яким приблизно замінюється біномний розподіл.

Від цієї властивості закону Пуассона – виражати біноміальний розподіл за великої кількості дослідів та малої ймовірності події – походить його назва, що часто застосовується у підручниках статистики: закон рідкісних явищ.

Розглянемо кілька прикладів, пов'язаних з пуасонівським розподілом, із різних галузей практики.

Приклад 1. На автоматичну телефонну станцію надходять дзвінки із середньою щільністю дзвінків на годину. Вважаючи, що кількість викликів на будь-якій ділянці часу розподілено за законом Пуассона, знайти ймовірність того, що за дві хвилини на станцію надійде рівно три виклики.

Рішення. Середня кількість дзвінків за дві хвилини дорівнює:

кв.м. Для поразки мети достатньо попадання до неї хоча б одного уламка. Знайти ймовірність поразки мети при цьому положенні точки розриву.

Рішення. . За формулою (5.9.4) знаходимо ймовірність влучення хоча б одного уламка:

(Для обчислення значення показової функціїкористуємось таблицею 2 додатка).

Приклад 7. Середня щільністьхвороботворних мікробів в одному кубічному метріповітря дорівнює 100. Береться на пробу 2 куб. дм повітря. Знайти ймовірність того, що в ньому буде виявлено хоча б один бактерій.

Рішення. Приймаючи гіпотезу про пуассонівський розподіл числа мікробів в обсязі, знаходимо:

Приклад 8. За деякою метою проводиться 50 незалежних пострілів. Імовірність влучення в ціль за одного пострілу дорівнює 0,04. Користуючись граничною властивістю біномного розподілу (формула (5.9.17)), знайти приблизно ймовірність того, що в ціль потрапить: жодного снаряда, один снаряд, два снаряди.

Рішення. Маємо. За таблицею 8 додатка знаходимо ймовірності.

Багато практично важливих додатках велику рольграє розподіл Пуассон. Багато хто з числових дискретних величинє реалізаціями пуассонівського процесу, що має такі властивості:

Нас цікавить, скільки разів відбувається певна подія у заданій області можливих наслідків випадкового експерименту. Область можливих наслідків може являти собою інтервал часу, відрізок, поверхню тощо.
Імовірність цієї події однакова всім областей можливих результатів.
Кількість подій, що відбуваються в одній області можливих наслідків, не залежить від кількості подій, що відбуваються в інших областях.
Імовірність того, що в одній і тій же області можливих наслідків дана подія відбувається більше одного разу, прагне нуля в міру зменшення області можливих наслідків.

Щоб глибше зрозуміти зміст пуассонівського процесу, припустимо, що ми досліджуємо кількість клієнтів, які відвідують відділення банку, що у центральному діловому районі, під час ланчу, тобто. з 12 до 13 години. Припустимо, потрібно визначити кількість клієнтів за одну хвилину. Чи має ця ситуація особливості, перераховані вище? По-перше, подія, яка нас цікавить, є приходом клієнта, а область можливих результатів - однохвилинний інтервал. Скільки клієнтів прийде до банку за хвилину – жодного, одного, двох чи більше? По-друге, розумно припустити, що ймовірність приходу клієнта протягом хвилини однакова всім однохвилинних інтервалів. По-третє, прихід одного клієнта протягом будь-якого однохвилинного інтервалу не залежить від приходу будь-якого іншого клієнта протягом будь-якого іншого однохвилинного інтервалу. І, нарешті, ймовірність того, що в банк прийде більше одного клієнта прагне нуля, якщо часовий інтервал прагне нуля, наприклад, стає менше 0,1 с. Отже, кількість клієнтів, які приходять до банку під час ланчу протягом однієї хвилини, описується розподілом Пуассона.

Розподіл Пуассона має один параметр, що позначається символом λ (грецька буква «лямбда») – середня кількість успішних випробувань у заданій області можливих наслідків. Дисперсія розподілу Пуассона також дорівнює λ, яке стандартне відхилення дорівнює . Кількість успішних випробувань ХПуассонівська випадкової величини змінюється від 0 до нескінченності. Розподіл Пуассон описується формулою:

де Р(Х)- ймовірність Xуспішних випробувань, λ - очікувана кількість успіхів, е- заснування натурального логарифму, що дорівнює 2,71828, X- кількість успіхів за одиницю часу.

Повернемося до нашого прикладу. Припустимо, що протягом обідньої перерви в середньому до банку приходять три клієнти на хвилину. Яка ймовірність того, що в цю хвилину до банку прийдуть два клієнти? А чому дорівнює ймовірність того, що до банку прийдуть понад два клієнти?

Застосуємо формулу (1) з параметром λ = 3. Тоді ймовірність того, що протягом цієї хвилини до банку прийдуть два клієнти, дорівнює

Імовірність того, що до банку прийдуть більше двох клієнтів, дорівнює Р(Х > 2) = Р(Х = 3) + Р(Х = 4) + … + Р(Х = ∞). Оскільки сума всіх ймовірностей має бути рівною 1, члени ряду, що стоїть у правій частині формули, є ймовірністю доповнення до події Х≤2. Інакше кажучи, сума цього ряду дорівнює 1 – Р(Х≤2). Отже, Р(Х> 2) = 1 – Р(Х≤2) = 1 – [Р(Х = 0) + Р(Х = 1) + Р(Х = 2)]. Тепер, використовуючи формулу (1), отримуємо:

Таким чином, ймовірність того, що до банку протягом хвилини прийдуть не більше двох клієнтів, дорівнює 0,423 (або 42,3%), а ймовірність того, що до банку протягом хвилини прийдуть більше двох клієнтів, дорівнює 0,577 (або 57,7) %).

Такі обчислення можуть здатися стомлюючими, особливо якщо параметр досить великий. Щоб уникнути складних обчислень, багато пуасонівських ймовірностей можна знайти в спеціальних таблицях (рис. 1). Наприклад, ймовірність того, що в задану хвилину до банку прийдуть два клієнти, якщо в середньому до банку приходять три клієнти за хвилину, перебуває на перетині рядка X= 2 і шпальти λ = 3. Таким чином, вона дорівнює 0,2240 або 22,4%.

Мал. 1. Пуассонівська ймовірність при λ = 3

Зараз навряд чи хтось користуватиметься таблицями, якщо під рукою є Excel з його функцією ПУАССОН.РАСП() (рис. 2). Ця функція має три параметри: кількість успішних випробувань Х, середня очікувана кількість успішних випробувань λ, параметр Інтегральна, що приймає два значення: БРЕХНЯ – у цьому випадку обчислюється ймовірність числа успішних випробувань Х(тільки Х), ІСТИНА – у цьому випадку обчислюється ймовірність числа успішних випробувань від 0 до Х.

Мал. 2. Розрахунок у Excel ймовірностей розподілу Пуассона при λ = 3

Апроксимація біномінального розподілу за допомогою розподілу Пуассона

Якщо число nвелике, а число р- мало, біномний розподіл можна апроксимувати за допомогою розподілу Пуассона. Чим більша кількість nі менше число ртим вище точність апроксимації. Для апроксимації біномного розподілу використовується наступна модель Пуассона.

де Р(Х)- ймовірність Xуспіхів при заданих параметрах nі р, n- обсяг вибірки, р- справжня ймовірність успіху, е- основа натурального логарифму, X- кількість успіхів у вибірці (X = 0, 1, 2, …, n).

Теоретично випадкова величина, що має розподіл Пуассона, набуває значення від 0 до ∞. Однак у тих ситуаціях, коли розподіл Пуассона застосовується для наближення біномного розподілу, пуассонівська випадкова величина – кількість успіхів серед nспостережень - не може перевищувати число n. З формули (2) випливає, що зі збільшенням числа nта зменшенням числа рймовірність виявити велику кількість успіхів зменшується і прагне нуля.

Як говорилося вище, математичне очікування µ та дисперсія σ 2 розподілу Пуассона дорівнюють λ. Отже, при апроксимації біномного розподілу за допомогою розподілу Пуассона для наближення математичного очікування слід застосовувати формулу (3).

(3) µ = Е(Х) = λ =np

Для апроксимації стандартного відхилення використовується формула (4).

Зверніть увагу на те, що стандартне відхилення, обчислене за формулою (4), прагне стандартного відхиленняу біноміальній моделі – , коли ймовірність успіху pпрагне до нуля, і, відповідно, ймовірність невдачі 1 – рпрагне одиниці.

Припустимо, що 8% шин, виготовлених на певному заводі, є бракованими. Щоб проілюструвати застосування розподілу Пуассона для апроксимації біномного розподілу, обчислимо ймовірність виявити одну дефектну шину у вибірці, що складається з 20 шин. Застосуємо формулу (2), отримаємо

Якби ми вирахували справжнє біномне розподіл, а не його наближення, то отримали б наступний результат:

Однак ці обчислення досить стомлюючі. У той же час, якщо ви використовуєте Excel для обчислення ймовірностей, застосування апроксимації у вигляді розподілу Пуассона стає зайвим. На рис. 3 показано, що трудомісткість обчислень Excel однакова. Тим не менш, цей розділ, на мій погляд, корисний розуміємо того, що за деяких умов біномні розподіл і розподіл Пуассон дають близькі результати.

Мал. 3. Порівняння трудомісткості розрахунків у Excel: (а) розподіл Пуассона; (б) біномінальний розподіл

Отже, у цій і двох попередніх нотатках було розглянуто три дискретні числові розподіли: , і Пуассона. Щоб краще уявляти, як ці розподіли співвідносяться один з одним наведемо невелике деревопитань (рис. 4).

Мал. 4. Класифікація дискретних розподілів ймовірностей

Використовуються матеріали книги Левін та ін. Статистика менеджерів. - М.: Вільямс, 2004. - с. 320–328

Схожі статті

Обговорюють:

Про церковні нагороди Грецька камілавка:фески, з верблюжої (грец. κάμηλος) вовни, яку носили в країнах...
Про церковні нагороди Камілівка синього кольору:все про сани священиків, сани російської православної церкви та їх вбрання...
Технологія домашнього консервування м'яса та риби Як зробити консерви з м'ясом:Багато господарки задаються питанням як правильно...
Шість пунктів нової демографічної програми Путіна Путінська програма:Подивився двогодинну зустріч кандидата у Президенти Російської Федерації.