سری واریاسیون. مقادیر متوسط انحراف معیار. میانگین خطای میانگین حسابی توزیع آماری نمونه. ویژگی های اصلی سری تغییرات

سری های آماریتوزیع- این توزیع منظم واحدهای جمعیتی به گروه ها بر اساس یک ویژگی متفاوت است.
بسته به ویژگی زیربنایی تشکیل سری های توزیع، وجود دارد سری توزیع اسنادی و متغیر.

وجود یک مشخصه مشترک مبنایی برای تشکیل یک جامعه آماری است که نشان دهنده نتایج یک توصیف یا اندازه گیری است. ویژگی های مشترکاشیاء تحقیق

موضوع مطالعه در آمار، ویژگی های متغیر (متغیر) یا ویژگی های آماری است.

انواع مشخصات آماری.

سری های توزیع را اسنادی می نامندبر اساس معیارهای کیفیت ساخته شده است. اسنادی- این علامتی است که نام دارد (مثلاً حرفه: خیاطی، معلم و غیره).
سری توزیع معمولاً در قالب جداول ارائه می شود. روی میز 2.8 سری توزیع ویژگی را نشان می دهد.
جدول 2.8 - توزیع انواع کمک های حقوقی ارائه شده توسط وکلا به شهروندان یکی از مناطق فدراسیون روسیه.

سری واریاسیون- اینها مقادیر مشخصه (یا فواصل مقادیر) و فرکانس آنها هستند.
سری های تنوع، سری های توزیع هستند، بر اساس کمی ساخته شده است. هر سری تغییرات از دو عنصر تشکیل شده است: گزینه ها و فرکانس ها.
واریانت ها به عنوان مقادیر فردی یک مشخصه در نظر گرفته می شوند که در یک سری تغییرات می گیرد.
فرکانس ها تعداد گزینه های فردی یا هر گروه هستند سری تغییرات، یعنی اینها اعدادی هستند که نشان می‌دهند چند وقت یکبار گزینه‌های خاص در یک سری توزیع رخ می‌دهند. مجموع همه فرکانس ها اندازه کل جمعیت، حجم آن را تعیین می کند.
فرکانس ها فرکانس هایی هستند که به صورت کسری از یک واحد یا به صورت درصدی از کل بیان می شوند. بر این اساس مجموع فرکانس ها برابر با 1 یا 100 درصد است. سری تغییرات به فرد اجازه می دهد تا شکل قانون توزیع را بر اساس داده های واقعی تخمین بزند.

بسته به ماهیت تنوع صفت، وجود دارد سری تغییرات گسسته و بازه ای.
نمونه ای از یک سری تغییرات گسسته در جدول آورده شده است. 2.9.
جدول 2.9 - توزیع خانواده ها بر اساس تعداد اتاق های اشغال شده در آپارتمان های فردی در سال 1989 در فدراسیون روسیه.

ستون اول جدول گزینه هایی را برای یک سری تغییرات گسسته ارائه می دهد، ستون دوم شامل فرکانس های سری تغییرات، و سوم شامل شاخص های فرکانس است.

سری واریاسیون

که در جمعیتیک ویژگی کمی خاص در حال بررسی است. نمونه ای از حجم به صورت تصادفی از آن استخراج می شود n، یعنی تعداد عناصر نمونه برابر است با n. در مرحله اول پردازش آماری، محدودهنمونه ها، یعنی سفارش شماره x 1، x 2، …، x nصعودی. هر مقدار مشاهده شده x iتماس گرفت گزینه. فرکانس m iتعداد مشاهدات مقدار است x iدر نمونه فرکانس نسبی (فرکانس) w iنسبت فرکانس است m iبه اندازه نمونه n: .
هنگام مطالعه سری تغییرات، از مفاهیم فرکانس انباشته و فرکانس انباشته نیز استفاده می شود. اجازه دهید ایکستعدادی عدد سپس تعداد گزینه ها , که مقادیر آن کمتر است ایکس، فرکانس انباشته نامیده می شود: برای x i nفرکانس انباشته w i max نامیده می شود.
یک مشخصه در صورتی متغیر گسسته نامیده می شود که مقادیر فردی (انواع) آن با یک مقدار محدود خاص (معمولا یک عدد صحیح) با یکدیگر متفاوت باشند. سری تغییرات چنین مشخصه ای سری تغییرات گسسته نامیده می شود.

جدول 1. نمای کلی یک سری فرکانس تغییرات گسسته

ارزش های مشخصهx i x 1 x 2 x n
فرکانس هاm i متر 1 متر 2 m n

یک مشخصه به طور پیوسته متغیر نامیده می شود اگر مقادیر آن به مقدار دلخواه کمی با یکدیگر متفاوت باشد، به عنوان مثال. این ویژگی می تواند هر مقداری را در یک بازه زمانی خاص بگیرد. یک سری تغییرات پیوسته برای چنین مشخصه ای بازه نامیده می شود.

جدول 2. نمای کلی سری تغییرات بازه ای فرکانس ها

جدول 3. تصاویر گرافیکی سری تغییرات

ردیفچند ضلعی یا هیستوگرامتابع توزیع تجربی
گسسته
فاصله
با بررسی نتایج مشاهدات، مشخص می شود که چه تعداد از گزینه ها در هر بازه خاص قرار می گیرند. فرض بر این است که هر بازه به یکی از انتهای آن تعلق دارد: یا در همه موارد چپ (بیشتر) یا در همه موارد سمت راست، و فرکانس ها یا فرکانس ها تعداد گزینه های موجود در محدوده های مشخص شده را نشان می دهند. تفاوت a i – a i +1فواصل جزئی نامیده می شوند. برای ساده کردن محاسبات بعدی، سری تغییرات بازه ای را می توان با یک سری گسسته مشروط جایگزین کرد. در این مورد، مقدار متوسط من-فاصله به عنوان یک گزینه در نظر گرفته شده است x iو فرکانس بازه مربوطه m i- برای فرکانس این بازه.
برای نمایش گرافیکی سری تغییرات، رایج ترین موارد استفاده شده عبارتند از چند ضلعی، هیستوگرام، منحنی تجمعی و تابع توزیع تجربی.

روی میز 2.3 (گروه بندی جمعیت روسیه بر اساس درآمد سرانه متوسط ​​در آوریل 1994) ارائه شده است. سری تغییرات بازه ای.
تجزیه و تحلیل سری های توزیع با استفاده از یک تصویر گرافیکی راحت است که به فرد اجازه می دهد شکل توزیع را قضاوت کند. یک نمایش بصری از ماهیت تغییرات در فرکانس های سری تغییرات توسط چند ضلعی و هیستوگرام.
این چند ضلعی در هنگام نمایش سری تغییرات گسسته استفاده می شود.
به عنوان مثال، توزیع سهام مسکن را بر اساس نوع آپارتمان به صورت گرافیکی نشان می دهیم (جدول 2.10).
جدول 2.10 - توزیع موجودی مسکن منطقه شهری بر اساس نوع آپارتمان (ارقام مشروط).


برنج. منطقه توزیع مسکن


نه تنها مقادیر فرکانس، بلکه فرکانس های سری تغییرات را نیز می توان بر روی محورهای مختصات رسم کرد.
هیستوگرام برای نمایش یک سری تغییرات بازه ای استفاده می شود. هنگام ساخت یک هیستوگرام، مقادیر فواصل بر روی محور آبسیسا رسم می شوند و فرکانس ها با مستطیل هایی که بر روی فواصل مربوطه ساخته شده اند نشان داده می شوند. ارتفاع ستون ها در صورت فواصل مساوی باید متناسب با فرکانس ها باشد. هیستوگرام نموداری است که در آن یک سری به صورت نوارهای مجاور یکدیگر نشان داده می شود.
اجازه دهید سری های توزیع بازه ای را که در جدول آمده است را به صورت گرافیکی به تصویر بکشیم. 2.11.
جدول 2.11 - توزیع خانواده ها بر اساس اندازه فضای زندگی برای هر نفر (ارقام مشروط).
N p/p گروه هایی از خانواده ها بر اساس اندازه فضای زندگی برای هر نفر تعداد خانواده ها با اندازه معین فضای زندگی تعداد تجمعی خانواده ها
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
جمع 115 ----


برنج. 2.2. هیستوگرام توزیع خانواده ها بر اساس اندازه فضای زندگی برای هر نفر


با استفاده از داده های سری انباشته شده (جدول 2.11)، ما می سازیم توزیع تجمعی


برنج. 2.3. توزیع تجمعی خانواده ها بر اساس اندازه فضای زندگی برای هر نفر


نمایش یک سری تغییرات به صورت تجمعی به ویژه برای سری های تغییراتی که فرکانس آنها به صورت کسری یا درصدی از مجموع فرکانس های سری بیان می شود مؤثر است.
اگر هنگام نمایش گرافیکی یک سری تغییرات به صورت تجمعی، محورها را تغییر دهیم، به دست می‌آییم. ogiva. در شکل 2.4 نشان می دهد که بر اساس داده های جدول ساخته شده است. 2.11.
یک هیستوگرام را می توان با یافتن نقاط میانی اضلاع مستطیل ها و سپس اتصال این نقاط با خطوط مستقیم به یک چندضلعی توزیع تبدیل کرد. چند ضلعی توزیع حاصل در شکل نشان داده شده است. 2.2 با خط نقطه چین.
هنگام ساختن هیستوگرام توزیع یک سری تغییرات با فواصل نابرابر، این فرکانس ها نیستند که در امتداد ارتین رسم می شوند، بلکه چگالی توزیع مشخصه در فواصل مربوطه ترسیم می شوند.
چگالی توزیع فرکانس محاسبه شده در واحد عرض بازه است، یعنی. چند واحد در هر گروه در هر واحد مقدار بازه وجود دارد. نمونه ای از محاسبه چگالی توزیع در جدول ارائه شده است. 2.12.
جدول 2.12 - توزیع شرکت ها بر اساس تعداد کارکنان (ارقام مشروط)
N p/p گروه های شرکت ها بر اساس تعداد کارکنان، افراد. تعداد شرکت ها اندازه فاصله، افراد. چگالی توزیع
آ 1 2 3=1/2
1 تا 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
جمع 147 ---- ----

همچنین می تواند برای نمایش گرافیکی سری تغییرات استفاده شود منحنی تجمعی. با استفاده از یک انباشته (منحنی جمع)، یک سری از فرکانس های انباشته شده به تصویر کشیده می شود. فرکانس‌های تجمعی با جمع‌کردن متوالی فرکانس‌ها در گروه‌ها تعیین می‌شوند و نشان می‌دهند که چند واحد در جامعه دارای مقادیر مشخصه‌هایی هستند که بیشتر از مقدار مورد نظر نیستند.


برنج. 2.4. ارائه توزیع خانواده ها بر اساس اندازه فضای زندگی برای هر نفر

هنگام ساختن انباشته‌های سری تغییرات بازه‌ای، انواع سری در امتداد محور آبسیسا و فرکانس‌های انباشته شده در امتداد محور ارتین رسم می‌شوند.

ردیف ساخته شده است بر مبنای کمی، نامیده می شوند متغیر.

سری توزیع شامل گزینه ها(مقادیر مشخصه) و فرکانس ها(تعداد گروه ها). فرکانس هایی که به صورت مقادیر نسبی بیان می شوند (کسری، درصد) نامیده می شوند فرکانس ها. مجموع همه فرکانس ها را حجم سری توزیع می گویند.

بر اساس نوع، سری های توزیع به دو دسته تقسیم می شوند گسسته(ساخته شده بر اساس مقادیر ناپیوسته مشخصه) و فاصله(بر اساس مقادیر پیوسته مشخصه).

سری واریاسیوننشان دهنده دو ستون (یا ردیف) است. یکی از آنها مقادیر فردی از یک مشخصه متفاوت را ارائه می دهد که به نام واریانت و با X نشان داده می شود. و در دیگری - اعداد مطلق که نشان می دهد هر گزینه چند بار (چند بار) رخ می دهد. نشانگرهای ستون دوم فرکانس نامیده می شوند و به طور متعارف با f نشان داده می شوند. اجازه دهید یک بار دیگر توجه کنیم که در ستون دوم می توان از شاخص های نسبی استفاده کرد که سهم فراوانی گزینه های فردی را در مجموع فرکانس ها مشخص می کند. این شاخص های نسبی فرکانس نامیده می شوند و به طور قراردادی با ω نشان داده می شوند. مجموع همه فرکانس ها در این مورد برابر با یک است. با این حال، فرکانس ها را نیز می توان به صورت درصد بیان کرد و سپس مجموع همه فرکانس ها 100٪ را نشان می دهد.

اگر انواع یک سری تغییرات به صورت مقادیر گسسته بیان شوند، چنین سری تغییراتی نامیده می شود. گسسته.

برای مشخصه‌های پیوسته، سری‌های تغییرات به‌عنوان ساخته می‌شوند فاصلهیعنی مقادیر صفت موجود در آنها "از... به..." بیان می شود. در این حالت، حداقل مقادیر مشخصه در چنین فاصله ای، حد پایین فاصله، و حداکثر - حد بالایی نامیده می شود.

سری‌های تغییرات بازه‌ای نیز برای ویژگی‌های گسسته ساخته شده‌اند که در یک محدوده بزرگ متفاوت هستند. سری فاصله می تواند با برابرو نابرابردر فواصل زمانی

بیایید در نظر بگیریم که چگونه مقدار فواصل مساوی تعیین می شود. اجازه دهید نماد زیر را معرفی کنیم:

من- اندازه فاصله؛

- حداکثر مقدار مشخصه برای واحدهای جمعیتی؛

- حداقل مقدار مشخصه برای واحدهای جمعیتی؛

n -تعداد گروه های اختصاص داده شده

، اگر n شناخته شده باشد.

اگر از قبل تعیین تعداد گروه هایی که باید متمایز شوند دشوار است، برای محاسبه مقدار بهینه فاصله با اندازه جمعیت کافی، فرمول پیشنهادی استرجس در سال 1926 را می توان توصیه کرد:

n = 1 + 3.322 log N، که در آن N تعداد واحدهای کل است.

اندازه فواصل نابرابر در هر مورد جداگانه با در نظر گرفتن ویژگی های موضوع مطالعه تعیین می شود.

توزیع نمونه آماریفهرستی از گزینه ها و فرکانس های مربوط به آنها (یا فرکانس های نسبی) را فراخوانی کنید.

توزیع آماری نمونه را می توان در قالب یک جدول مشخص کرد که در ستون اول آن گزینه ها قرار دارند و در ستون دوم - فرکانس های مربوط به این گزینه ها ni، یا فرکانس های نسبی پی .

توزیع آماری نمونه

سری‌های بازه‌ای، سری‌های تغییراتی هستند که در آن مقادیر ویژگی‌های زیربنای شکل‌گیری آن‌ها در محدوده‌های معینی (فاصله) بیان می‌شوند. فرکانس ها در این مورد نه به مقادیر فردی ویژگی، بلکه به کل بازه اشاره دارد.

سری های توزیع بازه ای بر اساس ویژگی های کمی پیوسته و همچنین بر اساس ویژگی های گسسته ای که در محدوده های قابل توجهی تغییر می کنند ساخته می شوند.

یک سری بازه ای را می توان با توزیع آماری یک نمونه نشان داد که فواصل و فرکانس های مربوط به آنها را نشان می دهد. در این حالت، مجموع فرکانس های متغیرهایی که در این بازه قرار می گیرند به عنوان فرکانس بازه در نظر گرفته می شود.

هنگام گروه بندی بر اساس مشخصه های پیوسته کمی، تعیین اندازه بازه مهم است.

علاوه بر میانگین نمونه و واریانس نمونه، سایر ویژگی های سری تغییرات نیز استفاده می شود.

روشگونه ای که بیشترین فرکانس را دارد نامیده می شود.

سری واریاسیون - این یک سری آماری است که توزیع پدیده مورد مطالعه را با توجه به مقدار هر مشخصه کمی نشان می دهد. به عنوان مثال، بیماران بر اساس سن، مدت زمان درمان، نوزادان بر اساس وزن و غیره.

گزینه - مقادیر فردی مشخصه ای که با آن گروه بندی انجام می شود (نشان داده شده است V ) .

فرکانس- عددی که نشان می دهد هر چند وقت یکبار یک گزینه خاص رخ می دهد (نشان داده شده است پ ) . مجموع تمام فرکانس ها را نشان می دهد تعداد کل مشاهدات و تعیین شده است n . تفاوت بین بزرگترین و کوچکترین نوع یک سری تغییرات نامیده می شود دهانه یا دامنه .

سری های تنوع وجود دارد:

1. ناپیوسته (گسسته) و پیوسته.

اگر مشخصه گروه‌بندی را بتوان در مقادیر جزئی (وزن، قد و غیره) بیان کرد، یک سری پیوسته در نظر گرفته می‌شود، اگر مشخصه گروه‌بندی فقط به صورت یک عدد صحیح بیان شود (روزهای ناتوانی، تعداد ضربان نبض و غیره) ناپیوسته است. .

2-ساده و متعادل

سری تغییرات ساده سری‌هایی است که در آن مقدار کمی یک مشخصه متغیر یک بار اتفاق می‌افتد. در یک سری تغییرات وزنی، مقادیر کمی یک مشخصه متغیر با فرکانس معینی تکرار می شود.

3. گروه بندی شده (فاصله) و گروه بندی نشده.

یک سری گروه‌بندی شده دارای گزینه‌هایی است که در گروه‌هایی ترکیب شده‌اند که آن‌ها را بر اساس اندازه در یک بازه زمانی مشخص متحد می‌کند. در یک سری گروه بندی نشده، هر گزینه جداگانه با فرکانس خاصی مطابقت دارد.

4. زوج و فرد.

در سری تغییرات زوج، مجموع فرکانس ها یا تعداد کل مشاهدات با یک عدد زوج و در موارد فرد - با یک عدد فرد بیان می شود.

5. متقارن و نامتقارن.

در یک سری تغییرات متقارن، همه انواع مقادیر میانگین منطبق یا بسیار نزدیک هستند (حالت، میانه، میانگین حسابی).

بسته به ماهیت پدیده های مورد مطالعه، وظایف و اهداف خاص تحقیقات آماری، و همچنین محتوای منبع، در آمار بهداشتی از انواع میانگین های زیر استفاده می شود:

ابزار ساختاری (حالت، میانه)؛

میانگین حسابی؛

میانگین هارمونیک؛

میانگین هندسی؛

متوسط ​​مترقی

مد (M O ) - ارزش یک مشخصه متفاوت، که بیشتر در جمعیت مورد مطالعه یافت می شود، یعنی. گزینه مربوط به بالاترین فرکانس آنها آن را مستقیماً از ساختار سری تغییرات پیدا می کنند، بدون اینکه به هیچ محاسباتی متوسل شوند. معمولاً مقداری بسیار نزدیک به میانگین حسابی است و در عمل بسیار راحت است.

میانه (M ه ) - تقسیم سری تغییرات (رتبه بندی شده، یعنی مقادیر گزینه به ترتیب صعودی یا نزولی مرتب شده اند) به دو نیمه مساوی. میانه با استفاده از سری به اصطلاح فرد محاسبه می شود که با جمع متوالی فرکانس ها به دست می آید. اگر مجموع فرکانس ها با یک عدد زوج مطابقت داشته باشد، میانگین حسابی دو مقدار متوسط ​​معمولاً به عنوان میانه در نظر گرفته می شود.

حالت و میانه در مورد جمعیت باز استفاده می شود، یعنی. زمانی که بزرگترین یا کوچکترین گزینه ها مشخصه کمی دقیق ندارند (مثلاً تا 15 سال، 50 سال و بالاتر و غیره). در این حالت میانگین حسابی (مشخصات پارامتریک) قابل محاسبه نیست.

میانگین من حسابی هستم - رایج ترین مقدار میانگین حسابی اغلب با نشان داده می شود م.

میانگین های حسابی ساده و وزنی وجود دارد.

میانگین حسابی ساده محاسبه شد:

- در مواردی که جمعیت با یک لیست ساده از دانش یک ویژگی برای هر واحد نشان داده می شود.

- اگر تعداد تکرارهای هر گزینه قابل تعیین نباشد.

- اگر تعداد تکرارهای هر گزینه به هم نزدیک باشد.

میانگین حسابی ساده با استفاده از فرمول محاسبه می شود:

جایی که V - مقادیر فردی مشخصه؛ n - تعداد مقادیر فردی؛
- علامت جمع

بنابراین، میانگین ساده نسبت مجموع متغیرها به تعداد مشاهدات است.

مثال: تعیین میانگین مدت اقامت در تخت برای 10 بیمار مبتلا به ذات الریه:

16 روز - 1 بیمار. 17-1; 18–1; 19–1; 20–1; 21–1; 22-1; 23–1; 26–1; 31-1.

روز رختخواب

میانگین وزنی حسابی در مواردی که مقادیر فردی یک مشخصه تکرار می شود محاسبه می شود. به دو صورت قابل محاسبه است:

1. به طور مستقیم (میانگین حسابی یا روش مستقیم) طبق فرمول:

,

که در آن P فراوانی (تعداد موارد) مشاهدات هر گزینه است.

بنابراین، میانگین حسابی وزنی، نسبت مجموع حاصلضرب های متغیر و بسامد به تعداد مشاهدات است.

2. با محاسبه انحراف از میانگین شرطی (با استفاده از روش گشتاورها).

مبنای محاسبه میانگین حسابی موزون عبارت است از:

- گروه بندی مواد بر اساس انواع یک ویژگی کمی؛

- همه گزینه ها باید به ترتیب صعودی یا نزولی مقدار ویژگی (ردیف رتبه بندی شده) مرتب شوند.

برای محاسبه با استفاده از روش لحظه ای، یک پیش نیاز یکسان بودن اندازه تمام بازه ها است.

با استفاده از روش گشتاورها، میانگین حسابی با استفاده از فرمول محاسبه می شود:

,

که در آن M o میانگین شرطی است که اغلب به عنوان مقدار مشخصه مربوط به بالاترین فرکانس در نظر گرفته می شود، یعنی. که بیشتر تکرار می شود (Fashion).

i مقدار فاصله است.

a یک انحراف شرطی از شرایط میانگین است، که یک سری متوالی از اعداد (1، 2، و غیره) با علامت + برای انواع میانگین های شرطی بزرگ و با علامت – (–1، –2، و غیره) است. .) برای انواعی که کمتر از میانگین معمولی هستند. انحراف شرطی از متغیری که به عنوان میانگین شرطی در نظر گرفته شده است 0 است.

P - فرکانس ها.

- تعداد کل مشاهدات یا n.

مثال: میانگین قد پسران 8 ساله را مستقیماً تعیین کنید (جدول 1).

میز 1

ارتفاع بر حسب سانتی متر

پسران پ

مرکزی

گزینه V

گزینه مرکزی - وسط فاصله - به عنوان نیمه مجموع مقادیر اولیه دو گروه همسایه تعریف می شود:

;
و غیره.

حاصلضرب VP با ضرب انواع مرکزی در فرکانس ها به دست می آید
;
و غیره. سپس محصولات به دست آمده اضافه شده و به دست می آیند
، که بر تعداد مشاهدات (100) تقسیم می شود و میانگین حسابی وزنی به دست می آید.

سانتی متر.

همین مسئله را با استفاده از روش لحظه ها حل خواهیم کرد که جدول 2 زیر برای آن تهیه شده است:

جدول 2

ارتفاع بر حسب سانتی متر (V)

پسران پ

n=100

ما 122 را به عنوان M o می گیریم، زیرا از 100 مشاهده، 33 نفر قد 122 سانتی متر داشتند. مطابق با موارد فوق، انحرافات شرطی (a) از میانگین شرطی را پیدا می کنیم. سپس حاصل ضرب انحرافات شرطی فرکانس ها (aP) را به دست می آوریم و مقادیر به دست آمده را جمع می کنیم (
). نتیجه 17 است. در نهایت، داده ها را با فرمول جایگزین می کنیم:

هنگام مطالعه یک مشخصه متفاوت، نمی توان خود را فقط به محاسبه مقادیر متوسط ​​محدود کرد. همچنین لازم است شاخص هایی که درجه تنوع ویژگی های مورد مطالعه را مشخص می کنند محاسبه شود. مقدار یک یا آن مشخصه کمی برای همه واحدهای جامعه آماری یکسان نیست.

مشخصه یک سری تغییرات انحراف معیار است ( ) که گسترش (پراکندگی) ویژگی های مورد مطالعه را نسبت به میانگین حسابی نشان می دهد، یعنی. متغیر بودن سری تغییرات را مشخص می کند. می توان آن را مستقیماً با استفاده از فرمول تعیین کرد:

انحراف معیار برابر است با جذر مجذور انحرافات مجذور هر گزینه از میانگین حسابی (V–M) 2 بر فرکانس های آن تقسیم بر مجموع فرکانس ها (
).

مثال محاسبه: میانگین تعداد مرخصی های صادر شده در کلینیک در روز را تعیین کنید (جدول 3).

جدول 3

تعداد روزهای بیماری

برگه های صادر شده

پزشک در روز (V)

تعداد پزشکان (P)

;

در مخرج زمانی که تعداد مشاهدات کمتر از 30 باشد، لازم است از
یکی کم کن

اگر سری در فواصل مساوی گروه بندی شود، انحراف معیار را می توان با استفاده از روش گشتاور تعیین کرد:

,

جایی که i مقدار بازه است.

- انحراف مشروط از میانگین مشروط؛

P - نوع فرکانس فواصل مربوطه؛

- تعداد کل مشاهدات

محاسبه مثال : میانگین مدت اقامت بیماران روی تخت درمانی (با استفاده از روش لحظه ها) را تعیین کنید (جدول 4):

جدول 4

تعداد روزها

در رختخواب بمان (V)

بیمار (P)

;

A. Quetelet آماردان بلژیکی کشف کرد که تغییرات در پدیده های جرمی از قانون توزیع خطا پیروی می کند که تقریباً به طور همزمان توسط K. Gauss و P. Laplace کشف شد. منحنی نشان دهنده این توزیع به شکل زنگ است. طبق قانون توزیع نرمال، تغییرپذیری مقادیر فردی یک مشخصه در محدوده است
که 99.73 درصد از کل واحدهای جمعیت را پوشش می دهد.

محاسبه شده است که اگر 2 را به میانگین حسابی اضافه و کم کنید 95.45 درصد از کل اعضای سری تغییرات در مقادیر به دست آمده قرار دارند و در نهایت اگر 1 را به میانگین حسابی اضافه و کم کنیم. ، سپس 68.27 درصد از کل اعضای این سری تغییرات در مقادیر به دست آمده خواهند بود. در پزشکی با بزرگی
1با مفهوم هنجار مرتبط است. انحراف از میانگین حسابی بیش از 1 است ، اما کمتر از 2 غیر طبیعی است و انحراف بیش از 2 است غیر طبیعی (بالاتر یا کمتر از حد نرمال).

در آمارهای بهداشتی، قانون سه سیگما هنگام مطالعه رشد فیزیکی، ارزیابی عملکرد موسسات مراقبت‌های بهداشتی و ارزیابی سلامت جمعیت استفاده می‌شود. در اقتصاد ملی هنگام تعیین استانداردها از همین قانون استفاده می شود.

بنابراین، انحراف استاندارد برای:

- اندازه گیری پراکندگی سری تغییرات؛

- ویژگی های درجه تنوع ویژگی ها که توسط ضریب تغییرات تعیین می شود:

اگر ضریب تغییرات بیش از 20٪ باشد - تنوع قوی، از 20 تا 10٪ - متوسط، کمتر از 10٪ - تنوع ضعیف صفات. ضریب تغییرات تا حدی معیاری برای پایایی میانگین حسابی است.

روش گروه بندی نیز به شما امکان اندازه گیری را می دهد تغییر(تغییرپذیری، نوسان) علائم. هنگامی که تعداد واحدهای یک جمعیت نسبتاً کم است، تغییرات بر اساس تعداد رتبه‌بندی واحدهایی که جمعیت را تشکیل می‌دهند اندازه‌گیری می‌شود. سریال نام دارد رتبه بندی شده،اگر واحدها به ترتیب صعودی (نزولی) مشخصه مرتب شوند.

با این حال، سری های رتبه بندی شده کاملاً نشان دهنده زمانی هستند که یک ویژگی مقایسه ای تنوع مورد نیاز باشد. علاوه بر این، در بسیاری از موارد باید با جمعیت های آماری متشکل از تعداد زیادی واحد سروکار داشته باشیم که عملاً نمایش آنها در قالب یک سری خاص دشوار است. در این راستا، برای آشنایی اولیه اولیه با داده های آماری و به ویژه برای تسهیل در مطالعه تنوع در ویژگی ها، معمولاً پدیده ها و فرآیندهای مورد مطالعه در گروه ها ترکیب می شوند و نتایج گروه بندی در قالب جداول گروهی ارائه می شود.

اگر یک جدول گروهی فقط دو ستون داشته باشد - گروه ها با توجه به یک مشخصه انتخاب شده (گزینه ها) و تعداد گروه ها (فرکانس یا فرکانس)، نامیده می شود. نزدیک توزیع

محدوده توزیع -ساده ترین نوع گروه بندی ساختاری بر اساس یک مشخصه، که در یک جدول گروهی با دو ستون حاوی انواع و فرکانس های مشخصه نمایش داده می شود. در بسیاری از موارد، با چنین گروه بندی ساختاری، i.e. با تدوین سری های توزیع، مطالعه مواد اولیه آماری آغاز می شود.

یک گروه بندی ساختاری در قالب یک سری توزیع می تواند به یک گروه بندی ساختاری واقعی تبدیل شود اگر گروه های انتخاب شده نه تنها با فرکانس ها، بلکه توسط سایر شاخص های آماری نیز مشخص شوند. هدف اصلی از سری های توزیع، بررسی تنوع ویژگی ها است. تئوری سری های توزیع به طور مفصل توسط آمار ریاضی توسعه یافته است.

سری های توزیع به دو دسته تقسیم می شوند نسبتی(گروه بندی بر اساس ویژگی های اسنادی، به عنوان مثال، تقسیم جمعیت بر اساس جنسیت، ملیت، وضعیت تأهل و غیره) و متغیر(گروه بندی بر اساس ویژگی های کمی).

سری واریاسیونیک جدول گروهی است که شامل دو ستون است: گروه بندی واحدها بر اساس یک مشخصه کمی و تعداد واحدهای هر گروه. فواصل در سری تغییرات معمولاً مساوی و بسته تشکیل می شوند. سری تغییرات گروه بندی زیر از جمعیت روسیه بر اساس درآمد سرانه متوسط ​​پولی است (جدول 3.10).

جدول 3.10

توزیع جمعیت روسیه بر اساس درآمد سرانه متوسط ​​در 2004-2009.

گروه های جمعیت بر اساس میانگین درآمد نقدی سرانه، روبل/ماه

جمعیت در گروه، % از کل

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

بیش از 25000.0

کل جمعیت

سری های تنوع به نوبه خود به گسسته و فاصله ای تقسیم می شوند. گسستهسری‌های تنوع، انواع ویژگی‌های گسسته را ترکیب می‌کنند که در محدوده‌های باریک متفاوت هستند. نمونه ای از یک سری تغییرات گسسته، توزیع خانواده های روسی بر اساس تعداد فرزندان آنها است.

فاصلهسری‌های تنوع، انواعی از ویژگی‌های پیوسته یا ویژگی‌های گسسته را ترکیب می‌کنند که در محدوده وسیعی متفاوت هستند. فاصله سری تغییرات توزیع جمعیت روسیه بر اساس درآمد سرانه متوسط ​​پولی است.

سری تغییرات گسسته اغلب در عمل استفاده نمی شود. در همین حال، تدوین آنها دشوار نیست، زیرا ترکیب گروه ها توسط انواع خاصی که ویژگی های گروه بندی مورد مطالعه در واقع دارند تعیین می شود.

سری های تغییرات بازه ای گسترده تر هستند. هنگام جمع آوری آنها، یک سوال دشوار در مورد تعداد گروه ها و همچنین اندازه فواصل زمانی که باید ایجاد شود مطرح می شود.

اصول حل این مسئله در فصل روش شناسی ساخت گروه بندی های آماری تنظیم شده است (به بند 3.3 مراجعه کنید).

سری‌های تنوع وسیله‌ای برای جمع‌کردن یا فشرده‌سازی اطلاعات مختلف به شکل فشرده از آن‌ها هستند که می‌توان قضاوت نسبتاً روشنی در مورد ماهیت تغییرات انجام داد و تفاوت‌های ویژگی‌های پدیده‌های موجود در مجموعه مورد مطالعه را مطالعه کرد. اما مهم‌ترین اهمیت سری‌های تغییرات این است که بر اساس آنها ویژگی‌های تعمیم‌دهنده ویژه تغییرات محاسبه می‌شوند (به فصل 7 مراجعه کنید).

بیایید مقادیر مختلف نمونه را فراخوانی کنیم گزینه هاسری از مقادیر و نشان می دهد: ایکس 1 , ایکس 2،…. اول از همه ما تولید خواهیم کرد محدودهگزینه ها، یعنی ترتیب آنها به ترتیب صعودی یا نزولی. برای هر گزینه، وزن خود نشان داده شده است، یعنی. عددی که سهم یک گزینه معین را در کل جمعیت مشخص می کند. فرکانس ها یا فرکانس ها به عنوان وزن عمل می کنند.

فرکانس n من گزینه x iعددی است که نشان می دهد یک گزینه معین چند بار در جامعه نمونه در نظر گرفته می شود.

فرکانس یا فرکانس نسبی w i گزینه x iعددی است برابر با نسبت فرکانس یک متغیر به مجموع فرکانس های همه انواع. بسامد نشان می دهد که چه نسبتی از واحدها در جامعه نمونه دارای یک نوع معین هستند.

دنباله ای از گزینه ها با وزن متناظر آنها (فرکانس ها یا فرکانس ها) که به ترتیب صعودی (یا نزولی) نوشته می شود، نامیده می شود. سری تغییرات.

سری های تغییرات گسسته و بازه ای هستند.

برای یک سری تغییرات گسسته، مقادیر نقطه ای مشخصه مشخص می شود، برای یک سری فاصله، مقادیر مشخصه به صورت فواصل مشخص می شود. سری تغییرات می تواند توزیع فرکانس ها یا فرکانس های نسبی (فرکانس ها) را بسته به مقدار مشخص شده برای هر گزینه - فرکانس یا فرکانس نشان دهد.

سری تغییرات گسسته توزیع فرکانسدارای فرم:

فرکانس ها با فرمول i = 1, 2, … متر.

w 1 +w 2 + … + w m = 1.

مثال 4.1. برای مجموعه ای معین از اعداد

4, 6, 6, 3, 4, 9, 6, 4, 6, 6

ساخت سری تغییرات گسسته از توزیع فرکانس و فرکانس.

راه حل . حجم جمعیت برابر است با n= 10. سری توزیع فرکانس گسسته دارای فرم است

سریال های فاصله ای شکل مشابهی از ضبط دارند.

سری تغییرات فاصله توزیع فرکانسبه صورت نوشته شده است:

مجموع همه فرکانس ها برابر است با تعداد کل مشاهدات، یعنی. حجم کل: n = n 1 +n 2 + … + nمتر

سری تغییرات بازه ای توزیع فرکانس های نسبی (فرکانس ها)دارای فرم:

فرکانس با فرمول i = 1, 2, … متر.

مجموع همه فرکانس ها برابر با یک است: w 1 +w 2 + … + w m = 1.

سری های فاصله ای اغلب در عمل استفاده می شوند. اگر داده‌های نمونه آماری زیادی وجود داشته باشد و مقادیر آنها به مقدار دلخواه کمی با یکدیگر متفاوت باشد، در این صورت یک سری مجزا برای این داده‌ها برای تحقیقات بیشتر بسیار سخت و ناخوشایند خواهد بود. در این مورد، از گروه بندی داده ها استفاده می شود، یعنی. بازه حاوی تمام مقادیر مشخصه به چند بازه جزئی تقسیم می شود و با محاسبه فرکانس برای هر بازه، یک سری بازه به دست می آید. اجازه دهید طرح ساخت یک سری بازه ای را با جزئیات بیشتر بنویسیم، با فرض اینکه طول بازه های جزئی یکسان باشد.

2.2 ساخت یک سری فاصله

برای ساخت یک سری بازه ای شما نیاز دارید:

تعداد فواصل را تعیین کنید؛

طول فواصل را تعیین کنید؛

محل فواصل روی محور را تعیین کنید.

برای تعیین تعداد فواصل ک فرمول استرجز وجود دارد که طبق آن

,

جایی که n- حجم کل سنگدانه.

به عنوان مثال، اگر 100 مقدار از یک مشخصه (نوعی) وجود داشته باشد، توصیه می شود برای ساخت یک سری بازه، تعداد بازه ها را برابر با فواصل در نظر بگیرید.

با این حال، اغلب در عمل تعداد بازه‌ها توسط خود محقق انتخاب می‌شود، با در نظر گرفتن این که این تعداد نباید خیلی زیاد باشد تا سری‌ها دست و پا گیر نباشد، بلکه خیلی کم نیز نباشد تا برخی از ویژگی‌های آن از بین نرود. توزیع

طول بازه ساعت با فرمول زیر تعیین می شود:

,

جایی که ایکسحداکثر و ایکس min به ترتیب بزرگترین و کوچکترین مقادیر گزینه ها است.

اندازه تماس گرفت محدودهردیف

برای ساختن خود فواصل، به روش های مختلفی پیش می روند. یکی از ساده ترین راه ها به شرح زیر است. آغاز اولین فاصله در نظر گرفته می شود
. سپس مرزهای باقی مانده از فواصل با فرمول پیدا می شود. بدیهی است که پایان آخرین فاصله آ m+1 باید شرایط را برآورده کند

بعد از اینکه تمام مرزهای بازه ها پیدا شد، فرکانس (یا فرکانس) این بازه ها مشخص می شود. برای حل این مشکل، تمام گزینه ها را بررسی کنید و تعداد گزینه هایی را که در یک بازه زمانی خاص قرار می گیرند مشخص کنید. بیایید با استفاده از یک مثال به ساخت کامل یک سری بازه ای نگاه کنیم.

مثال 4.2. برای داده های آماری زیر که به ترتیب صعودی ثبت شده اند، یک سری بازه ای با تعداد بازه های برابر با 5 بسازید:

11, 12, 12, 14, 14, 15, 21, 21, 22, 23, 25, 38, 38, 39, 42, 42, 44, 45, 50, 50, 55, 56, 58, 60, 62, 63, 65, 68, 68, 68, 70, 75, 78, 78, 78, 78, 80, 80, 86, 88, 90, 91, 91, 91, 91, 91, 93, 93, 95, 96.

راه حل. جمع n= 50 مقدار متغیر.

تعداد فواصل در بیان مسئله مشخص شده است، یعنی. ک=5.

طول فواصل است
.

بیایید مرزهای فواصل را مشخص کنیم:

آ 1 = 11 − 8,5 = 2,5; آ 2 = 2,5 + 17 = 19,5; آ 3 = 19,5 + 17 = 36,5;

آ 4 = 36,5 + 17 = 53,5; آ 5 = 53,5 + 17 = 70,5; آ 6 = 70,5 + 17 = 87,5;

آ 7 = 87,5 +17 = 104,5.

برای تعیین فراوانی فواصل، تعداد گزینه هایی را که در یک بازه معین قرار می گیرند، شمارش می کنیم. به عنوان مثال، فاصله اول از 2.5 تا 19.5 شامل گزینه های 11، 12، 12، 14، 14، 15 است که تعداد آنها 6 است، بنابراین فراوانی فاصله اول برابر است. n 1 = 6. فرکانس بازه اول است . بازه دوم از 19.5 تا 36.5 شامل گزینه های 21، 21، 22، 23، 25 است که تعداد آنها 5 است. بنابراین فراوانی فاصله دوم n 2 = 5 و فرکانس . با یافتن فرکانس ها و فرکانس ها برای همه بازه ها به روشی مشابه، سری بازه های زیر را به دست می آوریم.

سری بازه ای توزیع فرکانس به شکل زیر است:

مجموع فرکانس ها 6+5+9+11+8+11=50 است.

سری بازه ای توزیع فرکانس به شکل زیر است:

مجموع فرکانس ها 0.12+0.1+0.18+0.22+0.16+0.22=1 است. ■

هنگام ساخت سری های بازه ای، بسته به شرایط خاص مسئله مورد بررسی، می توان قوانین دیگری را اعمال کرد، یعنی

1. سری تغییرات فاصله می تواند از فواصل جزئی با طول های مختلف تشکیل شده باشد. طول نابرابر فواصل این امکان را فراهم می کند که ویژگی های یک جامعه آماری با توزیع نابرابر مشخصه برجسته شود. به عنوان مثال، اگر مرزهای فواصل تعداد ساکنان شهرها را تعیین می کند، در این مسئله توصیه می شود از فواصل با طول نامساوی استفاده شود. بدیهی است که برای شهرهای کوچک تفاوت اندک در تعداد ساکنان مهم است، اما برای شهرهای بزرگ اختلاف ده ها یا صدها نفر جمعیت قابل توجه نیست. سری‌های بازه‌ای با طول‌های نابرابر بازه‌های جزئی عمدتاً در تئوری عمومی آمار مورد مطالعه قرار می‌گیرند و بررسی آنها از حوصله این راهنما خارج است.

2. در آمار ریاضی گاهی سری های بازه ای در نظر گرفته می شود که برای آن ها مرز سمت چپ اولین بازه برابر با –∞ و مرز سمت راست آخرین بازه +∞ در نظر گرفته می شود. این کار به منظور نزدیک کردن توزیع آماری به توزیع نظری انجام می شود.

3. هنگام ساخت سری های بازه ای، ممکن است معلوم شود که مقدار برخی از گزینه ها دقیقاً با مرز فاصله منطبق است. بهترین کار در این مورد به شرح زیر است. اگر فقط یک چنین تصادفی وجود داشته باشد، در نظر بگیرید که گزینه مورد بررسی با فرکانس آن در فاصله نزدیکتر به وسط سری بازه قرار می گیرد، اگر چندین چنین گزینه وجود داشته باشد، هر کدام از آنها به فواصل زمانی اختصاص داده می شود سمت راست این گزینه ها یا همه آنها به سمت چپ اختصاص داده شده اند.

4. پس از تعیین تعداد فواصل و طول آنها، می توان ترتیب فواصل را به شکل دیگری انجام داد. میانگین حسابی همه مقادیر در نظر گرفته شده گزینه ها را بیابید ایکسچهارشنبه و اولین بازه را طوری بسازید که این میانگین نمونه در یک بازه باشد. بنابراین، ما فاصله از ایکسچهارشنبه - 0.5 ساعتقبل از ایکسمیانگین.. + 0.5 ساعت. سپس به چپ و راست با اضافه کردن طول فاصله، بازه های باقی مانده را می سازیم تا ایکسدقیقه و ایکس max به ترتیب در بازه های اول و آخر قرار نمی گیرد.

5. سری های فاصله ای با تعداد بازه های زیاد به راحتی به صورت عمودی نوشته می شوند، یعنی. فواصل را نه در سطر اول، بلکه در ستون اول و فرکانس ها (یا فرکانس ها) را در ستون دوم بنویسید.

داده های نمونه را می توان به عنوان مقادیر برخی از متغیرهای تصادفی در نظر گرفت ایکس. یک متغیر تصادفی قانون توزیع خاص خود را دارد. از نظریه احتمال مشخص شده است که قانون توزیع یک متغیر تصادفی گسسته را می توان در قالب یک سری توزیع و برای یک پیوسته - با استفاده از تابع چگالی توزیع مشخص کرد. با این حال، یک قانون توزیع جهانی وجود دارد که برای متغیرهای تصادفی گسسته و پیوسته صادق است. این قانون توزیع به عنوان تابع توزیع داده شده است اف(ایکس) = پ(ایکس<ایکس). برای داده های نمونه، می توانید یک آنالوگ از تابع توزیع - تابع توزیع تجربی را مشخص کنید.


اطلاعات مربوطه.




مقالات مشابه

parki48.ru 2024. ما در حال ساخت یک خانه قاب هستیم. طراحی منظر. ساخت و ساز. پایه.