مطالعه آماری تغییرات. معیارهای تغییر در آمار

مفهوم تنوع و معنای آن

تغییراین تفاوت در مقادیر هر مشخصه در بین واحدهای مختلف یک جمعیت معین در یک دوره یا نقطه زمانی است.

به عنوان مثال، کارمندان یک شرکت از نظر درآمد، زمان صرف شده برای کار، قد، وزن و غیره متفاوت هستند.

تنوع در نتیجه این واقعیت به وجود می آید که مقادیر فردی یک مشخصه تحت تأثیر ترکیبی عوامل (شرایط) مختلف شکل می گیرد که در هر مورد جداگانه ترکیب می شوند. بنابراین، بزرگی هر گزینه عینی است.

بررسی تنوع در آمار است پراهمیت، زیرا به درک ماهیت پدیده مورد مطالعه کمک می کند. اندازه گیری تنوع، پیدا کردن علت آن، شناسایی تأثیر عوامل فردی می دهد اطلاعات مهم(به عنوان مثال، در مورد امید به زندگی مردم، درآمد و هزینه های جمعیت، موقعیت مالیشرکت ها و غیره) تصمیمات مدیریتی مبتنی بر علمی اتخاذ کنند.

مقدار متوسط ​​یک ویژگی کلی از ویژگی جمعیت مورد مطالعه را ارائه می دهد، اما ساختار جمعیت را که برای دانش آن بسیار مهم است، آشکار نمی کند. میانگین نشان نمی دهد که چگونه متغیرهای مشخصه میانگین در اطراف آن قرار گرفته اند، آیا آنها نزدیک به میانگین متمرکز شده اند یا به طور قابل توجهی از آن انحراف دارند. بنابراین، برای توصیف نوسانات یک صفت، از شاخص های تنوع استفاده می شود.

شاخص های تغییرات و معنای آنها در آمار

برای اندازه گیری تنوع یک صفت در جمعیت ها، از شاخص های کلی تنوع زیر استفاده می شود: محدوده تغییرات، میانگین انحراف خطی، پراکندگی و انحراف استاندارد.

1. رایج ترین شاخص مطلق است محدوده تنوع() که به عنوان تفاوت بین بزرگترین () و کوچکترین () مقادیر گزینه ها تعریف می شود.

. (5.1)

محاسبه این شاخص آسان است، به همین دلیل است استفاده گسترده. با این حال، فقط انحرافات شدید را ثبت می کند و انحرافات همه انواع سری را منعکس نمی کند.

2. برای یک مشخصه کلی از توزیع انحرافات، محاسبه کنید میانگین انحراف خطی , به عنوان میانگین حسابی انحراف مقادیر فردی از میانگین بدون در نظر گرفتن علامت این انحرافات تعریف می شود:

میانگین وزنی انحراف خطی:

, (5.2)

میانگین وزنی انحراف خطی:

. (5.3)

در این فرمول‌ها، تفاوت‌های صورت‌گر به صورت مدول در نظر گرفته می‌شود، در غیر این صورت، صورت‌گر همیشه یک صفر خواهد داشت. بنابراین، میانگین انحراف خطی به عنوان معیار تغییر یک مشخصه به ندرت در عمل آماری استفاده می شود، تنها در مواردی که جمع بندی شاخص ها بدون در نظر گرفتن علائم منطقی اقتصادی باشد. با کمک آن، برای مثال، ترکیب نیروی کار، ریتم تولید و گردش مالی تجارت خارجی تجزیه و تحلیل می شود.

3. اندازه گیری تغییرات به طور عینی تر توسط شاخص منعکس می شود واریانس ها(- میانگین انحراف مربع)، که به عنوان میانگین مجذور انحراف ها تعریف می شود:

بدون وزن:

, (5.4)

وزن دار:

. (5.5)

واریانس در تحلیل اقتصادی اهمیت زیادی دارد. که در آمار ریاضی نقش مهمپراکندگی آنها در توصیف کیفیت برآوردهای آماری نقش دارد.

4. جذر واریانس "میانگین انحراف مربع" است انحراف معیار:

انحراف معیار یک مشخصه کلی از اندازه تغییرات یک مشخصه در کل است. این نشان می دهد که آنها به طور متوسط ​​چقدر انحراف دارند گزینه های خاصاز مقدار متوسط ​​آنها؛ معیار مطلق تغییرپذیری یک مشخصه است و در واحدهای مشابه انواع مختلف بیان می شود، بنابراین از نظر اقتصادی به خوبی تفسیر می شود.

چگونه کمتر از ارزشواریانس و میانگین انحراف مربع، هر چه جمعیت یکنواخت تر (از نظر کمی) باشد و میانگین مقدار معمولی تر خواهد بود.

در عمل آماری اغلب نیاز به مقایسه تغییرات وجود دارد نشانه های مختلف(به عنوان مثال، مقایسه تغییرات در سن کارگران و صلاحیت، طول خدمت و دستمزد آنها).

برای انجام این نوع مقایسه از موارد زیر استفاده کنید شاخص های نسبی:

ضریب نوسان- منعکس کننده نوسانات نسبی مقادیر شدید مشخصه حول میانگین:

. (5.7)

انحراف خطی نسبیسهم میانگین مقدار انحرافات مطلق را مشخص می کند اندازه متوسط:

. (5.8)

ضریب تغییراترایج ترین شاخص تغییرپذیری است که برای ارزیابی معمولی بودن یک مقدار متوسط ​​استفاده می شود:

. (5.9)

اگر، پس این نشان دهنده تنوع زیاد صفت در جمعیت مورد مطالعه است.

5.3 پراکندگی: خواص و روش های محاسبه

پراکندگی دارای تعدادی ویژگی است که محاسبات آن را ساده می کند.

1) اگر تعدادی عدد ثابت را از همه مقادیر کم کنید، میانگین مربع انحرافات از آن تغییر نمی کند:

. (5.10)

2) اگر تمام مقادیر گزینه بر یک عدد ثابت تقسیم شود، میانگین مربع انحرافات از این مقدار یک ضریب و انحراف استاندارد با یک ضریب کاهش می یابد.

. (5.11)

3) اگر مجذور میانگین انحرافات را از هر مقداری که به یک درجه یا آن درجه با میانگین حسابی متفاوت است محاسبه کنید، آنگاه همیشه از میانگین مجذور انحرافات محاسبه شده از میانگین حسابی بیشتر خواهد بود:

یعنی مجذور میانگین انحرافات به مجذور اختلاف بین میانگین و این مقدار معمولی بزرگتر خواهد بود، یعنی. بر :

واریانس از میانگین دارد ویژگی حداقلی، یعنی همیشه کمتر از واریانس های محاسبه شده از هر کمیت دیگر است. در این حالت، زمانی که برابر با صفر باشد، فرمول به شکل زیر است:

. (5.14)

با استفاده از خاصیت دوم پراکندگی، تقسیم همه گزینه ها بر مقدار بازه، فرمول زیر را برای محاسبه پراکندگی در سری تغییراتبا در فواصل مساویبر اساس روش لحظه ای:

, (5.15)

پراکندگی با استفاده از روش لحظه ها در کجا محاسبه می شود.

شاخص های تنوعهنگام مطالعه یک ویژگی متفاوت در میان واحدهای یک جمعیت، نمی‌توان خود را به محاسبه مقدار متوسط ​​از انواع مختلف محدود کرد، زیرا ممکن است همان میانگین برای جمعیت‌هایی با ترکیب یکسان اعمال نشود.

تنوع یک ویژگی، تفاوت در مقادیر فردی یک ویژگی در جمعیت مورد مطالعه است.

اصطلاح "تغییر" از کلمه لاتین variatio گرفته شده است - تغییر، نوسان، تفاوت. با این حال، همه تفاوت ها معمولاً تنوع نامیده نمی شوند.

تنوع در آمار به عنوان چنین تغییرات کمی در مقدار مشخصه مورد مطالعه در یک جمعیت همگن درک می شود که ناشی از تأثیر متقاطع عمل است. عوامل مختلف. تنوع مقادیر فردی با شاخص های تغییر مشخص می شود. هرچه این تنوع بیشتر باشد، به طور متوسط ​​مقادیر فردی از هم دورتر هستند.

بین تنوع یک صفت در مطلق و ارزش های نسبی.

شاخص های مطلق عبارتند از: دامنه تغییرات، میانگین انحراف خطی، انحراف استاندارد، پراکندگی. همه شاخص های مطلقابعادی مشابه با کمیت های مورد مطالعه دارند.

شاخص های نسبی شامل ضرایب نوسان، انحراف خطیو تغییرات

شاخص ها مطلق هستند.بیایید شاخص های مطلق را که تنوع این صفت را مشخص می کند محاسبه کنیم.

دامنه تغییرات تفاوت بین حداکثر و حداقل مقادیر یک مشخصه است.

R = Xmax - Xmin.

نشانگر دامنه تغییرات همیشه قابل اجرا نیست، زیرا فقط مقادیر شدید یک مشخصه را در نظر می گیرد که می تواند بسیار متفاوت از همه واحدهای دیگر باشد.

می توان با استفاده از شاخص هایی که انحراف همه گزینه ها از میانگین حسابی را در نظر می گیرند، تغییرات را با دقت بیشتری تعیین کرد.

در آمار دو شاخص وجود دارد: میانگین خطی و انحراف معیار.

میانگین انحراف خطی (L) نشان دهنده میانگین حسابی مقادیر مطلق انحراف گزینه های فردی از میانگین است.

استفاده عملی از میانگین انحراف خطی به شرح زیر است: با کمک این شاخص ترکیب کارگران، ریتم تولید و یکنواختی عرضه مواد مورد تجزیه و تحلیل قرار می گیرد.

عیب این شاخص این است که محاسبات از نوع احتمالی را پیچیده می کند و استفاده از روش های آمار ریاضی را پیچیده می کند.

انحراف معیار () رایج ترین و پذیرفته شده ترین معیار تغییر است. کمی بزرگتر از میانگین انحراف خطی است. برای توزیع های نامتقارن متوسط، رابطه زیر بین آنها برقرار است

برای محاسبه آن، هر انحراف از میانگین مجذور می شود، تمام مربع ها (با در نظر گرفتن وزن) جمع می شوند، پس از آن مجموع مربع ها بر تعداد عبارت های سری تقسیم می شود و ریشه دوم از ضریب استخراج می شود. .

تمام این اقدامات با فرمول زیر بیان می شود

آن ها انحراف معیار جذر میانگین حسابی مجذورات انحراف از میانگین است.

انحراف معیار معیاری برای پایایی میانگین است. هرچه σ کوچکتر باشد، میانگین حسابی کل جمعیت ارائه شده را بهتر نشان می دهد.

میانگین حسابی مجذور انحراف مقادیر متغیر یک مشخصه از مقدار متوسط، پراکندگی () نامیده می شود که با استفاده از فرمول ها محاسبه می شود.

ویژگی متمایز این شاخصاین است که هنگام مربع () وزن مخصوصانحرافات کوچک کاهش می یابد و انحرافات بزرگ در کل مقدار انحرافات افزایش می یابد.

واریانس دارای تعدادی ویژگی است که برخی از آنها محاسبه را آسان تر می کند:

1. واریانس یک مقدار ثابت 0 است.

اگر پس و .

سپس .

2. اگر همه انواع مقادیر مشخصه (x) با یک عدد کاهش یابد، واریانس کاهش نخواهد یافت.

اجازه دهید ، اما پس از آن مطابق با خواص میانگین حسابی و .

واریانس در سری جدید برابر خواهد بود

آن ها واریانس در سری برابر با واریانس سری اصلی است.

3. اگر همه انواع مقادیر مشخصه به همان تعداد (k بار) کاهش یابد، واریانس k2 برابر کاهش می یابد.

بگذار پس و .

واریانس سری جدید برابر خواهد بود

4. واریانس محاسبه شده در رابطه با میانگین حسابی حداقل است. میانگین مجذور انحرافات محاسبه شده با توجه به یک عدد دلخواه بیشتر از واریانس محاسبه شده با توجه به میانگین حسابی با مجذور اختلاف بین میانگین حسابی و عدد است، یعنی. . واریانس از میانگین دارای خاصیت حداقلی است، یعنی. همیشه کمتر از واریانس های محاسبه شده از هر کمیت دیگر است. در این حالت، وقتی 0 را برابر می کنیم و بنابراین انحرافات را محاسبه نمی کنیم، فرمول به شکل زیر می شود:

محاسبه شاخص های تغییرات برای ویژگی های کمی در بالا مورد بحث قرار گرفت، اما در محاسبات اقتصادی ممکن است وظیفه ارزیابی تغییرات ویژگی های کیفی تعیین شود. . به عنوان مثال، هنگام مطالعه کیفیت محصولات تولیدی، محصولات را می توان به کیفیت بالا و معیوب تقسیم کرد.

در این مورد، ما در مورد ویژگی های جایگزین صحبت می کنیم.

ویژگی‌های جایگزین آن‌هایی هستند که برخی از واحدهای جمعیت دارای آن هستند و برخی دیگر ندارند. به عنوان مثال، وجود تجربه صنعتی در بین متقاضیان، مدرک تحصیلیاز اساتید دانشگاه و غیره وجود یک مشخصه در واحدهای جمعیتی به طور متعارف با 1 و عدم وجود آن با 0 نشان داده می شود. سپس، اگر نسبت واحدهای دارای مشخصه (در تعداد کل واحدهای جمعیتی) با p نشان داده شود، و نسبت واحدهای فاقد این مشخصه باشد. با داشتن مشخصه توسط q، واریانس مشخصه جایگزین را می توان با محاسبه کرد قانون کلی. در این مورد، p + q = 1 و بنابراین، q = 1– p.

ابتدا مقدار متوسط ​​ویژگی جایگزین را محاسبه می کنیم:

بیایید مقدار میانگین مشخصه جایگزین را محاسبه کنیم

,

آن ها مقدار متوسط ​​یک مشخصه جایگزین برابر با نسبت واحدهای دارای این ویژگی است.

واریانس مشخصه جایگزین برابر خواهد بود با:

بنابراین، واریانس یک مشخصه جایگزین برابر است با حاصلضرب نسبت واحدهای دارای این مشخصه با نسبت واحدهایی که این ویژگی را ندارند.

و انحراف معیار برابر با = خواهد بود.

شاخص ها نسبی هستند.به منظور مقایسه تغییرپذیری ویژگی‌های مختلف در یک جمعیت یا هنگام مقایسه تغییرپذیری یک ویژگی در چندین جمعیت، شاخص‌های تنوع بیان شده در مقادیر نسبی مورد توجه است. مبنای مقایسه، میانگین حسابی است. این شاخص ها به عنوان نسبت دامنه تغییرات، میانگین انحراف خطی یا انحراف استاندارد به میانگین حسابی یا میانه محاسبه می شوند.

اغلب آنها به صورت درصد بیان می شوند و نه تنها ارزیابی مقایسه ای تنوع را تعیین می کنند، بلکه همگنی جمعیت را نیز مشخص می کنند. اگر ضریب تغییرات از 33% تجاوز نکند، جمعیت همگن در نظر گرفته می شود. شاخص های نسبی تنوع زیر متمایز می شوند:

1. ضریب نوسان منعکس کننده نوسان نسبی مقادیر شدید یک مشخصه حول میانگین است.

3. ضریب تغییرات، معمول بودن مقادیر متوسط ​​را ارزیابی می کند.

.

هرچه کوچکتر باشد، جمعیت از نظر ویژگی مورد مطالعه همگن تر و میانگین معمول تر است. اگر ≤33٪ باشد، توزیع نزدیک به نرمال است و جمعیت همگن در نظر گرفته می شود. از مثال بالا، جمعیت دوم همگن است.

انواع واریانس ها و قانون اضافه کردن واریانس ها.همراه با مطالعه تنوع یک صفت در کل جمعیت، اغلب لازم است تغییرات کمی در ویژگی در گروه هایی که جمعیت به آنها تقسیم شده و همچنین بین گروه ها ردیابی شود. این مطالعه تغییرات از طریق محاسبه و تجزیه و تحلیل به دست می آید انواع مختلفواریانس ها

در این مورد، می توان سه شاخص تغییرپذیری یک علامت را در مجموع تعیین کرد:

1. تنوع کلی یک مجموعه که از عمل همه علل ناشی می شود. این تغییر را می توان با واریانس کل اندازه گیری کرد () که انحراف مقادیر فردی یک مشخصه جمعیت را از میانگین کلی مشخص می کند.

.

2. تغییر میانگین های گروه، بیان انحراف میانگین های گروه از میانگین عمومی و منعکس کننده تأثیر عاملی که توسط آن گروه بندی انجام شده است. این تنوع را می توان با به اصطلاح اندازه گیری کرد واریانس بین گروهی(δ2)

,

که در آن میانگین های گروهی وجود دارد، a میانگین کلی کل جمعیت و تعداد گروه های فردی است.

3. تغییر باقیمانده (یا درون گروهی)، که در انحراف مقادیر فردی ویژگی در هر گروه از میانگین گروه آنها بیان می شود و بنابراین، تأثیر همه عوامل دیگر به جز عامل گروه بندی را منعکس می کند. از آنجایی که تغییرات در هر گروه با واریانس گروه منعکس می شود

,

سپس برای کل جمعیت، تغییرات باقیمانده با میانگین واریانس گروه منعکس خواهد شد. این واریانس میانگین واریانس های درون گروهی () نامیده می شود و با استفاده از فرمول محاسبه می شود

این برابری که یک اثبات کاملاً ریاضی دارد، به عنوان قانون جمع واریانس شناخته می شود.

قانون اضافه کردن واریانس به شما امکان می دهد واریانس کل را از اجزای آن بیابید زمانی که مقادیر فردی یک مشخصه ناشناخته هستند و فقط شاخص های گروه در دسترس هستند.

ضریب تعیین.قانون جمع واریانس به شما امکان می دهد وابستگی نتایج را به عوامل خاصی با استفاده از ضریب تعیین شناسایی کنید.

این تأثیر مشخصه ای را مشخص می کند که اساس گروه را بر تغییر ویژگی حاصل تشکیل می دهد. نسبت همبستگی از 0 تا 1 متغیر است. اگر، مشخصه حاصل فقط بسته به مشخصه زیربنایی گروه بندی تغییر می کند و تأثیر سایر ویژگی های فاکتوریل صفر است.

شاخص های عدم تقارن و کشیدگی.در زمینه پدیده های اقتصادی، سریال های کاملاً متقارن بسیار نادر هستند.

در آمار، چندین شاخص برای توصیف عدم تقارن استفاده می شود. اگر در نظر بگیریم که در یک سری متقارن، میانگین حسابی از نظر مقدار با حالت و میانه منطبق است، آنگاه بیشترین مقدار نشانگر سادهعدم تقارن () تفاوت بین میانگین حسابی و حالت خواهد بود، یعنی.

مقدار کشیدگی با استفاده از فرمول محاسبه می شود

اگر > 0، کشش مثبت در نظر گرفته می شود (توزیع به اوج می رسد)، اگر<0, то эксцесс считается отрицательным (распределение низковершинно).

تنوع تعیین می کندتفاوت در مقادیر یک مشخصه در بین واحدهای مختلف یک جمعیت معین در یک دوره زمانی (نقطه زمانی). تنوع ناشی از شرایط مختلف وجود واحدهای مختلف جمعیت است. به عنوان مثال، حتی دوقلوها در طول زندگی خود تفاوت هایی در قد، وزن و همچنین در ویژگی هایی مانند سطح تحصیلات، درآمد، تعداد فرزندان و غیره به دست می آورند.

تنوع در نتیجه این واقعیت ایجاد می شود که مقادیر خود ویژگی تحت تأثیر کلی شرایط مختلف شکل می گیرند که در هر مورد به روش های مختلف ترکیب می شوند. بنابراین، ارزش هر گزینه عینی است.

تنوع مشخصهبه همه پدیده های طبیعت و جامعه، بدون استثنا، به جز معانی هنجاری تثبیت شده قانونی خصوصیات اجتماعی فردی. مطالعات تنوع در آمار از اهمیت زیادی برخوردار است، آنها به درک ماهیت پدیده مورد مطالعه کمک می کنند. یافتن تنوع، یافتن علل آن، شناسایی تأثیر عوامل فردی اطلاعات مهمی را برای اجرای تصمیمات مدیریتی مبتنی بر علمی ارائه می دهد.

مقدار متوسط ​​یک ویژگی تعمیم یافته از ویژگی جمعیت می دهد، اما ساختار آن را آشکار نمی کند. مقدار متوسط ​​نشان نمی دهد که چگونه متغیرهای مشخصه میانگین در اطراف آن قرار گرفته اند، خواه نزدیک به میانگین توزیع شده باشند یا از آن منحرف شوند. میانگین در دو جمعیت ممکن است یکسان باشد، اما در یک نسخه، همه مقادیر فردی با آن تفاوت ناچیزی دارند، و در دیگری، این تفاوت ها زیاد است، یعنی. در مورد اول، تنوع مشخصه کم است، و در مورد دوم، این برای مشخص کردن اهمیت مقدار متوسط ​​بسیار مهم است.

برای اینکه رئیس یک سازمان، یک مدیر یا یک محقق به مطالعه تغییرات و مدیریت آن بپردازد، آمار روش‌های خاصی را برای مطالعه تغییرات (سیستمی از شاخص‌ها) ایجاد کرده است. با کمک آنها، تنوع پیدا می شود و خواص آن مشخص می شود. شاخص های تنوع شامل : دامنه تغییرات، میانگین انحراف خطی، ضریب تغییرات.

سری تغییرات و اشکال آن

سری واریاسیون- این توزیع مرتب واحدهای یک جمعیت است که اغلب بر اساس مقادیر افزایشی (کمتر کاهشی) یک مشخصه و شمارش تعداد واحدها با مقدار خاصی از مشخصه است. زمانی که تعداد واحدهای جمعیتی زیاد باشد، سری رتبه بندی شده دست و پا گیر می شود و ساخت آن زمان زیادی می برد. در چنین شرایطی، یک سری تغییرات با گروه بندی واحدهای جمعیت بر اساس مقادیر مشخصه مورد مطالعه ساخته می شود.

موارد زیر وجود دارد فرم های سری تغییرات :

  1. سریال های رتبه بندی شدهفهرستی از واحدهای فردی جمعیت را به ترتیب صعودی (نزولی) مشخصه مورد مطالعه نشان می دهد.
  2. سری تغییرات گسسته - این یک جدول متشکل از دو خط یا نمودار است: مقادیر خاص مشخصه متغیر x و تعداد واحدهای جمعیت با مقدار معین f - مشخصه فرکانس. زمانی ساخته می شود که ویژگی بیشترین تعداد مقادیر را به خود بگیرد.
  3. سری فاصله.

دامنه تغییرات تعیین می شودبه عنوان قدر مطلق تفاوت بین حداکثر و حداقل مقادیر (انواع) مشخصه:

دامنه تنوع را نشان می دهد فقط انحرافات شدید از ویژگی است و منعکس کننده انحراف فردی از همه گزینه های مجموعه نیست. این محدودیت‌های تغییر در یک مشخصه متغیر را مشخص می‌کند و به نوسانات دو گزینه شدید وابسته است و مطلقاً به فرکانس‌های سری تغییرات مربوط نمی‌شود، یعنی به ماهیت توزیع، که به این مقدار یک کاراکتر تصادفی می‌دهد. برای تجزیه و تحلیل تنوع، به یک شاخص نیاز دارید که تمام نوسانات در ویژگی تغییرات را منعکس کند و یک ویژگی کلی ارائه دهد. ساده ترین شاخص این نوع انحراف خطی متوسط ​​است.

تغییر -این تفاوت در مقادیر هر مشخصه در بین واحدهای مختلف یک جمعیت معین در یک دوره یا نقطه زمانی است. شاخص های تغییرات عبارتند از: دامنه تغییرات، میانگین انحراف خطی، پراکندگی و انحراف استاندارد، ضریب تغییرات.

شاخص های مطلق:
محدوده تغییرات R،نشان دهنده تفاوت بین مقادیر حداکثر و حداقل صفت: .

دامنه تغییرات فقط انحرافات شدید صفت را نشان می دهد و انحراف همه انواع این سری را منعکس نمی کند. هنگام مطالعه تنوع، نمی توان خود را تنها به تعیین دامنه آن محدود کرد. برای تجزیه و تحلیل تنوع، شاخصی مورد نیاز است که تمام نوسانات مشخصه متغیر را منعکس کند و یک مشخصه تعمیم یافته بدهد. ساده ترین شاخص این نوع انحراف خطی متوسط ​​است.

میانگین انحراف خطینشان دهنده میانگین حسابی مقادیر مطلق انحراف گزینه های فردی از میانگین حسابی آنها است (همیشه فرض می شود که میانگین از گزینه کم می شود: ()).

میانگین انحراف خطی برای داده های گروه بندی نشده:

,

جایی که n- تعداد اعضای مجموعه؛ برای داده های گروه بندی شده:

,

مجموع فرکانس های سری تغییرات کجاست.

پراکندگیمشخصه میانگین مربع انحراف گزینه ها از مقدار متوسط ​​آنها است که با استفاده از فرمول های واریانس های ساده و وزنی (بسته به داده های اولیه) محاسبه می شود.

واریانس ساده برای داده های گروه بندی نشده:

;

واریانس وزنی برای یک سری تغییرات:

.

پراکندگی خواص خاصی دارد که دو مورد از آنها عبارتند از:

1) اگر تمام مقادیر یک مشخصه با همان مقدار ثابت A کاهش یا افزایش یابد، در نتیجه پراکندگی تغییر نخواهد کرد.

2) اگر تمام مقادیر مشخصه به همان تعداد بار (i بار) کاهش یا افزایش یابد.

سپس پراکندگی به ترتیب کاهش یا افزایش می یابد. با استفاده از خاصیت دوم پراکندگی، تقسیم تمام گزینه ها بر مقدار فاصله، می توانید یک فرمول محاسبه به دست آورید. پراکندگی در سری تغییرات با فواصل مساوی بر اساس روش گشتاورها:

,

واریانس با استفاده از روش لحظه ها در کجا محاسبه می شود.

i - مقدار فاصله؛

- مقادیر جدید (تبدیل شده) گزینه ها (A یک صفر شرطی است که برای آن استفاده از وسط بازه با بالاترین فرکانس راحت است).

- لحظه مرتبه دوم؛

مربع لحظه مرتبه اول است.

انحراف معیاربرابر با جذر واریانس: برای داده های گروه بندی نشده:


,

برای سری تغییرات:


.

انحراف معیار یک مشخصه کلی از اندازه تغییرات یک مشخصه در کل است. نشان می دهد که به طور متوسط ​​​​گزینه های خاص چقدر از مقدار متوسط ​​خود انحراف دارند. معیار مطلق تغییرپذیری یک مشخصه است و در واحدهای مشابه انواع مختلف بیان می شود، بنابراین از نظر اقتصادی به خوبی تفسیر می شود.

شاخص های نسبی:
ضریب تغییراتنشان دهنده نسبت انحراف استاندارد به میانگین حسابی است که به صورت درصد بیان می شود:

.

از ضریب تغییرات نیز به عنوان مشخصه همگنی جمعیت استفاده می شود. اگر، پس نوسان ناچیز است، اگر، آنگاه نوسان متوسط-متوسط ​​است، اگر، پس نوسان قابل توجه است، اگر، جمعیت همگن است.

ضریب نوسان:

.

انحراف خطی نسبی:

.

تنوع ویژگی ها ناشی از عوامل مختلفی است که در صورت تقسیم جامعه آماری بر حسب هر ویژگی به گروه هایی می توان برخی از این عوامل را شناسایی کرد. سپس، همراه با مطالعه تنوع یک صفت در کل جمعیت به عنوان یک کل، امکان مطالعه تنوع برای هر یک از گروه های تشکیل دهنده آن و همچنین بین این گروه ها فراهم می شود. در ساده ترین حالت، زمانی که جامعه بر اساس یک عامل به گروه ها تقسیم می شود، مطالعه تنوع از طریق محاسبه و تجزیه و تحلیل سه نوع واریانس حاصل می شود: کل، بین گروهی و درون گروهی.

واریانس کلتغییرات یک صفت را در کل جمعیت تحت تأثیر همه عواملی که باعث این تنوع شده اند اندازه گیری می کند. برابر با میانگین مجذور انحراف مقادیر فردی ویژگی x از مقدار میانگین کلی است و می تواند به صورت واریانس ساده یا واریانس وزنی محاسبه شود.

واریانس بین گروهیتغییر سیستماتیک مشخصه حاصل را به دلیل تأثیر علامت عامل که اساس گروه را تشکیل می دهد مشخص می کند. برابر است با مجذور میانگین انحراف میانگین های گروهی (جزئی) از میانگین کلی:

,

که در آن f تعداد واحدهای گروه است.

واریانس درون گروهی (جزئی).منعکس کننده تغییرات تصادفی است، به عنوان مثال. بخشی از تغییرات ناشی از تأثیر عوامل حساب نشده و مستقل از ویژگی عاملی است که اساس گروه را تشکیل می دهد. این برابر است با میانگین مربع انحراف مقادیر فردی یک مشخصه در گروه x از میانگین حسابی این گروه x i (میانگین گروه) و می تواند به عنوان یک واریانس ساده محاسبه شود.

یا به صورت واریانس وزنی

بر اساس واریانس درون گروهی برای هر گروه، یعنی. بر این اساس می توان میانگین کلی واریانس های درون گروهی را تعیین کرد: .

مطابق با قانون اضافه کردن واریانس هاواریانس کل برابر است با مجموع میانگین واریانس های درون گروهی و بین گروهی:

.

با استفاده از قانون اضافه کردن واریانس ها، همیشه می توانید سومین – مجهول – را از دو واریانس شناخته شده تعیین کنید. هر چه سهم واریانس بین گروهی در واریانس کل بیشتر باشد، تأثیر مشخصه گروه بندی بر مشخصه مورد مطالعه قوی تر است.

از این رو در تجزیه و تحلیل های آماری بسیار مورد استفاده قرار می گیرد ضریب تعیین تجربی- یک شاخص نشان دهنده سهم واریانس بین گروهی در کل واریانس مشخصه حاصل و مشخص کننده قدرت تأثیر مشخصه گروه بندی در شکل گیری تغییرات کلی:

.

ضریب تعیین تجربی نسبت تغییرات در مشخصه حاصل را نشان می دهد درتحت تأثیر یک علامت عامل ایکس(بقیه تغییرات کل در y به دلیل تغییرات در سایر عوامل است). در صورت عدم وجود اتصال، ضریب تعیین تجربی صفر و در مورد اتصال عملکردی، یک است.

رابطه همبستگی تجربیجذر ضریب تعیین تجربی است: .

این ارتباط نزدیک بین گروه بندی و ویژگی های عملکرد را نشان می دهد. نسبت همبستگی تجربی می تواند مقادیری از 0 تا 1 داشته باشد. اگر ارتباطی وجود نداشته باشد، نسبت همبستگی صفر است، یعنی. تمام میانگین های گروه با یکدیگر برابر خواهند بود، هیچ گونه تنوع بین گروهی وجود نخواهد داشت. این بدان معنی است که مشخصه گروه بندی به هیچ وجه بر شکل گیری تنوع کلی تأثیر نمی گذارد. اگر اتصال عملکردی باشد، نسبت همبستگی برابر با یک خواهد بود. در این حالت، واریانس میانگین های گروه برابر با واریانس کل است، یعنی. هیچ تغییر درون گروهی وجود نخواهد داشت. این بدان معنی است که مشخصه گروه بندی به طور کامل تغییر ویژگی حاصل را که مورد مطالعه قرار می گیرد تعیین می کند. هر چه مقدار نسبت همبستگی به یک نزدیک‌تر باشد، به وابستگی عملکردی نزدیک‌تر، ارتباط بین ویژگی‌ها نزدیک‌تر است.

وظیفه 2. شاخص های نسبی

گزینه 10. داده های جمعیت و قلمرو سال 1999 زیر برای دو کشور موجود است:

یک کشور

جمعیت (میلیون نفر)

قلمرو (هزار کیلومتر 2)

مولداوی

64.6

اوکراین

49.7

603.7

تعريف كردن:

    تراکم جمعیت برای هر دو کشور

    مقایسه نسبی بر اساس اندازه جمعیت.

    راه حل

    تراکم جمعیت به عنوان یک شاخص شدت نسبی (RII) محاسبه می شود که درجه توزیع یا سطح توسعه یک پدیده خاص را در یک محیط خاص مشخص می کند. به عنوان نسبت شاخص مشخص کننده پدیده به شاخص مشخص کننده محیطی که پدیده در آن گسترش می یابد محاسبه می شود.

    OPI مولداوی = نفر/کیلومتر 2. آن ها تراکم جمعیت مولداوی 31.15 نفر در هر کیلومتر مربع است.

    OPI آذربایجان = نفر/کیلومتر 2. آن ها تراکم جمعیت اوکراین 82.33 نفر در هر کیلومتر مربع است.

    OPSr= . آن ها قلمرو اوکراین 20708 برابر (یا 1970 درصد) بزرگتر از قلمرو مولداوی است.

    وظیفه 3. شاخص های متوسط

    گزینه 10. داده های زیر در مورد توزیع تعداد زنان بیکار ثبت شده توسط خدمات استخدامی بر اساس گروه سنی در پایان سال 1999 (هزار نفر) موجود است:

    سن

    کمتر از 20

    20-25

    25-30

    30-35

    35-40

    40-45

    45-50

    50 و بالاتر

    تعداد بیکاران

    12,7

    11,3

    میانگین سنی بیکاران ثبت شده را بیابید.

    راه حل

    برای محاسبه میانگین حسابی یک سری بازه، ابتدا باید به یک سری گسسته شرطی از مقادیر میانگین بازه ها بروید. اگر فواصل بدون تعیین حد پایین یا حد بالا (50 و بالاتر) وجود داشته باشد، مقدار مربوطه طوری تنظیم می شود که یک سری با فواصل مساوی به دست می آید. در این مورد، سری گسسته شرطی به شکل زیر است:

    سن

    17,5

    22,5

    27,5

    32,5

    37,5

    42,5

    47,5

    52,5

    جمعیت

    12,7

    11,3


    ,

    جایی که x iمن-مقدار صفت،

    n من- فرکانس x i, ک- تعداد مقادیر مختلف صفت در مجموع.

    . آن ها میانگین سنی 35.0 سال است.

    وظیفه 4. سری پویا

    گزینه 10. داده های زیر در مورد پویایی میانگین جمعیت سالانه اوکراین (میلیون نفر) موجود است:

    سال ها

    1995

    1996

    1997

    1998

    1999

    جمعیت

    51,3

    50,9

    50,4

    50,0

    49,7

    تعريف كردن:

    افزایش مطلق (زنجیری و پایه).

    میانگین افزایش مطلق

    نرخ رشد (زنجیره و پایه).

    نرخ رشد (زنجیره و پایه).

    ارزش مطلق 1 درصد افزایش.

  1. متوسط ​​نرخ رشد سالانه.

    راه حل

    رشد مطلق اندازه افزایش یا کاهش پدیده مورد مطالعه در یک دوره زمانی معین را مشخص می کند. به عنوان تفاوت بین این سطح و قبلی (زنجیره) یا اولیه (پایه) تعریف می شود.

    برای سری های زمانی ، شامل n+1سطوح، افزایش مطلق به شرح زیر تعیین می شود:

    زنجیره، جایی که سطح فعلی ردیف است، سطح قبل از آن است.

    پایه، جایی که سطح فعلی سریال است، سطح اولیه سریال است.

    (میلیون نفر)

    (میلیون نفر)

    (میلیون نفر)

    (میلیون نفر)

    (میلیون نفر)

    (میلیون نفر)

    (میلیون نفر)

    (میلیون نفر)

    میانگین افزایش مطلق با استفاده از فرمول محاسبه می شود

    ,

    سطح نهایی سریال کجاست

    یعنی میانگین سالانه جمعیت اوکراین در یک دوره زمانی معین به طور متوسط ​​0.4 میلیون نفر در سال کاهش یافته است.

    نرخ رشد نسبت یک سطح معین از یک پدیده به سطح قبلی (زنجیره ای) یا اولیه (پایه) است که به صورت درصد بیان می شود. نرخ رشد با استفاده از فرمول های زیر محاسبه می شود:

    زنجیر

    پایه ای

    نرخ رشد نسبت رشد مطلق به سطح قبلی (زنجیره ای) یا اولیه (پایه) است که به صورت درصد بیان می شود. نرخ رشد با استفاده از فرمول های زیر محاسبه می شود:

    زنجیر .

2. تنوع یک صفت جایگزین

3. انواع واریانس. قانون جمع واریانس

4. قانون برای اضافه کردن واریانس برای یک مشخصه جایگزین

تفاوت در مقدار یک مشخصه در واحدهای منفرد از جمعیت ثبت شده در طول مشاهده آماری، تغییر ویژگی نامیده می شود. با درجه تنوع یک ویژگی، می توان فرآیندهای توسعه پدیده های مورد مطالعه و معمولی بودن مقادیر متوسط ​​را قضاوت کرد. واقعیت این است که مقدار متوسط ​​یک ویژگی تعمیم‌دهنده ویژگی جمعیت مورد مطالعه را می‌دهد، اما ساختار جمعیت را آشکار نمی‌کند.

این نشان نمی دهد که چگونه انواع مشخصه میانگین نسبت به آن قرار دارد - آیا آنها نزدیک به میانگین متمرکز هستند یا به طور قابل توجهی از آن انحراف دارند. مقدار متوسط ​​یک صفت در دو جمعیت ممکن است یکسان باشد، اما در یک مورد ممکن است همه مقادیر فردی با آن تفاوت کمی داشته باشد و در مورد دیگر، این تفاوت ها می تواند زیاد باشد، یعنی در یک مورد تنوع صفت کم است. و در دیگری بزرگ است که برای مشخص کردن قابلیت اطمینان متوسط ​​اهمیت زیادی دارد.

برای تعیین اندازه تغییر یک مشخصه در آمار، از مقادیر مطلق و نسبی استفاده می شود. شاخص های تنوع.

به شاخص های مطلق تنوعشامل: محدوده تغییرات، میانگین انحراف خطی، پراکندگی، انحراف استاندارد.

محدوده تغییرات (R)ساده ترین شاخص مطلق تغییرات است و نشان دهنده تفاوت بین حداکثر و حداقل مقدار مشخصه است:

جایی که X max -حداکثر مقدار مشخصه در مجموع؛

X دقیقه -حداقل مقدار مشخصه در مجموع.

بزرگی دامنه تغییرات فقط به مقادیر شدید بستگی دارد که تمام تغییرات در ویژگی های مختلف در جمعیت مورد مطالعه را در نظر می گیرد. بنابراین، هنگام مطالعه تنوع، نمی توان خود را به محاسبه تنها این شاخص محدود کرد. برای تجزیه و تحلیل تنوع، به شاخص هایی نیاز است که ماهیت تعمیم یافته همه نوسانات مشخصه های مختلف را نشان دهد.

میانگین انحراف خطی ساده ترین شاخص این نوع است و نشان دهنده میانگین مقدار انحرافات مطلق مقادیر فردی یک مشخصه از میانگین حسابی آنها است.

میانگین انحراف خطی برای داده های گروه بندی نشده با فرمول (5.2) تعیین می شود:

میانگین انحراف خطی برای داده های گروه بندی شده به صورت زیر محاسبه می شود (5.3):

باید توجه داشت که میانگین انحراف خطی همیشه میزان تغییرات در مقادیر ویژگی را نشان نمی دهد. بنابراین، آمار از یک شاخص تعمیم دهنده حساس تر - پراکندگی استفاده می کند. پراکندگی میانگین مربع انحراف مقادیر فردی یک صفت از مقدار متوسط ​​آنها است. مربع سازی به شما امکان می دهد تفاوت در میزان انحرافات را به شدت افزایش دهید.


واریانس داده های گروه بندی نشده با استفاده از فرمول (5.4) محاسبه می شود:

واریانس برای داده های گروه بندی شده به صورت زیر محاسبه می شود (5.5):

برای محاسبه پراکندگی از فرمول زیر (5.6) نیز استفاده می شود:

انحراف معیار جذر واریانس (5.7) یا (5.8) است:

انحراف استاندارد، و همچنین میانگین انحراف خطی، نشان می دهد که به طور متوسط ​​مقادیر فردی یک مشخصه چقدر با مقدار متوسط ​​آنها متفاوت است. با این حال، مقدار انحراف استاندارد در همه موارد از میانگین خطی فراتر می رود، زیرا نسبت به تغییرات حساسیت بیشتری نشان می دهد. برای توزیع های متقارن و نسبتاً نامتقارن، رابطه زیر (5.9) برقرار است:

دامنه تغییرات، میانگین انحراف خطی و انحراف استاندارد با اعداد نام‌گذاری شده بیان می‌شوند، یعنی یک واحد اندازه‌گیری دارند (همان مقادیر مشخصه). بنابراین، نمی‌توان آنها را مستقیماً برای مقایسه درجه تنوع برای یک صفت در دو گروه با سطوح مختلف میانگین یا برای مقایسه تغییرات دو صفت مختلف در یک گروه استفاده کرد. در این موارد، از شاخص های نسبی تغییرات زیر استفاده می شود.

ضریب نوسان(5.10)

انحراف خطی نسبی(ضریب تغییرات خطی) (5.11):

ضریب تغییر(5.12):

ضریب تغییرات نه تنها به دست آوردن یک ویژگی تعمیم یافته از تنوع یک مشخصه در یک جمعیت امکان پذیر می شود، بلکه نتیجه گیری در مورد همگن بودن جمعیت را امکان پذیر می کند اگر ضریب تغییرات بیشتر نباشد 33% مقادیر متوسط ​​محاسبه شده برای یک جمعیت همگن مشخصه های به اندازه کافی قابل اعتماد هستند.

تنوع صفت جایگزین

در آمار، علاوه بر شاخص های تنوع ویژگی های کمی، شاخص های تنوع ویژگی های کیفی به طور گسترده ای استفاده می شود (به ویژه، هنگام طراحی مشاهدات نمونه). تغییر یک مشخصه جایگزین از نظر کمی در مقدار 0 (صفر) برای واحدهایی که این مشخصه را ندارند، یا 1 (واحد) برای واحدهایی که این ویژگی را دارند آشکار می شود. فرض کنید p نسبت واحدهایی در جمعیت باشد که این ویژگی را دارند، q- نسبت واحدهایی که این ویژگی را ندارند، با p + q = 1 .

مقدار متوسط ​​یک ویژگی جایگزینما با استفاده از فرمول میانگین حسابی (5.13) تعیین می کنیم:

واریانس صفت جایگزینبا فرمول (5.14) تعیین می شود:

بنابراین، مقدار متوسط ​​یک مشخصه جایگزین برابر است با سهم آن در یک جمعیت معین، و واریانس حاصلضرب سهم حضور و سهم عدم آن است. حداکثر مقدار واریانس مشخصه جایگزین، به معنای حداکثر ناهمگنی جمعیت، 0.25 در p = 0.5 است.



مقالات مشابه

parki48.ru 2024. ما در حال ساخت یک خانه قاب هستیم. طراحی منظر. ساخت و ساز. پایه.