چه چیزی واریانس مقدار مشاهده شده را نشان می دهد. واریانس و انحراف معیار در MS EXCEL

در میان بسیاری از شاخص هایی که در آمار استفاده می شود، لازم است محاسبه واریانس برجسته شود. لازم به ذکر است که انجام دستی این محاسبه یک کار نسبتا خسته کننده است. خوشبختانه، توابعی در اکسل وجود دارد که به شما امکان می دهد روش محاسبه را خودکار کنید. بیایید الگوریتم کار با این ابزارها را دریابیم.

واریانس معیاری از تغییرات است که مجذور میانگین انحرافات از آن است انتظارات ریاضی. بنابراین، گسترش اعداد را در مورد میانگین بیان می کند. محاسبه واریانس را می توان به صورت انجام داد جمعیت عمومی، و همچنین به صورت انتخابی.

روش 1: محاسبه بر روی جمعیت عمومی

برای محاسبه این شاخصدر اکسل روی جمعیت عمومی، تابع اعمال می شود DISP.G. نحو این عبارت به صورت زیر است:

DISP.G(Number1; Number2;…)

در مجموع، از 1 تا 255 آرگومان قابل اعمال است. آرگومان ها می توانند هم مقادیر عددی و هم ارجاع به سلول هایی باشند که در آنها قرار دارند.

بیایید ببینیم که چگونه این مقدار را برای طیف وسیعی از داده های عددی محاسبه کنیم.


روش 2: محاسبه نمونه

برخلاف محاسبه مقدار برای جمعیت عمومی، در محاسبه برای نمونه، مخرج نشان داده نشده است. جمعاعداد، اما یک عدد کمتر این کار به منظور اصلاح خطا انجام می شود. اکسل این تفاوت های ظریف را در یک تابع ویژه که برای این نوع محاسبه طراحی شده است - DISP.V در نظر می گیرد. نحو آن با فرمول زیر نمایش داده می شود:

VAR.B (شماره 1؛ شماره 2؛…)

تعداد آرگومان ها، مانند تابع قبلی، می تواند از 1 تا 255 متغیر باشد.


همانطور که می بینید، برنامه اکسل قادر است تا حد زیادی محاسبه واریانس را تسهیل کند. این آمار را می توان هم برای جامعه و هم برای نمونه توسط برنامه محاسبه کرد. در این حالت، تمام اقدامات کاربر در واقع فقط به تعیین محدوده اعداد پردازش شده و اصلی کاهش می یابد. کار اکسلخودش انجام می دهد البته این امر باعث صرفه جویی قابل توجهی در زمان کاربران خواهد شد.

این صفحه توضیح می دهد مثال استانداردبرای یافتن واریانس، می توانید به کارهای دیگر نیز برای یافتن آن نگاه کنید

مثال 1. تعیین گروه، میانگین گروه، بین گروهی و واریانس کل

مثال 2. یافتن واریانس و ضریب تغییرات در جدول گروه بندی

مثال 3. یافتن واریانس در سری گسسته

مثال 4. ما داده های زیر را برای یک گروه 20 دانش آموز داریم بخش مکاتبات. ساخت یک سری بازه ای از توزیع ویژگی، محاسبه مقدار میانگین ویژگی و مطالعه واریانس آن ضروری است.

بیایید یک گروه بندی فاصله ای بسازیم. بیایید محدوده بازه را با فرمول تعیین کنیم:

جایی که X max– حداکثر مقدارعلامت گروه بندی؛
Xmin حداقل مقدار ویژگی گروه بندی است.
n تعداد فواصل است:

ما n=5 را می پذیریم. مرحله این است: h \u003d (192 - 159) / 5 \u003d 6.6

بیایید یک گروه بندی فاصله ای ایجاد کنیم

برای محاسبات بیشتر، یک جدول کمکی می سازیم:

X "i - وسط فاصله. (به عنوان مثال، وسط فاصله 159 - 165.6 \u003d 162.3)

میانگین رشد دانش آموزان با فرمول میانگین موزون حسابی تعیین می شود:

پراکندگی را با فرمول تعیین می کنیم:

فرمول را می توان به شکل زیر تبدیل کرد:

از این فرمول نتیجه می شود که واریانس است تفاوت بین میانگین مربع های گزینه ها و مربع و میانگین.

پراکندگی در سری تغییرات با فواصل مساوی با توجه به روش گشتاورها را می توان به روش زیر با استفاده از خاصیت پراکندگی دوم (تقسیم همه گزینه ها بر مقدار بازه) محاسبه کرد. تعریف واریانسمحاسبه شده به روش ممان، طبق فرمول زیر زمان کمتری دارد:

جایی که i مقدار بازه است.
الف - صفر شرطی، که استفاده از وسط بازه با بالاترین فرکانس راحت است.
m1 مربع ممان مرتبه اول است.
m2 - لحظه سفارش دوم

واریانس ویژگی (اگر در جامعه آماری این ویژگی به گونه ای تغییر کند که فقط دو گزینه متقابل وجود داشته باشد، آنگاه چنین متغیری جایگزین نامیده می شود) را می توان با فرمول محاسبه کرد:

تعویض در این فرمولپراکندگی q \u003d 1- p، دریافت می کنیم:

انواع پراکندگی

واریانس کلتغییرات یک صفت را در کل جمعیت تحت تأثیر همه عواملی که باعث این تنوع می شوند اندازه گیری می کند. این برابر است با میانگین مربع انحراف مقادیر فردی ویژگی x از مقدار متوسط ​​کل x و می تواند به عنوان واریانس ساده یا واریانس وزنی تعریف شود.

واریانس درون گروهی تغییرات تصادفی را مشخص می کند، یعنی. بخشی از تغییرات، که به دلیل تأثیر عوامل نامشخص است و به عامل علامت زیربنای گروه بندی بستگی ندارد. این واریانس برابر است با میانگین مجذور انحراف مقادیر فردی صفت در گروه X از میانگین حسابی گروه و می تواند به صورت واریانس ساده یا واریانس وزنی محاسبه شود.



به این ترتیب، اندازه گیری های واریانس درون گروهیتنوع یک صفت در یک گروه و با فرمول تعیین می شود:

جایی که xi - میانگین گروه.
ni تعداد واحدهای گروه است.

به عنوان مثال، واریانس های درون گروهی، که باید در مسئله مطالعه تأثیر صلاحیت های کارگران بر سطح بهره وری نیروی کار در مغازه تعیین شود، تغییرات در تولید را در هر گروه نشان می دهد که ناشی از همه عوامل ممکن است. شرایط فنیتجهیزات، در دسترس بودن ابزار و مواد، سن کارگران، شدت کار، و غیره)، به جز تفاوت در دسته واجد شرایط(در یک گروه، همه کارگران دارای شرایط یکسانی هستند).

همراه با مطالعه تنوع یک صفت در کل جمعیت به عنوان یک کل، اغلب لازم است تغییرات کمی در آن صفت توسط گروه هایی که جمعیت به آنها تقسیم می شود و همچنین بین گروه ها ردیابی شود. این مطالعه تغییرات از طریق محاسبه و تجزیه و تحلیل به دست می آید انواع مختلفپراکندگی
بین پراکندگی کل، بین گروهی و درون گروهی تمایز قائل شوید.
واریانس کل σ 2تغییرات یک صفت را در کل جمعیت تحت تأثیر همه عواملی که باعث این تنوع شده اند اندازه گیری می کند.

واریانس بین گروهی (δ) تنوع سیستماتیک را مشخص می کند، به عنوان مثال. تفاوت در بزرگی صفت مورد مطالعه که تحت تأثیر عامل صفت زیربنایی گروه بندی ایجاد می شود. با فرمول محاسبه می شود:
.

واریانس درون گروهی (σ)منعکس کننده تغییرات تصادفی است، به عنوان مثال. بخشی از تغییراتی که تحت تأثیر عوامل نامشخص رخ می دهد و به عامل صفت زیربنای گروه بندی بستگی ندارد. با فرمول محاسبه می شود:
.

میانگین واریانس های درون گروهی: .

قانونی وجود دارد که 3 نوع پراکندگی را به هم مرتبط می کند. واریانس کل برابر است با مجموع میانگین واریانس های درون گروهی و بین گروهی: .
این نسبت نامیده می شود قانون جمع واریانس.

در تجزیه و تحلیل، یک معیار به طور گسترده استفاده می شود، که نسبت واریانس بین گروهی در واریانس کل است. این نام را یدک می کشد ضریب تعیین تجربی (η 2): .
جذر ضریب تعیین تجربی نامیده می شود نسبت همبستگی تجربی (η):
.
این تأثیر ویژگی زیربنایی گروه بندی را بر تغییر ویژگی حاصل مشخص می کند. نسبت همبستگی تجربی از 0 تا 1 متغیر است.
بیایید آن را نشان دهیم استفاده عملیدر مثال زیر (جدول 1).

مثال شماره 1. جدول 1 - بهره وری نیروی کار دو گروه از کارگران یکی از کارگاه های NPO "Cyclone"

میانگین کل و گروه و واریانس را محاسبه کنید:




داده های اولیه برای محاسبه میانگین پراکندگی درون گروهی و بین گروهی در جدول ارائه شده است. 2.
جدول 2
محاسبه و δ 2 برای دو گروه از کارگران.


گروه های کارگری
تعداد کارگران، نفر. میانگین، det./shift. پراکندگی

آموزش فنی را گذرانده است

5 95 42,0

آموزش فنی ندیده

5 81 231,2

همه کارگران

10 88 185,6
بیایید نمرات را محاسبه کنیم. میانگین واریانس های درون گروهی:
.
واریانس بین گروهی

واریانس کل:
بنابراین، نسبت همبستگی تجربی: .

در کنار تنوع صفات کمی، تنوع صفات کیفی نیز قابل مشاهده است. این مطالعه تغییرات با محاسبه به دست می آید انواع زیرواریانس ها:

واریانس درون گروهی سهم با فرمول تعیین می شود

جایی که n من- تعداد واحدها در گروه های جداگانه.
نسبت صفت مورد مطالعه در کل جمعیت که با فرمول تعیین می شود:
سه نوع پراکندگی به شرح زیر به یکدیگر مرتبط هستند:
.

این نسبت واریانس، قضیه جمع واریانس سهم ویژگی نامیده می شود.

پراکندگی معیاری از پراکندگی است که انحراف نسبی بین مقادیر داده و میانگین را توصیف می کند. این معیار پرکاربردترین معیار پراکندگی در آمار است که با جمع، مجذور، انحراف هر مقدار داده از سایز متوسط. فرمول محاسبه واریانس در زیر نشان داده شده است:

s 2 - واریانس نمونه;

x cf مقدار میانگین نمونه است.

nاندازه نمونه (تعداد مقادیر داده)،

(x i – x cf) انحراف از مقدار میانگین برای هر مقدار از مجموعه داده است.

برای درک بهتر فرمول، اجازه دهید به یک مثال نگاه کنیم. من واقعا آشپزی را دوست ندارم، بنابراین به ندرت آن را انجام می دهم. با این حال، برای اینکه از گرسنگی نمیمیرم، هر از گاهی مجبور می شوم برای اجرای طرح اشباع بدنم از پروتئین، چربی و کربوهیدرات به اجاق گاز بروم. مجموعه داده های زیر نشان می دهد که رنات هر ماه چند بار غذا می پزد:

اولین مرحله در محاسبه واریانس، تعیین میانگین نمونه است که در مثال ما 7.8 بار در ماه است. محاسبات باقی مانده را می توان با کمک جدول زیر تسهیل کرد.

مرحله نهایی محاسبه واریانس به صورت زیر است:

برای کسانی که دوست دارند تمام محاسبات را یکجا انجام دهند، معادله به شکل زیر خواهد بود:

استفاده از روش شمارش خام (مثال آشپزی)

باز هم هست روش موثرمحاسبه واریانس که به روش "شمارش خام" معروف است. اگرچه در نگاه اول این معادله ممکن است کاملاً دست و پا گیر به نظر برسد، در واقع آنقدرها هم ترسناک نیست. شما می توانید این را تأیید کنید، و سپس تصمیم بگیرید که کدام روش را بیشتر دوست دارید.

مجموع هر مقدار داده پس از مربع کردن است،

مجذور مجموع همه مقادیر داده است.

فعلا عقلت رو از دست نده بیایید همه را در قالب یک جدول قرار دهیم و سپس خواهید دید که در اینجا محاسبات کمتری نسبت به مثال قبلی وجود دارد.

همانطور که می بینید، نتیجه همان روش استفاده از روش قبلی است. مزایای این روشبا افزایش حجم نمونه (n) آشکار می شود.

محاسبه واریانس در اکسل

همانطور که احتمالا قبلاً حدس زده اید، اکسل فرمولی دارد که به شما امکان می دهد واریانس را محاسبه کنید. علاوه بر این، با شروع از اکسل 2010، می توانید 4 نوع از فرمول پراکندگی را پیدا کنید:

1) VAR.V - واریانس نمونه را برمی گرداند. مقادیر بولی و متن نادیده گرفته می شوند.

2) VAR.G - واریانس جمعیت را برمی‌گرداند. مقادیر بولی و متن نادیده گرفته می شوند.

3) VASP - واریانس نمونه را با در نظر گرفتن مقادیر بولی و متن برمی‌گرداند.

4) VARP - واریانس جمعیت را با در نظر گرفتن مقادیر منطقی و متنی برمی‌گرداند.

ابتدا، بیایید تفاوت بین یک نمونه و یک جامعه را بررسی کنیم. هدف از آمار توصیفی، خلاصه کردن یا نمایش داده ها به گونه ای است که به سرعت یک تصویر بزرگ، به اصطلاح، یک نمای کلی به دست آید. استنتاج آماری به شما این امکان را می دهد که بر اساس نمونه ای از داده های این جامعه استنباط هایی در مورد یک جمعیت انجام دهید. جمعیت نشان دهنده تمام نتایج یا اندازه گیری های ممکن است که مورد علاقه ما هستند. نمونه زیر مجموعه ای از جامعه است.

به عنوان مثال، ما به مجموع یک گروه از دانشجویان یکی از دانشگاه های روسیه علاقه مند هستیم و باید میانگین نمره گروه را تعیین کنیم. ما می‌توانیم میانگین عملکرد دانش‌آموزان را محاسبه کنیم، و سپس رقم حاصل یک پارامتر خواهد بود، زیرا کل جمعیت در محاسبات ما دخالت خواهند داشت. اما اگر بخواهیم معدل کل دانش آموزان کشورمان را محاسبه کنیم، این گروه نمونه ما خواهد بود.

تفاوت در فرمول محاسبه واریانس بین نمونه و جامعه در مخرج است. جایی که برای نمونه برابر با (n-1) و برای جمعیت عمومی فقط n خواهد بود.

حال به توابع محاسبه واریانس با پایان می پردازیم ولی،که در توضیح آن گفته شده است که محاسبه متن و مقادیر منطقی را در نظر می گیرد. AT این موردهنگام محاسبه واریانس یک مجموعه داده خاص که در آن مقادیر غیر عددی رخ می دهد، اکسل متن و بولی های نادرست را 0 و بولی های واقعی را به عنوان 1 تفسیر می کند.

بنابراین، اگر آرایه ای از داده ها دارید، محاسبه واریانس آن با استفاده از یکی از توابع اکسل ذکر شده در بالا دشوار نخواهد بود.

طبق بررسی نمونه، سپرده گذاران بر اساس اندازه سپرده در Sberbank شهر گروه بندی شدند:

تعریف کردن:

1) دامنه تغییرات؛

2) اندازه متوسط ​​سپرده؛

3) متوسط انحراف خطی;

4) پراکندگی؛

5) انحراف معیار؛

6) ضریب تغییرات مشارکت.

راه حل:

این سری توزیع شامل فواصل باز است. در چنین سری‌هایی معمولاً مقدار فاصله گروه اول برابر با مقدار فاصله گروه بعدی و مقدار فاصله گروه آخر برابر با مقدار فاصله گروه قبلی در نظر گرفته می‌شود. یکی

مقدار بازه گروه دوم 200 است، بنابراین مقدار گروه اول نیز 200 است، مقدار فاصله گروه ماقبل آخر 200 است، یعنی آخرین بازه نیز مقداری برابر با 200 خواهد داشت.

1) محدوده تغییرات را به عنوان تفاوت بین بزرگترین و تعریف کنید کوچکترین مقدارامضاء کردن:

دامنه تنوع در اندازه کمک 1000 روبل است.

2) اندازه متوسط ​​سهم با فرمول میانگین موزون حسابی تعیین می شود.

بیایید ابتدا تعریف کنیم مقدار گسستهویژگی در هر بازه برای این کار با استفاده از فرمول میانگین حسابی ساده، نقاط میانی بازه ها را پیدا می کنیم.

مقدار متوسط ​​اولین بازه برابر با:

دوم - 500 و غیره

بیایید نتایج محاسبات را در جدول قرار دهیم:

مبلغ سپرده، مالش.تعداد مشارکت کنندگان، fوسط فاصله، xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
جمع 400 - 312000

میانگین سپرده در Sberbank شهر 780 روبل خواهد بود:

3) میانگین انحراف خطی میانگین حسابی انحرافات مطلق مقادیر منفرد ویژگی از میانگین کل است:

روش محاسبه میانگین انحراف خطی در سری توزیع بازه ای به شرح زیر است:

1. میانگین موزون حسابی، همانطور که در بند 2 نشان داده شده است، محاسبه می شود.

2. انحراف مطلق متغیر از میانگین تعیین می شود:

3. انحرافات به دست آمده در فرکانس ضرب می شوند:

4. مجموع انحرافات وزنی بدون در نظر گرفتن علامت پیدا می شود:

5. مجموع انحرافات وزنی بر مجموع فرکانس ها تقسیم می شود:

استفاده از جدول داده های محاسبه شده راحت است:

مبلغ سپرده، مالش.تعداد مشارکت کنندگان، fوسط فاصله، x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
جمع 400 - - - 81280

میانگین انحراف خطی اندازه سپرده مشتریان Sberbank 203.2 روبل است.

4) پراکندگی میانگین حسابی مجذور انحرافات هر مقدار مشخصه از میانگین حسابی است.

محاسبه پراکندگی در سری بازه ایتوزیع طبق فرمول انجام می شود:

روش محاسبه واریانس در این مورد به شرح زیر است:

1. همانطور که در بند 2 نشان داده شده است، میانگین موزون حسابی را تعیین کنید.

2. انحراف از میانگین را بیابید:

3. مربع کردن انحراف هر گزینه از میانگین:

4. ضرب انحرافات مجذور در وزن (فرکانس):

5. آثار دریافتی را خلاصه کنید:

6. مقدار حاصل بر مجموع وزن ها (فرکانس ها) تقسیم می شود:

بیایید محاسبات را در یک جدول قرار دهیم:

مبلغ سپرده، مالش.تعداد مشارکت کنندگان، fوسط فاصله، x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
جمع 400 - - - 23040000
مقالات مشابه

2022 parki48.ru. ما در حال ساخت یک خانه قاب هستیم. محوطه سازی. ساخت و ساز. پایه.