فاصله اطمینان حول صدک ایجاد فاصله اطمینان برای انتظارات ریاضی عموم مردم

فاصله اطمینانمقادیر محدود کننده کمیت آماری هستند که با احتمال اطمینان داده شده γ، در این بازه با حجم نمونه بزرگتر خواهند بود. به عنوان P (θ - ε . در عمل، احتمال اطمینان γ از مقادیر γ = 0.9، γ = 0.95، γ = 0.99 به اندازه کافی نزدیک به وحدت انتخاب می شود.

واگذاری خدمات. این سرویس تعریف می کند:

  • فاصله اطمینان برای میانگین کلی، فاصله اطمینان برای واریانس.
  • فاصله اطمینان برای انحراف استاندارد، فاصله اطمینان برای کسر عمومی.
محلول به دست آمده در آن ذخیره می شود فایل ورد(نمونه را ببینید). در زیر یک دستورالعمل ویدیویی در مورد نحوه پر کردن داده های اولیه وجود دارد.

مثال شماره 1. در یک مزرعه جمعی، از کل گله 1000 گوسفند، 100 گوسفند تحت برش کنترل انتخابی قرار گرفتند. در نتیجه، میانگین برشی پشم 4.2 کیلوگرم برای هر گوسفند ایجاد شد. با احتمال 0.99 خطای استاندارد نمونه در تعیین میانگین برش پشم در هر گوسفند و حدودی که مقدار برشی در آن قرار دارد در صورتی که واریانس 2.5 باشد را تعیین کنید. نمونه غیر تکراری است
مثال شماره 2. از دسته محصولات وارداتی در پست گمرک شمالی مسکو، 20 نمونه از محصول "الف" به ترتیب نمونه گیری مجدد تصادفی گرفته شد. در نتیجه بررسی، میانگین رطوبت محصول "A" در نمونه مشخص شد که با انحراف معیار 1٪ 6٪ بود.
با احتمال 0.683 حدود میانگین رطوبت محصول در کل دسته محصولات وارداتی را تعیین کنید.
مثال شماره 3. نظرسنجی از 36 دانش آموز نشان داد که میانگین تعداد کتاب های درسی که آنها در آن می خوانند سال تحصیلیبا فرض اینکه تعداد کتاب های درسی خوانده شده توسط دانشجو در هر ترم دارای قانون توزیع نرمال با انحراف معیار برابر با 6 باشد، پیدا کنید: الف) با پایایی 0.99، تخمین فاصله ای برای انتظارات ریاضیاین متغیر تصادفی؛ ب) با چه احتمالی می توان استدلال کرد که میانگین تعداد کتاب های درسی خوانده شده توسط دانش آموز در هر ترم، محاسبه شده برای این نمونه، از انتظارات ریاضی انحراف داشته باشد. قدر مطلقبیشتر از 2 نیست.

طبقه بندی فواصل اطمینان

بر اساس نوع پارامتر مورد ارزیابی:

بر اساس نوع نمونه:

  1. فاصله اطمینان برای نمونه برداری بی نهایت.
  2. فاصله اطمینان برای نمونه نهایی؛
نمونه برداری را نمونه گیری مجدد می نامند، اگر شی انتخاب شده قبل از انتخاب مورد بعدی به جمعیت عمومی بازگردانده شود. نمونه غیر تکراری نامیده می شود.اگر شی انتخاب شده به جمعیت عمومی بازگردانده نشود. در عمل معمولاً با نمونه های تکرار نشدنی سروکار داریم.

محاسبه میانگین خطای نمونه گیری برای انتخاب تصادفی

اختلاف بین مقادیر شاخص های به دست آمده از نمونه و پارامترهای مربوط به جامعه عمومی نامیده می شود. خطای نمایندگی.
تعیین پارامترهای اصلی جامعه عمومی و نمونه.
نمونه فرمول های میانگین خطا
انتخاب مجددانتخاب غیر تکراری
برای وسطبرای اشتراک گذاریبرای وسطبرای اشتراک گذاری
نسبت بین حد خطای نمونه گیری (Δ) با احتمال کمی تضمین شده است P(t)،و میانگین خطای نمونه گیری به شکل: یا Δ = t μ است که در آن تی- ضریب اطمینان، بسته به سطح احتمال P(t) مطابق جدول تابع لاپلاس انتگرال تعیین می شود.

فرمول های محاسبه حجم نمونه با روش انتخاب تصادفی مناسب

بگذارید داشته باشیم تعداد زیادی ازاقلام با توزیع نرمال برخی از ویژگی ها (به عنوان مثال، یک انبار کامل از همان نوع سبزیجات، که اندازه و وزن آن متفاوت است). شما می خواهید مشخصات متوسط ​​کل دسته کالاها را بدانید، اما نه زمان و نه تمایلی برای اندازه گیری و وزن کردن هر سبزی دارید. می فهمی که این لازم نیست. اما چند قطعه باید برای بازرسی تصادفی بردارید؟

قبل از ارائه برخی از فرمول های مفید برای این وضعیت، برخی از نمادها را یادآوری می کنیم.

ابتدا، اگر کل انبار سبزیجات را اندازه گیری کنیم (به این مجموعه عناصر، جمعیت عمومی می گویند)، آنگاه با تمام دقتی که در دسترس ماست، میانگین وزن کل دسته را می دانیم. بیایید این را میانگین بنامیم X رجوع کنید به .g en . - میانگین عمومی ما قبلاً می دانیم که اگر مقدار میانگین و انحراف آن مشخص باشد چه چیزی کاملاً تعیین می شود . درست است، تا اینجا ما نه میانگین X هستیم و نهس ما جمعیت عمومی را نمی شناسیم. ما فقط می توانیم مقداری نمونه برداریم، مقادیر مورد نیاز خود را اندازه گیری کنیم و برای این نمونه هم میانگین مقدار X sr در نمونه و هم انحراف استاندارد S sb را محاسبه کنیم.

مشخص است که اگر چک سفارشی ما شامل تعداد زیادی عنصر باشد (معمولا n بزرگتر از 30 است) و آنها گرفته می شوند. واقعا تصادفی، سپس s جمعیت عمومی تقریباً با S تفاوتی نخواهد داشت.

علاوه بر این، برای مورد توزیع نرمالمی توانیم از فرمول های زیر استفاده کنیم:

با احتمال 95%


با احتمال 99%



AT نمای کلیبا احتمال Р (t)


رابطه بین مقدار t و مقدار احتمال P (t) که با آن می خواهیم فاصله اطمینان را بدانیم را می توان از جدول زیر دریافت کرد:


بنابراین، ما تعیین کرده‌ایم که میانگین مقدار برای جمعیت عمومی در چه محدوده‌ای است (با یک احتمال معین).

تا زمانی که نمونه به اندازه کافی بزرگ نداشته باشیم، نمی توانیم ادعا کنیم که جامعه دارای s = است S sel. علاوه بر این، در این مورد، نزدیک بودن نمونه به توزیع نرمال مشکل ساز است. در این حالت به جای آن از S sb نیز استفاده کنید s در فرمول:




اما مقدار t برای یک احتمال ثابت P(t) به تعداد عناصر موجود در نمونه n بستگی دارد. هر چه n بزرگتر باشد، فاصله اطمینان حاصل به مقدار داده شده توسط فرمول (1) نزدیکتر خواهد بود. مقادیر t در این مورد از جدول دیگری گرفته شده است ( آزمون تی دانشجویی) که در زیر ارائه می کنیم:

مقادیر آزمون t دانشجویی برای احتمال 0.95 و 0.99


مثال 3 30 نفر از بین کارکنان شرکت به صورت تصادفی انتخاب شدند. با توجه به نمونه، معلوم شد که میانگین حقوق (در ماه) 30 هزار روبل با میانگین انحراف مربع 5 هزار روبل است. با احتمال 0.99 میانگین حقوق در شرکت را تعیین کنید.

راه حل:با شرط، n = 30 داریم، X cf. =30000، S=5000، P=0.99. برای یافتن فاصله اطمینانما از فرمول مربوط به معیار دانشجو استفاده می کنیم. طبق جدول n \u003d 30 و P \u003d 0.99 t \u003d 2.756 را پیدا می کنیم ، بنابراین ،


آن ها اعتماد مورد نظرفاصله 27484< Х ср.ген < 32516.

بنابراین، با احتمال 0.99، می توان استدلال کرد که بازه (27484؛ 32516) شامل میانگین حقوق در شرکت است.

امیدواریم که از این روش استفاده کنید بدون اینکه لزوماً هر بار صفحه گسترده ای به همراه داشته باشید. محاسبات را می توان به طور خودکار در اکسل انجام داد. بودن در فایل اکسل، دکمه fx را در منوی بالا فشار دهید. سپس، از میان توابع، نوع "آماری" و از لیست پیشنهادی در کادر - STEUDRASP را انتخاب کنید. سپس، در اعلان، با قرار دادن مکان نما در قسمت "احتمال"، مقدار احتمال متقابل را تایپ کنید (یعنی در مورد ما، به جای احتمال 0.95، باید احتمال 0.05 را تایپ کنید). ظاهراً صفحه گسترده طوری طراحی شده است که نتیجه به این سؤال پاسخ می دهد که چقدر احتمال دارد اشتباه کنیم. به همین ترتیب، در قسمت "درجه آزادی" مقدار (n-1) را برای نمونه خود وارد کنید.

فاصله اطمینان.

محاسبه فاصله اطمینان بر اساس میانگین خطای پارامتر مربوطه است. فاصله اطمینان نشان می دهد که در چه محدوده هایی با احتمال (1-a) مقدار واقعی پارامتر تخمین زده شده است. در اینجا a سطح معناداری است، (1-a) نیز سطح اطمینان نامیده می شود.

در فصل اول، نشان دادیم که برای مثال، برای میانگین حسابی، میانگین جمعیت واقعی در حدود 95 درصد مواقع در 2 خطای میانگین از میانگین قرار دارد. بنابراین، مرزهای فاصله اطمینان 95% برای میانگین دو برابر از میانگین نمونه فاصله خواهد داشت. خطای متوسطمتوسط، یعنی ما میانگین خطای میانگین را در فاکتوری ضرب می کنیم سطح اطمینان. برای میانگین و تفاضل میانگین ها، ضریب Student (مقدار بحرانی معیار Student) و برای سهم و تفاوت سهم ها، مقدار بحرانی معیار z در نظر گرفته می شود. حاصل ضرب ضریب و میانگین خطا را می توان خطای حاشیه ای این پارامتر نامید. حداکثری که می توانیم هنگام ارزیابی آن بدست آوریم.

فاصله اطمینان برای میانگین حسابی : .

در اینجا میانگین نمونه است.

میانگین خطای میانگین حسابی؛

s-انحراف استاندارد نمونه؛

n

f = n-1 (ضریب دانش آموزی).

فاصله اطمینان برای تفاوت میانگین های حسابی :

در اینجا، تفاوت بین میانگین های نمونه است.

- میانگین خطای اختلاف میانگین های حسابی؛

s 1 , s 2 -معنی نمونه انحراف معیار;

n1، n2

ارزش بحرانی معیار دانشجو برای سطح معینی از اهمیت a و تعداد درجات آزادی f=n1 +n2-2 (ضریب دانش آموزی).

فاصله اطمینان برای سهام :

.

در اینجا d سهم نمونه است.

- میانگین خطای سهم

n- حجم نمونه (اندازه گروه)؛

فاصله اطمینان برای تفاوت ها را به اشتراک بگذارید :

در اینجا، تفاوت بین سهام نمونه است.

میانگین خطای اختلاف میانگین های حسابی است.

n1، n2- اندازه نمونه (تعداد گروه)؛

مقدار بحرانی معیار z در سطح معناداری معین a (،،،).

با محاسبه فواصل اطمینان برای تفاوت در شاخص ها، ما اولاً به طور مستقیم مقادیر احتمالی اثر را می بینیم و نه فقط آن را تخمین نقطه ای. ثانیاً می توان در مورد پذیرش یا رد فرضیه صفر نتیجه گرفت و ثالثاً در مورد قدرت ملاک نتیجه گرفت.

هنگام آزمایش فرضیه ها با استفاده از فواصل اطمینان، باید به آن پایبند بود قانون بعدی:

اگر فاصله اطمینان 100 (1-a) - درصد اختلاف میانگین حاوی صفر نباشد، آنگاه تفاوت ها در سطح معنی داری از نظر آماری معنی دار هستند. برعکس، اگر این بازه حاوی صفر باشد، تفاوت ها از نظر آماری معنی دار نیستند.

در واقع، اگر این فاصله حاوی صفر باشد، به این معنی است که شاخص مقایسه شده می تواند در یکی از گروه ها در مقایسه با گروه دیگر بیشتر یا کمتر باشد، یعنی. تفاوت های مشاهده شده تصادفی هستند.

با توجه به جایی که صفر در فاصله اطمینان قرار دارد، می توان قدرت معیار را قضاوت کرد. اگر صفر به حد پایین یا بالای بازه نزدیک باشد، شاید با تعداد بیشتری از گروه های مقایسه شده، تفاوت ها به اهمیت آماری. اگر صفر نزدیک به وسط فاصله باشد، به این معنی است که افزایش و کاهش شاخص در گروه آزمایشی به یک اندازه محتمل است و احتمالاً واقعاً هیچ تفاوتی وجود ندارد.

مثال ها:

برای مقایسه مرگ و میر ناشی از جراحی در هنگام استفاده از دو نوع بیهوشی مختلف: 61 نفر با استفاده از نوع اول بیهوشی عمل کردند، 8 نفر فوت کردند، با استفاده از دوم - 67 نفر، 10 نفر فوت کردند.

d 1 \u003d 8/61 \u003d 0.131; d 2 \u003d 10/67 \u003d 0.149; d1-d2 = - 0.018.

تفاوت در کشندگی روش های مقایسه شده در محدوده (0.018 - 0.122؛ -0.018 + 0.122) یا (0.14-؛ 0.104) با احتمال 100 (1-a) = 95٪ خواهد بود. بازه حاوی صفر است، یعنی. فرضیه مرگ و میر یکسان در دو انواع متفاوتبیهوشی را نمی توان انکار کرد.

بنابراین، مرگ و میر می تواند به 14٪ کاهش یابد و به 10.4٪ با احتمال 95٪ افزایش می یابد. صفر تقریباً در وسط فاصله است، بنابراین می توان استدلال کرد که به احتمال زیاد، این دو روش واقعاً از نظر کشندگی تفاوتی ندارند.

در مثالی که قبلاً در نظر گرفته شد، میانگین زمان ضربه زدن در چهار گروه از دانش‌آموزان که در نمرات امتحانی متفاوت بودند، مقایسه شد. بیایید فواصل اطمینان میانگین زمان پرس را برای دانش آموزانی که امتحان را برای 2 و 5 قبول شده اند و فاصله اطمینان را برای تفاوت بین این میانگین ها محاسبه کنیم.

ضرایب دانشجو از جداول توزیع دانش آموز یافت می شود (پیوست را ببینید): برای گروه اول: = t(0.05;48) = 2.011; برای گروه دوم: = t(0.05;61) = 2.000. بنابراین، فواصل اطمینان برای گروه اول: = (162.19-2.011 * 2.18؛ 162.19 + 2.011 * 2.18) = (157.8؛ 166.6) ، برای گروه دوم (156.55- 2.000 * 1.88*1.80 = 1.80) 160.3). بنابراین، برای کسانی که امتحان را برای 2 قبول کردند، میانگین زمان فشار از 157.8 ms تا 166.6 ms با احتمال 95٪ متغیر است، برای کسانی که امتحان را برای 5 قبول کردند - از 152.8 ms تا 160.3 ms با احتمال 95٪. .

همچنین می توانید فرضیه صفر را با استفاده از فواصل اطمینان برای میانگین ها و نه فقط برای تفاوت میانگین ها آزمایش کنید. به عنوان مثال، مانند مورد ما، اگر فواصل اطمینان برای میانگین ها همپوشانی داشته باشند، نمی توان فرضیه صفر را رد کرد. به منظور رد یک فرضیه در سطح معناداری انتخاب شده، فواصل اطمینان مربوطه نباید همپوشانی داشته باشند.

بیایید فاصله اطمینان را برای تفاوت میانگین زمان پرس در گروه هایی که امتحان را برای 2 و 5 قبول کردند، پیدا کنیم. تفاوت در میانگین ها: 162.19 - 156.55 = 5.64. ضریب دانش آموز: \u003d t (0.05؛ 49 + 62-2) \u003d t (0.05؛ 109) \u003d 1.982. انحراف استاندارد گروه برابر با: ; . میانگین خطای اختلاف میانگین ها را محاسبه می کنیم: . فاصله اطمینان: \u003d (5.64-1.982 * 2.87؛ 5.64 + 1.982 * 2.87) \u003d (-0.044؛ 11.33).

بنابراین، تفاوت میانگین زمان پرس در گروه‌هایی که امتحان را در 2 و 5 پشت سر گذاشتند در محدوده 0.044- میلی‌ثانیه تا 11.33 میلی‌ثانیه خواهد بود. این فاصله شامل صفر است، یعنی. میانگین زمان فشار برای کسانی که امتحان را با نتایج عالی گذرانده اند می تواند در مقایسه با کسانی که امتحان را به طور رضایت بخش گذرانده اند افزایش یا کاهش یابد. فرضیه صفر را نمی توان رد کرد. اما صفر بسیار نزدیک به حد پایین است، زمان پرس برای پاس‌های عالی بسیار بیشتر است. بنابراین، می‌توان نتیجه گرفت که هنوز تفاوت‌هایی در میانگین زمان کلیک بین افرادی که 2 و 5 را پشت سر گذاشته‌اند وجود دارد، ما فقط نتوانستیم آنها را برای یک تغییر معین در میانگین زمان، پخش میانگین زمان و اندازه نمونه تشخیص دهیم.



قدرت آزمون احتمال رد یک فرضیه صفر نادرست است، یعنی. تفاوت ها را در جایی که واقعا هستند پیدا کنید.

قدرت آزمون بر اساس سطح معنی داری، میزان تفاوت بین گروه ها، پراکندگی مقادیر در گروه ها و حجم نمونه تعیین می شود.

برای آزمون تی دانشجویی و تحلیل واریانسمی توانید از نمودارهای حساسیت استفاده کنید.

از قدرت معیار می توان در تعیین اولیه تعداد مورد نیاز گروه استفاده کرد.

فاصله اطمینان نشان می دهد که تا چه حد احتمال داده شدهمقدار واقعی پارامتر برآورد شده یافت می شود.

با کمک فواصل اطمینان می توان فرضیه های آماری را آزمایش کرد و در مورد حساسیت معیارها نتیجه گرفت.

ادبیات.

Glantz S. - فصل 6.7.

Rebrova O.Yu. - ص112-114، ص171-173، ص234-238.

Sidorenko E. V. - صص 32-33.

سوالات خودآزمایی دانش آموزان.

1. قدرت ملاک چیست؟

2. ارزیابی قدرت معیارها در چه مواردی ضروری است؟

3. روش های محاسبه توان.

6. چگونه یک فرضیه آماری را با استفاده از فاصله اطمینان آزمایش کنیم؟

7. در مورد قدرت معیار در محاسبه فاصله اطمینان چه می توان گفت؟

وظایف.

هر نمونه فقط یک تصور تقریبی از جامعه عمومی به دست می دهد و تمام ویژگی های آماری نمونه (میانگین، حالت، واریانس ...) تقریبی یا می گویند تخمینی از پارامترهای کلی است که در اکثر موارد به دلیل وجود آن قابل محاسبه نیست. عدم دسترسی عموم مردم (شکل 20).

شکل 20. خطای نمونه گیری

اما می توانید بازه ای را مشخص کنید که با درجه ای از احتمال، مقدار واقعی (عمومی) مشخصه آماری در آن قرار دارد. این فاصله نامیده می شود د فاصله اطمینان (CI).

بنابراین میانگین کلی با احتمال 95٪ در داخل قرار دارد

از تا، (20)

جایی که تی - مقدار جدولی معیار دانشجویی برای α =0.05 و f= n-1

را می توان یافت و 99٪ CI، در این مورد تی انتخاب شده برای α =0,01.

اهمیت عملی فاصله اطمینان چیست؟

    فاصله اطمینان گسترده نشان می دهد که میانگین نمونه به طور دقیق میانگین جامعه را منعکس نمی کند. این معمولاً به دلیل حجم نمونه ناکافی یا ناهمگونی آن است. پراکندگی بزرگ هر دو می دهند اشتباه بزرگمتوسط ​​و بر این اساس، CI گسترده تر. و این دلیلی است برای بازگشت به مرحله برنامه ریزی تحقیق.

    حد بالا و پایین CI ارزیابی می کند که آیا نتایج از نظر بالینی قابل توجه هستند یا خیر

اجازه دهید با جزئیات بیشتری در مورد اهمیت آماری و بالینی نتایج مطالعه خواص گروه صحبت کنیم. به یاد بیاورید که وظیفه آمار تشخیص حداقل برخی از تفاوت ها در جمعیت های عمومی بر اساس داده های نمونه است. این وظیفه پزشک است که چنین تفاوت هایی (نه هیچ کدام) را پیدا کند که به تشخیص یا درمان کمک کند. و همیشه نتیجه گیری های آماری مبنای نتایج بالینی نیستند. بنابراین، کاهش معنی دار آماری هموگلوبین به میزان 3 گرم در لیتر، جای نگرانی نیست. و برعکس، اگر مشکلی در بدن انسان دارای ویژگی توده ای در سطح کل جمعیت نباشد، این دلیلی برای عدم پرداختن به این مشکل نیست.

ما این موقعیت را در نظر خواهیم گرفت مثال.

محققین تعجب کردند که آیا پسرانی که به نوعی بیماری عفونی مبتلا هستند از نظر رشد از همسالان خود عقب مانده اند یا خیر. برای این منظور یک مطالعه انتخابی انجام شد که در آن 10 پسر مبتلا به این بیماری شرکت کردند. نتایج در جدول 23 ارائه شده است.

جدول 23. نتایج آماری

حد پایین

حد بالا

مشخصات (سانتی متر)

وسط

از این محاسبات چنین استنباط می شود که میانگین قد انتخابی پسران 10 ساله که تحت برخی از عفونت، نزدیک به نرمال (132.5 سانتی متر). با این حال، حد پایین فاصله اطمینان (126.6 سانتی متر) نشان می دهد که احتمال 95٪ وجود دارد که میانگین قد واقعی این کودکان با مفهوم "کوتاه قد" مطابقت دارد. این بچه ها کوتاه قدی هستند

در این مثال، نتایج محاسبات فاصله اطمینان از نظر بالینی قابل توجه است.

فاصله اطمینان ( انگلیسی فاصله اطمینان) یکی از انواع تخمین های فاصله ای مورد استفاده در آمار است که برای سطح معینی از اهمیت محاسبه می شود. آنها به ما این امکان را می دهند که بیان کنیم که مقدار واقعی یک پارامتر آماری ناشناخته از جمعیت عمومی در محدوده مقادیر به دست آمده با احتمالی است که توسط سطح معناداری آماری انتخاب شده ارائه می شود.

توزیع نرمال

هنگامی که واریانس (σ 2 ) از جمعیت داده ها مشخص باشد، از یک z-score می توان برای محاسبه محدودیت های اطمینان (نقاط مرزی فاصله اطمینان) استفاده کرد. در مقایسه با استفاده از توزیع t، استفاده از یک امتیاز z نه تنها فاصله اطمینان باریک تری را ارائه می دهد، بلکه تخمین های قابل اعتمادتری از میانگین و انحراف استاندارد (σ) ارائه می دهد، زیرا امتیاز Z بر اساس توزیع نرمال است.

فرمول

برای تعیین نقاط مرزی فاصله اطمینان، مشروط بر اینکه انحراف معیار جمعیت داده ها مشخص باشد، از فرمول زیر استفاده می شود.

L = X - Z α/2 σ
√n

مثال

فرض کنید که حجم نمونه 25 مشاهده، میانگین نمونه 15، و انحراف معیار جامعه 8 است. برای سطح معنی داری 5% α=، Z-score Z α/2 =1.96 است. در این صورت حد پایین و بالای فاصله اطمینان خواهد بود

L = 15 - 1.96 8 = 11,864
√25
L = 15 + 1.96 8 = 18,136
√25

بنابراین، می توان گفت که با احتمال 95% انتظار ریاضی عموم مردم در محدوده 11.864 تا 18.136 کاهش می یابد.

روش های کاهش فاصله اطمینان

فرض کنید محدوده برای اهداف مطالعه ما بسیار گسترده است. دو راه برای کاهش دامنه فاصله اطمینان وجود دارد.

  1. سطح اهمیت آماری α را کاهش دهید.
  2. حجم نمونه را افزایش دهید.

با کاهش سطح معنی داری آماری به α=10%، یک امتیاز Z برابر با Z α/2=1.64 بدست می آوریم. در این صورت حد پایین و بالای بازه خواهد بود

L = 15 - 1.64 8 = 12,376
√25
L = 15 + 1.64 8 = 17,624
√25

و خود فاصله اطمینان را می توان به صورت نوشتاری کرد

در این حالت، می‌توان این فرض را داشت که با احتمال 90 درصد، انتظارات ریاضی عموم مردم در محدوده قرار می‌گیرد.

اگر بخواهیم سطح اهمیت آماری α را حفظ کنیم، تنها راه حل افزایش حجم نمونه است. با افزایش آن به 144 مشاهده، مقادیر زیر را از حدود اطمینان بدست می آوریم

L = 15 - 1.96 8 = 13,693
√144
L = 15 + 1.96 8 = 16,307
√144

خود فاصله اطمینان به این صورت خواهد بود:

بنابراین، محدود کردن فاصله اطمینان بدون کاهش سطح معناداری آماری تنها با افزایش حجم نمونه امکان پذیر است. اگر امکان افزایش حجم نمونه وجود نداشته باشد، تنها با کاهش سطح معناداری آماری می توان به کاهش فاصله اطمینان دست یافت.

ایجاد فاصله اطمینان برای توزیع غیر عادی

اگر انحراف معیارجمعیت مشخص نیست یا توزیع نرمال نیست، از توزیع t برای ایجاد فاصله اطمینان استفاده می شود. این تکنیک در مقایسه با تکنیک مبتنی بر Z-score محافظه کارانه تر است که در فواصل اطمینان وسیع تری بیان می شود.

فرمول

از فرمول های زیر برای محاسبه حد پایین و بالای فاصله اطمینان بر اساس توزیع t استفاده می شود.

L = X - tα σ
√n

توزیع دانشجو یا توزیع t فقط به یک پارامتر بستگی دارد - تعداد درجات آزادی، که برابر با تعداد مقادیر ویژگی های فردی (تعداد مشاهدات در نمونه) است. مقدار آزمون t Student برای تعداد معینی از درجه آزادی (n) و سطح اهمیت آماری α را می توان در جداول جستجو پیدا کرد.

مثال

فرض کنید که حجم نمونه 25 مقدار جداگانه، مقدار میانگین نمونه 50 و انحراف معیار نمونه 28 است. شما باید یک فاصله اطمینان برای سطح اهمیت آماری α=5٪ بسازید.

در مورد ما، تعداد درجات آزادی 24 (25-1) است، بنابراین، مقدار جدولی مربوط به آزمون t Student برای سطح معناداری آماری α=5٪ 064/2 است. بنابراین، حد پایین و بالای فاصله اطمینان خواهد بود

L = 50 - 2.064 28 = 38,442
√25
L = 50 + 2.064 28 = 61,558
√25

و خود فاصله را می توان به صورت نوشتاری کرد

بنابراین می توان گفت که با احتمال 95 درصد انتظار ریاضی عموم مردم در محدوده خواهد بود.

استفاده از توزیع t به شما این امکان را می دهد که فاصله اطمینان را با کاهش معناداری آماری یا با افزایش حجم نمونه کاهش دهید.

با کاهش معنی‌داری آماری از 95% به 90% در شرایط مثال ما، مقدار جدولی مربوط به آزمون t Student 1.711 را بدست می‌آوریم.

L = 50 - 1.711 28 = 40,418
√25
L = 50 + 1.711 28 = 59,582
√25

در این صورت می توان گفت که با احتمال 90 درصد انتظار ریاضی عموم مردم در محدوده خواهد بود.

اگر بخواهیم از اهمیت آماری کاسته نشویم، تنها راه حل افزایش حجم نمونه است. بیایید بگوییم که 64 مشاهده فردی است، و نه 25 مورد مانند شرایط اولیه مثال. مقدار جدولآزمون t استودیو برای 63 درجه آزادی (64-1) و سطح معنی داری آماری 5% α=1.998 است.

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1.998 28 = 56,993
√64

این به ما این فرصت را می دهد که ادعا کنیم با احتمال 95٪ انتظارات ریاضی جمعیت عمومی در محدوده خواهد بود.

نمونه های بزرگ

نمونه های بزرگ نمونه هایی از یک جامعه داده با بیش از 100 مشاهدات منفرد هستند.مطالعات آماری نشان داده اند که نمونه های بزرگتر به طور معمول توزیع می شوند، حتی اگر توزیع جامعه نرمال نباشد. علاوه بر این، برای چنین نمونه‌هایی، استفاده از z-score و t-distribution تقریباً نتایج یکسانی را هنگام ساخت فواصل اطمینان به دست می‌دهد. بنابراین، برای نمونه های بزرگ، استفاده از z-score برای توزیع نرمال به جای توزیع t قابل قبول است.

جمع بندی

مقالات مشابه

parki48.ru 2022. ما در حال ساخت یک خانه قاب هستیم. محوطه سازی. ساخت و ساز. پایه.