اهمیت آماری چیست؟ اصطلاحات و مفاهیم اولیه آمار پزشکی

سطح معنی داری در آمار است شاخص مهم، منعکس کننده درجه اطمینان در صحت و صحت داده های دریافتی (پیش بینی شده). این مفهوم به طور گسترده ای در زمینههای مختلف: از برگزاری تحقیق جامعه شناختی، قبل از آزمون آماری فرضیه های علمی.

تعریف

سطح معنی داری آماری (یا نتیجه آماری معنی دار) احتمال وقوع شاخص های مورد مطالعه را به صورت تصادفی نشان می دهد. اهمیت آماری کلی یک پدیده با ضریب p-value (p-level) بیان می شود. در هر آزمایش یا مشاهده، این احتمال وجود دارد که داده های به دست آمده به دلیل خطاهای نمونه گیری بوده باشد. این به ویژه در مورد جامعه شناسی صادق است.

یعنی یک مقدار معنی دار آماری مقداری است که احتمال وقوع تصادفی آن بسیار کوچک است یا به سمت افراط گرایش دارد. افراطی در این زمینه میزان انحراف آمار از فرضیه صفر (فرضیه ای که برای سازگاری با داده های نمونه به دست آمده مورد آزمایش قرار می گیرد) است. در عمل علمی، سطح معنی داری قبل از جمع آوری داده ها انتخاب می شود و به طور معمول ضریب آن 0.05 (5%) است. برای سیستم هایی که بسیار مهم است مقادیر دقیق، این شاخص می تواند 0.01 (1%) یا کمتر باشد.

زمینه

مفهوم سطح معناداری توسط رونالد فیشر، آماردان و ژنتیک شناس بریتانیایی در سال 1925، زمانی که در حال توسعه تکنیکی برای آزمایش فرضیه های آماری بود، مطرح شد. هنگام تجزیه و تحلیل هر فرآیند، احتمال خاصی از پدیده های خاص وجود دارد. هنگام کار با درصدهای کوچک (یا غیر واضح) احتمالاتی که تحت مفهوم "خطای اندازه گیری" قرار می گیرند، مشکلات ایجاد می شود.

دانشمندان هنگام کار با داده های آماری که برای آزمایش آنها به اندازه کافی خاص نیستند، با مشکل فرضیه صفر مواجه می شوند که از عملکرد با مقادیر کم "جلوگیری می کند". فیشر برای چنین سیستم‌هایی پیشنهاد کرد تا احتمال رویدادها را در 5% (0.05) به عنوان یک برش نمونه‌گیری مناسب تعیین کنند، که به فرد اجازه می‌دهد فرضیه صفر را در محاسبات رد کند.

معرفی شانس های ثابت

در سال 1933 دانشمندان جرزینیمن و اگون پیرسون در کارهای خود توصیه کردند که سطح معینی از اهمیت را از قبل (قبل از جمع آوری داده ها) تعیین کنند. نمونه هایی از استفاده از این قوانین در زمان انتخابات به وضوح قابل مشاهده است. فرض کنید دو نامزد وجود دارد که یکی از آنها بسیار محبوب است و دیگری کمی شناخته شده است. بدیهی است که کاندیدای اول برنده انتخابات خواهد بود و شانس دومی به صفر می رسد. آنها تلاش می کنند - اما برابر نیستند: همیشه امکان فورس ماژور، اطلاعات هیجان انگیز وجود دارد، تصمیمات غیر منتظره، که می تواند نتایج پیش بینی شده انتخابات را تغییر دهد.

نیمن و پیرسون توافق کردند که سطح معنی داری فیشر 0.05 (که با α نشان داده می شود) مناسب ترین است. با این حال، خود فیشر در سال 1956 با تثبیت این مقدار مخالفت کرد. او معتقد بود که سطح α باید با توجه به شرایط خاص تنظیم شود. به عنوان مثال، در فیزیک ذرات 0.01 است.

مقدار سطح p

اصطلاح p-value اولین بار توسط براونلی در سال 1960 استفاده شد. سطح P (p-value) شاخصی است که با صحت نتایج رابطه معکوس دارد. بالاترین ضریب p-value مربوط به پایین ترین سطح اطمینان در رابطه نمونه بین متغیرها است.

این مقدار نشان دهنده احتمال خطاهای مرتبط با تفسیر نتایج است. بیایید سطح p = 0.05 (1/20) را فرض کنیم. احتمال پنج درصد را نشان می دهد که رابطه بین متغیرهای موجود در نمونه فقط یک ویژگی تصادفی نمونه است. یعنی اگر این وابستگی وجود نداشته باشد، با آزمایش های تکراری مشابه، به طور متوسط، در هر بیستمین مطالعه می توان انتظار وابستگی یکسان یا بیشتر بین متغیرها را داشت. سطح p اغلب به عنوان یک "حاشیه" برای میزان خطا در نظر گرفته می شود.

به هر حال، p-value ممکن است منعکس نشود وابستگی واقعیبین متغیرها، اما فقط مقدار متوسط ​​معینی را در مفروضات نشان می دهد. به طور خاص، تجزیه و تحلیل نهایی داده ها نیز به مقادیر انتخاب شده بستگی دارد ضریب داده شده. در p-level = 0.05 نتایجی وجود دارد و در ضریب 0.01 نتایج متفاوتی وجود خواهد داشت.

آزمون فرضیه های آماری

سطح معنی داری آماری به ویژه هنگام آزمون فرضیه ها اهمیت دارد. به عنوان مثال، هنگام محاسبه یک آزمون دو طرفه، ناحیه رد به طور مساوی در هر دو انتهای توزیع نمونه‌برداری (نسبت به مختصات صفر) تقسیم می‌شود و صحت داده‌های حاصل محاسبه می‌شود.

فرض کنید، هنگام نظارت بر یک فرآیند (پدیده)، معلوم می شود که اطلاعات آماری جدید تغییرات کوچکی را نسبت به مقادیر قبلی نشان می دهد. در عین حال، اختلافات در نتایج کوچک، آشکار نیست، اما برای مطالعه مهم است. متخصص با یک معضل مواجه است: آیا تغییرات واقعاً رخ می دهد یا این اشتباهات نمونه گیری (عدم دقت اندازه گیری) هستند؟

در این مورد، آنها از فرضیه صفر استفاده می کنند یا آن را رد می کنند (همه چیز را به یک خطا نسبت می دهند، یا تغییر در سیستم را به عنوان یک واقعیت انجام شده تشخیص می دهند). فرآیند حل مسئله بر اساس نسبت اهمیت آماری کلی (p-value) و سطح معناداری (α) است. اگر سطح p< α, значит, нулевую гипотезу отвергают. Чем меньше р-value, тем более значимой является тестовая статистика.

مقادیر استفاده شده

سطح اهمیت به مواد مورد تجزیه و تحلیل بستگی دارد. در عمل از مقادیر ثابت زیر استفاده می شود:

  • α = 0.1 (یا 10٪)؛
  • α = 0.05 (یا 5٪)؛
  • α = 0.01 (یا 1٪)؛
  • α = 0.001 (یا 0.1٪).

هرچه محاسبات دقیق تر مورد نیاز باشد، از ضریب α کمتر استفاده می شود. طبیعتاً پیش‌بینی‌های آماری در فیزیک، شیمی، داروسازی و ژنتیک به دقت بیشتری نسبت به علوم سیاسی و جامعه‌شناسی نیاز دارند.

آستانه های مهم در مناطق خاص

در زمینه های با دقت بالا مانند فیزیک ذرات و ساخت، اهمیت آماری اغلب به صورت نسبت انحراف استاندارد (که با ضریب سیگما - σ نشان داده می شود) در مقابل بیان می شود. توزیع نرمالاحتمالات (توزیع گاوسی). σ یک شاخص آماری است که پراکندگی مقادیر یک کمیت معین را نسبت به انتظارات ریاضی. برای ترسیم احتمال رویدادها استفاده می شود.

بسته به حوزه دانش، ضریب σ بسیار متفاوت است. به عنوان مثال، هنگام پیش‌بینی وجود بوزون هیگز، پارامتر σ برابر با 5 است (σ = 5)، که مربوط به p-value = 1/3.5 میلیون در مطالعات ژنومی، سطح معنی‌داری می‌تواند 5×10 - باشد. 8 که برای این مناطق غیر معمول نیست.

بهره وری

باید در نظر گرفت که ضرایب α و p-value مشخصه دقیقی نیستند. سطح اهمیت آمار پدیده مورد مطالعه هر چه باشد، مبنایی بی قید و شرط برای پذیرش فرضیه نیست. به عنوان مثال، از ارزش کمترα، احتمال اینکه فرضیه با اهمیت باشد بیشتر است. با این حال، خطر خطا وجود دارد که قدرت آماری (معنی‌داری) مطالعه را کاهش می‌دهد.

محققانی که صرفاً بر نتایج آماری معنی دار تمرکز می کنند ممکن است به نتایج اشتباهی برسند. در عین حال، بررسی مجدد کار آنها دشوار است، زیرا آنها مفروضاتی را اعمال می کنند (که در واقع مقادیر α و p هستند). بنابراین، همیشه توصیه می شود، همراه با محاسبه اهمیت آماری، شاخص دیگری - بزرگی اثر آماری را تعیین کنید. اندازه اثر یک اندازه گیری کمی از قدرت یک اثر است.

پژوهش معمولاً با فرضیاتی آغاز می شود که نیاز به تأیید با استفاده از حقایق دارد. این فرض - یک فرضیه - در رابطه با ارتباط پدیده ها یا ویژگی ها در مجموعه خاصی از اشیاء فرموله می شود.

برای آزمایش چنین مفروضاتی در برابر واقعیت ها، لازم است ویژگی های مربوط به حاملان آنها اندازه گیری شود. اما اندازه گیری اضطراب در همه زنان و مردان غیرممکن است، همانطور که اندازه گیری پرخاشگری در همه نوجوانان غیرممکن است. بنابراین، هنگام انجام تحقیق، تنها به گروه نسبتاً کوچکی از نمایندگان جمعیت های مربوطه افراد محدود می شود.

جمعیت- این کل مجموعه ای از اشیاء است که یک فرضیه تحقیق در رابطه با آنها فرموله می شود.

به عنوان مثال، همه مردان; یا همه زنان؛ یا همه ساکنان یک شهر. جمعیت‌های عمومی در رابطه با آنها که محقق قرار است بر اساس نتایج مطالعه نتیجه‌گیری کند، ممکن است از نظر تعداد کم‌تر باشند، مثلاً همه دانش‌آموزان کلاس اولی یک مدرسه معین.

بنابراین، جمعیت عمومی، اگرچه از نظر تعداد نامتناهی نیست، اما، به عنوان یک قاعده، برای تحقیقات مستمر، مجموعه ای از موضوعات بالقوه غیر قابل دسترس است.

نمونه یا جامعه نمونهگروهی از اشیاء محدود در تعداد (در روانشناسی - موضوعات، پاسخ دهندگان)، به طور ویژه انتخاب شده است جمعیتبرای مطالعه خواص آن بر این اساس، مطالعه ویژگی های جمعیت عمومی با استفاده از نمونه نامیده می شود مطالعه نمونه گیری تقریبا همه چیز تحقیقات روانشناختینمونه برداری می شوند و نتیجه گیری آن ها به جمعیت های عمومی گسترش می یابد.

بنابراین، پس از تدوین یک فرضیه و شناسایی جمعیت های مربوطه، محقق با مشکل سازماندهی نمونه مواجه می شود. نمونه باید به گونه ای باشد که تعمیم نتایج مطالعه نمونه توجیه شود - تعمیم، گسترش آنها به جامعه عمومی. معیارهای اصلی اعتبار نتایج تحقیقاینها نماینده نمونه و پایایی آماری نتایج (تجربی) هستند.

نمایندگی نمونه- به عبارت دیگر، بازنمایی آن توانایی نمونه برای بازنمایی کاملاً کامل پدیده های مورد مطالعه - از نقطه نظر تنوع آنها در جمعیت عمومی است.

البته، تنها جمعیت عمومی می توانند تصویر کاملی از پدیده مورد مطالعه، با تمام دامنه و تفاوت های ظریف آن ارائه دهند. بنابراین، بازنمایی همیشه به حدی محدود می شود که نمونه محدود باشد. و این معرف بودن نمونه است که ملاک اصلی در تعیین مرزهای تعمیم یافته های تحقیق است. با این حال، تکنیک هایی وجود دارد که امکان به دست آوردن نمونه ای از نمونه کافی برای محقق را فراهم می کند (این تکنیک ها در دوره "روانشناسی تجربی" مورد مطالعه قرار می گیرند).


اولین و تکنیک اصلی انتخاب تصادفی ساده (تصادفی) است. این شامل اطمینان از چنین شرایطی است که هر یک از اعضای جامعه شانس یکسانی با دیگران برای گنجاندن در نمونه داشته باشند. انتخاب تصادفی تضمین می‌کند که می‌توان تعداد زیادی از نمایندگان جمعیت عمومی را در نمونه گنجاند. در این صورت تدابیر ویژه ای برای جلوگیری از پیدایش هر گونه الگو در حین انتخاب اتخاذ می شود. و این به ما امکان می دهد امیدوار باشیم که در نهایت، در نمونه، اموال مورد مطالعه، اگر نه در همه، در حداکثر تنوع ممکن، نشان داده شود.

راه دوم برای اطمینان از نمایندگی، نمونه گیری تصادفی طبقه ای یا انتخاب بر اساس ویژگی های جمعیت عمومی است. این شامل تعیین اولیه آن دسته از کیفیت هایی است که می تواند بر تغییرپذیری اموال مورد مطالعه تأثیر بگذارد (این می تواند جنسیت، سطح درآمد یا تحصیلات و غیره باشد). سپس نسبت درصدی تعداد گروه‌ها (اقشار) که در این کیفیت‌ها متفاوت هستند در جمعیت عمومی تعیین می‌شود و نسبت درصدی یکسان از گروه‌های مربوطه در نمونه تضمین می‌شود. سپس، آزمودنی ها در هر زیرگروه از نمونه بر اساس اصل انتخاب تصادفی ساده انتخاب می شوند.

اهمیت آماری،یا اهمیت آماری، نتایج یک مطالعه با استفاده از روش های استنتاج آماری تعیین می شود.

آیا هنگام تصمیم گیری، هنگام نتیجه گیری معین از نتایج تحقیق، از اشتباه کردن بیمه شده ایم؟ البته که نه. به هر حال، تصمیمات ما بر اساس نتایج مطالعه جامعه نمونه و همچنین بر اساس سطح دانش روانشناختی ما است. ما کاملاً از اشتباه مصون نیستیم. در آمار، چنین خطاهایی در صورتی قابل قبول تلقی می شوند که بیشتر از یک مورد از 1000 مورد رخ ندهند (احتمال خطا 0.001 = α یا یک مقدار مرتبط احتمال اطمیناننتیجه گیری صحیح p=0.999)؛ در یک مورد از 100 (احتمال خطا = 0.01 یا احتمال اطمینان مرتبط نتیجه گیری صحیح p = 0.99) یا در پنج مورد از 100 (احتمال خطا = 0.05 α یا احتمال اطمینان مرتبط خروجی نتیجه گیری صحیح p=0.95). در دو سطح آخر است که در روانشناسی تصمیم گیری می شود.

گاهی وقتی صحبت می شود اهمیت آماری، از مفهوم "سطح اهمیت" (که با α مشخص می شود) استفاده کنید. مقادیر عددی p و α تا 1000 مکمل یکدیگر هستند - مجموعه کاملی از رویدادها: یا ما انجام دادیم نتیجه گیری صحیح، یا ما اشتباه کردیم. این سطوح محاسبه نمی شود، داده می شود. سطح اهمیت را می توان به عنوان نوعی خط "قرمز" درک کرد که تقاطع آن به ما امکان می دهد از این رویداد به عنوان غیر تصادفی صحبت کنیم. در هر گزارش یا انتشار علمی معتبر، نتیجه گیری باید با نشانه ای از مقادیر p یا α که در آن نتیجه گیری انجام شده است، همراه باشد.

روش های استنباط آماری به تفصیل در دوره آموزش داده شده است. آمار ریاضی" اکنون فقط توجه می کنیم که آنها الزامات خاصی برای تعداد یا اندازهی نمونه.

متأسفانه هیچ دستورالعمل دقیقی برای از پیش تعیین حجم نمونه مورد نیاز وجود ندارد. علاوه بر این، محقق معمولاً پاسخ سؤال در مورد تعداد لازم و کافی را خیلی دیر دریافت می کند - تنها پس از تجزیه و تحلیل داده های یک نمونه از قبل بررسی شده. با این حال، کلی ترین توصیه ها را می توان فرموله کرد:

1. بیشترین حجم نمونه هنگام توسعه یک روش تشخیصی مورد نیاز است - از 200 تا 1000-2500 نفر.

2. در صورت نیاز به مقایسه 2 نمونه، تعداد کل آنها باید حداقل 50 نفر باشد. تعداد نمونه های مورد مقایسه باید تقریباً یکسان باشد.

3. اگر رابطه بین هر یک از خواص در حال بررسی است، حجم نمونه باید حداقل 30-35 نفر باشد.

4. بیشتر تغییرپذیریاموال مورد مطالعه، اندازه نمونه باید بزرگتر باشد. بنابراین، تنوع را می توان با افزایش همگنی نمونه کاهش داد، مثلاً بر اساس جنسیت، سن و غیره.

نمونه های وابسته و مستقلیک موقعیت تحقیق رایج زمانی است که یک ویژگی مورد علاقه یک محقق بر روی دو یا چند نمونه به منظور مقایسه بیشتر مطالعه می شود. این نمونه ها بسته به روش سازماندهی آنها می توانند در نسبت های متفاوتی باشند. نمونه های مستقل با این واقعیت مشخص می شوند که احتمال انتخاب هر موضوعی در یک نمونه به انتخاب هیچ یک از موضوعات در نمونه دیگر بستگی ندارد. در برابر، نمونه های وابستهبا این واقعیت مشخص می شوند که هر موضوع از یک نمونه بر اساس اختصاص داده می شود معیار معینموضوع از نمونه دیگری

که در مورد کلینمونه‌های وابسته شامل انتخاب دوتایی آزمودنی‌ها در نمونه‌های مقایسه شده است و نمونه‌های مستقل دلالت بر انتخاب مستقل افراد دارد.

لازم به ذکر است که موارد نمونه های "جزئی وابسته" (یا "تا حدی مستقل") غیرقابل قبول است: این به طور غیرقابل پیش بینی نماینده آنها را نقض می کند.

در خاتمه، متذکر می شویم که دو پارادایم تحقیق روانشناختی قابل تفکیک است.

باصطلاح R-روش شناسیشامل مطالعه تغییرپذیری یک ویژگی خاص (روانی) تحت تأثیر یک تأثیر خاص، عامل یا ویژگی دیگر است. نمونه مجموعه ای از موضوعات است.

رویکرد دیگر روش شناسی کیو،شامل مطالعه تغییرپذیری یک موضوع (فرد) تحت تأثیر محرک های مختلف (شرایط، موقعیت ها و غیره) است. مطابق با وضعیتی است که نمونه مجموعه ای از محرک ها است.

امروز واقعاً خیلی آسان است: می‌توانید به سمت رایانه بروید و بدون آگاهی کم یا بی‌اطلاع از کاری که انجام می‌دهید، هوش و مزخرفات را با سرعتی واقعا شگفت‌آور خلق کنید. (جی. باکس)

اصطلاحات و مفاهیم اولیه آمار پزشکی

در این مقاله ما برخی از مفاهیم آماری کلیدی را ارائه خواهیم کرد که در هنگام انجام تحقیقات پزشکی مرتبط هستند. این اصطلاحات با جزئیات بیشتری در مقالات مربوطه مورد بحث قرار گرفته است.

تغییر

تعریف.درجه پراکندگی داده ها (مقادیر ویژگی) در محدوده مقادیر

احتمال

تعریف. احتمال، درجه امکان وقوع یک رویداد معین در شرایط معین است.

مثال. اجازه دهید تعریف این اصطلاح را در جمله "احتمال بهبود در هنگام استفاده" توضیح دهیم محصول داروییآریمیدکس 70 درصد است." این رویداد "بهبود بیمار" است، شرایط "بیمار Arimidex مصرف می کند"، درجه احتمال 70٪ است (به طور کلی، از 100 نفری که Arimidex مصرف می کنند، 70 نفر بهبود می یابند).

احتمال تجمعی

تعریف.احتمال تجمعی زنده ماندن در زمان t برابر با نسبت بیماران زنده در آن زمان است.

مثال. اگر گفته شود که احتمال بقای تجمعی پس از یک دوره درمانی پنج ساله 0.7 است، این بدان معناست که از گروه بیماران مورد بررسی، 70٪ از تعداد اولیه زنده ماندند و 30٪ فوت کردند. به عبارت دیگر، از هر صد نفر، 30 نفر در 5 سال اول فوت کردند.

زمان قبل از رویداد

تعریف.زمان قبل از یک رویداد زمانی است که در برخی واحدها بیان می شود که از یک نقطه اولیه در زمان تا وقوع یک رویداد گذشته است.

توضیح. واحدهای زمان در تحقیقات پزشکی روز، ماه و سال است.

نمونه های معمولی از زمان های اولیه:

    شروع به نظارت بر بیمار کنید

    درمان جراحی

نمونه های معمولی از رویدادهای در نظر گرفته شده:

    پیشرفت بیماری

    وقوع عود

    مرگ بیمار

نمونه

تعریف.بخشی از یک جمعیت که با انتخاب به دست می آید.

بر اساس نتایج تجزیه و تحلیل نمونه، در مورد کل جامعه نتیجه گیری می شود که تنها در صورتی معتبر است که انتخاب به صورت تصادفی باشد. از آنجایی که انتخاب تصادفی از یک جامعه عملا غیرممکن است، باید تلاش کرد تا اطمینان حاصل شود که نمونه حداقل نماینده جامعه است.

نمونه های وابسته و مستقل

تعریف.نمونه هایی که در آنها افراد مورد مطالعه مستقل از یکدیگر انتخاب شدند. جایگزینی برای نمونه های مستقل، نمونه های وابسته (متصل، جفت) است.

فرضیه

فرضیه های دو طرفه و یک طرفه

ابتدا اجازه دهید کاربرد اصطلاح فرضیه در آمار را توضیح دهیم.

هدف بیشتر تحقیقات، آزمایش درستی برخی گزاره ها است. هدف از آزمایش دارو اغلب آزمایش این فرضیه است که یک دارو از داروی دیگر مؤثرتر است (به عنوان مثال، آریمیدکس مؤثرتر از تاموکسیفن است).

برای اطمینان از دقت مطالعه، بیانیه ای که تأیید می شود به صورت ریاضی بیان می شود. به عنوان مثال، اگر A تعداد سال‌هایی باشد که بیمار مصرف‌کننده آریمیدکس زندگی می‌کند و T تعداد سال‌هایی است که بیمار مصرف‌کننده تاموکسیفن زنده خواهد ماند، فرضیه مورد آزمایش را می‌توان به صورت A>T نوشت.

تعریف.فرضیه ای دو طرفه نامیده می شود که از تساوی دو کمیت تشکیل شده باشد.

مثالی از فرضیه دو طرفه: A=T.

تعریف. فرضیه ای یک طرفه (یک طرفه) نامیده می شود اگر شامل نابرابری دو کمیت باشد.

نمونه هایی از فرضیه های یک طرفه:

داده های دوگانه (دودویی).

تعریف.داده ها تنها با دو مقدار جایگزین معتبر بیان می شوند

مثال: بیمار "سالم" - "بیمار" است. ادم "است" - "نه".

فاصله اطمینان

تعریف.فاصله اطمینان برای یک کمیت، محدوده حول مقدار کمیتی است که مقدار واقعی آن کمیت در آن قرار دارد (با سطح مشخصی از اطمینان).

مثال. بگذارید مقدار مورد مطالعه تعداد بیماران در سال باشد. به طور متوسط، تعداد آنها 500 است و 95٪ - فاصله اطمینان- (350، 900). یعنی به احتمال زیاد (با احتمال 95 درصد) در طول سال حداقل 350 و نه بیشتر از 900 نفر با کلینیک تماس خواهند گرفت.

تعیین. یک علامت اختصاری بسیار رایج این است: CI 95% یک فاصله اطمینان با سطح اطمینان 95٪ است.

پایایی، معناداری آماری (سطح P)

تعریف. اهمیت آمارینتیجه معیاری برای اطمینان به "حقیقت" آن است.

هر تحقیقی تنها بر اساس بخشی از اشیاء انجام می شود. مطالعه اثربخشی یک دارو نه بر اساس همه بیماران در این سیاره، بلکه فقط بر روی گروه خاصی از بیماران انجام می شود (انجام تجزیه و تحلیل بر اساس همه بیماران به سادگی غیرممکن است).

بیایید فرض کنیم که در نتیجه تجزیه و تحلیل نتیجه خاصی گرفته شد (به عنوان مثال، استفاده از Arimidex به عنوان یک درمان کافی 2 برابر موثرتر از تاموکسیفن است).

سوالی که باید پرسیده شود این است: "چقدر می توان به این نتیجه اعتماد کرد؟"

تصور کنید که ما مطالعه ای را بر اساس تنها دو بیمار انجام دادیم. البته، در این مورد، نتایج باید با احتیاط درمان شوند. اگر تعداد زیادی از بیماران معاینه شدند (مقدار عددی " مقدار زیاد"بستگی به وضعیت دارد)، سپس می توان به نتایج به دست آمده از قبل اعتماد کرد.

بنابراین، درجه اطمینان با مقدار p-level (p-value) تعیین می شود.

سطح p بالاتر مربوط به سطح پایین تری از اطمینان در نتایج به دست آمده از تجزیه و تحلیل نمونه است. به عنوان مثال، سطح p برابر با 0.05 (5٪) نشان می دهد که نتیجه گیری از تجزیه و تحلیل یک گروه خاص تنها یک ویژگی تصادفی از این اشیاء با احتمال تنها 5٪ است.

به عبارت دیگر، با احتمال بسیار بالا (95٪) می توان نتیجه را به همه اشیاء تعمیم داد.

بسیاری از مطالعات 5% را به عنوان یک مقدار سطح p قابل قبول در نظر می گیرند. این بدان معنی است که اگر برای مثال p = 0.01، می توان به نتایج اعتماد کرد، اما اگر p = 0.06، آنگاه نمی توانید.

مطالعه

مطالعه آینده نگرمطالعه ای است که در آن نمونه ها بر اساس یک عامل اولیه انتخاب می شوند و برخی از عوامل حاصل در نمونه ها مورد تجزیه و تحلیل قرار می گیرند.

مطالعه گذشته نگرمطالعه ای است که در آن نمونه ها بر اساس یک عامل حاصل انتخاب می شوند و برخی از عوامل اولیه در نمونه ها مورد تجزیه و تحلیل قرار می گیرند.

مثال. عامل اولیه یک زن باردار جوانتر/بالای 20 سال است. فاکتور حاصل این است که کودک سبکتر/سنگین تر از 2.5 کیلوگرم است. ما تجزیه و تحلیل می کنیم که آیا وزن کودک به سن مادر بستگی دارد یا خیر.

اگر ما 2 نمونه را انتخاب کنیم، یکی با مادران زیر 20 سال، دیگری با مادران بزرگتر، و سپس توده کودکان در هر گروه را تجزیه و تحلیل کنیم، آنگاه این یک مطالعه آینده نگر است.

اگر 2 نمونه را انتخاب کنیم، در یکی - مادرانی که بچه هایی با وزن کمتر از 2.5 کیلوگرم به دنیا آورده اند، در دیگری - سنگین تر، و سپس سن مادران هر گروه را تجزیه و تحلیل کنیم، آنگاه این یک مطالعه گذشته نگر است (طبیعاً چنین مطالعه ای است. را می توان تنها زمانی انجام داد که آزمایش کامل شود، یعنی همه بچه ها متولد شوند).

خروج

تعریف.یک پدیده بالینی مهم، نشانگر یا علامت آزمایشگاهی که به عنوان یک موضوع مورد علاقه محقق عمل می کند. هنگام انجام کارآزمایی های بالینی، نتایج به عنوان معیاری برای ارزیابی اثربخشی یک مداخله درمانی یا پیشگیرانه عمل می کنند.

اپیدمیولوژی بالینی

تعریف.علمی که بر اساس مطالعه سیر بالینی بیماری در موارد مشابه با استفاده از روش های دقیق، امکان پیش بینی نتیجه خاصی را برای هر بیمار خاص فراهم می کند. روش های علمیمطالعه بیماران برای اطمینان از صحت پیش بینی ها.

گروه

تعریف.گروهی از شرکت کنندگان در مطالعه که توسط برخی متحد شدند ویژگی مشترکدر زمان شکل گیری آن و در یک دوره زمانی طولانی مورد مطالعه قرار گرفت.

کنترل

کنترل تاریخی

تعریف.یک گروه کنترل تشکیل شد و در دوره قبل از مطالعه مورد بررسی قرار گرفت.

کنترل موازی

تعریف.یک گروه کنترل همزمان با تشکیل گروه اصلی تشکیل شد.

همبستگی

تعریف.یک رابطه آماری بین دو مشخصه (کمی یا ترتیبی) که نشان می دهد مقدار بزرگتر یک مشخصه در بخش خاصی از موارد با مقدار بزرگتر - در صورت همبستگی مثبت (مستقیم) - مشخصه دیگر یا کوچکتر مطابقت دارد. مقدار - در مورد همبستگی منفی (معکوس).

مثال. ارتباط معنی داری بین سطح پلاکت ها و لکوسیت ها در خون بیمار مشاهده شد. ضریب همبستگی 0.76 است.

ضریب ریسک (RR)

تعریف.نسبت ریسک، نسبت احتمال وقوع یک رویداد ("بد") برای گروه اول از اشیاء به احتمال وقوع همان رویداد برای گروه دوم از اشیاء است.

مثال. اگر احتمال ابتلا به سرطان ریه در افراد غیر سیگاری 20% و در افراد سیگاری 100% باشد، CR برابر با یک پنجم خواهد بود. در این مثال، دسته اول اشیاء غیر سیگاری، گروه دوم سیگاری هستند و بروز سرطان ریه به عنوان یک رویداد "بد" در نظر گرفته شده است.

بدیهی است که:

1) اگر KR = 1 باشد، احتمال وقوع یک رویداد در گروه ها یکسان است

2) اگر KP>1، آنگاه رویداد بیشتر با اشیاء گروه اول رخ می دهد تا از گروه دوم

3) اگر KR<1, то событие чаще происходит с объектами из второй группы, чем из первой

متاآنالیز

تعریف. باتجزیه و تحلیل آماری که نتایج چندین مطالعه را در مورد یک مشکل (معمولاً اثربخشی درمان، پیشگیری، روش‌های تشخیصی) خلاصه می‌کند. مطالعات ادغام نمونه بزرگتری برای تجزیه و تحلیل و قدرت آماری بیشتر برای مطالعات ترکیبی فراهم می کند. برای افزایش شواهد یا اطمینان در نتیجه گیری در مورد اثربخشی روش مورد مطالعه استفاده می شود.

روش کاپلان مایر (برآورنده های ضرب کاپلان مایر)

این روش توسط آماردانان E.L. Kaplan و Paul Meyer ابداع شد.

این روش برای محاسبه مقادیر مختلف مرتبط با زمان مشاهده بیمار استفاده می شود. نمونه هایی از این مقادیر:

    احتمال بهبودی در طی یک سال هنگام استفاده از دارو

    احتمال عود بعد از جراحی در عرض سه سال پس از جراحی

    احتمال تجمعی بقا در پنج سال در میان بیماران مبتلا به سرطان پروستات پس از قطع عضو

اجازه دهید مزایای استفاده از روش Kaplan-Meier را توضیح دهیم.

مقادیر مقادیر در تجزیه و تحلیل "متعارف" (بدون استفاده از روش Kaplan-Meier) بر اساس تقسیم فاصله زمانی مورد نظر به فواصل محاسبه می شود.

به عنوان مثال، اگر احتمال مرگ بیمار را در عرض 5 سال مطالعه کنیم، فاصله زمانی را می توان به 5 قسمت تقسیم کرد (کمتر از 1 سال، 1-2 سال، 2-3 سال، 3-4 سال، 4- 5 سال)، بنابراین و برای 10 (هر کدام شش ماه)، یا برای تعداد دیگری از فواصل. نتایج برای پارتیشن های مختلف متفاوت خواهد بود.

انتخاب مناسب ترین پارتیشن کار آسانی نیست.

تخمین مقادیر بدست آمده با استفاده از روش Kaplan-Meier به تقسیم زمان مشاهده به فواصل زمانی بستگی ندارد، بلکه تنها به طول عمر هر بیمار بستگی دارد.

بنابراین، انجام تجزیه و تحلیل برای محقق آسانتر است و نتایج اغلب بهتر از نتایج تجزیه و تحلیل «متعارف» است.

منحنی کاپلان - مایر نموداری از منحنی بقا است که با استفاده از روش کاپلان مایر به دست آمده است.

مدل کاکس

این مدل توسط سر دیوید راکسبی کاکس (متولد 1924)، آماردان مشهور انگلیسی، نویسنده بیش از 300 مقاله و کتاب، اختراع شد.

مدل کاکس در شرایطی استفاده می شود که کمیت های مورد مطالعه در تجزیه و تحلیل بقا به توابع زمان بستگی دارد. برای مثال، احتمال عود پس از t سال (t=1,2,...) ممکن است به لگاریتم زمان log(t) بستگی داشته باشد.

مزیت مهم روش ارائه شده توسط کاکس، کاربرد این روش در تعداد زیادی از موقعیت ها است (مدل محدودیت های سختی را در ماهیت یا شکل توزیع احتمال اعمال نمی کند).

بر اساس مدل کاکس می توان تحلیلی انجام داد (به نام آنالیز کاکس) که نتیجه آن مقدار ضریب ریسک و فاصله اطمینان برای ضریب ریسک است.

روش های آماری ناپارامتریک

تعریف.دسته ای از روش های آماری که عمدتاً برای تجزیه و تحلیل داده های کمی که توزیع نرمال را تشکیل نمی دهند و همچنین برای تجزیه و تحلیل داده های کیفی استفاده می شود.

مثال. برای شناسایی اهمیت تفاوت در فشار سیستولیک بیماران بسته به نوع درمان، از آزمون ناپارامتری من ویتنی استفاده می کنیم.

علامت (متغیر)

تعریف. ایکسویژگی های موضوع مورد مطالعه (مشاهده). ویژگی های کیفی و کمی وجود دارد.

تصادفی سازی

تعریف.روشی برای توزیع تصادفی اشیاء تحقیق به دو گروه اصلی و کنترل با استفاده از ابزارهای خاص (جدول یا شمارنده اعداد تصادفی، پرتاب سکه و سایر روش‌های تخصیص تصادفی شماره گروه به یک مشاهده شامل). تصادفی سازی تفاوت بین گروه ها در خصوص ویژگی های شناخته شده و ناشناخته را که به طور بالقوه بر نتیجه مورد مطالعه تأثیر می گذارد، به حداقل می رساند.

خطر

اسنادی- خطر اضافی یک پیامد نامطلوب (به عنوان مثال، بیماری) به دلیل وجود یک ویژگی خاص (عامل خطر) در موضوع مطالعه. این بخشی از خطر ابتلا به بیماری است که با آن همراه است، توضیح داده می شود و در صورت حذف عامل خطر می توان آن را از بین برد.

ریسک نسبی- نسبت خطر یک وضعیت نامطلوب در یک گروه به خطر ابتلا به این وضعیت در گروه دیگر. در مطالعات آینده نگر و مشاهده ای زمانی که گروه ها از قبل تشکیل شده اند و وقوع شرایط مورد مطالعه هنوز رخ نداده است استفاده می شود.

آزمون چرخشی

تعریف.روشی برای بررسی پایداری، قابلیت اطمینان، عملکرد (اعتبار) یک مدل آماری با حذف پی در پی مشاهدات و محاسبه مجدد مدل. هر چه مدل‌های حاصل شبیه‌تر باشند، مدل پایدارتر و قابل اعتمادتر است.

رویداد

تعریف.پیامد بالینی مشاهده شده در مطالعه، مانند وقوع یک عارضه، عود، بهبودی یا مرگ.

طبقه بندی

تعریف. میک روش نمونه‌گیری که در آن، جمعیت همه شرکت‌کنندگانی که معیارهای ورود به مطالعه را دارند، ابتدا بر اساس یک یا چند ویژگی (معمولاً جنس، سن) که بالقوه بر نتیجه مورد علاقه تأثیر می‌گذارند، به گروه‌ها (قشر) تقسیم می‌شوند. این گروه ها (قشر) شرکت کنندگان به طور مستقل در دو گروه آزمایش و کنترل انتخاب می شوند. این به محقق اجازه می دهد تا بین ویژگی های مهم بین گروه آزمایش و کنترل تعادل ایجاد کند.

جدول احتمالی

تعریف.جدولی از فرکانس های مطلق (اعداد) مشاهدات که ستون های آن با مقادیر یک مشخصه مطابقت دارد و ردیف ها با مقادیر یک مشخصه دیگر (در مورد یک جدول احتمالی دو بعدی). مقادیر فرکانس مطلق در سلول ها در محل تقاطع سطرها و ستون ها قرار دارند.

بیایید یک مثال از یک جدول احتیاطی ارائه دهیم. جراحی آنوریسم در 194 بیمار انجام شد. شدت ادم در بیماران قبل از جراحی مشخص است.

ادم\ نتیجه

بدون تورم 20 6 26
تورم متوسط 27 15 42
ادم تلفظ شده 8 21 29
m j 55 42 194

بنابراین از 26 بیمار بدون ادم، 20 بیمار پس از جراحی زنده ماندند و 6 بیمار فوت کردند. از 42 بیمار مبتلا به ادم متوسط، 27 بیمار زنده ماندند، 15 نفر فوت کردند و غیره.

تست مجذور کای برای جداول احتمالی

برای تعیین اهمیت (قابلیت اطمینان) تفاوت ها در یک علامت بسته به علامت دیگر (به عنوان مثال، نتیجه یک عمل بسته به شدت ادم)، از آزمون کای دو برای جداول احتمالی استفاده می شود:


شانس. فرصت

فرض کنید احتمال وقوع یک رویداد برابر با p باشد. سپس احتمال اینکه رویداد رخ ندهد 1-p است.

به عنوان مثال، اگر احتمال زنده ماندن بیمار پس از پنج سال 0.8 (80٪) باشد، احتمال مرگ او در این بازه زمانی 0.2 (20٪) است.

تعریف.شانس نسبت احتمال وقوع یک رویداد به احتمال عدم وقوع آن رویداد است.

مثال. در مثال ما (در مورد یک بیمار)، شانس 4 است، زیرا 0.8/0.2=4 است

بنابراین، احتمال بهبودی 4 برابر بیشتر از احتمال مرگ است.

تفسیر ارزش یک کمیت.

1) اگر شانس=1 باشد، احتمال وقوع یک رویداد برابر با احتمال عدم وقوع آن رویداد است.

2) اگر شانس > 1 باشد، پس احتمال وقوع رویداد بیشتر از احتمال رخ ندادن رویداد است.

3) اگر شانس<1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.

نسبت شانس

تعریف.نسبت شانس، نسبت شانس برای دسته اول از اشیاء به نسبت شانس برای گروه دوم از اشیاء است.

مثال. بیایید فرض کنیم که هم مردان و هم زنان تحت درمان قرار می گیرند.

احتمال زنده ماندن یک بیمار مرد پس از پنج سال 0.6 (60%) است. احتمال مرگ او در این بازه زمانی 0.4 (40%) است.

احتمالات مشابه برای زنان 0.8 و 0.2 است.

نسبت شانس در این مثال است

تفسیر ارزش یک کمیت.

1) اگر نسبت شانس = 1 باشد، شانس گروه اول برابر با شانس گروه دوم است.

2) اگر نسبت شانس > 1 باشد، شانس گروه اول بیشتر از شانس گروه دوم است.

3) اگر نسبت شانس<1, то шанс для первой группы меньше шанса для второй группы

آمار مدت هاست که به بخشی جدایی ناپذیر از زندگی تبدیل شده است. مردم همه جا با آن مواجه می شوند. بر اساس آمار، نتیجه‌گیری در مورد اینکه کجا و چه بیماری‌هایی شایع است، چه چیزی در یک منطقه خاص یا در میان بخش خاصی از جمعیت بیشتر مورد تقاضا است، به دست می‌آید. حتی برنامه های سیاسی نامزدهای دولت نیز بر همین اساس است. آنها همچنین توسط زنجیره‌های خرده‌فروشی هنگام خرید کالا استفاده می‌شوند و تولیدکنندگان در پیشنهادات خود بر اساس این داده‌ها هدایت می‌شوند.

آمار نقش مهمی در زندگی جامعه ایفا می کند و بر تک تک اعضا حتی در موارد کوچک تأثیر می گذارد. برای مثال، اگر بیشتر مردم رنگ‌های تیره را در لباس‌های شهر یا منطقه‌ای خاص ترجیح می‌دهند، پیدا کردن یک بارانی زرد روشن با چاپ گل در فروشگاه‌های خرده‌فروشی محلی بسیار دشوار خواهد بود. اما چه مقادیری این داده ها را تشکیل می دهند که چنین تأثیری دارند؟ به عنوان مثال، "اهمیت آماری" چیست؟ منظور از این تعریف دقیقاً چیست؟

این چیه؟

آمار به عنوان یک علم از ترکیبی از مقادیر و مفاهیم مختلف تشکیل شده است. یکی از آنها مفهوم «اهمیت آماری» است. این نام مقدار متغیرهایی است که احتمال ظهور سایر شاخص ها در آنها ناچیز است.

به عنوان مثال، از هر 10 نفر 9 نفر در یک پیاده روی صبحگاهی برای چیدن قارچ در جنگل های پاییزی پس از یک شب بارانی، کفش های لاستیکی روی پاهای خود می گذارند. این احتمال وجود دارد که در برخی موارد 8 نفر از آنها مقرنس بوم بپوشند، ناچیز است. بنابراین، در این مثال خاص، عدد 9 مقداری است که "معناداری آماری" نامیده می شود.

بر این اساس، اگر مثال عملی زیر را توسعه دهیم، کفش‌فروشی‌ها در پایان فصل تابستان، چکمه‌های لاستیکی را در مقادیر بیشتری نسبت به سایر زمان‌های سال خریداری می‌کنند. بنابراین، مقدار یک مقدار آماری بر زندگی روزمره تأثیر می گذارد.

البته در محاسبات پیچیده، مثلاً هنگام پیش بینی شیوع ویروس ها، تعداد زیادی متغیر در نظر گرفته می شود. اما ماهیت تعیین یک شاخص قابل توجه از داده های آماری، صرف نظر از پیچیدگی محاسبات و تعداد مقادیر غیر ثابت، مشابه است.

چگونه محاسبه می شود؟

آنها هنگام محاسبه مقدار شاخص "اهمیت آماری" معادله استفاده می شوند. یعنی می توان استدلال کرد که در این مورد همه چیز توسط ریاضیات تعیین می شود. ساده ترین گزینه محاسبه زنجیره ای از عملیات ریاضی است که شامل پارامترهای زیر است:

  • دو نوع نتیجه به دست آمده از نظرسنجی ها یا مطالعه داده های عینی، به عنوان مثال، مبالغی که برای آن خرید انجام می شود، با علامت a و b مشخص می شود.
  • شاخص برای هر دو گروه - n؛
  • مقدار سهم نمونه ترکیبی p است.
  • مفهوم "خطای استاندارد" - SE.

مرحله بعدی تعیین شاخص آزمایش عمومی - t است، مقدار آن با عدد 1.96 مقایسه می شود. 1.96 مقدار متوسطی است که محدوده 95% را با توجه به تابع توزیع t Student نشان می دهد.

اغلب این سوال مطرح می شود که تفاوت بین مقادیر n و p چیست. این تفاوت ظریف را می توان به راحتی با کمک یک مثال روشن کرد. فرض کنید در حال محاسبه اهمیت آماری وفاداری به یک محصول یا برند برای مردان و زنان هستیم.

در این مورد، نام حروف با موارد زیر دنبال می شود:

  • n - تعداد پاسخ دهندگان؛
  • p تعداد افرادی است که از محصول راضی هستند.

تعداد زنانی که در این مورد مصاحبه می شوند 1 نفر تعیین می شود. بر این اساس، n2 مرد وجود دارد. اعداد "1" و "2" برای نماد p به همین معنی خواهند بود.

مقایسه شاخص آزمون با مقادیر میانگین جداول محاسبات دانشجویی به چیزی تبدیل می‌شود که به آن «معنی‌داری آماری» می‌گویند.

منظور از تایید چیست؟

نتایج هر محاسبات ریاضی را می توان همیشه در مدرسه ابتدایی به کودکان آموزش داد. منطقی است که فرض کنیم از آنجایی که شاخص های آماری با استفاده از زنجیره ای از محاسبات تعیین می شوند، بررسی می شوند.

با این حال، آزمون اهمیت آماری فقط در مورد ریاضی نیست. آمار با تعداد زیادی متغیر و احتمالات مختلف سروکار دارد که همیشه قابل محاسبه نیستند. یعنی اگر به مثال کفش لاستیکی ارائه شده در ابتدای مقاله برگردیم، در آن صورت ساختار منطقی داده های آماری که خریداران کالا برای فروشگاه ها به آن تکیه می کنند ممکن است در اثر هوای خشک و گرم مختل شود، که برای آن معمول نیست. فصل پاييز. در نتیجه این پدیده، تعداد افرادی که چکمه های لاستیکی خریداری می کنند کاهش می یابد و خرده فروشی ها متحمل ضرر می شوند. یک فرمول ریاضی، البته، قادر به پیش بینی ناهنجاری آب و هوا نیست. این لحظه "اشتباه" نامیده می شود.

این دقیقاً احتمال چنین خطاهایی است که هنگام بررسی سطح اهمیت محاسبه شده در نظر گرفته می شود. هم شاخص های محاسبه شده و هم سطوح اهمیت پذیرفته شده و هم مقادیری را که معمولاً فرضیه نامیده می شوند در نظر می گیرد.

سطح اهمیت چیست؟

مفهوم "سطح" در معیارهای اصلی برای اهمیت آماری گنجانده شده است. در آمار کاربردی و کاربردی استفاده می شود. این یک نوع ارزش است که احتمال انحرافات یا خطاهای احتمالی را در نظر می گیرد.

این سطح بر اساس شناسایی تفاوت‌ها در نمونه‌های آماده است و به ما امکان می‌دهد اهمیت یا برعکس تصادفی بودن آنها را مشخص کنیم. این مفهوم نه تنها دارای معانی دیجیتالی است، بلکه رمزگشایی منحصر به فرد آنها را نیز دارد. آنها توضیح می دهند که چگونه ارزش باید درک شود، و خود سطح با مقایسه نتیجه با شاخص متوسط ​​تعیین می شود، این میزان قابلیت اطمینان تفاوت ها را نشان می دهد.

بنابراین، می توانیم مفهوم سطح را به سادگی تصور کنیم - این نشانگر خطا یا خطای قابل قبول، احتمالی در نتیجه گیری های حاصل از داده های آماری به دست آمده است.

چه سطوح معنی داری استفاده می شود؟

اهمیت آماری ضرایب احتمال خطا در عمل بر اساس سه سطح اساسی است.

سطح اول به عنوان آستانه ای در نظر گرفته می شود که در آن مقدار 5٪ است. یعنی احتمال خطا از سطح معنی داری 5 درصد فراتر نمی رود. این بدان معنی است که اطمینان به بی عیب و نقص بودن و نتیجه گیری بدون خطا بر اساس داده های تحقیقاتی آماری 95٪ است.

سطح دوم آستانه 1 درصد است. بر این اساس، این رقم به این معنی است که می توان با داده های به دست آمده در طی محاسبات آماری با اطمینان 99 درصد راهنمایی کرد.

سطح سوم 0.1٪ است. با این مقدار، احتمال خطا برابر با کسری از درصد است، یعنی خطاها عملا حذف می شوند.

فرضیه در آمار چیست؟

خطاها به عنوان یک مفهوم به دو جهت در مورد پذیرش یا رد فرضیه صفر تقسیم می شوند. فرضیه مفهومی است که بر اساس تعریف، مجموعه ای از داده ها یا گزاره های دیگر در پشت آن نهفته است. یعنی توصیفی از توزیع احتمالی چیزی مرتبط با موضوع حسابداری آماری.

در محاسبات ساده دو فرضیه وجود دارد - صفر و جایگزین. تفاوت بین آنها این است که فرضیه صفر بر این ایده استوار است که هیچ تفاوت اساسی بین نمونه های دخیل در تعیین معنی داری آماری وجود ندارد و فرضیه جایگزین کاملاً برعکس است. یعنی فرضیه جایگزین بر اساس وجود تفاوت معنادار در داده های نمونه است.

چه خطاهایی وجود دارد؟

خطاها به عنوان یک مفهوم در آمار به طور مستقیم به پذیرش یک یا آن فرضیه به عنوان صحیح بستگی دارد. آنها را می توان به دو جهت یا نوع تقسیم کرد:

  • نوع اول به دلیل پذیرش فرضیه صفر است که نادرست است.
  • دومی ناشی از پیروی از جایگزین است.

اولین نوع خطا، مثبت کاذب نامیده می شود و اغلب در همه مناطقی که از داده های آماری استفاده می شود، رخ می دهد. بر این اساس خطای نوع دوم را منفی کاذب می گویند.

رگرسیون در آمار برای چیست؟

اهمیت آماری رگرسیون این است که می توان از آن برای تعیین اینکه مدل وابستگی های مختلف محاسبه شده بر اساس داده ها چقدر با واقعیت مطابقت دارد استفاده کرد. به شما این امکان را می دهد که کافی بودن یا نبود عواملی را برای در نظر گرفتن و نتیجه گیری شناسایی کنید.

مقدار رگرسیون با مقایسه نتایج با داده های فهرست شده در جداول فیشر تعیین می شود. یا با استفاده از تحلیل واریانس. شاخص های رگرسیون برای مطالعات و محاسبات پیچیده آماری که شامل تعداد زیادی متغیر، داده های تصادفی و تغییرات احتمالی است، مهم هستند.

وظیفه تحقیقات آماری شناسایی الگوهای زیربنای ماهیت پدیده های مورد مطالعه است. شاخص ها و مقادیر متوسط ​​باید به عنوان بازتابی از واقعیت عمل کنند که برای تعیین میزان قابلیت اطمینان آنها ضروری است. نمایش صحیح جامعه نمونه توسط جامعه را نمایندگی می گویند . معیار دقت و پایایی مقادیر آماری نمونه، میانگین خطاهای نمایندگی (نمایندگی) است که به حجم نمونه و درجه تنوع جامعه نمونه با توجه به ویژگی مورد مطالعه بستگی دارد.

بنابراین، برای تعیین میزان پایایی نتایج یک مطالعه آماری، لازم است میانگین خطای متناظر برای هر مقدار نسبی و متوسط ​​محاسبه شود. میانگین خطای شاخص m p با استفاده از فرمول محاسبه می شود:

وقتی تعداد مشاهدات کمتر از 30 باشد، کجا

P - مقدار شاخص در درصد، ppm و غیره.

q - اضافه شدن این شاخص به 100 اگر درصد باشد به 1000 اگر % 0 و غیره باشد. (یعنی q = 100–P، 1000–P و غیره)

به عنوان مثال، مشخص است که در طول سال 224 نفر در منطقه به اسهال خونی مبتلا شده اند. جمعیت: 33000 درصد بروز اسهال خونی

میانگین خطای این شاخص

برای حل مسئله درجه قابلیت اطمینان یک شاخص، یک ضریب اطمینان (t) تعیین می شود که برابر است با نسبت شاخص به میانگین خطای آن، یعنی.

در مثال ما

هر چه t بالاتر باشد، درجه اطمینان بیشتر است. در t=1، احتمال پایایی شاخص 68.3٪، در t=2 - 95.5٪، در t=3 - 99.7٪ است. در مطالعات آماری پزشکی، معمولاً از سطح اطمینان (پایایی) 95.5٪ - 99.0٪ و در بحرانی ترین موارد - 99.7٪ استفاده می شود. بنابراین، در مثال ما، میزان بروز قابل اعتماد است.

اگر تعداد مشاهدات کمتر از 30 باشد، مقدار معیار با استفاده از جدول Student تعیین می شود. اگر مقدار حاصل بالاتر یا برابر با مقدار جدول باشد، نشانگر قابل اعتماد است. اگر پایین تر باشد قابل اعتماد نیست.

در صورت لزوم مقایسه دو شاخص همگن، قابلیت اطمینان تفاوت آنها با فرمول تعیین می شود:

(از عدد بزرگتر عدد کوچکتر کم می شود)

که در آن P 1 - P 2 تفاوت بین دو شاخص مقایسه شده است،

میانگین خطای تفاوت بین دو شاخص است.

به عنوان مثال، در منطقه B، 270 نفر در طول سال به اسهال خونی مبتلا شدند. جمعیت منطقه 45000 نفر است از این رو بروز اسهال خونی:

آن ها میزان بروز قابل اعتماد است.

همانطور که می بینید، میزان بروز در ناحیه B کمتر از ناحیه A است. ما پایایی تفاوت بین دو شاخص را با استفاده از فرمول تعیین می کنیم:

اگر تعداد مشاهدات زیاد باشد (بیش از 30)، تفاوت در شاخص ها از نظر آماری معنی دار است اگر t = 2 یا بیشتر باشد. بنابراین، در مثال ما، بروز در منطقه A به طور قابل توجهی بالاتر است، زیرا ضریب اطمینان (t) بیشتر از 2 است.

با دانستن مقدار میانگین خطای یک اندیکاتور، بسته به تأثیر دلایل تصادفی، می توان حدود اطمینان این شاخص را تعیین کرد. محدودیت های اطمینان با فرمول تعیین می شود:

P - نشانگر؛

m خطای متوسط ​​آن است.

t - ضریب اطمینان بسته به مقدار پایایی مورد نیاز انتخاب می‌شود: t=1 مربوط به پایایی نتیجه در 68.3% موارد، t=2 – 95.5%، t=2.6 – 99%، t=3 – 99.7% است. t=3.3 – 99.9 مقدار حداکثر خطا نامیده می شود.

به عنوان مثال، در منطقه B، نرخ بروز اسهال خونی با دقت 99.7 9٪ ممکن است به دلیل عوامل تصادفی در محدوده نوسان داشته باشد. از 49.1 تا 70.9.



مقالات مشابه

2024 parki48.ru. ما در حال ساخت یک خانه قاب هستیم. طراحی منظر. ساخت و ساز. پایه.