Вариацын болон статистик тархалтын цувралууд

Статистикийн шинжилгээнд онцгой байр суурь нь судлагдсан шинж чанар, үзэгдлийн дундаж түвшинг тодорхойлох явдал юм. Онцлогын дундаж түвшинг дундаж утгуудаар хэмждэг.

Дундаж утга нь судлагдсан шинж чанарын ерөнхий тоон түвшинг тодорхойлдог бөгөөд статистикийн популяцийн бүлгийн шинж чанар юм. Энэ нь нэг чиглэлд эсвэл өөр чиглэлд бие даасан ажиглалтын санамсаргүй хазайлтыг тэгшитгэж, сулруулж, судалж буй шинж чанарын үндсэн, ердийн шинж чанарыг тодотгож өгдөг.

Дундажуудыг өргөн ашигладаг:

1. Хүн амын эрүүл мэндийн байдлыг үнэлэхэд: шинж чанар бие бялдрын хөгжил(өндөр, жин, тойрог цээжгэх мэт), тархалт, үргэлжлэх хугацааг тодорхойлох янз бүрийн өвчин, хүн ам зүйн үзүүлэлтүүдийн дүн шинжилгээ (хүн амын байгалийн хөдөлгөөн, дундаж наслалт, хүн амын нөхөн үржихүй, дундаж хүн ам гэх мэт).

2. Эмнэлгийн байгууллага, эмнэлгийн ажилтны үйл ажиллагааг судлах, тэдгээрийн ажлын чанарыг үнэлэх, хүн амын хэрэгцээг төрөл бүрийн хэлбэрээр төлөвлөх, тодорхойлох. Эрүүл мэндийн тусламж үйлчилгээ(жилд нэг оршин суугчд ногдох өргөдөл, хандалтын дундаж тоо, өвчтөний эмнэлэгт хэвтэх дундаж хугацаа, өвчтөний үзлэгт хамрагдах дундаж хугацаа, эмч, ороор хангагдсан дундаж байдал гэх мэт).

3. Ариун цэврийн болон эпидемиологийн төлөв байдлыг тодорхойлох (цехийн агаарын дундаж тоосжилт, нэг хүнд ногдох талбайн дундаж хэмжээ, уураг, өөх тос, нүүрс усны дундаж хэрэглээ гэх мэт).

4. Эмнэлгийн болон физиологийн үзүүлэлтүүдийг норм ба эмгэг судлалд тодорхойлох, лабораторийн мэдээлэл боловсруулах, нийгэм-эрүүл ахуй, эмнэлзүйн, туршилтын судалгаанд сонгон авсан судалгааны үр дүнгийн найдвартай байдлыг тогтоох.

Дундаж утгын тооцоог вариацын цувааны үндсэн дээр гүйцэтгэдэг. Вариацын цуврал- энэ нь чанарын хувьд нэгэн төрлийн статистикийн багц бөгөөд тус тусын нэгжүүд нь судлагдсан шинж чанар, үзэгдлийн тоон ялгааг тодорхойлдог.

Тоон хэлбэлзэл нь тасархай (дискрет) ба тасралтгүй гэсэн хоёр төрөлтэй байж болно.

Тасралтгүй (дискрет) тэмдэг нь зөвхөн бүхэл тоогоор илэрхийлэгдэх бөгөөд ямар ч байж болохгүй завсрын утгууд(жишээлбэл, зочилсон тоо, сайтын хүн ам, гэр бүлийн хүүхдийн тоо, өвчний хүндийн зэргийг оноогоор илэрхийлнэ).

Тасралтгүй тэмдэг нь тодорхой хязгаар дотор ямар ч утгыг, түүний дотор бутархай утгыг авч болох бөгөөд зөвхөн ойролцоогоор илэрхийлэгддэг (жишээлбэл, жин - насанд хүрэгчдэд та килограммаар, нярай хүүхдэд - граммаар хязгаарлаж болно; өндөр, өндөр, артерийн даралт, өвчтөнтэй уулзах цаг гэх мэт).



Вариацын цувралд багтсан бие даасан шинж чанар, үзэгдэл бүрийн тоон утгыг хувилбар гэж нэрлэдэг бөгөөд үсгээр тэмдэглэнэ. В . Жишээлбэл, математикийн уран зохиолд өөр тэмдэглэгээ байдаг x эсвэл y.

Сонголт бүрийг нэг удаа зааж өгсөн вариацын цувралыг энгийн гэж нэрлэдэг.Ийм цувралуудыг компьютерийн өгөгдөл боловсруулах тохиолдолд статистикийн ихэнх асуудалд ашигладаг.

Дүрмээр бол ажиглалтын тоо нэмэгдэхийн хэрээр хувилбарын утгууд давтагддаг. Энэ тохиолдолд энэ нь үүсгэдэг бүлэглэсэн вариацын цуврал, давталтын тоог зааж өгсөн (давтамж, "үсгээр тэмдэглэгдсэн" Р »).

Эрэмбэлэгдсэн вариацын цувралөсөх эсвэл буурах дарааллаар байрлуулсан сонголтуудаас бүрдэнэ. Энгийн болон бүлэглэсэн цувралыг зэрэглэлээр бүрдүүлж болно.

Интервалын өөрчлөлтийн цувралМаш олон тооны ажиглалтын нэгжээр (1000 гаруй) компьютер ашиглахгүйгээр хийсэн дараагийн тооцооллыг хялбарчлах зорилгоор хийсэн.

Тасралтгүй вариацын цувралямар ч утга байж болох хувилбарын утгыг агуулдаг.

Хэрэв вариацын цувралд шинж чанарын утгуудыг (сонголтуудыг) тусад нь тусгай тоо хэлбэрээр өгсөн бол ийм цувралыг нэрлэдэг. салангид.

Ерөнхий шинж чанарВариацын цувралд тусгагдсан шинж чанарын утгууд нь дундаж утгууд юм. Тэдгээрийн дотроос хамгийн их ашиглагддаг нь: дунд арифметик утга М,загвар Моба дундаж Би.Эдгээр шинж чанар бүр нь өвөрмөц юм. Тэдгээр нь бие биенээ орлож чадахгүй бөгөөд зөвхөн нэгтгэсэн хэлбэрээр, нэлээд бүрэн бөгөөд товч хэлбэрээр нь вариацын цувралын онцлог шинж чанарууд юм.

Загвар (Сар) хамгийн их тохиолддог сонголтуудын утгыг нэрлэнэ үү.

Медиан (би) нь мужласан вариацын цувааг хагаст хуваах хувилбарын утга (дундаж тал бүр дээр хувилбарын тал нь байна). Ховор тохиолдолд, тэгш хэмтэй вариацын цуваа байх үед горим ба медиан нь хоорондоо тэнцүү бөгөөд арифметик дундажийн утгатай давхцдаг.

Хувилбарын утгуудын хамгийн нийтлэг шинж чанар нь Арифметик дундажүнэ цэнэ( М ). Математикийн уран зохиолд үүнийг тэмдэглэсэн байдаг .

Арифметик дундаж (М, ) нь чанарын хувьд нэгэн төрлийн статистикийн багцыг бүрдүүлдэг судлагдсан үзэгдлийн тодорхой шинж чанарын ерөнхий тоон шинж чанар юм. Энгийн арифметик дундаж ба жигнэсэн дундажийг ялгах. Энгийн арифметик дундажийг энгийн вариацын цувралын хувьд бүх хувилбаруудыг нэгтгэж, энэ нийлбэрийг хуваах замаар тооцдог. нийтсонголт энэ хувилбарт багтсан. Тооцооллыг дараахь томъёоны дагуу гүйцэтгэнэ.

,

хаана: М - энгийн арифметик дундаж;

Σ В - үнийн сонголт;

n- ажиглалтын тоо.

Бүлэглэсэн вариацын цувралд жигнэсэн арифметик дундажийг тодорхойлно. Үүнийг тооцоолох томъёо:

,

хаана: М - арифметик жигнэсэн дундаж;

Σ vp - тэдгээрийн давтамж дээрх хувилбарын бүтээгдэхүүний нийлбэр;

n- ажиглалтын тоо.

Гараар тооцоолсон тохиолдолд олон тооны ажиглалт хийснээр моментийн аргыг ашиглаж болно.

Арифметик дундаж нь байна дараах шинж чанарууд:

хувилбарын дундажаас хазайлтын нийлбэр ( Σ г ) тэгтэй тэнцүү (Хүснэгт 15-ыг үз);

Бүх сонголтыг ижил хүчин зүйлээр (хуваагч) үржүүлэх (хуваах) үед арифметик дундажийг ижил хүчин зүйлээр (хуваагч) үржүүлнэ (хуваах);

Хэрэв та бүх хувилбарт ижил тоог нэмэх (хасах) тохиолдолд арифметик дундаж нь ижил тоогоор нэмэгддэг (багасдаг).

Тооцоолсон цувааны хувьсах чанарыг харгалзахгүйгээр өөрсдөө авсан арифметик дундаж нь вариацын цувааны шинж чанарыг бүрэн тусгадаггүй, ялангуяа бусад дундаж үзүүлэлттэй харьцуулах шаардлагатай үед. Ойролцоох дундаж утгыг янз бүрийн тархалтын зэрэгтэй цувралаас авч болно. Бие биедээ ойртох тусмаа хувийн сонголтууд нь тэдний тоон шинж чанар, бага тархалт (хэлбэлзэл, хэлбэлзэл)цуврал байх тусам түүний дундаж нь илүү нийтлэг байдаг.

Тухайн шинж чанарын хувьсах чадварыг үнэлэх үндсэн үзүүлэлтүүд нь:

· хамрах хүрээ;

Далайц;

· Стандарт хэлбэлзэл;

· Өөрчлөлтийн коэффициент.

Ойролцоогоор шинж чанарын хэлбэлзлийг вариацын цувралын далайц ба далайцаар шүүж болно. Энэ муж нь цувралын хамгийн их (V max) ба хамгийн бага (V мин) сонголтуудыг заана. Далайн далайц (A m) нь эдгээр сонголтуудын хоорондох ялгаа юм: A m = V max - V min .

Вариацын цувралын хэлбэлзлийн гол, нийтээр хүлээн зөвшөөрөгдсөн хэмжүүр нь тархалт (Д ). Гэхдээ хамгийн тохиромжтой параметрийг хэлбэлзэл дээр үндэслэн тооцдог стандарт хазайлт ( σ ). Энэ нь хазайлтын утгыг харгалзан үздэг ( г ) вариацын цувааны хувилбар бүрийн арифметик дундажаас ( d=V - М ).

Хувилбарын дунджаас хазайх нь эерэг ба сөрөг байж болох тул нэгтгэвэл "0" (S) утгыг өгнө. d=0). Үүнээс зайлсхийхийн тулд хазайлтын утгууд ( г) хоёр дахь зэрэглэлд шилжүүлж, дундажлана. Тиймээс вариацын цувралын дисперс нь хувилбарын арифметик дунджаас хазайсан дундаж квадрат бөгөөд дараах томъёогоор тооцоолно.

.

Энэ нь хувьсах чадварын хамгийн чухал шинж чанар бөгөөд олон тооны тооцоолоход хэрэглэгддэг статистикийн шалгуур.

Дисперсийг хазайлтын квадратаар илэрхийлдэг тул түүний утгыг арифметик дундажтай харьцуулахад ашиглах боломжгүй. Эдгээр зорилгоор үүнийг ашигладаг стандарт хэлбэлзэл, үүнийг "Сигма" тэмдгээр тэмдэглэсэн ( σ ). Энэ нь вариацын цувралын бүх хувилбаруудын арифметик дундажаас дундаж хазайлтыг ижил нэгжээр тодорхойлдог. дундаж утгаТиймээс тэдгээрийг хамтад нь ашиглаж болно.

Стандарт хазайлтыг дараах томъёогоор тодорхойлно.

Энэ томъёог ажиглалтын тоонд хэрэглэнэ ( n ) нь 30-аас их. Бага тоотой n стандарт хазайлтын утга нь математикийн хазайлттай холбоотой алдаатай байх болно ( n - нэг). Үүнтэй холбогдуулан илүү яг үр дүнСтандарт хазайлтыг тооцоолох томъёонд ийм хазайлтыг харгалзан үзэж болно.

стандарт хэлбэлзэл (с ) нь стандарт хазайлтын тооцоо юм санамсаргүй хувьсагч Xтүүний тухай математикийн хүлээлттүүний хэлбэлзлийн бодитой тооцоололд үндэслэсэн.

Үнэт зүйлсийн хувьд n > 30 стандарт хазайлт ( σ ) ба стандарт хазайлт ( с ) ижил байх болно ( σ=с ). Тиймээс ихэнх тохиолдолд практик тусламжЭдгээр шалгуурыг өөр өөр гэж үздэг. AT Excel програмстандарт хазайлтын тооцоог =STDEV(муж) функцээр хийж болно. Стандарт хазайлтыг тооцоолохын тулд та тохирох томьёог үүсгэх хэрэгтэй.

Үндсэн дундаж квадрат буюу стандарт хазайлт нь тухайн шинж чанарын утга нь дундаж утгаас хэр их ялгаатай болохыг тодорхойлох боломжийг олгодог. Өдөр тутмын дундаж температур ижил хоёр хот байна гэж бодъё зуны улирал. Эдгээр хотуудын нэг нь далайн эрэг дээр, нөгөө нь тивд байрладаг. Далайн эрэг дээр байрладаг хотуудад өдрийн температурын ялгаа нь дотоодод байрладаг хотуудаас бага байдаг нь мэдэгдэж байна. Тиймээс далайн эргийн хотын ойролцоох өдрийн температурын стандарт хазайлт нь хоёр дахь хотынхоос бага байх болно. Практикт энэ нь тивд байрладаг хотын тодорхой өдөр бүрийн агаарын температур далайн эрэг дээрх хотынхоос илүү их ялгаатай гэсэн үг юм. Нэмж дурдахад стандарт хазайлт нь температурын боломжит хазайлтыг дундаж үзүүлэлтээс шаардлагатай магадлалын түвшингээр тооцоолох боломжийг олгодог.

Магадлалын онолын дагуу ердийн тархалтын хуульд захирагддаг үзэгдлийн хувьд арифметик дундаж, стандарт хазайлт ба сонголтуудын хооронд хатуу хамаарал байдаг ( гурван сигма дүрэм). Жишээлбэл, хувьсагчийн шинж чанарын утгуудын 68.3% нь M ± 1 дотор байна σ , 95.5% - M ± 2 дотор σ ба 99.7% - M ± 3 дотор σ .

Стандарт хазайлтын утга нь вариацын цуваа болон судалж буй бүлгийн нэгэн төрлийн шинж чанарыг дүгнэх боломжийг олгодог. Хэрэв стандарт хазайлтын утга бага байвал энэ нь судалж буй үзэгдлийн хангалттай өндөр нэгэн төрлийн байгааг илтгэнэ. Энэ тохиолдолд арифметик дундаж нь энэ вариацын цувралын нэлээд онцлог шинж чанартай гэдгийг хүлээн зөвшөөрөх ёстой. Гэсэн хэдий ч хэт жижиг сигма нь ажиглалтын зохиомол сонголтын талаар бодоход хүргэдэг. Маш том сигматай бол арифметик дундаж нь вариацын цувааг бага хэмжээгээр тодорхойлдог бөгөөд энэ нь судлагдсан шинж чанар, үзэгдлийн мэдэгдэхүйц хэлбэлзэл эсвэл судалгааны бүлгийн нэг төрлийн бус байдлыг илэрхийлдэг. Гэсэн хэдий ч стандарт хазайлтын утгыг харьцуулах нь зөвхөн ижил хэмжээтэй шинж тэмдгүүдийн хувьд боломжтой юм. Үнэн хэрэгтээ, хэрэв бид нярай болон насанд хүрэгчдийн жингийн олон янз байдлыг харьцуулж үзвэл бид насанд хүрэгсдэд үргэлж өндөр сигма утгыг авах болно.

Янз бүрийн хэмжээсийн шинж чанаруудын хувьсах чадварыг харьцуулж, ашиглан хийж болно хэлбэлзлийн коэффициент. Энэ нь олон янз байдлыг дундаж утгын хувиар илэрхийлдэг бөгөөд энэ нь янз бүрийн шинж чанаруудыг харьцуулах боломжийг олгодог. Анагаах ухааны ном зохиол дахь өөрчлөлтийн коэффициентийг " тэмдгээр тэмдэглэсэн болно. FROM ", мөн математикт" v» гэсэн томъёогоор тооцоолно:

.

Өөрчлөлтийн коэффициентийн 10% -иас бага утга нь бага хэмжээний тархалтыг илтгэнэ, 10-аас 20% - дундаж, 20% -иас дээш - арифметик дундажийн эргэн тойронд хүчтэй тархалттай байна.

Арифметик дундажийг ихэвчлэн түүврийн өгөгдөл дээр үндэслэн тооцдог. Санамсаргүй үзэгдлийн нөлөөн дор давтан судалгаа хийснээр арифметик дундаж нь өөрчлөгдөж болно. Энэ нь дүрмээр бол ажиглалтын боломжит нэгжийн зөвхөн нэг хэсэг буюу түүвэр популяцийг судалж байгаатай холбоотой юм. Судалж буй үзэгдлийг илэрхийлэх бүх боломжит нэгжийн талаарх мэдээллийг бүхэлд нь судалснаар олж авч болно нийт хүн ам, энэ нь үргэлж боломжгүй байдаг. Үүний зэрэгцээ туршилтын өгөгдлийг нэгтгэхийн тулд нийт хүн амын дунджийн утгыг сонирхож байна. Тиймээс судалж буй үзэгдлийн талаар ерөнхий дүгнэлт гаргахын тулд түүврийн олонлогийн үндсэн дээр олж авсан үр дүнг статистикийн аргаар нийт хүн амд шилжүүлэх ёстой.

Түүврийн судалгаа болон нийт хүн амын хоорондын тохирлын түвшинг тодорхойлохын тулд түүврийн ажиглалтын явцад зайлшгүй гарах алдааны хэмжээг тооцоолох шаардлагатай. Ийм алдаа гэж нэрлэдэг төлөөллийн алдаа” эсвэл “Арифметик дундажийн дундаж алдаа”. Үнэн хэрэгтээ энэ нь сонгомол статистик ажиглалтын явцад олж авсан дундаж үзүүлэлт ба ижил объектыг тасралтгүй судлах явцад олж авах ижил төстэй утгуудын хоорондох зөрүү юм. нийт хүн амыг судлах үед. Түүврийн дундаж нь санамсаргүй хэмжигдэхүүн тул ийм таамаглалыг судлаачийн хувьд хүлээн зөвшөөрөгдөх магадлалын түвшинд хийдэг. Анагаах ухааны судалгаанд энэ нь хамгийн багадаа 95% байдаг.

Төлөөлөлийн алдааг бүртгэлийн алдаа эсвэл анхаарал хандуулах алдаа (буруу хэвлэх, буруу тооцоолол, буруу хэвлэх гэх мэт) гэж андуурч болохгүй, үүнийг туршилтанд ашигласан зохих арга зүй, хэрэгслээр багасгах хэрэгтэй.

Төлөөлөгчийн алдааны хэмжээ нь түүврийн хэмжээ болон шинж чанарын хувьсах чадвараас хамаарна. Ажиглалтын тоо их байх тусам түүвэр нь нийт хүн амд ойртдог алдаа бага. Онцлог нь илүү их хувьсах тусам статистикийн алдаа их байх болно.

Практикт вариацын цувааны төлөөллийн алдааг тодорхойлохын тулд дараах томъёог ашигладаг.

,

хаана: м - төлөөллийн алдаа;

σ - стандарт хэлбэлзэл;

nнь түүвэр дэх ажиглалтын тоо юм.

Хэмжээтэй болохыг томьёоноос харж болно дундаж алдаастандарт хазайлттай шууд пропорциональ, өөрөөр хэлбэл судалж буй шинж чанарын хувьсах чадвартай, ажиглалтын тооны квадрат язгууртай урвуу пропорциональ байна.

Тооцоолол дээр үндэслэн статистик дүн шинжилгээ хийх үед харьцангуй үнэ цэнэвариацын цуврал барих нь сонголттой. Энэ тохиолдолд харьцангуй үзүүлэлтүүдийн дундаж алдааг тодорхойлохдоо хялбаршуулсан томъёог ашиглан хийж болно.

,

хаана: Р- хувь, ppm гэх мэтээр илэрхийлсэн харьцангуй үзүүлэлтийн утга;

q- үзүүлэлтийг тооцоолох үндэслэлээс хамааран P-ийн харилцан хамаарал ба (1-P), (100-P), (1000-P) гэх мэтээр илэрхийлэгдэнэ;

nнь түүвэр дэх ажиглалтын тоо юм.

Гэсэн хэдий ч харьцангуй утгын төлөөллийн алдааг тооцоолох томъёог зөвхөн индикаторын утга нь суурь хэмжээнээс бага байх үед л хэрэглэж болно. Эрчимтэй үзүүлэлтүүдийг тооцоолох хэд хэдэн тохиолдолд энэ нөхцөл хангагдаагүй бөгөөд үзүүлэлтийг 100% эсвэл 1000%o-ээс их тоогоор илэрхийлж болно. Ийм нөхцөлд вариацын цуваа байгуулж, төлөөллийн алдааг стандарт хазайлт дээр үндэслэн дундаж утгын томъёог ашиглан тооцоолно.

Нийт хүн амын дунд арифметик дундаж утгыг урьдчилан таамаглахдаа хамгийн бага ба хамгийн их гэсэн хоёр утгыг зааж өгдөг. Нийт хүн амын хүссэн дундаж утга хэлбэлзэж болох боломжит хазайлтын эдгээр хэт утгыг "" гэж нэрлэдэг. Итгэлийн хил хязгаар».

Магадлалын онолын постулатууд нь 99.7% магадлалтай тэмдгийн хэвийн тархалтаар дундаж утгын хазайлтын туйлын утга нь төлөөллийн гурвалсан алдааны утгаас хэтрэхгүй болохыг нотолсон. М ± 3 м ); 95.5% -д - дундаж утгын хоёр дахин нэмэгдсэн дундаж алдааны утгаас ихгүй байна ( М ±2 м ); 68.3% -д нэг дундаж алдааны утгаас ихгүй байна ( М ± 1 м ) (Зураг 9).

P%

Цагаан будаа. 9. Магадлалын нягт хэвийн тархалт.

Дээрх мэдэгдэл нь зөвхөн Гауссын ердийн тархалтын хуульд захирагдах шинж чанарын хувьд үнэн болохыг анхаарна уу.

Олонхи туршилтын судалгаа, тэр дундаа анагаах ухааны салбарт хэмжилттэй холбоотой бөгөөд үр дүн нь өгөгдсөн интервалд бараг ямар ч утгыг авч чаддаг тул дүрмээр бол тэдгээрийг тасралтгүй санамсаргүй хэмжигдэхүүний загвараар дүрсэлсэн байдаг. Үүнтэй холбогдуулан ихэнх статистик аргууд нь тасралтгүй тархалтыг авч үздэг. Эдгээр хуваарилалтын нэг нь үндсэн үүрэг гүйцэтгэдэг математик статистик, байна хэвийн буюу Гауссын тархалт.

Энэ нь хэд хэдэн шалтгаантай холбоотой юм.

1. Юуны өмнө олон туршилтын ажиглалтуудыг хэвийн тархалтыг ашиглан амжилттай дүрсэлж болно. Ердийн тархалттай санамсаргүй хэмжигдэхүүн нь практикт хэзээ ч тохиолддоггүй -ээс - хүртэлх мужид байдаг тул яг хэвийн байх эмпирик өгөгдлийн тархалт байхгүй гэдгийг нэн даруй тэмдэглэх нь зүйтэй. Гэсэн хэдий ч хэвийн тархалт нь ихэвчлэн сайн ойролцоо байдаг.

Хүний биеийн жин, өндөр болон бусад физиологийн үзүүлэлтүүдийг хэмжиж байгаа эсэхээс үл хамааран үр дүнд нь маш их нөлөөлдөг. том тоо санамсаргүй хүчин зүйлүүд (байгалийн шалтгаануудхэмжилтийн алдаа). Түүнээс гадна, дүрмээр бол эдгээр хүчин зүйлүүд тус бүрийн нөлөө нь ач холбогдолгүй юм. Туршлагаас харахад ийм тохиолдлын үр дүн нь ойролцоогоор хэвийн хувиарлагдах болно.

2. Санамсаргүй түүвэртэй холбоотой олон тархалт, сүүлчийнх нь хэмжээ ихсэх нь хэвийн болдог.

3. Хэвийн тархалт нь бусадтай ойролцоо тайлбар хийхэд тохиромжтой тасралтгүй хуваарилалт(жишээлбэл, тэгш бус).

4. Хэвийн тархалт нь хэд хэдэн таатай талуудтай математик шинж чанарууд, энэ нь үүнийг ихээхэн хангасан өргөн хэрэглээстатистикт.

Үүний зэрэгцээ, эмнэлгийн өгөгдөлд ердийн тархалтын загвараар тайлбарлах боломжгүй олон туршилтын тархалт байдаг гэдгийг тэмдэглэх нь зүйтэй. Үүнийг хийхийн тулд статистик нь "Параметрийн бус" гэж нэрлэгддэг аргуудыг боловсруулсан.

Сонголт статистикийн арга, тодорхой туршилтын өгөгдлийг боловсруулахад тохиромжтой, олж авсан өгөгдөл нь хэвийн тархалтын хуульд хамаарах эсэхээс хамаарч хийгдэх ёстой. Тэмдгийг ердийн тархалтын хуульд захируулах таамаглалыг давтамжийн тархалтын гистограмм (график), түүнчлэн статистикийн хэд хэдэн шалгуурыг ашиглан хийдэг. Тэдний дунд:

Тэгш хэмийн шалгуур ( б );

Куртозыг шалгах шалгуурууд ( g );

Шапиро-Уилксын шалгуур ( В ) .

Өгөгдлийн тархалтын шинж чанарын шинжилгээг (үүнийг тархалтын хэвийн байдлын тест гэж нэрлэдэг) параметр тус бүрээр хийдэг. Параметрийн тархалт хэвийн хуультай нийцэж байгаа эсэхийг итгэлтэйгээр дүгнэхийн тулд хангалттай олон тооны ажиглалтын нэгж (дор хаяж 30 утга) шаардлагатай.

Хэвийн тархалтын хувьд хазайлт ба муруйлт шалгуур нь 0 утгыг авна. Хэрэв тархалтыг баруун тийш шилжүүлсэн бол б > 0 (эерэг тэгш бус), хамт б < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона g =0. At g > 0 бол тархалтын муруй илүү хурц байна g < 0 пик более сглаженный, чем функция нормального распределения.

Шапиро-Вилкс тестийг ашиглан хэвийн эсэхийг шалгахын тулд шаардлагатай ач холбогдлын түвшинд, ажиглалтын нэгжийн тооноос (чөлөөний зэрэг) хамааран статистикийн хүснэгтүүдийг ашиглан энэ шалгуурын утгыг олох шаардлагатай. Хавсралт 1. Дүрмээр бол энэ шалгуурын бага утгын хувьд хэвийн байдлын таамаглалыг үгүйсгэдэг. w <0,8.

(вариацын цувааны тодорхойлолт; вариацын цувааны бүрэлдэхүүн хэсгүүд; вариацын цувааны гурван хэлбэр; байгуулах оновчтой байдал интервал цуврал; бүтээсэн цувралаас гаргаж болох дүгнэлтүүд)

Вариацын цуврал гэдэг нь түүврийн бүх элементүүдийн буурахгүй дарааллаар байрлуулсан дараалал юм. Үүнтэй ижил элементүүд давтагдана

Вариаци - эдгээр нь тоон үзүүлэлтээр бүтээгдсэн цувралууд юм.

Вариацын тархалтын цуврал нь хувилбар ба давтамж гэсэн хоёр элементээс бүрдэнэ.

Хувилбарууд нь тархалтын вариацын цуврал дахь тоон шинж чанарын тоон утгууд юм. Тэд эерэг эсвэл сөрөг, үнэмлэхүй эсвэл харьцангуй байж болно. Тиймээс аж ахуйн нэгжүүдийг эдийн засгийн үйл ажиллагааны үр дүнгийн дагуу бүлэглэхдээ эерэг сонголтууд байдаг - энэ бол ашиг, сөрөг тоо - энэ нь алдагдал юм.

Давтамж нь бие даасан хувилбаруудын тоо эсвэл вариацын цувралын бүлэг тус бүрийн тоо юм. Эдгээр нь түгээлтийн цувралд тодорхой сонголтууд хэр олон удаа байдгийг харуулсан тоонууд юм. Бүх давтамжийн нийлбэрийг хүн амын эзлэхүүн гэж нэрлэдэг бөгөөд нийт хүн амын элементийн тоогоор тодорхойлогддог.

Давтамж гэдэг нь харьцангуй утгууд (нэгжийн бутархай эсвэл хувь) хэлбэрээр илэрхийлэгдсэн давтамж юм. Давтамжийн нийлбэр нь нэг буюу 100% -тай тэнцүү байна. Давтамжийг давтамжаар солих нь янз бүрийн тооны ажиглалттай вариацын цувааг харьцуулах боломжийг олгодог.

Вариацын цувралын гурван хэлбэр байдаг:эрэмбэлсэн цуваа, салангид цуврал, интервал цуврал.

Эрэмбэлэгдсэн цуврал гэдэг нь судалж буй шинж чанарын өсөх эсвэл буурах дарааллаар популяцийн бие даасан нэгжүүдийн тархалтыг хэлнэ. Эрэмбэлэх нь тоон өгөгдлийг бүлэгт хуваахад хялбар болгодог, шинж чанарын хамгийн бага, хамгийн том утгыг нэн даруй илрүүлж, ихэвчлэн давтагддаг утгуудыг тодруулдаг.

Вариацын цувралын бусад хэлбэрүүд нь судалж буй шинж чанарын утгын өөрчлөлтийн шинж чанарын дагуу эмхэтгэсэн бүлгийн хүснэгтүүд юм. Өөрчлөлтийн шинж чанараар салангид (тасралтгүй) ба тасралтгүй шинж тэмдгүүдийг ялгадаг.

Дискрет цуваа нь тасалдалтай өөрчлөлт бүхий тэмдгүүд (дискрет тэмдэг) дээр суурилдаг ийм вариацын цуваа юм. Сүүлийнх нь холбоотой байж болно тарифын ангилал, гэр бүлийн хүүхдийн тоо, аж ахуйн нэгжийн ажилчдын тоо гэх мэт. Эдгээр тэмдгүүд нь зөвхөн хязгаарлагдмал тооны тодорхой утгыг авч болно.

Дискрет вариацын цуврал нь хоёр баганаас бүрдэх хүснэгт юм. Эхний баганад атрибутын тодорхой утгыг, хоёр дахь нь атрибутын тодорхой утгатай популяцийн нэгжийн тоог заана.

Хэрэв тэмдэг нь тасралтгүй өөрчлөгдөж байвал (орлогын хэмжээ, ажлын туршлага, аж ахуйн нэгжийн үндсэн хөрөнгийн өртөг гэх мэт тодорхой хязгаарт ямар ч үнэ цэнийг авч болно) байвал энэ тэмдгийн хувьд интервалын өөрчлөлтийн цувралыг бий болгох шаардлагатай.



Энд байгаа бүлгийн хүснэгт нь мөн хоёр баганатай. Эхнийх нь "-ээс" (сонголтууд) интервал дахь шинж чанарын утгыг, хоёр дахь нь интервалд (давтамж) багтсан нэгжийн тоог заана.

Давтамж (давталтын давтамж) - шинж чанарын утгын тодорхой хувилбарын давталтын тоо, fi гэж тэмдэглэгдсэн ба судлагдсан популяцийн эзлэхүүнтэй тэнцүү давтамжийн нийлбэрийг тэмдэглэнэ.

Энд k нь шинж чанарын утгын сонголтуудын тоо юм

Ихэнх тохиолдолд хүснэгтийг хуримтлагдсан S давтамжийг тооцсон баганаар нэмж оруулдаг бөгөөд энэ нь популяцийн хэдэн нэгж энэ утгаас ихгүй шинж чанартай болохыг харуулдаг.

Дискрет вариацын тархалтын цуваа нь зөвхөн бүхэл тоон утгыг авдаг, салангид байдлаар өөрчлөгддөг шинж чанарын дагуу бүлгүүдийг бүрдүүлдэг цуврал юм.

Тархалтын интервалын хэлбэлзлийн цуврал нь бүлэглэлийн үндэс болсон бүлэглэлийн шинж чанар нь тодорхой интервалд, түүний дотор бутархай утгыг авч болох цуврал юм.

Интервалын вариацын цуваа нь санамсаргүй хэмжигдэхүүний утгуудын хувьсах интервалуудын дараалсан багц бөгөөд тэдгээр нь тус бүрт хамаарах хэмжигдэхүүний утгуудын харгалзах давтамж эсвэл давтамж юм.

Интервалын тархалтын цувралыг юуны өмнө шинж чанарын тасралтгүй өөрчлөлттэй, мөн түүнчлэн салангид хэлбэлзэл нь өргөн хүрээний хүрээнд илэрдэг бол, өөрөөр хэлбэл. салангид функцийн сонголтуудын тоо нэлээд их байна.

Энэ цувралаас хэд хэдэн дүгнэлтийг аль хэдийн гаргаж болно. Жишээлбэл, вариацын цувралын дундаж элемент (медиан) нь хэмжилтийн хамгийн их магадлалтай үр дүнгийн тооцоолол байж болно. Вариацын цувралын эхний ба сүүлчийн элемент (өөрөөр хэлбэл түүврийн хамгийн бага ба хамгийн их элемент) нь дээжийн элементүүдийн тархалтыг харуулдаг. Заримдаа, хэрэв эхний эсвэл сүүлчийн элемент нь дээжийн бусад хэсгээс эрс ялгаатай бол эдгээр утгыг зарим төрлийн бүдүүлэг гэмтэл, жишээлбэл, технологийн үр дүнд олж авсан гэж үзэн хэмжилтийн үр дүнгээс хасдаг.

Вариацын цуврал: тодорхойлолт, төрөл, үндсэн шинж чанарууд. Тооцоолох арга
анагаах ухаан, статистикийн судалгаанд загвар, медиан, арифметик дундаж
(Нөхцөлт жишээн дээр үзүүл).

Вариацын цуврал гэдэг нь судалж буй шинж чанарын тоон утгуудын цуврал бөгөөд тэдгээр нь хэмжээнээсээ ялгаатай бөгөөд тодорхой дарааллаар (өсөх эсвэл буурах дарааллаар) байрладаг. Цувралын тоон утга бүрийг хувилбар (V) гэж нэрлэдэг бөгөөд энэ цувралын найрлагад энэ эсвэл өөр хувилбар хэр олон удаа тохиолддогийг харуулсан тоонуудыг давтамж (p) гэж нэрлэдэг.

Вариацын цувралаас бүрдэх ажиглалтын нийт тохиолдлын тоог n үсгээр тэмдэглэнэ. Судлагдсан шинж чанаруудын утгын зөрүүг хэлбэлзэл гэж нэрлэдэг. Хэрэв хувьсах тэмдэг нь тоон хэмжигдэхүүнгүй бол өөрчлөлтийг чанарын, тархалтын цувралыг атрибутив гэж нэрлэдэг (жишээлбэл, өвчний үр дагавар, эрүүл мэндийн байдал гэх мэт).

Хэрэв хувьсах тэмдэг нь тоон илэрхийлэлтэй бол ийм өөрчлөлтийг тоон, тархалтын цувааг хэлбэлзэл гэж нэрлэдэг.

Вариацын цувааг тоон шинж чанарын шинж чанараар нь тасархай, тасралтгүй, энгийн ба жигнэсэн - хувилбар үүсэх давтамжаар хуваана.

Энгийн вариацын цувралд хувилбар бүр зөвхөн нэг удаа (p=1), жигнэсэнд нэг хувилбар хэд хэдэн удаа тохиолддог (p>1). Ийм цувралын жишээг дараа нь текстэнд авч үзэх болно. Хэрэв тоон шинж чанар нь тасралтгүй байвал, i.e. бүхэл тоонуудын хооронд завсрын бутархай утгууд байдаг бөгөөд вариацын цувааг тасралтгүй гэж нэрлэдэг.

Жишээ нь: 10.0 - 11.9

14.0 - 15.9 гэх мэт.

Хэрэв тоон тэмдэг нь тасалдсан бол, i.e. түүний бие даасан утгууд (сонголтууд) нь бие биенээсээ бүхэл тоогоор ялгаатай бөгөөд завсрын бутархай утгатай байдаггүй тул вариацын цувааг тасархай эсвэл салангид гэж нэрлэдэг.

Зүрхний цохилтын талаархи өмнөх жишээн дэх өгөгдлийг ашиглан

21 оюутны хувьд бид вариацын цувралыг бүтээх болно (Хүснэгт 1).

Хүснэгт 1

Анагаахын оюутнуудын импульсийн хурдаар хуваарилалт (bpm)

Тиймээс вариацын цувралыг бий болгох гэдэг нь одоо байгаа тоон утгыг (сонголтуудыг) системчлэх, оновчтой болгох гэсэн үг юм. харгалзах давтамжтай нь тодорхой дарааллаар (өсөх эсвэл буурах дарааллаар) байрлуулна. Харж буй жишээн дээр сонголтуудыг өсөх дарааллаар байрлуулсан бөгөөд тасалдалгүй (дискрет) бүхэл тоогоор илэрхийлэгддэг, сонголт бүр хэд хэдэн удаа тохиолддог, өөрөөр хэлбэл. Бид жигнэсэн, тасалдсан эсвэл салангид вариацын цувралтай харьцаж байна.

Дүрмээр бол, хэрэв бидний судалж буй статистикийн популяцийн ажиглалтын тоо 30-аас хэтрэхгүй бол судалж буй шинж чанарын бүх утгыг Хүснэгтийн дагуу өсөх дарааллаар вариацын цувралд байрлуулахад хангалттай. 1, эсвэл буурах дарааллаар.

At олон тоогооражиглалт (n>30), тохиолдох хувилбаруудын тоо маш их байж болох бөгөөд энэ тохиолдолд интервал эсвэл бүлэглэсэн вариацын цувралыг эмхэтгэж, дараагийн боловсруулалтыг хялбарчлах, тархалтын мөн чанарыг тодруулахын тулд хувилбаруудыг бүлэг болгон нэгтгэдэг. .

Ихэвчлэн бүлгийн сонголтуудын тоо 8-15 хооронд хэлбэлздэг.

Тэдгээрийн дор хаяж 5 нь байх ёстой, учир нь. эс бөгөөс энэ нь хэт бүдүүлэг, хэт томорч, өөрчлөлтийн ерөнхий дүр зургийг гажуудуулж, дундаж утгын нарийвчлалд ихээхэн нөлөөлнө. Бүлгийн сонголтуудын тоо 20-25-аас дээш байвал дундаж утгыг тооцоолох нарийвчлал нэмэгдэх боловч шинж чанарын өөрчлөлтийн шинж чанарууд ихээхэн гажуудаж, математик боловсруулалт илүү төвөгтэй болдог.

Бүлэглэсэн цувралыг эмхэтгэхдээ үүнийг анхаарч үзэх хэрэгтэй

− хувилбарын бүлгүүдийг тодорхой дарааллаар (өсөх эсвэл буурах) байрлуулах ёстой;

- хувилбаруудын бүлгүүдийн интервалууд ижил байх ёстой;

− интервалын хилийн утгууд давхцах ёсгүй, учир нь аль бүлгүүдэд хувь хүний ​​сонголтыг хамааруулах нь тодорхойгүй байх болно;

- интервалын хязгаарыг тогтоохдоо цуглуулсан материалын чанарын шинж чанарыг харгалзан үзэх шаардлагатай (жишээлбэл, насанд хүрэгчдийн жинг судлахдаа 3-4 кг-ийн интервалыг, эхний саруудад хүүхдэд зориулсан) Амьдралын хувьд энэ нь 100 граммаас хэтрэхгүй байх ёстой.)

64, 66, 60, 62, 64, 66, 60, 62, 55 анагаахын оюутнуудын импульсийн давтамж (минутанд цохилтын тоо) -ийн өгөгдлийг тодорхойлдог бүлэглэсэн (интервал) цувралыг байгуулъя.

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Бүлэглэсэн цуврал бүтээхийн тулд танд дараахь зүйлс хэрэгтэй болно.

1. Интервалын утгыг тодорхойлох;

2. Вариацын цувааны хувилбарын бүлгүүдийн дунд, эхлэл, төгсгөлийг тодорхойлно.

● (i) интервалын утгыг хүлээгдэж буй бүлгүүдийн (r) тоогоор тодорхойлдог бөгөөд тэдгээрийн тоог тусгай хүснэгтийн дагуу ажиглалтын тооноос (n) хамааруулан тогтоодог.

Ажиглалтын тооноос хамааран бүлгийн тоо:

Манай улсын хувьд 55 оюутны хувьд 8-10 бүлэгт хамрагдах боломжтой.

(i) интервалын утгыг дараах томъёогоор тодорхойлно -

i = Vmax-Vmin/r

Бидний жишээнд интервалын утга 82-58/8= 3 байна.

Хэрэв интервалын утга бол бутархай тоо, үр дүнг бүхэл тоо хүртэл дугуйлах ёстой.

Дундаж хэд хэдэн төрөл байдаг:

● арифметик дундаж,

геометрийн дундаж,

● гармоник дундаж,

язгуур дундаж квадрат,

● дунд зэргийн дэвшилттэй,

● дундаж

AT эмнэлгийн статистикХамгийн түгээмэл хэрэглэгддэг нь арифметик дундаж юм.

Арифметик дундаж (M) нь нийт хүн амд хамаарах ердийн утгыг тодорхойлдог ерөнхий утга юм. M-ийг тооцоолох үндсэн аргууд нь: арифметик дундаж арга ба моментийн арга (нөхцөлт хазайлт).

Арифметик дундаж аргыг энгийн арифметик дундаж болон жигнэсэн арифметик дундажийг тооцоолоход ашигладаг. Арифметик дундаж утгыг тооцоолох аргыг сонгох нь вариацын цувралын төрлөөс хамаарна. Хувилбар бүр нь зөвхөн нэг удаа тохиолддог энгийн вариацын цувралын хувьд энгийн арифметик дундажийг дараах томъёогоор тодорхойлно.

Үүнд: М – арифметик дундаж утга;

V нь хувьсагчийн шинж чанарын утга (сонголт);

Σ - үйлдлийг илэрхийлнэ - нийлбэр;

n- нийт тооажиглалт.

Арифметик дундажийг тооцоолох жишээ нь энгийн. 35 настай 9 эрэгтэй хүний ​​амьсгалын тоо (минутанд амьсгалах тоо): 20, 22, 19, 15, 16, 21, 17, 23, 18.

35 настай эрэгтэйчүүдийн амьсгалын замын дундаж түвшинг тодорхойлохын тулд дараахь зүйлийг хийх шаардлагатай.

1. Бүх сонголтуудыг өсөх эсвэл буурах дарааллаар байрлуулж вариацын цуваа байгуул.Бид энгийн вариацын цуваа олж авсан, учир нь хувилбарын утга нь зөвхөн нэг удаа тохиолддог.

M = ∑V/n = 171/9 = минутанд 19 амьсгал

Дүгнэлт. 35 настай эрэгтэйчүүдийн амьсгалын тоо минутанд дунджаар 19 удаа амьсгалдаг.

Хэрэв хувилбарын бие даасан утгууд давтагдсан бол хувилбар бүрийг мөрөнд бичих шаардлагагүй, гарч буй хувилбарын хэмжээг (V) жагсааж, тэдгээрийн давталтын тоог зааж өгөхөд хангалттай (V) p). хувилбаруудыг өөрт тохирох давтамжийн тоогоор нь жигнэх ийм вариацын цувааг жигнэсэн вариацын цуваа гэж нэрлэх ба тооцоолсон дундаж утгыг арифметик жигнэсэн дундаж утга гэнэ.

Арифметик жигнэсэн дундажийг дараах томъёогоор тодорхойлно: M= ∑Vp/n

энд n нь ажиглалтын тоо, нийлбэртэй тэнцүү байнадавтамж - Σr.

Арифметик жигнэсэн дундажийг тооцоолох жишээ.

Энэ оны 1-р улиралд амьсгалын замын цочмог өвчтэй 35 өвчтөний тахир дутуугийн хугацаа (өдөрөөр) 6, 7, 5, 3, 9, 8, 7, 5, 6 байна. , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 хоног.

Амьсгалын замын цочмог халдвартай өвчтөний хөгжлийн бэрхшээлийн дундаж хугацааг тодорхойлох арга нь дараах байдалтай байна.

1. Жигнэсэн вариацын цуваа байгуулъя, учир нь хувь хүний ​​хувилбарын утгууд хэд хэдэн удаа давтагдана. Үүнийг хийхийн тулд та бүх сонголтуудыг харгалзах давтамжтай нь өсөх эсвэл буурах дарааллаар байрлуулж болно.

Манай тохиолдолд сонголтууд нь өсөх дарааллаар байна.

2. М = ∑Vp/n = 233/35 = 6.7 хоног гэсэн томъёогоор арифметик жигнэсэн дундажийг тооцоол.

Амьсгалын замын цочмог халдвартай өвчтөнүүдийг хөгжлийн бэрхшээлтэй хугацаагаар нь хуваах:

Хөдөлмөрийн чадваргүй байх хугацаа (V) Өвчтөний тоо (p) vp
∑p = n = 35 ∑Vp = 233

Дүгнэлт. Амьсгалын замын цочмог өвчтэй өвчтөнүүдийн хөгжлийн бэрхшээлтэй байх хугацаа дунджаар 6.7 хоног байна.

Mode (Mo) нь вариацын цувралын хамгийн түгээмэл хувилбар юм. Хүснэгтэнд үзүүлсэн хуваарилалтын хувьд горим нь 10-тай тэнцэх хувилбартай тохирч байгаа бөгөөд энэ нь бусдаас илүү олон удаа тохиолддог - 6 удаа.

Эмнэлэгт хэвтсэн хугацаагаар өвчтөнүүдийн хуваарилалт (өдөрөөр)

В
х

Судалж буй өгөгдөлд "ихэнхдээ" тохиолддог хэд хэдэн ажиглалт байж болох тул заримдаа горимын яг утгыг тодорхойлоход хэцүү байдаг.

Медиан (Me) нь параметрийн бус үзүүлэлт бөгөөд вариацын цувааг хоёр тэнцүү хагас болгон хуваадаг: ижил тооны сонголтууд нь медиануудын хоёр талд байрладаг.

Жишээлбэл, хүснэгтэд үзүүлсэн тархалтын хувьд медиан нь 10 байна, учир нь Энэ утгын хоёр талд 14-р сонголт дээр байрладаг, i.e. 10 тоо нь энэ цувралын гол байр суурийг эзэлдэг бөгөөд түүний голч юм.

Энэ жишээн дээрх ажиглалтын тоо тэгш (n=34) байгаа тул медианыг дараах байдлаар тодорхойлж болно.

Би = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Энэ нь цувралын дунд хэсэг нь арван долоо дахь хувилбар дээр унасан гэсэн үг бөгөөд энэ нь 10-ын медиантай тохирч байна. Хүснэгтэнд үзүүлсэн тархалтын хувьд арифметик дундаж нь:

M = ∑Vp/n = 334/34 = 10.1

Тиймээс, Хүснэгтээс авсан 34 ажиглалтын хувьд. 8, бид авсан: Mo=10, Me=10, арифметик дундаж (M) нь 10.1. Бидний жишээн дээр гурван үзүүлэлт нь огт өөр боловч хоорондоо тэнцүү эсвэл ойролцоо байсан.

Арифметик дундаж нь бүх нөлөөллийн үр дүнгийн нийлбэр юм; бүх сонголтууд нь түүний үүсэхэд оролцдог, тэр дундаа өгөгдсөн үзэгдэл эсвэл олонлогийн хувьд ихэвчлэн хэвийн бус байдаг эрс тэс хувилбарууд байдаг.

Горим ба медиан нь арифметик дунджаас ялгаатай нь хувьсагчийн шинж чанарын бүх хувийн утгуудын утгаас (хэт хувилбаруудын утга ба цувралын тархалтын зэрэг) хамаардаггүй. Арифметик дундаж нь ажиглалтын нийт массыг, горим ба медиан нь дийлэнх хэсгийг тодорхойлдог.

Энэ бүлгийг эзэмшсэний үр дүнд оюутан дараахь зүйлийг хийх ёстой. мэдэх

  • өөрчлөлтийн үзүүлэлтүүд ба тэдгээрийн хамаарал;
  • шинж чанаруудын тархалтын үндсэн хуулиуд;
  • зөвшөөрлийн шалгуурын мөн чанар; боломжтой байх
  • хэлбэлзлийн хувь хэмжээ, тохирох байдлыг тооцоолох;
  • тархалтын шинж чанарыг тодорхойлох;
  • үндсэн тоон шинж чанарыг үнэлэх статистикийн цувралхуваарилалт;

эзэмшдэг

  • тархалтын цувааны статистик шинжилгээний арга;
  • суурь дисперсийн шинжилгээ;
  • Статистикийн тархалтын цувааг тархалтын үндсэн хуулиудад нийцэж байгаа эсэхийг шалгах арга.

Өөрчлөлтийн үзүүлэлтүүд

Төрөл бүрийн статистикийн популяцийн шинж чанарыг статистикийн судалгаагаар хүн амын бие даасан статистикийн нэгжийн онцлог шинж чанар, түүнчлэн энэ шинж чанарын дагуу нэгжийн тархалтын шинж чанарыг судлах нь ихээхэн сонирхол татаж байна. Хувилбар -Эдгээр нь судлагдсан популяцийн нэгжүүдийн хоорондын шинж чанарын бие даасан утгын ялгаа юм. Өөрчлөлтийг судлах нь өргөн цар хүрээтэй практик үнэ цэнэ. Өөрчлөлтийн зэргээр тухайн шинж чанарын өөрчлөлтийн хил хязгаар, энэ шинж чанарын популяцийн нэгэн төрлийн байдал, дундаж үзүүлэлтийн ердийн байдал, өөрчлөлтийг тодорхойлдог хүчин зүйлсийн хамаарлыг шүүж болно. Вариацын үзүүлэлтүүдийг статистикийн популяцийг тодорхойлох, цэгцлэх зорилгоор ашигладаг.

Статистикийн тархалтын цуврал хэлбэрээр боловсруулсан статистикийн ажиглалтын материалын хураангуй, бүлэглэлтийн үр дүн нь судлагдсан популяцийн нэгжийг бүлэглэх (хувьсах) шинж чанарын дагуу бүлэгт эрэмбэлсэн хуваарилалтыг илэрхийлдэг. Хэрэв чанарын шинж чанарыг бүлэглэх үндэс болгон авсан бол ийм тархалтын цуваа гэж нэрлэдэг атрибут(мэргэжил, хүйс, өнгө гэх мэтээр хуваарилалт). Хэрэв тархалтын цуваа тоон үзүүлэлтээр хийгдсэн бол ийм цувралыг дуудна хувьсах(өндөр, жин, хэмжээгээр хуваарилах цалингэх мэт). Вариацын цуваа байгуулах гэдэг нь популяцийн нэгжийн тоон хуваарилалтыг шинж чанарын утгын дагуу эрэмбэлэх, эдгээр утгууд (давтамж) бүхий популяцийн нэгжийн тоог тоолох, үр дүнг хүснэгтэд оруулах гэсэн үг юм.

Хувилбарын давтамжийн оронд түүний ажиглалтын нийт эзлэхүүнтэй харьцуулсан харьцааг ашиглах боломжтой бөгөөд үүнийг давтамж (харьцангуй давтамж) гэж нэрлэдэг.

Дискрет ба интервал гэсэн хоёр төрлийн вариацын цуваа байдаг. Дискрет цуврал- Энэ бол ийм вариацын цуврал бөгөөд түүний бүтээн байгуулалт нь тасалдалтай өөрчлөлт бүхий тэмдгүүд (дискрет тэмдгүүд) дээр суурилдаг. Сүүлийнх нь аж ахуйн нэгжийн ажилчдын тоо, цалингийн ангилал, гэр бүлийн хүүхдийн тоо гэх мэт орно. Дискрет вариацын цуврал нь хоёр баганаас бүрдэх хүснэгт юм. Эхний баганад атрибутын тодорхой утгыг, хоёр дахь нь атрибутын тодорхой утгатай популяцийн нэгжийн тоог заана. Хэрэв тэмдэг нь тасралтгүй өөрчлөгдөж байвал (орлогын хэмжээ, ажлын туршлага, аж ахуйн нэгжийн үндсэн хөрөнгийн өртөг гэх мэт тодорхой хязгаарт ямар ч үнэ цэнийг авч болно) байвал энэ тэмдгийг барьж болно. интервалын өөрчлөлтийн цуврал.Интервалын вариацын цувралыг байгуулах хүснэгт нь мөн хоёр баганатай байна. Эхнийх нь "-ээс" (сонголтууд) интервал дахь шинж чанарын утгыг, хоёр дахь нь интервалд (давтамж) багтсан нэгжийн тоог заана. Давтамж (давталтын давтамж) - шинж чанарын утгуудын тодорхой хувилбарын давталтын тоо. Интервалууд нь хаалттай, нээлттэй байж болно. Хаалттай интервал нь хоёр талдаа хязгаарлагдмал, i.e. доод ("-ээс") болон дээд ("хүртэл") аль аль нь хилтэй байна. Нээлттэй интервалууд нь дээд эсвэл доод аль нэг хилтэй байдаг. Хэрэв сонголтуудыг өсөх эсвэл буурах дарааллаар байрлуулсан бол мөрүүдийг дуудна эрэмбэлсэн.

Вариацын цувааны хувьд давтамжийн хариу урвалын хоёр төрлийн сонголт байдаг: хуримтлагдсан давтамж ба хуримтлагдсан давтамж. Хуримтлагдсан давтамж нь тухайн шинж чанарын утга нь заасан утгаас бага утгатай хэдэн ажиглалт хийснийг харуулдаг. Хуримтлагдсан давтамжийг өмнөх бүлгүүдийн бүх давтамжтай өгөгдсөн бүлгийн шинж чанарын давтамжийн утгыг нэгтгэн тодорхойлно. Хуримтлагдсан давтамжийг тодорхойлдог тодорхой татах хүчшинж чанарын утга нь тухайн бүлгийн дээд хязгаараас хэтрэхгүй ажиглалтын нэгжүүд. Тиймээс хуримтлагдсан давтамж нь нийлбэр дэх хувилбарын хувийн жинг харуулдаг бөгөөд энэ нь үүнээс ихгүй утгатай байна. Давтамж, давтамж, үнэмлэхүй ба харьцангуй нягтрал, хуримтлагдсан давтамж ба давтамж нь хувилбарын цар хүрээний шинж чанар юм.

Популяцийн статистик нэгжийн тэмдгийн өөрчлөлт, тархалтын шинж чанарыг цувралын дундаж түвшин, дундаж шугаман хазайлт, стандарт хазайлт, тархалт зэргийг багтаасан вариацын цувралын үзүүлэлт, шинж чанарыг ашиглан судалдаг. , хэлбэлзлийн коэффициент, хэлбэлзэл, тэгш бус байдал, куртоз гэх мэт.

Түгээлтийн төвийг тодорхойлохын тулд дундаж утгыг ашигладаг. Дундаж нь ерөнхий статистик үзүүлэлт бөгөөд үүнд судлагдсан популяцийн гишүүдийн шинж чанарын ердийн түвшинг тоогоор илэрхийлдэг. Гэсэн хэдий ч арифметик дундаж нь тархалтын өөр шинж чанартай давхцах тохиолдол байж болно. статистик шинж чанаруудбүтцийн дундаж гэж нэрлэгддэг вариацын цувааг тооцдог - горим, медиан, түүнчлэн хуваарилалтын цувааг тэнцүү хэсгүүдэд хуваадаг квантилууд (квартил, дециль, хувь гэх мэт).

Загвар -Энэ нь тархалтын цувралд бусад утгуудаас илүү олон удаа тохиолддог шинж чанарын утга юм. Дискрет цувралын хувьд энэ нь хамгийн өндөр давтамжтай хувилбар юм. Интервалын вариацын цувралд горимыг тодорхойлохын тулд юуны өмнө модаль интервал гэж нэрлэгддэг интервалыг тодорхойлох шаардлагатай. Тэнцүү интервалтай вариацын цувралд модаль интервалыг хамгийн өндөр давтамжаар, тэгш бус интервалтай цувралд тодорхойлно. хамгийн өндөр нягтралхуваарилалт. Дараа нь ижил интервалтай эгнээний горимыг тодорхойлохын тулд томъёог хэрэглэнэ

хаана Мо бол загварын үнэ цэнэ; x Mo - модаль интервалын доод хязгаар; h-модаль интервалын өргөн; / Mo - модаль интервалын давтамж; / Mo j - модаль өмнөх интервалын давтамж; / Mo+1 нь постмодалийн интервалын давтамж бөгөөд энэ тооцооны томъёонд тэгш бус интервалтай цувралын хувьд / Mo, / Mo, / Mo давтамжийн оронд тархалтын нягтыг ашиглах нь зүйтэй. Оюун ухаан 0 _| , Оюун ухаан 0> UMO+"

Хэрэв нэг горим байгаа бол санамсаргүй хэмжигдэхүүний магадлалын тархалтыг unimodal гэж нэрлэдэг; хэрэв нэгээс олон горим байгаа бол үүнийг multimodal (полимодаль, multimodal), хоёр горимын хувьд - bimodal гэж нэрлэдэг. Дүрмээр бол multimodality нь судалж буй тархалт нь ердийн тархалтын хуулийг дагаж мөрддөггүйг харуулж байна. Нэг төрлийн популяци нь дүрмээр бол нэг төрлийн тархалтаар тодорхойлогддог. Multivertex нь мөн судлагдсан популяцийн нэг төрлийн бус байдлыг илтгэнэ. Хоёр ба түүнээс дээш оройн харагдах байдал нь илүү нэгэн төрлийн бүлгүүдийг тусгаарлахын тулд өгөгдлийг дахин бүлэглэх шаардлагатай болдог.

Интервалын вариацын цувралд горимыг гистограмм ашиглан графикаар тодорхойлж болно. Үүнийг хийхийн тулд гистограмын хамгийн өндөр баганын дээд цэгээс зэргэлдээ хоёр баганын дээд цэг хүртэл огтлолцсон хоёр шугамыг зурна. Дараа нь тэдгээрийн огтлолцлын цэгээс абсцисса тэнхлэгт перпендикуляр доошлоно. Перпендикуляртай харгалзах абсцисса дээрх онцлогийн утга нь горим юм. Ихэнх тохиолдолд популяцийг ерөнхий үзүүлэлт болгон тодорхойлохдоо арифметик дундажаас илүү горимыг илүүд үздэг.

Медиан -Энэ нь шинж чанарын гол утга бөгөөд үүнийг эрэмбэлсэн түгээлтийн цувралын төв гишүүн эзэмшдэг. AT салангид мөрүүдмедианы утгыг олохын тулд эхлээд түүний серийн дугаарыг тодорхойлно. Үүнийг хийхийн тулд сондгой тооны нэгжээр бүх давтамжийн нийлбэр дээр нэгийг нэмж, тоог хоёр хуваана. Хэрэв цувралд тэгш тоо байгаа бол хоёр медиан байх тул энэ тохиолдолд медианыг хоёр медиан нэгжийн утгын дундажаар тодорхойлно. Иймээс салангид вариацын цувралын медиан нь цувралыг ижил тооны хувилбаруудыг агуулсан хоёр хэсэгт хуваах утга юм.

Интервалын цувралд медианы дарааллын дугаарыг тодорхойлсны дараа медиан интервалыг хуримтлагдсан давтамж (давтамж) -аар олж, дараа нь медианыг тооцоолох томъёог ашиглан медианы утгыг өөрөө тодорхойлно.

Энд Би бол медиан утга; x Би -дундаж интервалын доод хязгаар; h-дундаж интервалын өргөн; - тархалтын цувралын давтамжийн нийлбэр; /D - өмнөх дундаж интервалын хуримтлагдсан давтамж; / Me - дундаж интервалын давтамж.

Дундаж утгыг хуримтлалыг ашиглан графикаар олж болно. Үүнийг хийхийн тулд хуримтлагдсан давтамжийн (давтамж) хуваарь дээр харгалзах цэгээс хуримтлагдана. серийн дугаармедиан, х тэнхлэгтэй параллель шулуун шугамыг хуримтлалтай огтлолцох хүртэл зурна. Цаашилбал, заасан шулуун шугамын хуримтлалтай огтлолцох цэгээс абсцисса тэнхлэгт перпендикуляр доошлоно. Зурсан ордонд (перпендикуляр) харгалзах x тэнхлэг дээрх шинж чанарын утга нь медиан байна.

Медиан нь дараах шинж чанаруудаар тодорхойлогддог.

  • 1. Энэ нь түүний хоёр талд байрлах шинж чанарын утгуудаас хамаарахгүй.
  • 2. Энэ нь хамгийн бага шинж чанартай бөгөөд энэ нь атрибутын утгуудын дундаж утгаас үнэмлэхүй хазайлтын нийлбэр нь атрибутын утгуудын бусад утгаас хазайсантай харьцуулахад хамгийн бага утгатай байна гэсэн үг юм.
  • 3. Мэдэгдэж буй медиантай хоёр тархалтыг нэгтгэх үед шинэ тархалтын дундаж утгыг урьдчилан таамаглах боломжгүй юм.

Эдгээр дундаж шинж чанаруудыг эд зүйлсийн байршлыг төлөвлөхөд өргөн ашигладаг. дараалалсургууль, эмнэлэг, шатахуун түгээх станцууд, босоо хоолой гэх мэт. Жишээлбэл, хотын тодорхой хэсэгт поликлиник барихаар төлөвлөж байгаа бол тухайн улирлын уртыг биш, харин оршин суугчдын тоог хоёр хуваасан цэгт байрлуулах нь илүү тохиромжтой.

Мод, медиан ба арифметик дундажийн харьцаа нь нийлбэр дэх шинж чанарын тархалтын шинж чанарыг харуулж, тархалтын тэгш хэмийг үнэлэх боломжийг танд олгоно. Хэрвээ x Me дараа нь цувралын баруун талын тэгш бус байдал байна. Ердийн тархалттай X -Би - Мо.

К.Пирсон дээр суурилсан тэгшитгэл янз бүрийн төрөлДунд зэргийн хазайлттай тархалтын хувьд арифметик дундаж, медиан ба горимын хоорондох дараах ойролцоо хамаарал хүчинтэй болохыг муруй тодорхойлсон.

Энд Би бол медиан утга; Мо - загварын үнэ цэнэ; x арифметик - арифметик дундажийн утга.

Хэрэв вариацын цувралын бүтцийг илүү нарийвчлан судлах шаардлагатай бол голчтой төстэй шинж чанарын утгыг тооцоолно. Ийм шинж чанарын утгууд нь бүх түгээлтийн нэгжийг тэнцүү тоонд хуваадаг бөгөөд тэдгээрийг квантил эсвэл градиент гэж нэрлэдэг. Квантиль нь квартил, дециль, хувь гэх мэтээр хуваагдана.

Квартилууд хүн амыг дөрвөн тэнцүү хэсэгт хуваадаг. Эхний улирлын интервалыг өмнө нь тодорхойлсон эхний дөрөвний нэгийг тооцоолох томъёог ашиглан медиантай адил тооцоолно.

энд Qi нь эхний квартилийн утга; xQ^-эхний квартилийн интервалын доод хязгаар; h- эхний улирлын интервалын өргөн; /, - интервалын цувралын давтамж;

Эхний квартилийн интервалаас өмнөх интервал дахь хуримтлагдсан давтамж; Jq ( - эхний квартиль интервалын давтамж.

Эхний квартиль нь хүн амын нэгжийн 25% нь түүний үнэ цэнээс бага, 75% нь илүү байгааг харуулж байна. Хоёр дахь квартиль нь медиантай тэнцүү, i.e. Q2 =Би.

Үүнтэй адилаар, гурав дахь улирлын интервалыг өмнө нь олсон гурав дахь квартилыг тооцоолно.

гурав дахь квартилийн интервалын доод хязгаар хаана байна; h- гурав дахь квартилийн интервалын өргөн; /, - интервалын цувралын давтамж; /X"-өмнөх интервал дахь хуримтлагдсан давтамж

Г

гурав дахь квартилийн интервал; Jq - гурав дахь квартилийн интервалын давтамж.

Гурав дахь квартиль нь хүн амын нэгжийн 75% нь түүний үнэ цэнээс бага, 25% нь илүү байгааг харуулж байна.

Гурав дахь болон эхний дөрөвний хоорондох ялгаа нь квартил хоорондын интервал юм.

энд Aq нь квартиль хоорондын интервалын утга; Q 3 -гурав дахь улирлын үнэ цэнэ; Q, - эхний квартилийн утга.

Дециль нь хүн амыг 10 тэнцүү хэсэгт хуваадаг. Аравтын тоо нь хүн амын аравны нэгтэй тэнцэх тархалтын цувралын шинж чанарын утга юм. Квартилуудтай зүйрлэвэл эхний аравтын тоо нь хүн амын нэгжийн 10% нь түүний үнэ цэнээс бага, 90% нь илүү, ес дэх арав дахь нь хүн амын нэгжийн 90% нь түүний үнэ цэнээс бага, 10% нь илүү. Ес дэх ба эхний аравтын харьцаа, i.e. хамгийн чинээлэг хүмүүсийн 10%, хамгийн бага чинээлэг хүн амын 10% -ийн орлогын түвшний харьцааг хэмжих орлогын ялгааг судлахад өргөн хэрэглэгддэг децилийн коэффициент. Хувь хэмжээ нь эрэмблэгдсэн хүн амыг 100 тэнцүү хэсэгт хуваадаг. Процентилийн тооцоо, утга, хэрэглээ нь децильтэй төстэй.

Квартил, дециль болон бусад бүтцийн шинж чанархуримтлалыг ашиглан медиантай зүйрлэн графикаар тодорхойлж болно.

Өөрчлөлтийн хэмжээг хэмжихийн тулд дараах үзүүлэлтүүдийг ашигладаг: хэлбэлзлийн муж, дундаж шугаман хазайлт, стандарт хазайлт, дисперс. Хувьсах хүрээний хэмжээ нь цувралын туйлын гишүүдийн тархалтын санамсаргүй байдлаас бүрэн хамаарна. Энэ үзүүлэлт нь шинж чанарын утгын хэлбэлзлийн далайц гэж юу болохыг мэдэх нь чухал тохиолдолд сонирхолтой байдаг.

хаана R-хэлбэлзлийн хүрээний утга; x max - шинж чанарын хамгийн их утга; х тт -шинж чанарын хамгийн бага утга.

Хувилбарын мужийг тооцоолохдоо цувралын гишүүдийн дийлэнх олонхийн утгыг харгалздаггүй, харин хэлбэлзэл нь цувралын гишүүн бүрийн утгатай холбоотой байдаг. Энэ дутагдал нь шинж чанарын бие даасан утгуудын дундаж утгаасаа хазайлтаас авсан дундаж үзүүлэлтүүд биш юм: дундаж шугаман хазайлт ба стандарт хазайлт. Дунджаас хувь хүний ​​хазайлт ба тодорхой шинж чанарын хэлбэлзлийн хооронд шууд хамаарал байдаг. Тогтворгүй байдал хэдий чинээ хүчтэй байх тусам дунджаас хазайх үнэмлэхүй хэмжээ их байна.

Дундаж шугаман хазайлт нь хувь хүний ​​сонголтуудын дундаж утгаас хазайсан үнэмлэхүй утгын арифметик дундаж юм.

Бүлэглэгдээгүй өгөгдлийн дундаж шугаман хазайлт

хаана / pr - дундаж утга шугаман хазайлт; x, - - шинж чанарын утга; X - P -хүн амын нэгжийн тоо.

Бүлэглэсэн цувралын дундаж шугаман хазайлт

хаана / vz - дундаж шугаман хазайлтын утга; x, - шинж чанарын утга; X -судлагдсан популяцийн шинж чанарын дундаж утга; / - тусдаа бүлэгт хамаарах хүн амын тоо.

Хазайсны шинж тэмдэг Энэ тохиолдолдүл тоомсорлодог, эс тэгвээс бүх хазайлтын нийлбэр тэгтэй тэнцүү байх болно. Шинжилсэн өгөгдлийн бүлэглэлээс хамааран дундаж шугаман хазайлтыг тооцоолно янз бүрийн томъёо: бүлэглэсэн болон бүлэггүй өгөгдөлд зориулагдсан. Дундаж шугаман хазайлтыг нөхцөлт байдлаас шалтгаалан бусад өөрчлөлтийн үзүүлэлтүүдээс тусад нь практикт харьцангуй ховор ашигладаг (ялангуяа нийлүүлэлтийн жигд байдлын үүднээс гэрээний үүргийн биелэлтийг тодорхойлох; эргэлтийн дүн шинжилгээ хийх). Гадаад худалдааны, ажилчдын бүрэлдэхүүн, үйлдвэрлэлийн хэмнэл, бүтээгдэхүүний чанарыг харгалзан үзэх технологийн онцлогүйлдвэрлэл гэх мэт).

Стандарт хазайлт нь судлагдсан шинж чанарын бие даасан утгууд нь популяцийн дундаж утгаас дунджаар хэр зэрэг хазайж байгааг тодорхойлдог бөгөөд судлагдсан шинж чанарын нэгжээр илэрхийлэгддэг. Стандарт хазайлт нь хувьсах гол хэмжүүрүүдийн нэг бөгөөд нэгэн төрлийн популяцийн шинж чанарын өөрчлөлтийн хил хязгаарыг үнэлэх, хэвийн тархалтын муруйн ординатуудын утгыг тодорхойлоход өргөн хэрэглэгддэг. түүврийн ажиглалтыг зохион байгуулах, түүврийн шинж чанарын үнэн зөвийг тогтоохтой холбоотой тооцоо. Бүлэглэгдээгүй өгөгдлийн стандарт хазайлтыг дараах алгоритмын дагуу тооцоолно: дунджаас гарсан хазайлт бүрийг квадрат болгож, бүх квадратыг нэгтгэж, дараа нь квадратуудын нийлбэрийг цуврал дахь гишүүний тоонд хувааж, квадрат язгуурыг авна. коэффициент:

энд a Iip - стандарт хазайлтын утга; Xj-онцлог шинж чанар; X- судлагдсан популяцийн шинж чанарын дундаж утга; P -хүн амын нэгжийн тоо.

Нэгтгэсэн дүн шинжилгээ хийсэн өгөгдлийн хувьд өгөгдлийн стандарт хазайлтыг жинлэсэн томъёогоор тооцоолно

хаана - стандарт хазайлтын утга; Xj-онцлог шинж чанар; X -судлагдсан популяцийн шинж чанарын дундаж утга; fx-тодорхой бүлэгт хамаарах хүн амын тоо.

Аль ч тохиолдолд язгуурын доорх илэрхийлэлийг дисперс гэнэ. Тиймээс дисперсийг шинж чанарын утгуудын дундаж утгаас хазайсан дундаж квадратаар тооцдог. Жингээгүй (энгийн) шинж чанарын утгуудын хувьд хэлбэлзлийг дараах байдлаар тодорхойлно.

Жинлэсэн шинж чанарын утгын хувьд

Мөн дисперсийг тооцоолох тусгай хялбаршуулсан арга байдаг: ерөнхийд нь

жингүй (энгийн) шинж чанарын утгуудын хувьд жигнэсэн шинж чанарын утгын хувьд
нөхцөлт тэгээс тоолох аргыг ашиглан

энд a 2 - тархалтын утга; x, - - шинж чанарын утга; X -шинж чанарын дундаж утга, h-бүлгийн интервалын утга, t 1 -жин (A =

Тархалт нь статистикт бие даасан илэрхийлэл бөгөөд нэг юм гол үзүүлэлтүүдөөрчлөлтүүд. Үүнийг судалж буй шинж чанарын хэмжлийн нэгжийн квадраттай харгалзах нэгжээр хэмждэг.

Тархалт нь дараах шинж чанартай байдаг.

  • 1. Тогтмол утгын дисперс нь тэг байна.
  • 2. Онцлогийн бүх утгыг A-ийн ижил утгаар багасгах нь дисперсийн утгыг өөрчлөхгүй. Энэ нь хазайлтын дундаж квадратыг шинж чанарын өгөгдсөн утгуудаас бус, харин тэдгээрийн зарим тогтмол тооноос хазайлтаар тооцоолж болно гэсэн үг юм.
  • 3. Онцлогийн бүх утгыг багасгах кдахин тархалтыг бууруулдаг к 2 удаа, стандарт хазайлт - in кудаа, өөрөөр хэлбэл. Бүх функцийн утгыг зарим тогтмол тоогоор (цувралын интервалын утгаар гэх мэт) хувааж, стандарт хазайлтыг тооцоолж, дараа нь тогтмол тоогоор үржүүлж болно.
  • 4. Хэрэв бид ямар нэгэн утгаас хазайлтын дундаж квадратыг тооцвол Мөн цагтнь арифметик дунджаас тодорхой хэмжээгээр ялгаатай бол энэ нь арифметик дунджаас тооцсон хазайлтын дундаж квадратаас үргэлж их байх болно. Энэ тохиолдолд хазайлтын дундаж квадрат нь сайн тодорхойлсон утгаас илүү их байх болно - дундаж ба энэ нөхцөлт авсан утгын зөрүүний квадратаар.

Альтернатив шинж чанарын өөрчлөлт нь хүн амын нэгжид судлагдсан эд хөрөнгө байгаа эсвэл байхгүй байх явдал юм. Альтернатив шинж чанарын өөрчлөлтийг тоон хувьд хоёр утгаар илэрхийлнэ: нэгжид судлагдсан шинж чанар байгаа эсэхийг нэг (1), байхгүйг тэг (0) гэж тэмдэглэнэ. Судалгаанд хамрагдаж буй эд хөрөнгөтэй нэгжийн эзлэх хувийг P-ээр, энэ өмчгүй нэгжийн эзлэх хувийг гэж тэмдэглэнэ. Г.Тиймээс альтернатив шинж чанарын дисперс нь өгөгдсөн шинж чанартай (P) нэгжийн харьцааг энэ шинж чанаргүй нэгжийн эзлэх хувьтай тэнцүү байна. (G).Хүн амын хамгийн их хэлбэлзэл нь хүн амын нийт эзлэхүүний 50% -ийг бүрдүүлдэг хүн амын нэг хэсэг нь онцлог шинж чанартай, харин 50% -тай тэнцэх хүн амын бусад хэсэг нь шинж чанаргүй тохиолдолд тохиолддог. хэлбэлзэл нь хүрч байхад энэ онцлог хамгийн их утга 0.25-тай тэнцүү, өөрөөр хэлбэл. P = 0.5, G= 1 - P \u003d 1 - 0.5 \u003d 0.5 ба o 2 \u003d 0.5 0.5 \u003d 0.25. Энэ үзүүлэлтийн доод хязгаар нь тэгтэй тэнцүү бөгөөд энэ нь нийлбэрт өөрчлөлт ороогүй нөхцөл байдалд тохирч байна. Практик хэрэглээАльтернатив шинж чанарын ялгаа нь бүтээхэд оршино итгэлцлийн интервалууддээж авах үед.

Хэрхэн бага үнэ цэнэтархалт ба стандарт хазайлттай байх тусам популяци нь нэг төрлийн байх тусам дундаж нь илүү нийтлэг байх болно. Статистикийн практикт янз бүрийн шинж чанаруудын өөрчлөлтийг харьцуулах шаардлагатай болдог. Жишээлбэл, ажилчдын нас, тэдний мэргэшил, ажилласан хугацаа ба цалин хөлс, зардал ба ашиг, ажилласан хугацаа, хөдөлмөрийн бүтээмж гэх мэт өөрчлөлтүүдийг харьцуулах нь сонирхолтой юм. Ийм харьцуулалт хийхэд шинж чанарын үнэмлэхүй хэлбэлзлийн үзүүлэлтүүд тохиромжгүй байдаг: жилээр илэрхийлсэн ажлын туршлагын хэлбэлзлийг рубльээр илэрхийлсэн цалингийн өөрчлөлттэй харьцуулах боломжгүй юм. Ийм харьцуулалт хийх, түүнчлэн янз бүрийн арифметик аргаар хэд хэдэн популяцид ижил шинж чанарын хэлбэлзлийг харьцуулахын тулд хэлбэлзлийн үзүүлэлтүүдийг ашигладаг - хэлбэлзлийн коэффициент, шугаман коэффициентдундаж утгын эргэн тойронд хэт их утгын хэлбэлзлийн хэмжүүрийг харуулсан хэлбэлзэл ба вариацын коэффициент.

Хэлбэлзлийн хүчин зүйл:

хаана V R -хэлбэлзлийн коэффициентийн утга; Р- өөрчлөлтийн хүрээний утга; X -

Шугаман хэлбэлзлийн коэффициент".

хаана vj-шугаман хэлбэлзлийн коэффициентийн утга; би-дундаж шугаман хазайлтын утга; X -судалж буй популяцийн шинж чанарын дундаж утга.

Өөрчлөлтийн коэффициент:

хаана Ва-хэлбэлзлийн коэффициентийн утга; a - стандарт хазайлтын утга; X -судалж буй популяцийн шинж чанарын дундаж утга.

Хэлбэлзлийн коэффициент нь вариацын хүрээг судалж буй шинж чанарын дундаж утгад эзлэх хувь, шугаман хэлбэлзлийн коэффициент нь дундаж шугаман хазайлтыг судалж буй шинж чанарын дундаж утгад харьцуулсан харьцааг хувиар илэрхийлнэ. Вариацын коэффициент нь стандарт хазайлтаас судалж буй шинж чанарын дундаж утгад эзлэх хувь юм. Хувиар илэрхийлсэн харьцангуй утгын хувьд хэлбэлзлийн коэффициентийг янз бүрийн шинж чанаруудын хэлбэлзлийн түвшинг харьцуулахад ашигладаг. Вариацын коэффициентийг ашиглан статистикийн популяцийн нэгэн төрлийн байдлыг тооцоолно. Хэрэв вариацын коэффициент 33% -иас бага бол судлагдсан популяци нь нэгэн төрлийн, хэлбэлзэл нь сул байна. Хэрэв вариацын коэффициент 33% -иас их байвал судалж буй популяци нь нэг төрлийн бус, хэлбэлзэл нь хүчтэй, дундаж утга нь хэвийн бус бөгөөд энэ популяцийн ерөнхий үзүүлэлт болгон ашиглах боломжгүй юм. Түүнчлэн янз бүрийн популяци дахь нэг шинж чанарын хэлбэлзлийг харьцуулахын тулд вариацын коэффициентийг ашигладаг. Жишээлбэл, хоёр аж ахуйн нэгжийн ажилчдын үйлчилгээний урт хугацааны өөрчлөлтийг үнэлэх. Коэффициентийн утга их байх тусам шинж чанарын өөрчлөлт нь илүү чухал болно.

Тооцоолсон квартил дээр үндэслэн тооцоолох боломжтой харьцангуй үзүүлэлттомъёоны дагуу улирлын өөрчлөлт

хаана Q 2 болон

Квартиль хоорондын мужийг томъёогоор тодорхойлно

Хэт их утгыг ашиглахтай холбоотой сул талуудаас зайлсхийхийн тулд дөрвөлжин хазайлтыг хэлбэлзлийн хүрээний оронд ашигладаг.

Тэгш бус интервалын вариацын цувааны хувьд тархалтын нягтыг мөн тооцдог. Энэ нь интервалын утгад хуваагдсан харгалзах давтамж эсвэл давтамжийн коэффициент гэж тодорхойлогддог. Тэгш бус интервалын цувралд үнэмлэхүй ба харьцангуй тархалтын нягтыг ашигладаг. Түгээлтийн үнэмлэхүй нягт нь интервалын нэгж урт дахь давтамж юм. Харьцангуй тархалтын нягт - интервалын нэгж урт дахь давтамж.

Дээрх бүх зүйл нь тархалтын хууль нь хэвийн тархалтын хуулиар сайн тодорхойлогдсон эсвэл түүнтэй ойролцоо тархалтын цувралын хувьд үнэн юм.

Статистикийн тархалтын цуврал- энэ нь хүн амын нэгжийг тодорхой өөр өөр шинж чанарын дагуу бүлэгт хуваарилах явдал юм.
Түгээлтийн цуваа үүсэх үндсэн шинж чанараас хамааран дараахь зүйлүүд байдаг шинж чанар ба өөрчлөлтийн тархалтын цуврал.

Нийтлэг шинж чанар байгаа нь тодорхойлолт, хэмжилтийн үр дүн болох статистикийн популяци үүсэх үндэс суурь болдог. нийтлэг шинж чанаруудсудалгааны объектууд.

Статистикийн судалгааны сэдэв нь өөрчлөгдөж буй (хувьсах) шинж чанарууд эсвэл статистик шинж чанарууд юм.

Статистикийн шинж чанаруудын төрлүүд.

Тархалтын цувралыг шинж чанарын цуврал гэж нэрлэдэг.чанартай үндэслэлээр барьсан. Атрибутив- энэ нь нэртэй тэмдэг юм (жишээлбэл, мэргэжил: оёдолчин, багш гэх мэт).
Түгээлтийн цувралыг хүснэгт хэлбэрээр зохион байгуулах нь заншилтай байдаг. Хүснэгтэнд. 2.8 нь шинж чанарын тархалтын цувралыг харуулж байна.
Хүснэгт 2.8 - ОХУ-ын аль нэг бүс нутгийн иргэдэд хуульчдаас үзүүлж буй хууль зүйн туслалцааны төрлүүдийн хуваарилалт.

Вариацын цувралшинж чанаруудын утга (эсвэл утгын хүрээ) ба тэдгээрийн давтамж юм.
Вариацын цувралууд нь түгээлтийн цувралууд юмтоон үзүүлэлтээр бүтээгдсэн. Аливаа вариацын цуваа нь хувилбар ба давтамж гэсэн хоёр элементээс бүрдэнэ.
Хувилбарууд нь вариацын цувралд авдаг шинж чанарын бие даасан утгууд юм.
Давтамж нь бие даасан хувилбаруудын тоо эсвэл вариацын цувралын бүлэг тус бүрийн тоо юм. Эдгээр нь түгээлтийн цувралд тодорхой сонголтууд хэр олон удаа байдгийг харуулсан тоонууд юм. Бүх давтамжийн нийлбэр нь нийт хүн амын хэмжээ, түүний эзлэхүүнийг тодорхойлдог.
Давтамжийг нэгжийн бутархай эсвэл нийт дүнгийн хувиар илэрхийлсэн давтамж гэж нэрлэдэг. Үүний дагуу давтамжийн нийлбэр нь 1 эсвэл 100% -тай тэнцүү байна. Вариацын цуваа нь бодит өгөгдөл дээр үндэслэн хуваарилалтын хуулийн хэлбэрийг үнэлэх боломжийг олгодог.

Зан чанарын өөрчлөлтийн шинж чанараас хамааран байдаг дискрет ба интервалын хэлбэлзлийн цуваа.
Дискрет вариацын цувралын жишээг Хүснэгтэнд үзүүлэв. 2.9.
Хүснэгт 2.9 - ОХУ-д 1989 онд тусдаа орон сууцанд амьдардаг өрөөнүүдийн тоогоор гэр бүлийн хуваарилалт.

Хүснэгтийн эхний баганад салангид вариацын цувралын хувилбаруудыг, хоёр дахь баганад вариацын цувралын давтамжийг, гурав дахь баганад давтамжийн үзүүлэлтүүдийг тусгана.

Вариацын цуврал

Нийт хүн амын дунд тодорхой тоон шинж чанарыг судалж байна. Үүнээс эзэлхүүний дээжийг санамсаргүй байдлаар гаргаж авдаг n, өөрөөр хэлбэл түүвэр дэх элементийн тоо байна n. Статистик боловсруулалтын эхний шатанд хүрээтэйдээж, жишээ нь. дугаарын захиалга x 1 , x 2 , …, x nӨгсөж байна. Ажиглагдсан утга бүр x iдуудсан сонголт. Давтамж м биүнэ цэнийн ажиглалтын тоо юм x iдээжинд. Харьцангуй давтамж (давтамж) w iдавтамжийн харьцаа юм м бидээжийн хэмжээгээр n: .
Вариацын цувааг судлахдаа хуримтлагдсан давтамж ба хуримтлагдсан давтамж гэсэн ойлголтыг бас ашигладаг. Болъё xзарим тоо. Дараа нь сонголтуудын тоо , тэдний үнэ цэнэ бага байна x, хуримтлагдсан давтамж гэж нэрлэдэг: хувьд x i nхуримтлагдсан давтамж гэж нэрлэдэг w i max .
Хэрэв хувийн утгууд (хувилбарууд) нь бие биенээсээ хязгаарлагдмал хэмжээгээр (ихэвчлэн бүхэл тоо) ялгаатай байвал шинж чанарыг салангид хувьсагч гэж нэрлэдэг. Ийм шинж чанарын вариацын цувааг салангид вариацын цуваа гэж нэрлэдэг.

Хүснэгт 1. Давтамжийн дискрет вариацын цувааны ерөнхий дүр зураг

Онцлог утгуудx i x 1 x2 x n
Давтамжуудм би м 1 м2 м н

Хэрэв шинж чанарууд нь бие биенээсээ дур мэдэн бага хэмжээгээр ялгаатай байвал шинж чанарыг тасралтгүй өөрчлөгддөг гэж нэрлэдэг. тэмдэг нь тодорхой интервалд ямар ч утгыг авч болно. Ийм шинж чанарын тасралтгүй вариацын цувааг интервалын цуваа гэж нэрлэдэг.

Хүснэгт 2. Давтамжийн интервалын вариацын цувааны ерөнхий дүр зураг

Хүснэгт 3. Вариацын цувралын график зургууд

МөрПолигон буюу гистограмЭмпирик тархалтын функц
Дискрет
Интервал
Ажиглалтын үр дүнг харахад тодорхой интервал бүрт хэдэн хувилбарын утга унасныг тодорхойлдог. Интервал бүр нь түүний төгсгөлийн аль нэгэнд хамаарна гэж үздэг: бүх тохиолдолд зүүн (илүү олон удаа), эсвэл бүх тохиолдолд баруун тал, давтамж эсвэл давтамж нь заасан хил хязгаарт багтсан сонголтуудын тоог харуулдаг. Ялгаа a i – a i +1хэсэгчилсэн интервал гэж нэрлэдэг. Дараагийн тооцооллыг хялбарчлахын тулд интервалын өөрчлөлтийн цувааг нөхцөлт дискретээр сольж болно. Энэ тохиолдолд дундаж утга би-th интервалыг сонголт болгон авсан x i, ба харгалзах интервалын давтамж м би- энэ интервалын давтамжийн хувьд.
Вариацын цувааны график дүрслэлд полигон, гистограмм, хуримтлагдсан муруй, эмпирик тархалтын функцийг ихэвчлэн ашигладаг.

Хүснэгтэнд. 2.3 (1994 оны 4-р сарын нэг хүнд ногдох дундаж орлогын хэмжээгээр Оросын хүн амыг бүлэглэх) танилцуулав. интервалын өөрчлөлтийн цуврал.
График дүрслэлийг ашиглан түгээлтийн цувралд дүн шинжилгээ хийх нь тохиромжтой бөгөөд энэ нь тархалтын хэлбэрийг шүүх боломжтой болгодог. Вариацын цувааны давтамжийн өөрчлөлтийн мөн чанарыг харуулсан дүрслэлийг дараах байдлаар үзүүлэв олон өнцөгт ба гистограмм.
Дискрет вариацын цувааг харуулах үед олон өнцөгтийг ашигладаг.
Жишээлбэл, орон сууцны төрлөөр орон сууцны нөөцийн хуваарилалтыг графикаар харуулъя (Хүснэгт 2.10).
Хүснэгт 2.10 - Хот суурин газрын орон сууцны нөөцийг орон сууцны төрлөөр нь хуваарилах (нөхцөлт тоо).


Цагаан будаа. Орон сууцны хуваарилалтын полигон


Y тэнхлэг дээр зөвхөн давтамжийн утгуудыг төдийгүй вариацын цувралын давтамжийг зурж болно.
Гистограммыг интервалын өөрчлөлтийн цувралыг харуулахын тулд авдаг. Гистограммыг бүтээхдээ интервалын утгыг абсцисса тэнхлэг дээр зурж, давтамжийг харгалзах интервал дээр барьсан тэгш өнцөгтүүдээр дүрсэлдэг. Тэнцүү интервалтай тохиолдолд баганын өндөр нь давтамжтай пропорциональ байх ёстой. Гистограмм нь цувралыг хоорондоо зэргэлдээх баар хэлбэрээр харуулсан график юм.
Хүснэгтэнд өгөгдсөн интервалын тархалтын цувааг графикаар дүрсэлцгээе. 2.11.
Хүснэгт 2.11 - Нэг хүнд ногдох орон сууцны талбайн хэмжээгээр гэр бүлийн хуваарилалт (нөхцөлт тоо).
N p / p Нэг хүнд ногдох амьдрах талбайн хэмжээгээр гэр бүлүүдийг бүлэг Өгөгдсөн орон сууцны талбайтай гэр бүлийн тоо Хуримтлагдсан гэр бүлийн тоо
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
НИЙТ 115 ----


Цагаан будаа. 2.2. Нэг хүнд ногдох амьдрах талбайн хэмжээгээр гэр бүлийн хуваарилалтын гистограмм


Хуримтлагдсан цувралын өгөгдлийг ашиглан (Хүснэгт 2.11) бид бүтээдэг хуваарилалтын хуримтлагдсан.


Цагаан будаа. 2.3. Нэг хүнд ногдох амьдрах талбайн хэмжээгээр гэр бүлийн хуримтлагдсан хуваарилалт


Вариацын цувааг хуримтлал хэлбэрээр дүрслэх нь ялангуяа давтамжийг цувралын давтамжийн нийлбэрийн бутархай эсвэл хувиар илэрхийлдэг вариацын цувааны хувьд үр дүнтэй байдаг.
Хэрэв бид вариацын цувралын график дүрслэл дэх тэнхлэгүүдийг хуримтлал хэлбэрээр өөрчилвөл бид олж авна. огивуу. Зураг дээр. 2.4-т Хүснэгтийн өгөгдлийн үндсэн дээр бүтээгдсэн огивыг харуулав. 2.11.
Тэгш өнцөгтүүдийн талуудын дунд цэгүүдийг олж, дараа нь эдгээр цэгүүдийг шулуун шугамаар холбосноор гистограммыг тархалтын олон өнцөгт болгон хувиргаж болно. Үүссэн тархалтын полигоныг зурагт үзүүлэв. 2.2 тасархай шугам.
Ординатын тэнхлэгийн дагуу тэгш бус интервал бүхий вариацын цувааны тархалтын гистограммыг бүтээхдээ давтамжийг биш харин тухайн шинж чанарын хуваарилалтын нягтыг харгалзах интервалд ашигладаг.
Түгээлтийн нягтрал нь нэгж интервалын өргөнөөр тооцсон давтамж, i.e. нэгж интервалын утгад бүлэг тус бүрт хэдэн нэгж байна. Тархалтын нягтыг тооцоолох жишээг Хүснэгтэнд үзүүлэв. 2.12.
Хүснэгт 2.12 - Аж ахуйн нэгжүүдийн ажилчдын тоогоор хуваарилалт (тоо бол нөхцөлтэй)
N p / p Аж ахуйн нэгжүүдийн бүлгүүдийг ажиллагсдын тоогоор, хүн амын . Аж ахуйн нэгжийн тоо Интервалын хэмжээ, хувь. Түгээлтийн нягт
ГЭХДЭЭ 1 2 3=1/2
1 20 хүртэл 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
НИЙТ 147 ---- ----

Вариацын цувралын график дүрслэлийг мөн ашиглаж болно хуримтлагдсан муруй. Хуримтлалын тусламжтайгаар (нийлбэрийн муруй) хуримтлагдсан давтамжийн цувралыг харуулна. Хуримтлагдсан давтамжийг бүлгүүдийн давтамжийг дараалан нэгтгэн тодорхойлж, хүн амын хэдэн нэгж нь авч үзсэн утгаас ихгүй шинж чанартай болохыг харуулдаг.


Цагаан будаа. 2.4. Нэг хүнд ногдох орон сууцны талбайн хэмжээгээр гэр бүлийн Ogiva хуваарилалт

Интервалын вариацын цувааны хуримтлалыг бүтээхдээ цувралын хувилбаруудыг абсцисса тэнхлэгийн дагуу, хуримтлагдсан давтамжийг ордны тэнхлэгийн дагуу зурна.

Үүнтэй төстэй нийтлэлүүд

2022 parki48.ru. Бид хүрээ байшин барьж байна. Тохижилт. Барилга. Суурь.