Интервалын вариацын цуваа зохиож, гистограмм байгуул. Тасралтгүй тоон өгөгдлийн интервалын вариацын цуваа байгуулах

Лабораторийн ажил №1. Анхдагч боловсруулалт статистик мэдээлэл

Түгээх цувралын бүтээн байгуулалт

Популяцийн нэгжийг аль нэг шинж чанарын дагуу бүлэгт дарааллаар нь хуваарилахыг нэрлэдэг түгээлтийн ойролцоо . Энэ тохиолдолд тэмдэг нь тоон аль аль нь байж болно, дараа нь цуврал гэж нэрлэдэг хувьсах , болон чанарын, дараа нь цуврал гэж нэрлэдэг атрибут . Жишээлбэл, хотын хүн амыг насны бүлгээр нь янз бүрийн цувралаар эсвэл мэргэжлийн харьяаллаар нь ялгаж салгаж болно (мэдээжийн хэрэг, тархалтын цувралыг бий болгоход чанарын болон тоон шинж чанаруудыг санал болгож болно. шинж чанарыг сонгох нь статистикийн судалгааны даалгавараар тодорхойлогддог).

Аливаа түгээлтийн цуврал нь хоёр элементээр тодорхойлогддог.

- сонголт(x i) - эдгээр нь түүвэр популяцийн нэгжийн шинж чанарын бие даасан утгууд юм. Учир нь вариацын цувралхувилбар нь тоон утгыг авдаг, атрибутивийн хувьд - чанарын хувьд (жишээлбэл, х = "төрийн албан хаагч");

- давтамж(n би) нь энэ болон бусад шинж чанарын утга хэдэн удаа тохиолдож байгааг харуулсан тоо юм. Хэрэв давтамжийг харьцангуй тоогоор илэрхийлсэн бол (өөрөөр хэлбэл популяцийн нийт эзлэхүүн дэх сонголтуудын өгөгдсөн утгатай тохирох популяцийн элементүүдийн эзлэх хувь) үүнийг нэрлэдэг. харьцангуй давтамжэсвэл давтамж.

Хувилбарын цувралууд нь:

- салангидсудалж буй шинж чанар нь тодорхой тоогоор тодорхойлогддог (ихэвчлэн бүхэл тоо).

- интервал"-аас" болон "хүртэл" хил хязгаарыг тасралтгүй хувьсах шинж чанарыг тодорхойлох үед. Хэрэв салангид хувьсах шинж чанарын утгуудын багц их байвал интервалын цувралыг бүтээдэг.

Интервалын цувааг интервалтай адил байгуулж болно тэнцүү урт(тэнцүү интервалын цуваа) ба тэгш бус интервалтай, хэрэв энэ нь статистикийн судалгааны нөхцлөөр тогтоогдсон бол. Жишээлбэл, хүн амын орлогын хуваарилалтыг дараахь интервалтайгаар авч үзэж болно.<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



Энд k нь интервалын тоо, n нь түүврийн хэмжээ. (Мэдээжийн хэрэг, томъёо нь ихэвчлэн бутархай тоог өгдөг бөгөөд үр дүнд нь хамгийн ойрын бүхэл тоог интервалын тоогоор сонгоно.) Энэ тохиолдолд интервалын уртыг томъёогоор тодорхойлно.

.

Графикийн хувьд вариацын цувралыг дараах байдлаар илэрхийлж болно гистограмууд(энэ интервал дахь давтамжтай тохирох өндрийн "багана" нь интервалын цувааны интервал бүрийн дээр баригдсан болно), түгээлтийн талбай(эвдэрсэн шугам холбох цэгүүд ( x i;n i) эсвэл хуримтлагддаг(хуримтлагдсан давтамжийн дагуу бүтээгдсэн, өөрөөр хэлбэл шинж чанарын утга тус бүрийн хувьд шинж чанарын өгөгдсөн хэмжээнээс бага утгатай объектуудын олонлогт тохиолдох давтамжийг авна).

Excel дээр ажиллахдаа вариацын цуваа үүсгэхийн тулд дараах функцуудыг ашиглаж болно.

ШАЛГАХ( өгөгдлийн массив) – түүврийн хэмжээг тодорхойлох. Аргумент нь жишээ өгөгдлийг агуулсан нүднүүдийн муж юм.

COUNTIF( хүрээ; шалгуур) - шинж чанар эсвэл вариацын цувралыг бүтээхэд ашиглаж болно. Аргументууд нь атрибутын түүврийн утгуудын массив ба шалгуур үзүүлэлт - атрибутын тоон эсвэл текстийн утга эсвэл түүний байрлах нүдний тоо юм. Үр дүн нь дээжинд тухайн утгын тохиолдох давтамж юм.

ДАВТАТ( өгөгдлийн массив; интервалын массив) – вариацын цуваа бүтээх. Аргументууд нь түүвэр өгөгдлийн массивын муж ба интервалын багана юм. Хэрэв салангид цуврал үүсгэх шаардлагатай бол сонголтуудын утгыг энд, хэрэв интервал бол интервалын дээд хилийг (тэдгээрийг "халаас" гэж нэрлэдэг) зааж өгсөн болно. Үр дүн нь давтамжийн багана учраас CTRL+SHIFT+ENTER товчлуурын хослолыг дарж функцийн танилцуулгыг дуусгах ёстой. Функцийг нэвтрүүлэхдээ интервалын массивыг тохируулахдаа түүний сүүлчийн утгыг орхиж болно гэдгийг анхаарна уу - өмнөх "халаасанд" ороогүй бүх утгыг харгалзах "халаасанд" хийнэ. Энэ нь заримдаа хамгийн том түүврийн утгыг автоматаар сүүлчийн "халаасанд" оруулаагүй алдаанаас зайлсхийхэд тусалдаг.

Нэмж дурдахад нарийн төвөгтэй бүлэглэлийн хувьд (хэд хэдэн шалгуурын дагуу) "пивот хүснэгт" хэрэгслийг ашигладаг. Тэдгээрийг мөн шинж чанар, өөрчлөлтийн цувралыг бүтээхэд ашиглаж болох боловч энэ нь даалгаврыг шаардлагагүйгээр хүндрүүлдэг. Мөн вариацын цуврал болон гистограм бүтээхийн тулд "Шинжилгээний багц" нэмэлтээс "гистограм" процедур байдаг (Excel дээр нэмэлтүүдийг ашиглахын тулд та эхлээд татаж авах хэрэгтэй, тэдгээрийг анхдагчаар суулгаагүй)

Анхдагч өгөгдөл боловсруулах үйл явцыг бид дараах жишээн дээр харуулав.

Жишээ 1.1. 60 гэр бүлийн тоон бүрэлдэхүүний тухай мэдээлэл бий.

Вариацын цуваа ба тархалтын полигон байгуулах

Шийдэл.

Excel хүснэгтийг нээцгээе. A1:L5 мужид өгөгдлийн массив оруулъя. Хэрэв та баримт бичгийг цахим хэлбэрээр (жишээ нь Word форматаар) судалж байгаа бол өгөгдөл бүхий хүснэгтийг сонгоод санах ойд хуулж, дараа нь A1 нүдийг сонгоод өгөгдлийг буулгахад хангалттай. тохирох хүрээ. Түүврийн хэмжээ n - түүврийн өгөгдлийн тоог тооцоолъё, үүний тулд B7 нүдэнд = COUNT (A1: L5) томъёог оруулна уу. Хүссэн мужаа томьёонд оруулахын тулд гарнаас түүний тэмдэглэгээг оруулах шаардлагагүй, үүнийг сонгоход хангалттай гэдгийг анхаарна уу. Түүврийн хамгийн бага ба хамгийн их утгыг B8 нүдэнд =MIN(A1:L5), B9 нүдэнд: =MAX(A1:L5) томъёог оруулан тодорхойлъё.

Зураг.1.1 Жишээ 1. Excel хүснэгт дэх статистик мэдээллийг анхан шатны боловсруулалт

Дараа нь интервалын багана (хувилбарын утга) болон давтамжийн баганын нэрийг оруулж вариацын цуваа бүтээх хүснэгтийг бэлдье. Интервалын баганад B12: B17 мужийг эзэлдэг хамгийн бага (1) -ээс хамгийн их (6) хүртэлх шинж чанарын утгыг оруулна уу. Давтамжийн баганыг сонгоод =FREQUENCY(A1:L5;B12:B17) томъёог оруулаад CTRL+SHIFT+ENTER товчийг дарна уу.

Зураг.1.2 Жишээ 1. Вариацын цуваа байгуулах

Хяналтын хувьд бид SUM функцийг ашиглан давтамжийн нийлбэрийг тооцдог (Нүүр хуудасны Засварлах бүлгийн S функцийн дүрс), тооцоолсон нийлбэр нь B7 нүдэн дэх урьд нь тооцоолсон түүврийн хэмжээтэй тохирч байх ёстой.

Одоо олон өнцөгт бүтээцгээе: үүссэн давтамжийн мужийг сонгоод "Оруулах" таб дээрх "График" командыг сонгоно уу. Анхдагч байдлаар, хэвтээ тэнхлэг дээрх утгууд нь дарааллын тоо байх болно - манай тохиолдолд 1-ээс 6 хүртэлх тоо нь сонголтуудын утгатай (тарифын ангиллын тоо) давхцдаг.

"Цуврал 1" диаграммын цувралын нэрийг "Дизайнер" таб дээрх "өгөгдлөө сонгох" сонголтыг ашиглан өөрчлөх эсвэл зүгээр л устгаж болно.

Зураг.1.3. Жишээ 1. Давтамжийн олон өнцөгт байгуулах

Жишээ 1.2. Бохирдуулагчийн ялгаруулалтын талаарх мэдээллийг 50 эх үүсвэрээс авах боломжтой.

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Тэнцүү интервалтай цувралыг эмхэтгэж, гистограммыг байгуул

Шийдэл

Excel хуудсанд массив өгөгдлийн нэмж оруулъя, энэ нь A1: J5 мужийг эзэлнэ. Өмнөх даалгаврын адил бид түүврийн хэмжээ n, түүврийн хамгийн бага ба хамгийн их утгыг тодорхойлно. Одоо бидэнд дискрет биш, харин интервалын цуваа хэрэгтэй бөгөөд асуудлын интервалын тоог заагаагүй тул Sturgess томъёог ашиглан k интервалын тоог тооцоолно. Үүнийг хийхийн тулд B10 нүдэнд =1+3.322*LOG10(B7) томьёог оруулна.

Зураг 1.4. Жишээ 2. Тэнцүү интервалтай цуваа байгуулах

Үр дүнгийн утга нь бүхэл тоо биш, ойролцоогоор 6.64 байна. k=7-ийн хувьд интервалуудын урт нь бүхэл тоогоор илэрхийлэгдэх тул (k=6-аас ялгаатай) энэ утгыг C10 нүдэнд оруулан k=7-г сонгоно. Бид = (B9-B8) / C10 томъёог оруулснаар B11 нүдэнд d интервалын уртыг тооцоолно.

7 интервал тус бүрийн дээд хязгаарыг зааж өгөх интервалын массивыг тодорхойлъё. Үүний тулд E8 нүдэнд =B8+B11 томьёог оруулан эхний интервалын дээд хязгаарыг тооцоолно; E9 нүдэнд хоёр дахь интервалын дээд хязгаарыг =E8+B11 томъёогоор оруулна. Интервалын дээд хязгаарын үлдсэн утгыг тооцоолохын тулд бид оруулсан томьёоны B11 нүдний тоог $ тэмдгээр засч, E9 нүдний томьёо =E8+B$11 болж, агуулгыг хуулна. E9 нүдийг E10-E14 нүд рүү. Хамгийн сүүлд олж авсан утга нь B9 нүдэнд өмнө нь тооцоолсон түүврийн хамгийн их утгатай тэнцүү байна.

Зураг.1.5. Жишээ 2. Тэнцүү интервалтай цуваа байгуулах


Одоо 1-р жишээн дээр хийсэн шиг FREQUENCY функцийг ашиглан "халаасны" массивыг дүүргэцгээе.

Зураг.1.6. Жишээ 2. Тэнцүү интервалтай цуваа байгуулах

Үүссэн вариацын цуврал дээр үндэслэн бид гистограммыг бүтээх болно: давтамжийн баганыг сонгоод "Оруулах" таб дээрээс "Гистограмм" -ыг сонгоно уу. Гистограммыг хүлээн авсны дараа бид хэвтээ тэнхлэгийн шошгыг интервалын муж дахь утга болгон өөрчлөх бөгөөд үүний тулд "Дизайн" табын "Өгөгдөл сонгох" сонголтыг сонгоно. Гарч ирэх цонхонд "Хэвтээ тэнхлэгийн шошго" хэсэгт "Өөрчлөх" командыг сонгоод "хулгана" ашиглан утгын хүрээг оруулна уу.

Зураг 1.7. Жишээ 2. Гистограмм бүтээх

Зураг 1.8. Жишээ 2. Гистограмм бүтээх

Математикийн статистик- шинжлэх ухаан, практик дүгнэлтэнд статистикийн өгөгдлийг боловсруулах, системчлэх, ашиглах математик аргуудад зориулагдсан математикийн хэсэг.

3.1. МАТЕМАТИК СТАТИСТИКИЙН ҮНДСЭН ОЙЛГОЛТ

Биоанагаах ухааны асуудлын хувьд маш олон тооны хүмүүст нэг буюу өөр шинж чанарын тархалтыг судлах шаардлагатай байдаг. Өөр өөр хүмүүсийн хувьд энэ шинж чанар нь өөр өөр утгатай тул санамсаргүй хэмжигдэхүүн юм. Жишээлбэл, аливаа эмчилгээний эмийг өөр өөр өвчтөнд хэрэглэхэд өөр өөр үр дүнтэй байдаг. Гэсэн хэдий ч энэ эмийн үр дүнтэй байдлын талаар ойлголттой болохын тулд үүнийг хэрэглэх шаардлагагүй хүн бүрөвчтэй. Харьцангуй цөөн тооны өвчтөнүүдэд эмийг хэрэглэх үр дүнг ажиглаж, олж авсан өгөгдлүүдийн үндсэн дээр эмчилгээний үйл явцын чухал шинж чанаруудыг (үр дүнтэй байдал, эсрэг заалтуудыг) тодорхойлох боломжтой.

Хүн ам- ямар нэг онцлог шинжээр тодорхойлогддог, судлах нэгэн төрлийн элементүүдийн багц. Энэ тэмдэг Үргэлжилсэнтархалтын нягтралтай санамсаргүй хэмжигдэхүүн f(x).

Жишээлбэл, хэрэв бид тодорхой бүс нутагт өвчний тархалтыг сонирхож байгаа бол нийт хүн ам гэдэг нь тухайн бүс нутгийн нийт хүн ам юм. Хэрэв бид эрэгтэй, эмэгтэй хүмүүсийн энэ өвчинд мэдрэмтгий байдлыг тус тусад нь олж мэдэхийг хүсвэл хоёр ерөнхий популяцийг авч үзэх хэрэгтэй.

шинж чанарыг судлах хүн амтүүний зарим элементүүдийг сонгоно уу.

Дээж- шинжилгээнд (эмчилгээнд) сонгосон нийт хүн амын нэг хэсэг.

Хэрэв энэ нь төөрөгдөл үүсгэхгүй бол дээжийг гэж нэрлэдэг объектуудын цуглуулгашалгалтанд сонгосон, мөн нийт

үнэт зүйлсшалгалтын явцад олж авсан судалж буй шинж чанар. Эдгээр утгыг хэд хэдэн аргаар илэрхийлж болно.

Энгийн статистик цуврал -судалж буй шинж чанарын утгыг олж авсан дарааллаар нь бүртгэнэ.

20 өвчтөний духны арьсны гадаргуугийн долгионы хурдыг (м / с) хэмжиж олж авсан энгийн статистик цувралын жишээг Хүснэгтэнд үзүүлэв. 3.1.

Хүснэгт 3.1.Энгийн статистикийн цуврал

Энгийн статистик цуврал нь судалгааны үр дүнг бүртгэх гол бөгөөд бүрэн гүйцэд арга юм. Энэ нь хэдэн зуун элемент агуулж болно. Ийм дүүргэгчийг нэг дор харахад маш хэцүү байдаг. Тиймээс том дээжийг ихэвчлэн бүлэгт хуваадаг. Үүнийг хийхийн тулд шинж чанарын өөрчлөлтийн талбарыг хэд хэдэн (N) хэсэгт хуваана. интервалуудтэнцүү өргөнтэй байх ба эдгээр интервалд хамаарах шинж чанарын харьцангуй давтамжийг (n/n) тооцоол. Интервал бүрийн өргөн нь:

Интервалуудын хил хязгаар нь дараахь утгатай байна.

Хэрэв түүврийн аль нэг элемент нь хоёр зэргэлдээх интервалын хоорондох хил бол түүнийг гэж нэрлэдэг зүүнинтервал. Ийм байдлаар бүлэглэсэн өгөгдлийг гэж нэрлэдэг интервалын статистик цуврал.

- энэ бол шинж чанарын утгуудын интервал ба эдгээр интервалд хамаарах шинж чанарын харьцангуй давтамжийг харуулсан хүснэгт юм.

Манай тохиолдолд бид жишээлбэл, ийм интервалын статистик цуврал үүсгэж болно (N = 5, г= 4), таб. 3.2.

Хүснэгт 3.2.Интервалын статистик цуврал

Энд 28-тай тэнцэх хоёр утгыг 28-32 интервалд (Хүснэгт 3.1), 32, 33, 34, 35 утгыг 32-36 интервалд онооно.

Интервалын статистик цувралыг графикаар дүрсэлж болно. Үүнийг хийхийн тулд абсцисса тэнхлэгийн дагуу шинж чанарын утгуудын интервалыг зурж, тэдгээрийн үндсэн дээр харьцангуй давтамжтай тэнцүү өндөртэй тэгш өнцөгтийг барьсан болно. Үүссэн баганан диаграмыг дуудна гистограм.

Цагаан будаа. 3.1.баганат график

Гистограмм дээр шинж чанарын тархалтын статистик хэв маяг нэлээд тодорхой харагдаж байна.

Түүврийн хэмжээ их (хэдэн мянга), баганын өргөн багатай гистограмын хэлбэр нь графикийн хэлбэртэй ойролцоо байна. түгээлтийн нягтралтэмдэг.

Гистограмын баганын тоог дараах томъёогоор сонгож болно.

Гистограммыг гараар бүтээх нь урт процесс юм. Тиймээс тэдгээрийг автоматаар бүтээхэд зориулж компьютерийн программуудыг боловсруулсан.

3.2. СТАТИСТИКИЙН ЦУВРАЛЫН ТООН ОНЦЛОГ

Статистикийн олон процедур нь хүн амын дундаж ба дисперсийн (эсвэл стандарт хазайлт) түүврийн тооцоог ашигладаг.

жишээ дундаж(X) нь энгийн статистик цувралын бүх элементийн арифметик дундаж юм.

Бидний жишээн дээр X= 37.05 (м/с).

Жишээ дундаж ньХамгийн сайнерөнхий дундаж үнэлгээМ.

Түүврийн зөрүү s 2түүвэр дунджаас элементүүдийн квадрат хазайлтын нийлбэрийг хуваасантай тэнцүү байна n- 1:

Бидний жишээнд s 2 \u003d 25.2 (м / с) 2.

Түүврийн дисперсийг тооцоолохдоо томъёоны хуваагч нь түүврийн хэмжээ n биш, харин n-1 гэдгийг анхаарна уу. Энэ нь (3.3) томъёоны хазайлтыг тооцоолохдоо үл мэдэгдэх математикийн хүлээлтийн оронд түүний тооцоог ашигладагтай холбоотой юм. жишээ дундаж.

Түүврийн зөрүү нь Хамгийн сайнерөнхий хэлбэлзлийн тооцоо (σ 2).

Стандарт хазайлтын жишээ(s) нь түүврийн дисперсийн квадрат язгуур:

Бидний жишээн дээр с= 5.02 (м/с).

сонгомол Rmsхазайлт нь ерөнхий RMSE (σ)-ийн хамгийн сайн үнэлгээ юм.

Түүврийн хэмжээ хязгааргүй нэмэгдэхийн хэрээр түүврийн бүх шинж чанар нь нийт хүн амын харгалзах шинж чанаруудад чиглэдэг.

Түүврийн шинж чанарыг тооцоолохын тулд компьютерийн томъёог ашигладаг. Excel-д эдгээр тооцоолол нь AVERAGE, VARR гэсэн статистик функцуудыг гүйцэтгэдэг. STDEV.

3.3. ИНТЕРВАЛ ТООЦОО

Бүх дээжийн шинж чанарууд байна санамсаргүй утгууд.Энэ нь ижил хэмжээтэй өөр түүврийн хувьд түүврийн шинж чанарын утгууд өөр байх болно гэсэн үг юм. Тиймээс сонгомол

шинж чанарууд нь зөвхөн тооцоололнийт хүн амын холбогдох шинж чанарууд.

Энэ нь сонгомол үнэлгээний дутагдлыг нөхдөг интервалын тооцоо,төлөөлж байна тооны интервал,дотор нь өгөгдсөн магадлалаар Р дтооцоолсон параметрийн жинхэнэ утгыг олно.

Болъё U r - ерөнхий популяцийн зарим параметр (ерөнхий дундаж, ерөнхий дисперс гэх мэт).

интервалын тооцоо U r параметрийг интервал гэж нэрлэдэг (U 1 , U 2),нөхцөлийг хангаж байна:

П(У < Ur < U2) = Рд. (3.5)

Магадлал Р ддуудсан итгэх магадлал.

Итгэлийн магадлал Рг - тооцоолсон хэмжигдэхүүний жинхэнэ утга байх магадлал доторзаасан интервал.

Үүний зэрэгцээ интервал (U 1 , U 2)дуудсан итгэлийн интервалтооцоолсон параметрийн хувьд.

Ихэнхдээ итгэлийн магадлалын оронд холбогдох утга α = 1 - R d гэж нэрлэгддэг. ач холбогдлын түвшин.

Ач холбогдолын түвшинТооцоолсон параметрийн жинхэнэ утга байх магадлал гаднаитгэлийн интервал.

Заримдаа α ба R d-ийг хувиар илэрхийлдэг, жишээлбэл, 0.05-ын оронд 5%, 0.95-ийн оронд 95%.

Интервалын тооцоололд эхлээд тохирохыг нь сонгоно итгэлийн түвшин(ихэвчлэн 0.95 эсвэл 0.99), дараа нь тооцоолсон параметрийн утгуудын харгалзах интервалыг олно.

Бид интервалын тооцооллын зарим ерөнхий шинж чанарыг тэмдэглэв.

1. Ач холбогдлын түвшин бага байх тусам (илүү их R d),интервалын тооцоо илүү өргөн байна. Тиймээс хэрэв 0.05-ийн ач холбогдлын түвшинд ерөнхий дундаж утгын интервалын үнэлгээ нь 34.7 байна.< М< 39,4, то для уровня 0,01 она будет гораздо шире: 33,85 < М< 40,25.

2. Түүврийн хэмжээ их байх тусам n,Сонгосон ач холбогдлын түвшинтэй интервалын тооцоо нь нарийсдаг. Жишээлбэл, 20 зүйлийн түүврээс авсан ерөнхий дундаж (β=0.05)-ийн хувийн үнэлгээг 5, дараа нь 34.7 гэж үзье.< М< 39,4.

Түүврийн хэмжээг 80 хүртэл нэмэгдүүлснээр бид ижил ач холбогдлын түвшинд илүү үнэн зөв тооцоолол авах болно: 35.5< М< 38,6.

Ерөнхий тохиолдолд найдвартай итгэлцлийн тооцоог бий болгохын тулд тооцоолсон санамсаргүй шинж чанарыг нийт хүн амд хуваарилдаг хуулийн талаархи мэдлэгийг шаарддаг. Интервалын тооцоолол хэрхэн хийгдсэнийг авч үзье ерөнхий дундаждагуу нийт хүн амд тархсан шинж хэвийнхууль.

3.4. Хэвийн ТАРХИАЛТЫН ХУУЛИЙН ЕРӨНХИЙ ДУНДЫН ИНТЕРВАЛИЙН ТООЦОО.

Ердийн тархалтын хуультай нийт хүн амын ерөнхий дундаж М-ийн интервалын тооцоог байгуулахдаа дараах шинж чанарт үндэслэнэ. Эзлэхүүн түүвэрлэлтийн хувьд nхандлага

ν = эрх чөлөөний зэрэгтэй Оюутны хуваарилалтад захирагдана n- 1.

Энд Xтүүвэр дундаж, ба с- сонгомол стандарт хазайлт.

Оюутны тархалтын хүснэгтүүд эсвэл тэдгээрийн компьютерийн аналогийг ашиглан өгөгдсөн итгэлийн магадлалаар дараахь тэгш бус байдлыг хангасан хилийн утгыг олж болно.

Энэ тэгш бус байдал нь M-ийн тэгш бус байдалтай тохирч байна:

хаана ε нь итгэлцлийн интервалын хагас өргөн юм.

Ийнхүү M-ийн итгэлцлийн интервалыг байгуулах ажлыг дараах дарааллаар гүйцэтгэнэ.

1. P d (ихэвчлэн 0.95 эсвэл 0.99) итгэх магадлалыг сонгоод Оюутны тархалтын хүснэгтийн дагуу t параметрийг олно.

2. Итгэлийн интервал ε-ийн хагас өргөнийг тооцоол.

3. Сонгосон итгэлийн магадлалаар ерөнхий дундажийн интервалын тооцоог гаргаж авна.

Товчхондоо ингэж бичжээ.

Интервалын тооцоог олохын тулд компьютерийн процедурыг боловсруулсан.

Оюутны хуваарилалтын хүснэгтийг хэрхэн ашиглах талаар тайлбарлая. Энэ хүснэгт нь хоёр "орц"-той: зүүн багана, эрх чөлөөний градусын тоо гэж нэрлэгддэг ν = n- 1, дээд эгнээ нь ач холбогдлын түвшин α байна. Харгалзах мөр, баганын огтлолцол дээр Оюутны коэффициент олддог т.

Энэ аргыг дээж дээрээ хэрэгжүүлье. Оюутны хуваарилалтын хүснэгтийн хэсгийг доор үзүүлэв.

Хүснэгт 3.3. Оюутны хуваарилалтын хүснэгтийн фрагмент

20 хүний ​​түүвэрт зориулсан энгийн статистикийн цуврал (n= 20, ν =19)-ийг Хүснэгтэнд үзүүлэв. 3.1. Энэ цувралын хувьд (3.1-3.3) томъёог ашиглан хийсэн тооцоолол нь: X= 37,05; с= 5,02.

Сонгоцгооё α = 0.05 (P d = 0.95). "19" мөр ба "0.05" баганын огтлолцол дээр бид олдог т= 2,09.

Тооцооллын нарийвчлалыг (3.6) томъёогоор тооцоолъё: ε = 2.09?5.02/λ /20 = 2.34.

Интервалын тооцоог хийцгээе: 95% -ийн магадлалаар үл мэдэгдэх ерөнхий дундаж нь тэгш бус байдлыг хангана.

37,05 - 2,34 < М< 37,05 + 2,34, или М= 37.05 ± 2.34 (м / с), Р d = 0.95.

3.5. СТАТИСТИКИЙН ТААМАГЛАЛ БАТАЛГААХ АРГА

Статистикийн таамаглал

Статистикийн таамаглал гэж юу болохыг тодорхойлохын өмнө дараах жишээг авч үзье.

Тодорхой өвчнийг эмчлэх хоёр аргыг харьцуулахын тулд тус бүр нь 20 хүнтэй хоёр бүлгийн өвчтөнүүдийг сонгосон бөгөөд эдгээр аргуудын дагуу эмчилгээг хийдэг. Өвчтөн бүрийн хувьд a процедурын тоодараа нь эерэг нөлөө үзүүлнэ. Эдгээр өгөгдлүүдийн дагуу бид бүлэг бүрийн хувьд түүврийн дундаж (X), түүврийн зөрүүг олсон (s 2)болон жишээ RMS (s).

Үр дүнг хүснэгтэд үзүүлэв. 3.4.

Хүснэгт 3.4

Эерэг нөлөө үзүүлэхэд шаардагдах процедурын тоо нь санамсаргүй хэмжигдэхүүн бөгөөд эдгээрийн талаарх бүх мэдээлэл одоогоор дээрх түүвэрт агуулагдаж байна.

Хүснэгтээс. 3.4-т эхний бүлгийн түүврийн дундаж нь хоёр дахь бүлгийнхээс бага байгааг харуулж байна. Энэ нь ерөнхий дундаж үзүүлэлтүүдэд ижил харьцаа байна гэсэн үг үү: M 1< М 2 ? Достаточно ли статистических данных для такого вывода? Ответы на эти вопросы и дает таамаглалын статистик туршилт.

Статистикийн таамаглал- Энэ нь популяцийн шинж чанарын талаархи таамаглал юм.

Бид шинж чанаруудын талаархи таамаглалуудыг авч үзэх болно хоёрерөнхий популяци.

Хэрэв хүн ам байгаа бол мэддэг, адилхантооцоолж буй үнэ цэнийн хуваарилалт ба таамаглалууд нь хэмжигдэхүүнтэй холбоотой зарим параметрЭнэ хуваарилалт, дараа нь таамаглалуудыг дуудна параметрийн.Жишээлбэл, популяциас дээж авдаг ердийн хуульхуваарилалт ба тэнцүү дисперс. Үүнийг олж мэдэх шаардлагатай адилхан байнаэдгээр популяцийн ерөнхий дундаж үзүүлэлтүүд.

Хэрэв ерөнхий популяцийн тархалтын хуулиудын талаар юу ч мэдэгдээгүй бол тэдгээрийн шинж чанарын талаархи таамаглалыг нэрлэнэ параметрийн бус.Жишээлбэл, адилхан байнадээж авсан популяцийн тархалтын хууль.

Үгүй ба альтернатив таамаглал.

Таамаглалыг шалгах даалгавар. Ач холбогдолын түвшин

Таамаглалыг шалгахад ашигладаг нэр томъёотой танилцацгаая.

H 0 - тэг таамаглал (эргэлзэгч таамаглал) - энэ бол таамаглал юм ялгаагүй тухайхарьцуулсан дээжүүдийн хооронд. Эргэлзэгч нь судалгааны үр дүнгээс олж авсан түүврийн тооцооллын зөрүү нь санамсаргүй гэж үздэг;

H 1- өөр таамаглал (өөдрөг үзлийн таамаглал) нь харьцуулсан түүврийн хооронд ялгаа байгаа тухай таамаглал юм. Өөдрөг үзэлтнүүд түүврийн тооцооллын зөрүү нь объектив шалтгаанаас үүдэлтэй бөгөөд нийт хүн амын ялгаатай байдалтай тохирч байна гэж үздэг.

Статистикийн таамаглалыг турших нь харьцуулсан түүврийн элементүүдийг зарим зүйлийг бүрдүүлэхэд ашиглах боломжтой үед л боломжтой юм. үнэ цэнэ(шалгуур), шударга байдлын хувьд хуваарилалтын хууль H 0мэдэгдэж байна. Дараа нь энэ тоо хэмжээг зааж өгч болно итгэлийн интервал,өгөгдсөн магадлалтайгаар Р дүнэ цэнийг нь авдаг. Энэ интервал гэж нэрлэгддэг чухал бүс.Хэрэв шалгуур үзүүлэлт нь эгзэгтэй бүсэд орвол таамаглалыг хүлээн зөвшөөрнө H 0.Үгүй бол H 1 таамаглалыг хүлээн зөвшөөрнө.

Анагаах ухааны судалгаанд P d = 0.95 эсвэл P d = 0.99-ийг ашигладаг. Эдгээр үнэ цэнэ нь таарч байна ач холбогдлын түвшинα = 0.05 эсвэл α = 0.01.

Статистикийн таамаглалыг шалгахдааач холбогдлын түвшин(α) нь тэг таамаглал үнэн үед няцаагдах магадлал юм.

Таамаглалыг шалгах процедур нь үндсэндээ чиглэгдэж байгааг анхаарна уу ялгаа илрүүлэх,Тэдний байхгүйг батлахгүй байх. Шалгуурын үнэ цэнэ нь эгзэгтэй хэсгээс давсан тохиолдолд бид "эргэлзэгч" гэж цэвэр зүрх сэтгэлээр хэлж чадна - та өөр юу хүсч байна вэ ?! Хэрэв ялгаа байхгүй байсан бол 95% (эсвэл 99%) байх магадлалтай бол тооцоолсон утга нь заасан хязгаарт багтах болно. Тэгэхээр үгүй! ..

Хэрэв шалгуур үзүүлэлтийн утга нь эгзэгтэй мужид орвол H 0 таамаглал зөв гэдэгт итгэх шалтгаан байхгүй. Энэ нь хамгийн их магадлалтай хоёр шалтгааны аль нэгийг харуулж байна.

1. Түүврийн хэмжээ нь ялгааг илрүүлэх хангалттай том биш байна. Туршилтыг үргэлжлүүлэх нь амжилтанд хүрэх магадлалтай.

2. Ялгаатай байдаг. Гэхдээ тэдгээр нь маш жижиг тул практик ач холбогдолгүй юм. Энэ тохиолдолд туршилтыг үргэлжлүүлэх нь утгагүй юм.

Анагаах ухааны судалгаанд ашигладаг зарим статистик таамаглалыг авч үзье.

3.6. ХӨРӨНГИЙН ТЭГШ БАЙДЛЫН ТУРШИЛТЫН ТААМАГЛАЛ, ФИШЕР Ф ШАЛГАЛТ

Зарим эмнэлзүйн судалгаагаар эерэг нөлөө нь тийм ч их биш байдаг хэмжээсудалж буй параметр, хэр их тогтворжуулах,түүний хэлбэлзлийг багасгах. Энэ тохиолдолд түүвэр судалгааны үр дүнд үндэслэн хоёр ерөнхий хэлбэлзлийг харьцуулах асуулт гарч ирнэ. Энэ даалгаврыг ашиглан шийдэж болно Фишерийн шалгуур.

Асуудлын томъёолол

ердийн хуульхуваарилалт. Дээжийн хэмжээ -

n 1болон n2,а түүврийн зөрүүтэнцүү s 1 ба s 2 2 ерөнхий зөрүү.

Туршсан таамаглалууд:

H 0- ерөнхий зөрүү ижил байна;

H 1- ерөнхий зөрүү өөр.

Популяциас дээж авсан бол харуулна ердийн хуульхуваарилалт, хэрэв таамаглал үнэн бол H 0түүврийн хэлбэлзлийн харьцаа нь Фишерийн тархалтыг дагаж мөрддөг. Тиймээс хүчин төгөлдөр байдлыг шалгах шалгуур болгон H 0утгыг авдаг F,томъёогоор тооцоолно:

хаана s 1 ба s 2 - түүврийн зөрүү.

Энэ харьцаа нь ν 1 = тоологчийн эрх чөлөөний зэрэгтэй Фишерийн тархалтыг дагаж мөрддөг. n 1- 1 ба хуваагчийн эрх чөлөөний зэрэглэлийн тоо ν ​​2 = n 2 - 1. Критик мужийн хил хязгаарыг Фишерийн тархалтын хүснэгтүүдийн дагуу эсвэл компьютерийн BRASPOBR функцийг ашиглан олно.

Хүснэгтэнд үзүүлсэн жишээний хувьд. 3.4, бид дараахийг авна: ν 1 \u003d ν 2 \u003d 20 - 1 \u003d 19; Ф= 2.16/4.05 = 0.53. α = 0.05 үед эгзэгтэй бүсийн хилүүд тэнцүү байна: = 0.40, = 2.53.

Шалгуурын утга нь эгзэгтэй бүсэд унасан тул таамаглалыг хүлээн зөвшөөрөв H 0:ерөнхий түүврийн зөрүү адилхан байна.

3.7. ДУНДЖИЙН ТЭГШ БАЙДЛЫН ТААМАГЛАЛЫН ТЕСТ, ОЮУТНЫ t тест

Харьцуулах асуудал дундүед хоёр ерөнхий популяци үүсдэг хэмжээсудалж буй шинж чанар. Жишээлбэл, эмчилгээний үргэлжлэх хугацааг хоёр өөр аргаар харьцуулах эсвэл тэдгээрийн ашиглалтаас үүсэх хүндрэлийн тоог харьцуулах үед. Энэ тохиолдолд Оюутны t тестийг ашиглаж болно.

Асуудлын томъёолол

бүхий популяциас хоёр дээж (X 1 ) ба (X 2 ) авсан ердийн хуульхуваарилалт ба ижил тархалт.Дээжийн хэмжээ - n 1 ба n 2, дээж гэсэн үгнь X 1 ба X 2-тэй тэнцүү бөгөөд түүврийн зөрүү- s 1 2 ба s 2 2тус тус. Харьцуулах хэрэгтэй ерөнхий дундаж.

Туршсан таамаглалууд:

H 0- ерөнхий дундаж ижил байна;

H 1- ерөнхий дундаж өөр.

Хэрэв таамаглал үнэн бол гэдгийг харуулсан H 0 t-ийн утга, томъёогоор тооцоолно:

ν = ν 1 + + ν2 - 2 эрх чөлөөний зэрэгтэй Студентийн хуулийн дагуу хуваарилагдсан.

Энд ν 1 = байна n 1 - 1 - эхний дээжийн эрх чөлөөний зэрэглэлийн тоо; v2 = n 2 - 1 - хоёр дахь дээжийн эрх чөлөөний градусын тоо.

Чухал бүсийн хил хязгаарыг t-тархалтын хүснэгтээс эсвэл компьютерийн STUDRASP функцийг ашиглан олж болно. Оюутны тархалт тэг орчим тэгш хэмтэй тул эгзэгтэй бүсийн зүүн ба баруун хил нь үнэмлэхүй утгаараа ижил, тэмдгээр эсрэг тэсрэг байна: -ба

Хүснэгтэнд үзүүлсэн жишээний хувьд. 3.4, бид дараахь зүйлийг авна.

v 1 \u003d v 2 \u003d 20 - 1 \u003d 19; v = 38, т= -2.51. α = 0.05 = 2.02 байна.

Шалгуурын утга нь эгзэгтэй бүсийн зүүн хилээс давсан тул бид таамаглалыг хүлээн зөвшөөрч байна H 1:ерөнхий дундаж өөр.Үүний зэрэгцээ нийт хүн амын дундаж анхны дээжБАГА.

Оюутны t-тестийг хэрэглэх боломж

Оюутны t-тест нь зөвхөн дээжид хамаарна хэвийн-тэй нэгтгэдэг ижил ерөнхий зөрүү.Хэрэв нөхцөлүүдийн дор хаяж нэг нь зөрчигдсөн бол шалгуурыг ашиглах эсэх нь эргэлзээтэй байна. Нийт хүн амын хэвийн байдлын шаардлагыг ихэвчлэн үл тоомсорлодог төв хязгаарын теорем.Үнэн хэрэгтээ, тоологч (3.10)-д байгаа түүврийн дундаж утгын зөрүүг ν > 30-ийн хувьд хэвийн тархсан гэж үзэж болно. Гэхдээ дисперсийн тэгш байдлын тухай асуултыг шалгахад хамаарахгүй бөгөөд Фишер туршилтыг илрүүлээгүй тул ялгааг тооцох боломжгүй. Гэсэн хэдий ч хангалттай нотлох баримтгүй ч гэсэн t-тест нь хүн амын дундах ялгааг илрүүлэхэд өргөн хэрэглэгддэг.

Доор авч үзнэ параметрийн бус шалгуур,ижил зорилгоор амжилттай ашиглаж байгаа бөгөөд ямар ч шаардлагагүй хэвийн байдал,аль нь ч биш хэлбэлзлийн тэгш байдал.

3.8. ХОЁР ДЭЭЖИЙН ПАРАМЕТР БУС ХАРИЛЦУУЛАЛТ: МАНН-УИТНИЙ ТЕСТ

Параметрийн бус шалгуурууд нь хоёр ерөнхий популяцийн тархалтын хуулиудын ялгааг илрүүлэх зорилготой юм. Ерөнхийдөө ялгааг мэдэрдэг шалгуурууд дунд,шалгуур гэж нэрлэдэг ээлж.Ерөнхийдөө ялгааг мэдэрдэг шалгуурууд тархалт,шалгуур гэж нэрлэдэг масштаб. Mann-Whitney тест нь шалгуур үзүүлэлтийг хэлнэ хяргахЭнэ нь дээжийг танилцуулсан хоёр популяцийн дундаж ялгааг илрүүлэхэд хэрэглэгддэг зэрэглэлийн хэмжүүр.Хэмжсэн тэмдгүүдийг энэ хуваарь дээр өсөх дарааллаар байрлуулж, дараа нь 1, 2 бүхэл тоогоор дугаарлана ... Эдгээр тоонуудыг нэрлэдэг. зэрэглэл.Тэнцүү утгыг ижил зэрэглэлээр өгдөг. Энэ нь шинж чанарын үнэ цэнэ биш, зөвхөн чухал зүйл юм энгийн газар,бусад үнэт зүйлсийн дунд эзэлдэг.

Хүснэгтэнд. 3.5. Хүснэгт 3.4-ийн эхний бүлгийг өргөтгөсөн хэлбэрээр (мөр 1) эрэмбэлсэн (мөр 2), дараа нь ижил утгуудын зэрэглэлийг арифметик дундаж утгуудаар солино. Жишээлбэл, эхний эгнээний 4, 4-р элементүүдэд 2, 3-р зэрэглэл өгсөн бөгөөд дараа нь 2.5-ын ижил утгатай сольсон.

Хүснэгт 3.5

Асуудлын томъёолол

Бие даасан дээж (X 1)болон (X 2)тархалтын хууль тодорхойгүй популяциас гаргаж авсан. Дээжийн хэмжээ n 1болон n 2тус тус. Дээжийн элементүүдийн утгыг энд үзүүлэв зэрэглэлийн хэмжүүр.Эдгээр ерөнхий популяци нь бие биенээсээ ялгаатай эсэхийг шалгах шаардлагатай юу?

Туршсан таамаглалууд:

H 0- дээж нь ижил нийтлэг популяцид хамаарах; H 1- дээж нь янз бүрийн ерөнхий популяцид хамаарна.

Ийм таамаглалыг шалгахын тулд (/-Mann-Whitney тестийг ашигладаг.

Нэгдүгээрт, элементүүдийг эрэмбэлсэн хоёр дээжээс хосолсон дээжийг (X) хийдэг. Дараа нь эхний түүврийн элементүүдэд тохирох зэрэглэлийн нийлбэр олдоно. Энэ нийлбэр нь таамаглалыг шалгах шалгуур юм.

У= Эхний түүврийн зэрэглэлийн нийлбэр. (3.11)

20-оос дээш бие даасан дээжийн хувьд утга Удуулгавартай байдаг хэвийн тархалт, хүлээгдэж буй үнэ цэнэба RMS нь тэнцүү байна:

Тиймээс эгзэгтэй бүсийн хил хязгаарыг хэвийн тархалтын хүснэгтийн дагуу олно.

Хүснэгтэнд үзүүлсэн жишээний хувьд. 3.4, бид дараахийг авна: ν 1 \u003d ν 2 \u003d 20 - 1 \u003d 19, У= 339, μ = 410, σ = 37. α = 0.05-ийн хувьд бид дараахь зүйлийг авна: зүүн = 338 ба баруун талд = 482.

Шалгуурын утга нь эгзэгтэй бүсийн зүүн хилээс давсан тул H 1 таамаглалыг хүлээн зөвшөөрч байна: ерөнхий популяци нь өөр өөр тархалтын хуультай байдаг. Үүний зэрэгцээ нийт хүн амын дундаж анхны дээжБАГА.

Тэдгээрийг түгээлтийн цуврал хэлбэрээр танилцуулж, форматтай байна.

Түгээлтийн цуврал нь бүлэглэлийн нэг төрөл юм.

Түгээлтийн хүрээ- судлагдсан популяцийн нэгжийг тодорхой өөр өөр шинж чанарын дагуу бүлэгт хуваарилахыг илэрхийлдэг.

Түгээлтийн цуваа үүсэх үндсэн шинж чанараас хамааран дараахь зүйлүүд байдаг атрибутив ба хэлбэлзэлтэйтүгээлтийн зэрэглэл:

  • атрибут- чанарын үндэслэлээр баригдсан түгээлтийн цувралыг дуудах.
  • Тоон шинж чанарын утгуудын өсөх эсвэл буурах дарааллаар бүтээгдсэн тархалтын цувааг нэрлэдэг. хувьсах.
Түгээлтийн вариацын цуврал нь хоёр баганаас бүрдэнэ.

Эхний баганад гэж нэрлэгддэг хувьсагчийн шинж чанарын тоон утгыг агуулна сонголтуудмөн тэмдэглэгдсэн байна. Дискрет хувилбар - бүхэл тоогоор илэрхийлнэ. Интервалын сонголт нь -аас болон хооронд байна. Хувилбаруудын төрлөөс хамааран салангид эсвэл интервалын вариацын цуваа байгуулах боломжтой.
Хоёр дахь баганад агуулагдаж байна хэмжээ тодорхой сонголт , давтамж эсвэл давтамжаар илэрхийлсэн:

Давтамжууд- эдгээр нь тухайн шинж чанарын өгөгдсөн утга нийлбэрт хэдэн удаа тохиолдож байгааг харуулсан үнэмлэхүй тоонууд бөгөөд . Бүх давтамжийн нийлбэр нь нийт хүн амын нэгжийн тоотой тэнцүү байх ёстой.

Давтамжууд() нь нийт дүнгийн хувиар илэрхийлсэн давтамж юм. Хувиар илэрхийлсэн бүх давтамжийн нийлбэр нь нэгийн бутархайгаар 100% -тай тэнцүү байх ёстой.

Түгээлтийн цувралын график дүрслэл

Түгээлтийн цувралуудыг график дүрслэлээр дүрсэлсэн болно.

Түгээлтийн цувралыг дараах байдлаар харуулав.
  • Олон өнцөгт
  • Гистограммууд
  • Хуримтлагдана
  • огивууд

Олон өнцөгт

Олон өнцөгтийг барихдаа хэвтээ тэнхлэгт (абсцисса) хувьсах шинж чанарын утгуудыг, босоо тэнхлэгт (ординат) давтамж эсвэл давтамжийг зурна.

Зураг дээрх олон өнцөгт. 6.1-ийг 1994 онд Оросын хүн амын бичил тооллогын дагуу барьсан.

6.1. Өрхийн тоо хэмжээгээр хуваарилах

Нөхцөл байдал: Нэг аж ахуйн нэгжийн 25 ажилчдыг тарифын ангиллаар хуваарилах мэдээллийг өгсөн болно.
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Даалгавар: Дискрет вариацын цуваа байгуулж, графикаар тархалтын полигон хэлбэрээр дүрсэл.
Шийдэл:
AT энэ жишээсонголтууд юм тарифын ангилалажилчин. Давтамжийг тодорхойлохын тулд зохих цалингийн ангилалтай ажилчдын тоог тооцоолох шаардлагатай.

Дискрет вариацын цувралд олон өнцөгтийг ашигладаг.

Түгээлтийн полигон (Зураг 1) байгуулахын тулд абсцисса (X) дагуу бид янз бүрийн шинж чанарын тоон утгыг - хувилбарууд, ординатын дагуу - давтамж эсвэл давтамжийг зурдаг.

Хэрэв шинж чанарын утгыг интервалаар илэрхийлсэн бол ийм цувралыг интервалын цуваа гэж нэрлэдэг.
интервал цувралтархалтыг графикаар гистограмм, хуримтлал эсвэл огив хэлбэрээр үзүүлэв.

Статистикийн хүснэгт

Нөхцөл байдал: Хадгаламжийн хэмжээ 20-ийн мэдээллийг өгсөн хувь хүмүүснэг банкинд (мянган рубль) 60; 25; 12; арав; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; арван найман; 7; 42.
Даалгавар: Тэнцүү интервалтай интервалын вариацын цуваа байгуул.
Шийдэл:

  1. Анхны популяци нь 20 нэгжээс бүрдэнэ (N = 20).
  2. Sturgess томъёог ашиглан бид тодорхойлно шаардлагатай хэмжээашигласан бүлгүүд: n=1+3.322*lg20=5
  3. Утгыг нь тооцоод үзье тэнцүү интервал: би \u003d (152 - 2) / 5 \u003d 30 мянган рубль
  4. Бид анхны хүн амыг 30 мянган рублийн интервалтай 5 бүлэгт хуваадаг.
  5. Бүлэглэлийн үр дүнг хүснэгтэд үзүүлэв.

Үргэлжилсэн шинж чанарыг ингэж бүртгэснээр ижил утга хоёр удаа (нэг интервалын дээд хязгаар ба өөр интервалын доод хязгаар гэх мэт) тохиолдох үед энэ утга нь дээд хязгаарын үүрэг гүйцэтгэдэг бүлэгт хамаарна.

баганат график

Абсцисса дагуу гистограмм байгуулахын тулд интервалуудын хилийн утгыг зааж, тэдгээрийн үндсэн дээр өндөр нь давтамж (эсвэл давтамж) -тай пропорциональ тэгш өнцөгтүүдийг байгуулна.

Зураг дээр. 6.2. 1997 онд Оросын хүн амын насны бүлгээр хуваарилах гистограммыг үзүүлэв.

Цагаан будаа. 6.2. ОХУ-ын хүн амын насны бүлгээр хуваарилалт

Нөхцөл байдал: Компанийн 30 ажилтны сарын цалингийн хэмжээгээр хуваарилалтыг өгсөн

Даалгавар: Интервалын вариацын цувааг графикаар гистограмм хэлбэрээр үзүүлж, хуримтлуулна.
Шийдэл:

  1. Нээлттэй (эхний) интервалын үл мэдэгдэх хилийг хоёр дахь интервалын утгаар тодорхойлно: 7000 - 5000 = 2000 рубль. Ижил утгатай бол бид эхний интервалын доод хязгаарыг олно: 5000 - 2000 = 3000 рубль.
  2. Гистограммыг тэгш өнцөгт координатын системд абсцисса тэнхлэгийн дагуу байгуулахын тулд утгууд нь хувилбарын цувралын интервалтай тохирч буй сегментүүдийг салгана.
    Эдгээр сегментүүд нь доод суурь болж үйлчилдэг бөгөөд харгалзах давтамж (давтамж) нь үүссэн тэгш өнцөгтүүдийн өндөрт үйлчилдэг.
  3. Гистограмм бүтээцгээе:

Хуримтлалыг бий болгохын тулд хуримтлагдсан давтамжийг (давтамж) тооцоолох шаардлагатай. Тэдгээр нь өмнөх интервалуудын давтамжийн (давтамж) дараалсан нийлбэрээр тодорхойлогддог бөгөөд S-ээр тэмдэглэгдсэн байна. Хуримтлагдсан давтамж нь хүн амын хэдэн нэгж нь авч үзэж буй хэмжээнээс ихгүй шинж чанартай болохыг харуулдаг.

Хуримтлуулах

Хуримтлагдсан давтамж (давтамж) -ын дагуу вариацын цуврал дахь шинж чанарын тархалтыг хуримтлалыг ашиглан дүрсэлсэн болно.

Хуримтлуулахэсвэл хуримтлагдсан муруй нь олон өнцөгтөөс ялгаатай нь хуримтлагдсан давтамж эсвэл давтамж дээр суурилдаг. Үүний зэрэгцээ шинж чанарын утгыг абсцисса тэнхлэг дээр байрлуулж, хуримтлагдсан давтамж эсвэл давтамжийг ординатын тэнхлэг дээр байрлуулна (Зураг 6.3).

Цагаан будаа. 6.3. Өрхүүдийн хуримтлагдсан хуваарилалт

4. Хуримтлагдсан давтамжийг тооцоол:
Эхний интервалын өвдөгний давтамжийг дараах байдлаар тооцоолно: 0 + 4 = 4, хоёр дахь нь: 4 + 12 = 16; гурав дахь нь: 4 + 12 + 8 = 24 гэх мэт.

Хуримтлалыг бий болгохдоо холбогдох интервалын хуримтлагдсан давтамжийг (давтамж) түүний дээд хязгаарт хуваарилдаг.

Огива

Огивахуримтлагдсан давтамжийг абсцисса тэнхлэгт, шинж чанарын утгыг ординат тэнхлэгт байрлуулах цорын ганц ялгаа нь хуримтлагдсантай ижил төстэй байдлаар бүтээгдсэн.

Хуримтлын өөрчлөлт нь концентрацийн муруй буюу Лоренцын график юм. Хоёр тэнхлэг дээр концентрацийн муруйг зурах тэгш өнцөгт системкоординат, хуваарийн хуваарийг 0-ээс 100 хүртэлх хувиар хэрэглэнэ. Энэ тохиолдолд абсцисса нь хуримтлагдсан давтамжийг, ордны тэмдэг нь тухайн шинж чанарын эзлэхүүний хувь хэмжээний хуримтлагдсан утгыг (хувиар) заана.

Тэмдгийн жигд тархалт нь график дээрх квадратын диагональтай тохирч байна (Зураг 6.4). Тэгш бус тархалттай бол график нь шинж чанарын концентрацийн түвшингээс хамаарч хонхор муруй юм.

6.4. концентрацийн муруй

Нийгэм, эдийн засгийн үзэгдэл, үйл явцыг судлах хамгийн чухал үе шат бол анхан шатны өгөгдлийг системчлэх, үүний үндсэн дээр ерөнхий статистикийн материалыг нэгтгэн бүлэглэх замаар олж авсан ерөнхий үзүүлэлтүүдийг ашиглан бүх объектын хураангуй шинж чанарыг олж авах явдал юм.

Статистикийн хураангуй - энэ нь багц бүрдүүлдэг тодорхой нэг баримтыг нэгтгэн дүгнэх, судалж буй үзэгдлийн онцлог шинж чанар, хэв маягийг бүхэлд нь тодорхойлох дараалсан үйлдлүүдийн цогц юм. Статистикийн хураангуйг явуулах нь орно Дараагийн алхмууд :

  • бүлэглэх онцлогийг сонгох;
  • бүлэг байгуулах дарааллыг тодорхойлох;
  • бүлгүүд болон объектыг бүхэлд нь тодорхойлох статистик үзүүлэлтүүдийн тогтолцоог боловсруулах;
  • хураангуй үр дүнг танилцуулах статистикийн хүснэгтийн схемийг боловсруулах.

Статистикийн бүлэглэл судлагдсан популяцийн нэгжийг тэдэнд зайлшгүй шаардлагатай тодорхой шинж чанарын дагуу нэгэн төрлийн бүлэгт хуваахыг нэрлэдэг. Бүлэглэх нь хамгийн чухал статистикийн аргастатистикийн мэдээллийг нэгтгэх, статистик үзүүлэлтүүдийг зөв тооцоолох үндэс.

Ялгах дараах төрлүүдБүлэглэл: типологи, бүтцийн, аналитик. Эдгээр бүх бүлэглэлүүд нь объектын нэгжүүд нь зарим шинж чанарын дагуу бүлэгт хуваагддагтай холбоотой юм.

бүлэглэх тэмдэг хүн амын нэгжийг тусдаа бүлэгт хуваах тэмдэг гэж нэрлэдэг. -аас зөв сонголтбүлэглэх онцлог нь статистикийн судалгааны дүгнэлтээс хамаарна. Бүлэглэх үндэс болгон чухал ач холбогдолтой, онолын хувьд үндэслэлтэй шинж чанаруудыг (тоон эсвэл чанарын) ашиглах шаардлагатай.

Бүлэглэх тоон шинж тэмдэг тоон илэрхийлэлтэй байх (арилжааны хэмжээ, хүний ​​нас, гэр бүлийн орлого гэх мэт), мөн бүлгийн чанарын шинж чанарууд хүн амын нэгжийн төлөв байдлыг тусгах (хүйс, гэр бүлийн байдал, аж ахуйн нэгжийн салбарын харьяалал, өмчийн хэлбэр гэх мэт).

Бүлэглэх үндэслэлийг тодорхойлсны дараа судалгаанд хамрагдсан хүн амыг хэдэн бүлэгт хуваах вэ гэдэг асуудлыг шийдэх хэрэгтэй. Бүлгүүдийн тоо нь судалгааны зорилго, бүлэглэлд хамаарах үзүүлэлтийн төрөл, популяцийн хэмжээ, шинж чанарын өөрчлөлтийн зэргээс хамаарна.

Жишээлбэл, аж ахуйн нэгжүүдийг өмчийн хэлбэрийн дагуу бүлэглэх нь хотын захиргаа, холбооны болон холбооны субъектуудын өмчийг харгалзан үздэг. Хэрэв бүлэглэл нь тоон үзүүлэлтээр хийгдсэн бол урвуу оруулах шаардлагатай Онцгой анхааралсудалж буй объектын нэгжийн тоо, бүлэглэх шинж чанарын хэлбэлзлийн зэрэг дээр.

Бүлгүүдийн тоог тодорхойлсны дараа бүлэглэх интервалыг тодорхойлох шаардлагатай. Интервал - эдгээр нь тодорхой хил хязгаарт оршдог хувьсах шинж чанарын утгууд юм. Интервал бүр өөрийн гэсэн утгатай, дээд ба доод хязгаар, эсвэл ядаж нэг нь байдаг.

Интервалын доод хязгаар интервал дахь шинж чанарын хамгийн бага утга гэж нэрлэдэг ба дээд хил - интервал дахь атрибутын хамгийн том утга. Интервалын утга нь дээд ба доод хязгаарын зөрүү юм.

Хэмжээнээс хамааран бүлэглэх интервалууд нь: тэнцүү ба тэгш бус байна. Хэрэв шинж чанарын өөрчлөлт нь харьцангуй нарийн хил хязгаарт илэрч, тархалт нь жигд байвал ижил интервалтай бүлэглэлийг байгуулна. Тэнцүү интервалын утгыг дараах томъёогоор тодорхойлно :

Энд Xmax, Xmin - нэгтгэсэн шинж чанарын хамгийн их ба хамгийн бага утгууд; n нь бүлгийн тоо юм.

Сонгосон бүлэг бүр нэг үзүүлэлтээр тодорхойлогддог хамгийн энгийн бүлэг бол түгээлтийн цуврал юм.

Статистикийн цувралхуваарилалт - энэ бол популяцийн нэгжийг тодорхой шинж чанарын дагуу бүлэгт хуваарилах явдал юм. Тархалтын цуваа үүсэх үндсэн шинж чанараас хамааран атрибутив ба вариацын тархалтын цувааг ялгадаг.

атрибут Тэд чанарын шинж чанарын дагуу баригдсан хуваарилалтын цувралыг, өөрөөр хэлбэл тоон илэрхийлэлгүй шинж тэмдгүүдийг (хөдөлмөрийн төрөл, хүйс, мэргэжлээр хуваарилах гэх мэт) гэж нэрлэдэг. Атрибутын тархалтын цуврал нь хүн амын бүтцийг нэг буюу өөр чухал шинж чанарын дагуу тодорхойлдог. Хэд хэдэн хугацаанд авсан эдгээр өгөгдөл нь бүтцийн өөрчлөлтийг судлах боломжийг бидэнд олгодог.

Хувилбарын эгнээ тоон үндсэн дээр баригдсан түгээлтийн цуврал гэж нэрлэдэг. Аливаа вариацын цуваа нь хувилбар ба давтамж гэсэн хоёр элементээс бүрдэнэ. Сонголтууд Вариацын цувралд авсан шинж чанарын бие даасан утгуудыг хувьсагчийн шинж чанарын тодорхой утга гэж нэрлэдэг.

Давтамжууд хувь хүний ​​хувилбарын тоо эсвэл вариацын цувралын бүлэг тус бүр гэж нэрлэгддэг, өөрөөр хэлбэл эдгээр нь тархалтын цувралд тодорхой хувилбарууд хэр олон удаа тохиолдож байгааг харуулдаг тоонууд юм. Бүх давтамжийн нийлбэр нь нийт хүн амын хэмжээ, түүний эзлэхүүнийг тодорхойлдог. Давтамжууд давтамжийг нэгжийн бутархайгаар эсвэл нийт дүнгийн хувиар илэрхийлдэг. Үүний дагуу давтамжийн нийлбэр нь 1 эсвэл 100% -тай тэнцүү байна.

Тухайн шинж чанарын өөрчлөлтийн шинж чанараас хамааран вариацын цувааны гурван хэлбэрийг ялгадаг: эрэмбэлэгдсэн цуврал, салангид цуврал, интервалын цуваа.

Эрэмбэлэгдсэн вариацын цуврал - энэ нь судалж буй шинж чанарын өсөх эсвэл буурах дарааллаар популяцийн бие даасан нэгжийн хуваарилалт юм. Эрэмбэлэх нь тоон өгөгдлийг бүлэгт хувааж, хамгийн жижиг, нэн даруй илрүүлэхэд хялбар болгодог хамгийн том үнэ цэнэонцлог, ихэвчлэн давтагддаг утгуудыг онцлон тэмдэглэ.

Дискрет вариацын цуврал зөвхөн бүхэл тоон утгыг авдаг салангид шинж чанарын дагуу популяцийн нэгжийн тархалтыг тодорхойлдог. Жишээлбэл, тарифын ангилал, гэр бүлийн хүүхдийн тоо, аж ахуйн нэгжийн ажилчдын тоо гэх мэт.

Хэрэв тэмдэг нь тодорхой хязгаарт ямар ч утгыг ("ээс - хүртэл") авч болох тасралтгүй өөрчлөлттэй бол энэ тэмдгийн хувьд та бүтээх хэрэгтэй. интервалын өөрчлөлтийн цуврал . Жишээлбэл, орлогын хэмжээ, ажлын туршлага, аж ахуйн нэгжийн үндсэн хөрөнгийн өртөг гэх мэт.

"Статистикийн хураангуй ба бүлэглэл" сэдвээр асуудлыг шийдвэрлэх жишээ

Даалгавар 1 . Өнгөрсөн хичээлийн жилд оюутнуудын захиалгаар хэдэн ном авсан талаарх мэдээлэл бий.

Цувралын элементүүдийг тэмдэглэсэн муж болон салангид вариацын тархалтын цуваа байгуул.

Шийдэл

Энэ иж бүрдэл нь оюутнуудын хүлээн авах номын тоог тохируулсан багц юм. Ийм хувилбаруудын тоог тоолж, тэдгээрийг вариацын зэрэглэл, вариацын хэлбэрээр байрлуулцгаая. салангид цувралхуваарилалт.

Даалгавар 2 . 50 аж ахуйн нэгжийн үндсэн хөрөнгийн үнэ цэнийн талаархи мэдээлэл байна, мянган рубль.

Аж ахуйн нэгжийн 5 бүлгийг (тэнцүү интервалаар) онцлон тэмдэглэсэн түгээлтийн цувралыг бүтээ.

Шийдэл

Шийдлийн хувьд бид аж ахуйн нэгжүүдийн үндсэн хөрөнгийн өртгийн хамгийн том, хамгийн бага утгыг сонгодог. Эдгээр нь 30.0 ба 10.2 мянган рубль юм.

Интервалын хэмжээг олоорой: h \u003d (30.0-10.2): 5 \u003d 3.96 мянган рубль.

Дараа нь эхний бүлэгт үндсэн хөрөнгийн хэмжээ нь 10.2 мянган рубль болох аж ахуйн нэгжүүд орно. 10.2 + 3.96 = 14.16 мянган рубль хүртэл. Ийм 9 аж ахуйн нэгж байх болно.Хоёр дахь бүлэгт үндсэн хөрөнгийн хэмжээ нь 14.16 мянган рубль болох аж ахуйн нэгжүүд орно. 14.16 + 3.96 = 18.12 мянган рубль хүртэл. Ийм 16 аж ахуйн нэгж байх болно.Үүний нэгэн адил бид гурав, дөрөв, тавдугаар бүлэгт багтсан аж ахуйн нэгжийн тоог олдог.

Үр дүнгийн хуваарилалтын цувралыг хүснэгтэд байрлуулна.

Даалгавар 3 . Хэд хэдэн аж ахуйн нэгжийн хувьд хөнгөн үйлдвэрдараах өгөгдлийг хүлээн авсан:

Аж ахуйн нэгжүүдийг ажилчдын тоогоор нь бүлэглэж, тэнцүү зайтайгаар 6 бүлэг байгуулна. Бүлэг тус бүрийг тоолно уу:

1. аж ахуйн нэгжийн тоо
2. ажилчдын тоо
3. жилд үйлдвэрлэсэн бүтээгдэхүүний хэмжээ
4. нэг ажилчинд ногдох дундаж бодит бүтээгдэхүүн
5. үндсэн хөрөнгийн хэмжээ
6. нэг аж ахуйн нэгжийн үндсэн хөрөнгийн дундаж хэмжээ
7. нэг аж ахуйн нэгжийн үйлдвэрлэсэн бүтээгдэхүүний дундаж үнэ

Тооцооллын үр дүнг хүснэгтэд бичнэ үү. Өөрийнхөө дүгнэлтийг гарга.

Шийдэл

Шийдлийн хувьд бид аж ахуйн нэгжийн ажилчдын дундаж тооноос хамгийн том, хамгийн бага утгыг сонгоно. Эдгээр нь 43 ба 256 юм.

Интервалын хэмжээг ол: h = (256-43): 6 = 35.5

Дараа нь эхний бүлэгт 43-43 + 35.5 = 78.5 хүний ​​дундаж тоотой аж ахуйн нэгжүүд орно. Ийм 5 аж ахуйн нэгж байх болно.Хоёр дахь бүлэгт ажилчдын дундаж тоо 78.5-аас 78.5 + 35.5 = 114 хүн байх аж ахуйн нэгжүүд орно. Ийм 12 аж ахуйн нэгж байх болно.Үүний нэгэн адил гурав, дөрөв, тав, зургадугаар бүлэгт багтсан аж ахуйн нэгжийн тоог олно.

Бид үр дүнгийн тархалтын цувралыг хүснэгтэд байрлуулж, бүлэг тус бүрт шаардлагатай үзүүлэлтүүдийг тооцоолно.

Дүгнэлт : Хүснэгтээс харахад хоёрдугаар бүлгийн аж ахуйн нэгжүүд хамгийн олон байдаг. Үүнд 12 аж ахуйн нэгж багтдаг. Хамгийн жижиг нь тав, зургаа дахь бүлэг (тус бүр хоёр аж ахуйн нэгж). Эдгээр нь хамгийн том аж ахуйн нэгжүүд юм (ажилчдын тооны хувьд).

Хоёр дахь бүлэг нь хамгийн олон байдаг тул энэ бүлгийн аж ахуйн нэгжүүдийн жилийн үйлдвэрлэлийн хэмжээ, үндсэн хөрөнгийн хэмжээ бусадтай харьцуулахад хамаагүй өндөр байна. Үүний зэрэгцээ энэ бүлгийн аж ахуйн нэгжүүдийн нэг ажилтны дундаж бодит бүтээгдэхүүн хамгийн өндөр биш байна. Дөрөвдүгээр бүлгийн аж ахуйн нэгжүүд энд тэргүүлж байна. Энэ бүлэгт мөн нэлээд их хэмжээний үндсэн хөрөнгө багтдаг.

Дүгнэж хэлэхэд бид үндсэн хөрөнгийн дундаж хэмжээ болон дундаж утганэг аж ахуйн нэгжийн үйлдвэрлэсэн бүтээгдэхүүн нь тухайн аж ахуйн нэгжийн хэмжээтэй (ажилчдын тоогоор) шууд пропорциональ байна.

Лаборатори №1

By математик статистик

Сэдэв: Туршилтын өгөгдлийг анхан шатны боловсруулалт

3. Оноогоор үнэлэх. нэг

5. тестийн асуултууд.. 2

6. Хэрэгжүүлэх арга лабораторийн ажил.. 3

Зорилго

Математик статистикийн аргаар эмпирик өгөгдлийг анхан шатны боловсруулалт хийх ур чадварыг эзэмших.

Туршилтын өгөгдлийн багц дээр үндэслэн дараахь ажлуудыг гүйцэтгэнэ.

Дасгал 1.Тархалтын интервалын вариацын цувралыг байгуул.

Даалгавар 2.Интервалын вариацын цувралын давтамжийн гистограммыг байгуул.

Даалгавар 3.Эмпирик тархалтын функц ба графикийг зохио.

a) горим ба медиан;

б) нөхцөлт эхний мөчүүд;

в) түүврийн дундаж;

г) түүврийн дисперс, залруулсан популяцийн дисперс, залруулсан дундаж стандарт хэлбэлзэл;

e) хэлбэлзлийн коэффициент;

д) тэгш бус байдал;

ж) хөших;

Даалгавар 5.Судалгаанд хамрагдсан тоон шинж чанаруудын жинхэнэ утгуудын хил хязгаарыг тодорхойлох санамсаргүй хувьсагчөгөгдсөн найдвартай байдлын дагуу.

Даалгавар 6.Асуудлын нөхцөл байдлын дагуу анхан шатны боловсруулалтын үр дүнг утга учиртай тайлбарлах.

Оноо оноо

Даалгавар 1-56 оноо

Даалгавар 62 оноо

Лабораторийн хамгаалалт(хяналтын асуулт, лабораторийн ажлын талаар аман ярилцлага) - 2 оноо

Бүтээлийг А4 хуудсан дээр бичгээр ирүүлсэн бөгөөд үүнд:

1) Гарчиг хуудас(Хавсралт 1)

2) Анхны өгөгдөл.

3) Заасан дээжийн дагуу ажлын танилцуулга.

4) Тооцооллын үр дүн (гараар гүйцэтгэсэн ба/эсвэл MS Excel програмыг ашиглан) заасан дарааллаар.

5) Дүгнэлт - асуудлын нөхцөл байдлын дагуу анхан шатны боловсруулалтын үр дүнгийн утга учиртай тайлбар.

6) аман ярилцлагаажил, хяналтын асуудлаар.



5. Аюулгүй байдлын асуултууд


Лабораторийн ажил гүйцэтгэх арга зүй

Даалгавар 1. Тархалтын интервалын вариацын цувааг байгуул

Статистикийн өгөгдлийг ижил зайтай хувилбар бүхий вариацын цуврал хэлбэрээр үзүүлэхийн тулд дараахь зүйлийг хийх шаардлагатай.

1. Анхны өгөгдлийн хүснэгтээс хамгийн бага ба хамгийн том утгыг ол.

2. Тодорхойлох хэлбэлзлийн хүрээ :

3. h интервалын уртыг тодорхойл, хэрэв түүвэрт 1000 хүртэлх өгөгдөл байгаа бол дараах томъёог ашиглана. , энд n - түүврийн хэмжээ - түүвэр дэх өгөгдлийн хэмжээ; lgn-ийг тооцоололд авна).

Тооцоолсон харьцааг хүртэл дугуйрсан байна тохиромжтой бүхэл тоо .

4. Тэгш тооны интервалын эхний интервалын эхлэлийг тодорхойлохын тулд утгыг авахыг зөвлөж байна; сондгой тооны интервалын хувьд .

5. Бүлэглэх интервалыг тэмдэглэж, хилийн өсөх дарааллаар байрлуул

, ,………., ,

эхний интервалын доод хязгаар хаана байна. Тохиромжтой тоо нь -ээс ихгүй байх ёстой бөгөөд сүүлийн интервалын дээд хязгаар нь -ээс багагүй байх ёстой. Интервалууд нь санамсаргүй хэмжигдэхүүний анхны утгуудыг агуулж, тэдгээрээс тусгаарлахыг зөвлөж байна 5-аас 20 хүртэлинтервалууд.

6. Бүлэглэх интервалын анхны өгөгдлийг бичнэ үү, i.e. заасан интервалд багтах санамсаргүй хэмжигдэхүүний утгын тоог анхны хүснэгтээс тооцоол. Хэрэв зарим утгууд интервалын хилтэй давхцаж байвал дараа нь тэдгээр нь зөвхөн өмнөх эсвэл зөвхөн дараагийн интервалд хамаарна.

Тайлбар 1.Интервалуудын уртыг тэнцүүлэх шаардлагагүй. Утга нь илүү нягтралтай байгаа газруудад жижиг богино интервалыг авах нь илүү тохиромжтой, бага давтамжтай бол илүү том байх болно.

Тайлбар 2.Хэрэв зарим утгын хувьд "тэг" буюу давтамжийн бага утгыг олж авсан бол интервалыг томруулж (алхамыг нэмэгдүүлэх) өгөгдлийг дахин бүлэглэх шаардлагатай.

Үүнтэй төстэй нийтлэлүүд

2022 parki48.ru. Бид хүрээ байшин барьж байна. Тохижилт. Барилга. Суурь.