Свойства и способы расчета средних арифметических величин. Абсолютные показатели вариации Определить м среднюю арифметическую по способу моментов
Наиболее часто в характеристике вариационного ряда используют среднюю арифметическую.
Различают три вида средней арифметической: простая, взвешенная и вычисленная по способу моментов. Средняя арифметическая, которая рассчитана в вариационном ряду, где каждая варианта встречается только 1 раз называется средней арифметической простой (табл. 4) .Ее определяют по формуле:
где М – средняя арифметическая,
V – варианта изучаемого признака,
n –число наблюдений.
Если в исследуемом ряду одна или несколько вариант повторяются несколько раз, то вычисляют среднюю арифметическую взвешенную (табл. 2) , когда учитывается вес каждой варианты в зависимости от частоты ее встречаемости. Расчет такой средней проводят по формуле:
где М – средняя арифметическая взвешенная;
∑ - знак суммы;
V – варианты (числовые значения изучаемого признака);
P – частота, с которой встречается одна и та же варианта признака, т.е. сумма вариант с данным значением признака;
n – число наблюдений, т.е., сумма всех частот или общее число всех вариант (∑p).
Таблица 4
(Расчет простой средней арифметической)
ЧИСЛО СТУДЕНТОВ (p) | |
∑V = 691 | n = 9 |
M = уд/мин. |
Пример: при определений среднего пульса у студентов перед экзаменом следует сначала вычислить ∑ V * p, а затем среднюю величинуM = = 76,9 уд/мин.(табл. 5).
Нередко при большом числе наблюдений для вычисления средней арифметической взвешенной используют сгруппированный вариационный (или разбитый на равные интервалы) ряд. Такой вариационный ряд должен быть непрерывным, варианты, расположенные в определенном порядке (возрастания или убывания), следуют друг за другом.
Таблица 5
Определение среднего пульса у студентов-мужчин перед экзаменом
(Расчет взвешенной средней арифметической)
ПУЛЬС У СТУДЕНТОВ-МУЖЧИН (V) | ЧИСЛО СТУДЕНТОВ (p) | V * p |
∑p = n = 26∑V * p = 2000 M = = 76,9 уд/мин. |
При группировке вариационного ряда следует учитывать, что интервал выбирает исследователь, величина интервала зависит от цели и задач исследования.
Число групп в сгруппированном вариационном ряду определяют в зависимости от числа наблюдений.При числе наблюдений от 31 до 100 рекомендуется иметь 5-6 групп, от 101 до 300 - от 6 до 8 групп, от 300 до 1000 наблюдений можно использовать от 10 до 15 групп. Расчет интервала (i) проводится по формеле:i = ,
Vmax – максимальное значение варианты,
Vmin – минимальное значение варианты.
Расчет средней взвешенной в сгруппированном ряду (или интервальном ряду требует определения середины интервала, которую вычисляют как полусуммукрайных значений группы.(табл. 3). Расчет средней величины производят по формуле: M = = =176,7см.(табл. 6).
Таблица 6
(Расчет взвешенной средней арифметическойв сгруппированном ряду)
ЦЕНТРАЛЬНАЯ ВАРИАНТА ГРУППЫ (V 1), СМ. | ЧИСЛО СТУДЕНТОВ (p) | V 1 ∙ p | |
162 = 167 = 172 = 177 = 182 187 | |||
∑p = n =212 ∑ V 1 ∙ p = 37469 M = = = 176,74 см. |
В случаях, когда варианты представлены большими числами (например, масса тела новорожденных в граммах) и имеется число наблюдений, выраженное сотнями или тысячами случаев, взвешенная средняя арифметическая может быть вычислена по способу моментов (табл. 7) по формуле:
гдеA – условно взятая средняя величина (чаще всего в качестве условной средней берется Мо);
∑ - знак суммы;
α – отклонение каждой варианты в интервалах от условной средней =
p – частота (число раз, с которым встречается одна и та же варианта признака).
αp – произведение отклонения (α) на частоту (p);
n – число наблюдений, т.е. сумма всех частот или общее число всех вариант (∑p).
i – величина интервала = (Vmax – максимальное значение варианты, Vmin – минимальное значение варианты).
Таким образом, средняя взвешенная вычисленная по способу моментов, составила 176,74 см., что практический совпало с расчетами средней обычным методом – 176,7 см.. Однако при вычислений средней по способу моментов используют простые цифры, вычисление менее громоздки, что значительно облегчает и ускоряет расчеты.
Средняя арифметическая (средняя взвешенная) имеет ряд свойств , которые используют в некоторых случаях для упрощения расчета средней и получения ориентировочной величины.
1. Средняя арифметическая занимает срединное положение в строго симметричном вариационном ряду (M = M 0 = M e) .
2. Средняя арифметическая имеет абстрактный характер и является обобщающей величиной, выявляющей закономерность.
3. Алгебраическая сумма отклонений всех вариант от средней равна нулю: ∑ (V - M) = 0. На этом свойстве основан расчет средней по способу моментов.
Таблица 7
Определение среднего роста студентов-мужчин 20-22 лет
(Методика расчета средней арифметической величины по способу моментов, i = 5)
РОСТ СТУДЕНТОВ-МУЖЧИН (V), СМ. | ЦЕНТРАЛЬНАЯ ВАРИАНТА ГРУППЫ (V 1), СМ. | ЧИСЛО СТУДЕНТОВ (p) | α = | a ∙ p | |
160-164 165-169 170-174 175-179 180-184 185-189 | ∑p = n =212 | -3 -2 -1 +1 +2 | -12 -42 -47 +54 +36 ∑a∙p = -11 | ||
M= 177 + | |||||
Различают три вида средних величин: мода (М0), медиана (Ме), средняя арифметическая (М).
Они не могут подменить друг друга и лишь в совокупности достаточно полно и в сжатой форме представляют собой особенности вариационного ряда.
Мода (Мо) - наиболее часто встречающаяся в ряду распределения варианта. Она дает представление о центре распределения вариационного ряда. Используется:
Для определения центра распределения в открытых вариационных рядах
Для определения среднего уровня в рядах с резко асимметричным распределением
Медиана - это серединная варианта, центральный член ранжированного ряда. Название медиана взято из геометрии, где так именуется линия, делящая сторону треугольника на две равные части.
Медиана применяется:
Для определения среднего уровня признака в числовых рядах с неравными интервалами в группах
Для определения среднего уровня признака, когда исходные данные представлены в виде качественных признаков и когда единственным способом указать некий центр тяжести совокупности является указание варианты (группы вариант), которая занимает центральное положение
При вычислении некоторых демографических показателей (средней продолжительности предстоящей жизни)
При определении наиболее рационального места расположения учреждений здравоохранения, коммунальных учреждений и т. п. (имеется в виду учет оптимальной удаленности учреждений от всех объектов обслуживания)
В настоящее время очень распространены различные опросы (маркетинговые, социологические и др.), в которых опрашиваемых просят выставить баллы изделиям, политикам и т. п. Затем из полученных оценок рассчитывают средние баллы и рассматривают их как интегральные оценки, выставленные коллективом опрошенных. При этом обычно для определения средних показателей применяют среднее арифметическое. Однако такой способ на самом деле применять нельзя. Обоснованным в этом случае является использование в качестве средних баллов медианы или моды.
Для характеристики среднего уровня признака наиболее часто используется в медицине средняя арифметическая величина (М).
Средняя арифметическая величина - это общая количественная характеристика определенного признака изучаемых явлений, составляющих качественно однородную статистическую совокупность.
Различают среднюю арифметическую простую и взвешенную.
Средняя арифметическая простая вычисляется для не сгруппированного вариационного ряда путем суммирования всех вариант и делением этой суммы на общее количество вариант, входящих в вариационный ряд.
Вычисляется средняя арифметическая простая по формуле:
М - средняя арифметическая взвешенная,
∑Vp - сумма произведений вариант на их частоты,
n - число наблюдений.
Помимо указанного метода прямого расчета средней арифметической взвешенной, существуют другие методы, в частности, способ моментов при котором несколько упрощены арифметические расчеты.
Расчет средней арифметической способом моментов проводится по формуле:
М = А + | ∑dp |
n |
А - условная средняя (чаще всего в качестве условной средней берется мода М0)
d - отклонение каждой варианты от условной средней (V-A)
∑dp - сумма произведений отклонений на их частоту.
Порядок вычисления представлен в таблице (за условную среднюю принимаем М0 = 76 ударам в минуту).
частота пульса V | Р | d (V-A) | dp |
-16 | -16 | ||
-14 | -28 | ||
-12 | -36 | ||
-10 | -30 | ||
-8 | -24 | ||
-6 | -54 | ||
-4 | -24 | ||
-2 | -14 | ||
n= 54 | | ∑dp= -200 |
где i - интервал между группами.
Порядок вычисления представлен в табл. (за условную среднюю принимаем М 0 = 73 ударам в минуту, где i = 3)
Определение средней арифметической способом моментов
n = 54 ∑dp = -13
М = А + | ∑dp | = | 73+ | -13*3 | = 73 - 0,7=72,3 (ударов в минуту |
n |
Таким образом, полученное значение средней арифметической величины по способу моментов идентично таковому, найденному обычным способом.
Где А – условный нуль, равный варианте с максимальной частотой (середина интервала с максимальной частотой), h – шаг интервала,
Назначение сервиса . С помощью онлайн-калькулятора вычисляется среднее значение по способу моментов. Результат решения оформляется в формате Word .
Инструкция . Для получения решения необходимо заполнить исходные данные и выбрать параметры отчета для оформления в Word.
Алгоритм нахождения средней по способу моментов
Пример . Затраты рабочего времени на однородную технологическую операцию распределялись между рабочими следующим образом:
Требуется определить среднюю величину затрат рабочего времени и среднеквадратическое отклонение по способу моментов; коэффициент вариации; моду и медиану.Таблица для расчета показателей.
Группы | Середина интервала, x i | Кол-во, f i | x i ·f i | Накопленная частота, S | (x-x ) 2 ·f |
5 - 10 | 7.5 | 20 | 150 | 20 | 4600.56 |
15 - 20 | 17.5 | 25 | 437.5 | 45 | 667.36 |
20 - 25 | 22.5 | 50 | 1125 | 95 | 1.39 |
25 - 30 | 27.5 | 30 | 825 | 125 | 700.83 |
30 - 35 | 32.5 | 15 | 487.5 | 140 | 1450.42 |
35 - 40 | 37.5 | 10 | 375 | 150 | 2200.28 |
150 | 3400 | 9620.83 |
Мода
где x 0 – начало модального интервала; h – величина интервала; f 2 –частота, соответствующая модальному интервалу; f 1 – предмодальная частота; f 3 – послемодальная частота.
Выбираем в качестве начала интервала 20, так как именно на этот интервал приходится наибольшее количество.
Наиболее часто встречающееся значение ряда – 22.78 мин.
Медиана
Медианным является интервал 20 - 25, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).
Таким образом, 50% единиц совокупности будут меньше по величине 23 мин.
.
Находим А = 22.5, шаг интервала h = 5.
Средний квадрат отклонений по способу моментов .
x ц | x * i | x * i f i | 2 f i |
7.5 | -3 | -60 | 180 |
17.5 | -1 | -25 | 25 |
22.5 | 0 | 0 | 0 |
27.5 | 1 | 30 | 30 |
32.5 | 2 | 30 | 60 |
37.5 | 3 | 30 | 90 |
5 | 385 |
мин.
Среднее квадратическое отклонение .
мин.
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
Поскольку v>30% ,но v<70%, то вариация умеренная.
Пример
Для оценки ряда распределения найдем следующие показатели:Средняя взвешенная
Среднее значение изучаемого признака по способу моментов .
где А – условный нуль, равный варианте с максимальной частотой (середина интервала с максимальной частотой), h – шаг интервала.
При большом числе наблюдений или при большом числовом значении вариант применяют
упрощенный способ вычисления средней арифметической- способ моментов.
М = А+ iSар
где М - средняя арифметическая; А - условная средняя; i - интервал между группами вариант;
S - знак суммирования.; а- условное отклонение каждой варианты от условной средней;
р - частота встречаемости вариант; n - число наблюдений.
Пример вычисления средней арифметической по способу моментов (средней массы тела
юношей в возрасте 18 лет)
V(n в кг) | Р | а (V-А) | а. Р |
+2 | +4 | ||
+1 | +3 | ||
М о =62 | |||
-1 | -6 | ||
-2 | -8 | ||
-3 | -3 | ||
п = 25 | Sар = - 10кг |
Этапы расчета средней по способу моментов:
2) определяем "а" - условное отклонение варианты от условной средней, для этого из каждой варианты вычитаем условную среднюю: а = V - А, (например, а = 64 - 62 = +2 и т.д.).
3) умножаем условное отклонение "а" на частоту "р" каждой варианты и получаем произведение а р;
4) находим сумму Sа. р = - 10кг
5) рассчитываем среднюю арифметическую по способу моментов:
М = А + i SаР = 62 - 1×0,4 = 61,6кг
Таким образом, можно сделать вывод, что в изучаемой нами группе юношей средняя масса тела
Средняя арифметическая сама по себе ничего не говорит о том вариационном ряде, из которого
она была вычислена. На ее типичность (достоверность) влияет однородность рассматриваемого
материала и колеблемость ряда.
Пример: даны два одинаковых по числу наблюдений вариационных ряда, в которых
представлены данные измерений окружности головы детей в возрасте от 1 года до 2-х лет
Имея одинаковое число наблюдений и одинаковые средние арифметические (М= 46 см), ряды
имеют различия в распределении внутри. Так варианты первого ряда отклоняются в целом от
средней арифметической с меньшим значением, чем варианты второго ряда, что дает
возможность предположить, что средняя арифметическая (46 см) более типична для первого
ряда, чем для второго.
В статистике для характеристики разнообразия вариационного ряда употребляют среднее
квадратическое отклонение (s)
Существует два способа расчета среднего квадратического отклонения: среднеарифметический
способ и способ моментов. При среднеарифметическом способе расчета применяют формулу:
где d истинное отклонение каждой варианты от истиной средней М. Формула используется при
небольшом числе наблюдений (п <30)
Формула для определения s по способу моментов:
где а - условное отклонение варианты от условной средней ;
Момент второй степени, а момент первой степени, возведенный в квадрат.
Теоретически и практически доказано, что если при большом числе наблюдений к средней
арифметической прибавить и отнять от нее 1s (М ± 1s), то в пределах полученных величин
будет находится 68,3% всех вариант вариационного ряда. Если к средней арифметической
прибавить и отнять 2s (М± 2s), то в пределах полученных величин будет находиться 95,5%
всех вариант. М ±3s включает в себя 99,7% всех вариант вариационного ряда.
Исходя из этого положения можно проверить типичность средней арифметической для
вариационного ряда, из которого она была вычислена. Для этого надо к средней
арифметической прибавить и от нее отнять утроенную s (М± 3s). Если в полученные пределы
данный вариационный ряд укладывается, то средняя арифметическая типична, т.е. она
выражает основную закономерность ряда и ей можно пользоваться.
Указанное положение широко применяется при выработке различных стандартов (одежды,
обуви, школьной мебели и т.д).
Степень разнообразия признака в вариационном ряду можно оценить по коэффициенту
вариации (отношение среднего квадратического отклонения к средней арифметической,
умноженное на 100%)
С v = s х 100
При С v менее 10% отмечается слабое разнообразие, при С v 10-20% - среднее, а при более 20% -
сильное разнообразие признака.
Оценка достоверности реультатов статистического исследования
Как мы уже говорили, самые надежные результаты можно получать при применении
сплошного метода т.е. при изучении генеральной совокупности.
Между тем изучение генеральной совокупности связано со значительной трудоемкостью.
Поэтому в медико-биологических исследованиях, как правило, проводятся выборочные
наблюдения. С тем, чтобы полученные при изучении выборочной совокупности данные можно
было перенести на генеральную совокупность, необходимо провести оценку достоверности
результатов статистического исследования. Выборочная совокупность может недостаточно
полно представлять генеральную совокупность, поэтому выборочным наблюдениям всегда
сопутствует ошибка репрезентативности. По размерам средней ошибки (m) можно судить,
насколько найденная выборочная средняя величина отличается от средней генеральной
совокупности. Малая ошибка указывает на близость этих показателей, большая ошибка такой
уверенности не дает.
На величину средней ошибки средней арифметической влияют следуюие два обстоятельства.
Во-первых, однородность собранного материала: чем меньше разбросанность вариант вокруг
своей средней, тем меньше ошибка репрезентативности. Во-вторых, число наблюдений:
средняя ошибка будет тем меньше, чем больше число наблюдений.
Средняя ошибка средней арифметической вычисляетсяя по следующей формуле:
Средняя ошибка (ошибка репрезентативности) для относительных величин определяется по
формуле:
где m p - средняя ошибка показателя;
р - показатель в % или в % о
q - (100 -р), (1000 -р)
n - общее число наблюдений
Из лечебного учреждения выбыло 289 больных, из них умерло 12.
Относительная величина (показатель летальности) р = (12:289)х100 = 4,1%; q=100 -р =
100-4,1 =95,9, откуда
m p = ±
Таким образом, относительная величина при повторном исследовании будет соответствовать
Доверительные границы - это максимальное и минимальное значение в пределах которого
при заданной степени вероятности безошибочного прогноза может находиться относительный
показатель или средняя величина в генеральной совокупности
Доверительные границы относительной величины в генеральной совокупности определяют по
Р ген = Р выб ± tm m
Доверительные границы средней арифметической в генеральной совокупности определяется по формуле:
М ген = М выб ± tm m
где Р ген и М ген - значения относительной и средней величины, полученные для генеральной
совокупности.
Р выб и М выб - значения относительной и средней величины, полученные для выборочной совокупности.
m р и m m - ошибка репрезентативности для средних и относительных величин.
t - критерий достоверности.
Установлено, что если t= 1, достоверность не превышает 68%; если t=2 -95%; если t=3- 99%
При медицинских и биологических исследованиях считается достаточным, если критерий
достоверности t ³ 2(достоверность 95%)
Чтобы найти критерий t при числе наблюдений £ 30 необходимо воспользоваться специальной
таблицей
С уменьшением величины ошибки репрезентативности уменьшаются доверительные границы
средних и относительных величин, т.е.уточняются результаты исследования, приближаясь к
соответствующим величинам генеральной совокупности. Если ошибка репрезентативности
большая, то получают большие доверительные границы, которые могут противоречить
логической оценке искомой величины в генеральной совокупности. Доверительные границы
зависят также от избранной исследователем степени вероятности безошибочного прогноза. При
большой степени вероятности безошибочного прогноза размах доверительных границ
М ср - рассчитанная при помощи метода моментов = 61,6 кг
Средняя арифметическая величина обладает тремя свойствами.
1. Средняя занимает серединное положение в вариационном ряду . В строго симметричном ряду: М = М 0 =М е.
2. Средняя является обобщающей величиной и за средней не видны случайные колебания, различия в индивидуальных данных, она вскрывает то типичное, что характерно для всей совокупности . К средней обращаются всякий раз, когда надо исключить случайное влияние отдельных факторов, выявить общие черты, существующие закономерности, получить полное и глубокое представление о наиболее общих и характерных особенностях всей группы.
3. Сумма отклонений всех вариант от средней равна нулю : S (V-M)= 0 . Это происходит потому, что средняя величина превышает размеры одних вариант и меньше размеров других вариант.
Иначе говоря, истинное отклонение вариант от истинной средней (d =v-М) может быть положительной и отрицательной величиной, поэтому сумма S всех "+"d и "-"d равна нулю.
Данное свойство средней используется при проверке правильности расчетов М. Если сумма отклонений вариант от средней равна нулю, то можно сделать вывод, что средняя вычислена правильно. На этом свойстве основан способ моментов для определения М. Ведь если условная средняя А будет равна истинной М, то сумма отклонений вариант от условной средней будет равна нулю.
Роль средних величин в биологии чрезвычайно велика. С одной стороны их используют для характеристики явлений в целом, с другой - они необходимы для оценки отдельных величин. При сравнении отдельных величин со средними получают ценные характеристики для каждой из них. Использование средних величин требует строгого соблюдения принципа однородности совокупности. Нарушение этого принципа искажает представление о реальных процессах.
Вычисление средних из неоднородной в социально-экономическом отношении совокупности делает их фиктивными, искаженными. Следовательно, для того чтобы правильно использовать средние величины, надо быть уверенным в том, что они характеризуют однородные статистические совокупности.
ХАРАКТЕРИСТИКА РАЗНООБРАЗИЯ ПРИЗНАКА В
СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ
Величина того или иного признака неодинакова у всех членов совокупности, несмотря на ее относительную однородность. Например, в группе детей, однородной по возрасту, полу и месту жительства, рост каждого ребенка отличается от роста сверстников. То же можно сказать о числе посещений, сделанных отдельными лицами в поликлинику, об уровне белка крови у каждого больного ревматизмом, об уровне артериального давления у отдельных лиц, больных гипертонической болезнью и т. п. В этом проявляется разнообразие, колеблемость признака в изучаемой совокупности. Вариабельность демонстративно можно представить на примере роста в группах подростков.
Статистика позволяет охарактеризовать это специальными критериями, определяющими уровень разнообразия каждого признака в той или иной группе. К таким критериям относятся лимит (lim), амплитуда ряда (Am), среднее квадратическое отклонение (s) и коффициент вариации (C v). Так как каждый из этих критериев имеет свое самостоятельное значение, то следует остановиться на них отдельно.
Лимит - определяется крайними значениями вариант в вариационном ряду
Амплитуда (Am) - разность крайних вариант
Лимит и амплитуда - дают определенную информацию о степени разнообразия роста в каждой группе. Однако как лимит, так и амплитуда ряда обладает одним существенным недостатком. Они учитывают только разнообразие крайних вариант и не позволяют получить информацию о разнообразии признака в совокупности с учетом ее внутренней структуры. Дело в том, что разнообразие проявляется не столько в крайних вариантах, сколько при анализе всей внутренней структуры группы. Поэтому этими критериями можно пользоваться для приближенной характеристики разнообразия, особенно при малом числе наблюдений (n<30).
Наиболее полную характеристику разнообразию признака в совокупности дает так называемое среднее квадратическое отклонение , обозначаемое греческой буквой "сигма" - s.
Существует два способа расчета среднего квадратического отклонения : среднеарифметический и способ моментов .
При среднеарифметическом способе расчета применяют формулу, где d - истинное отклонение вариант от истинной средней (V-M).
Формула используется при небольшом числе наблюдений (n<30), когда в вариационном ряду все частоты р= 1.
При р > 1 используют формулу такого вида:
При наличии вычислительной техники эту формулу применяют и при большом количестве наблюдений.
Эта формула предназначена для определения "сигмы" по способу моментов:
где: a - условное отклонение от условной средней (V-A ); p - частота встречаемости для варианты; n - число вариант; i - величина интервала между группами.
Этот способ применяется в тех случаях, когда нет вычислительной техники, а вариационный ряд громоздкий как за счет большого числа наблюдений, так и за счет вариант, выраженных многозначными числами. При числе наблюдений, равном 30 и менее, в моменте второй степени п заменяют за (п -1).
Как видно из формулы среднего квадратичного отклонения (4), в знаменателе стоит (п -1), т.е. при числе наблюдений, равном или меньшем 30 (n£30), необходимо в знаменатель формулы брать (п -1). Если при определении средней арифметической М учитывают все элементы ряда, то, рассчитывая а, надо брать не все случаи, а на единицу меньше (п-1).
При большом числе наблюдений (n>30) в знаменатель формулы берут п, так как единица не изменяет результаты расчета и поэтому автоматически опускается.
Следует обратить внимание на то, что среднее квадратическое отклонение - именованная величина , поэтому оно должно иметь обозначение, общее для вариант и средней арифметической величины (размерность – кг, см. км и др).
Расчет среднего квадратического отклонения по способу моментов производится после расчета средней величины.
Существует еще один критерий, характеризующий уровень разнообразия величин признака в совокупности, - коэффициент вариации .
Коэффициент вариации (Сv) - является относительной мерой разнообразия, так как исчисляется как процентное отношение среднего квадратического отклонения (а) к средней арифметической величине (М). Формула коэффициента вариации такова:
Для ориентировочной оценки степени разнообразия признака пользуются следующими градациями коэффициента вариации. Если коэффициент составляет более 20%, то отмечают сильное разнообразие; при 20-10% - среднее, и если коэффициент менее 10%, то считают, что разнообразие слабое.
Коэффициент вариации применяют при сравнении степени разнообразия признаков, имеющих различия в величине признаков или неодинаковую их размерность. Допустим, необходимо сравнить степень разнообразия массы тела у новорожденных и 5-летних детей. Понятно, что у новорожденных "сигма" всегда будет меньше, чем у семилетних детей, так как меньше их индивидуальная масса. Среднее квадратическое отклонение будет меньше там, где меньше величина самого признака. В этом случае для определения различия в степени разнообразия необходимо ориентироваться не на среднее квадратическое отклонение, а на относительную меру разнообразия - коэффициент вариации Сv.
Большое значение коэффициент вариации также имеет для оценки и сопоставления степени разнообразия нескольких признаков с разной размерностью. По среднему квадратическому отклонению нельзя еще судить о различии в степени разнообразия указанных признаков. Для этого необходимо использовать коэффициент вариации – Сv.
Среднее квадратическое отклонение связано со структурой ряда распределения признака. Схематично это можно изобразить следующим образом.
Теорией статистики доказано, что при нормальном распределении в пределах М±s находится 68% всех случаев, в пределах М±2s - 95,5% всех случаев, а в пределах М±3s - 99,7% всех случаев, составляющих совокупность. Таким образом, М±3s охватывает почти весь вариационный ряд.
Это теоретическое положение статистики о закономерностях структуры ряда имеет огромное значение для практического применения среднего квадратического отклонения. Можно воспользоваться этим правилом для выяснения - вопроса о типичности средней величины. Если 95% всех вариант находятся в пределах М±2s, то средняя - является характерной для данного ряда и не требуется увеличивать число наблюдений в совокупности. Для определения типичности средней сравнивается фактическое распределение с теоретическим, путем расчета сигмальных отклонений.
Практическое значение среднего квадратического отклонения заключается также в том, что зная М и s , можно построить необходимые вариационные ряды для практического использования. Сигму (s ) также используют для сравнения степени разнообразия однородных признаков, например при сравнении колебаний (вариабельности) роста детей в городе и селе местности. Зная сигму (s ), можно рассчитать коэффициент вариации (Сv), необходимой для сравнения степени разнообразия признаков, выраженных в различных единицах измерения (сантиметрах, килограммах и др.). Это позволяет выявить более устойчивые (постоянные) и менее устойчивые признаки в совокупности.
Сравнивая коэффициенты вариации (C v), можно сделать выводы о том, что является наиболее устойчивым признаком в совокупности признаков. Среднее квадратическое отклонение (s) используется также для оценки отдельных признаков у одного объекта. Стандартное отклонение указывает, на сколько сигм (s ) от средней (М) отклоняются индивидуальные измерения.
Среднее квадратическое отклонение (s) может быть использовано в биологии и экологии при разработке проблем нормы и патологии.
Наконец, среднее квадратическое отклонение является важным компонентом формулы т м - средней ошибки средней арифметической (ошибки репрезентативности):
где т м - средняя ошибка средней арифметической величины (ошибка репрезентативности), п - число наблюдений.
Репрезентативность. Важнейшие теоретические основы репрезентативности были освещены выше в разделе, посвященном выборочной и генеральной совокупности. Репрезентативность означает представительность в выборочной совокупности всех учитываемых признаков (пол, возраст, профессия, стаж и др.) единиц наблюдения, составляющих генеральную совокупность. Достигается эта репрезентативность выборочной совокупности по отношению к генеральной с помощью специальных методов отбора, которые излагаются ниже.
Оценка достоверности результатов исследования базируется на теоретических основах репрезентативности.
ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ
Под достоверностью статистических показателей следует понимать степень их соответствия отображаемой ими действительности. Достоверными результатами считаются те, которые не искажают и правильно отражают объективную реальность.
Оценить достоверность результатов исследования означает определить, с какой вероятностью возможно перенести результаты, полученные на выборочной совокупности, на всю генеральную совокупность.
В большинстве исследований исследователю приходится, как правило, иметь дело с частью изучаемого явления, а выводы по результатам такого исследования переносить на все явление в целом - на генеральную совокупность.
Таким образом, оценка достоверности необходима для того, чтобы по части явления должно было бы судить о явлении в целом, о его закономерностях.
Оценка достоверности результатов исследования предусматривает определение:
1) ошибок репрезентативности (средних ошибок средних арифметических и относительных величин) - т ;
2) доверительных границ средних (или относительных) величин;
3) достоверности разности средних (или относительных) величин
(по критерию
t
);
4) достоверности различия сравниваемых групп по критерию c 2 .
1. Определение средней ошибки средней (или относительной) величины (ошибки репрезентативности) - т.
Ошибка репрезентативности (m ) является важнейшей статистической величиной, необходимой для оценки достоверности результатов исследования. Эта ошибка возникает в тех случаях, когда требуется по части охарактеризовать явление в целом. Эти ошибки неизбежны. Они проистекают из сущности выборочного исследования; генеральная совокупность может быть охарактеризована по выборочной совокупности только с некоторой погрешностью, измеряемой ошибкой репрезентативности.
Ошибки репрезентативности нельзя смешивать с обычным представлением об ошибках: методических, точности измерения, арифметических и др.
По величине ошибки репрезентативности определяют, насколько результаты, полученные при выборочном наблюдении, отличаются от результатов, которые могли бы быть получены при проведении сплошного исследования всех без исключения элементов генеральной совокупности.
Этот единственный вид ошибок, учитываемых статистическими методами, которые не могут быть устранены, если не осуществлен переход на сплошное изучение. Ошибки репрезентативности можно свести к достаточно малой величине, т. е. к величине допустимой погрешности. Делается это путем привлечения в выборку достаточного количества наблюдений (п).
Каждая средняя величина - М (средняя длительность лечения, средний рост, средняя масса тела, средний уровень белка крови и др.), а также каждая относительная величина - Р (уровень летальности, заболеваемости и др.) должны быть представлены со своей средней ошибкой - т. Так, средняя арифметическая величина выборочной совокупности (М) имеет ошибку репрезентативности, которая называется средней ошибкой средней арифметической (m м) и определяется по формуле:
Как видно из этой формулы, величина средней ошибки средней арифметической прямо пропорциональна степени разнообразия признака и обратно пропорциональна корню квадратному из числа наблюдений. Следовательно, уменьшение величины этой ошибки при определении степени разнообразия (s ) возможно путем увеличения числа наблюдений.
На этом принципе основан метод определения достаточного числа наблюдений для выборочного исследования.
Относительные величины (Р), полученные при выборочном исследовании, также имеют свою ошибку репрезентативности, которая называется средней ошибкой относительной величины и обозначается m р
Для определения средней ошибки относительной величины (Р) используется следующая формула:
где Р - относительная величина. Если показатель выражен в процентах, то q=100-P, если Р- в промиллях, то q=1000-P, если Р- в продецимиллях, то q= 10000-Р и т.д.; п - число наблюдений. При числе наблюдений менее 30 в знаменатель следует взять (п – 1 ).
Каждая средняя арифметическая или относительная величина, полученная на выборочной совокупности, должна быть представлена со своей средней ошибкой. Это дает возможность" рассчитать доверительные границы средних и относительных величин, а также определить достоверность разности сравниваемых показателей (результатов исследования).