Читать книгу Проведение статистического анализа на языке программирования R в медико-биологических исследованиях. Учебное пособие - - Страница 11
2. НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
2.1.2. Вычисление среднего квадратического отклонения
ОглавлениеСреднее квадратическое отклонение является статистической характеристикой, показывающей степень близости отдельных значений к средней величине (чем меньше среднее квадратическое отклонение, тем лучше средняя величина описывает исследуемую переменную). Среднее квадратическое отклонение генеральной совокупности значений вычисляется как (4):
где N – полное количество исследований в генеральной совокупности; x̅ – среднее значение исследуемой величины; xi – фактическое значение, полученное при измерении величины.
В большинстве случаев исследователь имеет дело не с генеральной совокупностью (всей популяцией), а с выборочной ее частью. Среднее квадратическое отклонение для выборки из генеральной совокупности вычисляется как (5):
Оценки верны для случаев, когда исследуемые переменные имеют количественную природу, и данные принадлежат к нормальному закону распределения. Иллюстрация среднего квадратического отклонения представлена на рисунке 5.
Рисунок 5 – Белой вертикальной линией отмечено выборочное среднее значение данных, распределенных по нормальному (Гауссову) закону. Расстояние от белой вертикальной линии до зеленой (влево или вправо) задается средним квадратическим отклонением
В случае, если исследователю необходимо оценить среднее квадратическое отклонение вероятности возникновения признака, то составляется уравнение (6):
где p̂ – вероятность возникновения исследуемого признака:
где N – общее количество значений, обладающих различными признаками; n – количество исследований, обладающих анализируемым признаком.
На языке программирования R для вычисления среднего квадратического значения применяется функция sd () из пакета stats. В случае данных, распределенных по нормальному закону, выборочное среднее квадратическое отклонение будет соответствовать рисунку 5.
Пример вычисления среднего квадратического отклонения
Для примера проведения вычислений среднего квадратического отклонения используем набор данных anorexia из пакета MASS.
Листинг 4
library (MASS) #Подключаем пакет MASS, содержащий набор данных anorexia
#========================================================
#Выделяем из набора данных подгруппы пациентов с разным типом лечения
#========================================================
contData <– anorexia [anorexia$Treat==«Cont», ] $Prewt
cbtData <– anorexia [anorexia$Treat==«CBT», ] $Prewt
ftData <– anorexia [anorexia$Treat==«FT», ] $Prewt
#=====================================================
#Вычисляем среднее квадратическое отклонение веса пациента до
# прохождения лечения
Продолжение листинга 4
#=====================================================
sd (contData)
#====================================================
# Результат вычисления в контрольной группе
#====================================================
[1] 5.70706
#====================================================
sd (cbtData)
#====================================================
# Результат вычисления в группе с когнитивно-поведенческой терапией
#=====================================================
[1] 4.845495
#========================================================
sd (ftData)
#=====================================================
# Результаты вычислений в группе с семейной терапией
#=====================================================
[1] 5.016693
#=====================================================
# Вычисляем количество пациентов до прохождения лечения
#=====================================================
lenPrewt <– length (anorexia$Prewt) #Общее количество данных
lenContPrew <– length (anorexia [anorexia$Treat==«Cont», ] $Prewt) # Количество
# данных в контрольной группе
lenCBTPrewt <– length (anorexia [anorexia$Treat==«CBT», ] $Prewt) # Количество
# данных в группе с когнитивно-поведенческой терапией
lenBTPrew <– length (anorexia [anorexia$Treat==«FT», ] $Prewt) # Количество
# данных в группе с семейной терапией
Продолжение листинга 4
#========================================================
# Вычисляем доли пациентов в каждой группе
#=====================================================
pCP <– lenContPrew/ lenPrewt # Доля в контрольной группе
pCBTP <– lenCBTPrewt/ lenPrewt # Доля в когнитивно-поведенческой группе
pBTP <– lenBTPrew/lenPrewt # Доля в семейной группе
#========================================================
sdCP <– sqrt47 (pCP* (1-pCP)) # Среднее квадратичное отклонение долей в
# контрольной группе.
sdCBT <– sqrt (pCBTP* (1- pCBTP))
sdBT <– sqrt (pBTP* (1- pBTP))
#=====================================================
# Результаты вычисления
#=====================================================
print (sdCP)
#=====================================================
[1] 0.4803227
#=====================================================
print (sdCBT)
#=====================================================
[1] 0.4904568
#=====================================================
print (sdBT)
#=====================================================
[1] 0.4246912
47
Функция sqrt () используется для вычисления квадратного корня из количественной величины.