Тарифы Услуги Сим-карты

Таблица распределения стьюдента онлайн калькулятор. Основные статистики и t-критерий Стьюдента

Одним из наиболее известных статистических инструментов является критерий Стьюдента. Он используется для измерения статистической значимости различных парных величин. Microsoft Excel обладает специальной функцией для расчета данного показателя. Давайте узнаем, как рассчитать критерий Стьюдента в Экселе.

Но, для начала давайте все-таки выясним, что представляет собой критерий Стьюдента в общем. Данный показатель применяется для проверки равенства средних значений двух выборок. То есть, он определяет достоверность различий между двумя группами данных. При этом, для определения этого критерия используется целый набор методов. Показатель можно рассчитывать с учетом одностороннего или двухстороннего распределения.

Расчет показателя в Excel

Теперь перейдем непосредственно к вопросу, как рассчитать данный показатель в Экселе. Его можно произвести через функцию СТЬЮДЕНТ.ТЕСТ . В версиях Excel 2007 года и ранее она называлась ТТЕСТ . Впрочем, она была оставлена и в позднейших версиях в целях совместимости, но в них все-таки рекомендуется использовать более современную — СТЬЮДЕНТ.ТЕСТ . Данную функцию можно использовать тремя способами, о которых подробно пойдет речь ниже.

Способ 1: Мастер функций

Проще всего производить вычисления данного показателя через Мастер функций.


Выполняется расчет, а результат выводится на экран в заранее выделенную ячейку.

Способ 2: работа со вкладкой «Формулы»

Функцию СТЬЮДЕНТ.ТЕСТ можно вызвать также путем перехода во вкладку «Формулы» с помощью специальной кнопки на ленте.


Способ 3: ручной ввод

Формулу СТЬЮДЕНТ.ТЕСТ также можно ввести вручную в любую ячейку на листе или в строку функций. Её синтаксический вид выглядит следующим образом:

СТЬЮДЕНТ.ТЕСТ(Массив1;Массив2;Хвосты;Тип)

Что означает каждый из аргументов, было рассмотрено при разборе первого способа. Эти значения и следует подставлять в данную функцию.

После того, как данные введены, жмем кнопку Enter для вывода результата на экран.

Как видим, вычисляется критерий Стьюдента в Excel очень просто и быстро. Главное, пользователь, который проводит вычисления, должен понимать, что он собой представляет и какие вводимые данные за что отвечают. Непосредственный расчет программа выполняет сама.

Метод позволяет проверить гипотезу о том, что средние значения двух ге-неральных совокупностей, из которых извлечены сравниваемые зависимые вы-борки, отличаются друг от друга. Допущение зависимости чаще всего значит, что признак измерен на одной и той же выборке дважды, например, до воз-действия и после него. В общем же случае каждому представителю одной вы-борки поставлен в соответствие представитель из другой выборки (они по-парно объединены) так, что два ряда данных положительно коррелируют друг с другом. Более слабые виды зависимости выборок: выборка 1 — мужья, вы-борка 2 — их жены; выборка 1 — годовалые дети, выборка 2 составлена из близнецов детей выборки 1, и т. д.

Проверяемая статистическая гипотеза, как и в предыдущем случае, Н 0: М 1 = М 2 (средние значения в выборках 1 и 2 равны). При ее отклонении принимается альтернативная гипотеза о том, что М 1 больше (меньше) М 2 .

Исходные предположения для статистической проверки:

Каждому представителю одной выборки (из одной генеральной совокупно-сти) поставлен в соответствие представитель другой выборки (из другой генеральной совокупности);

Данные двух выборок положительно коррелируют (образуют пары);

Распределение изучаемого признака и в той и другой выборке соответству-ет нормальному закону.

Структура исходных данных: имеется по два значения изучаемого признака для каждого объекта (для каждой пары).

Ограничения: распределения признака и в той, и в другой выборке должно суще-ственно не отличаться от нормального; данные двух измерений, соответству-ющих той и другой выборке, положительно коррелируют.

Альтернативы: критерий Т-Вилкоксона , если распределение хотя бы для одной выборки существенно отличается от нормального; критерий t-Стьюдента для независимых выборок — если данные для двух выборок не корре-лируют положительно.

Формула для эмпирического значения критерия t-Стьюдента отражает тот факт, что единицей анализа различий является разность (сдвиг) значений при-знака для каждой пары наблюдений. Соответственно, для каждой из N пар значений признака сначала вычисляется разность d i = х 1 i - x 2 i .

где M d - средняя разность значений; σ d - стандартное отклонение разностей.

Пример расчета:

Предположим, в ходе проверки эффективности тренинга каждому из 8 членов груп-пы задавался вопрос «Насколько часто твое мнение совпадаете мнением группы?» — дважды, до и после тренинга. Для ответов использовалась 10-балльная шкала: 1 — никогда, 5 — в половине случаев, 10 — всегда. Проверялась гипотеза о том, что в результате тренинга самооценка конформизма (стремления быть как другие в группе) участников возрастет (α = 0,05). Составим таблицу для промежуточных вычислений (таблица 3).


Таблица 3

Среднее арифметической для разности M d = (-6)/8 = -0,75. Вычтем это значение из каждого d (предпоследний столбец таблицы).

Формула для стандартного отклонения отличается лишь тем, что вместо Х в ней фигурирует d. Подставляем все нужные значения, получаем:

σ d = = 0,886.

Ш а г 1. Вычисляем эмпирическое значение критерия по формуле (3): средняя раз-ность M d = -0,75; стандартное отклонение σ d = 0,886; t э = 2,39; df = 7.

Шаг 2. Определяем по таблице критических значений критерия t-Стьюдента р-уровень значимости. Для df = 7 эмпирическое значение находится меж-ду критическими для р = 0,05 и р — 0,01. Следовательно, р < 0,05.

df Р
0,05 0,01 0,001
2,365 3,499 5,408

Шаг 3. Принимаем статистическое решение и формулируем вывод. Статистичес-кая гипотеза о равенстве средних значений отклоняется. Вывод: показатель само-оценки конформизма участников после тренинга увеличился статистически досто-верно (на уровне значимости р < 0,05).

К параметрическим методам относится и сравнение дисперсий двух выборок по критерию F-Фишера . Иногда этот метод приводит к ценным содержатель-ным выводам, а в случае сравнения средних для независимых выборок срав-нение дисперсий является обязательной процедурой.

Для вычисления F эмп нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе.

Сравнение дисперсий . Метод позволяет проверить гипотезу о том, что дисперсии двух генераль-ных совокупностей, из которых извлечены сравниваемые выборки, отлича-ются друг от друга. Проверяемая статистическая гипотеза Н 0: σ 1 2 = σ 2 2 (дисперсия в выборке 1 равна дисперсии в выборке 2). При ее отклонении принимается альтернативная гипотеза о том, что одна дисперсия больше другой.

Исходные предположения : две выборки извлекаются случайно из разных ге-неральных совокупностей с нормальным распределением изучаемого признака.

Структура исходных данных: изучаемый признак измерен у объектов (ис-пытуемых), каждый из которых принадлежит к одной из двух сравниваемых выборок.

Ограничения: распределения признака и в той, и в другой выборке суще-ственно не отличаются от нормального.

Альтернатива методу: критерий Ливена (Levene"sTest), применение которого не требует проверки предположения о нормальности (используется в программе SPSS).

Формула для эмпирического значения критерия F-Фишера:

(4)

где σ 1 2 большая дисперсия, a σ 2 2 — меньшая дисперсия. Так как заранее не известно, какая дисперсия больше, то для определения р-уровня применяется Таблица критических значений для ненаправленных альтернатив. Если F э > F Kp для соответствующего числа степеней свободы, то р < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

Пример расчета:

Детям давались обычные арифметические задания, после чего одной случайно выбранной половине учащихся сообщали, что они не выдержали испытания, а ос-тальным — обратное. Затем у каждого ребенка спрашивали, сколько секунд ему потребовалось бы для решения аналогичной задачи. Экспериментатор вычислял разность между называемым ребенком временем и результатом выполненного за-дания (в сек.). Ожидалось, что сообщение о неудаче вызовет некоторую неадекват-ность самооценки ребенка. Проверяемая гипотеза (на уровне α = 0,005) состояла в том, что дисперсия совокупности самооценок не зависит от сообщений об удаче или неудаче (Н 0: σ 1 2 = σ 2 2).

Были получены следующие данные:

Ш а г 1. Вычислим эмпирическое значение критерия и числа степеней свободы по формулам (4):

Шаг 2. По таблице критических значений критерия f-Фишера для ненаправлен-ных альтернатив находим критическое значение для df числ = 11; df знам = 11. Однако критическое значение есть только для df числ = 10 и df знам = 12. Боль-шее число степеней свободы брать нельзя, поэтому берем критическое значение для df числ = 10: Для р = 0,05 F Kp = 3,526; для р = 0,01 F Kp = 5,418.

Шаг 3. Принятие статистического решения и содержательный вывод. Поскольку эмпирическое значение превышает критическое значение для р = 0,01 (и тем бо-лее — для р = 0,05), то в данном случае р < 0,01 и принимается альтернативная гипо-теза: дисперсия в группе 1 превышает дисперсию в группе 2 (р < 0,01). Следователь-но, после сообщения о неудаче неадекватность самооценки выше, чем после сооб-щения об удаче.

Таблица распределения Стьюдента

Таблицы интеграла вероятностей используются для выборок большого объема из бесконечно большой генеральной совокупности. Но уже при (n ) < 100 получается Несоответствие между

табличными данными и вероятностью предела; при (n ) < 30 погрешность становится значительной. Несоответствие вызывается главным образом характером распределения единиц генеральной совокупности. При большом объеме выборки особенность распределения в гене-

ральной совокупности не имеет значения, так как распределение отклонений выборочного показателя от генеральной характеристики при большой выборке всегда оказывается нормаль-

ным. В выборках небольшого объема (n ) < 30 характер распределения генеральной совокупности сказывается на распределении ошибок выборки. Поэтому для расчета ошибки выборки при небольшом объеме наблюдения (уже менее 100 единиц) отбор должен проводиться из со-

вокупности, имеющей нормальное распределение. Теория малых выборок разработана английским статистиком В. Госсетом (писавшим под псевдонимом Стьюдент) в начале XX в. В

1908 г. им построено специальное распределение, которое позволяет и при малых выборках соотносить (t ) и доверительную вероятность F(t ). При (n ) > 100, таблицы распределения Стьюдента дают те же результаты, что и таблицы интеграла вероятностей Лапласа, при 30 < (n ) <

100 различия незначительны. Поэтому практически к малым выборкам относят выборки объемом менее 30 единиц (безусловно, большой считается выборка с объемом более 100 единиц).

Использование малых выборок в ряде случаев обусловлено характером обследуемой совокупности. Так, в селекционной работе «чистого» опыта легче добиться на небольшом числе

делянок. Производственный и экономический эксперимент, связанный с экономическими затратами, также проводится на небольшом числе испытаний. Как уже отмечалось, в случае малой выборки только для нормально распределенной генеральной совокупности могут быть рассчитаны и доверительные вероятности, и доверительные пределы генеральной средней.

Плотность вероятностей распределения Стьюдента описывается функцией.

1 + t2

f (t ,n) := Bn

n − 1

t - текущая переменная;n - объем выборки;

B - величина, зависящая лишь от (n ).

Распределение Стьюдента имеет только один параметр: (d.f. ) -число степеней свободы (иногда обозначается (к )). Это распределение - как и нормальное, симметрично относительно точки (t ) = 0, но оно более пологое. При увеличении объема выборки, а, следовательно, и числа степеней свободы распределение Стьюдента быстро приближается к нормальному. Число степеней свободы равно числу тех индивидуальных значений признаков, которыми нужно рас-

полагать для определения искомой характеристики. Так, для расчета дисперсии должна быть известна средняя величина. Поэтому при расчете дисперсии применяют (d.f. )= n - 1 .

Таблицы распределения Стьюдента публикуются в двух вариантах:

1. аналогично таблицам интеграла вероятностей приводятся значения (t ) и соответствую-

щие вероятности F(t ) при разном числе степеней свободы;

2. значения (t ) приводятся для наиболее употребляемых доверительных вероятностей

0,70; 0,75; 0,80; 0,85; 0,90; 0,95 и 0,99 или для 1 - 0,70 = 0,3; 1 - 0,80 = 0,2; …… 1 - 0,99 = 0,01.

3. при разном числе степеней свободы. Такого рода таблица приведена в приложении

(Таблица 1 - 20 ), а также значение (t )- критерий Стьюдента при уровне значимости от0,7

​ t-критерий Стьюдента – общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.

1. История разработки t-критерия

Данный критерий был разработан Уильямом Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны, статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).

2. Для чего используется t-критерий Стьюдента?

t-критерий Стьюдента используется для определения статистической значимости различий средних величин. Может применяться как в случаях сравнения независимых выборок (например, группы больных сахарным диабетом и группы здоровых ), так и при сравнении связанных совокупностей (например, средняя частота пульса у одних и тех же пациентов до и после приема антиаритмического препарата ).

3. В каких случаях можно использовать t-критерий Стьюдента?

Для применения t-критерия Стьюдента необходимо, чтобы исходные данные имели нормальное распределение . В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства (гомоскедастичности) дисперсий .

При несоблюдении этих условий при сравнении выборочных средних должны использоваться аналогичные методы непараметрической статистики , среди которых наиболее известными являются U-критерий Манна - Уитни (в качестве двухвыборочного критерия для независимых выборок), а также критерий знаков и критерий Вилкоксона (используются в случаях зависимых выборок).

4. Как рассчитать t-критерий Стьюдента?

Для сравнения средних величин t-критерий Стьюдента рассчитывается по следующей формуле:

где М 1 - средняя арифметическая первой сравниваемой совокупности (группы), М 2 - средняя арифметическая второй сравниваемой совокупности (группы), m 1 - средняя ошибка первой средней арифметической, m 2 - средняя ошибка второй средней арифметической.

5. Как интерпретировать значение t-критерия Стьюдента?

Полученное значение t-критерия Стьюдента необходимо правильно интерпретировать. Для этого нам необходимо знать количество исследуемых в каждой группе (n 1 и n 2). Находим число степеней свободы f по следующей формуле:

f = (n 1 + n 2) - 2

После этого определяем критическое значение t-критерия Стьюдента для требуемого уровня значимости (например, p=0,05) и при данном числе степеней свободы f по таблице (см. ниже ).

Сравниваем критическое и рассчитанное значения критерия:

  • Если рассчитанное значение t-критерия Стьюдента равно или больше критического, найденного по таблице, делаем вывод о статистической значимости различий между сравниваемыми величинами.
  • Если значение рассчитанного t-критерия Стьюдента меньше табличного, значит различия сравниваемых величин статистически не значимы.

6. Пример расчета t-критерия Стьюдента

Для изучения эффективности нового препарата железа были выбраны две группы пациентов с анемией. В первой группе пациенты в течение двух недель получали новый препарат, а во второй группе - получали плацебо. После этого было проведено измерение уровня гемоглобина в периферической крови. В первой группе средний уровень гемоглобина составил 115,4±1,2 г/л, а во второй - 103,7±2,3 г/л (данные представлены в формате M±m ), сравниваемые совокупности имеют нормальное распределение. При этом численность первой группы составила 34, а второй - 40 пациентов. Необходимо сделать вывод о статистической значимости полученных различий и эффективности нового препарата железа.

Решение: Для оценки значимости различий используем t-критерий Стьюдента, рассчитываемый как разность средних значений, поделенная на сумму квадратов ошибок:

После выполнения расчетов, значение t-критерия оказалось равным 4,51. Находим число степеней свободы как (34 + 40) - 2 = 72. Сравниваем полученное значение t-критерия Стьюдента 4,51 с критическим при р=0,05 значением, указанным в таблице: 1,993. Так как рассчитанное значение критерия больше критического, делаем вывод о том, что наблюдаемые различия статистически значимы (уровень значимости р<0,05).

В ходе рассмотрения примера мы будем использовать вымышленные сведения, чтобы читатель мог провести необходимые преобразования самостоятельно.

Так, допустим, в ходе исследований изучали влияние препарата А на содержание вещества В (в ммоль/г) в ткани С и концентрацию вещества D в крови (в ммоль/л) у пациентов, разделенных по какому-то признаку Е на 3 группы равного объема (n = 10). Результаты такого выдуманного исследования приведены в таблице:

Содержание вещества B, ммоль/г

Вещество D, ммоль/л

прирост концентрации


Хотим вас предупредить, что выборки объема 10 рассматриваются нами для простоты представления данных и вычислений, на практике такого объема выборок обычно оказывается недостаточно для формирования статистического заключения.

В качестве примера рассмотрим данные 1-го столбца таблицы.

Описательные статистики

Выборочное среднее

Среднее арифметическое, которое очень часто называют просто «среднее», получают путем сложения всех значений и деления этой суммы на число значений в наборе. Это можно показать с помощью алгебраической формулы. Набор n наблюдений переменной x можно изобразить как x 1 , x 2 , х 3 , ..., x n

Формула для определения среднего арифметического наблюдений (произносится «икс с чертой»):

= (Х 1 + Х 2 + ... + X n) / n

= (12 + 13 + 14 + 15 + 14 + 13 + 13 + 10 + 11 + 16) / 10 = 13,1;

Выборочная дисперсия

Один из способов измерения рассеяния данных за­ключается в том, чтобы определить степень отклоне­ния каждого наблюдения от средней арифметической. Очевидно, что чем больше отклонение, тем больше изменчивость, вариабельность наблюдений. Однако мы не можем использовать среднее этих отклоненийкак меру рассеяния, потому что положительные от­клонения компенсируют отрицательные отклонения (их сумма равна нулю). Чтобы решить эту проблему, мы возводим в квадрат каждое отклонение и находим среднее возведенных в квадрат отклонений; эта величина называется вариацией, или дисперсией. Возьмем n наблюдений x 1 , x 2 , х 3 , ..., x n , средняя которых равняется . Вычисляем диспер сию, обычно обозначаемую как s 2 , этих наблюдений:

Выборочная дисперсия данного показателя равна s 2 = 3,2.

Среднеквадратичное отклонение

Стандартное (среднеквадратичное) отклоне­ние — это положительный квадратный корень из дисперсии. На примере n наблюдений это выглядит следующим образом:

Мы можем представить себе стандартное отклоне­ние как своего рода среднее отклонение наблюдений от среднего. Оно вычисляется в тех же единицах (размерностях), что и исходные данные.

s = sqrt (s 2) = sqrt (3,2) = 1,79 .

Коэффициент вариации

Если разделить стандартное отклонение на сред­нее арифметическое и выразить результат в процен­тах, то получится коэффициент вариации.

CV = (1,79 / 13,1) * 100% = 13,7

Ошибка выборочного среднего

1,79 / sqrt (10) = 0,57 ;

Коэффициент Стьюдента t (одновыборочный t-критерий)

Применяется для проверки гипотезы об отличии среднего значения от некоторого известного значения m

Количество степеней свободы рассчитывается как f=n-1.

В данном случае доверительный интервал для среднего заключен между границами 11,87 и 14,39.

Для уровня доверительной вероятности 95% m=11,87 или m=14,39, то есть= |13,1-11,82| = |13,1-14,38| = 1,28

Соответственно, в данном случае для числа степеней свободы f = 10 - 1 = 9 и уровня доверительной вероятности 95% t=2,26.

Диалог Основные статистики и таблицы

В модуле Основные статистики и таблицы выберем Описательные статистики .

Откроется диалоговое окно Описательные статистики .

В поле Перменные выберем Группу 1 .

Нажав на Ок , получим таблицы результатов с описательными статистиками выбранных переменных.

Откроется диалоговое окно Одновыборочный t-критерий .

Предположим, нам известно, что среднее содержание вещества B в ткани С равно 11.

Таблица результатов с описательными статистиками и t-критерием Стьюдента выглядит следующим образом:

Нам пришлось отвергнуть гипотезу о том, что среднее содержание вещества В в ткани С равно 11.

Так как вычисленное значение критерия больше табличного (2,26), нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборкой и известной величиной признаются статистически значимыми. Таким образом, вывод о существовании различий, сделанный с помощью критерия Cтьюдента, подтверждается с помощью данного метода.