поделился событием

Решил перенести сюда один из моих старых постов на ЖЖ. Его текст размещаю ниже:

Одним из важных предположений для корректного использования статистических выводов на основе t-таблицы в теории является предположение о том, что значения исследуемых данных имеют нормальное распределение. Ниже я дословно приведу мнение одного американского эксперта* по этому поводу.

«Теория, лежащая в основе построения доверительного интервала, основана на предположении, что в генеральной совокупности изучаемые данные имеют нормальное распределение. Такое упрощенное условие дает возможность использовать необходимые формулы и построить t-таблицу (что уже сделано для вас). К счастью, есть две причины, по которым на практике это требование не является столь критичным.

Во-первых, никогда нельзя точно сказать, является совокупность полностью нормально распределенной или нет, поскольку имеется только случайная выборка. Поэтому на практике обращаются к гистограмме данных, чтобы удостовериться, что распределение является приблизительно нормальным, т.е. не слишком асимметричным и без особо отличающихся экстремальных значений.

Во-вторых, часто помогает центральная предельная теорема. Поскольку статистический вывод основан главным образом на выборочном среднем, необходимо, чтобы в первую очередь выборочное распределение было распределено приблизительно нормально. Центральная предельная теорема утверждает, что если число наблюдений достаточно велико, выборочное среднее будет распределено приблизительно нормально, даже если отдельные элементы в генеральной совокупности (и в выборке) не распределены нормально.

Итак, можно сформулировать следующее правило для практического применения.

Изучите гистограмму данных. Если она выглядит приблизительно нормально, то всё в порядке (т.е. доверительный интервал приблизительно корректен). Если гистограмма немного асимметрична, то необходимо иметь не очень малую выборку. Если гистограмма немного асимметрична или имеет несколько умеренно отличающихся значений, то необходимо иметь выборку большого размера. Если гистограмма сильно асимметрична или имеет большие экстремальные значения, то это должно вызвать беспокойство. »

Цитата из книги "Практическая бизнес-статистика / Эндрю Ф. Сигел, 2008 г." 

Эндрю Ф. Сигел - профессор факультета менеджмента и финансов школы бизнеса университета штата Вашингтон, Сиэтл. Он также является адъюнкт-профессором факультета статистики и факультета молекулярной биотехнологии, имеет звание доктора философии по статистике Станфордского университета (1977 г.), магистра наук по математике Станфордского университета (1975 г.) и бакалавра по математике и физике (с отличием) Бостонского университета (1973 г.).  Смотреть более подробную информацию о специалисте

Поделиться:
Комментарии0
Нет комментариев