3.1. Выборка. Эмпирическая функция распределения Пусть в некотором опыте наблюдается случайная величина Х с функцией распределения F(x). И пусть однократное осуществление опыта позволяет нам найти одно из возможных ее значений. Предположим, что опыт в одних и тех же условиях можно повторять какое угодно число раз, и что сами опыты (испытания) являются независимыми. Результаты рассматриваемых n опытов представляют собой последовательность x1, x2, … , xn действительных чисел, которая называется выборкой объема n. Такова практическая трактовка выборки. Каждое xi (i=1, 2, …, n) называется вариантой(элементом выборки, наблюденным значением, значением признака). Полученные в результате n опытов наблюдаемые значения x1, x2 xn представляют собой выборку из всей совокупности значений, которые может принимать интересующая нас величина Х. Принято говорить, что мы имеем дело с набором значений, соответствующим некоторой выборке из генеральной совокупности. Рассматриваемая выборка должна обладать свойством репрезентативности (представительности), то есть быть такой, чтобы по ее данным можно было получить правильное представление об всей генеральной совокупности в целом. Будет рассматриваемая выборка репрезентативной или нет – это зависит от способа отбора. В математической литературе слово «выборка» гораздо чаще используется в другом смысле. Конкретную выборкуx1, x2, …, xn мы можем рассматривать как реализацию значений системы случайных величин (X1, X2, …, Xn), распределенных одинаково, по тому же закону, что и Х. Выборкой объема n из распределения случайной величины Х называется последовательность x1, x2, …, xnнезависимых и одинаково распределенных – по тому же закону, что и Х – случайных величин. Часто в практических ситуациях возникает следующая задача: имеется выборка и отсутствует всякая информация о виде функции распределения F(x). Требуется построить оценку (приближение) для этой неизвестной функции F(x). Наиболее предпочтительной оценкой функции F(x) является эмпирическая функция распределения Fn(x), которая определяется следующим образом , где nx – число вариант меньших х (х принадлежит R), n – объем выборки. Функция Fn(x) служит хорошим приближением для неизвестной функции распределения для больших n. Пример 3.1. Анализировалась среднемесячная выручка (тыс. руб.) в 5 магазинах торговой организации. Результаты представлены в табл. 3.1. Таблица 3.1 Номер магазина | Выручка, тыс.р. | 1 | 205 | 2 | 255 | 3 | 195 | 4 | 220 | 5 | 235 |
Построим выборочную функцию распределения по данным табл. 3.1. Объем выборки по условию равен 5, т.е. n = 5. Наименьшая варианта равна 195, следовательно, F5(х) = 0 при х ≤ 195. Значение X < 205, а именно х1 = 195 наблюдалось один раз; следовательно, . Значение X < 220, а именно х1 = 195 и х2 = 205 наблюдалось два раза; следовательно, . Значение X < 235, а именно х1 = 195, х2 = 205 и х3 = 220 наблюдалось три раза; следовательно, . Значение X < 255, а именно х1 = 195, х2 = 205, х3 = 220 и х4 = 235 наблюдалось четыре раза; следовательно, . Так как Х = 255 – наибольшая варианта, то F5(х) = 1 при х > 255. Окончательно имеем График эмпирической функции распределения изображен на рис. 3.1. Рис. 3.1.3.2. Построение интервального вариационного ряда распределения При большом числе наблюдений (n ≥ 20) выборка перестает быть удобной формой записи – она становится слишком громоздкой и мало наглядной. Поэтому первичные данные (выборка) нуждаются в обработке, которая всегда начинается с их группировки. Рассмотрим группировку на конкретном примере. В таблице 3.2. приведены данные выручки магазина (тыс. руб.) за 90 дней.
Таблица 3.2 Выручка магазина, тыс. руб. 24,9 | 32,2 | 26,3 | 39,9 | 26,1 | 33 | 24,1 | 35,6 | 26,1 | 35,4 | 42 | 34,3 | 39,5 | 29,4 | 38,1 | 29,3 | 30,1 | 26,2 | 30,9 | 21,8 | 41,1 | 23 | 34,2 | 25 | 28,9 | 22,7 | 30,2 | 30,8 | 23,1 | 30,7 | 39,1 | 36,1 | 26,4 | 35,8 | 18,1 | 33,1 | 22,1 | 30,3 | 22,2 | 29,1 | 38,4 | 20,7 | 30,4 | 31,1 | 32,3 | 27,1 | 31,1 | 22,9 | 53,6 | 26,5 | 26,1 | 29,3 | 29,9 | 30,2 | 35,8 | 25,1 | 27,1 | 19,9 | 29,1 | 32,3 | 41,7 | 36,2 | 25,9 | 32,2 | 44,8 | 33,1 | 48 | 33,7 | 17,9 | 33,8 | 45 | 31,6 | 32,1 | 22,7 | 31,5 | 28 | 19,4 | 28 | 26,5 | 26,6 | 38,6 | 27 | 37,9 | 36,3 | 27,8 | 35 | 31,8 | 22 | 32,5 | 27,4 |
Построение интервального вариационного ряда распределения включает следующие этапы: 1. Определение среди имеющихся наблюдений (табл. 4.2) минимального хmin и максимального хmax значений признака. В данном примере это будут хmin = 17,9 и хmax = 53,6. 2. Определение размаха варьирования признака R = хmax – х min = 35,7. 3. Определение длины интервала по формуле Стерджеса , где n – объем выборки. В данном примере h = 35,7/8=4,45=4,5 (ссм). 4. Определение граничных значений интервалов (аi – bi). За нижнюю границу первого интервала рекомендуется брать величину, равную а1 = хmin – h/2. Верхняя граница первого интервала b1 = a1 + h. Тогда, если bi – верхняя граница i-го интервала (причем аi+1 = bi), то b 2 = a2 + h, b3 = a3 + h и т.д. Построение интервалов продолжается до тех пор, пока начало следующего по порядку интервала не будет равно или больше хmax. В примере граничные значения составляют: а1 = 17,9 – 0,5∙4,5 = 15,7; b1 = 20,2; a2 = 20,2; b2 = 24,7 и т.д. Границы последовательных интервалов запишем в первой графе табл. 4.3. 5. Сгруппируем результаты наблюдений. Просматриваем статистические данные в том порядке, в каком они записаны в табл. 3.2, и значения признака разносим по соответствующим интервалам, обозначая их черточками: | | , | | |, | | | | | , | | | | |, | | | | | | | | (по одной для каждого наблюдения). Так как граничные значения признака могут совпадать с границами интервалов, то условимся в каждый интервал включать варианты, большие, чем нижняя граница интервала (хi > ai), и меньшие или равные верхней границе (хi ≤ bi). Общее количество штрихов, отмеченных в интервале (табл. 3.3, гр. 3), даст его частоту (табл. 3.3., гр. 4). В результате получим интервальный статистический ряд распределения частот (табл. 3.3., гр.2 и 4).
Таблица 3.3 Интервальный ряд распределения выручки магазина № | Интервалы ai–bi | Подсчет частот | Частота ni | Накопленная частота nн i | 1 | 15,7 – 20,2 | | | | | | 4 | 4 | 2 | 20,2 – 24,7 | | | | | | | | | | | | | | 11 | 15 | 3 | 24,7 – 29,2 | | | | | | | | | | | | | | | | | | | | | | | | | 23 | 38 | 4 | 29,2 – 33,7 | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 27 | 65 | 5 | 33,7 – 38,2 | | | | | | | | | | | | | | | 13 | 78 | 6 | 38,2 – 42,7 | | | | | | | | | | 8 | 86 | 7 | 42,7 – 47,2 | | | | 2 | 88 | 8 | 47,2 – 51,7 | | | 1 | 89 | 9 | 51,7 – 56,2 | | | 1 | 90 |
Число интервалов обычно берут равным от 7 до 15 в зависимости от числа наблюдений и точности измерений с таким расчетом, чтобы интервалы были достаточно наполнены частотами. Однако приближенно число интервалов можно оценить исходя только из объема выборки с помощью таблицы 3.4. Если получают интервалы с нулевыми частотами, то нужно увеличить ширину интервалов (особенно в середине интервального ряда).
Таблица 3.4 Выбор числа интервалов группировки
Объем выборки, n | 30 – 50 | 50 – 100 | 100 – 400 | 400 – 1000 | 1000 – 2000 | Число интервалов | 4 – 6 | 6 – 8 | 8 – 9 | 9 – 11 | 11 – 12 |
3.3. Выборочные начальные и центральные моменты. Асимметрия. Эксцесс Приведем краткий обзор характеристик, которые применяются для анализа вариационного ряда и являются аналогами соответствующих числовых характеристик случайной величины. Начальным выборочным моментом k-го порядка называется величина, определяемая по формуле: , где хi – наблюдаемое значение с частотой ni, n – число наблюдений. В частности, начальный выборочный момент первого порядка обозначается и называется выборочной средней: . Медианой называется значение признака, приходящееся на середину ранжированного ряда наблюдений. Модой называется вариант, которому соответствует наибольшая частота. Вариационный размах R равен разности между наибольшим и наименьшим вариантом ряда. Центральным выборочным моментом k-го порядка называется величина, определяемая по формуле: . В частности, центральной выборочный момент второго порядка обозначается S2 и называется выборочной дисперсией: . Средним квадратическим отклонением S называется арифметическое значение корня квадратного из дисперсии: . Коэффициентом вариации называется отношение среднего квадратического отклонения к средней, выраженное в процентах: . Справедливы следующие формулы, выражающие центральные выборочные моменты различных порядков через начальные: и т.д. Выборочным коэффициентом асимметрии называется число, определяемое формулой . Выборочный коэффициент асимметрии служит для характеристики асимметрии полигона (см. далее) вариационного ряда. Если полигон асимметричен, то одна из ветвей его, начиная с вершины, имеет более пологий «спуск», чем другая. В случае отрицательного коэффициента асимметрии более пологий «спуск» полигона наблюдается слева, в противном случае – справа. В первом случае асимметрию называют левосторонней, а во втором – правосторонней. Выборочным эксцессом или коэффициентом крутизны называется число E˜k, определяемое формулой . Выборочный эксцесс служит для сравнения на «крутость» выборочного распределения с нормальным распределением. Ранее подчеркивалось, что эксцесс для случайной величины, распределенной нормально, равен нулю. Поэтому за стандартное значение выборочного эксцесса принимают E˜k = 0. Если выборочному распределению соответствует отрицательный эксцесс, то соответствующий полигон имеет более пологую вершину по сравнению с нормальной кривой. В случае положительного эксцесса полигон более крутой по сравнению с нормальной кривой. 3.4. Упрощенный способ вычисления выборочных характеристик распределения Для вычисления выборочных характеристик (выборочной средней, дисперсии, асимметрии и эксцесса) целесообразно пользоваться вспомогательной таблицей 3.5, которая составляется так: 1) используя данные таблицы 3.3, найдем середину каждого интервала и заполним столбец 1 табл. 3.5; 2) во второй столбец записывают частоты ni, складывают все частоты и их сумму (объем выборки n) помещают в нижнюю клетку столбца; 3) в третий столбец записывают условные варианты , причем в качестве ложного нуля С выбирают варианту, которая имеет наибольшую частоту или занимает среднее положение в ряду данных, и полагают h равным разности между любыми двумя соседними вариантами (длина интервала bi – ai); по данным примера С = 31,4, h = 4,5; практически же третий столбец заполняется так: в клетке третьего столбца, которая принадлежит строке, содержащей наибольшую частоту, пишем 0; над нулем последовательно –1, –2, –3, а под нулем 1, 2, 3, 4, 5. Дальнейший порядок заполнения таблицы простой и не требует пояснений. Последний столбец таблицы – контрольный. Контроль выполняется по правилу: . В нашем примере имеем: 1707 + 4∙101 + 6∙207 + 4∙(–13) + 90 = 3391. Следовательно, вычисления произведены правильно. В итоге получаем расчетную таблицу 3.5.
Таблица 3.5 Вспомогательная таблица для вычисления выборочных характеристик
xi | ni | ui | ni×ui | niui2 | ni×ui3 | ni×ui4 | ni×(ui +1)4 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 17,9 | 4 | –3 | –12 | 36 | –108 | 324 | 64 | 22,4 | 11 | –2 | –22 | 44 | –88 | 176 | 11 | 26,9 | 23 | –1 | –23 | 23 | –23 | 23 | 0 | 31,4 | 27 | 0 | 0 | 0 | 0 | 0 | 27 | 35,9 | 13 | 1 | 13 | 13 | 13 | 13 | 208 | 40,4 | 8 | 2 | 16 | 32 | 64 | 128 | 648 | 44,9 | 2 | 3 | 6 | 18 | 54 | 162 | 512 | 49,4 | 1 | 4 | 4 | 16 | 64 | 256 | 625 | 53,9 | 1 | 5 | 5 | 25 | 125 | 625 | 1296 | Σ | 90 | | –13 | 207 | 101 | 1707 | 3391 |
Выборочный условный момент k-го порядка определяется по формуле По данным примера . Вычислим искомые выборочные среднюю и дисперсию: Выборочное среднее квадратическое отклонение . Найдем центральные эмпирические моменты третьего и четвертого порядка: Найдем значение коэффициента асимметрии и эксцесса: Медиана M˜e – значение признака, приходящееся на середину ранжированного ряда наблюдений. Для интервального ряда медиану следует вычислять по формуле , где M˜e означает номер медианного интервала, (M˜e–1) – интервала, предшествующего медианному. В нашем примере . Мода M˜o для совокупности наблюдений равна тому значению признака (табл. 3.2), которому соответствует наибольшая частота. Для одномодального интервального ряда моду можно вычислить по формуле , где M˜o означает номер модального интервала (интервал с наибольшей частотой), (M˜o–1) и (M˜o+1) – номера предшествующего модальному и следующего за ним интервалов. В примере . Так как по величине , M˜o и M˜e мало отличаются друг от друга, есть основания предполагать теоретическое распределение нормальным. Коэффициент вариации . Коэффициент вариации является относительной мерой рассеяния признака. Коэффициент вариации используется и как показатель однородности выборочных наблюдений. Считается, что если коэффициент вариации не превышает 10%, то выборку можно считать однородной, т.е. полученной из одной генеральной совокупности. Однако к коэффициенту вариации нужно подходить с осторожностью. Продемонстрируем возможность ошибки на следующем примере. Если на основании многолетних наблюдений среднее арифметическое среднесуточных температур 8 марта составляет в какой-либо местности 0° С, то получим бесконечный коэффициент вариации независимо от разброса температур. Поэтому в данном случае коэффициент вариации не применим в качестве показателя рассеяния температур, а специфику явления более объективно оценивает стандартное отклонение S . Практически коэффициент вариации применяется в основном для сравнения выборок из однотипных генеральных совокупностей.3.5. Графическое изображение вариационных рядов Для визуального подбора теоретического распределения, а также выявления положения среднего значения () и характера рассеивания (S2 и S) вариационные ряды изображаются графически. Для изображения как дискретных, так и интервальных рядов применяются полигоны и кумулята, для изображения только интервальных рядов – гистограмма. Для построения этих графиков запишем вариационные ряды распределения (интервальный и дискретный) относительных частот (частостей) Wi = ni / n, накопленных относительных частот WHi и найдем отношение Wi / h, заполнив табл. 3.6.
Таблица 3.6 Статистический ряд распределения выручки магазина Интервалы ai – bi | xi | Wi | WHi | Wi / h | 15,7 – 20,2 | 17,9 | 0,05 | 0,05 | 0,01 | 20,2 – 24,7 | 22,4 | 0,12 | 0,17 | 0,03 | 24,7 – 29,2 | 26,9 | 0,26 | 0,43 | 0,06 | 29,2 – 33,7 | 31,4 | 0,3 | 0,73 | 0,07 | 33,7 – 38,2 | 35,9 | 0,14 | 0,87 | 0,03 | 38,2 – 42,7 | 40,4 | 0,09 | 0,96 | 0,02 | 42,7 – 47,2 | 44,9 | 0,02 | 0,98 | 0,004 | 47,2 – 51,7 | 49,4 | 0,01 | 0,99 | 0,002 | 51,7 – 56,2 | 53,9 | 0,01 | 1 | 0,002 |
Для построения гистограммы относительных частот (частостей) по оси абсцисс откладываем частичные интервалы, на каждом из которых строим прямоугольник, площадь которого равна относительной частоте Wi данного i–го интервала. Тогда высота элементарного прямоугольника должна быть равна Wi / h; в нашем примере h=4,5 (рис. 3.2). Следовательно, площадь под гистограммой равна сумме всех относительных частот, т.е. единице. Рис. 3.2. Из гистограммы можно получить полигон того же распределения, если середины верхних оснований прямоугольников соединить отрезками прямой (рис. 3.3). Гистограмма и полигон являются аппроксимациями кривой плотности (дифференциальной функции) теоретического распределения (генеральной совокупности). Поэтому по их виду можно судить о гипотетическом законе распределения. Рис. 3.3 Для построения кумуляты дискретного ряда по оси абсцисс откладывают значения признака, а по оси ординат – относительные накопленные частоты WHi . Полученные точки соединяют отрезками прямых. Для интервального ряда по оси абсцисс откладывают верхние границы группировки (рис. 3.4). Рис. 3.4 С кумулятой сопоставляется график интегральной функции распределения F(x). В нашем примере коэффициенты асимметрии и эксцесса не намного отличаются от нуля. Коэффициент асимметрии оказался положительным ( A˜s = 0,6), что свидетельствует о правосторонней асимметрии данного распределения. Эксцесс также оказался положительным ( -E˜k= 0,82). Это говорит о том, что кривая, изображающая ряд распределения, по сравнению с нормальной имеет более крутую вершину. Гистограмма и полигон напоминают кривую нормального распределения (рис. 3.2 и рис. 3.3). Все это дает возможность выдвинуть гипотезу о том, что распределение выручки магазина является нормальным.3.6. Статистические оценки параметров распределения Пусть x1, x2, …, xn – выборка объема n из генеральной совокупности с функцией распределения F(x ). Рассмотрим методы нахождения оценок параметров этого распределения. Рассмотрим для этого выборочное распределение, т.е. распределение дискретной случайной величины, принимающей значения x1, x2, …, xn с вероятностями, равными 1/n . Числовые характеристики этого выборочного распределения называются выборочными (эмпирическими) числовыми характеристиками. Следует отметить, что выборочные числовые характеристики являются характеристиками данной выборки, но не являются характеристиками распределения генеральной совокупности. Однако эти характеристики можно использовать для оценок параметров генеральной совокупности. Точечной называют статистическую оценку, которая определяется одним числом. Несмещенной называют точечную оценку, математическое ожидание которой равно оцениваемому параметру при любом объеме выборки. Точечная оценка называется состоятельной, если при неограниченном увеличении объема выборки (n => ∞) она сходится по вероятности к истинному значению параметра. Эффективной называют точечную оценку, которая (при заданном объеме выборки n) имеет наименьшую возможную дисперсию. В математической статистике показывается, что состоятельной, несмещенной оценкой генерального среднего значения а является выборочное среднее арифметическое: где хi – варианта выборки, ni – частота варианты хi, – объем выборки. Для упрощения расчета целесообразно перейти к условным вариантам (в качестве с выгодно брать первоначальную варианту, расположенную в середине вариационного ряда). Тогда . Эффективность или неэффективность оценки зависит от вида закона распределения случайной величины Х. Если величина Х распределена по нормальному закону, то оценка является эффективной. Для других законов распределения это может быть и не так. Несмещенной оценкой генеральной дисперсии служит исправления выборочная дисперсия , так как , где σ2 – генеральная дисперсия. Более удобна формула . Если . Оценка s2 для генеральной дисперсии является также и состоятельной, но не является эффективной. Однако в случае нормального распределения она является «асимптотически эффективной», то есть при увеличении n отношение ее дисперсии к минимально возможной неограниченно приближается к единице. Итак, если дана выборка из распределения F(x) случайной величины Х с неизвестным математическим ожиданием аи дисперсией σ2 , то для вычисления значений этих параметров мы имеем право пользоваться следующими приближенными формулами: 3.7. Интервальное оценивание Выше мы рассмотрели вопрос об оценке неизвестного параметра а одним числом. Такие оценки мы назвали точечными. Они имеют тот недостаток, что при малом объеме выборки могут значительно отличаться от оцениваемых параметров. Поэтому, чтобы получить представление о близости между параметром и его оценкой, в математической статистике вводятся, так называемые, интервальные оценки. Пусть во выборке для параметра θ найдена точечная оценка θ*. Обычно исследователи заранее задаются некоторой достаточно большой вероятностью γ (например, 0,95; 0,99 или 0,999) такой, что событие с вероятностью γ можно считать практически достоверным, и ставят вопрос об отыскании такого значения ε > 0, для которого . Видоизменив это равенство, получим: и будем в этом случае говорить, что интервал ]θ*–ε; θ*+ε[ покрывает оцениваемый параметр θ с вероятностью γ. Интервал ]θ*–ε θ*+ε[ называется доверительным интервалом. Вероятность γ называется надежностью или доверительной вероятностью интервальной оценки. Концы доверительного интервала, т.е. точки θ*–ε и θ*+ε называются доверительными границами. Число ε называется точностью оценки. В качестве примера задачи об определении доверительных границ, рассмотрим вопрос об оценке математического ожидания случайной величины Х, имеющей нормальный закон распределения с параметрами а и σ, т.е. Х = N(a,σ). Математическое ожидание в этом случае равно а. По наблюдениям x1, x2, …, xn вычислим среднее и оценку дисперсии σ2. Оказывается, что по данным выборки можно построить случайную величину , которая имеет распределение Стьюдента (или t-распределение) с ν=n–1 степенями свободы. Воспользуемся таблицей П.3 и найдем для заданных вероятности γ и числа n число tγ такое, при котором вероятность P(|Т| < tγ) = γ, или . Сделав очевидные преобразования, получим Итак, пользуясь распределением Стьюдента, мы нашли доверительный интервал , покрывающий неизвестный параметр а с надежностью γ. Здесь случайные величины и S заменены неслучайными величинами иs, найденными по выборке. По таблице П.3, по заданным n и γ можно найти tγ . Графическая иллюстрация схемы нахождения точности ε и доверительных границ, отвечающих надежности γ приведена на рис. 5.1. Доверительная вероятность γ будет соответствовать площади под кривой Стьюдента, заключенной между точками –tγ и tγ. Рис. 3 .1
Замечание. При n => ∞ распределение Стьюдента стремится к нормальному распределению. Поэтому при большихn (практически при n ≥ 30) tγ можно получить по таблице П.2 из уравнения Ф(tγ) = γ/2. Для оценки среднего квадратического отклонения s нормально распределенного количественного признака Х с надежностью g по исправленному выборочному среднему квадратическому отклонению s служат доверительные интервалы: s(1 – q) < s < s (1 + q) при q<1, 0 < s < s(1 + q) при q>1, где q находят по таблице П. 4 по заданным n и γ. Задача 3.1. Найти доверительные интервалы для оценки математического ожидания а и среднего квадратического отклонения s выручки магазина по результатам вычислений из 3.4. Надежность γ = 0,95. Решение. Ниже будет показано, что распределение выручки магазина является нормальным. В 4.4 были получены следующие точечные оценки а≈ = 30,77 тыс. руб., (тыс. руб)2, где n=90 – объем выборки. Следовательно, σ≈s=6,83 тыс.руб. По таблице П.1.2 при γ/2 =0,475 находим tγ= 1,96. Вычисляем точность оценки , доверительные границы . Получаем доверительный интервал 29,4< a < 32,2. Находим доверительный интервал для оценки σ. По таблице П.4 при γ = 0,95 и n = 90 получаем q = 0,151. Вычисляем доверительные границы s (1 – q)=6,83∙0,849 ≈ 5,8 и s (1+q) = 6,83∙1,151 ≈ 7,9. Получаем доверительный интервал 5,8 < σ < 7,9. 3.8. Оценки истинного значения измеряемой величины и точности измерений Пусть производится n измерений некоторой физической константы, истинное значение которой а неизвестно. Измерения будем рассматривать прямые, независимые, равноточные и не дающие систематической ошибки. Измерения называются: прямыми, если результаты измерений считываются непосредственно со шкалы измерительного прибора; независимыми, если результат каждого измерения не может повлиять на результаты остальных измерений; равноточными, если измерения проводятся в одинаковых условиях. Результаты измерений не будут содержать систематической ошибки, если применяется исправный измерительный прибор. В этих условиях результаты измерений х1, х2, …,хn можно считать случайными величинами, которые независимы, имеют один и тот же закон распределения – нормальный с параметрами (а,σ), где а – истинное значение измеряемой величины (математическое ожидание), σ – точность измерительного прибора (средне квадратическое отклонение). Следовательно, мы можем оценивать с помощью доверительных интервалов истинное значение а измеряемой величины по выборочной средней , а точность измерений σ по выборочному стандарту s, применяя изложенные выше методы. 3.9. Статистическая проверка гипотез Статистической называют гипотезу о виде неизвестного распределения или о параметрах известных распределений. Нулевой (основной) называют выдвинутую гипотезу Н0. Конкурирующий (альтернативной) называют гипотезу Н1, которая противоречит нулевой гипотезе. В итоге проверки гипотезы могут быть совершены ошибки двух родов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают через α . Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости равный 0,05, то это означает, что в среднем в пяти случаях из ста мы рискуем допустить ошибку первого рода (отвергнуть правильную гипотезу). Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают через β. Величина 1 – β называется мощностью критерия. Статистическим критерием (или просто критерием) называют случайную величину К, которая служит для проверки гипотезы. Его значения позволяют судить о «расхождении выборки с гипотезой». Критерий, будучи величиной случайной в силу случайности выборки x1, x2, …, xn, подчиняется при выполнении гипотезы Н0 некоторому известному, затабулированному закону распределения. Для проверки гипотезы по данным выборки вычисляют частные значения входящих в критерий величин, и таким образом получают частное (наблюдаемое) значение критерия. Наблюдаемым (эмпирическим) значением Кнабл. называют то значение критерия, которое вычислено по выборкам. После выбора определенного критерия, множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другое – при которых она принимается. Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают. Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают. Основной принцип проверки статистических гипотез: если наблюдаемое значение критерия принадлежит критической области, то нулевую гипотезу отвергают; если наблюдаемое значение критерия принадлежит области принятия гипотезы, то гипотезу принимают. Критическими точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы. Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области. Правосторонней называют критическую область, определяемую неравенством K > kкр, где kкр – положительное число. Левосторонней называют критическую область, определяемую неравенством К< kкр, где kкр – отрицательное число. Двусторонней называют критическую область, определяемую неравенствами К < k1, К > k2, где k2 > k1 . В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами (в предположении, что kкр > 0): К< – kкр , К> kкр , или равносильным неравенством | K|>kкр. Для отыскания, например, правосторонней критической области поступают следующим образом. Сначала задаются достаточно малой вероятностью – уровнем значимости α . Затем ищут критическую точку k кр , исходя из требования, чтобы при условии справедливости нулевой гипотезы, вероятность того, что критерий К примет значение, больше k кр., была равна принятому уровню значимости: Р(К> kкр) = α. Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию. Когда критическая точка уже найдена, вычисляют по данным выборок наблюдаемое значение критерия и, если окажется, что Кнабл > k кр , то нулевую гипотезу отвергают; если же Кнабл< kкр , то нет оснований, чтобы отвергнуть нулевую гипотезу. Но это вовсе не означает, что Н0 является единственно подходящей гипотезой: просто расхождение между выборочными данными и гипотезой Н0 невелико, или иначе Н0 не противоречит результатам наблюдений; однако таким же свойством наряду с Н0 могут обладать и другие гипотезы. Методы, которые для каждой выборки формально точно определяют, удовлетворяют выборочные данные нулевой гипотезе или нет, называются критериями значимости. Критерии значимости подразделяются на три типа: 1. Критерии значимости, которые служат для проверки гипотез о параметрах распределений генеральной совокупности (чаще всего нормального распределения). Эти критерии называются параметрическими. 2. Критерии, которые для проверки гипотез не используют предположений о распределении генеральной совокупности. Эти критерии не требуют знаний параметров распределения, поэтому называются непараметрическими. 3. Особую группу критериев составляют критерии согласия, служащие для проверки гипотез о согласии распределения генеральной совокупности, из которой получена выборка, с ранее принятой теоретической моделью (чаще всего нормальным распределением). |