Равномерность распределения. Оценка по двум критериям.
В.В. Заляжных

Введение.
Оценка равномерности распределения по выборке проводится по различным статистическим критериям. В статье Критерии равномерности. Оценка мощности по данным [1] приведены наиболее мощные критерии для различных уровней значимости и объёмов выборок при нулевой гипотезе о равномерности, обозначенной как

Н0: X ∈ Rav (0,1)

и альтернативных гипотезах

Н1: F(x) = Ве(1,5; 1,5);
Н2: F(x) = Ве(0,8; 1);
Н3: F(x) = Ве(1,1; 0,9);

Здесь Rav (0,1) – равномерное распределение случайной величины на интервале [0;1], F(x) функция распределения, Ве(a;b) -стандартные (т.е. на интервале [0,1]) бета-распределения, где a и b – параметры формы.

Предложен также метод ориентировочного подбора критериев при альтернативе общего вида путём расчёта относительных мощностей по среднему арифметическому или среднему геометрическому относительных мощностей при гипотезах Н1, Н2 и Н3.

Недостатками таких оценок по отдельным критериям являются, в частности, низкая мощность при небольших объёмах выборок, а также большие различия в мощности по различным альтернативам. Для возможного уменьшения таких недостатков в этой статье рассмотрена оценка равномерности распределения одновременно по двум критериям, те. по парам критериев. При этом возможна оценка равномерности по одному из двух правил:

Правило П («пересечение»): гипотеза равномерности не отвергается, если она не отвергается по обоим критериям. Иначе говоря, гипотеза отвергается, если она отвергается хотя бы одним критерием.

Правило О («объединение»): гипотеза о равномерности не отвергается, если она не отвергается хотя бы по одному из двух критериев. Иначе говоря, гипотеза отвергается, если она отвергается по обоим критериям.

По каждому из правил П и О уровень значимости, соответственно αп и αо, равен доле выборок от всех возможных выборок из равномерного распределения, для которых гипотеза равномерности отвергается. Это наглядно показано на рисунке 1 (уровни значимости критерия 1 и критерия 2, составляющих пару, одинаковы и равны αн).

рисунок st16-1

Рис.1. Уровни значимости пар критериев

Очевидно, мощность по каждому из правил П и О при некоторой альтернативной гипотезе равна доле выборок от всех возможных выборок из распределения, соответствующего альтернативной гипотезе, для которых гипотеза равномерности отвергается. Это наглядно показано на рисунке 2.

рисунок st16-2

Рис.2. Мощности пар критериев

Моделируя достаточно большое количество выборок, можно определить мощность по парам критериев для правил О и П.

Поскольку при оценке равномерности сравнительно низкая мощность имеет место при небольших объёмах выборки, исследовали мощность по парам критериев при сравнительно небольшом объёме выборки 20.

Для исследования выбрали критерии (в скобках принятые здесь сокращённые обозначения): Андерсона-Дарлинга (АД), модификация энтропийного критерия HY2[m,n] при оптимальных значениях m (МЭК2), Жанга Zc (ZC), Фросини (ФР) - как наиболее мощные по отдельным альтернативным гипотезам Н1, Н2 или Н3; Шварца (ШВ) и Шермана (ШЕР). Последние два критерия представляли интерес для оценки сочетания критериев с высокой и относительно невысокой мощностью.

Цель работы:
Исследование мощности при оценке равномерности одновременно по двум критериям (по парам критериев) при объёме выборки 20.

Методика исследования.
Методом статистического компьютерного моделирования в MS Excel моделировали 1 млн. выборок из равномерно распределённой на интервале [0;1] непрерывной случайной величины при объёме выборки 20. По каждой выборке рассчитывали значения критериев АД, МЭК2, ZC, ФР, ШВ, ШЕР (расчётные формулы можно найти в [1]). Задавая для каждого из возможных пар критериев уровни значимости αн, равные 0,005, 0,01, 0,025, 0,05, 0,1, 0,15, 0,2, 0,3 и 0,4, находили соответствующие уровни значимости для каждой из возможных пар критериев по правилу О и по правилу П, соответственно αо и αп. Аппроксимацией находили функциональные зависимости αн = f(αo) и αн = f(αп). По этим зависимостям определяли значения αн, соответствующие αп и αо, равным 0,01, 0,05, 0,1 и 0,15. Эти значения αн затем уточняли по данным моделирования (при этом уточнение обычно не требовалось). Для всех найденных αн находили из полученных моделированием данных соответствующие процентные точки исследуемых критериев.

Далее моделировали 1 млн. выборок из распределений, соответствующих гипотезам Н1, Н2 или Н3 при объёме выборки 20. По полученным данным, задавая найденные значения процентных точек критериев, находили мощности пар критериев по гипотезам Н1, Н2 и Н3. По этим абсолютным мощностям находили относительные мощности для пар критериев по каждой из альтернативных гипотез Н1, Н2 и Н3, а также по альтернативной гипотезе общего вида, так, как это описано в статье Критерии равномерности. Оценка мощности. При этом в качестве базовых использовали те же мощности, что и в указанной статье. Это позволяет сравнивать относительные мощности по одному и по двум критериям.

Результаты.
Полученные результаты приведены в таблицах 1...4 . Обозначения пар критериев видны из примеров:

ФР | ШВ(О) - пара критериев Фросини и Шварца, правило О
ШЕР | АД(П) - пара критериев Шермана и Андерсона-Дарлинга, правило П
Порядок указания критериев в обозначениях не имеет значения. Например, ШВ | ФР(О) - то же, что и ФР | ШВ(О).

Таблица 1 - Правило О, объём выборки 20. Уровни значимости αн каждого из пары критериев и соответствующие процентные точки.
Пара Критерии
в паре
Уровень значимости αо по паре критериев
0,01 0,05 0,1 0,15
Уровни значимости αн критериев / Процентные точки
ШЕР | ФР(О) ШЕР 0,055 / 0,445 0,162 / 0,411 0,250 / 0,394 0,322 / 0,383
ФР 0,055 / 0,5674 0,162 / 0,4358 0,250 / 0,3781 0,322 / 0,3431
ШЕР | МЭК2(О) ШЕР 0,058 / 0,444 0,174 / 0,409 0,273 / 0,390 0,351 / 0,378
МЭК2 0,058 / 0,183 0,174 / 0,105 0,273 / 0,070 0,351 / 0,048
ШЕР | АД(О) ШЕР 0,048 / 0,449 0,148 / 0,414 0,235 / 0,397 0,306 / 0,385
АД 0,048 / 2,535 0,148 / 1,633 0,235 / 1,291 0,306 / 1,104
ШЕР | ZC(О) ШЕР 0,051 / 0,447 0,153 / 0,413 0,244 / 0,395 0,319 / 0,383
ZC 0,051 / 22,83 0,153 / 16,07 0,244 / 13,33 0,319 / 11,73
ШЕР | ШВ(О) ШЕР 0,034 / 0,458 0,113 / 0,423 0,189 / 0,405 0,255 / 0,393
ШВ 0,034 / 0,497 0,113 / 0,367 0,189 / 0,314 0,255 / 0,283
ФР | МЭК2(О) ФР 0,036 / 0,6145 0,124 / 0,47 0,208 / 0,4028 0,279 / 0,3631
МЭК2 0,036 / 0,215 0,124 0,130 0,208 / 0,091 0,279 / 0,068
ФР | АД(О) ФР 0,012 / 0,7247 0,059 / 0,5594 0,116 / 0,4784 0,172 / 0,428
АД 0,012 / 3,731 0,059 / 2,366 0,116 / 1,822 0,172 / 1,519
ФР | ZC(О) ФР 0,023 / 0,6612 0,090 / 0,5097 0,165 / 0,4334 0,234 / 0,3870
ZC 0,023 / 28,24 0,090 / 19,26 0,165 / 15,63 0,234 / 13,57
ФР | ШВ(О) ФР 0,032 / 0,6268 0,119 / 0,4752 0,202 / 0,4068 0,272 / 0,3665
ШВ 0,032 / 0,504 0,119 / 0,361 0,202 / 0,307 0,272 / 0,277
МЭК2 | АД(О) МЭК2 0,037 / 0,213 0,119 / 0,133 0,202 / 0,094 0,272 / 0,070
АД 0,037 / 2,755 0,119 / 1,802 0,202 / 1,400 0,272 1,187
МЭК2 | ZC(О) МЭК2 0,037 / 0,213 0,109 / 0,139 0,182 / 0,102 0,246 / 0,078
ZC 0,037 / 24,93 0,109 / 18,09 0,182 / 15,05 0,246 / 13,28
МЭК2 | ШВ(О) МЭК2 0,021 / 0,249 0,094 / 0,150 0,177 / 0,104 0,254 / 0,075
ШВ 0,021 / 0,554 0,094 / 0,386 0,177 / 0,321 0,254 / 0,284
АД | ZC(О) АД 0,021 / 3,241 0,083 / 2,089 0,153 / 1,607 0,220 / 1,338
ZC 0,021 / 28,94 0,083 / 19,76 0,153 / 16,07 0,220 / 13,94
АД | ШВ(О) АД 0,032 / 2,879 0,113 / 1,843 0,192 / 1,438 0,261 / 1,216
ШВ 0,032 / 0,504 0,113 / 0,367 0,192 / 0,312 0,261 / 0,281
ZC | ШВ(О) ZC 0,032 / 25,9 0,104 / 18,38 0,181 / 15,09 0,251 / 13,16
ШВ 0,032 / 0,504 0,104 / 0,375 0,181 / 0,318 0,251 / 0,285

Таблица 2 - Правило П, объём выборки 20. Уровни значимости αн каждого из пары критериев и соответствующие процентные точки.
Пара Критерии
в паре
Уровень значимости αо по паре критериев
0,01 0,05 0,1 0,15
Уровни значимости αн критериев / Процентные точки
ШЕР | ФР(П) ШЕР 0,005 / 0,501 0,027 / 0,464 0,055 / 0,445 0,084 / 0,433
ФР 0,005 / 0,8042 0,027 / 0,6448 0,055 / 0,5674 0,084 / 0,5181
ШЕР | МЭК2(П) ШЕР 0,005 / 0,501 0,027 / 0,464 0,055 / 0,445 0,084 / 0,433
МЭК2 0,005 / 0,337 0,027 / 0,233 0,055 / 0,187 0,084 / 0,157
ШЕР | АД(П) ШЕР 0,005 / 0,501 0,027 / 0,464 0,056 / 0,445 0,086 / 0,432
АД 0,005 / 4,523 0,027 / 3,024 0,056 / 2,408 0,086 / 2,061
ШЕР | ZC(П) ШЕР 0,005 / 0,501 0,027 / 0,464 0,056 / 0,445 0,086 / 0,432
ZC 0,005 / 40,79 0,027 / 27,1 0,056 / 22,22 0,086 / 19,54
ШЕР | ШВ(П) ШЕР 0,005 / 0,501 0,029 / 0,462 0,061 / 0,442 0,095 / 0,429
ШВ 0,005 / 0,747 0,029 / 0,515 0,061 / 0,432 0,095 / 0,384
ФР | МЭК2(П) ФР 0,005 / 0,8042 0,029 / 0,6373 0,060 / 0,5575 0,092 / 0,5070
МЭК2 0,005 / 0,337 0,029 / 0,229 0,060 / 0,181 0,092 / 0,151
ФР | АД(П) ФР 0,008 / 0,7626 0,043 / 0,5951 0,088 / 0,5125 0,132 / 0,4622
АД 0,008 / 4,087 0,043 / 2,629 0,088 / 2,042 0,132 / 1,722
ФР | ZC(П) ФР 0,006 / 0,788 0,033 / 0,6238 0,068 / 0,543 0,105 / 0,4909
ZC 0,006 / 39,18 0,033 / 25,68 0,068 / 20,98 0,105 / 18,32
ФР | ШВ(П) ФР 0,006 / 0,788 0,030 / 0,6337 0,061 / 0,5556 0,093 / 0,5056
ШВ 0,006 / 0,720 0,030 / 0,511 0,061 / 0,432 0,093 / 0,387
МЭК2 | АД(П) МЭК2 0,005 / 0,337 0,029 / 0,229 0,059 / 0,182 0,091 / 0,152
АД 0,005 / 4,523 0,029 / 2,964 0,059 / 2,366 0,091 / 2,015
МЭК2 | ZC(П) МЭК2 0,005 / 0,337 0,028 / 0,231 0,061 / 0,180 0,096 / 0,148
ZC 0,005 / 40,79 0,028 / 26,84 0,061 / 21,68 0,096 / 18,87
МЭК2 | ШВ(П) МЭК2 0,006 / 0,327 0,033 / 0,221 0,068 / 0,172 0,103 / 0,143
ШВ 0,006 / 0,720 0,033 / 0,500 0,068 / 0,420 0,103 / 0,376
АД | ZC(П) АД 0,006 / 4,350 0,034 / 2,827 0,071 / 2,216 0,109 / 1,870
ZC 0,006 / 39,18 0,034 / 25,48 0,071 / 20,71 0,109 / 18,09
АД | ШВ(П) АД 0,006 / 4,350 0,030 / 2,935 0,062 / 2,326 0,095 / 1,981
ШВ 0,006 / 0,720 0,030 / 0,511 0,062 / 0,430 0,095 / 0,384
ZC | ШВ(П) ZC 0,005 / 40,79 0,030 / 26,35 0,063 / 21,47 0,098 / 18,74
ШВ 0,005 / 0,747 0,030 / 0,511 0,063 / 0,428 0,098 / 0,381

Порядок применения таблиц 1 и 2: при объёме выборки 20 принимают правило О или правило П, соответствующий уровень значимости αо или αп и пару критериев. Рассчитывают по имеющейся выборке значение каждого из критериев пары, сравнивают его с процентной точкой, указанной в табл. 1 или 2 и определяют, отвергается ли гипотеза равномерности по каждому из критериев пары. Затем оценивают гипотезу равномерности по принятому правилу. Если объём выборки отличается от 20, процентные точки критериев необходимо определять по приведённой выше методике.

Таблица 3 - Мощности пар критериев по правилу О, объём выборки 20
Пары критериев
Гипотеза Н1 Гипотеза Н2 Гипотеза Н3
Уровни значимости
0,01 0,05 0,1 0,15 0,01 0,05 0,1 0,15 0,01 0,05 0,1 0,15
Мощности
ШЕР | ФР(O) 0,008 0,059 0,122 0,182 0,038 0,122 0,198 0,262 0,026 0,092 0,159 0,217
ШЕР | МЭК2(O) 0,035 0,126 0,218 0,295 0,021 0,076 0,137 0,193 0,019 0,075 0,14 0,2
ШЕР | АД(O) 0,006 0,05 0,107 0,166 0,04 0,129 0,207 0,275 0,025 0,091 0,157 0,218
ШЕР | ZC(O) 0,015 0,081 0,156 0,225 0,041 0,125 0,202 0,267 0,024 0,089 0,154 0,217
ШЕР | ШВ(O) 0,018 0,075 0,137 0,194 0,023 0,091 0,162 0,225 0,017 0,073 0,134 0,192
ФР | МЭК2(O) 0,016 0,109 0,224 0,324 0,029 0,093 0,156 0,209 0,027 0,096 0,166 0,226
ФР | АД(O) 0,005 0,034 0,092 0,16 0,051 0,151 0,235 0,304 0,036 0,12 0,196 0,262
ФР | ZC(O) 0,006 0,061 0,151 0,243 0,055 0,152 0,233 0,299 0,037 0,12 0,195 0,259
ФР | ШВ(O) 0,012 0,086 0,182 0,266 0,033 0,112 0,188 0,253 0,029 0,1 0,17 0,23
МЭК2 | АД(O) 0,015 0,091 0,196 0,29 0,029 0,089 0,149 0,202 0,027 0,09 0,156 0,215
МЭК2 | ZC(O) 0,039 0,197 0,342 0,451 0,029 0,085 0,141 0,193 0,027 0,091 0,157 0,217
МЭК2 | ШВ(O) 0,064 0,208 0,326 0,418 0,017 0,068 0,126 0,182 0,02 0,079 0,143 0,206
АД | ZC(O) 0,005 0,049 0,127 0,212 0,063 0,167 0,252 0,32 0,038 0,122 0,197 0,262
АД | ШВ(O) 0,011 0,075 0,164 0,248 0,036 0,117 0,195 0,262 0,029 0,099 0,17 0,231
ZC | ШВ(O) 0,03 0,163 0,28 0,369 0,034 0,105 0,177 0,241 0,028 0,095 0,164 0,225

Таблица 4 - Мощности пар критериев по правилу П, объём выборки 20
Пары критериев
Гипотеза Н1 Гипотеза Н2 Гипотеза Н3
Уровни значимости
0,01 0,05 0,1 0,15 0,01 0,05 0,1 0,15 0,01 0,05 0,1 0,15
Мощности
ШЕР | ФР(П) 0,005 0,035 0,080 0,129 0,039 0,138 0,212 0,280 0,027 0,100 0,172 0,235
ШЕР | МЭК2(П) 0,050 0,181 0,294 0,389 0,018 0,075 0,136 0,194 0,015 0,069 0,129 0,188
ШЕР | АД(П) 0,005 0,032 0,074 0,122 0,045 0,141 0,226 0,297 0,027 0,100 0,172 0,236
ШЕР | ZC(П) 0,004 0,041 0,113 0,192 0,047 0,146 0,228 0,296 0,023 0,094 0,165 0,228
ШЕР | ШВ(П) 0,023 0,104 0,182 0,252 0,021 0,087 0,156 0,219 0,017 0,075 0,137 0,195
ФР | МЭК2(П) 0,049 0,184 0,304 0,401 0,033 0,112 0,184 0,245 0,026 0,101 0,172 0,236
ФР | АД(П) 0,003 0,029 0,081 0,143 0,055 0,160 0,249 0,318 0,035 0,120 0,198 0,262
ФР | ZC(П) 0,002 0,041 0,123 0,214 0,061 0,170 0,253 0,321 0,035 0,118 0,193 0,259
ФР | ШВ(П) 0,026 0,102 0,177 0,246 0,041 0,126 0,204 0,270 0,031 0,107 0,178 0,241
МЭК2 | АД(П) 0,049 0,183 0,298 0,393 0,040 0,128 0,203 0,269 0,027 0,103 0,174 0,238
МЭК2 | ZC(П) 0,049 0,177 0,301 0,402 0,042 0,131 0,207 0,270 0,023 0,093 0,165 0,229
МЭК2 | ШВ(П) 0,06 0,206 0,335 0,431 0,017 0,071 0,132 0,188 0,018 0,074 0,138 0,196
АД | ZC(П) 0,001 0,04 0,124 0,215 0,063 0,174 0,26 0,326 0,034 0,116 0,192 0,257
АД | ШВ(П) 0,025 0,099 0,174 0,241 0,048 0,140 0,222 0,271 0,033 0,108 0,180 0,221
ZC | ШВ(П) 0,021 0,097 0,176 0,255 0,045 0,146 0,226 0,292 0,025 0,101 0,172 0,234

ЛИТЕРАТУРА
1. Лемешко Б.Ю., Блинов П.Ю. Критерии проверки отклонения распределения от равномерного закона: руководство по применению. М.: ИНФРА-М, 2015.- 183с.

The evaluation of uniformity of distribution of the random variable in two statistical tests

Окончание статьи далее
      Далее       Содержание

© В.В. Заляжных
Отзывы, замечания, предложения - z9876543@rambler.ru
При использовании материалов ссылка на сайт обязательна