4.1 Исключение ложных данных
Ложные результаты проникают в исходную совокупность случайным путем из-за действия достаточно большого числа случайных причин, которые не удается заранее предусмотреть при проведении измерений или при сборе статистических сведений (описки, опечатки). Не исключен случай, когда ошибки в статистические данные вносятся злонамеренно, к примеру, с целью искажения или сокрытия истинного положения вещей.
Процедура исключения ложных данных позволяет выявить такие данные в статистической совокупности с большой степенью вероятности.
К источникам ложных данных относятся:
- грубые (недостаточно точные) измерения;
- нарушение условий эксперимента;
- использование неисправного оборудования;
- ошибки при обработке информации и др.
Наличие ложных данных приводит к необоснованным выводам, поэтому ложные данные должны быть исключены из выборочной совокупности в процессе первичной обработки опытных данных [26,30,33,35].
Процедура исключения ложных данных для представленных совокупностей:
1. Имеющиеся значения совокупностей значений располагаются в порядке возрастания: х(1) ? х(2) ? х(m), и определяются крайние элементы представленной совокупности:
х(1) = хmin, х(n) = х(max).
Таблица 7 - Упорядоченные по возрастанию совокупности значений
L, чел. |
m1, чел. |
m2, чел. |
m3, чел. |
N, дни |
|
278200 |
625 |
10 |
18 |
29090 |
|
283730 |
725 |
12 |
18 |
29482 |
|
290000 |
858 |
13 |
32 |
35398 |
|
291008 |
899 |
17 |
36 |
35476 |
|
292200 |
912 |
18 |
36 |
35604 |
|
324500 |
1133 |
20 |
38 |
40278 |
|
339100 |
1313 |
28 |
40 |
40689 |
|
343600 |
1542 |
30 |
47 |
42046 |
|
351900 |
1650 |
31 |
51 |
47039 |
|
357900 |
1722 |
33 |
58 |
48838 |
|
390500 |
2059 |
44 |
63 |
52710 |
|
411700 |
2387 |
46 |
63 |
56094 |
|
427300 |
2540 |
51 |
65 |
58420 |
|
2,203 |
0,034 |
0,529 |
23,000 |
1527,6 |
|
2,500 |
0,041 |
0,621 |
23,500 |
1566,1 |
|
3,084 |
0,047 |
1,062 |
24,417 |
1778,3 |
|
3,089 |
0,052 |
1,150 |
24,660 |
2221,3 |
|
3,121 |
0,062 |
1,171 |
25,600 |
2519,4 |
|
3,492 |
0,070 |
1,237 |
26,121 |
3155,6 |
|
3,872 |
0,081 |
1,313 |
35,826 |
4194,5 |
|
4,308 |
0,085 |
1,369 |
38,899 |
4992,5 |
|
4,689 |
0,087 |
1,449 |
39,604 |
5488,4 |
|
5,012 |
0,097 |
1,474 |
40,665 |
7007,6 |
|
5,273 |
0,103 |
1,579 |
41,256 |
7306,8 |
|
5,586 |
0,118 |
1,613 |
43,105 |
8339,3 |
|
6,170 |
0,124 |
1,688 |
46,544 |
11161,5 |
|
17,8 |
10360 |
11,5 |
65,6 |
41400 |
|
18 |
10886 |
13,1 |
78,3 |
49800 |
|
18,2 |
11690 |
13,6 |
89 |
56900 |
|
18,5 |
11729 |
15,5 |
100,8 |
64800 |
|
20,5 |
11811 |
26,9 |
140 |
90400 |
|
20,8 |
11929 |
34,3 |
164,8 |
107000 |
|
23,3 |
12124 |
41,3 |
205,8 |
134100 |
|
25,8 |
12314 |
42,3 |
226,1 |
148200 |
|
26,5 |
12500 |
44,5 |
240,3 |
157200 |
|
26,5 |
12550 |
49,9 |
264,5 |
173800 |
|
30,9 |
12975 |
57,2 |
318,8 |
187300 |
|
33,3 |
13690 |
60,9 |
335,4 |
220800 |
|
33,5 |
14383 |
71,8 |
404,8 |
244700 |
2. Вычисляются значения , отклонений крайних значений случайной величины хmin, хmax от ее среднего значения с учетом разброса значений случайной величины x в выборке по следующим формулам:
, . (5)
Среднее значение опытных данных вычисляется по исходной совокупности объемом m по формуле:
(6)
Среднее значение для величины L:
Lср==337049,1
По исходной совокупности опытных данных вычисляется величина , характеризующая разброс опытных значений величины x вокруг среднего
Разброс опытных данных для величины L:
. (7)
1,18
1,80
3. Рассчитанные значения относительно отклонения (б;m) сравниваются с его критическими (теоретическими) значениями . Так как выборка небольшая (m?25) для исключения ложных данных используется таблица квантилей распределения максимального относительного отклонения . Значение квантиля максимального относительного отклонения для уровня значимости б=0,05 принимается равным 2,43. [30,35]
Таблица 8 -Квантили максимального относительного отклонения
б, % |
Объем выборочной совокупности m |
|||||||||
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
||
1 |
2,37 |
2,46 |
2,54 |
2,61 |
2,66 |
2,71 |
2,76 |
2,8 |
2,84 |
|
5 |
2,17 |
2,24 |
2,29 |
2,34 |
2,39 |
2,43 |
2,46 |
2,49 |
2,52 |
Сравниваются расчетное и критическое значения по формуле:
?.
Оба значения и 1,80 меньше =2,43, следовательно, оба неравенства выполнены и оба значения не считаются ложными и остаются в выборке.
Таким образом, рассчитываются оставшиеся выборочные совокупности. Результаты расчетов представлены в таблице
Таблица 9 - Результаты расчетов , отклонений крайних значений случайных величин хmin, хmax от среднего значения
хmin |
хmax |
||||||
L |
278200 |
427300 |
337049,1 |
50071,51 |
1,18 |
1,80 |
|
m1 |
625,00 |
2540,00 |
1412,69 |
633,14 |
1,24 |
1,78 |
|
m2 |
10,00 |
51,00 |
27,15 |
13,63 |
1,26 |
1,75 |
|
m3 |
15,00 |
65,00 |
43,23 |
16,46 |
1,72 |
1,32 |
|
N |
29090,00 |
58420,00 |
42397,23 |
9609,77 |
1,38 |
1,67 |
|
Kч |
2,203 |
6,170 |
4,031 |
1,197 |
1,787 |
0,8 |
|
Kл |
0,034 |
0,124 |
0,077 |
0,028 |
1,685 |
0,02 |
|
Kп.з. |
0,529 |
1,688 |
1,250 |
0,341 |
1,285 |
0,25 |
|
Kт |
23,000 |
46,544 |
33,323 |
8,472 |
1,561 |
5,0 |
|
S |
1527,60 |
11161,50 |
4712,3 |
3024,73 |
1,05 |
2,13 |
|
D |
17,80 |
33,50 |
24,12 |
5,78 |
1,09 |
1,62 |
|
E |
10360,00 |
14383,00 |
12226,23 |
1065,65 |
1,75 |
2,02 |
|
I |
11,50 |
71,80 |
37,14 |
20,00 |
1,28 |
1,73 |
|
V |
65,50 |
404,80 |
202,70 |
108,25 |
1,27 |
1,87 |
|
Vp |
41400,00 |
244700,00 |
128953,8 |
66864,25 |
1,31 |
1,73 |
Как видно из таблицы все значения и выборочных совокупностей удовлетворяют неравенству ?. В результате проведенной процедуры можно утверждать, что в таблице значений случайных величин ложных данных нет.
- Глоссарий
- Введение
- 1. Причины производственного травматизма
- 2. Методы анализа производственного травматизма
- 3. Сбор статистических данных
- 4. Первичная обработка опытных данных
- 4.1 Исключение ложных данных
- 4.2 Проверка опытных данных на их случайность и независимость
- 5. Статистический анализ выборочных совокупностей
- 5.1 Проверка гипотезы о нормальном распределении генеральной совокупности
- 5.2 Проверка гипотезы о значимости коэффициента корреляции
- 6. Корреляционно-регрессионный анализ
- 6.1 Уравнения множественной регрессии
- 6.2 Коэффициент множественной корреляции
- 6.3 Оценка качества построенной модели
- 29. Прогнозирование производственного травматизма.
- 3. Методы анализа травматизма и заболеваемости. Их показатели и прогнозирование.
- 3. Анализ производственного травматизма
- 5. Производственный травматизм: основные понятия, методы анализа и прогнозирования.
- Анализ производственного травматизма на предприятиях и учреждениях. Коэффициент травматизма.
- 20. Методы анализа производственного травматизма
- 1.4. Методы анализа производственного травматизма.
- 1.15. Анализ производственного травматизма.
- 48. Анализ профессионального и производственного рисков. Анализ, прогнозирование, профилактика травматизма и профессиональных заболеваний
- 6. Методы изучения и анализа производственного травматизма