logo
Анализ и прогнозирование производственного травматизма

4.1 Исключение ложных данных

Ложные результаты проникают в исходную совокупность случайным путем из-за действия достаточно большого числа случайных причин, которые не удается заранее предусмотреть при проведении измерений или при сборе статистических сведений (описки, опечатки). Не исключен случай, когда ошибки в статистические данные вносятся злонамеренно, к примеру, с целью искажения или сокрытия истинного положения вещей.

Процедура исключения ложных данных позволяет выявить такие данные в статистической совокупности с большой степенью вероятности.

К источникам ложных данных относятся:

- грубые (недостаточно точные) измерения;

- нарушение условий эксперимента;

- использование неисправного оборудования;

- ошибки при обработке информации и др.

Наличие ложных данных приводит к необоснованным выводам, поэтому ложные данные должны быть исключены из выборочной совокупности в процессе первичной обработки опытных данных [26,30,33,35].

Процедура исключения ложных данных для представленных совокупностей:

1. Имеющиеся значения совокупностей значений располагаются в порядке возрастания: х(1) ? х(2) ? х(m), и определяются крайние элементы представленной совокупности:

х(1) = хmin, х(n) = х(max).

Таблица 7 - Упорядоченные по возрастанию совокупности значений

L, чел.

m1, чел.

m2, чел.

m3, чел.

N, дни

278200

625

10

18

29090

283730

725

12

18

29482

290000

858

13

32

35398

291008

899

17

36

35476

292200

912

18

36

35604

324500

1133

20

38

40278

339100

1313

28

40

40689

343600

1542

30

47

42046

351900

1650

31

51

47039

357900

1722

33

58

48838

390500

2059

44

63

52710

411700

2387

46

63

56094

427300

2540

51

65

58420

2,203

0,034

0,529

23,000

1527,6

2,500

0,041

0,621

23,500

1566,1

3,084

0,047

1,062

24,417

1778,3

3,089

0,052

1,150

24,660

2221,3

3,121

0,062

1,171

25,600

2519,4

3,492

0,070

1,237

26,121

3155,6

3,872

0,081

1,313

35,826

4194,5

4,308

0,085

1,369

38,899

4992,5

4,689

0,087

1,449

39,604

5488,4

5,012

0,097

1,474

40,665

7007,6

5,273

0,103

1,579

41,256

7306,8

5,586

0,118

1,613

43,105

8339,3

6,170

0,124

1,688

46,544

11161,5

17,8

10360

11,5

65,6

41400

18

10886

13,1

78,3

49800

18,2

11690

13,6

89

56900

18,5

11729

15,5

100,8

64800

20,5

11811

26,9

140

90400

20,8

11929

34,3

164,8

107000

23,3

12124

41,3

205,8

134100

25,8

12314

42,3

226,1

148200

26,5

12500

44,5

240,3

157200

26,5

12550

49,9

264,5

173800

30,9

12975

57,2

318,8

187300

33,3

13690

60,9

335,4

220800

33,5

14383

71,8

404,8

244700

2. Вычисляются значения , отклонений крайних значений случайной величины хmin, хmax от ее среднего значения с учетом разброса значений случайной величины x в выборке по следующим формулам:

, . (5)

Среднее значение опытных данных вычисляется по исходной совокупности объемом m по формуле:

(6)

Среднее значение для величины L:

Lср==337049,1

По исходной совокупности опытных данных вычисляется величина , характеризующая разброс опытных значений величины x вокруг среднего

Разброс опытных данных для величины L:

. (7)

1,18

1,80

3. Рассчитанные значения относительно отклонения (б;m) сравниваются с его критическими (теоретическими) значениями . Так как выборка небольшая (m?25) для исключения ложных данных используется таблица квантилей распределения максимального относительного отклонения . Значение квантиля максимального относительного отклонения для уровня значимости б=0,05 принимается равным 2,43. [30,35]

Таблица 8 -Квантили максимального относительного отклонения

б, %

Объем выборочной совокупности m

8

9

10

11

12

13

14

15

16

1

2,37

2,46

2,54

2,61

2,66

2,71

2,76

2,8

2,84

5

2,17

2,24

2,29

2,34

2,39

2,43

2,46

2,49

2,52

Сравниваются расчетное и критическое значения по формуле:

?.

Оба значения и 1,80 меньше =2,43, следовательно, оба неравенства выполнены и оба значения не считаются ложными и остаются в выборке.

Таким образом, рассчитываются оставшиеся выборочные совокупности. Результаты расчетов представлены в таблице

Таблица 9 - Результаты расчетов , отклонений крайних значений случайных величин хmin, хmax от среднего значения

хmin

хmax

L

278200

427300

337049,1

50071,51

1,18

1,80

m1

625,00

2540,00

1412,69

633,14

1,24

1,78

m2

10,00

51,00

27,15

13,63

1,26

1,75

m3

15,00

65,00

43,23

16,46

1,72

1,32

N

29090,00

58420,00

42397,23

9609,77

1,38

1,67

Kч

2,203

6,170

4,031

1,197

1,787

0,8

Kл

0,034

0,124

0,077

0,028

1,685

0,02

Kп.з.

0,529

1,688

1,250

0,341

1,285

0,25

Kт

23,000

46,544

33,323

8,472

1,561

5,0

S

1527,60

11161,50

4712,3

3024,73

1,05

2,13

D

17,80

33,50

24,12

5,78

1,09

1,62

E

10360,00

14383,00

12226,23

1065,65

1,75

2,02

I

11,50

71,80

37,14

20,00

1,28

1,73

V

65,50

404,80

202,70

108,25

1,27

1,87

Vp

41400,00

244700,00

128953,8

66864,25

1,31

1,73

Как видно из таблицы все значения и выборочных совокупностей удовлетворяют неравенству ?. В результате проведенной процедуры можно утверждать, что в таблице значений случайных величин ложных данных нет.