6.3 Оценка качества построенной модели
Коэффициентом множественной детерминации R2 называется квадрат множественного коэффициента корреляции.
Коэффициент множественной детерминации характеризует, на сколько процентов построенная модель регрессии объясняет вариацию значений результативной переменной относительно своего среднего уровня, т. е. показывает долю общей дисперсии результативной переменной, объяснённой вариацией факторных переменных, включённых в модель регрессии. Чем больше значение коэффициента множественной детерминации, тем лучше построенная модель регрессии характеризует взаимосвязь между переменными.
Для коэффициента множественной детерминации всегда выполняется неравенство вида:
. (15)
Следовательно, включение в линейную модель регрессии дополнительной факторной переменной не снижает значения коэффициента множественной детерминации.[26]
Таблица 18 - Рассчитанные коэффициенты детерминации
Показатель травмирования |
Кч |
Кл |
Кп.з. |
Кт |
|
R2 |
0,935 |
0,690 |
0,874 |
0,881 |
Для того чтобы не допустить преувеличения тесноты связи, применяется скорректированный индекс множественной детерминации, который содержит поправку на число степеней свободы и рассчитывается по формуле:
. (16)
где n - объем выборки, m - число переменных в уравнении множественной регрессии. При небольшом числе наблюдений нескорректированная величина коэффициента множественной детерминации R2 имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель.
Таблица 19 - Скорректированный индекс множественной детерминации
Показатель травмирования |
Кч |
Кл |
Кп.з. |
Кт |
|
0,913 |
0,587 |
0,832 |
0,842 |
Высокие величины коэффициентов детерминации R2 указывают на то, что модели регрессии хорошо аппроксимируют исходные данные и такими регрессионными моделями можно воспользоваться для прогноза значений результативного показателя.
Проверить значимость (качество) уравнения регрессии - значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным, достаточно ли включенных в уравнение объясняющих переменных для описания зависимой переменной. Чтобы иметь общее суждение о качестве модели, по каждому наблюдению из относительных отклонений определяют среднюю ошибку аппроксимации. Проверка адекватности уравнения регрессии (модели) осуществляется с помощью средней ошибки аппроксимации, величина которой не должна превышать 12-15% (максимально допустимое значение).
Формула для расчета средней ошибки аппроксимации:
, (17)
- Глоссарий
- Введение
- 1. Причины производственного травматизма
- 2. Методы анализа производственного травматизма
- 3. Сбор статистических данных
- 4. Первичная обработка опытных данных
- 4.1 Исключение ложных данных
- 4.2 Проверка опытных данных на их случайность и независимость
- 5. Статистический анализ выборочных совокупностей
- 5.1 Проверка гипотезы о нормальном распределении генеральной совокупности
- 5.2 Проверка гипотезы о значимости коэффициента корреляции
- 6. Корреляционно-регрессионный анализ
- 6.1 Уравнения множественной регрессии
- 6.2 Коэффициент множественной корреляции
- 6.3 Оценка качества построенной модели
- 29. Прогнозирование производственного травматизма.
- 3. Методы анализа травматизма и заболеваемости. Их показатели и прогнозирование.
- 3. Анализ производственного травматизма
- 5. Производственный травматизм: основные понятия, методы анализа и прогнозирования.
- Анализ производственного травматизма на предприятиях и учреждениях. Коэффициент травматизма.
- 20. Методы анализа производственного травматизма
- 1.4. Методы анализа производственного травматизма.
- 1.15. Анализ производственного травматизма.
- 48. Анализ профессионального и производственного рисков. Анализ, прогнозирование, профилактика травматизма и профессиональных заболеваний
- 6. Методы изучения и анализа производственного травматизма