logo
Анализ и прогнозирование производственного травматизма

6.3 Оценка качества построенной модели

Коэффициентом множественной детерминации R2 называется квадрат множественного коэффициента корреляции.

Коэффициент множественной детерминации характеризует, на сколько процентов построенная модель регрессии объясняет вариацию значений результативной переменной относительно своего среднего уровня, т. е. показывает долю общей дисперсии результативной переменной, объяснённой вариацией факторных переменных, включённых в модель регрессии. Чем больше значение коэффициента множественной детерминации, тем лучше построенная модель регрессии характеризует взаимосвязь между переменными.

Для коэффициента множественной детерминации всегда выполняется неравенство вида:

. (15)

Следовательно, включение в линейную модель регрессии дополнительной факторной переменной не снижает значения коэффициента множественной детерминации.[26]

Таблица 18 - Рассчитанные коэффициенты детерминации

Показатель травмирования

Кч

Кл

Кп.з.

Кт

R2

0,935

0,690

0,874

0,881

Для того чтобы не допустить преувеличения тесноты связи, применяется скорректированный индекс множественной детерминации, который содержит поправку на число степеней свободы и рассчитывается по формуле:

. (16)

где n - объем выборки, m - число переменных в уравнении множественной регрессии. При небольшом числе наблюдений нескорректированная величина коэффициента множественной детерминации R2 имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель.

Таблица 19 - Скорректированный индекс множественной детерминации

Показатель травмирования

Кч

Кл

Кп.з.

Кт

0,913

0,587

0,832

0,842

Высокие величины коэффициентов детерминации R2 указывают на то, что модели регрессии хорошо аппроксимируют исходные данные и такими регрессионными моделями можно воспользоваться для прогноза значений результативного показателя.

Проверить значимость (качество) уравнения регрессии - значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным, достаточно ли включенных в уравнение объясняющих переменных для описания зависимой переменной. Чтобы иметь общее суждение о качестве модели, по каждому наблюдению из относительных отклонений определяют среднюю ошибку аппроксимации. Проверка адекватности уравнения регрессии (модели) осуществляется с помощью средней ошибки аппроксимации, величина которой не должна превышать 12-15% (максимально допустимое значение).

Формула для расчета средней ошибки аппроксимации:

, (17)