Coeficiente de determinación corregido o R-cuadrado ajustado

Publicado por Eric Melillanca... el Vie, 08/06/2018 - 16:05

En un modelo de regresión lineal, el R2ajust es una medida de bondad que considera el número de variables existentes en el modelo.

(También te puede interesar leer: Noción de R​ cuadrado o Coeficiente de Determinación)

Se considera a R2 una medida que contiene sesgo. A medida que se incorporan más variables, R2 tiende a sobreestimar el proder predictivo del modelo, aunque las variables no sean significativas. El R2ajust corrige esta interpretación y se define de la siguiente forma:

Fórmula de R2 ajustado

Donde:

  • = tamaño de la muestra
  • p = cantidad de variables en el modelo

R2ajust, penaliza la incorporación de nuevas variables. En la fórmula se puede observar que al encontrarse el parámetro p en el denominador, disminuye el valor alcanzado por R2ajust a medida que se incorpore una nueva variable. Algebraicamente hablando, si la cantidad de parámetros (p) fuera cero, se lograría una igualdad entre R2 y R2ajust.

Lo aquí expresado, es posible observarlo en la depuración de los modelos de regresión lineal, en la etapa de eliminación regresiva; a medida que se eliminan las variables poco relevantes del modelo, R2 tiende a disminuir, mientras que R2ajust tiende a aumentar.

 

Temas destacados

análisisDeDatos apellido argentina chile clasificación Data Science Diario Concepción emprendimiento En la prensa estadística Estilo de vida identidad innovación instalación investigación machineLearning MacOSX Mapuche mapudungun mineríaDeDatos opinión regresiones rubyOnRails Tips en el computador