Data Science

Tareas en Data Science

En primer lugar, es necesario hacer la distinción entre Tarea y Método. Una tarea es un problema de Minería de Datos. Por ejemplo, al clasificar los potenciales clientes de un banco como aptos para un crédito y no aptos, la tarea es la clasificación, independiente del método que se utilice para resolverla.

A continuación los principales tipos de tareas

...continúa leyendo.


Análisis comparativo sobre modelos de regresión

A continuación, se listan las principales ventajas y desventajas de los modelos de regesión más relevantes en Data Science.

Regresión lineal

Ventajas

  • Trabaja con cualquier tamaño de muestra.
  • Informa sobre la relevancia de cada variable dependiente.

Desventaja

...continúa leyendo.


¿Qué modelo de regresión lineal utilizar?

Una vez que conoces distintos modelos de regresión, puedes quedar con la duda al momento de enrrentar un problema sobre qué modelo utilizar. Aquí una ayuda:

...continúa leyendo.


Interpretar Valor P

En Estadística, un parámetro estadístico muy utilizado es el Valor-P; de él depende si una prueba de hipótesis rechaza o no la hipótesis nula. Una de las alternativas de algoritmos a utilizar se encuentra en los Modelos de Regresión Lineal Múltiple; dentro del proceso de desarrollo de una solución, estos modelos deben ser depurados para lograr mayor precisión en sus predicciones, para lo que se desarrolla un proceso de eliminación regresiva, donde el Valor-P juega un papel muy importante.

...continúa leyendo.


Coeficiente de determinación corregido o R-cuadrado ajustado

En un modelo de regresión lineal, el R2ajust es una medida de bondad que considera el número de variables existentes en el modelo.

(También te puede interesar leer: Noción de R​ cuadrado o Coeficiente de Determinación)

...continúa leyendo.