¿Qué algoritmo de clasificación usar?

Publicado por Eric Melillanca... el Mié, 08/08/2018 - 13:35

Al igual que para los modelos de regresión, primero es necesario averiguar si el problema es lineal o no.

Si el problema es lineal, se debiera optar por la Regresión Logística o SVM.

Si el problema no es lineal, podría escoger entre k-NN, Naive Bayes, Árbol de Decisión o Bosque Aleatorio.

  • Regresión Logística o Naive Bayes cuando se desea predecir la clase en base a su probabilidad si el problema es lineal. Naive Bayes si su problema no es lineal.
  • SVM cuando se desee predecir a qué segmento pertenecen sus clientes. Los segmentos pueden ser de cualquier tipo, por ejemplo, algunos segmentos de mercado que se hubieran identificado previamente a través de agrupación.
  • Árbol de decisión cuando desee tener una interpretación clara de los resultados de su modelo. Este algoritmo permite generar reglas de decisión.
  • Bosque Aleatorio cuando se busca un alto rendimiento con menos necesidad de interpretación.

 

Fuente: SuperDataScience.com

 

Temas destacados

análisisDeDatos clasificación code Data Science Diario Concepción emprendimiento En la prensa estadística Estilo de vida identidad innovación instalación linux machineLearning MacOSX Mapuche mapudungun mineríaDeDatos opinión regresiones rubyOnRails Tips en el computador turismo viajes