Welcome to the Jungle


La simplicidad es la máxima sofisticación

Evaluación de modelos de clasificación: curva CAP

Al trabajar en el análisis de datos a través de métodos de clasificación, es necesario evaluar los modelos analizados para el caso, con el fin de determinar el mejor.

Cuando comencé mis estudios en Data Science conocí la "Curva ROC", pero recientemente me encontré con otra forma que es la "Curva CAP". Por la forma en que distribuyen en el gráfico, se pueden generar confusiones con respecto a pensar que se trata de la misma curva; pero no, no lo son.

...continúa leyendo.


Caracterización de algoritmos de clasificación

A continuación, se listan las principales ventajas y desventajas de los modelos de clasificación más relevantes en Data Science.

Regresión Logística

Ventajas

  • Enfoque probabilístico, proporciona información sobre el significado estadístico de las características

Desventajas

  • Los supuestos de Regresión Logística

 

k Nearest Neighbor (k-NN)

El vecino más cercano, utiliza tanto atributos numéricos como categóricos

...continúa leyendo.


El Ciberataque a bancos chilenos explicado “con piñones”

El 25 de julio, poco antes de las 08:00 horas, un grupo que se hace llamar “The Shadow Brokers” publicaron en su cuenta Twitter que se encontraban disponibles para descarga un listado de usuarios de tarjetas de crédito de Banco de Chile.

Recién en la tarde, luego de rumores en redes sociales y la confirmación de la Superintendencia de Bancos e Instituciones Financieras (SBIF), diversos medios publicaron la noticia sobre las 14.000 cuentas afectadas y la noticia corrió como el viento, también los miedos.

...continúa leyendo.


Inteligencia Artificial y nuevas tecnologías ¿Peligran nuestros trabajos?

Big Data, Robótica, Inteligencia Artificial, Ciberseguridad, Internet de las Cosas, Nanotecnología, entre otros; conceptos que a los más antiguos pueden sonar a película futurista, son parte de una nueva realidad que estamos viviendo, tecnologías que se encuentran impulsando la “Cuarta Revolución Industrial”. Un proceso histórico que nuevamente está cambiando las formas de producción y en consecuencia, buen parte de nuestra forma de vivir.

...continúa leyendo.


Tareas en Data Science

En primer lugar, es necesario hacer la distinción entre Tarea y Método. Una tarea es un problema de Minería de Datos. Por ejemplo, al clasificar los potenciales clientes de un banco como aptos para un crédito y no aptos, la tarea es la clasificación, independiente del método que se utilice para resolverla.

A continuación los principales tipos de tareas

...continúa leyendo.