¿Qué es el Big Data?

Publicado por Eric Melillanca... el Dom, 04/12/2016 - 19:38

¿Qué es el Big Data? ¿Qué es este concepto nuevo? ¿Una moda o más de lo mismo?

En esta publicación intentaré responder a esta interrogante.

Si conoces el concepto de Minería de Datos puedes saltarte esta publicación, la verdad son lo mismo, pero el concepto en inglés suena más sofisticado, se vende por sí mismo y por lo tanto "pega más". Por este motivo, en este blog lo verás escrito en las dos formas, para ayudar a asociar el concepto a quienes no lo tengan claro.

Se le atribuye a Bill Gates la siguiente frase de 1981:

Nadie va a necesitar más de 640 Kb de memoria en su PC

Esta "profecía" está claramente obsoleta, el uso de medios digitales para el almacenamiento de información de todo tipo, audio, video, imágenes, planos, exámenes médicos entre otros; a lo que agregamos el crecimiento explosivo de usuarios de internet a través de computadores, tablets, teléfonos celulares; además del uso de las Tecnologías de Información en todas las industrias. Todo ello ha llevado a un incremento en el volumen de datos que almacenan las organizaciones. A esto apunta el concepto de Big Data, grandes datos, datos a gran escala, datos masivos.

Lo interesante de este fenómeno es lo que se puede hacer con este "tesoro" que organizaciones han acumulado durante años.

La Minería de Datos es el análisis y gestión de grandes volúmenes de datos que por lo general superan los límites de las herramientas de softwares utilizadas para fines similares. Su gran objetivo es convertir Datos Tontos en Información Relevante para lograrlo se utilizan técnicas de diversas áreas de las Ciencias Matemáticas y de la Ingeniería.

¿Qué información puedo obtener? Algunos ejemplos:

  1. Un banco puede saber de antemano a qué clientes es conveniente aprobar un crédito, analizando el comportamiento de todos los clientes que tengan registrados a través de los años, agrupándolos en características comunes y llegar a conclusiones como: "Los clientes con un determinado nivel de ingreso, con cierta formación académica, con edad en algún rango y que previamente han tomado nuestros productos X, Y y Z, pagan a tiempo sus cuotas". Posteriormente el banco utilizará este criterio para la aprobación (o rechazo) a las solicitudes de crédito.
  2. Un retail, basándose en los millones de millones de datos acumulados, puede encontrar patrones de comportamiento que permitan afirmar: "Los varones entre 32 y 40 años, de profesión ingeniero y que viven en determinado sector, les gustan las camisas amarillas". Y claramente, enfocarán la campaña de marketing publicitando en este público las camisas amarillas del retail.
  3. Una clínica puede determinar en qué períodos del año, realizan atenciones por determinadas patologías. Posteriormente hacer una relación entre ambas variables.
  4. Un retail puede crear clasificaciones de personas y sus preferencias de compras, a partir de esto realizar marketing relacional permitiendo entregar ofertas personalizadas.

Ya que han leído hasta aquí, no se extrañen cuando en el supermercado o cuando compren ropa le pidan su número de identificación (R.U.T. en Chile). Tampoco se extrañen cuando justo estaban pensando en comprar un departamento, les empiecen a llegar las ofertas; y así, ejemplos hay muchos.

La Minería de Datos es una disciplina que no es fácil (ni necesario) encasillar en alguna especialidad de la Ingeniería. Combina conocimientos en Bases de Datos, Estadística, Optimización. Hay algo más que también es muy relevante, idealmente debe ser llevada a cabo por profesionales con capacidad de comprensión de los procesos de negocio existentes en las organizaciones. En mi experiencia he podido ser testigo de proyectos llevados por profesionales con un perfil excesivamente técnico y que al cabo de un año y medio de trabajo logran soluciones técnicamente óptimas, pero con un resultado que no es el que la organización esperaba.

La Minería de Datos es una de las disciplinas de lo que ya se está denominando la Cuarta Revolución Industrial, o también Industria 4.0, una tarea que las organizaciones que pretenden seguir siendo competitivas en el nuevo milenio no pueden dejar de lado.

Seguiré publicando acerca de este tema.

Temas relacionados: 

Temas destacados

análisisDeDatos apellido argentina chile clasificación Data Science Diario Concepción emprendimiento En la prensa estadística Estilo de vida identidad innovación instalación investigación machineLearning MacOSX Mapuche mapudungun mineríaDeDatos opinión regresiones rubyOnRails Tips en el computador