Últimamente, el término Big Data está en el centro de atención, pero pocas personas saben qué es big data. Las empresas, las instituciones estatales, los proveedores de atención médica y las instituciones financieras y académicas están aprovechando el poder de Big Data para mejorar las perspectivas comerciales y de gestión junto con una mejor experiencia del usuario.
IBM sostiene que las empresas de todo el mundo generan casi 2.5 quintillones de bytes de datos al día. ¡Datos increíbles! Casi el 90% de los datos globales se han producido solo en los últimos 2 años. En otras palabras, se están generando datos masivos en poco tiempo como nunca antes se ha logrado en la historia del hombre.
En ese sentido, sabemos con certeza que Big Data ha penetrado en casi todas las industrias hoy en día y es una fuerza impulsora dominante detrás del éxito de las empresas, organizaciones gubernamentales y no gubernamentales en todo el mundo. Pero, en este punto, es importante saber qué es el big data o los grandes datos, traducido al español. Comencemos a hablar del significado big data, tipos de big data, características de big data y ejemplos de las empresas muy conocidas que utilizan el big data.
Significado de Big Data
El significado de Big Data está relacionada a los conjuntos de datos grandes y complejos que deben procesarse y analizarse para descubrir información valiosa que pueda servir a las empresas y organizaciones en la toma de decisiones.
Sin embargo, hay ciertos principios básicos de Big Data que harán que sea aún más simple responder lo que es Big Data:
- Se refiere a una masiva cantidad de datos que sigue creciendo aceleradamente con el tiempo.
- Es tan voluminoso que no puede procesarse ni analizarse utilizando técnicas tradicionales de procesamiento de datos.
- Incluye minería de datos, almacenamiento de datos, análisis de datos, intercambio de datos y visualización de datos.
- El término incluye datos, marcos de datos, junto con las herramientas y técnicas utilizadas para procesar y analizar los datos.
Tipos de Big Data
Ahora que ya conocemos el significado de datos masivos, veamos los 3 tipos de big data:
Estructurado
Estructurado es uno de los tipos de big data y se refieren a datos que pueden procesarse, almacenarse y recuperarse en un formato fijo. Es decir, alude a la información altamente organizada que puede almacenarse y accederse fácilmente y sin problemas desde una base de datos mediante algoritmos simples de motores de búsqueda. Por ejemplo, la tabla de empleados en una base de datos de una organización se estructurará a medida que los detalles del empleado, sus puestos de trabajo, sus salarios, etc., estén presentes de manera organizada.
Desestructurado
Los datos no estructurados se refieren a los datos que carecen de cualquier forma o estructura específica. Esto hace que sea muy difícil y lento procesar y analizar este tipo de datos. El correo electrónico es un ejemplo de datos no estructurados, dado que no están clasificados por items.
Semiestructurada
Semi estructurado es el tercer tipo de big data. Son datos que contienen los dos formatos mencionados anteriormente, es decir, datos estructurados y no estructurados. Para ser precisos, se refiere a los datos que, aunque no se han clasificado en un repositorio particular (base de datos), contienen información vital o etiquetas que segregan elementos individuales dentro de los datos. Los tipos de datos estructurados y no estructurados son los más importantes del big data.
Características de Big Data
Gartner Doug Laney, estratega en data analytics, en el 2001 propuso las 3V de Big Data: variedad, velocidad y volumen. Estas características, de forma aislada, son suficientes para saber qué es big data. Veamos de qué trata cada uno:
Variedad
La variedad de Big Data se refiere a datos estructurados, no estructurados y semiestructurados que se recopilan de múltiples fuentes. Mientras que en el pasado, los datos solo se podían recopilar de hojas de cálculo y bases de datos, hoy los datos se presentan en una variedad de formas, como correos electrónicos, archivos PDF, fotos, videos, audios y mucho más. La variedad es una de las características importantes de big data.
Velocidad
La velocidad se refiere esencialmente a la rapidez en el que se crean los datos en tiempo real. En una perspectiva más amplia, comprende la tasa de cambio, la vinculación de los conjuntos de datos entrantes a diferentes velocidades y las ráfagas de actividad.
Volumen
El volumen es una de las características de big data, dado que sabemos que indica grades ‘volúmenes’ de datos que se generan diariamente a partir de diversas fuentes, como plataformas de redes sociales, procesos comerciales, máquinas, interacciones humanas, etc.
Ejemplos de casos de Big Data
Muchas empresas conocidas hoy en día se han beneficiado del Big Data para incrementar sus ventas a partir de conocer más a sus clientes y adecuar sus productos y servicios para satisfacerlos mejor. A continuación, les presentamos los 5 casos ejemplos de empresas que se valieron del big data.
Walmart
Walmart aprovecha Big Data y Data Mining para crear recomendaciones de productos personalizados para sus clientes. Con la ayuda de estas dos tecnologías emergentes, Walmart puede descubrir patrones valiosos que muestran los productos comprados con mayor frecuencia, los productos más populares e incluso los paquetes de productos más populares (productos que se complementan entre sí y generalmente se compran juntos).
En base a estos conocimientos, Walmart sugiere productos atractivos y personalizados para usuarios individuales. Al implementar eficazmente las técnicas de minería de datos, el gigante minorista ha aumentado con éxito las tasas de conversión y ha mejorado sustancialmente su servicio al cliente. Además, Walmart utiliza las tecnologías Hadoop y NoSQL para permitir a los clientes acceder a datos en tiempo real acumulados de fuentes dispares.
American Express
El gigante de las tarjetas de crédito se vale de enormes volúmenes de datos de clientes para identificar indicadores que podrían representar la lealtad del usuario. También, utiliza Big Data para construir modelos predictivos avanzados para analizar transacciones históricas junto con 115 variables diferentes para predecir la pérdida potencial de clientes. Gracias a las soluciones y herramientas de Big Data, American Express puede identificar el 24% de las cuentas que es muy probable que cierren en los próximos cuatro o cinco meses.
General Electric
En palabras de Jeff Immelt, presidente de General Electric (GE), en los últimos años, GE ha tenido éxito en reunir lo mejor de ambos mundos: «el mundo físico y analítico». GE utiliza a fondo Big Data. Cada máquina que opera bajo GE genera datos sobre cómo funcionan. Luego, el equipo de análisis analiza estas cantidades colosales de datos para extraer información relevante y rediseñar las máquinas y sus operaciones en consecuencia.
La compañía se ha dado cuenta de que incluso las mejoras menores, por pequeñas que sean, juegan un papel crucial en la infraestructura de su compañía. Según las estadísticas de GE, el Big Data tiene el potencial de aumentar la productividad en un 1.5% en los EE. UU., Lo que compilado en un lapso de 20 años podría aumentar el ingreso nacional promedio en un asombroso 30%.
Uber
Uber es uno de los principales proveedores de servicios de taxi en el mundo. Aprovecha los datos del cliente para rastrear e identificar los servicios más populares y más utilizados por los usuarios. Una vez que se recopilan estos datos, Uber utiliza el análisis de datos para analizar los patrones de uso de los clientes y determinar qué servicios deben recibir más énfasis e importancia.
Además de esto, Uber usa Big Data de otra manera única, pues estudia de cerca la demanda y la oferta de sus servicios y cambia las tarifas de los taxis en consecuencia. Es el mecanismo de aumento de precios que funciona de esta manera: suponga que cuando tiene prisa y tiene que reservar un taxi desde un lugar lleno de gente, ¡Uber le cobrará el doble de la cantidad normal!
Netflix
Netflix es una de las plataformas de transmisión de contenido de video en línea más populares bajo demanda utilizada por personas de todo el mundo. Esta empresa es un gran defensor del motor de recomendaciones. Recopila datos del cliente para comprender las necesidades específicas, las preferencias y los patrones de gusto de los usuarios. Luego, utiliza estos datos para predecir qué les gustará a los usuarios individuales y crear listas de recomendaciones de contenido personalizadas para ellos.
Hoy en día, esta empresa tecnológica se ha vuelto tan grande que incluso está creando contenido único para los usuarios. Los datos son el ingrediente secreto que alimenta tanto sus motores de recomendación como las nuevas decisiones de contenido. La información más importante utilizada por Netflix incluyen títulos que los usuarios miran. Asimismo, clasificaciones de usuarios, géneros preferidos y con qué frecuencia los usuarios detienen la reproducción. Hadoop, Hive y Pig son los tres componentes principales de la estructura de datos utilizadas por este negocio.