“Nunca he encontrado una persona tan ignorante que no pueda aprender algo de ella.”

martes, 7 de marzo de 2017

BIG DATA

¿Hemos utilizado alguna vez la expresión exabyte?
Bien, no creo. Exabyte equivale a 1018   bytes. ¿Enorme, no? Más allá de eso, quintillones de bytes (10 30).
Esa es la cantidad de información que maneja Big Data, diariamente. Big Data, para que no entendamos, se refiere a toda esa cantidad de información que es imposible de tratar por medios tradicionales.
Además de que el mundo genera día a día una cantidad inconmensurable de información, genera una gran variedad de ella, ya que los datos pueden ser muy distintos. Por eso, los métodos tradicionales de análisis de información son poco útiles, no abarcan tanta cantidad.
Toda esta información proviene de las cantidades de procesos tanto industriales, como bancarios, como comerciales, etc, que suponen el día a día de los millones de personas que habitan en la Tierra. Además, con el creciente uso de la tecnología, esta cantidad de datos se verá aumentadas un 78% anualmente. 
Y no solo hablamos de información proveniente de humanos, sino que las máquinas, entre ellas, también intercambian información.
Asimismo, existen distintos tipos de información dependiendo de su procedencia, por lo que podemos clasificarlos de la siguiente manera:
1.- Web and Social Media: Incluye contenido web e información que es obtenida de las redes sociales como Facebook, Twitter, LinkedIn, etc, blogs.
2.- Machine-to-Machine (M2M): M2M se refiere a las tecnologías que permiten conectarse a otros dispositivos. M2M utiliza dispositivos como sensores o medidores que capturan algún evento en particular (velocidad, temperatura, presión, variables meteorológicas, variables químicas como la salinidad, etc.) los cuales transmiten a través de redes alámbricas, inalámbricas o híbridas a otras aplicaciones que traducen estos eventos en información significativa.
3.- Big Transaction Data: Incluye registros de facturación, en telecomunicaciones registros detallados de las llamadas , etc.
4.- Biometrics: Información biométrica en la que se incluye huellas digitales, escaneo de la retina, reconocimiento facial, genética, etc. En el área de seguridad e inteligencia, los datos biométricos han sido información importante para las agencias de investigación.
5.- Human Generated: Las personas generamos diversas cantidades de datos como la información que guarda un call center al establecer una llamada telefónica, notas de voz, correos electrónicos, documentos electrónicos, estudios médicos, etc.
Para que los datos se consideren Big Data deben de cumplir las "5 uves".
-Volumen. Se necesitan máquinas y programas para tratarlos.
-Velocidad. A veces es tan alta que no tenemos tiempo para recibirlos y procesarlos para que resulten útiles, y "caducan".
-Variedad. Provenientes de múltiples fuentes.
-Veracidad. Tienen que ser precisos y reales, sin ningún tipo de error.
-Valor. Capacidad que tiene de aportar ventajas tangibles a nuestro proyecto o negocio.

Es fundamental entender que Big Data tiene un propósito, que es producir beneficios y mejorar el ritmo de cada negocio.