miércoles, 24 de abril de 2013

BIG DATA para aprender








Todo el mundo sabe que el Internet ha cambiado la forma del funcionamiento de las empresas, la función de los gobiernos, y la propia gente. Pero una nueva tendencia menos visible, tecnológicamente es tan transformadora como internet: la llamada  "Big Data".

Big Data comienza con el hecho de que hay mucha más información flotando alrededor en estos días que nunca antes, y se está poniendo a los nuevos usos extraordinarios.

Big Data es distinta de Internet, a pesar de la Web hace que sea mucho más fácil de recopilar y compartir  los datos. Big data es algo más que la comunicación: la idea es que podemos aprender de una gran cantidad de cosas de información que no podríamos comprender cuando utilizamos solamente cantidades pequeñas.

En el siglo III antes de Cristo, se creía que la Biblioteca de Alejandría albergaba a la suma total del conocimiento humano. Hoy en día, hay suficiente información en el mundo para darle a cada persona viva 320 veces más de lo que los historiadores pensaban que se almacenaba en toda la colección de Alejandría - un valor estimado de 1.200 exabytes. Si toda esta información se coloca apilado  en CDs, ese  CDs formarían cinco montones separados que todo el espacio para llegar a la luna.

Esta explosión de datos es relativamente nuevo. En fecha tan reciente como es el año 2000, sólo una cuarta parte de toda la información almacenada en el mundo era digital. El resto se conservó en papel, en el cine y otros medios análogos de comunicación. Pero debido a que la cantidad de datos digitales se expande tan rápidamente - se dobla alrededor de cada tres años - esa situación se invirtió rápidamente. Hoy en día, menos del dos por ciento de toda la información almacenada es no digital y el 98% es información digital.

Podemos aprender de una gran cantidad de cosas de información que no podríamos comprender cuando utilizamos solamente cantidades pequeñas.

Dada esta escala, se tiene la tentación de comprender los grandes datos exclusivamente en términos de tamaño. Pero eso sería engañoso. Big Data también se caracteriza por la capacidad de producir en los datos muchos aspectos del mundo que nunca se han cuantificado antes, como : " Datafication" llamarlo, por ejemplo, la ubicación se ha datafied, primero con la invención de longitud y latitud, y más recientemente con sistemas de satélites GPS. Las palabras se tratan como datos cuando los equipos minan el valor de libros de los siglos. Incluso las amistades y "likes" se datafied, a través de Facebook.

Este tipo de datos se está poniendo a los nuevos usos increíbles con la ayuda de la memoria del ordenador barato, potentes procesadores, algoritmos inteligentes, software inteligente y matemáticas que toma prestado de las estadísticas básicas.

En lugar de tratar de "enseñar" a una computadora cómo hacer las cosas, como conducir un automóvil o traducir de un idioma a otro, que los expertos de inteligencia artificial han intentado sin éxito hacer por décadas, el nuevo enfoque es alimentar suficientes datos en una computadora para que se puede inferir la probabilidad de que, por ejemplo, un semáforo está en verde y no en rojo, o que, en cierto sentido, Lumiere es un sustituto más adecuado para la "luz" de Léger.

Con grandes volúmenes de información de esta manera se requiere tres cambios profundos en la forma en que nos acercamos a los datos.

La primera consiste en recopilar y utilizar una gran cantidad de datos en lugar de conformarse con pequeñas cantidades o muestras, como los estadísticos han hecho por más de un siglo.

La segunda es para arrojar nuestra preferencia por los datos muy curados y prístina y en lugar de aceptar el desorden: en un número cada vez mayor de situaciones, un poco de falta de precisión puede ser tolerada, ya que los beneficios de usar mucho más datos de calidad variable son mayores que los costos de la utilización de menores cantidades de datos muy exactos.

El tercer lugar,  que en muchos casos, tendremos que abandonar nuestra búsqueda para descubrir la causa de las cosas, a cambio de la aceptación de las correlaciones. Con grandes volúmenes de datos, en lugar de tratar de entender exactamente por qué un motor se rompe o qué efecto secundario desaparece de una droga, los investigadores en su lugar pueden recoger y analizar cantidades masivas de información sobre este tipo de eventos y todo lo que se asocia con ellos, en busca de patrones que podrían ayudar predecir acontecimientos futuros. Big Data ayuda a responder : qué, por qué, y muchas veces eso es suficiente.

El Internet se ha reformado como se comunica la humanidad. Big Data es diferente: marca una transformación en la forma en que la sociedad procesa la información. Con el tiempo, grandes volúmenes de datos pueden cambiar nuestra forma de pensar sobre el mundo. Como hacemos tapping cada vez más datos para entender los acontecimientos y tomar decisiones, es probable que descubra que muchos aspectos de la vida son probabilísticos y no muy seguros.

SE ACERCA "N = ALL"

Durante la mayor parte de la historia, la gente ha trabajado con cantidades relativamente pequeñas de datos, ya que las herramientas para recopilar, organizar, almacenar y analizar la información eran pobres. La gente aventaban la información que confiar en que el mínimo estricto para que pudieran examinarlo con mayor facilidad. Este fue el genio de las estadísticas de hoy en día, que vino por primera vez a la luz a finales del siglo XIX y permitió a la sociedad a entender realidades complejas, incluso cuando existían pocos datos.

Hoy en día, el entorno técnico ha cambiado 179 grados. Todavía es, y siempre será, una restricción de la cantidad de datos que podemos manejar, pero es mucho menos limitado de lo que solía ser y será cada vez menos a medida que pasa el tiempo.