Les dificultats d'interpretar les dades del 'big data'.
Hay que entender es que existe una gran distancia entre los datos y la informaciĆ³n. Producimos una inmensa cantidad de datos, pero eso no significa que estemos haciendo mĆ”s o mejor informaciĆ³n. Por ejemplo: gracias al procesador de texto, hoy en dĆa escribir es mĆ”s fĆ”cil que nunca, si lo comparamos con el esfuerzo que tenĆa que hacer Cervantes para escribir. Pero no estamos haciendo mĆ”s literatura de calidad que en tiempos de Cervantes. Yo creo que podemos aprender mucho de los datos, pero se ha sobrevendido su potencial de tener un contenido informativo.
Hay muchas cosas que la tecnologĆa no te puede hacer. Las estadĆsticas te dicen que la mayorĆa de los que mueren ahogados en el ocĆ©ano son muy buenos nadadores. Con esos datos en la mano, si te preguntas si debes enseƱar a tus hijos a nadar, la respuesta es no. Y no hay tecnologĆa que puedas usar ni datos que puedas recolectar que expliquen la decisiĆ³n de quien fuera que saliese a nadar y se pusiera a sĆ mismo en peligro. Puede que haya sobreestimado su habilidad, ¡pero eso no lo puedo saber! ¿QuĆ© soluciĆ³n te propone el big data? Agarrar a todos los niƱos de Madrid, tirarles a cinco kilĆ³metros de la costa y llegar a la conclusiĆ³n, correcta, de que el que nada peor se ahoga antes y que no saber nadar no te salva de morir ahogado, asĆ que hay que enseƱar a los niƱos a nadar. Pero no creo que debiĆ©ramos llegar a ese punto para tener esa respuesta [rĆe]. Hay mĆ”s fondos de capital riesgo que han quebrado tras usar big data que fondos que han triunfado. Y estamos hablando del sector financiero: gente muy inteligente.
Me parece un error gravĆsimo la gente que dice que los datos hablan por sĆ solos: los datos nunca hablan por sĆ solos. Los datos son como los criminales: puedes hacerlos confesar, pero no siempre te van a dar la informaciĆ³n que tĆŗ quieres.
Lo que tratamos es buscar la informaciĆ³n mĆ”s relevante; por ejemplo, lo que hacemos con los precios. Junto a Alberto Cavallo, otro profesor en el MIT, llevamos 12 aƱos coordinando un proyecto de mejorar la recolecciĆ³n de datos estadĆsticos a travĆ©s de las nuevas tecnologĆas. Pongamos el caso de Amazon, que vende cerca de 53 millones de productos. ImagĆnate que quiero medir cuĆ”nto han cambiado los precios en Amazon. Yo tengo la capacidad de bajar toda esa informaciĆ³n; no me supone ningĆŗn problema. Pero algo mĆ”s de 22 millones de esos productos son libros o mĆŗsica. Y solo 500 de esos libros representan mĆ”s del 90% de las ventas. Yo solo necesito esos 500 libros para obtener un dato relevante. ¿Para quĆ© bajarse el resto? Es totalmente inĆŗtil. Es un ejemplo de que no se trata de fuerza bruta.
No hay una carrera universitaria de anĆ”lisis de datos. Y quien se dedique a esto va a necesitar un poco de conocimiento de ingenierĆa tĆ©cnica, un poco de economĆa, un poco de sociologĆa, un poco de psicologĆa... y eso todavĆa no existe.
Que estamos hablando de la revoluciĆ³n de datos, pero en muchos casos falta conocimiento a la hora de saber quĆ© es informaciĆ³n. Una empresa te puede recoger un montĆ³n de datos y vendĆ©rtelos. TĆŗ, como no tienes ni idea, te crees que con esos datos puedes aprender de todo. Pero cuando no hay gente que sepa cĆ³mo preguntar a esos datos, se hacen preguntas al azar. Y cuando haces preguntas al azar, obtienes respuestas al azar. Si lo Ćŗnico que te han vendido es un par de correlaciones mal hechas, tomas decisiones equivocadas basadas en esos datos. Y fracasas. Hay gente invirtiendo muchĆsimo dinero en recolectar datos, pero no saben que cuando mĆ”s datos tienes mĆ”s difĆcil es procesarlos, y se quedan sentados sin saber quĆ© hacer con ellos. Eso son recursos que se pierden.El problema es que, ahora mismo, las empresas que saben usar los datos de forma eficiente son como cinco”
Thiago Ferrer Morini, entrevista a Roberto Rigobon (extracto): "El tener mĆ”s datos no quiere decir que haya mejor informaciĆ³n", Negocios. El PaĆs, 26/10/2014
Comentaris