Big Data i predictibilitat dels comportaments humans.
Los datos que se obtienen de teléfonos móviles, redes sociales o sitios como Netflix son claro ejemplo de Big Data propicio para ser analizado para muy diversos propósitos. Los datos de geolocalización que se capturan a través de teléfonos móviles puede ayudar a mapear epidemias. Global Pulse, un fabuloso proyecto de Big Data de la ONU, estima mediante búsquedas en Google los flujos migratorios y complementa estadísticas nacionales; se trata de uno de entre muchos otros proyectos humanitarios. En estudios económicos es posible realizar proyecciones bursátiles y detectar la inflación al rastrear los precios, como lo hace el proyecto The Billion Prices Project del Tecnológico de Massachusetts.
Sin embargo, en la trama que mantiene actualmente a Facebook contra la pared, 50 millones de perfiles de ciudadanos estadounidenses fueron extraídos de la red social por un tercero, el académico Aleksandr Kogan, quien trabajó en 2014 para la consultora. Kogan, mediante una app, que supuestamente predecía la personalidad de los usuarios, obtuvo los datos a través de los comunes tests rápidos, aparentemente inofensivos, que solemos contestar en la red social. Si usted es de los que responde cuestionarios como: ¿Qué Pokémon eres? o ¿A qué artista de Hollywood te pareces? usted se divirtió, pero sus ejecutores lo hicieron más al coleccionar sus datos. Los datos recogidos por Kogan fueron usados por Cambridge Analytica para dirigir campañas en favor de Trump, pero ¿la ciencia de datos puede manipular a los electores y hacer ganar a un candidato?
La pregunta es si mediante los datos de Facebook se pueden implementar campañas dirigidas que modifiquen el comportamiento humano. Hay poco consenso sobre la fiabilidad de los datos de redes sociales para proyectar resultados electorales como lo ha demostrado el investigador de la Universidad de Oviedo Daniel Gayo Avello en uno de los artículos científicos más citados por la investigación de estos temas. Twitter es la red más analizada en este sentido y el consenso es que no es una red representativa del electorado trátese de cualquier democracia. Además, podríamos catalogar a esta red como replicante, pues la opinión es detonada por pocos usuarios y se disemina con base en réplicas (retuits).
La psicología ha realizado experimentos como el de Michael Kosinski y su famoso test en el que mediante un algoritmo correlaciona datos de nuestro historial en redes sociales con tipos de personalidad y conductas. Es un experimento innovador que podría ser aplicado a algunos casos de manera exitosa pero no está exento de fallas. Según su algoritmo, yo soy un hombre joven; no soy ni lo uno ni lo otro.
En tanto, la sociología política desde los tiempos de la radio y la televisión señala que los públicos nos son hojas en blanco y que la decisión electoral depende de un sin fin de factores sociales y psicológicos como para atribuir a los medios o a los contenidos en Facebook un poder escalofriante. En lo que sí hay consenso es en el reforzamiento de creencias políticas: quienes simpatizaban con Trump habrán reforzado su afinidad preexistente gracias a la propaganda focalizada que llegó a sus muros.
Los fenómenos sociopolíticos son poco predecibles dice el investigador de la Universidad de California Martin Hilbert en coincidencia con otros investigadores como el profesor alemán Andreas Jungherr, pues aseguran que están sometidos a la contingencia y a una gran cantidad de variables poco controlables. Otro tema controversial es el de la validez y veracidad de los datos así como la forma como fueron recabados, tópico abordado por otros investigadores multicitados en la literatura especializada como Danah Boyd y Kate Crawford.
Estos límites no obstan para reconocer el valor de la ciencia de datos para acciones humanitarias, económicas y de salud pública, de las cuales hay evidencias exitosas, pero por ahora las conductas políticas parecen mucho más complejas de lo que se piensa, como para dar por hecho su efectividad.
No hay laboratorio universitario, organismo mundial ni industria que no invierta esfuerzos humanos y millonarias cifras para construir el conocimiento especializado que requiere la sociedad de este siglo, aunque por ahora nada ofrezca certezas absolutas de que los grandes datos nos conducirán a un mundo de decisiones precisas y, sobre todo, que beneficien a la humanidad. Lo realmente preocupante en este episodio tecnológico es el manejo poco escrupuloso de los datos en manos de Facebook. Basta ver sus pérdidas en la bolsa y la reacción de la Comisión Federal de Comercio de Estados Unidos que amenaza con tomar medidas para proteger a los datos de millones consumidores. Facebook deberá invertir en los próximos años sumas millonarias en inteligencia artificial, no solo para capitalizar la energía social como lo ha hecho hasta ahora, sino para proteger a sus usuarios del mal uso de su información; sobre todo deberá endurecer sus políticas de compartición de datos con terceros, además de colaborar con otras empresas y gobiernos para de manera colaborativa contribuir a frenar el problema.
Mientras tanto, la discusión tecnocientífica continúa y se concentra en obtener evidencias para poder afirmar que los datos ayudan a predecir fenómenos complejos, entre estos políticos, pero también ya empieza a enfocarse en las consecuencias humanas de la datificación en la que sobran anécdotas y falta mesura, responsabilidad y transparencia.
María Elena Meneses, Cambridge Analytica y los alcances de la ciencia de datos, Letras Libres 09/0472018
Comentaris