Decisions humanes i soroll.
Los profesionales de muchas organizaciones son asignados arbitrariamente a casos: tasadores en agencias de calificación crediticia, médicos en salas de emergencia, aseguradores de préstamos y seguros, y otros. Las organizaciones esperan coherencia de estos profesionales: los casos idénticos deben tratarse de manera similar, si no idéntica. El problema es que los humanos son tomadores de decisiones poco fiables; sus juicios están fuertemente influenciados por factores irrelevantes, como su estado de ánimo actual, el tiempo transcurrido desde su última comida y el clima. Llamamos a la variabilidad casual de los juicios ruido.
Algunos trabajos están libres de ruidos. Los empleados de un banco o de una oficina de correos realizan tareas complejas, pero deben seguir reglas estrictas que limiten el juicio subjetivo y garanticen, por diseño, que los casos idénticos se tratarán de forma idéntica. Por el contrario, los profesionales médicos, los oficiales de préstamos, los gerentes de proyectos, los jueces y los ejecutivos hacen decisiones, que se guían por la experiencia informal y los principios generales en lugar de por reglas rígidas. Y si no llegan exactamente a la misma respuesta que cualquier otra persona en su función, es aceptable; esto es lo que queremos decir cuando decimos que una decisión es «una cuestión de juicio». Una empresa cuyos empleados ejercen su criterio no espera que las decisiones estén totalmente libres de ruido. Pero a menudo el ruido es muy por encima el nivel que los ejecutivos considerarían tolerable, y lo desconocen por completo.
La prevalencia del ruido se ha demostrado en varios estudios. Los investigadores académicos han confirmado en repetidas ocasiones que los profesionales a menudo contradicen sus propios juicios anteriores cuando se les dan los mismos datos en diferentes ocasiones. Por ejemplo, cuando a los desarrolladores de software se les pidió en dos días distintos que estimaran el tiempo de finalización de una tarea determinada, las horas que proyectaron difirieron en un 71%, en promedio. Cuando los patólogos realizaron dos evaluaciones de la gravedad de los resultados de la biopsia, la correlación entre sus calificaciones fue de solo 0,61 (de un 1,0 perfecto), lo que indica que fueron inconsistentes diagnostica con bastante frecuencia. Es aún más probable que los juicios emitidos por personas diferentes diverjan. Las investigaciones han confirmado que, en muchas tareas, las decisiones de los expertos son muy variables: valoración de acciones, tasar bienes raíces, condenar a criminales, evaluar el desempeño laboral, auditoría de estados financieros, y mucho más. La conclusión inevitable es que los profesionales suelen tomar decisiones que se desvían significativamente de las de sus pares, de sus propias decisiones anteriores y de las reglas que ellos mismos dicen seguir.
Desde hace tiempo se sabe que las predicciones y decisiones generadas por algoritmos estadísticos simples suelen ser más precisas que las realizadas por expertos, incluso cuando los expertos tienen acceso a más información que la que utilizan las fórmulas. Es menos conocido que la ventaja clave de los algoritmos es que están libres de ruido: a diferencia de los humanos, una fórmula siempre devolverá el mismo resultado para cualquier entrada dada. La consistencia superior permite que incluso los algoritmos simples e imperfectos logren una mayor precisión que los profesionales humanos.
La solución más radical al problema del ruido es reemplazar el juicio humano por reglas formales, conocidas como algoritmos, que utilizan los datos sobre un caso para producir una predicción o una decisión. Las personas han competido contra algoritmos en varios cientos de concursos de precisión durante los últimos 60 años, en tareas que van desde predecir la esperanza de vida de pacientes con cáncer para predecir el éxito de estudiantes de posgrado. Los algoritmos fueron más precisos que los profesionales humanos en aproximadamente la mitad de los estudios, y se relacionaron aproximadamente con el humanos en los demás. Los empates también deberían contar como victorias para los algoritmos, que son más rentables.
La suposición común es que los algoritmos requieren un análisis estadístico de grandes cantidades de datos. Por ejemplo, la mayoría de las personas con las que hablamos creen que los datos sobre miles de solicitudes de préstamos y sus resultados son necesarios para desarrollar una ecuación que prediga los incumplimientos de los préstamos comerciales. Muy pocos saben que se pueden desarrollar algoritmos adecuados sin ningún dato de resultados y con información de entrada solo en un pequeño número de casos. Las fórmulas predictivas que se crean sin datos de resultados las denominamos «reglas razonadas» porque se basan en un razonamiento de sentido común.
El resultado sorprendente de muchas investigaciones es que, en muchos contextos, las reglas razonadas son tan precisas como los modelos estadísticos construidos con datos de resultados. Los modelos estadísticos estándar combinan un conjunto de variables predictivas, a las que se les asignan ponderaciones en función de su relación con los resultados previstos y entre sí. Sin embargo, en muchas situaciones, estos pesos son estadísticamente inestables y prácticamente no tienen importancia. Es probable que una regla sencilla que asigne ponderaciones iguales a las variables seleccionadas sea igual de válida. Los algoritmos que ponderan las variables por igual y no dependen de los datos de resultados han demostrado tener éxito en selección de personal, previsión electoral, predicciones sobre partidos de fútbol, y otras aplicaciones.
Por incómoda que la gente pueda estar con la idea, los estudios han demostrado que, si bien los humanos pueden proporcionar información útil a las fórmulas, los algoritmos funcionan mejor en el papel de decisor final. Si el único criterio es evitar errores, se debe recomendar encarecidamente a los administradores que anulen el algoritmo solo en circunstancias excepcionales.
Daniel Khaneman, Ruido: cómo superar el alto costo oculto de la toma de decisiones incoherente, Harvard Business Review, edición Octubre 2016
Comentaris