¿Qué tanto sabemos realmente sobre la pareidolia, el fenómeno de ver caras y patrones en objetos cuando en realidad no están allí? Un nuevo estudio del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT profundiza en este fenómeno y presenta un extenso conjunto de datos etiquetados por humanos de 5000 imágenes pareidólicas, que supera con creces las colecciones anteriores. Vale la pena destacar que, con este conjunto de datos, el equipo descubrió diversos resultados sorprendentes sobre las diferencias entre la percepción humana y la de las máquinas, y sobre cómo la capacidad de ver rostros en una tostada podría haber salvado la vida de nuestros parientes lejanos.
Estos son los datos destacados que debe conocer acerca de la pareidolia
“La pareidolia facial ha fascinado a los psicólogos durante mucho tiempo, pero ha sido poco explorada en la comunidad de visión artificial”, comentó Mark Hamilton, estudiante de doctorado en ingeniería eléctrica y ciencias de la computación del MIT, afiliado de CSAIL e investigador principal del trabajo.
Así mismo añadió, “Queríamos crear un recurso que pudiera ayudarnos a comprender cómo los humanos y los sistemas de IA procesan estos rostros ilusorios”.
¿Qué revelaron entonces todas estas caras falsas? En primer lugar, los modelos de Inteligencia Artificial (IA) no parecen reconocer las caras pareidólicas como lo hacemos nosotros. Sorprendentemente, el equipo descubrió que no fue hasta que entrenaron algoritmos para reconocer caras de animales que estos mejoraron significativamente en la detección de caras pareidólicas. Es de resaltar que, esta conexión inesperada sugiere un posible vínculo evolutivo entre nuestra capacidad para detectar caras de animales (crucial para la supervivencia) y nuestra tendencia a ver caras en objetos inanimados.
Ahora bien, es crucial destacar que otro descubrimiento intrigante es lo que los investigadores denominan la “Zona Ricitos de Oro de la Pareidolia”, una clase de imágenes en las que es más probable que se produzca la pareidolia.
Para descubrirlo, el equipo desarrolló una ecuación que modela cómo las personas y los algoritmos detectan los rostros ilusorios. Al analizar esta ecuación, hallaron un claro “pico pareidólico” en el que la probabilidad de ver rostros es mayor, correspondiente a imágenes que tienen “la cantidad justa” de complejidad. Esta “Zona de Ricitos de Oro” predicha se validó luego en pruebas con sujetos humanos reales y sistemas de detección de rostros con Inteligencia Artificial.
Este nuevo conjunto de datos, “Rostros en las cosas”, eclipsa a los de estudios anteriores que habitualmente usaban solo 20-30 estímulos. Esta escala permitió a los investigadores poder explorar cómo se comportaban los algoritmos de detección de rostros de última generación luego de ajustarlos en rostros pareidólicos, mostrando que no solo se podían editar estos algoritmos para detectar estos rostros, sino que también podían actuar como un sustituto de silicio para nuestro propio cerebro, lo que permitió al equipo hacer y así mismo, responder preguntas sobre los orígenes de la detección de rostros pareidólicos que son imposibles de hacer en humanos.
No se debe pasar por alto mencionar que para construir este conjunto de datos, el equipo seleccionó alrededor de 20.000 imágenes candidatas del conjunto de datos LAION-5B, que posteriormente fueron etiquetadas y evaluadas meticulosamente por anotadores humanos. Este proceso implicó dibujar cuadros delimitadores alrededor de los rostros percibidos y responder preguntas detalladas sobre cada rostro, como la emoción percibida, la edad y así mismo, si el rostro era accidental o intencional.
“Recopilar y anotar miles de imágenes fue una tarea monumental. Gran parte del conjunto de datos debe su existencia a mi madre, una banquera jubilada, que pasó incontables horas etiquetando amorosamente las imágenes para nuestro análisis”, comentó Hamilton.
Es importante destacar que el estudio también tiene aplicaciones potenciales en la mejora de los sistemas de detección de rostros mediante la reducción de falsos positivos, lo que podría tener implicaciones para campos como; los coches autónomos, así como la interacción hombre-ordenador y del mismo modo, la robótica.
El conjunto de datos y los modelos también podrían ayudar en áreas como lo sonÑ el diseño de productos, donde la comprensión y el control de la pareidolia podrían crear mejores productos.
Lo cierto es que, mientras los investigadores se preparan para compartir su conjunto de datos con la comunidad científica, ya están mirando hacia el futuro. El trabajo futuro puede implicar el entrenamiento de modelos de visión y lenguaje para comprender y describir rostros pareidólicos, lo que podría conducir a sistemas de Inteligencia Artificial (IA) que puedan interactuar con estímulos visuales de formas más parecidas a las humanas.