Una nueva investigación de la Universidad de Montana y sus socios sugiere que la inteligencia artificial puede igualar al 1% de los mejores pensadores humanos en una prueba estándar de creatividad.
El estudio fue dirigido por el Dr. Erik Guzik, profesor clínico asistente en la Facultad de Negocios de la UM. Él y sus socios utilizaron las Pruebas Torrance de Pensamiento Creativo, una conocida herramienta utilizada durante décadas para evaluar la creatividad humana.
Los investigadores enviaron ocho respuestas generadas por ChatGPT, la aplicación impulsada por el motor de inteligencia artificial GPT-4. También presentaron respuestas de un grupo de control de 24 estudiantes de la UM que tomaron las clases de emprendimiento y finanzas personales de Guzik. Estos puntajes se compararon con 2700 estudiantes universitarios a nivel nacional que tomaron el TTCT en 2016. Todas las presentaciones fueron calificadas por Scholastic Testing Service, que no sabía que AI estaba involucrada.
Los resultados colocaron a ChatGPT en la élite de la creatividad. La aplicación de IA se encontraba en el percentil superior en cuanto a fluidez (la capacidad de generar un gran volumen de ideas) y originalidad (la capacidad de generar nuevas ideas). La IA se deslizó un poco, al percentil 97, en cuanto a flexibilidad, la capacidad de generar diferentes tipos y categorías de ideas.
« Para ChatGPT y GPT-4, demostramos por primera vez que se desempeña en el 1% superior en originalidad », dijo Guzik. « Eso era nuevo ».
Le complació notar que algunos de sus estudiantes de UM también se desempeñaron en el 1% superior. Sin embargo, ChatGTP superó a la gran mayoría de los estudiantes universitarios a nivel nacional.
Guzik probó la IA y sus alumnos durante el semestre de primavera. Fue asistido en el trabajo por Christian Gilde de UM Western y Christian Byrge de la Universidad de Vilnius. Los investigadores presentaron su trabajo en mayo en la Conferencia de Creatividad de la Universidad del Sur de Oregón.
« Tuvimos mucho cuidado en la conferencia de no interpretar mucho los datos », dijo Guzik. « Acabamos de presentar los resultados. Pero compartimos pruebas sólidas de que la IA parece estar desarrollando una capacidad creativa a la par o incluso superior a la capacidad humana ».
Guzik dijo que le preguntó a ChatGPT qué indicaría si funcionaba bien en TTCT. La IA dio una respuesta contundente, que compartieron en la conferencia:
« ChatGPT nos dijo que es posible que no entendamos completamente la creatividad humana, lo cual creo que es correcto », dijo. « También sugirió que es posible que necesitemos herramientas de evaluación más sofisticadas que puedan diferenciar entre ideas generadas por humanos y por IA ».
Dijo que el TTCT es material patentado protegido, por lo que ChatGPT no podía « hacer trampa » accediendo a información sobre la prueba en Internet o en una base de datos pública.
Guzik lleva mucho tiempo interesado en la creatividad. Como estudiante de séptimo grado que creció en la pequeña ciudad de Palmer, Massachusetts, estaba en un programa para estudiantes talentosos y dotados. Esa experiencia lo introdujo al proceso de resolución de problemas futuros desarrollado por Ellis Paul Torrance, el psicólogo pionero que también creó el TTCT. Guzik dijo que en ese momento se enamoró de la lluvia de ideas y de cómo aprovecha la imaginación humana, y sigue activo en la organización Future Problem Solving, e incluso conoció a su esposa en una de sus conferencias.
Guzik y su equipo decidieron probar la creatividad de ChatGPT después de jugar con él durante el año pasado.
« Todos habíamos estado explorando con ChatGPT y notamos que había estado haciendo algunas cosas interesantes que no esperábamos », dijo. « Algunas de las respuestas fueron novedosas y sorprendentes. Fue entonces cuando decidimos ponerlo a prueba para ver qué tan creativo es realmente ».
Guzik dijo que la prueba TTCT utiliza indicaciones que imitan las tareas creativas de la vida real. Por ejemplo, ¿puede pensar en nuevos usos para un producto o mejorarlo?
« Digamos que es una pelota de baloncesto », dijo. « Piensa en todos los usos que puedas para una pelota de baloncesto. Puedes lanzarla en un aro y usarla en una exhibición. Si te obligas a pensar en nuevos usos, tal vez la cortes y la uses como macetero. O con un ladrillo puedes construir cosas, o puede usarse como pisapapeles. Pero tal vez lo tritures y lo transformes en algo completamente nuevo ».
Guzik esperaba que ChatGPT fuera bueno para crear muchas ideas (fluidez), porque eso es lo que hace la IA generativa. Y se destacó al responder a la indicación con muchas ideas que eran relevantes, útiles y valiosas a los ojos de los evaluadores.
Le sorprendió más lo bien que lo hizo generando ideas originales, que es un sello distintivo de la imaginación humana. Los evaluadores de la prueba reciben listas de respuestas comunes para un aviso, las que casi se espera que se envíen. Sin embargo, la IA aterrizó en el percentil superior por generar nuevas respuestas.
« En la conferencia, nos enteramos de investigaciones previas sobre GPT-3 que se realizaron hace un año », dijo Guzik. « En ese momento, ChatGPT no puntuaba tan bien como los humanos en tareas que involucraban el pensamiento original. Ahora, con el GPT-4 más avanzado, está en el 1% superior de todas las respuestas humanas ».
Con los avances de la IA acelerándose, espera que se convierta en una herramienta clave para el mundo de los negocios en el futuro y en un nuevo impulsor significativo de la innovación regional y nacional.
« Para mí, la creatividad se trata de hacer las cosas de manera diferente », dijo Guzik. « Una de las definiciones de emprendimiento que amo es que ser emprendedor es pensar de manera diferente. Entonces, la IA puede ayudarnos a aplicar el mundo del pensamiento creativo a los negocios y al proceso de innovación, y eso es simplemente fascinante para mí ».
Dijo que la Facultad de Negocios de la UM está abierta a enseñar sobre IA e incorporarla en los cursos.
« Creo que sabemos que el futuro incluirá la IA de alguna manera », dijo Guzik. « Tenemos que tener cuidado con la forma en que se usa y considerar las reglas y regulaciones necesarias. Pero las empresas ya lo están usando para muchas tareas creativas. En términos de emprendimiento e innovación regional, esto cambia las reglas del juego ».