Esta IA aprendió que debe comprar 10 mil Magikarp en Pokémon Rojo y esto revela todo lo que aprendió de los jugadores
Santiago Díaz Benavides
Lector adicto, miope curioso y cinéfilo. Una vez tuve una columna de cine que nadie leyó. Todos dicen que me parezco a El Profesor.

Después de miles de pruebas, una IA llegó a la extraña conclusión de que debía comprar Magikarp cada vez que tenía la oportunidad.

VidaExtra

La inteligencia artificial continúa asombrando al mundo. Un reciente experimento en Pokémon Rojo ha revelado que, después de miles de horas de simulaciones, una IA desarrolló un curioso patrón: comprar 10.000 Magikarp en sus partidas. Aunque esta decisión parece absurda, el comportamiento refleja más de lo que parece y nos ofrece una ventana única a cómo las IA aprenden y, sorprendentemente, qué pueden revelar sobre los propios jugadores humanos.

El proyecto fue dirigido por Peter Whidden, quien utilizó un sistema de aprendizaje automático para entrenar a la IA con el objetivo de avanzar en Pokémon Rojo. Tras más de 50.000 horas de simulación y 20.000 partidas, Whidden descubrió que la IA había desarrollado estrategias curiosamente similares a las de los jugadores humanos, entre ellas, la compulsión por comprar el Magikarp, un Pokémon de bajo nivel que un NPC vende por 500 Pokécuartos. A lo largo de las pruebas, la IA adquirió el Magikarp unas 10.000 veces, lo que resultaba completamente ilógico desde una perspectiva humana.

VidaExtra

Este comportamiento tan particular no es un simple fallo del sistema, sino que refleja una interpretación basada en los datos recibidos. A medida que la IA aprendía del entorno, su objetivo era maximizar las recompensas inmediatas, y la compra de Magikarp, una criatura que superaba en nivel a la mayoría de su equipo, se tradujo en una ganancia de puntos que el algoritmo de la IA interpretaba como un avance positivo. A pesar de que Magikarp es conocido por su inutilidad en combate hasta su evolución en Gyarados, la IA repetía la compra una y otra vez, ya que le brindaba una recompensa fácil.

El sistema de aprendizaje utilizado por Whidden no solo replicaba la mecánica del juego, sino también la lógica humana detrás de la toma de decisiones. La IA, que inicialmente no sabía qué hacer, fue “aprendiendo” a partir de imágenes del juego y las recompensas asociadas. Cada vez que identificaba algo novedoso o diferente, recibía puntos. Así, compraba Magikarp una y otra vez porque era una acción rápida y le otorgaba una recompensa inmediata.

VidaExtra

Este comportamiento refleja un aspecto fascinante del ser humano: la tendencia a tomar decisiones fáciles o de corto plazo, aunque no siempre sean las más efectivas. El paralelismo entre la IA y los jugadores es evidente. Muchas veces, los humanos optamos por soluciones inmediatas que nos proporcionan una gratificación rápida, aunque no sean las mejores opciones a largo plazo. Este tipo de decisiones, comunes en muchos videojuegos, son replicadas por la IA a lo largo de las pruebas, lo que demuestra cómo las máquinas pueden aprender y, en cierta medida, imitar nuestros propios errores.

Además de la obsesión por Magikarp, la IA también mostró otros comportamientos curiosos. Por ejemplo, aprendió a evitar entrar en Centros Pokémon después de que, en una ocasión, accidentalmente depositara a todos sus Pokémon en la caja de almacenamiento, una acción que resultaba catastrófica para su avance en el juego. Este "trauma" llevó a la IA a evitar los Centros Pokémon, un comportamiento que su creador tuvo que corregir ajustando las recompensas para que volver al centro se viera como algo positivo.

VidaExtra

El experimento de Whidden no solo ofrece una visión interesante sobre los límites del aprendizaje automático, sino también sobre cómo las IA, al igual que los seres humanos, pueden caer en patrones repetitivos o erróneos si no se ajustan sus incentivos de forma adecuada. Comprar 10.000 Magikarp puede parecer absurdo, pero también es un reflejo de cómo enfrentamos la toma de decisiones y, en ocasiones, nos aferramos a lo conocido o lo fácil, sin importar las consecuencias.

Al final, este proyecto deja en claro que la IA no solo aprende del entorno, sino que, en cierto modo, también refleja nuestras propias debilidades y hábitos. Una lección que puede ser tan sorprendente como instructiva en el desarrollo de futuras tecnologías.

facebook Tweet
Noticias relacionadas
Back to Top