IA, cognición humana y juegos de estrategia

Ilustración: Víctor Solís

En 1912, el inventor español Leonardo Torres Quevedo construyó una máquina
autómata capaz de jugar ajedrez y vencer a sus contrincantes de carne y hueso, conocida como “El ajedrecista”. Aunque sólo podía jugar con tres piezas en el tablero, esta innovación anticipaba la posibilidad de que una máquina pudiera competir contra humanos en juegos de estrategia.

El primer hito significativo en la competencia entre humanos e inteligencia artificial (IA) en estos juegos ocurrió en 1997, cuando Deep Blue de IBM derrotó al campeón
mundial de ajedrez Garry Kasparov. Años más tarde, en 2016, AlphaGo de DeepMind
venció al campeón mundial de Go, Lee Sedol. De manera similar, la IA como OpenAI
Five, que juega Dota; y AlphaStar, que domina StarCraft II, han demostrado una
gran capacidad para resolver problemas, en tiempo real, en videojuegos de estrategia
modernos. ¿Qué implica que las máquinas superen a los humanos en juegos que
requieren estrategia?, ¿estos sistemas son realmente inteligentes?

La evolución desde “El ajedrecista” hasta las IA modernas refleja no sólo avances tecnológicos, sino también una búsqueda por comprender la cognición humana —el pensamiento, el aprendizaje, la memoria, el juicio— y cómo empleamos estos procesos para tomar decisiones estratégicas.

La inteligencia detrás de la estrategia

Tanto el cerebro humano como las máquinas procesan y utilizan información para reducir la cantidad de incertidumbre asociada a un evento. En el cerebro, esta información se puede manifestar como pensamientos, emociones y recuerdos; mientras que en las máquinas, en datos binarios, redes neuronales y algoritmos. En los juegos de estrategia, esta información se presenta como tableros, piezas y reglas. Y una de las tareas que el jugador debe hacer es tomar decisiones que maximicen la probabilidad de ganar dentro de las normas establecidas. Sin embargo, la complejidad radica en la enorme cantidad de posibles movimientos y estados futuros en cada jugada.

Algunos investigadores, influenciados por concepciones filosóficas de la
mente postuladas por Descartes, consideraban que la inteligencia humana se asemejaba a un sistema mecánico que procesa bits a través de algoritmos definidos
por pasos secuenciales y lógicos. No obstante, el cerebro humano demuestra una
capacidad notable para procesar información de manera simultánea a través de
múltiples unidades. Por ejemplo, al observar un objeto, podemos analizar su color,
forma y posición de forma paralela. Este procesamiento paralelo, inspirado por el
sistema visual animal, ha contribuido al desarrollo de modelos de IA modernos, como las redes neuronales artificiales y el aprendizaje profundo. Las redes neuronales artificiales emulan el procesamiento paralelo del cerebro, donde múltiples neuronas operan de forma simultánea para relevar información. En los modelos artificiales, las “neuronas” (conocidas como nodos) están interconectadas a través de circuitos complejos que se activan o inhiben según la información recibida, similar a una neurona humana. Como señaló Donald Hebb en The Organization of Behavior: A Neuropsychological Theory, cuando ciertas neuronas se activan juntas, sus conexiones se fortalecen, lo que es igual a que “las neuronas que se activan juntas, se conectan juntas”. Este principio es fundamental en cómo los humanos formamos memorias y aprendemos: es más fácil aprender un tema si reforzamos las neuronas y circuitos que almacenan los conceptos necesarios para entenderlo. Posterior a reforzar este tema y sus conceptos, podemos usar esta información para tomar decisiones estratégicas y flexibles que se adapten a las demandas cambiantes de los juegos de estrategia.

De manera análoga, las IA utilizan grandes conjuntos de datos para ajustar y optimizar decisiones automáticamente (machine learning), al modular la función de activación de sus circuitos neuronales en el proceso de aprendizaje. Por ejemplo, AlphaZero de DeepMind aprendió a dominar el ajedrez jugando contra sí mismo y ajustando sus estrategias en función de los resultados. Este proceso computacional, conocido como aprendizaje por refuerzo, permite planificar estrategias para maximizar una meta y ayuda a las máquinas a realizar la toma de decisiones. Este fenómeno es similar al aprendizaje por reforzamiento en animales, y se explica de manera elegante y sencilla en la ley del efecto de Thorndike, la cual establece que “las acciones que producen consecuencias favorables son más propensas a ser repetidas en el futuro, mientras que las acciones que producen consecuencias que se perciben como negativas, se evitan”.

Las máquinas modernas, mediante estos algoritmos de aprendizaje por refuerzo,
pueden ajustar su toma de decisiones para maximizar recompensas a largo plazo, lo
que es crucial en juegos de estrategia, donde una acción temprana puede influir de
múltiples formas el resultado final. Por ejemplo, en el juego de Go, evaluar todas las
posibles secuencias de tres movimientos futuros implica considerar 46,655,640 (361×360×359) situaciones posibles. Una máquina, como AlphaGo, puede analizar estas posibilidades en segundos, anticipando y ajustando estrategias en tiempo real para maximizar sus probabilidades de ganar.

Además del aprendizaje por refuerzo, los aspectos cognitivos como la atención y la memoria son cruciales en los juegos de estrategia. Por un lado, la atención es la
capacidad de enfocarse en estímulos o tareas importantes, ignorando la información
irrelevante. En los juegos de este tipo es prioridad dedicar atención a amenazas y oportunidades relevantes mientras se descartan jugadas que no contribuyen a los
objetivos. De manera análoga, las máquinas simulan la atención al centrarse en las
partes críticas de un problema utilizando métodos como los árboles de decisiones o
mecanismos de atención en redes neuronales, los cuales permiten filtrar opciones
menos prometedoras y priorizar aquellas que maximizan la meta. De este modo, no se tienen que considerar todas las posibles jugadas. Sin embargo, este proceso no es
equivalente a la atención humana, ya que no implica una atención guiada por juicio sino por evaluaciones cuantitativas.

Por otro lado, aunque hemos visto cómo la IA puede “observar el presente” (atención), analizar múltiples decisiones y sus probabilidades de éxito o fracaso (aprendizaje por refuerzo), y ajustar sus estrategias en tiempo real (toma de decisiones), aún falta explicar cómo la IA puede “recordar el pasado” y aprender de estas experiencias. Aquí es donde entra el proceso de la memoria episódica, que almacena eventos (o episodios) específicos con su contexto y tiempo. Un ejemplo de este tipo de memoria y cómo facilita el aprendizaje sería el siguiente: “El sábado pasado jugué una partida de ajedrez en la que perdí porque intenté una estrategia inspirada en Harry Potter, pero aprendí que sacrificar a la reina no funciona contra un rival que ya vio la película”. A pesar de que las IA no tienen memoria episódica como los humanos —en lugar de recordar “momentos”, recuperan datos—, estas “experiencias” pasadas les permiten ajustar su desempeño futuro, pero sin el componente narrativo o contextual que define la memoria humana.

Aunque la IA ha avanzado en aspectos que emulan nuestra inteligencia, hay
capacidades humanas que aún no puede replicar pues los humanos no sólo
tomamos decisiones para maximizar la eficiencia o ganar, regresando al punto
pendiente del inicio del texto. Como señala el maestro internacional Levy Rozman, a menudo los jugadores eligen movimientos influenciados por factores emocionales o
estéticos para disfrutar y apreciar la belleza de la partida. Somos seres sociales,
emocionales y subjetivos, características difíciles de replicar en una máquina, pero que en los humanos guían nuestras decisiones. Bobby Fischer no sólo jugaba para ganar, también disfrutaba “destruir el ego de su oponente”. Mijaíl Tal decía que “una partida [de ajedrez] sin errores es una partida sin color”. Danil “Dendi” Ishutin encuentra en Dota 2 una forma de sumergirse y olvidar el dolor. Estas perspectivas muestran que buscamos más que un resultado, más que la mejor jugada; estamos guiados por pasiones y subjetividades que son esenciales para nuestra naturaleza. Como afirmó el filósofo Alan Watts en The Book: On the Taboo against Knowing Who You Are: “Cuando bailamos con la música, no intentamos superar la música ni quedarnos atrás, sino fluir con los eventos del presente. Igual que el baile, si nos absorbemos en sólo mejorar, tal vez olvides del todo vivir la experiencia”.

La experiencia humana va mucho más allá de la inteligencia requerida para jugar un
juego de estrategia. La colaboración entre la cognición humana e inteligencia artificial tiene el potencial de llevarnos a nuevas fronteras: las redes neuronales artificiales han inspirado teorías sobre el procesamiento neuronal biológico; el aprendizaje por refuerzo ha explorado cómo ajustamos estrategias según recompensas y castigos. A pesar de que la IA carece de emociones y creatividad humana, ha inspirado nuevas formas de entender y abordar los juegos de estrategia. Garry Kasparov destaca la capacidad y utilidad de usar las IA no para reemplazar a la mente humana, sino para fortalecer y complementar a la humanidad.

En palabras del escritor Frank Herbert, quien en su novela Dune advierte sobre el riesgo de que la humanidad transfiera su pensamiento a máquinas con el fin de buscar libertad: “La vida no es un problema que se deba resolver, sino una realidad que se debe experimentar”.

Santiago García Ríos

Neurobiólogo computacional. Ha colaborado con el departamento de computación de la Universidad Estatal de Michigan y del Instituto Max Planck, así como en los laboratorios de mayor prestigio de memoria y aprendizaje en México en el Instituto de Fisiología Celular de la UNAM.

Escribe tu correo para recibir el boletín con nuestras publicaciones destacadas.


Publicado en: Contactos

Un comentario en “IA, cognición humana y juegos de estrategia

  1. Buen dia, solo para comentar que el presente artitulo resulta por demas interesante y sobre todo muy entendible, que nos lleva a reflexionar sobre el actuar de las personas, agradezco que se tomen en tiempo de publicar articulos como el comentado gracias y saludos.

Comentarios cerrados