"AlphaZero": la computadora que genera su propio conocimiento
Hace tiempo que para las máquinas dejó de ser un reto superar a los humanos.
En muchos aspectos, los robots han demostrado ser "más duros, mejores, más rápidos, más fuertes", como dice la canción de Daft Punk.
Ahora, su desafío es ser más elegantes, o por lo menos eso es lo que deja entrever la computadora AlphaZero, una de los desarrollos más recientes de DeepMind, la empresa de Google dedicada a la inteligencia artificial.
Hace un año AlphaZero venció de manera contundente a otras máquinas entrenadas para jugar ajedrez; shogi, conocido como el ajedrez japónes; y go, uno de los juegos de tablero más complejos que existen.
Ahora, un año después los creadores de AlphaZero revelan las claves de cómo la máquina aplastó a sus contrincantes, jugando a un nivel "superhumano", según sus creadores.
"AlphaZero aprendió a jugar tres juegos retadores a los niveles más altos que se hayan visto", escribió en la revista Science Murray Campbell, investigador de IBM.
No es necesario mencionar que venció a los humanos, pues esa barrera se superó hace 20 años, cuando la computadora Deep Blue venció a Garry Kasparov, quizás el mejor ajedrecista de todos los tiempos.
Pero las máquinas, aunque más poderosas, hasta ahora no logran emular características humanas como el instinto o la imaginación.
"Así como los aviones no baten sus alas como los pájaros, las máquinas no generan movimientos de ajedrez como los humanos", escribió Kasparov en un reciente artículo en Science.
Pero eso parece estar cambiando con la llegada de AlphaZero.
Autodidacta
Al ajedrecista armenio Tigran Petrosian, quien fuera campeón del mundo, se le atribuye la frase: "el mejor entrenador de ajedrez es uno mismo".
Y eso fue justo lo que hizo AlphaZero.
Hasta ahora, los programas de inteligencia artificial más poderosos se han basado en una combinación de técnicas de búsqueda, adaptación al entorno que se les presenta y funciones que les permiten evaluar las situaciones.
Todo ello, obviamente, proviene de seres humanos que las entrenan y las programan de acuerdo a lo que ellos consideran que es lo más óptimo.
Pero ese no fue el caso de AlphaZero, a quien simplemente se le indicaron las reglas del juego y a partir de ahí ella reforzó ese aprendizaje jugando contra ella misma.
En pocas horas, AlphaZero jugó más partidas contra ella misma que las que se han registrado en toda la historia del ajedrez.
"Los programas usualmente reflejan las prioridades y los prejuicios de los programadores", escribió Kasparov . "Pero como AlphaZero se programa a sí misma, yo diría que su estilo refleja la verdad".
Así, AlphaZero se distancia de la manera en la que jugaría un humano y comienza a mostrar maneras sorprendentes de entender el ajedrez.
En su artículo, Kasparov admite que se vio "complacido" de ver a AlphaZero jugar con un estilo "dinámico y abierto", prefiriendo posiciones que para un humano como el parecerían "arriesgadas y agresivas".
Según Kasparov, pudo observar que AlphaZero "reevalúa conceptos fundamentales como el valor de las piezas" y "prioriza la actividad de las piezas sobre lo material".
Parte del éxito de AlphaZero es que no se apoya simplemente en su capacidad de analizar miles de posibilidades en un segundo, como una mera calculadora, sino que enfoca su búsqueda en aquellas jugadas que luzcan más ganadoras.
En otras palabras, AlphaZero no trabaja más duro, si no de manera más inteligente.
Aunque por ahora AlphaZero no tiene otra función más que jugar ajedrez, shogi y go, sus creadores esperan que esta tecnología pueda aplicarse a otras áreas como la ciencia y la medicina.
"AlphaZero nos está superando de una manera profunda y útil", dice Kasparov, "un modelo que puede duplicarse en cualquier otra tarea o campo donde se pueda generar conocimiento virtual".
Así lo plantea DeepMind, quienes afirman que su objetivo es "desarrollar programas que puedan aprender a resolver cualquier problema complejo sin necesidad de que se le enseñe cómo hacerlo".