En el anterior artículo hablamos sobre un profundo análisis que Deepmind había publicado en su web sobre las partidas que Alphago jugó contra Lee Sedol en marzo. Pues bien, no vinieron solas e incluyeron un extra de 3 partidas que Alphago jugó contra sí misma con comentarios de varios jugadores profesionales. En esta segunda parte nos centramos en estas últimas 3 partidas, ¡espero que las disfrutéis!
La nueva Inteligencia Artificial que viene
Las 3 partidas de Alphago vs Alphago que Deepmind ha publicado son muy diferentes de las jugadas con Lee Sedol. De las 3 hay 2 partidas jugadas a 5 segundos por movimiento, en ellas lo primero que llama la atención es que los primeros 48 movimientos son iguales. Comentan que Alphago juega muchas partidas con comienzos muy similares, pero que la variedad aumenta cuando dispone de más tiempo para calcular y a medida que juega más partidas.
Durante las partidas con Lee Sedol, Alphago hizo muchos movimientos considerados lentos, innecesarios o claramente inferiores perdiendo puntos pero asegurando la victoria. Por ello todos pensamos que sería muy interesante ver a Alphago jugando con todo su potencial, y parece que esto sólo puede pasar jugando contra ella misma.
¿Pero y dónde se equivoca la inteligencia artificial? Sus fallos no son errores de dirección como puede pasar en partidas entre humanos, sino que suelen ser errores catastróficos que casi dan la partida por finalizada según la fase donde se encuentre por no haber leído un movimiento en concreto. Estos errores pueden ser decisivos como la partida que ganó Lee Sedol o pueden ser más sutiles como el movimiento 43 de la 2ª partida contra el coreano y el 136 de la 3ª partida de Alphago vs Alphago. Así que parece que conocemos bien la debilidad más obvia de Alphago: ramas del árbol de decisión que descarta o no explora con la profundidad requerida.
El demonio sabe más por viejo que por demonio.
ALPHAGO vs ALPHAGO
Entrando en las partidas, de las dos primeras lo primero que llama la atención son las variantes de un conocido joseki de esquina que Alphago juega. No sólo hace una variante antigua que se considera lenta sino que a veces se la deja a medias creando un grupo en apariencia muy pesado, algo que ningún profesional haría. Por supuesto siempre lo hace con un motivo y sólo en contadas ocasiones los comentadores se permiten la licencia de calificar un movimiento como malo o dudoso. Los comentarios de los profesionales son muy útiles y se nota el gran esfuerzo que han hecho para encontrar sentido a las secuencias pues es muy difícil seguir las intenciones de Alphago.
De las partidas más rápidas a 5 segundos no tengo mucho más que decir, es más, son partidas que no me gustan, me parecen una amalgama de jugadas violentas o invasiones a las que no le encuentro mucho sentido. Parece que siempre todo está “cogidos por los pelos” y sólo se mantiene unido por una brutal capacidad de cálculo que nos supera, no hay intuición en estas partidas, para mí no hay “arte”. Y cuando empezamos a comprender un poco lo que pasa en una zona, Alphago no tiene reparos en hacer tenuki. Al final todas las peleas confluyen y se llega a un casi inexistente y extraño yose donde sigue habiendo intercambios hasta el final.
Durante las partidas se deja entrever el concepto de buena forma pues hay combinaciones reconocibles, pero siempre desde un punto de vista muy práctico. Las partidas tienen poca coherencia desde nuestro punto de vista, pasando de construir un territorio enorme para a continuación descartarlo. De las dos primeras me quedo con la potencia de cálculo de la inteligencia artificial, es el juego de un bot de KGS con esteroides.
TERCERA PARTIDA
La tercera partida es otra cosa, con 2 minutos por jugada la partida como por arte de magia parece mucho más humana, lo cual es un alivio, parece que no jugamos tan mal después de todo. A su vez es el tipo de partida que puede hacer replantearse teorías. Es un Yin-Yang donde negro toma territorio seguro contra blanco que juega ligero y controla el centro. En las partidas con Lee Sedol nos sorprendió ver cómo Alphago siempre manejaba con maestría el centro, pero quizá fue para balancear el juego territorial de Lee Sedol. ¿Podemos decir que Lee Sedol obligó a Alphago a ir a por el centro?
desde Devianart
Para mí los momentos más interesantes de la partida son los siguientes:
- Movimiento 13, Alphago juega el mismo joseki considerado lento, igual que en las partidas más rápidas.
- La jugada 20 combinando con 28 es la más sorprendente de la apertura y seguro que dará mucho que hablar. Las variantes son muchas y reveladoras. Digamos que en la primera partida seria que vemos Alphago ha inventado un joseki.
- Jugada 34, Alphago no tiene miedo del hane a la cabeza de dos piedras y prefiere hacer tenuki. Por supuesto se salda con un ataque y una compleja secuencia. En el manejo de la incertidumbre y gracias a su potencia de cálculo es donde más difiere el juego de Alphago del de un humano, riesgos que nosotros no osaríamos tomar por lo incierto, en esos momentos Alphago ni pestañea. Da que pensar de cara a las futuras inteligencias artificiales que tomarán el control de muchos aspectos de nuestras vidas. Los profesionales aun así dijeron que no lo permitirían aun viendo las continuaciones.
- Me hace gracia el imaginarme la cara de los profesionales analizando la variante empezando en 53. ¡No una sino 6 veces empuja desde detrás! Concluyen con cara de póker que daría lugar a una partida complicada. Sin comentarios.
- Hay un movimiento muy del estilo “orejas rojas” con 66.
- Es muy bueno el análisis en el movimiento 83. Plantearnos si esa sensación que a veces tenemos de ir ganando para en pocos movimientos perder la ventaja sea una ilusión de nuestra mente o de los conocimientos preconcebidos que tenemos y nos indican una posición favorable. Tras 83 donde negro parece totalmente perdido, Alphago opina que la partida está igualada al 51.5%. Da que pensar.
- Los profesionales consideran que negro jugó pobremente amenzando el grupo de la derecha de blanco hasta 117 y encuentran un sutil pero claro error con 126.
- Es lógico pensar que las partidas de Alphago contienen un complejo medio juego. Una elevada incertidumbre es lo único que puede mantener el % de victoria cercano al 50% siempre y esto queda patente en esta partida. Una reducción del centro de negro con varios grupos implicados para al final una extraña jugada 137 que ni los profesionales pudieron explicar claramente tras un concienzudo análisis. Ahí parece que a Alphago se le “escapó algo” y la balanza se decantó a favor de blanco.
Añadir que con la victoria final de blanco y sabiendo que ya en 83 nuestro conocimiento humano del juego nos decía que blanco estaba mucho mejor quizá aún nos haga superiores a la inteligencia artificial en algunos aspectos.
Y poco queda sino agradecer a FanHui, Gu Li y Zhou Ruiyang por los excelentes comentarios, esperamos con ansias nuevas partidas. Y tú, ¿cuál crees que será el próximo paso de Deepmind con Alphago?
Gran entrada, menudas partidas! Sin embargo no puedo ver la tercera, no sé si es cosa mía…
Qué lejos veo el dan, desde aquí abajo…!!! 😀
Un saludo!
Gracias David, ¡ya está! Si llevas atascado un tiempo prueba a hacer las cosas diferentes. Anñímate a mándarme algunas partidas 🙂