Arte según las redes neuronales de Google.
Los padres de Alphago, Deepmind, han publicado en su web las partidas que Alphago jugó con Lee Sedol en marzo. Y no queda aquí la cosa, sino que además contienen análisis con variantes propuestas por la propia inteligencia artificial a cómo el humano debería haber jugado para salir mejor parado. Como Alphago ofrece variantes pero no da explicaciones se ha echado mano de varios profesionales para que profundicen en ellas. Han sido analizadas por 2 profesionales chinos: el 9 dan, archirival y gran amigo de Lee Sedol GuLi, así como el también 9 dan Zhou Ruiyang. Los resultados han sido compuestos por FanHui 2d, el primer profesional que se enfrentó a AlphaGo y que pasó a colaborar con Deepmind tras ello. Estos archivos sgf contienen comentarios tras analizar las múltiples variantes así como impresiones de FanHui de primera mano durante lo vivido en las partidas.
¿Ha matado AlphaGo el arte?
El estado del arte ha cambiado. El resultado son las 5 partidas entre el humano y la IA así como un extra de 3 partidas que AlphaGo jugó contra sí misma. Dos de ellas a 5 segundos por movimiento y la última con 1-2 minutos por jugada. Este artículo constará de dos partes, en la primera nos centraremos en lo ya conocido, las partidas que Alphago jugó con Lee Sedol.
Me referiré a AlphaGo en femenino por el español no tener género neutro y que parece que queda más poético.
Durante las partidas Alphago propone variantes a las jugadas de Lee Sedol. Según las reacciones de GuLi y Zhou Ruiyang podemos clasificar estas variantes en 3 tipos:
- Están de acuerdo, la variante propuesta les parece razonable y mejor que el resultado obtenido por Lee Sedol. Éstas son las más fáciles de entender y nos dan valiosa información y demuestran la destreza de Alphago.
- Variante que conduciría a una complicada pelea donde es muy difícil evaluar la situación. Una vez la partida avanza parece que para Alphago un resultado equilibrado implica una posición cuya complejidad y devenir no podemos comprender.
- Alphago propone algo que va en contra de los conceptos de Go actuales, sacrificar piedras en el centro del tablero, dejar joseki a medias, cambiar otros, jugadas que se consideran lentas, etc. Éstas serán las que más darán que hablar entre profesionales y quién sabe si veremos cambios en el juego y teorías más allá de algún nuevo joseki.
Contaré mis impresiones de cada partida y los puntos que considero más interesantes y rompedores. Podéis verlas completas en cada diagrama, los comentarios de FanHui son muy interesantes. He añadido en los ficheros algunos comentarios propios en algunos momentos bajo la etiqueta [EOO].
FanHui 2p (leer Fan Juei) al fondo en el centro de la imagen.
Primera partida
Por no saber a lo que se enfrentaba Lee Sedol comienza bastante despreocupado probando a salirse de las aperturas más comunes jugando 7 en C12. Es interesante cómo los profesionales empezaron juzgando como malas las jugadas de Alphago hasta que ganó la primera partida, momento tras el que se mostraron mucho más cautos. Esto pasa por juzgar una posición en base a las teorías actuales y los conceptos de buena forma, etc. Como bien dice FanHui, Alphago no tiene prejuicios y no juega por intuición sino por eficacia. La intuición es lo que nos permite a los humanos jugar tan bien al Go y a la vez lo que nos puede hacer fallar si no lo acompañamos de cálculo. Me imagino algo parecido de cuando Go Seigen y Kitani Minoru comenzaron a jugar acorde a su nueva teoría del fuseki, seguro que les llovieron miles de críticas, sobre todo en una sociedad como el Japón de mediados del siglo XX.
Lee Sedol dijo tras las partidas que a partir de ahora no se dejaría guiar por sus sentimientos a la hora de jugar sino por el cálculo. Y que lo diga uno de los jugadores de la historia que mejor cálculo ha demostrado, impresiona.
Alphago tiene ideas muy fijas, hay aperturas que le gustan mucho más que otras y no duda en repetirlas, además queda claro que la dirección de juego es de suma importancia. Tras Lee Sedol cometer un error de dirección, aun perdiendo un movimiento, Alphago sugiere al coreano cambiar de plan y seguir lo que ella dice. El movimiento 27 es uno de ellos pero no el único. Alphago opina que negro debe retroceder y no cortar y pelear. Por supuesto para un luchador como Lee Sedol esto es impensable, si jugó 23 es para cortar.
Tras el devenir de esta pelea y según la partida avanzaba todo el mundo tenía más y más claro que Alphago estaba ganando, lo que pasa que la partida se mantuvo lo suficientemente ajustada para que hubiera algunas dudas. Esto pudimos verlo con el tímido movimiento de 88, que encierra a blanco en la esquina y da un inmenso (que no suficiente) territorio a negro en el centro. No olvidemos que Alphago intenta maximizar sus posibilidades de ganar y controlar la partida. Prefiere esto a arriesgarse a ganar de más porque puede estimar perfectamente el resultado.
Tras 78 movimientos Alphago va claramente por delante, pero tan pronto como en el 19, Alphago considera que está mejor. En la jugada 80 calcula la victoria como segura al 74%. Al final abandono, blanco gana de 2.5 puntos.
Tras terminar la primera partida parece que la segunda sería el verdadero comienzo donde Lee Sedol, ahora sí, tomaría en serio a su rival.
Segunda partida
La tensión se palpaba en el ambiente y todos estábamos deseando contemplar esta partida. A mí me pilló de viaje en Hong-Kong y gracias a que alquilé un router wifi pude seguirlas. Creo que tendré que ir otra vez a Hong-Kong.
Alphago ganó la primera partida. Pero lo hizo por un margen tan ajustado y con jugadas lentas o que perdían puntos que nos hizo dudar de si el problema era más bien que Lee Sedol se había confiado. Así para la segunda partida todos esperábamos un contrataque de Lee Sedol para doblegar a Alphago. Pero ahora con negras y la iniciativa demostró al mundo que además puede innovar: dejó un joseki a medias, hizo un “peep” o “kikashi” en 15 que se considera temprano y ganó sin paliativos. Es más, al final de la misma volvimos a ver jugadas lentas para simplificar el camino a la victoria.
El humano jugó muy cauto durante la partida hasta que se dio cuenta alreadedor del movimiento 75 de que algo iba mal y estaba por detrás.
Alphago no perdona los fallos en dirección de juego. De 15 a 29 podemos ver un grandísimo ejemplo.
Es curioso ver en el comentario de FanHui que AlphaGo jugó el movimiento 37, el “golpe de hombro” que sorprendió al mundo, lo mismo que podría haber jugado E12, una jugada que parece mucho más normal, ambas tenían similares probabilidades de ser elegidas dada la incertidumbre. Es un alivio saber que quizá haya muchas formas de jugar al Go, una de ellas siguiendo la teoría clásica pero otra muy desconocida que concierne al centro.
Un principiante juega en las esquinas, un jugador medio en los laterales, pero un maestro controla el centro.
Como curiosidad durante esta partida parece que hubo un claro error de Alphago con el movimiento 43 que que Lee Sedol no supo aprovechar. Tras jugarlo la estimación de victoria de Alphago bajó al 50% tras la ventaja acumulada hasta entonces del 55%. Había una variante que Alphago no contempló, posiblemente el atari de F4.
Tras perder blanco la posibilidad de atacar el grupo central de negro las posibilidades de victoria se esfumaron para el coreano. Digno de mención es cómo Alphago trató la invasión de G17 en el movimiento 80, una vez más viendo todo el tablero unido en perspectiva.
Tras pequeñas escaramuzas en el centro, jugadas que perdían puntos de Alphago y llegando al yose la diferencia a favor de Alphago se mantuvo invariable.
A los 67 movimientos, profesionales ya concuerdan en que negro está mucho mejor. En el 77 es muy claro. Tan pronto como en el movimiento 73 Alphago está segura de ganar con un 64% d eprobabilidad. Al final negro gana de pocos puntos.
Tercera partida
Esta partida tuvo lugar tras el día de descanso. Parece que medios de comunicación intentaron entrevistar a Lee Sedol pero estuvo descansando todo el día. Sobre todo porque la noche anterior la pasó en vela con compañeros profesionales analizando las partidas jugadas para dar con una estrategia.
Fue la partida donde el resultado fue más abultado y donde vimos que Alphago puede jugar el ko perfectamente. Parece magia ver una partida donde algo o alguien controla al mejor jugador de la última década sin darle ninguna oportunidad. La estrategia de Lee Sedol fue atacar desde el principio fieramente y sin tregua a Alphago y sacar ventaja. Como FanHui apunta éste es un estilo que no es el de Lee Sedol que siempre espera la mejor oportunidad para atacar y no se expone tanto. Alphago con una suerte de Taichi absorbió el ataque y se lo devolvió multiplicado para sentenciar la partida.
Para mí digna de mención la jugada 32, mi preferida de la serie de partidas. Un movimiento diagonal de apariencia extraña que por supuesto coordina con todas las piedras alrededor. Tras esto Lee Sedol no pudo sino correr para salvar su grupo mientras Alphago cerraba un inmenso territorio. Al final incluso pasó varias veces de su rival porque sabía que tenía más amenazas de ko. Me gustaría saber con cuánta ventaja puede jugar Alphago contra los mejores jugadores actuales, ¿podría con 2 piedras?
Ya en el movimiento 28 Alphago se considera victoriosa en un 59% y en el 48 este índice sube al 72%. Los profesionales presentes concuerdan en que alrededor de la jugada 48 negro está muy mal y no hay vuelta atrás. Esta partida blanco la gana por abandono total.
Cuarta partida
Esta fue la partida de la redención de Lee Sedol. Jugó mucho más tranquilo y fiel a su estilo y aunque ganó y fue muy celebrado a mí me dejó un sabor agridulce. La partida estaba una vez más perdida cuando ocurrió el milagro y el movimiento que le dio victoria no funcionaba siguiendo la secuencia correcta. Fue un fallo en los algoritmos de Alphago y aunque me sentí muy feliz por Lee Sedol pudimos verificar que nadie puede tratar de tú a tú a Alphago. Si no podemos derrotarla nos tendremos que conformar con aprender de ella.
Si algo me ha quedado claro de las partidas es que Alphago no da ninguna tregua, aprovecha cualquier jugada que considera inferior para sacar una ventaja que ya no pierde —cosa que sabe medir muy bien— y sólo se la puede sorprender con jugadas que no contempla como en esta partida o la tercera contra sí misma. Sólo se le puede ganar al explotar fallos en su programación y no con la sabiduría del juego y nuestro limitado razonamiento humanos.
En la jugada 68 Alphago está confiada al 70% y tras el movimiento 90 Alphago considera una victoria total con un 84%. Al final tras la debacle de Aphago blanco va por delante por más de 10 puntos y negro abandona.
Quinta partida
La quinta es mi favorita porque rompe moldes en cuanto a teoría de apertura y cómo el que las piedras funcionen juntas en el centro es lo más importante frente al “simple” hacer territorio. Además estuvo muy ajustada e interesante en el medio juego, me dio la impresión de que el coreano lo dio todo, se desgastó y quedó convencido de que es imposible ganarle a Alphago.
Hay un intercambio al principio que todos los profesionales analizaron como prometedor pero Aphago considera claramente bueno para ella. Los análisis del sgf al respecto y alternativas propuestas son muy interesantes. Y la secuencia que comienza con 48 y que todos creyeron que era un flagrante error de Alphago es excepcional, la definición de “aji”. Y muy divertido ver cómo Alphago al final la descarta porque quiere simplificar la partida.
70 es un claro ejemplo de cómo no seguir el plan de tu rival y aprovechar la fuerza y con 72 pudimos comprobar la diferencia de ser humano y tener sentimientos y miedos frente a una máquina sin ellos.
Tras vivir Lee Sedol pequeño con 79 parece que la posición de blanco era mucho más prometedora y al final de un yose largo y complicado abandonó cuando Alphago iba a ganar de más de 10 puntos.
Es la partida que mantuvo la esperanza más tiempo tras la primera. Sobre la jugada 68 la estimación de victoria de Alphago es ya del 70%. En el movimiento 79, la opinión de que blanco está mejor es unánime. Al final blanco iba por delante por más de 10 puntos.
Para finalizar algunas conclusiones
- Alphago podría dar handicap al jugador número uno actual.
- En general la buena forma y conceptos generales como no empujar por detrás, lanzar leaning attack, valor del sente, josekis conocidos, etc son válidos pero siempre depende de cada situación en concreto.
- Alphago hace muchísimo más énfasis en el centro del tablero de lo que las teorías presentes dicen, su fuseki se parece mucho más al Go de la época dorada de Japón que al actual.
- A medida que la partida avanza, una partida equilibrada para Alphago es una con mucha pelea, quizá por la incertidumbre.
- Si no es por un hecho puntual como el movimiento de la cuarta partida parece que no se puede ganar a Alphago. Veremos en el siguiente artículo cómo esto no es un hecho aislado.
En la siguiente parte del artículo estudiaremos en detalle las partidas que Alphago jugó contra sí misma. ¡No tienen desperdicio! Si te animas me gustaría leer qué te han aportado a ti estas partidas.
Desde luego seguir las partidas fue muy interesante. Fue un golpe duro entre comillas por “la impotencia” de la humanidad XD y a la vez fue muy interesante saber, de una forma bastante peculiar pero precisa, gracias a la afición al Go, en qué momento de la IA nos encontramos y de lo que es capaz.
Gracias Miguel. Sí, yo nunca había tenido tanto interés por ver unas partidas. Al principio creía que Lee Sedol ganaría, no digo que fuera una decepción pero en el momento sí fue una bofetada de realidad. Pensándolo detenidamente es justo como dices, emociona pensar la de avances y cosas alucinantes que están por venir.
Muchas gracias por el artículo, sumamente interesante. Retomé la afición al Go, como muchos otros, gracias a esta partida, y conocer el detalle de los comentarios y lo que “pasaba por la cabeza” de AlphaGo en cada movimiento es realmente cautivador.
Muchas gracias Carlos, te recomiendo pasarte en cuanto puedas por algún sitio donde puedas conocer a gente que juegue. Si me dices por dónde te mueves lo mismo te puedo ayudar. Y sí, es muy interesante el intentar ponerse en el lugar de Alphago, aunque como ves ¡no es nada fácil! Hay otro programa que se llama Zen, menos fuerte que Alphago pero que va a participar en un torneo en marzo entre representantes de Japón, China y Corea.