Es posible que te enterases reto de Google con su AlphaGo contra el jugador coreano de Go Lee Sedol, representante de la humanidad, sobre todo si tienes la suerte o quizá desgracia de tener algún amigo que juegue y se haya pasado una semana compartiendo noticias sobre el evento. Conozcamos por qué todo este revuelo con AlphaGo.
AlphaGo
Alphago fue creada por DeepMind, una startup británica que Google adquirió hace unos años. Lee es el mejor jugador de la última década, una leyenda viva del Go y un auténtico ídolo en su Corea natal, actualmente no es el número 1 mundial pero sigue entre los 3 primeros. Este reto terminó el 15 de marzo y confirmó que AlphaGo es la primera IA (Inteligencia Artificial) que consigue derrotar a jugadores profesionales de tú a tú sin ningún tipo de hándicap. En octubre de 2015 hizo lo propio con el profesional chino residente en Francia y numerosas veces campeón europeo FanHui (樊麾) que pasó a formar parte del equipo del proyecto AlphaGo. FanHui es 2dan profesional por China y la victoria de Alphago 5-0 fue incontestable pero muchos jugadores insistieron en decir que FanHui había jugado muy mal, algo exagerado porque, aunque no es comparable a las grandes superestrellas asiáticas, es un grandísimo jugador.
FanHui en una de sus partidas contra AlphaGo
Pues bien, AlphaGo acaba de derrotar 4-1 a LeeSedol y ha quedado todo dicho, ni FanHui es tan malo ni jugó tan mal, sino que AphaGo es mejor. Y esto parece indicar que los humanos ya no volveremos a ganar a las máquinas al Go, posiblemente la última barrera en juegos de tablero para las computadoras.
¿Por qué el Go?
Kasparov vs Deep Blue
En ajedrez las máquinas superaron a los humanos definitivamente en 1.997 con la revancha de Deep Blue contra Kasparov. Otros juegos han caido desde entonces pero, en contra de todas las predicciones, en Go ha llegado décadas antes de lo previsto. Deep Blue utiliza principalmente fuerza bruta (calcular todas las variantes posibles) por el menor tamaño del tablero, sumado a que en ajedrez es más sencillo evaluar la posición global pues el valor de cada pieza es claro. Además la máquina no calcula las aperturas, se demostró que era demasiado costoso y siempre salía mal parada por lo que se incluyeron libros de aperturas.
Lee Sedol vs AlphaGo (por GoGameGuru)
La particularidad del Go es que la máquina debe simular una intuición real porque no es posible calcular todas las jugadas posibles en una partida, son demasiadas: el tablero es muy grande y el valor de las piedras varía según la configuración del tablero en cada momento. AlphaGo se apoya en sus predecesores pero va más allá al crear redes neuronales que evalúan el estado del tablero y calculan la próxima jugada con más probabilidades de asegurar la victoria, justo lo que hace un humano. Se comenzó partiendo de partidas reales de KGS y partidas profesionales en formato digital para después seguir el aprendizaje haciendo que la máquina jugase contra sí misma —algo que nosotros no podemos hacer sin morir de aburrimiento—. AlphaGo ha jugado millones de partidas desde su creación, muchas más que ningún ser humano haya jugado jamás. Podemos decir que una IA puede aprender como un humano pero a una velocidad incomparable y sin olvidar.
AlphaGo vs Lee Sedol
Podríamos analizar las partidas que se han jugado, pero como no quiero hacer algo muy técnico enlazaré los comentarios (en inglés) que ofreció Google a través de Youtube durante el evento y daré pistas generales de cada partida para todos los públicos. Los comentarios corren a cargo de Michael Redmon 9dan, primer occidental que nunca ha obtenido esta distinción. Me podéis preguntar lo que queráis e intentaré responder.
Partida 1
El encuentro y cómo perder una batalla para ganar la guerra.
El Go es un juego de compromisos, puedes perder localmente para que tus piedras funcionen mejor juntas y así obtener un beneficio mayor. Jugadores expertos suelen usar este recurso pues no es trivial. Un jugador menos experimentado puede verse tentado a ganar localmente sin saber que será una mala estrategia global.
Árbol de decisiones de AlphaGo y logo
Lee Sedol comenzó muy confiado ante el reto y como el 100% de los profesionales no concebía su derrota. Innovó ligeramente en el inicio del juego para asegurarse de que AlphaGo no se limitaba a usar su de base de datos de partidas. AlphaGo no solo refutó sino que castigó esta innovación, no huyó de la lucha, castigó otras jugadas dudosas de Lee Sedol, invadió y al final descubrimos que calcula tan perfecto (“modo Dios” lo ha llamado algún profesional) que es imbatible en el final de la partida. Lo que más nos chocó fueron jugadas de AlphaGo en apariencia “malas” que pierden puntos pero que pretenden simplificar el juego cuando calcula que va a ganar. Al final Lee perdería de unos ajustados 2-3 puntos. 1-0
Partida 2
¿Sueñan los androides con ovejas eléctricas?
Philip K. Dick
Hay partidas de muchos tipos: tranquilas, aburridas, caóticas, partidas cortas que terminan antes de 100 movimientos, otras donde no se sabe quién gana hasta pasados 250, etc. Normalmente tanto los jugadores jóvenes como los veteranos innovan, el primero porque ha estudiado una secuencia que considera beneficiosa y quiere hacerse un sitio en el competitivo mundo del Go y el segundo por aburrimiento de jugar siempre lo mismo y redescubrirse. También se preparan estrategias contra ciertos rivales o en partidas importantes ya que cada jugador tiene puntos fuertes que aprovechar y flojos a disimular. Si eres malo en el final de la partida (yose) no llegues a ella, antes ¡mata todo! Lee Sedol partió con la desventaja de aún no saber exactamente qué esperar de su rival.
¿Perder yo?, “Una mente maravillosa”
El coreano planteó una estrategia diferente, ya sabe que innovar no es aconsejable y juega una apertura muy estándar y de manual para ver las reacciones de AlphaGo. Para sorpresa de todos es AlphaGo la que innova, deja secuencias a medias que más tarde refuerza muy elegante y naturalmente haciendo funcionar todas sus piedras. Toma ventaja para al final ganar de mucho, aunque más tarde los desarrolladores de AlphaGo comentaron que en ciertos puntos fue una partida muy igualada. Lee abandona. 2-0
Partida 3
Kiai, espíritu de lucha.
Partida tras un día de descanso y reuniones de Lee con otros profesionales para analizar las partidas jugadas y dar con debilidades en AlphaGo y una nueva estrategia. Fueron admirables la flexibilidad y continuos cambios de estrategia de Lee en las 3 primeras partidas para poder dar con la que aumentaba más sus chances de victoria. Lee Sedol ama las luchas complejas, es lo que le ha dado la fama que tiene, destronó a Lee ChangHo que es posiblemente el jugador más tranquilo y con mejor cálculo que ha existido —famoso por ganar muchísimas partidas de medio punto—, todo gracias a su estilo agresivo y sin concesiones que marcó un antes y un después.
En Go, si te atacan hay que luchar.
Con pocas jugadas Lee esbozó una amplia área que debía ser invadida o se convertiría en un gran territorio. Su plan era atacar sin piedad a AlphaGo cuando lo hiciera. AlphaGo no defraudó, entró y no sólo capeó el ataque con jugadas brillantes y sencillas, sino que tras el ataque fallido expuso las debilidades que Lee había dejado en su furiosa acometida. Como último recurso y para probar, el coreano creó un Ko en el excesivo territorio de AlphaGo. El Ko es sinónimo de pelea, un tipo de jugada que puede disparar la complejidad e incertidumbre en la partida. Para mí Lee Sedol es uno de “los reyes del Ko” y se sospechaba que AlphaGo evitaba hacerlos aun a costa de perder puntos, ¿porque estaba asustada?, ¿no sabía jugarlos bien? No, no necesitaba agregar complejidad a la partida. Jugó un Ko perfecto y lo ganó. 3-0
Tras el 3-0 ya se consideraba que AlphaGo había ganado el reto, la Inteligencia Artificial de Google había derrotado al representante humano. El lado bueno: Lee jugaría las siguientes partidas con mucha menos presión. Las tornas habían cambiado, ahora una victoria del humano sería considerada un triunfo.
Partida 4
El fallo en Matrix.
O cómo descubrir un bug en el sistema. En Go hay muchas formas de jugar, como ya vimos tu estilo está íntimamente relacionado con cómo eres. Un jugador como Lee tiene preferencias pero fue muy flexible para encontrar lo que mejor le funcionaba ante un rival misterioso.
¿Para ganar a Matrix hay que jugar a su juego o a descubrir sus errores?
Con mucha menos presión por la menor relevancia de las dos últimas partidas el asiático optó por una estrategia muy definida llamada amashi en japonés: acumular muchos puntos seguros al principio de la partida, dando a cambio fuerza para en el medio juego invadir el gran territorio del rival y destruirlo. En medio juego Lee no iba bien, el potencial del territorio de AlphaGo parecía demasiado, pero como un genio que es se sacó de la manga un movimiento mágico que cumplía unas condiciones muy particulares: extremadamente raro, un bug, una excepción que va en contra de las enseñanzas a principiantes y que en esa única y particular posición funcionaba, “la jugada de Dios” algunos dijeron. Tras análisis hay dudas de que funcionara perfectamente, pero para mí no hay duda de que lo hizo porque expuso y explotó una debilidad de AlphaGo: AlphaGo no supo calcular la jugada, respondió mal y no se dio cuenta de lo que pasaba hasta 10 movimientos más tarde. Dar medio movimiento de ventaja a Lee Sedol es estar muerto. 3-1
Lee Sedol ya tenía un lugar en la historia del Go. Ahora lo tiene en la historia de la humanidad.
Ignacio Cernuda, campeón de España de Go.
Partida 5
¿Es una ventaja no tener emociones?
No hay comentario corto en vídeo de esta partida pero hay detalles en el enlace (en inglés). Para mí fue la partida más tensa y por un largo tiempo parecía que Lee estaba mejor. Hubo un intercambio al principio, Lee se quedó con muchos puntos, una cantidad con la que cualquier profesional estaría contento a cambio de dar a AlphaGo una no tan clara influencia exterior. Además de eso AlphaGo jugó muy pronto una secuencia que simplificó la partida pero dio puntos extra a Lee a cambio de poco, el tipo de variante que no quieres hacer aún cuando hay tanto por decidir. Para los profesionales el saber cuándo jugar algo que elimina el resto de posibilidades es muy importante, pero AlphaGo parece que sólo busca simplificar si cree que aún puede ganar, “la máquina que huye del caos”. De todas formas todos coincidieron en que había perdido demasiado y la partida estaba a favor de Lee… entonces entró el factor humano en la ecuación.
Nuestras emociones nos limitan y nos hacen grandes.
Tras un comienzo así cualquier jugador se vería afectado psicológicamente, una partida de Go es una prueba mental intensa y continuamente se juega con las emociones del rival. Hay veces que nada puede pararte y otras que ya has perdido antes de empezar. Ir por detrás frente a una leyenda como Lee Sedol y verle hacer jugadas más tranquilas de lo normal porque sabe que va por delante, todo es parte de esa “otra batalla”. También para Lee: se intuye con ventaja, ¿continuar presionando y arriesgarme a cometer un error? ¿Cómo de tranquilo puedo jugar para preservar ese margen? Como Lee dijo en la posterior rueda de prensa “No creo que AlphaGo sea superior a mí en cuanto a Go, pero su falta de emociones, de humanidad hacen de ella un rival formidable y diferente a todo lo que me haya enfrentado antes”. La partida tuvo un final de infarto pero el “Modo Dios” de AlphaGo tras el medio juego fue decisivo, ni siquiera los diferentes comentadores podían afirmar quién tenía ventaja bien entrado el medio juego. Al final otros 2-3 puntos de ventaja para AlphaGo, había remontado. Fin. 4-1
Lo que viene
El Go ya no volverá a ser lo mismo ¿mejor o peor? Diferente.
Tras el reto se ha especulado mucho con qué pasará y ante esta hazaña mucha gente está concienciándose de lo que representarán las Inteligencias Artificiales que vendrán y se infiltrarán en nuestras vidas cotidianas. DeepMind vuelve a Londres a analizar los valiosos datos recogidos, ver qué pasó en la partida 4 y mejorar si cabe AlphaGo, aunque decepcionantemente sin dar muchos detalles claros de qué pasará. ¿Ha sido éste un simple pasatiempo para Google y se enfocará en otras metas o seguirá evolucionando AlphaGo para consolidar este cambio histórico en el Go?
Por otro lado esperamos que gracias a la gran cobertura periodística y repercusión mediática, el Go sufrirá un boom en Occidente. Y en Asia todo será diferente, jovenes profesionales ya están experimentando con las aperturas de AlphaGo y creo que las teorías del balance territorio/fuerza deberán ser revisadas. Si en un futuro se publican versiones domésticas de AlphaGo podrían surgir Bobby Fischers en cualquier parte del mundo. El Go asiático parece que acepta y abraza de buena gana lo que está por venir, incluso nombraron 9dan a AlphaGo en la ceremonia de clausura. También se está especulando con más retos de AlphaGo contra otros profesionales, equipos de profesionales, revisar partidas de AlphaGo vs AlphaGo, etc.
El Genio
Y para finalizar me gustaría quedarme con el factor más humano dentro del evento humano-máquina y que lo ha hecho posible: Lee Sedol. Agradecerle humildemente y de corazón el haberse enfrentado a la máquina y haberme representado. Si algo veremos en este blog es que los más grandes genios suelen ser los más humildes, es una de las grandezas de cómo el Go te cambia y te hace consciente de lo mucho que te falta por aprender aún siendo un maestro entre maestros.
Esta es una derrota para Lee Sedol, no para la humanidad.
Lee Sedol, 18 veces campeón del mundo tras el reto contra AlphaGo.
Lee Sedol, El Genio (por GoGameGuru)
Muchas gracias por el relato.
Yo había visto la parte física, las cinco partidas. Escuchando al presentador y al profesional… Obteniendo una opinión sobre qué le estaría pasando por la cabeza al maestro Lee Sedol. Ahora lo tengo mucho más claro 😉
Una gozada de relato de las partidas y de hacia dónde nos llevan.
Qué ganas de jugar contra AlphaGO!!! Leñe 🙂
Gracias Antonio
Muchas gracias Ricardo, me alegro de que te haya aportado algo.