En Silicio

Explorando la realidad usando datos y gráficas

1400 personas se han suscrito

Otros reciben En Silicio por correo

El ordenador que ganaba juegos de guerra

June 21, 2009 por Kiko Llaneras · 22 Comentarios

15327066_4f66fd82f2_mjpg1En 1981, un informático de Stanford llamado Doug Lenat decidió inscribirse en un juego de guerra, el Traveller Trillion Credit Squadron.

El funcionamiento era simple: los participantes recibían un volumen con las reglas del juego y debían diseñar una flota de naves de guerra con un presupuesto de un billón de dólares; a continuación las flotas se iban enfrentando hasta obtener un ganador.

En realidad Lenat no era aficionado a estos juegos, sino que buscaba un reto para el programa de inteligencia artificial que había desarrollado, y que el llamaba Eurisko.

Lenat introdujo las reglas en su programa y dejó que éste buscara la mejor estrategia por si mismo. No le dio consejos ni le sugirió tácticas. Durante un mes Eurisko se ejecutó cada noche en cien ordenadores —ordenadores de 1981, hoy habría bastado un Ipod— en busca de una estrategia óptima.

Cuando llegó el torneo la mayoría de participantes desplegó alguna variante de una flota tradicional, con naves de diferente tamaño y todas bien defendidas. Eurisko planteó una estrategia diferente: gastó su billón de dólares en un número astronómico de pequeños botes, con armas poderosas pero sin defensa ni capacidad de movimiento.

Sus barquitos estaban ahí parados, abriendo fuego con sus enormes cañones, hasta que recibían el primer impacto y se iban al fondo. Pero no importaba porque eran legión.

Lenat ganó el torneo en un suspiro.

Las reglas cambiaron al año siguiente para penalizar el tipo de flota que había dado la victoria a Lenat, ahora las naves no podrían permanecer estáticas porque un criterio para ganar era la agilidad. Pero Eurisko volvió a sorprender con su estrategia: cuando una de sus naves era dañada, ésta se hundía a si misma y así la flota recuperaba agilidad. Por supuesto, Eurisko ganó de nuevo.

De convenciones y modelos

Me encanta el sabor ochentero de la historia —ese tono triunfal que precedió al fiasco de la inteligencia artificial— y las lecciones que de ella se pueden sacar. La primera nos la ofrece Malcom Gladwell, el autor del artículo del New Yorker en el que he descubierto a Eurisko:

No conocer las convenciones puede ser una ventaja

Los jugadores usaron su conocimiento de estrategia militar para llenar vacios en las reglas —”Las naves llevan motor, cargan defensas y no se disparan”, pensaron— y para aplicar estrategias tomadas de batallas reales. Eurisko, en cambio, se limitó al libro de reglas y le bastó.

Pero aún hay otra lección que sacar de esta historia:

Eurisko estaba demostrando que cualquier conjunto finito de reglas [cualquier modelo, añado yo] va a ser siempre una aproximación incompleta de la realidad

Esto es un axioma para los que trabajamos en modelización. En ocasiones se formula con un toque de humor, o algo similar al alcance de físicos e ingenieros, y uno dice aquello de «todos los modelos son erróneos, pero algunos son útiles».

Esta ley podría tener, incluso, consecuencias trascendentes: si el razonamiento se construye en base a reglas y modelos, nuestra comprensión cotidiana de las cosas estará condenada a ser aproximada e incompleta.

Algunos ejemplos de nuestro razonamiento… irracional:



22 respuestas hasta ahora ↓

  • 1 TPS // Jun 22, 2009 a las 01:45

    De nuevo vuelves a tocar mi fibra sensible de modelizador. Hace tiempo que tengo el convencimiento de que cada fragmento de la realidad es tan complejo que no puede ser explicado por un modelo por evolucionado que sea. Esto tiene sus consecuencias científicas, pero también políticas y filosóficas. Toda respuesta a un problema complejo, que hay muchos, es parcial, cuestionable, mejorable. Toda ideología inflexible está condenada al fracaso. Cada reto se puede afrontar con diversas estrategias sin saber de antemano cual es la mejor, ni siquiera cuando ha funcionado en casos anteriores. Nadie puede ostentar la verdad absoluta. Debemos ser más humildes.

  • 2 Ponzonha // Jun 22, 2009 a las 09:38

    Si te he de ser sincero, como profesional de esto de la ciencia (Biólogo en concreto) nunca me he fiado de los modelos (y menos de las simulaciones por ordenador). Es cierto que para aproximarse a un fenómeno real es necesario fijar una serie de parámetros, lo hago todos los días en el laboratorio. Sin embargo, nunca jamás he pensado que las conclusiones obtenidas a partir de un modelo sean extrapolables a la realidad al 100%. Sólo cuando se ha comprobado algo mediante muchos experimentos independientes llevados a cabo por gente diferente empiezo a creerlos.
    En cierto modo, es por eso por lo que ciertas asunciones sobre el cambio climático nunca me convencerán…

  • 3 Orayo // Jun 22, 2009 a las 09:51

    Sea una vaca esferica en el vacío…

    Genial articulo, le echare paciencia y me leere el articulo original de Malcom Gladwell. Ayer mismo me recomendaron al autor. Dos veces en pocas horas es mas que coincidencia.

    salu2!

  • 4 bovolo // Jun 22, 2009 a las 11:04

    Felicidades,

    Muy buena historia. Al principio, me ha recordado la película “Juegos de Guerra”.

    Saludos!

  • 5 Kiko Llaneras // Jun 22, 2009 a las 22:30

    Dos notas rápidas:

    Ya decía que la historia daba de si. IC enlaza desde El blog Salmón, donde usa la historia para ilustrar la importancia de la ética empresarial. Como el dice: “el convencionalismo que Eurisko desconocía era el factor ético.”

    Y una nueva reflexión: esta historia, como todas las metáforas, no deja de ser un modelo simplificado de la realidad…

    ¡Saludos!

  • 6 TPS // Jun 22, 2009 a las 22:55

    Ponzonha, estoy de acuerdo contigo en que los resultados de cualquier modelo no son “extrapolables” a la realidad al 100% (puedes leer mi primer comentario a esta entrada si no lo crees) sin embargo, eso no quiere decir que sea conveniente despreciar los modelos. Muchos modelos han demostrado su utilidad y la demuestran cada día para nuestro beneficio. No olvides, por ejemplo, que por los medios de comunicación te llegan predicciones meteorológicas que aciertan casi el 80% de las veces y te permiten programar tus salidas al campo, o los simuladores de Fórmula 1 que permiten saber cuales serán los efectos de determinada modificación en el diseño de una pieza de un bólido antes de tan siquiera construirla, o la increible exactitud con que son predichas las efemérides astronómicas o… ¡La Ciencia entera es un modelo que nos permite escudriñar la realidad! Igual que no podemos olvidarnos de la incertidumbre que por definición tienen nuestros modelos, sería injusto no reconocer sus logros. Muchas áreas del conocimiento vagan exangües por este país (ahora esta de moda decir Estado ¿no?) por no “creer” en los modelos para su desarrollo.

    Me gustaría saber qué asunciones no te convencen sobre el cambio climático. En cualquier caso, la palabra “nunca” hay que utilizarla con mucho cuidado al hablar de ciencia.

  • 7 Kiko Llaneras // Jun 22, 2009 a las 23:46

    Orayo, el artículo de Gladwell está bien, aunque lo mejor para mi es la historia de Eurisko.

    Bovolo, cuando decía eso de tono ochentero de la historia estaba pensando precisamente en Juegos de Guerra :-)

    Por cierto, respecto al cambio climático, es un tema que me interesa pero que me abruma. Un buen sitio para hacerse una idea rápida de que pruebas apoyan todo el asunto es este wiki: http://www.globalwarmingart.com/wiki/

    Saludos.

  • 8 Iñigo // Jun 23, 2009 a las 02:19

    Como primera aproximacion parece poco creible que un programa fuera capaz de encontrar demostraciones desde las normas, que no habian detectado personas, incluyendo su propio diseñador. O eso o es que la solucion pasaba por pura fuerza bruta computacional a partir de un planteamiento previo del diseñador, supongo que sera el caso.

  • 9 AntonioC // Jun 23, 2009 a las 10:08

    Una historia muy interesante.

    Como mencionas en tu comentario, el factor que ignoraba Eurisko era el ético, ya que en una estrategia militar real el objetivo es ganar al enemigo sufriendo el menor número de bajas posibles. Si Eurisko adopta una estrategia suicida, es fácil ganar el juego porque en el juego no muere nadie de verdad.

    La duda que me surje es que, por un lado, Eurisko estaba pervirtiendo las normas sociales establecidad y eso es lo que hacía que el modelo no funcionara. Pero, por otra parte, la realidad nos ha demostrado que hay cierto tipo de terrorismo que no le importa recurrir al suicidio de sus militantes para conseguir sus objetivos, por lo que, quizás, el modelo en el que Eurisko venció era mucho más exacto de lo que parece a simple vista.

    En todo caso, es muy difícil que un modelo pueda registrar todas las variables que existen en la realidad, así como la posibilidad de que pase algo imprevisible.

  • 10 Blas // Jun 23, 2009 a las 11:08

    AntonioC

    Eurisko no estaba adoptando una estrategia suicida ni pervirtiendo ninguna norma social establecida (porque en los ejércitos de verdad no hay “normas sociales” más allá de disparar primero y preguntar después). En cada bote pequeño viaja mucho menos personal que en uno grande. Si uno grande es alcanzado, toda su tripluación (presumiblemente numerosa) muere. Su estrategia en realidad minimiza el número de bajas manteniendo una alta potencia de fuego.

    En realidad adoptó una estrategia de saturación. Su ejército probablemente presentaba al enemigo más blancos de los que podía alcanzar en una sola salva con sus armas. El enemigo de Eurisko no tenía ninguna posibilidad de concentrar su fuego, y además, apuntaba a blancos más pequeños, que siempre son más difíciles de alcanzar.

    Cuando Eurisko, con sus mil barquitos (o los que fueran), alcanzaba un blanco enemigo, el enemigo perdía una potencia de fuego considerable.

    La estrategia de esta IA es similar a la que adoptan las guerrillas: numerosos elementos pequeños, difíciles de alcanzar, que actúan coordinadamente para abatir blancos importantes.

    Ponzonha

    Sobre el cambio climático no se hacen asunciones: se analizan evidencias, se componen modelos para tratar de replicar las observaciones, y con estos modelos se proponen escenarios, no se predicen condiciones futuras. Y muy probablemente, los primeros críticos de los modelos son los que los diseñan y ejecutan.

    Los resultados de lo modelos nunca son una verdad completa, pero sirven para acercarnos a ella. La postura contraria, que sería negar su utilidad, nos condena a la “ceguera”.

    Un caso muy Hollywoodiense: Se trabaja en modelos informáticos que tratan de predecir el choque de un asteroide con la Tierra, y tal vez tienen pocas probabilidades de acertar, pero ¿acaso no crees que sea importante seguir desarrollándolos?. Yo diría que sí es importante.

    Un saludo y gracias por la entrada, Kiko, ha sido MUY INTERESANTE.

  • 11 AntonioC // Jun 23, 2009 a las 12:02

    Blas

    Pero una guerrilla siempre tiene la posibilidad de recurrir al movimiento y la defensa. Eurisko estaba negando estas posibilidades a su ejército como planteamiento básico, por lo que sí que me parece una estrategia suicida (algo evidente cuando participó en la segunda edición, cuando hizo que las barcas se hundieran a sí mismas). Sería cuestión de tener más datos de como fue su victoria, cuántas bajas sufrío, etc… Si ganó por aniquilación del enemigo y de su ejército sólo quedó un barquito, sería una victoria pírrica.

    Por lo demás, la guerra tiene un código de honor y unos marcos legales (declaraciones formales de guerra, ultimatums, Convención de Ginebra), otra cosa es que se respeten.

    De todas formas, el tema del artículo es si Eurisko subvirtió las normas del modelo, invalidándolo como representación de la realidad, o si los hizo más realista al incluir un componente imprevisible.

  • 12 Agustín // Jun 23, 2009 a las 15:24

    Lenat hizo historía con su forma. Muy interesante, me hace recordar a querer quebrar 1000 ramas muy flacas pero que juntas es imposible de hacer.

    Vía: http://www.quebuenolonuevo.com

  • 13 Alejandro // Jun 23, 2009 a las 16:56

    Hola,
    Muy buena la nota. A mi me gusta mas el: “conjunto finito de reglas” que “cualquier modelo”, porque me hace acordar al teorema de incompletitud de Gödel, del cual se podría extrapolar que si nuestra “versión de la realidad” es consistente, no puede explicarse a si misma y luego es incompleta.

    Saludos

  • 14 guerrilleva // Jun 23, 2009 a las 17:44

    Llego aquí por la portada del menéame. Enhorabuena por todo el blog, Kiko.
    Yo trabajo creando estrategias (de comunicación, aunque eso es lo de menos) para la empresa privada y tu post me encanta como metáfora de hasta qué punto alejarse de los expertos (expertos en caminos trillados) te permite ver la solución. Por absurda que parezca.
    En cuanto a la discusión de la ética, solo recordaros que, si el desembarco de Normandía funcionó fue por la cantidad de soldados que el ejército USA estaba dispuesto a enviar al matadero: una oleada tras otra. Por cierto, una estrategia muy vieja.

  • 15 DoNoBaN // Jun 23, 2009 a las 18:03

    Me sorprende que el programa “suicidara” barcos, supongo que haría alguna búsqueda heurística o un bactracking probando TODAS las combinaciones posibles. Suerte que el programador no le agregara una regla del tipo (no puedes dispararte a ti mismo).

  • 16 Tall & Cute // Jun 23, 2009 a las 21:42

    Un post excelente. Aporta una buena lección a la hora de diseñar sistemas complejos que traten de comprender o emular la realidad

  • 17 TPS // Jun 24, 2009 a las 11:16

    Para quien esté interesado por el cambio climático y no disponga de mucho tiempo para dedicar a este tema, recomiendo las dos siguientes lecturas que se pueden encontrar fácilmente en la página del IPCC:

    “Frequently Asked Questions” del Working Group I Report “The Physical Science Basis”

    “The AR4 Synthesis Report” del que existe una versión en castellano.

    Un saludo.

  • 18 Demócrito // Jun 24, 2009 a las 11:25

    Yo creo que la cuestión es la relación del modelo con la realidad, y los condicionantes que ofrezca el modelo para operar. Toda modelización trata de representar la realidad, pero lo hace estilizándola para superar la radical particularidad de ésta. Lógicamente, esto supone un grado de desvirtuación de la información existente, que además ya de por sí nunca es completa, pero algo así es inevitable. Es en esta pérdida de información donde el modelo ofrece fisuras explotables que la realidad no perdonaría.

    Los modelos de los jugadores de estrategia, y a menudo de los diseñadores de juegos de estrategia, provienen de su experiencia práctica como jugadores en entornos que en la mayoría de los casos tratan de emular la realidad histórica. Esta realidad histórica viene determinada por condicionantes específicos, de naturaleza muy variada. No son sólo éticos (no masacrar tus propias tropas, algo que no siempre se cumple) sino económicos, políticos, etc… Es muy difícil que un jugador, habiendo internalizado tales condicionantes como propios del juego estratégico, se desembarace de ellos ante una nueva situación. Es decir, se confunde la realidad percibida con el modelo, cuando éste último reproduce los condicionantes de la primera sólo en cierto grado, lo que ofrece de salida mucha mayor libertad.

    Es decir, que lo explicado por Kiko incide en una de las diferencias más importantes entre el pensamiento humano y el de la I.A. Nuestro razonamiento es menos analítico que relacional, la experiencia determina los caminos que tomará nuestro pensamiento, que además utiliza mecanismos de simplificación para no tener que trabajar con demasiados elementos. En este sentido un ordenador, en función de la programación, no tiene por qué tener esos hándicaps: no prefiere un camino a otro, no trata de cerrar el campo y no le importa trabajar con innumerables datos.

  • 19 Kiko Llaneras // Jun 24, 2009 a las 23:28

    Iñigo, yo apostaría por lo visto Eurisko usaba reglas heurística de algún tipo, pero supongo que el entrenamiento para el juego fue por un método de fuerza bruta.

    Blas, coincido en aquello de la victoria por saturación «Su ejército probablemente presentaba al enemigo más blancos de los que podía alcanzar en una sola salva con sus armas.», el rival de Eurisko malgastaba potencia de fuego evaporando naves que caerían con un soplido.

    AntonioC, hay dos opciones: Eurisko aprovechó una fisura de irrealidad en el modelo o descubrió una estrategia aplicable en batallas reales, no podremos estar seguros hasta comprobarlo… en el campo de batalla.

  • 20 Kiko Llaneras // Jun 24, 2009 a las 23:52

    Guerrilleva, gracias. Estuve en la playa de Omaha hace un par de años y es impresionante… llegar en las primeras barcazas debió ser un infierno. El monte lleno de cruces y estrellas de david habla por si solo.

    Tall & Cute, yo no pude evitar ver la historia bajo esa óptica —aunque no era esa la perspectiva que daba Gladwell en su artículo— supongo que por deformación profesional. El único problema que le veo a la historia es que para contarla en clase es un poco larga :-)

    Demócrito, interesante reflexión. Aunque contamos con otras ventajas, a las personas nos gustan los atajos al razonar —y los caminos transitados— mientras que un ordenador es feliz siendo estúpidamente exhaustivo.

    P.S. Gracias a todos por los comentarios.

  • 21 Miguel // Jan 17, 2010 a las 00:46

    Me han pasado tu referencia y me he permitido escribir esta pequeña reflexión sobre “como se ganan las guerras en Internet” partiendo de este articulo:
    http://miguelperezsubias.aui.es/index.php?body=blog_comenta&id_article=3325&id_auteur=63&archives=2010-01

    Para mi Internet es como un cerebro que desarrolla la inteligencia que le transmitimos las personas.
    http://miguelperezsubias.aui.es/index.php?body=blog_comenta&id_article=3317&id_auteur=63&archives=2010-01

    Un saludo y gracias por este brillante articulo.
    miguel

  • 22 Kiko Llaneras // Jan 18, 2010 a las 18:47

    Miguel, me alegro de que te gustará la historia. A mi me encanta.

    Saludos,
    Kiko

Deja tu comentario

Si quieres seguir leyendo