Читать книгу Palabra de robot - Òscar Vilarroya Oliver - Страница 8
ОглавлениеCapítulo 1
EL LENGUAJE DE LOS AIBO
Enero del 2002. Estoy frente al laboratorio de robótica de Luc Steels en París. Está situado en el Quartier Latin, en el 5ème Arrondisement, el barrio estudiantil por excelencia. Luc Steels convenció a sus mecenas japoneses para que le montasen un laboratorio en el centro de París. Un regalo que está a disposición de muy pocos científicos. El edificio moderno, con grandes ventanales, da a un calle poco transitada pero bastante amplia. Entro. Un vigilante solicita mis datos, consulta la agenda y me indica por dónde ir después de hacerme pasar por el detector de metales. Subo por el ascensor preguntándome cuál es la sorpresa que me ha anunciado Steels esta mañana por teléfono. No me faltan incentivos para venir, así que estoy doblemente intrigado. Se abre la puerta del ascensor delante de un gran cartel que anuncia que he llegado a mi objetivo.
Entro al laboratorio. Como no hay nadie en recepción, sigo adelante. Paso por un corredor que a ambos lados tiene despachos y algún pequeño laboratorio. Veo a estudiantes de doctorado removiendo las entrañas de robots multiformes y a alguno diseñando figuras extrañas en grandes pantallas de ordenador. Llego al final del corredor que desemboca en una gran sala. Reconozco a Luc Steels y a alguno de sus colaboradores en las figuras que están de espaldas. Me acerco sin decir nada. Veo que están observando lo que hacen dos de sus robots más famosos, los AIBO.
El AIBO (figura 1) es un robot comercializado por la compañía Sony. En su desarrollo participó muy activamente Steels. El AIBO es un robot complemente autónomo y móvil. Es capaz de mostrar más de mil conductas, coordinadas a través de un sistema computacional complejo (Fujita y Kitano, 1998). Tiene una locomoción basada en cuatro patas, una cámara para recibir inputs visuales, dos micrófonos y una gran cantidad de sensores corporales. Hoy en día, AIBO es uno de los robots autónomos más complejos. El grupo de Steels lo ha mejorado y le ha incorporado capacidad lingüística para experimentar muchas de sus teorías sobre el origen del lenguaje (Steels, 1998; Steels, 2001b; Steels et al., 2002).
Figura 1. AIBO
Luc da media vuelta y me saluda. Me doy cuenta de que están observando cómo dos de sus AIBO sostienen una conversación entre ellos. Los AIBO están en un espacio de unos tres metros cuadrados, donde hay diferentes objetos, como una pelota roja, una verde, muñecos y otras cosas. Tanto Steels como el resto del grupo de investigadores parecen muy interesados. Los robots siguen hablando, y se mueven hacia la pelota roja. Luc Steels tiene un gesto de sorpresa cada vez mayor. Gira y me dice:
No sé qué diablos se están diciendo entre ellos. Por ejemplo, los AIBO utilizan el término pelota solamente cuando los operadores humanos les tiramos una pelota que rueda y que ellos han de ir a buscar. Nunca cuando la pelota está quieta, o cuando se la enseñamos.
Le digo que si los ha programado él, debería saber de lo que están hablando. Me contesta encogiendo los hombros, porque ambos sabemos que el lenguaje que hablan sus robots no ha sido creado por los humanos, sino por los mismos AIBO. Steels, que lleva a cabo el proyecto, sólo les ha dado un procesador, unos sensores y un sintetizador de voz.
Las siguientes horas las pasamos analizando los datos que surgen de la actividad de los ordenadores que mueven los robots. No da con el quid de la cuestión. La pregunta parece clara: ¿cómo podemos saber de lo que están hablando? ¿Cómo podemos saber el significado de las palabras del nuevo lenguaje de los AIBO? Todos pensábamos que sería muy sencillo de contestar, sobre todo teniendo en cuenta que el mundo artificial en el que viven los AIBO del grupo de Steels es todavía bastante reducido, con pocos objetos y actividades sencillas, como jugar a la pelota. Ahora el grupo de Steels se percata de que no, de que a pesar de todo lo que saben y han investigado sobre el origen, la naturaleza y el desarrollo de los lenguajes, la verdad es que saben muy poco sobre cómo pueden identificar algunos de los significados de los lenguajes de los AIBO.
LUC STEELS
Luc Steels es director del Laboratorio Sony de Ciencia Computacional de París y es profesor de informática en la Universidad de Bruselas. Steels estudió en el prestigioso MIT (Massachussets Institute of Technology) y se especializó en el campo de la inteligencia artificial y en el estudio del lenguaje.
En los últimos cuatro años, Steels y su grupo han desarrollado programas de ordenador y robots que puedan ayudar a entender la naturaleza del lenguaje. Han estudiado cómo se desarrolla la capacidad lingüística a partir de procesos cognitivos muy sencillos (Steels y Vogt, 1997). Steels ha diseñado sus programas y robots de manera que sean capaces de funcionar con autonomía, desarrollar conceptualizaciones muy básicas de sus mundos, crear palabras que se refieran a estos mundos, comunicarse con otros congéneres y, sobre todo, cambiar sus conceptualizaciones y palabras si éstas no permiten una comunicación eficaz con otros robots con los que se comunican (Steels y Brooks, 1994; Steels et al., 2002).
JUEGOS LINGÜÍSTICOS
Luc Steels está llevando a cabo este proyecto a través de un grupo de experimentos a los que denomina Los juegos de las adivinanzas (Steels, 2001a; Steels, 1999). Los experimentos comenzaron en 1999 y se han concentrado en los orígenes y la evolución del arraigo de las palabras.
Los experimentos consisten en estimular la comunicación entre diferentes agentes robóticos, entre ellos los AIBO. Todos disponen de sensores visuales y auditivos mediante los cuales reciben información del entorno para que puedan interactuar con otros robots que ven y sienten cosas similares. El entorno comunicativo puede consistir, por ejemplo, en una pizarra blanca en la que se han dibujado diferentes formas de colores enlazadas, triángulos, círculos, rectángulos, sin olvidar que los entornos han ido cambiando a medida que los robots se han vuelto más sofisticados.
El juego lo realizan dos agentes. Uno de ellos toma el papel de hablante y el otro el de oyente. Los agentes intercambian de tanto en tanto los papeles de oyente y hablante. Los objetos que tienen a su alrededor al comienzo del juego constituyen el contexto. Una versión del juego de las adivinanzas es el que se juega cuando un niño empieza a hablar. Un ejemplo podría ser el siguiente:
MADRE: ¿Cómo hace la vaca? (La madre señala el dibujo de una vaca.) ¡Muuu!
NIÑO: (Observa a la madre).
MADRE. ¿Cómo hace el perro? (La madre señala el dibujo de un perro.) Guau!
NIÑO: (Observa a la madre).
MADRE: ¿Cómo hace la vaca? (Señala a la vaca y espera).
NIÑO: ¡Muuu!
MADRE: ¡Muy bien!
Otra versión del juego consiste en que el hablante seleccione un objeto del contexto, que se denomina tópico, y le da una pista lingüística al oyente para que adivine en qué consiste. La pista lingüística es una expresión que identifica el tópico frente a los demás objetos del contexto. Por ejemplo, si el contexto contiene una pelota roja, una caja azul y una llave verde, el hablante puede decir algo así como «la cosa roja». Si el contexto también contiene una llave roja, el agente tendrá que ser mucho más preciso y decir «la cosa redonda roja».
Evidentemente, los agentes no dicen estas palabras, sino que utilizan su propio lenguaje. Incluso no hay garantía de que los conceptos se parezcan en nada a los utilizados en inglés, francés o castellano. Por ejemplo, los agentes pueden decir algo como «malewna» para decir «cosa roja situada al extremo izquierdo del escenario». Ahora bien, las palabras creadas en estos juegos son siempre unidades atómicas, aunque los agentes pueden producir y reconocer frases con muchas palabras.
A partir de estos datos, el oyente intentará adivinar qué tópico es el que está pensando el hablante. El oyente da su respuesta aproximándose y señalando el objeto en el que estaba pensando. El juego tiene éxito si el tópico supuesto por el oyente es el mismo que el seleccionado por el hablante. El juego fracasa si lo adivinado no coincide o el hablante y el oyente no se entienden en algún momento del juego. En caso de fallar, el hablante da una clave extralingüística señalando el tópico en el que estaba pensando, y ambos agentes intentan adecuar sus estructuras internas para ser más eficaces en el futuro.
En el caso de los AIBO, Steels ha logrado reproducir otro juego, denominado juego de clasificación (Steels, 1999; Steels, 2001a). El juego de clasificación es parecido al juego de las adivinanzas, con la diferencia de que sólo hay un objeto para clasificar. Como la cámara del AIBO no tiene un gran ángulo de visión, sólo un objeto puede ser focalizado. Los objetos de los que se va a servir Steels serán una pelota, una muñeca llamada Smiley y una imitación, en pequeño formato, de un AIBO, llamado poo-chi. Las palabras pelota, Smiley y poo-chi son las que utiliza el interlocutor humano en sus interacciones con el AIBO. El objetivo fundamental del robot es adquirir el uso adecuado de la palabra en relación con las imágenes. Un diálogo típico entre el interlocutor humano y el AIBO es el siguiente (figura 2):
HUMANO: ¡Levántate!
El AIBO ya tiene un léxico de acciones y de órdenes, y la orden de levantarse ha sido relacionada por el AIBO con la acción de comenzar un juego lingüístico. La conversación de un AIBO que comienza a jugar por primera vez sigue por lo general el siguiente proceso:
HUMANO: ¡Mira!
La palabra mira ayuda a orientar la atención y las señales que vienen del interlocutor. En estas situaciones, AIBO comienza a con centrarse en la pelota, a seguir sus trayectorias e intentar tocarla. Entonces el interlocutor humano acostumbra a decir:
Figura 2. Interacción entre el operador humano y el AIBO.
HUMANO: Pelota.
El AIBO todavía no conoce la palabra para este objeto. Con frecuencia, cuando ocurre esto, el AIBO pide la confirmación del interlocutor humano de que la palabra es la correcta:
AIBO: ¿Pelota? HUMANO: Sí.
El humano, entonces, puede comenzar a comprobar si el AIBO ha comprendido efectivamente la palabra.
HUMANO: ¿Qué es eso?
AIBO: Pelota.
HUMANO: ¡Bien!
El humano puede mover la pelota de un sitio a otro del entorno del AIBO y volver a preguntar:
HUMANO: ¿Qué es eso?
AIBO: Smiley.
HUMANO: No. Escucha. Pelota.
AIBO: ¿Pelota? HUMANO: Sí. ¿Es un Smiley?
AIBO: No. Pelota.
HUMANO: ¡Bien!
En definitiva, el AIBO se comporta como un niño de dos años: casi siempre está jugando, a medida que desarrolla su lenguaje.
EL CEREBRO DEL AIBO
¿Cómo consigue eso Steels? Su laboratorio ha diseñado los AIBO para establecer las bases necesarias que den lugar a un sistema capaz de aprender y hablar. Esto ha requerido muchos años de trabajo y muchos esfuerzos de diseños y de prueba/error, así como el desarrollo de una infraestructura experimental y teórica muy sofisticada. A partir de las investigaciones que ha hecho los últimos años, Steels ha identificado un número de criterios que definen las capacidades básicas a partir de las cuales ha diseñado sus robots parlantes:
Mecanismo de conceptualización
Los AIBO tienen un mecanismo para conceptualizar su entorno sin tener información de referencia sobre el mismo. En efecto, el punto básico del trabajo del grupo de Steels consiste en que las categorizaciones que hace un AIBO de su mundo, y el lenguaje que utiliza, no están programadas, sino que emergen de los sistemas que tiene el AIBO y de su interacción con otros AIBO. Ahora bien, para que haya conceptualizaciones es necesario que el AIBO disponga de algún mecanismo básico. ¿Cuál?
Aunque Steels ha probado muchos mecanismos de conceptualización a lo largo de los años que lleva desarrollando robots, le ha costado encontrar un sistema apropiado. El hecho es que en el momento actual hay muchas maneras de clasificar objetos, pero no siempre funcionan en la práctica. En el caso del AIBO, la decisión más importante que adoptó el equipo de Steels ha consistido en no segmentar objetos con rasgos distintivos. Ésta es la técnica habitual y tradicional (Lamberts y Shanks, 1997; Murphy y Medin, 1985), y consiste, en primer lugar, en dividir los objetos y las situaciones que pueden ser percibidas por el sistema con rasgos distintivos (por ejemplo, una silla podría tener estos rasgos distintivos: a) tener cuatro patas; b) tener una superficie plana sobre las cuatro patas; c) tener un respaldar; d) estar hecha de material duro...). Después se ha de dar al sistema la capacidad para construir representaciones de objetos y situaciones a partir de estos rasgos. Una vez que se ha conseguido esto, el sistema establecerá categorías de un grupo de objetos como grupo, y como categoría cuando comparten un determinado número de rasgos.
Steels desestimó esta opción porque es extremadamente difícil, e incluso se considera que puede ser imposible lograrla (Clancey, 1997). Cada rasgo de un objeto puede cambiar de un momento a otro. Es muy difícil establecer de entrada todos los rasgos y todas las situaciones posibles en las que el AIBO podrá percibir estos rasgos. La iluminación y el ángulo de visión cambian y modifican los rasgos que pertenecen a un objeto.
El sistema de categorización elegido por Steels es el de ejemplos y casos. Este es un sistema fuertemente contextual y específico para cada situación (Mel, 1997). Se basa en la utilización de muchas visiones diferentes de un objeto, situaciones que posteriormente se normalizan1 y se memorizan. La clasificación en diferentes categorías se hace mediante un algoritmo de vecindad. El resultado es un sistema que fundamenta la adquisición de conceptos en la propia experiencia del individuo (Hintzman, 1990; Medin y Schaffer, 1978).
Ahora bien, como este sistema se basa en la experiencia de cada AIBO, el proceso de conceptualización puede llegar a ser diferente para cada AIBO, de tal manera que se corre el riesgo de que los AIBO lleguen a tener un repertorio de conceptos diferentes. El caso es que hay muchas maneras de conceptualizar la realidad. Por ejemplo, en una situación en la que un AIBO tenga delante un triángulo rojo a la izquierda y un cuadrado azul a la derecha, pueden ser conceptualizadas por el AIBO tres distinciones diferentes: rojo/azul, triángulo/ cuadrado, izquierda/derecha.
Para conseguir reducir este repertorio y garantizar una cierta estabilidad entre diferentes AIBO, Steels ha utilizado dos mecanismos. Uno es la visibilidad: las diferencias sensoriales que se remarquen serán las preferidas para conceptualizar la escena, y se reducirá el espacio de búsqueda de las palabras que no se conozcan. Por lo tanto, si hay tres objetos con colores muy variados, dos a la izquierda y uno a la derecha, se preferirá el color antes que la ubicación, porque es más distintivo. La segunda restricción viene del hecho de tener en cuenta el léxico para el proceso de conceptualización. Aquí hay dos conceptos que son igualmente distintivos, pero a uno le corresponde una palabra que se ha utilizado más, y éste será el elegido.
Además, Steels ha organizado las categorías en árboles de discriminación que permiten fijar las categorías. En un árbol de discriminación, cada nudo contiene un discriminador que permite filtrar un conjunto de objetos en un subconjunto que satisface una determinada categoría y otro a su contrario. Por ejemplo, puede haber un discriminador basado en la posición horizontal (HPOS) del centro de un objeto (en una escala entre 0,0 y 1,0) que distribuye los objetos en un contexto como izquierda cuando el HPOS está entre 0 y 0,5 y otro que categoriza derecha cuando el HPOS está entre 0,5 y 1,0. Otras subcategorías se pueden crear mediante la restricción de las características de cada categoría. Por ejemplo, la categoría muy a la izquierda se aplica cuando un objeto tiene un valor HPOS entre 0,0 y 0,25.
Mecanismo de verbalización
Los AIBO tienen un mecanismo de verbalización y comprensión de formas verbales. Este sistema es evidentemente imprescindible; sin él no puede haber ningún juego lingüístico. Las palabras que entienden y utilizan los AIBO son combinaciones al azar de sílabas que los AIBO seleccionan de su repertorio léxico. Una vez elegida una forma silábica, cada agente asocia, en una relación bidireccional, la forma (que son las palabras individuales) y las categorías específicas. Una vez hecho esto, cada asociación se marca con un resultado que puede ir de 0,1 a 1.
Cuando un hablante necesita verbalizar una categoría, y ya dispone del léxico desarrollado, busca todas las palabras asociadas con esta categoría, las ordena y selecciona una que tiene el mejor resultado para la trasmisión al oyente. De igual manera, cuando el oyente necesita interpretar una palabra, busca todas las categorías, prueba cuáles son aplicables al contexto activo en ese momento, de tal manera que opta por un único referente, y elige como ganadora la palabra asociada con el resultado más alto. El hablante y el oyente comparan los resultados y actualizan los resultados de las palabras. Cuando el juego ha tenido éxito, incrementan el resultado de la asociación entre palabra y categoría con una cantidad fija (frecuentemente un 0,1) y disminuyen el de sus competidoras con la misma cantidad. Cuando el juego ha fracasado, disminuyen el resultado de la asociación utilizada en la misma cantidad fija.
Mecanismo de comunicación no verbal
Los AIBO también tienen mecanismos no verbales para conseguir sus interacciones verbales. El objetivo comunicativo de los agentes en los experimentos de los AIBO es orientar la atención de diferentes individuos hacia un objeto dentro de un contexto compartido. Steels y sus colaboradores han llegado a la conclusión de que es crucial que los agentes puedan hacerlo así para que la comunicación tenga éxito. El lenguaje verbal por sí mismo no es suficiente. Por ejemplo, cuando un hablante no tiene una forma para expresar una categoría que quiere comunicar y necesita reforzar su opción, o cuando el oyente escucha una palabra nueva que nunca había escuchado antes, las pistas extralingüísticas son de mucha ayuda. En estos casos, el oyente conserva una nueva asociación entre la palabra escuchada y la mejor hipótesis que puede encontrar como categoría posible. La hipótesis puede verse facilitada por las claves extralingüísticas que ha proporcionado el hablante, como un gesto de la cabeza señalando el tópico en cuestión.
Mecanismo de aprendizaje
Los AIBO tienen un mecanismo de aprendizaje de asociaciones entre palabras y significados. Este mecanismo permite asociaciones en doble sentido (de las palabras a los significados y de los significados a las palabras), el uso de asociaciones múltiples (una palabra con muchos significados y un significado con muchas palabras), y debe poder registrar el valor de las asociaciones a partir de su experiencia. Si lo comparásemos con los humanos, sería nuestro mecanismo de memoria.
Como el sistema de categorización de los AIBO está basado en el sistema de ejemplos y casos, el mecanismo de aprendizaje obtiene provecho de sus propiedades. Así, el AIBO identifica en su memoria las situaciones similares a las que experimenta en ese momento, las relaciona con algoritmos de vecindad, reúne situaciones similares y extrae una regularidad relevante. Por ejemplo, si la palabra dicha por un hablante siempre que juegan es maluwna, esta forma verbal se relacionará siempre con situaciones de juego.
Mecanismo de interacción social
Los AIBO tienen un sistema que les permite establecer interacciones coordinadas entre diferentes individuos. Esto quiere decir que han de ser capaces de compartir objetivos y motivaciones entre diferentes agentes para cooperar entre sí.
EL PROBLEMA
El grupo de Steels ha encontrado que, a pesar de haber diseñado estos robots, es incapaz de saber a qué corresponden las palabras que finalmente utilizan los AIBO. De entrada, resulta paradójico el hecho de que Steels haya diseñado unos sistemas y no sepa qué es lo que hacen. Para Luc Steels, sin embargo, eso no es tan paradójico. Siempre que puede, Steels insiste en que la opción que ha tomado dentro del mundo de la inteligencia artificial y de la robótica es completamente diferente de la que era tradicional en el pasado. La inteligencia artificial clásica quería construir sistemas que hicieran ciertas cosas de manera eficaz. Steels no quiere construir robots que cumplan una serie de funciones. No. Lo que este investigador belga quiere es comprender cómo nacen y se desarrollan la inteligencia y el lenguaje. Por eso lo que ha hecho es intentar saber cuáles son las capacidades básicas necesarias y suficientes que permiten el desarrollo de la inteligencia y el lenguaje. Steels ha diseñado sus robots con unos mecanismos sencillos de reglas locales, lo que permite a los sistemas buscar por sí mismos soluciones a sus problemas. Sus AIBO parecen ser la culminación de su esfuerzo. El hecho de que no entienda lo que dicen es para él un elogio y no un problema. AIBO ha demostrado que puede crear un lenguaje propio, que puede comunicarlo y adaptarse a su entorno. Es más, el problema para Luc Steels no es tanto saber cuál es el significado concreto de las palabras (piloto, verde, rojo, etc.), sino saber a qué corresponden los significados en general (¿a las propiedades perceptivas de los objetos de su entorno?; ¿a las reglas que determina cada categoría?). Porque una vez analizados los programas de los AIBO, Steels se ha percatado de que los AIBO ya no utilizan las palabras simplemente para referirse a cosas concretas, como la pelota o el color verde. Parece que los robots han ido más allá. Pero, ¿adónde? Para entender mejor a dónde van los AIBO es necesario que hagamos un pequeño repaso sobre el lugar de donde vienen.
1 La normalización es, en pocas palabras, el proceso de organizar los datos que aportan los sensores de manera eficaz. El proceso de normalización tiene dos objetivos: eliminar los datos redundantes y asegurar que las relaciones entre los datos tengan sentido. Hay muchos métodos de normalización, cuya explicación no tendría sentido en estas páginas.