21
´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ´ I ART ´ ICULO Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado en un Sistema Multi-agente YazidLe´onFern´ andez de Lara, Ang´ elica Mu˜ noz Mel´ endez INAOE, Coordinaci´on de Ciencias Computacionales Luis Enrique Erro No. 1 72840 Tonantzintla Puebla, M´ exico {yazid,munoz}@ccc.inaoep.mx Resumen La rob´ otica colectiva se interesa, de manera general, en el dise˜ no y el control de sistemas multi-robot o multi-agente, grupos de robots o agentes trabajando de manera conjunta para lograr objetivos comunes. Estos sistemas son ´ utiles en tareas que un solo individuo es incapaz de realizar, o bien en tareas en las cuales se obtiene una ganancia, en t´ erminos de tiempo por ejemplo, si son ejecutadas por m´as de un individuo. Tareas de este tipo son aquellas que requieren, por ejemplo, la dispersi´ on espacial f´ ısica o la suma de fuerzas. Debido a que el control de un sistema multi-robot o multi-agente est´ a descentralizado entre sus componentes, es necesario dise˜ nar e implantar estrategias que permitan a los miembros del sistema, coordinar sus acciones de modo que no interfieran entre ellos, as´ ı como integrar sus recursos, e.g. movimientos o percepciones, para realizar un tarea colectiva. En este trabajo se analizan las estrategias de percepci´on y propagaci´ on de informaci´ on de un agente que forma parte de un sistema multi-agente capaz de desplazarse de manera coordinada, denominadas en este trabajo principios de percepci´on. Se propone as´ ı mismo, un conjunto de gu´ ıas de comportamiento para sistemas multi-agente capaces de movimiento colectivo coordinado, deno- minadas aqu´ ı como principios de organizaci´on. Por ´ ultimo, se presentan y comparan resultados de la aplicaci´ on de ambos tipos de principios para lograr el movimiento colectivo coordinado de grupos de agentes y de robots m´oviles. Palabras clave: sistema multi-agente, agente, movimiento colectivo coordinado, principios de percepci´ on, principios de organizaci´ on. 1. Introducci´on Los et´ologos distinguen entre sociedades y agru- paciones de animales. Aunque ambos t´ erminos re- fieren grupos de individuos de la misma especie, el ermino sociedad se refiere a individuos organiza- dos que exhiben conductas cooperativas, mientras que el t´ ermino agrupaci´ on se refiere a individuos reunidos espacialmente, los cuales no necesaria- mente est´ an organizados o involucrados en con- ductas cooperativas [17]. Los animales forman sociedades y agrupaciones para trascender sus capacidades individuales. Las agrupaciones en particular, proveen protecci´ on contra depredadores o aumentan la eficiencia de la depredaci´ on. Camazine et al. [3] refieren que al agruparse, los animales pueden incluso aumentar la eficiencia de su locomoci´on y ahorrar energ´ ıa gracias a la sincronizaci´ on de sus movimientos in- dividuales. Las agrupaciones de animales son un caso de es- tudio interesante que puede apoyar la formula- ci´ on de principios generales de organizaci´ on es- Inteligencia Artificial, Revista Iberoamericana de Inteligencia Artificial. No. 34 (2007), pp. 83-103. ISSN: 1137-3601. c AEPIA (http://www.aepia.org/revista)

Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

IIIIIIIIIIIIIIIIII IIIIIIIIIIIIIIIIII ARTICULO

Investigacion sobre los Requisitos del Movimiento

Colectivo Coordinado en un Sistema Multi-agente

Yazid Leon Fernandez de Lara, Angelica Munoz Melendez

INAOE, Coordinacion de Ciencias Computacionales

Luis Enrique Erro No. 1

72840 Tonantzintla Puebla, Mexico

{yazid,munoz}@ccc.inaoep.mx

Resumen

La robotica colectiva se interesa, de manera general, en el diseno y el control de sistemas multi-robot omulti-agente, grupos de robots o agentes trabajando de manera conjunta para lograr objetivos comunes.Estos sistemas son utiles en tareas que un solo individuo es incapaz de realizar, o bien en tareas en las cualesse obtiene una ganancia, en terminos de tiempo por ejemplo, si son ejecutadas por mas de un individuo.Tareas de este tipo son aquellas que requieren, por ejemplo, la dispersion espacial fısica o la suma de fuerzas.Debido a que el control de un sistema multi-robot o multi-agente esta descentralizado entre sus componentes,es necesario disenar e implantar estrategias que permitan a los miembros del sistema, coordinar sus accionesde modo que no interfieran entre ellos, ası como integrar sus recursos, e.g. movimientos o percepciones,para realizar un tarea colectiva. En este trabajo se analizan las estrategias de percepcion y propagacionde informacion de un agente que forma parte de un sistema multi-agente capaz de desplazarse de maneracoordinada, denominadas en este trabajo principios de percepcion. Se propone ası mismo, un conjuntode guıas de comportamiento para sistemas multi-agente capaces de movimiento colectivo coordinado, deno-minadas aquı como principios de organizacion. Por ultimo, se presentan y comparan resultados de laaplicacion de ambos tipos de principios para lograr el movimiento colectivo coordinado de grupos de agentesy de robots moviles.

Palabras clave: sistema multi-agente, agente, movimiento colectivo coordinado, principios de percepcion,principios de organizacion.

1. Introduccion

Los etologos distinguen entre sociedades y agru-paciones de animales. Aunque ambos terminos re-fieren grupos de individuos de la misma especie, eltermino sociedad se refiere a individuos organiza-dos que exhiben conductas cooperativas, mientrasque el termino agrupacion se refiere a individuosreunidos espacialmente, los cuales no necesaria-mente estan organizados o involucrados en con-ductas cooperativas [17].

Los animales forman sociedades y agrupacionespara trascender sus capacidades individuales. Lasagrupaciones en particular, proveen proteccioncontra depredadores o aumentan la eficiencia dela depredacion. Camazine et al. [3] refieren que alagruparse, los animales pueden incluso aumentarla eficiencia de su locomocion y ahorrar energıagracias a la sincronizacion de sus movimientos in-dividuales.

Las agrupaciones de animales son un caso de es-tudio interesante que puede apoyar la formula-cion de principios generales de organizacion es-

Inteligencia Artificial, Revista Iberoamericana de Inteligencia Artificial. No. 34 (2007), pp. 83-103.ISSN: 1137-3601. c©AEPIA (http://www.aepia.org/revista)

Page 2: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

84 Inteligencia Artificial Vol. 11, No 34, 2007

pacial para sistemas multi-agente y multi-robot.Para los estudiosos de estos sistemas, es de in-teres proponer estrategias fiables que permitanla percepcion y propagacion de informacion entrelos miembros de un grupo, de modo que puedanreaccionar a perturbaciones externas tales comoobstaculos en el ambiente. Es de interes tambienproponer estrategias que permitan a grupos deagentes y de robots autonomos, coordinar sus mo-vimientos individuales para lograr el movimientocolectivo.

Estas estrategias de percepcion y propagacion deinformacion, y de coordinacion son indispensablesen el control de sistemas multi-robot, para la eje-cucion de tareas como la exploracion o vigilanciacolectiva de espacios, el transporte colectivo deobjetos y la manipulacion de material peligroso,por mencionar algunas.

El objetivo de este trabajo es investigar las es-trategias de percepcion y propagacion de infor-macion, ası como las estrategias de coordinacionde agentes y de robots moviles con capacidad demovimiento colectivo coordinado.

Las estrategias de percepcion y propagacion deinformacion comprenden la cantidad y el tipo deinformacion que los agentes y robots deben cono-cer acerca de ellos mismos y del ambiente parala accion colectiva, ası como los medios que uti-lizaran para compartir esa informacion con losmiembros de su grupo. Debido a que estas es-trategias estan relacionadas con los medios y ma-neras en que los robots perciben y transmiten in-formacion, en este trabajo las denominaremos enadelante como principios de percepcion.

Las estrategias de coordinacion comprenden lasguıas de comportamiento que los agentes y ro-bots aplican en su interaccion entre ellos y conel ambiente. Debido a que estas estrategias estanrelacionadas con la actuacion de los individuos,tanto de caracter individual como colectiva, lasdenominaremos en adelante como principios de

organizacion.

El resto del artıculo esta organizado en cinco sec-ciones. En la seccion 2 se reportan trabajos re-lacionados con el nuestro, en los cuales se docu-mentan grupos de agentes y de robots capacesde generar movimiento colectivo coordinado. Enla seccion 3 se describe la investigacion realiza-da para definir los principios de percepcion y deorganizacion para el movimiento colectivo coor-dinado de sistemas multi-agente. En la seccion 4se reportan resultados de experimentos de coor-

dinacion de grupos de agentes autonomos y derobots fısicos. En la seccion 5 se comparan losresultados de nuestra investigacion con trabajossimilares. Por ultimo, en la seccion 6 se discutenlas consideraciones finales del trabajo.

2. Trabajo relacionado

En esta seccion se resumen importantes contribu-ciones al estudio y sıntesis del movimiento colecti-vo coordinado de agentes autonomos y de robotsfısicos. Las interacciones entre los individuos dela mayor parte de estos trabajos se basan en es-quemas de comunicacion directa e indirecta y enesquemas de percepcion local.

Por comunicacion directa se denota la transmi-sion explıcita de informacion entre individuosconocidos de un grupo. Por comunicacion indi-recta se indica la transmision no explıcita de in-formacion, apoyada comunmente en los efectos delas acciones de los individuos de un grupo sobresu medio ambiente. La comunicacion indirecta seconoce tambien como estigmergia [3]. La percep-cion local denota la percepcion llevada a cabo porun individuo utilizando los medios y dispositivossituados en su propio cuerpo.

Un caso particular de movimiento colectivo coor-dinado es el de las formaciones espaciales de agen-tes, “agrupaciones” de individuos en el sentidointroducido previamente. Una formacion es unpatron espacial, e.g. una figura geometrica, for-mado con los cuerpos de los agentes. En este tra-bajo clasificamos los metodos para la generaciony el mantenimiento de formaciones de agentes endos familias: geometricos y posicionales.

En los metodos geometricos se utilizan modelosgeometricos para reorientar, desplazar e inclusodeformar la formacion de los agentes. En este ca-so, cada agente puede tener un centro de masaasociado, el cual utiliza para calcular sus des-plazamientos dadas sus coordenadas y una matrizde inercia, por ejemplo. En los metodos posicio-nales, un sistema multi-agente mantiene una for-macion aplicando fuerzas y senales locales, masque modelos geometricos explıcitos. Estas fuer-zas responden generalmente a principios motoressimples, como repulsion y atraccion.

En los metodos geometricos se da una gran impor-tancia a las capacidades de deliberacion y comuni-cacion directa de los agentes. La organizacion de

Page 3: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

Inteligencia Artificial Vol. 11, No 34, 2007 85

los sistemas multi-agente que utilizan este enfo-que puede incluso estar apoyada en planificadoresexternos que aseguran el correcto posicionamien-to de los agentes. A continuacion se citan trabajosrepresentativos que utilizan el enfoque geometri-co.

Sugihara y Suzuki [13] desarrollaron experimen-tos con multiples agentes capaces de generar for-maciones estables. Cada agente del grupo es ca-paz de percibir en forma de coordenadas geo-metricas, la posicion relativa de los otros agentesy de moverse una posicion en cada tiempo paramantener una formacion en cırculo.

Unsal y Bay [15] desarrollaron un algoritmode auto-organizacion para una colonia de agen-tes, cuyos miembros son fısica y funcionalmenteidenticos. Este algoritmo esta basado en el reco-nocimiento de una marca usada para identificarel punto de reunion de los agentes, creando for-maciones tales como cırculos, esferas y parabolas.

En los metodos posicionales, por su parte, se damayor importancia a las capacidades de percep-cion local y comunicacion indirecta de los agentes.La organizacion de los sistemas multi-agente queutilizan este enfoque, no depende de procesos ex-ternos sino de la interaccion de multiples agentesautonomos. A continuacion citamos los trabajosmas representativos de este enfoque.

Reynolds [12] desarrollo un modelo de comporta-miento simple para simular el movimiento colec-tivo de parvadas de pajaros, mediante un grupode agentes llamados boids. Los boids de Reynoldsmantienen orientacion y posicion propia en la par-vada y evitan colisiones con sus vecinos modifi-cando sus velocidades.

Balch y Arkin [1] presentan diferentes forma-ciones tales como lınea, columna, diamante, ycuna con un grupo de cuatro robots fısicos. Pa-ra cada formacion, cada robot tiene una posi-cion especıfica basada en un numero de identifica-cion propio. Los comportamientos de cada robotson dirigirse hacia la posicion destino,

evitar obstaculos, evitar colisiones conotros robots y mantener posicion en la forma-cion.

Fredslund y Mataric [5] utilizan un algoritmode formacion basado en percepcion y control lo-cales. Este algoritmo fue probado con agentesautonomos y robots fısicos. Cada individuo delgrupo tiene ademas un identificador propio quese difunde regularmente como mensaje y que es

percibido por otros individuos. El individuo queesta al inicio de la formacion se considera el lıdery cualquier individuo puede desempenar esa fun-cion. Los individuos conocen el numero total deindividuos que participan y la clase de formacionque deben generar. A excepcion del lıder, cadaindividuo sigue a un vecino designado conocidocomo su “amigo”, guardando cierta distancia yangulo con respecto a su orientacion.

Algunos trabajos de formaciones que utilizan elenfoque posicional, hacen uso ademas de algorit-mos de aprendizaje automatico para la definicionde las acciones o de los parametros requeridos pa-ra el desplazamiento colectivo coordinado. Dos deestos trabajos se citan a continuacion.

Flacher y Sigaud [4] presentan una metodologıaque consiste en la mejora de las interaccionesde un sistema multi-agente a un micro nivel,orientadas a generar un comportamiento globala un macro nivel. Sus agentes utilizan algoritmosgeneticos y metodos de campos potenciales [7] quehacen que un agente actue como una partıcula conpropiedades de atraccion y repulsion hacia otrosagentes.

Bendersky y Santos [2] realizan formaciones usan-do robots con sensores de proximidad de cortoalcance. Las formaciones de los robots emergende un comportamiento individual llamado seguirun blanco, el cual se define utilizando aprendi-zaje por refuerzo. Estos autores proponen unatecnica de descomposicion de tareas en dos com-portamientos activos que se ejecutan de mane-ra concurrente, mantener distancia y mantener

angulo. El primero se encarga de mantener unadistancia a un punto objetivo dentro de un rangodelimitado y el segundo, de mantener a los robotsalineados.

Dentro de los trabajos que utilizan tanto losmetodos geometricos como los posicionales pa-ra la generacion de formaciones espaciales, debehacerse mencion particular a una serie de traba-jos orientados a la formulacion de modelos teori-cos que expliquen el comportamiento de multiplesagentes capaces de agruparse en formaciones. Da-da la ausencia de controladores centrales y el usode agentes cuya actuacion se basa principalmenteen percepcion local, ubicamos todos los trabajosque a continuacion se citan en la familia de losmetodos posicionales.

Vicsek et al. [16] y Jadbabaie et al. [6], por ejem-plo, analizan la dinamica de sistemas de agentes“partıculas”, los cuales convergen en formacio-

Page 4: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

86 Inteligencia Artificial Vol. 11, No 34, 2007

nes aplicando reglas orientadas al consenso de laorientacion de los agentes basadas en la influenciade los vecinos cercanos.

Por su parte, Olfati-Saber y Murray [11], al igualque Ogren et al. [10], se interesan en la genera-cion de formaciones especıficas y estables, princi-palmente estaticas. Se propone en estos trabajosel uso de potenciales artificiales y de lıderes arti-ficiales. Los potenciales artificiales son fuerzas decontrol que determinan la atraccion o repulsionentre agentes vecinos, mientras que los lıderes ar-tificiales representan puntos moviles de referenciapara grupos de agentes ubicados dentro de unavecindad. Ambas nociones se utilizan para definirel espaciado entre, y en ultima instancia el patronespacial formado por un grupo de agentes. Estosmodelos representan las formaciones de agentescomo grafos y con ello se apoyan en conceptosprovenientes de la teorıa de grafos.

La busqueda de modelos teoricos mas generalesque expliquen no solo la generacion de formacio-nes espaciales, sino que puedan tambien aplicarsea otros casos de actuacion colectiva de agenteses una empresa ambiciosa y no trivial. Suzuki yYamashita [14] trabajan en este sentido, en par-ticular en la definicion de un modelo orientadoa problemas de consenso entre grupos de agentesque utilizan esencialmente percepcion y comuni-cacion locales. Sus agentes no solo convergen enformaciones espaciales, sino que pueden ademasacordar puntos de referencia, unidades de distan-cia y direccion de su orientacion.

A diferencia de los trabajos citados, en este tra-bajo se reportan resultados de experimentos demovimiento colectivo no dirigido y dirigido ha-cia objetivos, en ambientes sin y con obstaculos,aplicando un enfoque posicional. Nuestra investi-gacion esta orientada a la identificacion de princi-pios generales de caracter cualitativo, subyacen-tes al movimiento colectivo coordinado de agentesautonomos.

Los experimentos de movimiento colectivo no di-rigido y dirigido son importantes pues nos in-teresa investigar los requisitos del desplazamien-to colectivo de sistemas multi-agente y sistemasmulti-robot compuestos de individuos proactivos,capaces de agruparse en formaciones y de alcan-zar tambien objetivos especıficos.

3. Requisitos del movimiento

colectivo coordinado

En esta seccion se investigan los requisitos, enforma de principios de percepcion y de organi-zacion para el movimiento colectivo de agentesautonomos cuya tarea es mantener una formacionespacial.

Distinguimos dos tipos de formaciones: estaticasy dinamicas. Las formaciones estaticas son gene-radas por un grupo de agentes que se reunen al-rededor de una marca y permanecen inmoviles,mientras que las formaciones dinamicas son gene-radas por un grupo de agentes en movimiento.

A excepcion de los experimentos de la seccion4.1.1, en los experimentos reportados en este tra-bajo la generacion de una formacion estatica seconsidera un prerequisito para el mantenimientode una formacion dinamica. La generacion de unaformacion estatica se lleva a cabo aplicando reglasde reunion de los agentes en un punto conocidopor ellos, y posteriormente reglas de distribucionespacial en patrones especıficos. Los experimentosde reunion y generacion de formaciones estaticasse encuentran reportados en [8, 9].

3.1. Percepcion

La atraccion de un individuo, sea este un animal,un agente o un robot hacia sus congeneres, suponeel reconocimiento de lo que es similar a sı mismo,la plena identificacion de los miembros de su espe-cie. El reconocimiento de la especie o del grupo alque se pertenece es en efecto el principio basico dela interatraccion grupal. Sin embargo, este reco-nocimiento no explica per se el movimiento colec-tivo coordinado y otros principios son necesariospara lograr que un grupo se reuna y permanezcareunido.

Diversos autores (por ejemplo Parr citado en [3])han afirmado que una agrupacion animal, de pe-ces en particular, resulta de un balance en la apli-cacion de fuerzas de atraccion y repulsion guia-das ambas por la percepcion visual. Otros autores(Shaw y Partridge citados en [3]), han encontra-do evidencia en donde la percepcion visual apoyaen efecto la atraccion, no ası la repulsion. En estaultima parecen participar otros sentidos de per-cepcion lateral que proveen informacion sobre lavelocidad y direccion de una agrupacion.

Page 5: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

Inteligencia Artificial Vol. 11, No 34, 2007 87

Por otra parte, en las agrupaciones de peces estosse mantienen a distancias y elevaciones especıficasde sus vecinos [3], es decir que tales parametrosson conocidos o percibidos por cualquier indivi-duo participando en la agrupacion. Aun aceptan-do que esta informacion es indispensable, en par-ticular en un enfoque posicional, tenemos que in-dagar la forma en que los miembros de un grupopropagan y reciben esa informacion para ejecutaracciones necesarias para el movimiento colectivo,como seguirse o cambiar de direccion. Esta inves-tigacion es el objeto de las siguientes secciones.

3.1.1. Modelos de agentes

Se estudiaron tres modelos de agentes para de-terminar los forma en que parametros indispen-sables para el movimiento colectivo coordinadoson transmitidos y percibidos entre los miembrosde un grupo.

El primer modelo consiste en un agente comu-

nicativo basado en la comunicacion directa. Esteagente es un punto en un espacio bidimensional,puede moverse un cierto numero de posiciones ycambiar su direccion en un angulo dado. Un agen-te comunicativo transmite directamente su posi-cion a otros agentes en todo momento. Los agen-tes tienen un radio de percepcion y transmisionde informacion de 2 posiciones en el ambiente (verFigura 1(a)).

El segundo modelo consiste en un agente com-

puesto basado en la fusion de percepciones. De-bido a que los agentes comunicativos son incapa-ces de distinguir por sı mismos las orientaciones yformaciones de sus vecinos, los agentes fueron re-disenados para percibir localmente esta informa-cion, lo cual dio origen a los agentes compuestos.Un agente compuesto es un sistema multi-agenteformado por cuatro agentes: una cabeza, un cen-tro y dos brazos, cada uno de los cuales es unpunto en un espacio bidimensional pintado de uncolor distintivo. Esta informacion es usada por losagentes compuestos para estimar sus orientacio-nes. La percepcion de estos agentes surge de lapercepcion individual de cada una de sus partes.Estos agentes estiman sus orientaciones basando-se en el reconocimiento de su composicion (verFigura 1(b)).

El tercer modelo esta basado en la percepcion

local y se denomina agente perceptivo. Tratade reunir en un solo modelo las ventajas de losmodelos anteriores, simplicidad y autonomıa. Unagente perceptivo es un punto en un espacio bi-dimensional donde puede moverse cierto numerode posiciones y cambiar su direccion. Los agentesperceptivos estan pintados en una escala predefi-nida de color rojo de acuerdo a sus orientaciones,e.g. un agente rojo oscuro esta orientado hacia elnorte, y cada vez que gira 45o a la derecha se de-grada su color hasta completar 315o, despues delo cual recupera su tono original. Estos agentesestiman las orientaciones de sus vecinos por me-dio de sus percepciones locales y tienen un radiode percepcion de 5 posiciones en el ambiente (verFigura 1(c)).

(a)

(b)

(c)

Figura 1. Representacion de los agentes

comunicativo (a), compuesto (b) y perceptivo

(c). En cada figura se ilustran tres agentes,

orientados, de izquierda a derecha, hacia el

Este, Norte y Noreste. El area en gris

representa el area percibida por el agente del

centro. N, E, S y O indican, respectivamente,

Norte, Este, Sur y Oeste

Page 6: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

88 Inteligencia Artificial Vol. 11, No 34, 2007

0

10

20

30

40

50

60

70

80

90

0 5 10 15 20 25

No.

de

agen

tes

Tiempo (segs)

0.58

0.84

1.2

1.4

4.34

8.5

15.2

25.12

5.2

8.3

12.2

13.7

comunicativocompuestoperceptivo

Figura 2. Tiempo invertido por agentes de los tres modelos para desplazarse de un punto inicial

hacia un punto destino

La Figura 2 muestra el tiempo invertido por tresgrupos de agentes de los modelos descritos ante-riormente para realizar la misma tarea, consisten-te en mantener una formacion dinamica en cunade un punto a otro. Estos tiempos fueron regis-trados en cuatro pruebas realizadas con gruposde agentes de cada modelo. Los experimentos serealizaron en Starlogo1.

Por cada modelo se obtuvo un promedio del tiem-po invertido por un agente para completar la ta-rea. El tiempo promedio requerido por un agen-te comunicativo para mantener una formaciondinamica de una posicion inicial a una posicionfinal es de 0.02 segs., de 0.48 segs. por un agentecompuesto y de 0.20 segs. por un agente percep-tivo.

La razon por la que un agente comunicativo es enpromedio 24 veces mas rapido que un agente com-puesto, se debe a que el primer agente no inviertetiempo estimando la posicion y orientacion de susvecinos, a diferencia del segundo, el cual esta inte-grado por cuatro agentes que tienen que percibir

a sus vecinos y fusionar sus percepciones. Sin em-bargo, aunque mas veloces, los agentes comuni-cativos no son capaces de operar por sus propiosmedios. En promedio, un agente perceptivo es 10veces mas lento que un agente comunicativo pa-ra realizar movimientos similares pero conserva,a diferencia de este, una autonomıa total.

La Figura 3 muestra el desempeno de un agentede cada modelo medido con respecto a su gradode autonomıa y al tiempo invertido para realizarla misma tarea. Los agentes compuestos y percep-tivos son capaces de operar por sı mismos basadosen sus propios sensores y actuadores por lo quetienen un alto nivel de autonomıa, mientras quelos agentes comunicativos dependen de la infor-macion transmitida directamente por otros agen-tes para operar, por lo que tienen un grado mediode autonomıa.

1Starlogo es un ambiente de simulacion grafica en 2D desarrollado por Mitchel Resnick, orientado a la experimentacion con

sistemas descentralizados. Esta disponible en el sitio http://education.mit.edu/starlogo/

Page 7: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

Inteligencia Artificial Vol. 11, No 34, 2007 89

Figura 3. Comparacion del nivel de

autonomıa y del tiempo que invierten en

promedio los agentes de cada modelo para

realizar tareas similares

3.1.2. Extension del modelo de agente

perceptivo

De acuerdo a los experimentos previos, el tercermodelo de agente ofrece un equilibrio entre rapi-dez y grado de autonomıa en su operacion. Poresta razon, este modelo fue elegido para realizarel resto de los experimentos.

Estamos en un punto en el cual un agente puedeidentificar las orientaciones de sus vecinos de ma-nera simple y rapida: cada agente informa en todomomento con su cuerpo, la orientacion que llevade manera que otros agentes pueden registrar ycopiar esa informacion. Sin embargo, es necesarioequipar a estos agentes con algun tipo de percep-cion lateral que les permita el constante alinea-miento entre ellos una vez agrupados.

El radio de percepcion de los agentes se redefi-nio: ahora cuentan con un radio de percepcionizquierdo, un radio de percepcion derecho y unradio de percepcion frontal, con el fin de deter-minar la ubicacion de sus vecinos con respectoa ellos. Dentro de esos radios de percepcion, losagentes son tambien capaces de percibir a otrosagentes, un obstaculo o camino libre para despla-zarse (ver figura 4).

Figura 4. Percepcion extendida del agente

perceptivo

Con las nuevas percepciones de los agentes sur-gen nuevos estados tales como lıder, seguidor,obstruido y rezagado, los cuales se explican acontinuacion.

Un agente es “lıder” cuando en sus radios de per-cepcion frontal, izquierdo y derecho no percibeningun otro agente.

Si un agente se unio a una formacion y percibe aotro agente en alguno de sus radios de percepcion,se encuentra en el estado de seguidor.

Un agente esta en estado de obstruido cuandopercibe un obstaculo en su radio de percepcionfrontal.

El estado de rezagado se presenta despues deque un agente en el estado de obstruido, trata derodear un obstaculo y retomar la direccion quellevaba antes de verse obstruido; es decir cuandoen sus radios de percepcion izquierdo o derechoel agente percibe algun obstaculo.

Estos estados son mutuamente exclusivos y lastransiciones validas entre ellos se indican en elcuadro 1.

Notese que los agentes no pueden determinar siencabezan una formacion, todos los agentes son“lideres” naturales, i.e. candidatos involuntariosa encabezar una formacion. Sin embargo, una vezen el estado de seguidor, los agentes pueden deter-minar si se encuentran en el centro o extremo deuna formacion, e.g. un agente reconoce que se en-cuentra en el extremo izquierdo de una formacioncuando en su radio de percepcion derecho perci-be algun otro agente, y en su radio de percepcionizquierdo no percibe ningun agente. Aun cuandola identificacion de esos estados es util para losagentes, para determinar por ejemplo el sentido

Page 8: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

90 Inteligencia Artificial Vol. 11, No 34, 2007

de un giro, solo nos referiremos a los cuatro esta-dos mencionados previamente, por considerar quereflejan la situacion de una formacion.

El modelo extendido de agente perceptivo sepondra en practica en los experimentos reporta-dos en la seccion 4.

Estado actual

Estado lıder segui obs reza

previo dor truido gado

lıder√ √ √

seguidor√ √ √

obstruido√ √

rezagado√ √ √ √

Cuadro 1. Transiciones validas entre estados

3.1.3. Principios de percepcion

Concluimos esta seccion con un recapitulativo delos principios de percepcion para el movimientocolectivo coordinado de agentes autonomos.

1. Reconocimiento de los miembros del

grupo. Este principio indica que un agentedebe ser capaz de diferenciar entre los indi-viduos que pertenecen y los que no perte-necen a su grupo, basado probablemente enpercepcion visual. Mas aun, un agente debeser capaz de distinguir una agrupacion desus congeneres.

2. Reconocimiento de propiedades varia-

bles del grupo en movimiento: veloci-

dad y orientacion. Dada la dinamica deun grupo de agentes, estas propiedades de-ben idealmente conocerse en tiempo de eje-cucion por los miembros del grupo. Nues-tros agentes, por ejemplo, comunican local-mente sus orientaciones a los demas y aun-que se mueven en grupo a una velocidadconstante conocida, esta velocidad podrıaser comunicada tambien localmente.

3. Reconocimiento de propiedades

intrınsecas del grupo en movimiento:

distancias maxima y mınima entre los

miembros del grupo. Estas propiedades

son parte del arsenal de “reglas” que losagentes aplican para agruparse. No pare-ce evidente que dichas propiedades puedantransmitirse localmente, pues son conocidasy aceptadas por los agentes de antemano.En nuestro caso, los agentes conocen losrangos de distancia que los separan de otrosagentes agrupados.

3.2. Organizacion

En esta seccion se analiza el complemento de losprincipios de percepcion de los agentes. Comen-zamos describiendo las acciones individuales y acontinuacion proponemos un conjunto de princi-pios de organizacion.

3.2.1. Conductas

Las conductas se forman a partir de aquellas ac-ciones que todo agente o robot autonomo es capazde ejecutar, e.g. avanzar, girar a la derecha o ala izquierda y detenerse.

Una conducta puede traducirse en comandos di-rectos a los actuadores del agente o robot. Lasconductas mencionadas, por ejemplo, se produ-cen al aplicar voltajes equivalentes, variables oiguales a 0 a los motores de un robot movil conun arreglo diferencial de llantas convencional.

El saber que accion debe ejecutar un agente oun robot, no implica saber en que momento debeejecutarse. La solucion a este problema, evidentepara un agente operando individualmente, requie-re ciertas guıas de comportamiento colectivo queson analizadas a continuacion.

3.2.2. Principios de organizacion

Proponemos un conjunto de principios de orga-nizacion para el movimiento colectivo coordina-do de grupos de agentes y robot moviles. Consi-deramos que estos principios son necesarios paralograr el movimiento colectivo tanto no dirigidocomo dirigido hacia objetivos.

1. Preservacion de la individualidad. Es-te principio indica a los agentes que debenejecutar acciones encaminadas a asegurar supermanencia en el ambiente. El principio esaplicado en tres situaciones:

Page 9: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

Inteligencia Artificial Vol. 11, No 34, 2007 91

a) Cuando un agente no percibe otrosagentes a su alrededor, debe moversepara favorecer el encuentro con otrosagentes.

b) Cuando un agente percibe a otro agen-te en su radio de percepcion frontal yen orientacion opuesta a la suya, debecambiar su orientacion para evitar unacolision.

c) Cuando un agente en formacion es obs-truido a causa de un obstaculo y dejade percibir a otros agentes que antespercibıa a su alrededor, debe moversealrededor de ese obstaculo con objetode alcanzar a los agentes del grupo.

2. Atraccion por el grupo. Este principioindica a los agentes que deben ejecutar ac-ciones ortientadas a asegurar que se reunany permanezcan reunidos. El principio esaplicado en los siguientes casos:

a) Cuando un agente percibe una agrupa-cion de agentes, aumenta su velocidady se dirige hacia la agrupacion.

b) Cuando un agente ha alcanzado unaagrupacion percibida a la distancia,copia la velocidad y orientacion de losagentes agrupados para mantenerse enformacion.

3. Atraccion por estımulos externos. Es-te principio indica a ciertos agentes, los queeventualmente se convierten en lıderes delgrupo, que se dirijan hacia estımulos delambiente. El principio es aplicado en ununico caso:

a) Cuando un agente es lıder, y eventual-mente se encuentra a la cabeza de ungrupo, se dirige a un punto conocidodel ambiente.

4. Experimentos y resulta-

dos

En esta seccion se reportan experimentos de mo-vimiento colectivo no dirigido hacia objetivos enambientes sin y con obstaculos realizados en Star-logo. Se reportan tambien experimentos de movi-miento dirigido hacia puntos especıficos del am-biente, en ambientes sin y con obstaculos.

Se reportan ademas experimentos que muestrancomo los principios propuestos, permiten a losagentes adaptarse a ciertas situaciones imprevis-tas como la perdida del lıder de la formacion, oel cambio inesperado del objetivo hacia el cual sedirigıa una formacion.

Finalmente, se reportan resultados de la aplica-cion de los principios propuestos en el manteni-miento de una formacion simple de robots fısicos.

En todos los experimentos, cada agente o robotidentifica su situacion por sus propios medios, deacuerdo a los principios de percepcion enumera-dos, y determina en consecuencia el principio deorganizacion que debe aplicar.

4.1. Movimiento no dirigido

En esta seccion se describen experimentos deagentes que deben agruparse en formacionesmientras se desplazan libremente, i.e. sin dirigirsehacia objetivos fijos.

4.1.1. Movimiento no dirigido en ambien-

tes sin obstaculos

En estos experimentos, los agentes inician distri-buidos aleatoriamente en el ambiente. El objetivodel experimento es lograr que los agentes se agru-pen y se mantengan agrupados.

Como se dijo en 3.1.1, las orientaciones de losagentes pueden ser identificadas a partir de unaescala de colores. Los agentes se desplazan a tresdistintas velocidades: media, alta y baja. La pri-mera se utiliza cuando los agentes no estan for-mados, la segunda para alcanzar una formacion yla tercera para mantenerse en formacion.

La figura 5 muestra una secuencia de imagenesde un experimento con 25 agentes inicialmentedesagrupados. En la figura 6 se muestra el estadode los agentes a lo largo de dicho experimento.El estado de los agentes se registro cada segundoy como puede apreciarse en la grafica, paulatina-mente los agentes se agrupan y pasan del estadode “lıder” potencial, al estado de seguidor de unaformacion. La creacion de una agrupacion refuer-za en los agentes la aplicacion del principio deatraccion por el grupo sobre el principio de pre-servacion de la individualidad.

Page 10: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

92 Inteligencia Artificial Vol. 11, No 34, 2007

Figura 5. Del extremo superior izquierdo al extremo inferior derecho: posiciones de los agentes

durante el movimiento colectivo no dirigido en un ambiente sin obstaculos

Figura 6. Estado de los agentes durante el

movimiento colectivo no dirigido en un

ambiente sin obstaculos

4.1.2. Movimiento no dirigido en ambien-

tes con obstaculos

En este experimento los agentes inician forma-dos en un ambiente con obstaculos, y deben sercapaces de evitar los obstaculos y recuperar laformacion que llevaban o una similar.

Los agentes interactuan en su medio ambientecon obstaculos de dos tipos, unos que fragmen-tan la formacion y otros que obligan a los agentesa deshacer la formacion.

Los obstaculos que fragmentan las forma-

ciones perturban los extremos, es decir, los agen-tes que estan en las orillas de la formacion sonlos que contienden con los obstaculos aplicandoel principio de preservacion de individualidad.

Page 11: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

Inteligencia Artificial Vol. 11, No 34, 2007 93

Figura 7. Del extremo superior izquierdo al extremo inferior derecho: posiciones de los agentes

durante el movimiento colectivo no dirigido en un ambiente con dos obstaculos que fragmentan la

formacion. Los recuadros indican los agentes en estado de lıder

Los obstaculos que rompen las formaciones

perturban a todos los individuos de la formacion,es decir, todos los agentes formados perciben unobstaculo al frente. Los agentes preservan su in-dividualidad en cascada, iniciando con los quese encuentran en los extremos de la formaciony seguidos por los que se encontraban al centro,quienes esperan a que los vecinos que los rodean,igualmente obstruidos, se muevan para rodear elobstaculo y les permitan a su vez rodearlo.

La figura 7 muestra una secuencia de imagenestomadas en un experimento con 25 agentes y dosobstaculos que fragmentan la formacion. Es denotarse que despues de haber rodeado un obstacu-lo fijo, los agentes exhiben una formacion simi-lar a la que mantenıan antes de contender conel obstaculo. La Figura 8 muestra el numero deagentes lıderes, seguidores, obstruidos y rezaga-dos a lo largo de este experimento. Notese quea pesar de que la mayorıa de agentes logran re-cuperar la formacion, algunos agentes rezagadosno son capaces de reintegrarse y se convierten enlideres potenciales de otras formaciones.

Experimentos con obstaculos que rompen las for-maciones pueden consultarse en [8].

Figura 8. Estado de los agentes durante el

movimiento colectivo no dirigido en un

ambiente con obstaculos que fragmentan la

formacion

4.2. Movimiento dirigido

En esta seccion se describen experimentos conagentes en formacion que deben mantenerse agru-pados mientras se dirigen hacia objetivos marca-dos en el ambiente.

Page 12: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

94 Inteligencia Artificial Vol. 11, No 34, 2007

Figura 9. Del extremo superior izquierdo al extremo inferior derecho: posiciones de los agentes

durante el movimiento colectivo dirigido en un ambiente sin obstaculos. La flecha y el recuadro

indican, respectivamente, el punto objetivo hacia el cual se dirige la formacion, y los lıderes

4.2.1. Movimiento dirigido en ambientes

sin obstaculos

En este experimento, los agentes inician formadosen un ambiente sin obstaculos y deben mantenerla formacion mientras se dirigen hacia un objeti-vo fijo. El lıder en la formacion es atraıdo por unestımulo externo o meta y se dirige ahı mientrasque los demas agentes lo siguen.

En la Figura 9 se ilustra una secuencia de image-nes de un experimento con 25 agentes. En la se-cuencia puede apreciarse que al avanzar el lıderde la formacion hacia la meta, los agentes que seencuentran detras de este copian su orientaciony se desplazan detras de el, y ası sucesivamentelos demas agentes al percibir que un agente quese encuentra al frente se mueve, copian la orien-tacion y se desplazan junto con este, generandoası en el punto destino una formacion en formade cuna.

Los principios de atraccion por el grupo y atrac-cion por estımulos externos son aplicados por losagentes en este experimento. La Figura 10 mues-tra los estados de los agentes, registrados cada se-

gundo, durante el experimento ilustrado en la fi-gura 9. Como se aprecia en esta figura, un numerode agentes pasa al estado de lıder en el transcursodel experimento debido al cambio de orientacionde la formacion.

Figura 10. Estado de los agentes durante el

movimiento colectivo dirigido en un ambiente

sin obstaculos

Page 13: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

Inteligencia Artificial Vol. 11, No 34, 2007 95

Figura 11. Del extremo superior izquierdo al extremo inferior derecho: posiciones de los agentes

durante el movimiento colectivo dirigido en un ambiente con obstaculos. La flecha y el recuadro

indican, respectivamente, el punto objetivo hacia el cual se dirige la formacion y los agentes lıderes

4.2.2. Movimiento dirigido en ambientes

con obstaculos

En este experimento, los agentes deben mantenerla formacion en un ambiente con obstaculos mien-tras se dirigen hacia un objetivo fijo, sorteando elobstaculo de ser preciso. El o los agentes lıderesson atraıdos por un estımulo mientras los demasagentes de la formacion son atraıdos por el grupo.Para contender con los obstaculos del ambiente,todos los agentes aplican el principio de preserva-cion de individualidad.

En la Figura 11 puede observarse como despuesde percibir que el lıder avanza hacia la meta, losagentes copian su orientacion y se desplazan jun-to con el evitando un obstaculo que fragmenta laformacion hasta alcanzar el punto destino. La Fi-gura 12 muestra los estados de los agentes duranteel mismo experimento, registrados cada segundo.

Figura 12. Estado de los agentes durante el

movimiento colectivo dirigido en un ambiente

con obstaculos

Page 14: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

96 Inteligencia Artificial Vol. 11, No 34, 2007

Figura 13. Perdida del lıder. La flecha indica el punto objetivo hacia el cual se dirige la formacion,

los recuadros indican los agentes en el estado de lıder

4.3. Movimiento adaptativo

Estos experimentos fueron realizados para pro-bar la robustez de los principios de percepcion yorganizacion utilizados por nuestros agentes. Enel primer experimento se presenta la perdida delıder con el objeto de ilustrar que otro agente pue-de tomar el liderazgo y guiar la formacion haciaun estımulo externo. En el segundo experimento,el cambio inesperado de la ubicacion del estımu-lo externo u objetivo ilustra la reactividad de losagentes.

4.3.1. Perdida del lıder

En este experimento, la formacion tiene inicial-mente un lıder que se dirige hacia un estımuloexterno.

Cuando se produce la perdida del lıder, es decir,cuando el usuario selecciona al lıder y lo retiraintencionalmente de su posicion colocandolo fue-ra del radio de percepcion de los demas agentes,otros agentes toman el liderazgo y los demas agen-tes de la formacion copian las orientaciones de losnuevos lıderes y los siguen hasta llegar a la metaindicada por el estımulo externo.

Ante la perdida del lıder inicial y gracias a la re-actividad que muestran los agentes al aplicar losprincipios de organizacion, la formacion es man-tenida y se logra llegar al objetivo.

En la figura 13 se muestra una serie de image-nes que ilustran el comportamiento de 25 agen-tes cuando se presenta la perdida de lıder en unexperimento de movimiento dirigido en un am-biente sin obstaculos. En la cuarta escena de lasecuencia, el usuario cambia de lugar al lıder dela formacion. En consecuencia, en la quinta es-cena otros agentes se identifican en posicion delıderes y aplican el principio de atraccion por unestımulo externo.

La figura 14 indica los estados de los agentes, re-gistrados cada segundo, durante el experimentoilustrado en la figura 13. Notese el incremento enel numero de lıderes en la primera mitad del ex-perimento, lo cual corresponde al efecto del des-plazamiento intencional del lıder original.

Page 15: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

Inteligencia Artificial Vol. 11, No 34, 2007 97

Figura 14. Estado de los agentes durante un

experimento de movimiento colectivo en el

cual los agentes reaccionan a la perdida del

lıder de la formacion

4.3.2. Cambio inesperado de objetivo

En este experimento al igual que en el anterior,la formacion tiene inicialmente solo un lıder quees atraıdo por un estımulo externo. Cuando entiempo de ejecucion el usuario cambia la posiciondel punto destino de la formacion, es decir mueveel estımulo a otro punto que no era conocido porel lıder actual, este percibe la nueva posicion y sere-orienta hacia el estımulo.

Con este cambio de orientacion, otro agente to-ma el liderazgo de modo que la formacion tienemas de un lıder. Estos agentes, en su calidad delıderes, son atraıdos por el estımulo externo y sedirigen hacia el, mientras que los demas agentescopian sus orientaciones y los siguen hasta llegara la meta.

Ante el cambio inesperado del objetivo final, ygracias a la aplicacion de los principios de orga-nizacion tanto por el lıder como por el resto delos robots, la formacion es mantenida en su mo-vimiento hacia el nuevo objetivo.

La Figura 15 muestra una serie de imagenes queilustran el comportamiento de 25 agentes ante elcambio inesperado de objetivo. En la cuarta esce-na de esta secuencia, el usuario cambia de lugar elobjetivo, lo cual es percibido por el agente lıder.En respuesta a ello, otros agentes se identifican

en posicion de lıderes en la quinta escena y seorientan hacia el nuevo objetivo.

La Figura 16 muestra el estado de los agentes, re-gistrado cada segundo, a lo largo del experimentoilustrado en la figura 15. Como se puede apreciar,el numero de agentes en posicion de lıder aumen-ta en un punto del experimento. Este punto es elmomento en que el usuario cambia de lugar el ob-jetivo, con lo cual algunos agentes no perciben aningun otro agente en sus radios frontal, izquierdoy derecho, y en consecuencia se consideran lıderes.

4.4. Experimentos con robots fısi-

cos

Los principios de percepcion y organizacion pro-puestos se probaron con tres robots fısicos, loscuales se construyeron con el kit de Lego Minds-torms Robotics Invention System 2.0 c©.

Los experimentos reportados en esta seccionson conocidos como seguimiento de laberintos yusualmente se realizan con sistemas mono-robot.Se evaluo un grupo de robots cuya tarea era man-tener una formacion lineal mientras recorrıa unlaberinto marcado en el piso.

Inicialmente, los robots se encuentran formadosen lınea. El lıder es invariablemente el robot situa-do al frente de la formacion. Este robot decide latrayectoria de la formacion, la cual no es conocidapor los robots seguidores. Los robots seguidoresperciben los movimientos del lıder y tratan de se-guirlo manteniendose en formacion.

4.4.1. Diseno de los experimentos

Ambiente. Los experimentos se desarrollaron enun ambiente de 152 cm de ancho ×190 cm delargo con una superficie blanca. Tres trayectoriastrazadas con lıneas negras que permiten hacer gi-ros de 90o y marcas entre las intersecciones delas lıneas fueron dispuestas en ese ambiente (verFigura 17).

Robots. El kit Lego tiene dos tipos de sensores:de contacto y de luz. Los sensores de contactopermiten detectar obstaculos, es decir, permitendiscernir el punto de impacto a traves de lecturasbinarias: choque o no-choque.

Page 16: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

98 Inteligencia Artificial Vol. 11, No 34, 2007

Figura 15. Cambio inesperado de objetivo. La flecha indica el punto objetivo hacia el cual se dirige

la formacion, los recuadros indican los agentes en estado de lıder

Figura 16. Estado de los agentes durante un

experimento de movimiento colectivo en el

cual los agentes reaccionan al cambio

inesperado de objetivo

Los sensores de luz, fotoceldas o fotocelulas porsu parte, detectan la variabilidad de la luz y per-miten identificar tres gamas de colores. Se usaronen nuestros experimentos para determinar sobreque zona se encuentra un robot. Los sensores en-tregan una lectura de 0 en blanco a 256 en negro.

Figura 17. Ambiente del experimento con

robots fısicos. Las marcas indican las

intersecciones o el final del laberinto.

La base de cada robot consiste en un modelo di-ferencial con cuatro ruedas controladas por dosmotores independientes colocados en la parte cen-tral, una placa de espejos en la parte trasera paracomunicar de manera indirecta la orientacion alos vecinos cercanos, tres sensores de luz al fren-te, dos apuntando hacia la parte frontal para per-cibir a los vecinos y uno apuntando al piso para

Page 17: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

Inteligencia Artificial Vol. 11, No 34, 2007 99

percibir el laberinto. Dos lamparas se colocarondebajo de los sensores de luz, al frente del robot(ver figura 18).

(a)

(b)

(c)

Figura 18. Estructura del robot. Vista

superior (a), frontal (b) y trasera (c)

Percepcion y organizacion de los robots.

Cada robot determina la orientacion del robot si-tuado al frente mediante los reflejos de sus lampa-ras en los espejos del otro. Los robots puedenigualmente percibir obstaculos y el objetivo final

marcado en el piso. En cuanto a la actuacion,los robots ejecutan conductas como avanzar,

esperar, girar y detenerse y aplican los prin-cipios de percepcion y organizacion discutidospreviamente.

4.4.2. Resultados

Las conductas ejecutadas y los principios de or-ganizacion aplicados por los robots en uno de losexperimentos realizados se muestran en la figura19. Los robots permanecen inmoviles hasta queel lıder se desplaza y al llegar a una marca de in-terseccion elige dar vuelta indistintamente haciala izquierda o hacia la derecha y continua des-plazandose sobre la lınea hasta llegar al objetivo.

A diferencia de los agentes, los robots fısicos eje-cutan una conducta denominada esperar. Es-ta conducta se ejecuta cuando un robot segui-dor percibe que el robot de enfrente cambia suorientacion. Los agentes perciben esa informacionde forma casi instantanea, mientras que los ro-bots fısicos deben detenerse, estimar y memorizarla nueva orientacion del robot de enfrente, paracopiarla cuando ellos mismos alcancen el puntode interseccion. De otro modo, los robots podrıanseguirse pero abandonarıan el laberinto.

Aunque para los robots fısicos el problema seconcentro en el seguimiento y mantenimiento deuna formacion lineal, los principios propuestos, enparticular los principios de reconocimiento de laspropiedades intrınsecas y variables de un grupo enmovimiento, ası como los principios de atraccionpor estımulos y de atraccion por el grupo, fueronde utilidad para lograr el movimiento colectivocoordinado del grupo.

5. Comparacion

En esta seccion se comparan algunos de los mode-los que fueron presentados en la seccion 2 connuestra propuesta. Cabe aclarar que las propie-dades de nuestra propuesta que se estan conside-rando conciernen unicamente el modelo de agenteperceptivo, que fue el modelo retenido por razo-nes expuestas anteriormente. Los aspectos con-siderados en esta comparacion se dividen en lascategorıas de control mono-agente, configuracionde la formacion y escalabilidad.

Page 18: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

100 Inteligencia Artificial Vol. 11, No 34, 2007

Figura 19. Conductas ejecutadas por los robots en un laberinto. Por claridad, la conducta avanzar

del robot lıder se indico como comandar. La conducta detenerse es ejecutada por un robot cuando

percibe el objetivo. PI, PAE y PAG indican, respectivamente, la aplicacion de los principios de

individualidad, atraccion por estımulos externos y atraccion por el grupo

Reynolds Unsal Balch Fredslund Leon

1987 1994 & Arkin & Mataric & Munoz

Propiedades 1998 2002 2005

Enfoque

situado basado en percepcion local√ √ √ √

situado basado en comunicacion directa√

Percepcion del ambiente

congeneres√ √ √ √ √

obstaculos√ √ √

Actuacion

mantener formacion√ √ √ √ √

dirigirse hacia objetivos√ √ √ √

Control del sistema

descentralizado√ √ √ √ √

Cuadro 2. Enfoque, percepcion y actuacion

En la categorıa de control mono-agente se iden-tificaron las propiedades del enfoque, percepcion,actuacion y el tipo de sistema. En la segunda ca-tegorıa se evaluaron los mecanismos de control,el tipo de formacion, el numero de agentes y eltipo de ambientes utilizados. Por ultimo, en laescalabilidad se consideran los tipos de agentes yla resistencia ante perturbaciones externas.

Como se puede apreciar en el cuadro 2, nuestromodelo se basa en un enfoque situado utilizan-do percepcion local. Los agentes pueden percibir

otros agentes y obstaculos, son capaces de dirigir-se hacia una marca manteniendo una formaciony el control es descentralizado. Nuestra propuestaen cuanto al control mono-agente es equivalentea los modelos propuestos por Balch y Arkin [1] yFredslund y Mataric [5] que se ubican en lo masreciente del estado del arte en formaciones. Caberecordar que nosotros llegamos a un modelo conesas propiedades basados en evidencia experimen-tal y comparacion con otros modelos de agentespropuestos por nosotros mismos.

Page 19: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

Inteligencia Artificial Vol. 11, No 34, 2007 101

Reynolds Unsal Balch Fredslund Leon

1987 1994 & Arkin & Mataric & Munoz

Propiedades 1998 2002 2005

Metodo de formaciones

posicional√ √ √ √

geometrico√

Tipo de formacion

cuna√ √ √ √

cırculo√ √

parabola√

lınea√ √

diamante√ √

Numero de agentes

mas de 10√ √ √

hasta 10√ √

Ambientes

con obstaculos√ √ √

objetivos fijos√ √ √

Cuadro 3. Configuracion de las formaciones y tipos de ambientes enfrentados

Reynolds Unsal Balch Fredslund Leon

1987 1994 & Arkin & Mataric & Munoz

Propiedades 1998 2002 2005

Tipos de agentes

simulados√ √ √ √ √

robots fısicos√ √ √

Resistencia

cambio de lıder√ √ √ √ √

cambio de objetivo√

Cuadro 4. Escalabilidad

Como se aprecia en la comparacion resumida en elcuadro 3, nuestros agentes dependen de un meto-do de control posicional para agruparse. Los tiposde formaciones que nuestros agentes pueden ge-nerar son cırculo [8] y cuna. En nuestro trabajointeractuan como maximo 80 agentes en ambien-tes sin y con obstaculos y objetivos fijos. De nue-vo nuestros agentes estan emparentados con losmodelos propuestos por Balch y Arkin [1] y Freds-lund y Mataric [5]. Los enfoques posicionales adiferencia de los geometricos, estan inspirados enprincipios biologicos, i.e. mecanismos de atracciony repulsion, y son adecuados para agentes y ro-bots con poco conocimiento del ambiente en elque operan.

En el cuadro 4 se compara la escalabilidad de los

modelos. Esta comparacion muestra como nues-tro modelo de agente perceptivo es robusto ante laperdida del lıder y el cambio inesperado del obje-tivo, una propiedad raramente observada en otrosmodelos. El empleo de robots fısicos para probarlos principios de los modelos es considerado unfactor igualmente relevante en esta comparacion.

En nuestro modelo de agente perceptivo los agen-tes tienen 8 orientaciones, ası que en el peor de loscasos para que un agente se integre a una forma-cion, tiene que interactuar 7 veces con el agenteformado, por lo que el numero maximo de interac-ciones para n agentes esta determinado por la for-mula 7n − 7, ası que el orden de nuestro metodopara el mantenimiento de formaciones es lineal.A diferencia del nuestro, los trabajos analizados

Page 20: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

102 Inteligencia Artificial Vol. 11, No 34, 2007

anteriormente no reportan el orden de sus algo-ritmos.

6. Consideraciones finales

El problema fundamental abordado en este tra-bajo es el estudio de los principios de percepciony organizacion del movimiento colectivo coordi-nado de grupos de agentes autonomos y gruposde robots moviles. La formulacion de estos prin-cipios esta orientada a lograr la operacion de gru-pos de robots a los que se les puedan encomendartareas como manejo de materiales peligrosos, ex-ploracion y vigilancia de espacios, manipulaciony recoleccion de objetos.

En este trabajo se propusieron y compararon tresdiferentes modelos de agentes para la genera-cion y el mantenimiento de formaciones espacia-les, comunicativos, compuestos y perceptivos, loscuales fueron disenados de manera constructivis-ta, i.e. cada modelo surgio como consecuencia deotro del que tomo sus ventajas.

El modelo de agente perceptivo fue el masapropiado y fue seleccionado y extendido pararealizar experimentos de movimiento colectivo endiversas situaciones.

Las principales aportaciones de este trabajo sonla identificacion y la aplicacion de principios cua-litativos generales de percepcion y organizacionpara el movimiento colectivo coordinado de agen-tes autonomos y de robots moviles, basados encomunicacion indirecta y percepcion local.

Los principios identificados se caracterizan por seraplicables a agentes y robots de estructura sim-ple, por proveer un alto grado de autonomıa ytiempo de respuesta aceptable. Finalmente, estosprincipios probaron ser robustos para contendercon situaciones imprevistas en el ambiente.

Los experimentos realizados con robots fısicos de-ben extenderse a situaciones mas complejas. Sinembargo, consideramos importante incluir estosexperimentos en esta comunicacion, no como evi-dencia concluyente, sino como un indicativo deque principios cualitativos como los propuestos eneste trabajo pueden exportarse a agentes fısicosoperando en ambientes reales.

A futuro, consideramos extender nuestro mode-lo de agente perceptivo, ası como revisar losprincipios de percepcion y de organizacion para

contender con ambientes mas ricos que incluyanobstaculos y objetivos moviles. Estas extensio-nes pretenden incursionar en aplicaciones comoel seguimiento de objetivos en esquemas presa-depredador, la proteccion de un individuo de laformacion o la cobertura de ambientes dinamicoshostiles.

Igualmente, se experimentaran los principios pro-puestos con robots fısicos mejor equipados, enambientes menos estructurados y en situacionesde mayor complejidad, e.g. formaciones de robotsmoviles operando como arreglos de sensores.

Agradecimientos

Los autores desean agradecer a los revisoresanonimos por sus valiosas observaciones y suge-rencias.

Durante el desarrollo de la investigacion repor-tada en este trabajo, el primer autor fue becariodel Consejo Nacional de Ciencia y Tecnologıa enMexico, bajo el numero de expediente 182899.

Referencias

[1] Balch T., Arkin R. Behavior-based forma-tion control for multirobot teams. IEEETransactions on Robotics and Automation14: 926-939, 1998.

[2] Bendersky D. A., Santos J.M. Robot for-mation as an emergent collective task usingtarget-following behavior. Revista Iberoame-ricana de Inteligencia Artificial 7: 9-18, 2003.

[3] Camazine S., Deneubourg J.-L., Franks N.R., Sneyd J., Bonabeau E.. Fish Schooling,capıtulo del libro Self-organization in bio-logical systems, paginas 166-187. PrincetonUniversity Press, 2001.

[4] Flacher F., Sigaud O.. Spatial coordinationthrough social potential fields and genetic al-gorithms. Proceedings of the Seventh Inter-national Conference on Simulation of Adap-tative Behavior: From Animals to Animats,paginas 389-390, 2002.

[5] Fredslund J., Mataric M. A general algo-rithm for robot formation using local sensing

Page 21: Investigaci´on sobre los Requisitos del Movimiento Colectivo Coordinado …journaldocs.iberamia.org/articles/534/article (1).pdf · 2009-12-16 · de generar movimiento colectivo

Inteligencia Artificial Vol. 11, No 34, 2007 103

and minimal communication. IEEE Tran-sactions on Robotics and Automation 18:837-846, 2002.

[6] Jadbabaie A., Lin J., Morse S. Coordina-tion of groups of mobile autonomous agentsusing nearest neighbor rules. IEEE Transac-tions on Automatic Control 18(6): 988-1000,2003.

[7] Khatib O. Real time obstacle avoidance formanipulators and mobile robots. Interna-tional Journal of Robotic Research 5: 90-98,1986.

[8] Leon Fernandez Y. Generacion y manteni-miento de formaciones en robotica colectiva.Tesis de maestrıa en Ciencias Computaciona-les. Instituto Nacional de Astrofısica, Opticay Electronica, INAOE. Mexico, 2005.

[9] Leon Fernandez Y., Munoz Melendez A. For-mations in collective robotics. Research onComputing Science 17: 223-232, 2005.

[10] Ogren P., Fiorelli E., Leonard E. Forma-tions with a mission: Stable coordination ofvehicle group maneuvers. Proceedings of the15th International Symposium on Mathema-tical Theory of Networks and Systems. NotreDame, Indiana. Agosto, 2002. [CD-ROM]

[11] Olfati-Saber R., Murray R. M. Distributedcooperative control on multiple vehicle for-mations using structural potential functions.

Proceedings of the 15th IFAC World Con-gress on Automatic Control. Barcelona, Es-pana. Julio, 2002.

[12] Reynolds C. Flocks, herds, and schools.A distributed behavioral model. ComputerGraphics 21(4): 25-34, 1987.

[13] Sugihara K., Suzuki I. Distributed motioncoordination of multiple robots. Proceedingsof the IEEE International Symposium on In-telligent Control, paginas 138-143, 1990.

[14] Suzuki I., Yamashita M. Distributed anony-mous mobile robots - Formation and Agree-ment Problems. Proceedings of the 3rd In-ternational Colloquium on Structural Infor-mation and Communication Complexity (SI-ROCCO’96), paginas 313-330. Siena, Italia.Junio, 1996.

[15] Unsal C., Bay J. S. Spatial self-organizationin large populations of mobile robots.IEEE International Symposium on Intelli-gent Control, paginas 249-254. Columbus,Ohio, 1994.

[16] Vicsek T., Czirok A., Ben-Jacob E., Cohen I.Novel type of phase transition in a system ofself-driven particles. Physical Review Letters75: 1226-1229, 1995.

[17] Wilson E. O. Sociobiology. The New Synthe-sis. Harvard University Press, 1975.