36
Reconocimiento de patrones Razonamiento basado en casos Minería de datos en el ambiente bancario Sistema Automático de Silabeo Aprendizaje & Visión Número Especial en APRENDIZAJE COMPUTACIONAL PRECIO PÚBLICO $ 50.00 MX www.komputersapiens.org.mx

Número Especial en APRENDIZAJE de patrones …smia.mx/komputersapiens/download.php?file=ks32_1.6MB_compacta.pdf · Memorizar un poema o una canci on, estudiar otro idio-ma, ejercitarse

Embed Size (px)

Citation preview

Reconocimiento de patrones

Razonamientobasado en casos

Minería de datosen el ambientebancario

Sistema Automático de Silabeo

Aprendizaje & Visión

Número Especial enAPRENDIZAJECOMPUTACIONAL

PRECIOPÚBLICO $ 50.00 MX

www.komputersapiens.org.mx

c©Komputer Sapiens, Ano III Volumen II, julio-diciembre 2011, es una publicacion semestral

de la Sociedad Mexicana de Inteligencia Artificial, A.C., con domicilio en Luis Enrique Erro No. 1, Tonantzintla,

Pue., C.P. 72840, Mexico, http://www.komputersapiens.org.mx/, correo electronico: [email protected],

tel. +52.222.266.31.00 ext. 8315, fax +52.222.266.31.52. Impresa por Sistemas y Disenos de Mexico S.A. de C.V.,

calle Aragon No. 190, colonia Alamos, delegacion Benito Juarez, Mexico D.F., C.P. 03400, Mexico, se termino de

imprimir el 15 de noviembre de 2011, este numero consta de 1000 ejemplares.

Reserva de derechos al uso exclusivo numero 04-2009-111110040200-102 otorgado por el Instituto Nacional de

Derechos de Autor. ISSN 2007-0691.

Los artıculos y columnas firmados son responsabilidad exclusiva de los autores y no reflejan necesariamente los

puntos de vista de la Sociedad Mexicana de Inteligencia Artificial. La mencion de empresas o productos especıficos

en las paginas de Komputer Sapiens no implica su respaldo por la Sociedad Mexicana de Inteligencia Artificial.

Queda estrictamente prohibida la reproduccion total o parcial por cualquier medio, de la informacion aquı contenida

sin autorizacion por escrito de los editores.

Komputer Sapiens es una revista de divulgacion en idioma espanol de temas relacionados con la inteligencia

artificial. Creada en LATEX, con la clase papertex disponible en el repositorio CTAN: Comprehensive TeX Archive

Network, http://www.ctan.org/

Directorio SMIAPresidente Raul Monroy BorjaVicepresidente Alexander GelbukhSecretario Miguel Gonzalez MendozaTesorero Grigori SidorovVocales: Jesus A. Gonzalez Bernal

Alejandro Pena AyalaGustavo Arroyo FigueroaOscar Herrera AlcantaraRafael Murrieta CidArturo Hernandez AguirreSofıa Natalia Galicia HaroHugo Terashima MarınFelix A. Castro EspinozaIldar Batyrshin

Komputer SapiensDirector general Raul Monroy BorjaDirectores fundadores Carlos Alberto Reyes Garcıa

Angel Kuri MoralesEditora en jefe Angelica Munoz MelendezEditor invitado Eduardo F. Moralese-Tlakuilo Hector Hugo Aviles ArriagaEstado del IArte Ma del Pilar Gomez Gil

Jorge Rafael Gutierrez PulidoSakbe Laura Cruz Reyes

Hector Gabriel Acosta MesaIA & Educacion J. Julieta Noguez MonroyDeskubriendo Konocimiento Gildardo Sanchez Ante

Alejandro Guerra HernandezAsistencia tecnica Irvin Hussein Lopez NavaLogotipo & portada Gabriela Lopez LucioEdicion de imagen Laura Tapia Dıaz

Departamento de Imagen &Diseno, INAOE

Comite Editorial

Juan Manuel Ahuactzin LariosPiero P. BonisoneRamon Brena PineroFrancisco Cantu OrtizOfelia Cervantes VillagomezJesus Favela VaraJuan Jose Flores RomeroJose de Jesus Galaviz CasasLeonardo Garrido LunaAlexander GelbukhJesus A. Gonzalez BernalJose Luis GordilloAngel Kuri MoralesAurelio Lopez LopezRaul Monroy BorjaEduardo F. Morales ManzanaresAngelica Munoz MelendezManuel Montes y GomezJose Negrete MartınezPablo Noriega B.V.Alejandro Pena AyalaCarlos Alberto Reyes GarcıaAntonio Sanchez AguilarJesus Savage CarmonaHumberto Sossa AzuelaGrigori SidorovLuis Enrique Sucar SuccarAlfredo Weitzenfeld Ridel

ContenidoARTICULO INVITADO

Reconocimiento de patronespor Jesus Ariel Carrasco Ochoa y Jose Francisco MartınezTrinidadpag. 5 ⇒ El reconocimiento de patrones es el mecanismo necesariopara distinguir unas cosas de otras, relacionar cosas semejantes, for-mar grupos de cosas, describir objetos, tomar y explicar decisiones.Se revisan avances en el reconocimiento automatico de patrones.

ARTICULO INVITADO

Razonamiento basado en casos. Ejemplos deaplicaciones poco convencionales

por Ramon Lopez de Mantaras

pag. 10 ⇒ Nuevos problemas pueden resolverse re-utilizando, y eventual-mente adaptando, soluciones a problemas similares resueltos en el pasado.

ARTICULO INVITADO

Ver para aprender y aprender a ver: sinergias entreaprendizaje y vision computacionales

por Hugo Jair Escalante y Eduardo F. Morales

pag. 15 ⇒ Un panorama general de los principales avances en la intersecciondel aprendizaje computacional y la vision artificial.

ARTICULO INVITADO

Silabeo automatico del espanol con arboles dedecision

por Rene MacKinney-Romero y John C.H. Goddard

pag. 21 ⇒ Arboles de decision aplicados a la division de palabras en sılabas,problema de interes para los sistemas automaticos de texto a voz.

ARTICULO INVITADO

Minerıa de datos en el ambiente bancario

por Horacio Carvajal Sanchez Yarza

pag. 26 ⇒ En el ambiente bancario hay que saber que esta pasando, que vaa pasar, y que acciones tomar para optimizar los resultados. La minerıa dedatos, gran aliada en este contexto.

Columnas

Sapiens Piensa. Editorial pag. 2

e-Tlakuilo pag. 3

Estado del IArte pag. 4

Sakbe pag. 4

IA & Educacion pag. 30

DeskubriendoKonocimiento pag. 31

Komputer Sapiens Julio - Diciembre 2011 ‖ Ano III, Vol.II

Año III, Vol. II. Julio - Diciembre 2011 Columnas Komputer Sapiens 2 / 32

Sapiens Piensapor Angelica Munoz y Eduardo F. Morales

Aprender, la capacidad para adquirir nueva informa-cion y nuevas habilidades, o para extender informaciony habilidades ya adquiridas es una caracterıstica indiso-ciable de lo vivo y de lo inteligente.

¿Que es lo que hay detras de este proceso abstractodenominado aprendizaje?, ¿que es lo que permite a unapersona o a cualquier organismo vivo adaptarse, modifi-car sus habitos, su conocimiento, su estructura quizas?Memorizar un poema o una cancion, estudiar otro idio-ma, ejercitarse en algun instrumento musical, mejorar eldesempeno en una actividad fısica, todos ellos son ejem-plos muy claros en los que el aprendizaje esta inmerso.Otros ejemplos son asociar eventos a situaciones de pe-ligro, categorizar lo que se ve o lo que se oye en rubrosconocidos o nuevos, generalizar un concepto a partir demultiples ejemplos.

Alan M. Turing, matematico precursor de la Inteli-gencia Artificial que vivio en Inglaterra en la primeramitad del siglo pasado, identifica en su celebre artıcu-lo Computer Machinery and Intelligence que la capaci-dad de aprendizaje es condicion para que una maquinase considere inteligente. Con ello, Turing preconizo dealgun modo lo que hoy constituye un area de estudio dela disciplina que el ayudo a establecer.

El aprendizaje computacional, automatico, o demaquina (machine learning en ingles) es un area de laInteligencia Artificial cuyo objetivo es desarrollar progra-mas que permitan a las computadoras mejorar su desem-peno a partir de su propia experiencia. Estas tecnicaspueden o no incluir la guıa de un supervisor, puedenejecutarse sobre colecciones completas (off line) o colec-ciones dinamicas (on line) de datos, pueden enfocarse enla identificacion de relaciones o similitudes en conjuntosde datos, entre muchas otras variantes.

Aprendizaje computacional es el tema de este volu-men de Komputer Sapiens, preparado con gran es-mero y entusiasmo para nuestros lectores. Cinco contri-buciones de autores reconocidos en el area nos dan unpanorama muy completo de las principales tecnicas delaprendizaje computacional y sus aplicaciones.

En primer lugar, Ariel Carrasco Ochoa y FranciscoMartınez Trinidad esbozan en su contribucion “Recono-cimiento de patrones”, los diferentes enfoques y los prin-cipales problemas de este topico cuyo objetivo es for-malizar y automatizar los procesos de interpretacion delmundo real. El proceso del reconocimiento de patrones esdetallado e ilustrado con ejemplos en los que los autoreshan trabajado en los ultimos anos.

En segundo lugar, en el artıculo “Razonamiento ba-sado en casos: ejemplos de aplicaciones poco convencio-

nales”, Ramon Lopez de Mantaras nos presenta tecnicasde aprendizaje computacional basadas en el “reciclaje”de soluciones conocidas, a problemas identificados co-mo similares a los que se busca resolver. Se ilustran lastecnicas presentadas con interesantes aplicaciones de larepresentacion de piezas de jazz y el futbol robotico.

A continuacion Hugo Jair Escalante y Eduardo F.Morales revisan en su contribucion “Ver para aprendery aprender a ver: sinergias entre aprendizaje y visioncomputacionales”, la aplicacion del aprendizaje compu-tacional para el tratamiento, analisis e interpretacion deinformacion visual, contenida en imagenes y videos; pro-blema muy complejo, pues para ello los humanos usamosnuestro conocimiento del mundo, adquirido durante anosde aprendizaje e interaccion con el mundo mismo, nos di-cen los autores.

Rene MacKinney Romero y John C.H. Goddard sonlos autores de nuestro cuarto artıculo, “Silabeo automati-co del espanol con arboles de decision”, en el cual se abor-da el problema de como dividir las palabras en sılabas,reto que enfrentan los programas para reconocimientoautomatico del habla. Ejemplos de arboles de decision,la tecnica descrita en el artıculo, obtenidos a partir deobras de Mario Benedetti y Miguel de Cervantes Saave-dra son presentados y analizados, entre otros aspectos deeste interesante problema.

Cierra este volumen Horacio Carvajal Sanchez Yar-za con la contribucion “Minerıa de datos en el ambien-te bancario”, en la cual recorre areas de las institucio-nes financieras en las que el aprendizaje computacionalpuede incidir favorablemente. Esta contribucion describeaplicaciones del aprendizaje computacional llevadas a lapractica y en uso en el ambiente bancario, sector en elcual el autor tiene amplia experiencia.

Nuestros columnistas de e-Tlakuilo, Estado del IAr-te, Sakbe, IA & Educacion y Deskubriendo Konocimientohan preparado tambien materiales de gran interes paranuestros lectores. Aprovechamos para darle las gracias aOscar Herrera, quien dejo de hacerse cargo de e-Tlakuilo,y le damos la bienvenida a Hector Hugo Aviles, quien losustituye en el equipo.

¡Les deseamos una muy interesante lectura!

Angelica Munoz es Editora en Jefe de la revistaKom-puter Sapiens desde noviembre de 2010, y miembro delequipo editorial desde la creacion de la revista.

Eduardo F. Morales es experto en aprendizaje compu-tacional, y es Editor Invitado de este volumen especial.

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Columnas Komputer Sapiens 3 / 32

e-Tlakuilo: Cartas de nuestros lectoresa cargo de Hector Hugo Aviles Arriaga, [email protected]

Estimados lectores, los miembros de grupo editorial deKomputer Sapiens celebramos nuevamente el interesdemostrado en sus correos electronicos por los apasio-nantes temas de IA que presentamos en esta revista. LaIA esta tan inmersa en nuestra vida cotidiana que al-gunas veces suele pasar desapercibida para muchos denosotros. Por ello, igualmente nos congratulamos por suentusiasmo en difundir este esfuerzo editorial dentro desu ambito academico y laboral.

Es muy importante mantener una constante comu-nicacion con ustedes para conocer sus inquietudes y lesreiteramos la invitacion para que nos sigan haciendo lle-gar sus preguntas, comentarios y sugerencias a la direc-cion de correo electronico de esta seccion.

A continuacion les presentamos algunas de las pre-guntas dirigidas a Komputer Sapiens y sus correspon-dientes respuestas.

Jose Alfredo Alonso¿La suscripcion a la revista es independiente del costoanual que mencionan en la pagina? Si es ası, ¿cuantocuesta la suscripcion a la revista o en donde puedo en-contrar las versiones impresas? Saludos y gracias.Estimado Jose Alfredo, el costo de las suscripciones en2011 ası como indicaciones para realizar el pago estanindicados en el formulario de suscripcion disponible enwww.komputersapiens.org.mx/suscripciones.htmlEste pago incluye envıo a domicilio de los dos ejemplaresque editamos este ano. Si usted es miembro activo de laSMIA, el pago de su membresıa le da derecho a recibirlos ejemplares de Komputer Sapiens durante un ano.En este caso solo enviamos un ejemplar a domicilio y elsegundo lo entregamos durante la conferencia MICAI.Si desea versiones impresas de los volumenes previosel costo es de $50.00 M.N. por ejemplar mas gastos deenvıo, que varıan segun el numero de volumenes solici-tados. Salvo el volumen 1 del ano 1, tenemos disponibleslos ejemplares restantes. No tenemos un formato espe-cial para estas solicitudes. Si esta interesado por favordetallenos cuales ejemplares le interesan para que calcu-lemos el costo total.

Miguel Perez Ramırez, Instituto deInvestigaciones Electricas¿Es posible contar con la version electronica del ejemplarde la revista de este ano?Miguel, los ejemplares completos en version digital estandisponibles en nuestro portal web aproximadamente 6meses despues de su aparicion en version impresa. El vo-lumen 1 del ano 3 se publica en nuestro portal al salir ala luz el volumen 2 del mismo ano, dentro de la conferen-cia MICAI 2011. Esta es una polıtica de la revista para

darle el valor de la primicia al ejemplar impreso, al quetienen derecho los socios de la SMIA y los suscriptoresque pagan una suscripcion a la revista. Tambien tenemossuscripciones institucionales que pueden ser aprovecha-das por bibliotecas y escuelas a un precio nada oneroso.La informacion completa esta disponible en nuestro por-tal web: www.komputersapiens.org.mx

Arnulfo Alanıs Garza, InstitutoTecnologico de Tijuana

Quisiera saber cuando se puede mandar [una contribu-cion] para el proximo numero. Ademas, ¿cuales son losrequisitos para poder apoyarlos dentro del grupo edito-rial?Arnulfo, tenemos un llamado permanentemente abier-to para presentar contribuciones. En nuestro portalpodra encontrar mas informacion a ese respecto. Todaslas contribuciones recibidas siguen un proceso de eva-luacion que puede tomar varios meses, y se agendan enlos volumenes no tematicos segun orden de aprobacion.Los artıculos invitados para integrar numeros tematicossiguen otro proceso. Anunciamos esos volumenes en lamisma revista con anterioridad. Si esta interesado en con-tribuir en Komputer Sapiens es conveniente estar altanto de los temas de los volumenes tematicos en pre-paracion y contactarnos si alguno es de su interes. Conrespecto a integrarse al equipo editorial de esta revista,requerimos por supuesto mas voluntarios que quieran su-mar su esfuerzo al nuestro. Lo invitamos a revisar lascolumnas de la revista y comenzar a contribuir en aque-llas que mas le interesen para comenzar a integrarlo anuestro equipo.

Manuel Martınez Morales, UniversidadVeracruzana

Creo que su revista cumple un papel fundamental encomunicar socialmente diversos aspectos de la IA. Poraca con otros companeros hemos iniciado un suplementode divulgacion cientıfica, de caracter general, en La Jor-nada Veracruz. Se llama “El Jarocho Cuantico”, aparecemensualmente y ya vamos en el numero 8. En particularel numero 6 lo dedicamos a la IA. Les envıo la edicionpdf de este numero. Reciban un cordial saludo, especial-mente para nuestra colega Angelica Munoz.Estimado Manuel, muchas gracias por tu mensaje, ytambien te felicitamos por el esfuerzo tan valioso de quie-nes dan vida a “El Jarocho Cuantico”. Nuestros lectoresinteresados en el numero dedicado a la IA, que desafor-tunadamente no permanece disponible en el portal webdel periodico La Jornada Veracruz, pueden solicitarlo ala direccion [email protected].✵

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Columnas Komputer Sapiens 4 / 32

COLUMNAS

Estado del IArteMarıa del Pilar Gomez Gil y Jorge Rafael Gutierrez Pulido, [email protected]

ANALISIS DE VIDEO. El usode tecnicas de aprendizaje compu-tacional para el analisis automati-co de video esta volviendose maspopular cada dıa. Por ejemplo, elsistema conocido como VAR (Vi-deo Activity Report) producido porla empresa ProBayes, utiliza mo-delos probabilistas Bayesianos paraidentificar entidades en movimientodentro de un video. Ademas, VARestima la posicion y predice el movi-miento de estas entidades. Con es-ta informacion VAR genera una se-rie de estadısticas que pueden uti-lizarse en areas muy diversas, porejemplo: la medicion de actividaddel trafico de carreteras, el segui-miento de clientes en una tienda de-

partamental para optimizacion demercado, el aumento en la seguri-dad en un aeropuerto, etc. VAR esun ejemplo mas de la utilidad de laIA para mejorar la productividad1.Para saber mas sobre VAR consul-tar www.probayes.com.

ROBOCUP 2012. RoboCup esuna iniciativa que tiene por objetivoel que un equipo de robots jugado-res de futbol soccer venza al equipocampeon del mundo en este depor-te. Del 18 al 24 de junio de 2012se llevara a cabo en el World Tra-de Center de la ciudad de Mexicola competencia internacional Robo-Cup. Este acontecimiento sin lugara dudas fortalecera el desarrollo dela robotica en Mexico, por lo que

la Federacion Mexicana de Roboti-ca, A.C. esta buscando que 2012sea declarado el Ano de la Roboti-ca en Mexico. Para saber mas con-sultar www.robocup2012.org yfemexrobotica.org✵

Camara de vision utilizada por

VAR para procesamiento de vi-

deo en tiempo real. Cortesıa de

Probayes Americas

Sakbea cargo de Laura Cruz Reyes y Hector Gabriel Acosta Mesa, [email protected]

Aprendizaje Automatico en

CMU ⇒ La fascinante idea deprogramar computadoras para queaprendan y mejoren su desempenocon la experiencia es un area deinvestigacion muy activa. Sus apli-caciones van desde el control de ro-

bots autonomos de servicios multi-ples, hasta el diseno de sistemasinteligentes capaces de descubrirrelaciones complejas en grandesbases de datos. Un centro de in-vestigacion importante en el areaes el Departamento de Aprendizaje

Computacional de la Universidadde Carnegie Mellon, dirigido por elDr. Tom Mitchell. En su portal sepueden encontrar interesantes ligasa platicas, tutoriales y publicacio-nes sobre topicos del area.

www-2.cs.cmu.edu/˜tom

WEKA 3 ⇒ Un grupo de in-vestigadores de la Universidad deWaikato de Nueva Zelanda desa-rrollo la plataforma de softwareWEKA (Waikato Environment forKnowledge Analysis) para tareas deaprendizaje automatico y minerıade datos. WEKA es software libre

escrito en Java distribuido bajo li-cencia GNU-GPL. WEKA contie-ne una extensa coleccion de tecni-cas que posibilitan las tareas de vi-sualizacion, analisis de datos y mo-delado para prediccion. Una inter-faz grafica facilita el acceso a todasu funcionalidad. Actualmente WE-

KA es muy popular en los ambitosacademico, industrial y de investi-gacion. Puede ayudar en la toma dedecisiones, proporcionar un extensobanco de prueba para desarrollo denuevos algoritmos, y apoyar la en-senanza de tecnicas de aprendizajeautomatico.✵

www.cs.waikato.ac.nz/ml/weka

1Agradecemos al Dr. Juan-Manuel Ahuactzin, CEO de Probayes Americas, por la informacion proporcionada acerca del proyecto VAR.

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 5 / 32

ARTICULO INVITADO

Reconocimiento de patronespor Jesus Ariel Carrasco Ochoa y Jose Francisco Martınez Trinidad

Introduccion

De manera intuitiva, podemos definir el reconoci-miento de patrones como la forma de interpretar al mun-do, por ejemplo, un nino desde bebe aprende a reconocersu entorno distinguiendo patrones visuales (formas, co-lores, etc.), auditivos (sonidos, musica, etc.), sensitivos(calor, frıo, etc.), entre otros. Conforme un nino crece varefinando su capacidad de reconocimiento de patrones,de manera que puede distinguir una melodıa de otra, di-ferentes variaciones de temperatura, diferentes tonalida-des de un mismo color. Posteriormente aprende a hablar,a reconocer letras, a formar y entender palabras, etc. Enfin, podemos decir que el reconocimiento de patrones es elmecanismo con el que contamos para distinguir unas co-sas de otras, relacionar cosas semejantes, formar gruposde cosas, describir objetos, tomar y explicar decisiones,etc.

Sin embargo, para lograr hacer esto de manera au-tomatica es necesario resolver problemas que involucrancuestiones de medicion, validacion, procesamiento y enultima instancia interpretacion de la informacion en elentorno que se quiere estudiar, con todo esto, el reco-nocimiento de patrones se vuelve un campo de estudiomulti-disciplinario. Por este motivo, en un sentido masformal, podemos definir al reconocimiento de patronescomo “la ciencia que se ocupa de los procesos sobre inge-nierıa, computacion y matematicas relacionados con ob-jetos fısicos y/o abstractos, con el proposito de extraerinformacion que permita establecer propiedades de o en-tre conjuntos de dichos objetos, los cuales nos permitaninterpretar el mundo que nos rodea” [1].

De esta manera podemos entender al reconocimientode patrones como un mecanismo para formalizar y au-tomatizar los procesos de interpretacion del mundo real.Dentro de los problemas que comunmente se abordan enel reconocimiento de patrones tenemos la seleccion deatributos y prototipos, la clasificacion y el agrupamiento[1], los cuales abordaremos mas adelante.

Para resolver problemas de reconocimiento de patro-nes se han seguido diferentes enfoques, entre los cualesencontramos:

Reconocimiento estadıstico de patrones [2,3]: Este enfoque se basa en la teorıa de probabili-dad y estadıstica y supone que se tiene un conjuntode medidas numericas con distribuciones de proba-bilidad conocidas o estimables, y a partir de ellasse hace el reconocimiento.

Reconocimiento sintactico de patrones [4, 5]:Este enfoque ha sido desarrollado para el estudiode objetos que no estan descritos como vectoresde atributos, por ejemplo objetos descritos como:cadenas de sımbolos, grafos, etc. Comunmente, elobjetivo es encontrar las relaciones estructuralesque guardan los objetos de estudio.

Redes neuronales [6]: Este enfoque busca resol-ver los problemas de reconocimiento de patronesmediante redes neuronales artificiales, las cualespueden ser entrenadas para dar una cierta respues-ta cuando se les presentan determinados valoresnumericos en sus entradas. De este modo una redneuronal artificial puede dar una respuesta similarcuando se presenta una entrada parecida a las quese usaron para entrenarla.

Reconocimiento logico combinatorio [1]: Esteenfoque constituye una alternativa a los enfoquesantes mencionados y se basa en la idea de que elmodelado del problema debe ser lo mas cercanoposible a la realidad del mismo, sin hacer supo-siciones que no esten fundamentadas. Uno de losaspectos esenciales del enfoque es que los atributosutilizados para describir a los objetos de estudiodeben ser tratados cuidadosamente para no reali-zar operaciones que resulten antinaturales respectoal problema que estan representando. Este trata-miento cuidadoso permite trabajar con atributoscualitativos y cuantitativos e incluso con ausenciade informacion.

Problemas de reconocimiento depatrones

Como ya mencionamos, algunos de los problemas quepueden resolverse usando tecnicas de reconocimiento depatrones son la seleccion de atributos y prototipos, laclasificacion y el agrupamiento.

Seleccion de atributos y prototiposDentro del reconocimiento de patrones, uno de los

problemas mas importantes es la seleccion de atributosrelevantes a partir del conjunto total de atributos que seles pueden medir a los objetos de estudio. Este proce-so de seleccion comunmente se hace con el objetivo demejorar otros procesos de reconocimiento de patrones,como por ejemplo la clasificacion y el agrupamiento, in-tentando reducir los tiempos de procesamiento o aumen-tar la calidad de los resultados. Sin embargo, la seleccion

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 6 / 32

de atributos tambien puede ser un problema importantepor sı mismo, al tratar de encontrar los atributos quemejor describan a los objetos de estudio; por ejemplo,si se esta estudiando el problema de la criminalidad, lasleyes no admitirıan el uso de un sistema que, con base encaracterısticas descriptivas, determinara si una personasera un delincuente o no; sin embargo, es de gran impor-tancia determinar cuales son los factores que promueveno conducen a conductas delictivas, con el objetivo de ata-car el problema desde su origen.

De la misma manera no todos los objetos, de los cua-les se tiene una descripcion, son relevantes para el pro-blema a resolver, algunos puede ser producto del ruido(producido por mediciones erroneas, errores de captura,etc.), otros pueden ser casos atıpicos, o casos redundan-tes, que pueden sesgar las soluciones, o simplemente pue-den no contribuir ni a favor ni en contra de la calidad dela solucion y por lo tanto solo generan trabajo adicionalpara su procesamiento; y ocupan espacio extra para sualmacenamiento. Por todas estas razones es necesario se-leccionar cuales de los objetos son realmente utiles parael problema que se quiere resolver.

Tanto para la seleccion de atributos como para la se-leccion de objetos existen dos estrategias principales parala tarea de seleccion [7], a saber:

Estrategia wrapper [8], la cual toma en cuen-ta el mecanismo que se usara para dar solucion alproblema de reconocimiento y consiste en algunaestrategia de busqueda sobre el espacio de posiblesselecciones, usando el mecanismo de reconocimien-to para evaluar a los posibles candidatos. Los meto-dos de la estrategia wrapper obtienen en generalbuenos resultados, pero consumen largos tiemposde ejecucion pues requieren evaluar constantemen-te el desempeno del mecanismo de reconocimientopara diferentes selecciones.

Estrategia filter [7], la cual realiza la seleccionsin tomar en cuenta el mecanismo de reconocimien-to que se usara, utilizando comunmente medidasintrınsecas de los datos como: entropıa, redundan-cia, concordancia, “separabilidad”, entre otras.

ClasificacionEl problema de clasificacion, comunmente conocido

como clasificacion supervisada consiste en, dado un uni-verso de estudio dividido en clases y una muestra de obje-tos ya clasificados, encontrar mecanismos que nos permi-tan clasificar nuevos objetos. En la Figura 1 se muestraun esquema de este problema.

Para resolver el problema de clasificacion supervisa-da se ha desarrollado una gran cantidad de metodos, porejemplo: clasificadores Bayesianos [9], arboles de deci-sion [10], redes neuronales [11], maquinas de vectores desoporte [12], vecinos mas cercanos [13], algoritmos de vo-

tacion [1], clasificadores basados en patrones [14], clasifi-cadores basados en conjuntos de representantes [15], etc.Ademas, para cada uno de estos clasificadores se tienediversas variantes y formas de combinarlos para formarsistemas multi-clasificadores [16]. Con todo esto, la se-leccion de la tecnica de clasificacion mas adecuada paraun problema practico particular constituye en sı mismoun problema que es en general muy difıcil de resolver,siendo la opcion mas utilizada el hacer pruebas con dife-rentes clasificadores y seleccionar aquel que obtenga losmejores resultados para una cierta muestra de control;sin embargo este proceso puede ser muy costoso.

Por otro lado, el problema de seleccionar el mejorclasificador para un problema se ha planteado como unproblema de reconocimiento y se han desarrollado meta-clasificadores que permiten seleccionar un clasificadorpara un problema particular, sin embargo, la forma dedescribir a los problemas y la forma de seleccionar el me-jor clasificador siguen siendo problemas de investigacionabiertos.

Figura 1. Proceso de clasificacion

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 7 / 32

Figura 2. Proceso del reconocimiento de patrones

AgrupamientoEl problema de agrupamiento, tambien conocido co-

mo clasificacion no supervisada, consiste en, dada unamuestra de objetos, encontrar las clases en las que seagrupan dichos objetos. En dependencia de la forma deresolver este problema hay dos tipos de metodos de agru-pamiento [17]:

Restringidos: El numero de grupos esta previa-mente definido. Esto resulta util cuando se tieneconocimiento acerca de la estructura del universode estudio, pero se desconoce la clasificacion de lamuestra.

Libres: El numero de grupos es desconocido. Estees el caso mas general, es decir, solo se cuenta conuna muestra de objetos, pero se desconoce la formaen que se estructura el universo.

Para resolver el problema de agrupamiento se hadesarrollado gran cantidad de metodos, entre los cualespodemos mencionar los siguientes grandes grupos [18]:

Agrupamientos jerarquicos: Consisten en gene-rar una jerarquıa de agrupamientos, lo cual puedehacerse de forma acumulativa, es decir, partiendode grupos formados por un solo objeto de la mues-tra y agrupandolos poco a poco hasta obtener unsolo agrupamiento con todos los objetos de la mues-tra; o divisiva, partiendo del conjunto completo de

objetos de la muestra y dividiendo sucesivamentelos agrupamientos hasta llegar a tener solamentegrupos formados por un solo objeto de la muestra.Este tipo de metodos de agrupamiento puede utili-zarse para construir taxonomıas en un universo deobjetos, o bien para formar un solo agrupamien-to evaluando cada nivel y seleccionando aquel conlos grupos de mejor calidad. Ejemplos de este ti-po de metodos de agrupamiento son simple link ycomplete link [17].

Tecnicas de re-agrupamiento: Esta manera dehacer agrupamientos consiste, suponiendo que seconoce el numero de agrupamientos que se quie-re obtener, en generar una distribucion inicial delos objetos de la muestra, para tener esta cantidadde agrupamientos y despues hacer reorganizacionessucesivas hasta obtener un agrupamiento que cum-pla con un cierto criterio. Como ejemplos de estaestrategia podemos mencionar el K-means [2] y elISODATA [18].

Agrupamiento basado en grafos: Este tipo demetodos de agrupamiento consiste en generar ungrafo que contenga toda la informacion de semejan-zas entre los objetos de la muestra y posteriormen-te generar un cubrimiento de dicho grafo. Ejemplosde este tipo de metodos de agrupamiento son losalgoritmos Star [19], GStar [20] y Acons [21].

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 8 / 32

Proceso de Reconocimiento de PatronesPara la aplicacion de modelos de reconocimiento de

patrones en problemas practicos se necesita de un proce-so de modelado, en el cual intervienen especialistas delarea de aplicacion y especialistas en reconocimiento depatrones, los cuales interactuan para obtener un modelode la realidad, dentro del campo de aplicacion, el queposteriormente sera formalizado para crear un modelode reconocimiento de patones, el cual es utilizado parasolucionar el problema.

Durante este proceso de modelado, resulta importan-te que los especialistas en reconocimiento de patrones co-nozcan la esencia del problema que se esta tratando desolucionar, ası como las limitaciones de las herramientasde que disponen. Tambien resulta muy importante queel especialista del area de aplicacion entienda la formaen que su problema sera solucionado, es decir, el procesoal cual seran sometidos sus datos, ası como la maneraen que seran interpretados los resultados, de modo quepueda confiar en los sistemas automatizados que se ob-tengan, y por lo tanto los utilice. Mas aun, el especia-lista del area de aplicacion debe ser capaz de cuestionarsu modelo de la realidad, en caso de que los resultadosobtenidos no sean los esperados.

En la Figura 2 se muestra un esquema simplificadodel proceso de reconocimiento de patrones [1], en el cualla retroalimentacion permite, o deberıa permitir, no solomodificar el modelo de reconocimiento aplicado al pro-blema, sino que tambien el modelo que el especialistadel area de aplicacion tiene de la realidad.

AplicacionesLas tecnicas de reconocimiento de patrones pueden

ser aplicadas en casi cualquier area del conocimiento enla cual se estudien objetos, sus descripciones y la formaen que se organiza el universo de estudio. Entre las princi-pales areas de aplicacion estan las denominadas “cienciaspoco formalizadas”, como la geologıa, geofısica, medici-na, psicologıa, criminologıa, etc., en las cuales es difıcilque los especialistas del area de aplicacion construyan al-goritmos para resolver problemas tales como el diagnosti-co medico, prospeccion geologica, evaluacion psicologica,etc. En este tipo de ciencias, las tecnicas de reconoci-miento de patrones pueden ser entrenadas con casos co-nocidos (los cuales contienen la experiencia de los espe-cialistas del area de aplicacion), mediante los cuales se“aprende” a resolver problemas que de otro modo serıanmuy difıciles de resolver. Para ejemplificar a continuacionse mencionan algunas aplicaciones de reconocimiento depatrones, en las que los autores de este trabajo ha tenidoalgun tipo de participacion o conocimiento:

Identificacion de rostros. El problema consisteen decidir, a partir de una serie de imagenes de di-ferentes personas y cuando se presenta una nueva

imagen de una persona, si esta es alguna de las per-sonas registradas y, en caso de que lo sea, de cualde ellas se trata [22].

Identificacion de personas por su forma decaminar. En este problema se parte de la suposi-cion de que cada persona tiene una estilo particularde caminar, el cual puede ser usado para identifi-carla. La muestra de entrenamiento esta formadapor un conjunto de videos de personas caminando yel objetivo es, dado un nuevo video de una personacaminando, identificar de quien se trata [23].

Prediccion de magnitudes maximas de terre-motos. Este problema consistio en determinar elrango de magnitudes maximas de terremotos quepodrıan presentarse en el corto plazo en diferentesregiones de las islas del Caribe [24].

Busqueda de petroleo. Este trabajo se desa-rrollo en colaboracion con el grupo de geo-matematica del Centro de Investigaciones y Desa-rrollo del Petroleo de Cuba. Los datos de la mues-tra de entrenamiento contienen zonas perspecti-vas de acumulacion de hidrocarburos en secuen-cias ofiolıticas dentro del territorio insular de laRepublica de Cuba. El objetivo consiste en deter-minar el grado de certeza para encontrar hidrocar-buros, dentro de trece posibles grados determina-dos por los especialistas en Geologıa [25].

Determinacion de factores que inciden en losdiferentes tipos de uveıtis (inflamacion de lauvea o lamina intermedia del ojo, que aporta lamayor parte del suministro sanguıneo a la retina).Este es un ejemplo de un problema de seleccionde variables para la representacion. El problemaconsiste en determinar cuales son los factores quepromueven la aparicion de un cierto tipo de uveıtis.Se obtuvieron datos de cuatro grupos de pacientes,con los cuatro tipos distintos de uveıtis [26].

Como podemos ver el espectro de problemas en quelas tecnicas de reconocimiento de patrones puede aplicar-se es grande y variado. Ademas, cada problema tiene ca-racterısticas o peculiaridades que plantean nuevos retosen la disciplina ya que algunos casos obligan a modificaro extender las tecnicas existentes y otros, a crear nuevastecnicas para abordar los problemas que la practica im-pone, de ahı la importancia de continuar el trabajo deinvestigacion en el reconocimiento de patrones.✵

REFERENCIAS1. Ruiz-Shulcloper J., Guzman Arenas A., Martınez-Trinidad

J.F. (1999) “Enfoque Logico Combinatorio al Reconoci-miento de Patrones I”, Seleccion de Variables y Clasifica-cion Supervisada, IPN, Mexico.

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 9 / 32

2. Tou J.T., Gonzalez R.C. (1974) Pattern Recognition Prin-ciples, Addison-Wesley.

3. Schalkoff R.J. (1992) Pattern Recognition: Statistical,Structural and Neural Approaches, Wiley & Sons.

4. Gonzalez R.C., Thomason M. G. (1978) Syntactic PatternRecognition: An introduction, Addison-Wesley.

5. K.-S. Fu (1982) Syntactic Pattern Recognition and Appli-cations, Prentice-Hall.

6. Ripley B.D. (1996) Pattern Recognition and Neural Net-works, Cambridge University Press.

7. John G.H., Kohavi R., Pfleger K. (1994) “Irrelevant Featu-res and the Subset Selection Problem”, Machine Learning:Proceedings of the Eleventh International Conference, pp.121-129, Morgan Kaufmann.

8. Kohavi R., John G.H. (1997)“Wrappers for Feature SubsetSelection”, Journal of Artificial Intelligence, numero espe-cial en relevancia.

9. Duda R.O., Hart P.E., Stork D.G. (2000) Pattern Classifi-cation, 2a edicion, Wiley-Interscience.

10. Quinlan J.R. (1986) “Induction of Decision Trees”, MachineLearning, Vol. 1, pp. 81-106.

11. Haykin S. (1998) Neural Networks: A Comprehensive Foun-dation, Prentice Hall.

12. Shawe-Taylor J., Cristianini N. (2000) Support Vector Ma-chines and other kernel-based learning methods, CambridgeUniversity Press.

13. Dasarathy Belur V. -editor- (1990) Nearest Neighbor: Pat-tern Classification Techniques, IEEE Computer Society.

14. Ramamohanarao K., Fan H. (2007) “Patterns based classi-fiers”, World Wide Web, 10(1), pp. 71–83.

15. Baskakova L.V., Zhuravlev Y.I. (1981) “Modelo de Algorit-mos de Reconocimiento con Conjuntos de Representantes ySistemas de Conjuntos de Apoyo”, Zhurnal VichislitielnoiMatemati y Matematicheskoi Fisiki, 21(5), pp.1264-75.

16. Ranawana R., Palade V. (2006) “Multi-Classifier Systems:Review and a roadmap for developers”, International Jour-nal of Hybrid Intelligent Systems, 3(1), pp 35–61.

17. Jain A.K., Dubes R.C. (1988) Algorithms for Clustering Da-ta, Prentice Hall.

18. Escudero L.F. (1977) Reconocimiento de Patrones, Paranin-fo.

19. Aslam J., Pelekhov E., Rus D. (2004) “The star clusteringalgorithm for static and dynamic information organization”,Journal of Graph Algorithms and Applications, 8(1):95–129.

20. Perez-Suarez A., Medina-Pagola J. (2007) “A clustering al-gorithm based on generalized stars”, Proceedings of the 5thInternational Conference on Machine Learning and DataMining in Pattern Recognition, LNAI 4571, pp. 248–262.

21. Gago-Alonso A., Perez-Suarez A., Medina-Pagola J. (2007)“Acons: a new algorithm for clustering documents”, Procee-dings of the 12th Iberoamerican Congress on Pattern Recog-nition, LNCS 4756, pp 664–673.

22. Lopez Espinoza E.D. (2004) “Feature selection and ima-ge classification in eigenspaces using Logical Combinato-rial Pattern Recognition”, Tesis de Maestrıa en CienciasComputacionales, Instituto Nacional de Astrofısica, Opti-ca y Electronica, Mexico.

23. Romero-Moreno M., Martınez-Trinidad J.F., Carrasco-Ochoa J.A. (2008) “Gait Recognition Based on Silhouette,Contour and Classifier Ensambles”, Proceedings of 13th Ibe-roamerican Congress on Pattern Recognition, LNCS 5197,Springer-Verlag, pp. 527-534.

24. Ruiz-Shulcloper J., Alvarez L., Pico R. (1992) “Modelacionmatematica del pronostico de magnitudes maximas de losterremotos en la region del Caribe”, Reconocimiento de es-tructuras espaciales, Editorial Academia, Cuba. pp. 81-101.

25. Gomez J., Rodrıguez O., Valladares S., Ruiz-Shulcloper J.(1994) “Pronostico gasopetrolıfero en la asociacion ofeolıti-ca aplicando la modelacion matematica”, Revista GeofısicaInternacional 33(3), pp 447-467.

26. Martınez-Trinidad J.F., Velasco-Sanchez M., Contreras-Arevalo E. (2000) “Feature Selection for Classification ofPatients with Uveitis”, 5th Iberoamerican Symposium onPattern Recognition, pp. 459-466.

SOBRE LOS AUTORES

Jesus Ariel Carrasco Ochoa recibio su doctorado en Ciencias de la Computacion en el Centro deInvestigacion en Computacion del Instituto Politecnico Nacional. Actualmente trabaja como investi-gador de tiempo completo en el Instituto Nacional de Astrofısica, Optica y Electronica. Sus areas deinteres incluyen reconocimiento logico combinatorio de patrones, minerıa de datos, teorıa de testores,seleccion de atributos y prototipos, procesamiento de grandes conjuntos de datos, clasificacion basadaen patrones y agrupamiento.

Jose Francisco Martınez Trinidad termino sus estudios de licenciatura y maestrıa en Ciencias dela Computacion en la Benemerita Universidad Autonoma de Puebla. Obtuvo el grado de doctor enCiencias de la Computacion en el Centro de Investigacion en Computacion del Instituto PolitecnicoNacional. Actualmente es investigador de tiempo completo en el Instituto Nacional de AstrofısicaOptica y Electronica. Ha editado/publicado 6 libros y mas de 120 artıculos en revistas y conferenciasinternacionales con arbitraje estricto. Sus areas de interes incluyen: reconocimiento logico combinato-rio de patrones, analisis de datos mezclados, agrupamiento conceptual, seleccion de variables, seleccionde instancias, analisis de textos, clasificacion de documentos, minerıa de patrones frecuentes y metodosde reconocimiento de patrones para minerıa de datos.

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 10 / 32

ARTICULO INVITADO

Razonamiento basado en casos: ejemplos deaplicaciones poco convencionalespor Ramon Lopez de Mantaras

IntroduccionEl razonamiento basado en casos (CBR, en sus siglas

en ingles) es un enfoque a la solucion de problemas quehace enfasis en el papel que juega la experiencia adquiri-da resolviendo problemas a la hora de solucionar futurosproblemas. Es decir, nuevos problemas se resuelven me-diante la re-utilizacion y, si es necesario, adaptacion delas soluciones a problemas similares que se resolvieronen el pasado. Es tambien una tecnica de inteligencia ar-tificial que se ha aplicado con notable exito a una ampliavariedad de tareas y dominios. Tras una breve visiongeneral del ciclo tradicional de resolucion de problemasen CBR, se presenta una seleccion de la investigacionmas representativa en CBR en algunos dominios pococonvencionales (en el sentido que existen todavıa rela-tivamente pocas aplicaciones CBR en dichos dominios)como son la musica y el futbol robotico. Por lo tanto, elobjetivo de este artıculo es presentar un resumen muyconciso de algunas investigaciones relevantes en estosdominios de aplicacion.

La resolucion de problemas medianteCBR

A pesar de que mucha de la inspiracion para el es-tudio del razonamiento basado en casos procedıa de lainvestigacion sobre la memoria humana llevada a cabo enlas ciencias cognitivas [1], la metodologıa resultante hademostrado ser util en una amplia gama de aplicaciones[2-4]. A diferencia de la mayorıa de las metodologıas deresolucion de problemas en inteligencia artificial (IA), elCBR esta basado en el uso de la memoria como un pun-to de partida para la resolucion de problemas nuevos.La hipotesis fundamental del CBR es que problemas si-milares tienen soluciones similares [5]. Esta hipotesis seha demostrado cierta para escenarios simples [6], y se havalidado empıricamente en muchos ambitos del mundoreal.

Resolver un problema mediante CBR consiste en ob-tener una descripcion del problema, calcular su similitudcon las descripciones de problemas anteriores (almacena-dos en una base de casos junto con sus respectivas solu-ciones), recuperar uno o mas casos similares, y tratar de

reutilizar la solucion de uno de los casos recuperados, po-siblemente despues de su adaptacion para tener en cuen-ta las diferencias en las descripciones de los problemas.A continuacion la solucion propuesta por el sistema esevaluada (por ejemplo, aplicandola al problema inicialo siendo evaluada por un experto del dominio), tras locual, tanto la descripcion del problema como su solucionpueden ser retenidas como un nuevo caso, con lo que elsistema ha aprendido a resolver un nuevo problema.

La Figura 1 muestra el modelo clasico [7] del ciclo deresolucion de problemas en CBR. Las tareas individualesen el ciclo CBR (es decir, recuperar, reutilizar, revisary retener) se conocen como las “4 R”. Debido al papelfundamental de la recuperacion en el ciclo CBR, unaconsiderable cantidad de investigacion se ha centrado enla recuperacion de casos y, por consiguiente, en la eva-luacion de la similitud entre descripciones de problemas[8]. Los aspectos relacionados con la re-utilizacion y re-tencion, y en menor medida con la revision, tambien handado lugar a importantes investigaciones [8]. Ademas,varios libros examinan aspectos fundamentales del CBR[2, 4, 9-12].

CBR en musicaUn campo emergente muy representativo es la musi-

ca. El primer trabajo de aplicacion del CBR a la musicaes el de Arcos et al. [13]. En el, los autores describen unsistema, denominado SaxEx, capaz de sintetizar interpre-taciones de baladas de jazz de una alta calidad expresivaa partir de casos que contienen interpretaciones humanasdel mismo estilo musical.

La expresividad musical es un campo de estudiode gran importancia tanto en musicologıa como en in-formatica musical. Los sistemas anteriores, basados enreglas, para modelizar la expresividad no contemplabanmas de dos parametros expresivos (tales como la dinami-ca y el rubato), ya que es muy difıcil obtener reglas capa-ces de capturar la variedad presente en las interpretacio-nes expresivas. Ademas, los diferentes parametros expre-sivos interactuan unos con otros lo que dificulta aun masencontrar reglas adecuadas que tengan en cuenta estasinteracciones.

Nuevos problemas se resuelven mediante la re-utilizacion y adaptacion

de las soluciones a problemas similares resueltos en el pasado.

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 11 / 32

Figura 1. Ciclo de resolucion de problemas en CBR [7]

Usando CBR, los autores de SaxEx han demostradoque es posible incorporar los cinco parametros expresivosmas importantes en musica: dinamica, rubato, vibrato,articulacion, y ataque de las notas. Para ello, SaxEx utili-za una memoria de casos que contiene ejemplos de inter-pretaciones humanas, previamente analizadas por mediode tecnicas de modelado espectral con el fin de obteneruna descripcion simbolica de las duraciones de las notas,ası como sus niveles dinamicos, de articulacion, de vibra-to y el tipo de ataque, y conocimientos musicales. Laspartituras correspondientes tambien se proporcionan alsistema. Todo este conocimiento es necesario para anali-zar las notas con el fin de determinar el papel que jueganen la frase musical a la que pertenecen y de esta formaidentificar y recuperar aquellas notas expresivas de labase de casos que son similares a las notas de la frasemusical de entrada que debe ser sintetizada expresiva-mente. Una vez seleccionadas las notas expresivas massimilares, SaxEx procede a transferir sus valores expre-sivos a las correspondientes notas de la frase de entradaque deben ser sintetizadas.

La representacion de los casos en este sistema es unarepresentacion orientada a objetos estructurada y com-pleja lo cual requirio desarrollar un nuevo lenguaje derepresentacion de casos y un nuevo algoritmo de recu-peracion de casos complejos basado en el concepto dePerspectiva [14]. En una Perspectiva, los casos y las si-militudes se representan como terminos de caracterısti-cas (feature terms), que son equivalentes a terminos de

primer orden y tambien pueden ser vistos como grafosdirigidos acıclicos etiquetados por las caracterısticas ylos valores [15].

El algoritmo de recuperacion de casos se basa en unmecanismo de subsuncion entre terminos de caracterısti-cas que proporciona una relacion de orden entre los casosque permite seleccionar el caso mas similar (las notasexpresivas mas similares en el caso de SaxEx). Es unejemplo claro de como un dominio nuevo de aplicacionrequiere desarrollar nuevas tecnicas de CBR. En aquellosdominios en los que la representacion de los problemasse pueda hacer sencillamente mediante listas de pares“atributo-valor”, los algoritmos de recuperacion basadosen simples medidas de similitud basadas en el calculode distancias son suficientes. Ver [8] para una detalladadiscusion de medidas de similitud y otras alternativasexistentes para resolver el problema de la recuperacionde casos en CBR.

Aunque limitadas interpretaciones monofonicas, losresultados obtenidos son muy convincentes y demues-tran que el razonamiento basado en casos es una tecni-ca muy poderosa para directamente utilizar los cono-cimientos de un interprete humano que estan implıci-tos en sus interpretaciones musicales en lugar de tra-tar de explicitar estos conocimientos por medio de re-glas. El audio de algunos resultados se puede escuchar enwww.iiia.csic.es/˜mantaras. Trabajos mas recientes [16,17] describen este sistema en detalle. Sobre la base delos resultados de SaxEx, posteriormente se desarrollo el

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 12 / 32

sistema TempoExpress.TempoExpress [18], es un sistema que usa CBR para

modificar automaticamente el tempo de una interpreta-cion musical preservando la expresividad. El problema esque el cambio de tempo de una interpretacion no puedereducirse a una transformacion uniforme de las duracio-nes de todas las notas que la componen ya que la expre-sividad es un recurso para enfatizar la estructura musicalde la melodıa y el contenido afectivo y tanto la estruc-tura musical como la afectividad dependen del tempo.En otras palabras, el interprete adapta la expresividaden funcion del tempo. TempoExpress tiene en su base decasos un conjunto de interpretaciones expresivas a tem-pos distintos de forma que cuando recibe como entradauna interpretacion a un tempo dado y el tempo targetal cual debe ser re-interpretada, recupera de la base decasos interpretaciones a tempos similares al de entraday al target, analiza las diferencias expresivas de ambostempos y transfiere estas diferencias a la interpretacionque debe transformar.

Otras aplicaciones del CBR a la musica expresivason los de Suzuki et al. [19], y los de Tobudic y Widmer[20]. Suzuki et al. [19] tambien usan ejemplos de casos deinterpretaciones expresivas para generar multiples inter-pretaciones de una pieza con diferentes expresividades;sin embargo, consideran solo dos parametros expresivos.Tobudic y Widmer [20] aplican el aprendizaje basado eninstancias (IBL), una tecnica de CBR, al problema dela generacion de musica expresiva. El enfoque de IBLse utiliza como complemento a un modelo basado enreglas al nivel de notas con el fin de dotar al sistema decapacidad de prediccion al nivel del fraseo musical. Masconcretamente, el componente IBL reconoce los patronesde interpretacion de un concertista de piano a nivel defrases musicales y aprende por analogıa como aplicarlosa las interpretaciones nuevas. Este enfoque dio lugar aalgunos resultados interesantes pero, como reconocen susautores, no fue muy convincente debido a la limitacionde usar una representacion “atributo-valor” para repre-sentar las frases en IBL. Una representacion tan simpleno permite tener en cuenta los elementos estructuralesde la pieza, tanto a nivel de sub-frase como a nivel inter-frase. En un artıculo posterior, Tobudic y Widmer [21]lograron superar en parte estas limitaciones medianteuna representacion relacional de las frases musicales.

CBR en futbol roboticoDisenar comportamientos coordinados de robots en

entornos inciertos, dinamicos y adversos en tiempo realsupone un gran reto. En [22] se presenta un metodo derazonamiento basado en casos para la seleccion de ac-ciones cooperativas por parte de un equipo de robotsAIBO futbolistas atacantes que se basa en ejemplos dejugadas almacenadas en la base de casos. El objetivo esconseguir pases coordinados entre los robots atacantes

para superar la defensa del equipo rival de robots. Loscasos hacen una distincion explıcita entre caracterısticascontrolables (posicion de los robos atacantes) e incontro-lables (posiciones de los robots rivales y del balon). Elsistema introduce un algoritmo original de recuperacionde casos que ademas de tener en cuenta la semejanzade una situacion del juego en relacion con posicion delbalon y los jugadores rivales (las caracterısticas incon-trolables) tambien tiene en cuenta el coste que suponemover los robots del equipo atacante desde su posicionactual hasta las posiciones ideales representadas en elcaso (jugada) mas similar. Es decir que se asigna a losrobots una posicion adaptada a la que se desplazaranpara maximizar la similitud con el caso recuperado. Larecuperacion y re-utilizacion de casos por parte del equi-po atacante se consigue comunicando y compartiendo ac-ciones y estados internos propios. El sistema desarrolladose ha evaluado, tanto en simulaciones como con robotsreales, con jugadas implicando dos robots atacantes con-tra dos robots defensores ası como contra un defensa yun portero. Los resultados demuestran que se consigueun comportamiento de juego cooperativo que incluye pa-ses bien planificados y ejecutados superando claramentelos metodos de juego que no planifican pases.

Karol et al. [23] tambien presentan una solucion ba-sada en CBR al problema de la seleccion de acciones enla liga de robots AIBO. La descripcion del problema in-cluye la posicion de los robots, el grado de posesion delbalon y caracterısticas meta-nivel para guiar el procesode recuperacion de casos similares. Igual que Ros et al.[22] la solucion de cada caso son jugadas apropiadas acada situacion. Los autores proponen varias medidas desimilitud todas ellas basadas en comparar las posicionesde los robots. Dado que es un trabajo muy inicial todavıano se presenta ninguna evaluacion del sistema.

Marling et al. [24] describen tres prototipos basadosen CBR: el primero se encarga de posicionar el portero,el segundo en seleccionar la formacion del equipo y el ter-cero en reconocer estados del juego. Estos prototipos seusan en la liga de robots pequenos pero los experimentosrealizados se validaron unicamente en simulacion y nocon robots reales. Las decisiones del sistema se centranen aspectos estrategicos relacionados con el “coaching”en lugar de decisiones explıcitas de acciones a realizarpor los jugadores.

En la liga de robots simulados tambien existen traba-jos interesantes basados en CBR. Cabe recordar que enesta liga se pueden atacar problemas mas complejos debi-do a que no es necesario resolver los problemas asociadoscon el indeterminismo del mundo fısico. En particular esposible modelar el comportamiento de los jugadores ri-vales. El trabajo de Chen y Liu [25] introduce una arqui-tectura hıbrida a dos niveles. El nivel deliberativo es unsistema CBR y el nivel reactivo corresponde a una repre-sentacion fuzzy de los esquemas motores de los robots.

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 13 / 32

El nivel deliberativo monitorea la ejecucion de las accio-nes y en caso de necesidad anula la aplicacion del casocorriente y recupera otro mas adecuado a la situacion.Las soluciones representadas en los casos corresponden aacciones de un solo jugador lo cual limita su efectividadpara modelar comportamiento cooperativo por parte delequipo. El trabajo no incluye pues ninguna evaluacionacerca del comportamiento del equipo.

Berger y Lammel [26] proponen usar CBR para de-cidir si es conveniente o no realizar una “pared” (pasarel balon a un companero, avanzar y recibir a continua-cion el balon de dicho companero con el fin de superara un rival). Los casos representan las posiciones de losjugadores de ambos equipos.

Wendler y Bach [27] proponen aprender el comporta-miento de los rivales para de esta forma decidir a que po-siciones moverse. De acuerdo con esta idea atacan el pro-blema de la prediccion de las jugadas de los rivales, conbase en el reconocimiento de los comportamientos ob-servados externamente, mediante un sistema CBR quemodela la funcion que relaciona las situaciones del parti-do con los comportamientos de los jugadores rivales. Losresultados experimentales demuestran que aunque el sis-tema funciona bastante bien, el modelo de prediccion esmuy especıfico para cada equipo rival y por consiguientelas predicciones son muy poco utiles cuando cambia elequipo rival.

En relacion con el problema de predecir el compor-tamiento de los rivales, Ahmadi et al. [28] y Steffens[29] coinciden en argumentar que la medida de similitudusada por el algoritmo de recuperacion debe adaptarse ala situacion y al rol del jugador cuyas acciones se quierenpredecir. Con este fin, Ahmadi [28] adapta los pesos delas posiciones de los jugadores implicados en las juga-das mientras que Steffens [29] propone una medida desimilitud que tiene en cuenta mas o menos caracterısti-cas en funcion de la situacion y rol de cada jugador.La experimentacion realizada se focaliza en evaluar laeficacia de las predicciones del sistema pero no considerael problema de que acciones debe tomar cada equipo conel fin de contrarrestar el comportamiento que predicendel equipo rival.

ConclusionesLo que tienen en comun estos dominios de aplicacion

poco convencionales es que su dificultad plantea desafıosimportantes para el CBR. El motivo principal de dichadificultad es que la representacion de los casos (proble-mas y soluciones) es compleja en el sentido que no es po-sible limitar la representacion a listas de pares atributo-valor. En el caso de la musica ya hemos comentado quees necesaria una representacion estructurada que requie-re el desarrollo de tecnicas nuevas de recuperacion decasos basadas en el uso intensivo de conocimiento musi-cal para evaluar la similitud entre frases musicales. En

el caso del futbol robotico tambien hemos visto que, altratarse de entornos inciertos, dinamicos y que requie-ren decisiones rapidas frente a la presencia de agentesadversos cuyo objetivo es impedir llevar a cabo las ac-ciones planificadas (es decir las jugadas), ello supone ungran reto tanto para la representacion de los casos co-mo la recuperacion y la reutilizacion de las soluciones.La problematica de la reutilizacion de las soluciones, esdecir la reproduccion de las jugadas mas relevantes pa-ra cada situacion de juego, es especialmente compleja yaque implica a varios agentes que tienen que coordinarsepara pasarse el balon. Por estas razones, estos dominiosemergentes obligan a desarrollar nuevos algoritmos quehacen progresar la investigacion basica en CBR mante-niendo ası el interes de este campo de investigacion enInteligencia Artificial.✵

Figura 2. Robots futbolistas del IIIA del Consejo Su-

perior de Investigaciones Cientıficas, Espana

INFORMACION ADICIONALPara mas informacion sobre el autor y estas investigacio-nes consultar: www.iiia.csic.es/˜mantaras

REFERENCIAS

1. Schank R.C. (1982) Dynamic Memory: A Theory of Remin-ding and Learning in Computers and People, New York,NY: Cambridge University Press.

2. Watson I. (1997) Applying Case-Based Reasoning: Techni-ques for Enterprise Systems, San Francisco, CA: MorganKaufmann.

3. Aha D. W. (1998) “The omnipresence of case-based reaso-ning in science and application”,Knowledge-Based Systems11(5-6), 261-273.

4. Bergmann R. (2002) Experience Management: Founda-tions, Development Methodology, and Internet-Based Ap-plications, Berlin: Springer.

5. Leake D., Wilson D. (1999) “When experience is wrong:Examining CBR for changing tasks and environments”, Pro-ceedings of the Third International Conference on Case-Based Reasoning, Berlin: Springer, pp. 218-232.

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 14 / 32

6. Faltings B. (1997) “Probabilistic indexing for case-basedprediction”, Proceedings of the Second International Confe-rence on Case-Based Reasoning, Berlin: Springer, pp. 611-622.

7. Aamodt A., Plaza E. (1994) “Case-based reasoning: Foun-dational issues, methodological variations, and system ap-proaches”, AI Communications 7(1), 39–59.

8. Lopez de Mantaras R., McSherry D., Bridge D., Leake D.,Smyth B., Craw S., Faltings B., Maher M.L., Cox M., For-bus K., Keane M., Aamodt A., Watson I. (2006) “Retrieval,Reuse, Revise, and Retention in CBR”, Knowledge Engi-neering Review 20(3) 215-240.

9. Riesbeck C., Schank R. (1989) Inside Case-Based Reaso-ning, Hillsdale, NJ: Lawrence Erlbaum.

10. Kolodner J. L. (1993) Case-Based Reasoning, San Mateo,CA: Morgan Kaufmann.

11. Leake D. B. (1996) Case-Based Reasoning: Experiences,Lessons & Future Directions, Cambridge, MA: MIT Press.

12. Lenz M., Bartsch-Sporl B., Burkhard H.-D., Wess S. -eds.-(1998) Case-Based Reasoning Technology, Berlin: Springer.

13. Arcos J.L., Lopez de Mantaras R., Serra X. (1998) “Saxex:A Case-Based Reasoning System for Generating ExpressiveMusical Performances”, Journal of New Music Research 27(3), 194-210.

14. Arcos J. L., Lopez de Mantaras R. (1997) “Perspectives:A declarative bias mechanism for case retrieval”, Procee-dings of the Second International Conference on Case-Based Reasoning, Berlin: Springer, pp. 279-290.

15. Plaza E. (1995) “Cases as terms: A feature term approach tothe structured representation of cases”, Proceedings of theFirst International Conference on Case-Based Reasoning,Berlin: Springer, pp. 265-276.

16. Arcos J.L., Lopez de Mantaras R. (2001) “An InteractiveCase-Based Reasoning Approach for Generating ExpressiveMusic”, Applied Intelligence 14 (1), 115-129.

17. Lopez de Mantaras R.L., Arcos J.L. (2002) “AI and Music:From Composition to Expressive Performance”, AI Maga-zine 23(3), 43-57.

18. Grachten M., Arcos J.L., Lopez de Mantaras R. (2006) “ACase-Based Approach to Expressivity-aware Tempo Trans-formation”, Machine Learning Journal 65(2-3) 411-437.

19. Suzuki T., Tokunaga T., Tanaka H. (1999) “A Case-BasedApproach to the Generation of Musical Expression”, Pro-ceedings of the 16th International Joint Conference on Ar-tificial Intelligence, Morgan Kaufmann, 642-648.

20. Tobudic A., Widmer G. (2003) “Playing Mozart Phrase byPhrase”, Proceedings of the 5th International Conferenceon Case-Based Reasoning, pp. 552-566, Springer-Verlag.

21. Tobudic A., Widmer G. (2004) “Case-Based RelationalLearning of Expressive Phrasing in Classical Music”, Pro-ceedings of the 7th European Conference on Case-BasedReasoning, pp. 419-433, Springer-Verlag.

22. Ros R., Arcos J.L., Lopez de Mantaras R., Veloso M. (2009)“A Case-Based Approach for Coordinated Action Selectionin Robot Soccer”, Artificial Intelligence Journal 173(9-10)pp. 1014-1039.

23. Karol A., Nebel B., Stanton C., Williams M.A. (2004) “Casebased game play in the RoboCup four-legged league. Part I.The theoretical model”, RoboCup 2003: Robot Soccer WorldCup VII, LNCS 3020, Springer, pp. 739–747.

24. Marling C., Tomko M., Gillen M., Alexander D., ChelbergD. (2003) “Case-based reasoning for planning and world mo-deling in the RoboCup small size league”, IJCAI Workshopon Issues in Designing Physical Agents for Dynamic Real-Time Environments: World Modeling, Planning, Learning,and Communicating.

25. Chen K-Y., Liu A. (2002) “A design method for incorpora-ting multidisciplinary requirements for developing a robotsoccer player”, IEEE International Symposium on Multi-media Software Engineering, IEEE Computer Society, pp.25-32.

26. Berger R., Lammel G. (2007) “Exploiting past experience- case-based decision support for soccer agents”, KI 2007:Advances in Artificial Intelligence (German National AIConference, KI, LNCS 4667, Springer, pp. 440-443.

27. Wendler J., Bach, J. (2003) “Recognizing and predictingagent behavior with case based reasoning”, RoboCup 2003:Robot Soccer World Cup VII, LNCS 3020, Springer, pp.729-738.

28. Ahmadi M., Lamjiri A.K., Nevisi M.M., Habibi J., Badie K.(2003) “Using a two-layered case-based reasoning for predic-tion in soccer coach”, International Conference on MachineLearning; Models, Technologies and Applications, CSREAPress, USA, pp. 181-185.

29. Steffens T. (2004) “Adapting similarity-measures to agenttypes in opponent-modelling”, Workshop on Modeling Ot-her Agents from Observations (AAMAS).

SOBRE EL AUTOR

Ramon Lopez de Mantaras es Profesor de Investigacion del Consejo Superior de Investiga-ciones Cientıficas, y Director del Instituto de Investigacion en Inteligencia Artificial del prime-ro. Doctor en Fısica (especialidad Automatica) por la Universidad Paul Sabatier de Toulouse,Francia; Master of Science en Informatica por la Universidad de California-Berkeley y Doctoren Informatica por la Universidad Politecnica de Barcelona. Es uno de los pioneros de la IA enEspana. Miembro del comite de redaccion de mas de 20 revistas internacionales, miembro decomites cientıficos en mas de 250 congresos relacionados con la IA, y autor o co-autor de numero-sas publicaciones cientıficas. Miembro y ex-presidente del Board of Trustees de IJCAI. Entre lospremios que ha recibido se encuentran “Premio Ciudad de Barcelona” de investigacion en 1982,el European Artificial Intelligence Research Award en 1987, el International Computer MusicAssociation Swets & Zeitlinger Award en 1997, y el AAAI Robert S. Engelmore Award en 2011.Actualmente investiga en razonamiento y aprendizaje basado en casos, en robots autonomos yen inteligencia artificial y musica.

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 15 / 32

ARTICULO INVITADO

Ver para aprender y aprender a ver: sinergias entreaprendizaje y vision computacionalespor Hugo Jair Escalante y Eduardo F. Morales

Ver y aprender son dos capacidades natas demuchos seres vivos. El poder ver facilita ciertos

procesos de aprendizaje, mientras que elaprender nuevas cosas puede ayudar a refinarnuestro sentido de la vista o bien a percibir lascosas de manera diferente. Ası, la percepcion

visual y el aprendizaje son procesos ıntimamenterelacionados entre sı in vivo. Esta relacion sepresenta tambien in silico y se remonta a losmismos inicios de la inteligencia artificial.

¿Que hemos aprendido de las imagenes?Las areas de vision y aprendizaje computacionales

han interactuado notablemente desde los inicios de lacomputacion. Prueba de ello son los experimentos reali-zados por Frank Rosenblatt entre 1957 y 1962, quien pro-gramo el algoritmo Perceptron en la computadora Mark1 [1]. La entrada para el Perceptron eran imagenes digita-les muy primitivas y este tenıa que aprender a reconocercorrectamente caracteres en ellas. Cabe resaltar que elPerceptron marco un hito historico en el desarrollo delaprendizaje computacional al ser uno de los principalesantecesores de las redes neuronales artificiales [2]. Hoyen dıa el reconocimiento de caracteres puede considerar-se un problema resuelto con gran aplicabilidad. Comomuestra, el servicio postal de los Estados Unidos utilizametodos de aprendizaje computacional para reconocer elcodigo postal, y direcciones de la correspondencia.

El buen inicio de la relacion entre vision y aprendi-zaje artificiales se ha afianzado a traves de los anos y sesigue consolidando conforme avanza el desarrollo de am-bas areas. Gracias a esta relacion hoy en dıa contamoscon tecnologıas que podrıan considerarse sorprendentes.Por ejemplo, el dispositivo de videojuego Kinect R©, deMicrosoft R©, es capaz de reconocer las poses de jugado-res y sus movimientos, de forma que un avatar en elvideo juego es manipulado por el usuario mediante susmovimientos corporales. Esta tecnologıa de punta se ba-sa en tecnicas de aprendizaje y vision artificiales. A sa-ber, metodos de aprendizaje (“ensambles de arboles dedecision”) que reconocen partes del cuerpo, hacen unaclasificacion a nivel pixel, luego la informacion local secombina para detectar la pose global del usuario, y por

Figura 1. El dispositivo KinectR© reconoce partes del

cuerpo y estima en tiempo real la posicion del cuerpo

entero de un usuario con informacion 3D a partir de

una imagen de profundidad. Imagen tomada de [3].

Figura 2. Stanley (izquierda) y Boss (derecha),los vehıculos autonomos ganadores de las com-petenciasDARPA’s Grand Challenge 2005 y 2007,respectivamente, imagenes tomadas de [4,5].

ultimo el dispositivo extrae informacion tridimensionaldel usuario a partir de una sola imagen de profundidad,vease la Figura 1. El metodo de reconocimiento es ro-busto a diferentes poses, constituciones fısicas, tipos deropa y piel, ademas es altamente eficiente para procesar200 cuadros por segundo [3].

La popularidad de dispositivos como Kinect R©, auna-do a las aplicaciones potenciales para estas tecnologıas,e.g., en seguridad y medicina, han llamado poderosamen-te la atencion de las comunidades de vision y aprendiza-je, prueba de ello es la competencia en reconocimientode gestos (gesture.chalearn.org) de Microsoft R©.

Otro ejemplo notable del exito de la vision y apren-dizaje computacionales es el vehıculo Stanley de la Uni-versidad de Stanford. Dicho vehıculo autonomo, i.e., seconduce automaticamente, recorrio 132 millas (aproxi-madamente 212 Km) en ruta de rally en el desierto enmenos de 7 horas, lo que lo hizo acreedor de un premiopor la agencia de investigacion en proyectos de defensade los Estados Unidos (DARPA). Stanley percibe su en-torno mediante sensores laser, un sistema de radar, y sis-temas de vision estereoscopica (dos camaras) y monocu-

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 16 / 32

lar (una camara). Tecnicas de aprendizaje computacio-nal (“mezclas de Gaussianas”) se encargan de clasificarimagenes de color del terreno en las clases “conducible”y “no-conducible”, con esta informacion se crean mapasde navegacion que se complementan con informacion dellaser [4]. En una competencia mas reciente, tambien aus-piciada por DARPA, se requirio el desarrollo de vehıcu-los autonomos para recorrer una zona urbana. Esta ulti-ma competencia es aun mas desafiante que la anterior,pues ahora los vehıculos tienen que lidiar automatica-mente con problemas de trafico, obstaculos, e.g., casas,autos, personas, y ambientes dinamicos. Boss de la Uni-versidad Carnegie Mellon gano tal reto, haciendo uso de,entre otros, un sistema de vision inteligente [5]. Ambosvehıculos ganadores, mostrados en la Figura 2, se basanen el trabajo pionero de D. A. Pormeleau, quien uso re-des neuronales artificiales para aprender a conducir unautomovil a partir de imagenes del camino [2].

Muchas de las aplicaciones que se basan en vision yaprendizaje computacional se usan para facilitar el acce-so a la informacion, en particular, en la recuperacion deimagenes. En esta area se han propuesto algoritmos muyefectivos para aprender a ordenar imagenes de acuerdoa su relevancia a consultas formuladas por usuarios. Di-chos metodos son altamente eficientes y escalables puesson disenados para operar a escala Web, i.e., con millo-nes de imagenes. Ademas de recuperacion, la anotacionde imagenes, i.e., el proceso de asignar palabras a image-nes, a gran escala esta teniendo un auge importante enlos ultimos anos. Esto se debe a que la gran mayorıade las imagenes en la Web no tiene asociada ningunadescripcion textual, lo que limita la forma en que losusuarios pueden buscar esas imagenes no anotadas.

Ademas de la escalabilidad un requerimiento esen-cial para herramientas contemporaneas de acceso a lainformacion es la movilidad, debido a la proliferacion dedispositivos moviles con acceso a Internet. Una herra-mienta innovadora en esta lınea es Google R© Googles R©

(www.google.com/mobile/goggles). Esta tecnologıa dis-ponible para telefonos celulares permite el acceso a in-formacion de distintas modalidades usando una imagentomada con el dispositivo movil, como consulta. Usuariosde esta tecnologıa pueden, por ejemplo, tomar una fotocon su celular a una pintura y obtener informacion sobretal obra, o bien tomar la foto de algun lugar turıstico yrecabar informacion sobre el lugar; inclusive, la aplica-cion obtiene el texto en las imagenes y usa la informaciontextual de varias formas. Google R© Googles R© usa tecni-cas de aprendizaje computacional para llevar a cabo labusqueda de informacion, el reconocimiento de objetos,y el reconocimiento de caracteres a partir de imagenes.

ImageSwirl es otra herramienta desarrollada porGoogle R© que permite, ademas de recuperar imagenes re-levantes a consultas provistas por el usuario, agrupar losresultados en grupos

Figura 3. Veinte primeros resultados regresados por

un buscador de imagenes a la consulta pumpkin. De-

recha: ambiente donde se evaluan robots en el SRVC.

Izquierda: imagenes usadas para construir un modulo

que reconozca la calabaza que aparece a la derecha

de imagenes que comparten similitudes visuales osemanticas. Estos metodos se basan en estrategias deaprendizaje no supervisado y usan informacion visual ytextual.

Un reto muy ambicioso que tambien tiene que ver conla Web es el que se plantea dentro del Semantic RobotVision Challenge, SRVC, una competencia que consis-te en, a partir de una lista de objetos especificada enun documento de texto, desarrollar metodos de apren-dizaje computacional capaces de aprender a reconocerlos objetos listados usando unicamente imagenes en laWeb. Para evaluar la efectividad del robot, este se po-ne a navegar en un ambiente controlado donde el robotdebe encontrar los objetos e indicar donde esta locali-zado el objeto. El problema es complicado, entre otrascosas porque el robot tiene que conectarse a Internet ydescargar imagenes relevantes a los objetos que se deseareconocer, heredando, por tanto, las deficiencias de mo-tores de busqueda, esta dificultad se ilustra en la Figura3. Ademas, el robot debe aprender modelos de los obje-tos usando imagenes que son completamente diferentesa aquellas que se usaran para evaluar su desempeno.

Tal vez la herramienta de vision inteligente mas co-nocida y que esta presente en nuestra vida cotidiana esla tecnologıa detras de las camaras fotograficas que de-tectan rostros y/o se activan al detectar sonrisas. La ma-yorıa de estas herramientas se basan en el trabajo de Vio-la y Jones, quienes propusieron un metodo para extraeratributos simples que, combinados con clasificadores ti-po boosting en cascada, da resultados aceptables en elreconocimiento de rostros [6]. Por la simplicidad de losatributos el metodo funciona en tiempo real. El trabajode Viola y Jones se ha utilizado tambien en aplicacionesde seguridad y en reconocimiento de objetos genericos.

Se ha revisado apenas un punado de aplicaciones exi-tosas resultado de la interaccion entre vision y aprendi-zaje computacionales. Sin embargo, existen muchas otrasigualmente sorprendentes y/o utiles. Por ejemplo, meto-dos para que, mediante los movimientos de sus ojos, losusuarios puedan retro-alimentar motores de busqueda de

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 17 / 32

imagenes, i.e., detectar que imagenes le son relevantes yusar esta informacion para refinar la busqueda; tecnicasque generan automaticamente descripciones textuales deimagenes haciendo uso de gramaticas visuales; metodosque detectan objetos y su interaccion dentro de unaimagen, e.g., detectan si una persona esta montando uncaballo o si patea un balon; metodos que reconstruyenescenas tridimensionales a partir de fotografıas en dosdimensiones; tecnicas para la segmentacion de imagenesmedicas; sistemas de seguridad que detectan comporta-miento sospechoso en imagenes y video; sistemas de reha-bilitacion basados en reconocimiento de gestos; herra-mientas que determinan la posicion geografica en que fuetomada una fotografıa usando el contenido de la imagen(research.microsoft.com/en-us/um/people/szeliski/visioncontest05); metodos para analizar la estetica y los sen-timientos en imagenes; herramientas que proveen ilustra-ciones a partir de fragmentos de textos (alipr.com/spe)o auto-ilustracion, entre otras.

Aprendizaje y vision artificiales

Aprendizaje computacional es la rama de lainteligencia artificial que se encarga de estudiara los sistemas que son capaces de adaptar su

comportamiento de acuerdo a la experiencia [2].

Por experiencia generalmente nos referimos a datos, e.g.,muestras de ADN, textos o imagenes, y por comporta-miento nos referimos a la capacidad de realizar algu-na tarea en particular, e.g., reconocimiento, detecciono agrupamiento. Ası, podemos decir informalmente quelos sistemas que aprenden automaticamente son capacesde realizar una tarea especıfica, con cierto grado de exito,mediante su interaccion con un conjunto de datos.

La vision computacional, por su parte, estudia meto-dos para hacer que las computadoras interpreten y reac-cionen ante imagenes y video [7]. Esta investigacion com-prende varias sub-areas de estudio, las cuales difieren enlos niveles de interpretacion de las imagenes o bien enel tipo de tarea de aplicacion [7,8]. En la vision de bajonivel o vision temprana (early vision) se trabaja direc-tamente con la imagen, se estudia el procesamiento deimagenes y la extraccion de propiedades de estas, e.g., elfiltrado o suavizado de imagenes. En la vision interme-dia se extraen y caracterizan componentes de las image-nes, e.g., segmentacion de imagenes. La vision de altonivel se enfoca en el reconocimiento e interpretacion delas imagenes, e.g., reconocimiento de gestos o categoriza-cion de imagenes. Los metodos desarrollados en nivelesinferiores se usan por los metodos de los niveles superio-res. La Figura 4 ilustra esta taxonomıa. Dichos nivelesno indican necesariamente la dificultad de la sub-areade estudio, sino mas bien al grado de inteligencia de lossistemas automaticos para resolver esas tareas.

Aprendizaje y vision de bajo nivelLas tecnicas de aprendizaje computacional han teni-

do un mayor impacto en los niveles intermedio y alto.Sin embargo, tambien hay evidencia palpable de la inter-accion entre vision de bajo nivel y aprendizaje compu-tacional. Por ejemplo, tareas que hasta hace tiempo seresolvıan con formulas matematicas o tecnicas deter-ministas y que hoy en dıa se abordan con metodos deaprendizaje son: hallar la correspondencia entre image-nes en vision estereoscopica, eliminacion de ruido y res-tauracion de imagenes, busqueda de regiones de interesen imagenes, extraccion de atributos visuales y mejorade la resolucion de imagenes, i.e., super-resolucion, entreotras. Ası, el uso de aprendizaje no se restringe a tareasque requieran alto nivel interpretativo, aunque sı pode-mos decir que la interaccion entre vision de bajo nivel yaprendizaje computacional esta aun en su infancia.

Aprendizaje y vision intermediaEn la vision intermedia tecnicas de aprendizaje

computacional han sido ampliamente utilizadas princi-palmente para segmentacion de imagenes y para extrac-cion o generacion de atributos visuales “discriminan-tes”. La segmentacion consiste en identificar regioneshomogeneas en la imagen, idealmente se busca que lasregiones correspondan a los contornos de objetos presen-tes en la imagen. La segmentacion da soporte a metodosde deteccion ademas de que las regiones generadas pue-den usarse tambien para reconocimiento, recuperacion oanalisis de las imagenes. El problema es muy ambiguopues no es claro que se entiende por objeto o cual es elgrado de “granularidad” deseado, vease la Figura 5.

Figura 4. Niveles de la vision computacional

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 18 / 32

Figura 5. Dificultad de la segmentacion en una ima-

gen sencilla. Dos imagenes segmentadas manualmen-

te por diferentes personas, cada persona anadio eti-

quetas a las regiones para describir su contenido [9].

Figura 6. Sinonimia visual

Figura 7. Polisemia visual

El texto de las figuras originales esta en idioma ingles

Ademas de la segmentacion el aprendizaje compu-tacional se ha utilizado para generar atributos visualescon alto poder “discriminante” [10]. La idea es aprender

de la imagen que atributos basicos, e.g., color, textura,SIFT, SURF; son de mayor utilidad para una tarea dereconocimiento especıfica, ¿como combinar estos atribu-tos para maximizar el poder “discriminante” de clasi-ficadores?, o inclusive ¿como aprender estos atributosdirectamente de las imagenes? [10].

Aprendizaje y vision de alto nivelEl area de vision de alto nivel requiere de metodos de

aprendizaje poderosos que permitan interpretar image-nes a niveles cercanos a los humanos [7,8]. En consecuen-cia, el aprendizaje computacional es casi imprescindibleen esta area. Las tareas que se intentan resolver van des-de la categorizacion de caracteres escritos a mano hastael tratar de determinar la estetica de las imagenes, e.g.,decidir si una imagen es bonita o no. Con ello se intentanmodelar capacidades unicas de los humanos que ademasestan sujetas a un alto grado de subjetividad, e.g., laapreciacion artıstica. Claramente el desarrollar modelospara “aprender” este tipo de tareas representa un retomayor para las ciencias computacionales.

Tal vez la tarea en que mas interactuan vision yaprendizaje artificiales es la de reconocimiento. En susinicios se trataba de desarrollar programas para recono-cer dıgitos y/o caracteres escritos a mano [1], aunqueotras tareas populares son el reconocimiento de rostrosy de objetos genericos [6,11]. Actualmente el reconoci-miento de rostros se enfoca en la deteccion de rostros coninvariancia a expresiones faciales o a la edad de las per-sonas, o bien detectar el estado de animo de una personaa partir de su rostro, entre otras. Por su parte el recono-cimiento de objetos genericos se enfoca hoy en dıa en laincorporacion de informacion contextual [11], el desarro-llo de metodos que no requieran segmentacion y el uso demetodos de reconocimiento de objetos para deteccion deacciones y eventos. Tareas muy ligadas al reconocimientode objetos son las de deteccion y localizacion de objetosy el reconocimiento de gestos faciales y corporales.

Una dificultad comun en metodos de reconocimientode objetos es representar efectivamente la apariencia dela imagen por medio de atributos extraıdos de la imagen,e.g., mediciones de color, textura, forma. Las principa-les dificultades de los atributos de color son polisemiay sinonimia visuales, vease Figuras 6 y 7. Una forma deatacar estos problemas es incorporando informacion con-textual en los metodos de aprendizaje, e.g. en forma deestadısticas de co-ocurrencias o relaciones espaciales [11].

Aunque el analisis de video puede verse como el pro-cesamiento de una secuencia de imagenes, es un caso es-pecial. El analisis de video plantea retos de eficiencia yrequerimientos dinamicos, por lo que es mas complica-do que el analisis de imagenes. Sin embargo, los videosusualmente se acompanan de audio (o texto transcritodel audio) extraıdo de los videos y/o metadatos, e.g., elguion de un programa de TV, ası se cuenta con abundan-

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 19 / 32

te informacion, algo ventajoso para ciertas aplicaciones.Los principales problemas que incluyen aprendizaje

computacional son la deteccion de cambios de toma o deescenas, extraccion de recuadros clave (keyframes, porejemplo para generar los capıtulos de un DVD), gene-racion de resumenes del video, deteccion de plagio envideos, deteccion de eventos en sistemas de vigilancia,recuperacion de videos, identificacion del tema del videoe.g., drama, noticias, terror; deteccion de escenas quereflejen cierto sentimiento en el televidente, entre otras.

¿Aprender de las imagenes?Se han descrito algunas de las herramientas mas po-

pulares producto de la interaccion entre vision y apren-dizaje computacionales. Sin embargo, bien vale la penapreguntarnos en este punto ¿que tan difıcil es interpretaruna imagen automaticamente? El adagio chino “el sig-nificado de una imagen puede expresar mas de diez milpalabras” refleja claramente la magnitud del reto que en-frenta la vision computacional: ¿como extraer el signifi-cado de una imagen si esta puede expresar gran cantidadde informacion y a distintos niveles? Las Figuras 8 y 9,tomadas de la coleccion IAPRTC12 [9], muestran image-nes que ilustran la dificultad de interpretar una imagen.

Para los humanos es sencillo determinar que objetosestan presentes en una imagen o si hay personas en ella,sabemos automaticamente donde empieza y termina unobjeto, que parte de la imagen es el suelo y que parte lasnubes, cual es la profundidad de las distintas partes de laimagen, que idea nos trasmite la imagen, cual es la posi-cion de la persona que tomo la fotografıa, entre otros. Elextraer parte de esta informacion de manera automati-ca es un problema muy complejo, pues para ello usamosnuestro conocimiento del mundo, adquirido durante anosde aprendizaje e interaccion con el mundo mismo.

El conocimiento que los algoritmos de aprendiza-je usan para aprender tareas de vision computacionalesta almacenado en bases de datos de imagenes. Porejemplo, considerese la tarea de etiquetar imagenes i.e.,asignar palabras a las imagenes para facilitar el accesoa ellas, Figura 9. La tarea de aprendizaje aquı consisteen aprender un modelo que asocie imagenes a palabras,a partir de una coleccion de imagenes anotadas. En losprimeros trabajos en anotacion se usaban colecciones deimagenes, e.g., Corel R©, con un vocabulario muy limitadoe imagenes homogeneas y/o poco realistas. Dichas colec-ciones han evolucionado conforme ha avanzado esta areay hoy en dıa contamos con bases de datos en las quelas imagenes estan segmentadas y etiquetadas a distin-tos niveles de “granularidad”. Contamos con coleccionesde mediano tamano, e.g., IAPRTC12 20,000 imagenes[9]; gran escala, e.g., LabelME 100,000; y escala web i.e.,ImageNET millones de imagenes. Existen incluso colec-ciones de imagenes con informacion de las relaciones en-tre objetos en la imagenes, e.g., LotusHill. Algo positivo

Figura 8. Imagen creativa de personas [9]

Figura 9. Segmentacion y anotacion [9]

de estas colecciones es que contienen imagenes reales, es-to es, imagenes similares a las esperadas en los dominiosdonde se aplicaran las herramientas a desarrollar.

Retos actuales de la vision inteligenteHemos revisado los principales problemas en que con-

vergen aprendizaje y vision artificiales. En esta seccionrevisamos hacia donde apunta esta convergencia en losproximos anos. Como se dijo antes, en esta era de lastecnologıas de la informacion existen billones de image-nes y videos en el mundo y una cantidad impresionantede material visual se genera dıa a dıa. En consecuenciasera crıtico el estudio de metodos para acceder a informa-cion visual y multimedia de manera efectiva, automaticay eficiente. Ademas, otro topico crucial es el desarrollode tecnicas para reducir el esfuerzo de los humanos paraacceder a la informacion visual de su interes, e.g., usandogestos corporales o faciales. Otra tendencia es el desarro-llo de metodos capaces de aprovechar la informacion enla Web, por ejemplo, para entrenar metodos de recono-cimiento sin proporcionar una coleccion de imagenes.

Por otro lado, en general los sistemas de interaccionhumano-computadora estan siendo cada vez mas visua-les, tal vez debido a que la vista es uno de los sentidosmas informativos para los humanos. Ası, otra area que

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 20 / 32

esta y seguira teniendo un auge importante es el desarro-llo de tecnologıa inteligente para interactuar con sistemasvisuales. Estas tecnologıas ya las observamos en video-juegos de ultima generacion, y sera importante entoncestrasladar estos avances a dominios como la salud.

Todo apunta a que tareas de reconocimiento sigansiendo uno de los mayores campos en que interactuan vi-sion y aprendizaje computacionales principalmente conaplicaciones en seguridad. Por ejemplo, el reconocimientode acciones sospechosas en video y la deteccion de rela-ciones entre objetos y personas e.g., abandono de objetossospechosos, el reconocimiento de gestos para detectarmensajes ocultos entre delincuentes, o a mayor escala ladeteccion de planificacion de delitos a traves de redes desistemas visuales de vigilancia, la deteccion de personasextraviadas y/o delincuentes usando todos los dispositi-vos que generan imagenes y videos en lugares publicos.

Un aliciente para la proliferacion de aplicaciones devision inteligente son los eventos o competencias sobrerecuperacion multimedia de imagenes, anotacion y recu-peracion de imagenes medicas, deteccion de conceptosvisuales, recuperacion de videos, y mas recientementereconocimiento de gestos. Sin duda, estos eventos mar-can las tendencias de investigacion en vision inteligente.

Comentarios finalesSe han discutido las principales areas de interaccion

entre vision computacional y aprendizaje computacio-nal. Existen muchas otras areas y problemas en que es-tos campos interactuan y seguiran interactuando, inclusonuevos problemas generaran nuevas opciones de interac-cion. Los autores esperan haber dado al lector un panora-ma general de las areas revisadas. Para mayor informa-cion se recomienda consultar revistas de investigacion,libros y sitios web especializados en la materia. Es im-portante mencionar que en Mexico existen expertos con

alto reconocimiento internacional en ambas areas visioncomputacional y aprendizaje computacional.✵

INFORMACION ADICIONALLos autores agradecen el apoyo otorgado por el CO-NACyT a traves del proyecto numero 61335.

REFERENCIAS

1. Rosenblatt F. (1962) Principles of Neurodynamics: Percep-trons and the Theory of Brain Mechanisms. Spartan Books

2. Mitchell T. M. (1997) Machine Learning. McGraw Hill.

3. Shotton J., Fitzgibbon A., Cook M., Sharp T., FinocchioM., Moore R., Kipman A., Blake A. (2011) “Real-time hu-man pose recognition in parts from a single depth image”,Pr. of the Computer Vision & Pattern Recog. Conf., IEEE

4. Thrun et al. (2006) “Stanley: The robot that won the DAR-PA grand challenge”, J. of Field Robotics, 23(9):661-692.

5. C. Urmson et al. (2007) Tartan racing: A multi-modal ap-proach to the DARPA urban challenge. Technical report,Carnegie Mellon University.

6. Viola P., Jones M. (2004) “Robust real-time object detec-tion”, Int. Journal of Computer Vision, 57(2), pp.137-154.

7. Forsyth D., Ponce J. (2002) Computer Vision: a ModernApproach. Prentice Hall.

8. Sucar L. E., Gomez G. (2011) Vision Computacional. Enpreparacion.

9. Escalante H.J., Hernandez C.A., Gonzalez J.A., Lopez A.,Montes M., Morales E.F., Sucar L.E., Villasenor L., Grubin-ger M. (2010) “The segmented and annotated IAPR TC-12benchmark”, Computer Vision and Image Understanding,114(4), pp. 419-428.

10. Hernandez B., Olague G., Hammoud R., Trujillo L., Rome-ro E. (2007) “Visual learning of texture descriptors for facialexpression recognition in thermal imagery”, Computer Vi-sion and Image Understanding, 106(2-3), pp. 258-269.

11. Oliva A., Torralba A. (2007) “The role of context in objectrecognition”, Trends in Cog. Sciences, 11(12), pp. 520-527.

SOBRE LOS AUTORES

Hugo Jair Escalante es doctor en Ciencias Computacionales por el Instituto Nacional de As-trofısica, Optica y Electronica. Actualmente es profesor-investigador en la Facultad de IngenierıaMecanica y Electrica de la Universidad Autonoma de Nuevo Leon. Es candidato a investigador delSistema Nacional de Investigadores. Sus intereses de investigacion son en aprendizaje automatico yen sus aplicaciones en vision computacional de alto nivel y en el procesamiento de lenguaje natural;ası como las sinergias entre aprendizaje automatico y tecnicas de optimizacion heurıstica. Para masinformacion favor de visitar su sitio web www.hugojair.org.

Eduardo Morales obtuvo su doctorado en Computacion del Turing Institute, Universidad deStrathclyde, en Escocia. Fue investigador visitante en el Electric Power Research Institute, en EEUUy en la Universidad de New South Wales, en Australia. Trabajo en el Instituto de InvestigacionesElectricas, y en el Tec de Monterrey campus Cuernavaca. Actualmente es investigador Titular C delInstituto Nacional de Astrofısica, Optica y Electronica. Cuenta con alrededor de 100 publicaciones enrevistas, capıtulos de libros y congresos de prestigio. Miembro del Sistema Nacional de Investigadores,Nivel 2. Sus lıneas de investigacion se centran en aprendizaje computacional y robotica.

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 21 / 32

ARTICULO INVITADO

Silabeo automatico del espanol con arboles dedecisionpor Rene MacKinney-Romero y John C.H. Goddard

Silabeo, o dividir las palabras en sılabas, es uninteresante problema a resolver, ya que tiene

aplicaciones en el reconocimiento automatico delhabla, y puede ser utilizado en sistemas de textoa voz, como una forma de mejorar la calidad delhabla. Despues del uso de varios mecanismos deaprendizaje maquinal para el silabeo automatico

del espanol encontramos que los arboles dedecision han demostrado, en espanol al menos,ser muy adecuados para ser utilizados en la

generacion de un sistema automatico de silabeo.Este artıculo presenta como utilizando arboles

de decision se puede generar un sistemaautomatico de silabeo.

IntroduccionEl enfoque predominante de reconocimiento au-

tomatico del habla utiliza fonemas como los bloques deconstruccion basicos. Esto ha sido criticado [1,2] dadoque los problemas, tales como la variacion de pronuncia-cion en el habla espontanea, co-articulacion, y un reco-nocimiento robusto en condiciones adversas, no han sidocompletamente resueltos. Se han propuesto otras sub-unidades de palabras, como las sılabas, como posiblessustitutos. Las sılabas, en particular, tienen la ventajasobre los fonemas en que abarcan mucho mas tiempo, loque podrıa ayudar a superar estos problemas. Resultadosalentadores han sido reportados para el ingles en [3].

La sıntesis de voz tambien puede beneficiarse del si-labeo ya que la calidad de la voz puede ser mejorada, yen algunos idiomas, como los de la India [4] y el espanol[5], la correcta pronunciacion requiere un conocimientode las reglas de silabeo, es decir, como dividir una pala-bra en sus sılabas. Por ejemplo, en espanol, una palabrapuede ser pronunciada correctamente de su forma escritasolamente, sin embargo, hay reglas especıficas a aplicarcon el fin de hacer hincapie en la sılaba correcta.

Todo esto plantea la cuestion de como obtener lasreglas correctas de silabeo para un idioma concreto. Loshablantes nativos parecen facilmente conocer las reglasde su lengua, a pesar de que algunos errores se pue-dan cometer. Las reglas de silabeo se han dado para elespanol [6] y portugues [7]. Sin embargo, incluso en elespanol, que tiene un conjunto bien definido de reglas,

hay aproximadamente 100 reglas, y su deteccion con-sume mucho tiempo. Es interesante explorar enfoquesalternativos, y las tecnicas de aprendizaje automaticoofrecen una opcion util. Trabajos al respecto se han rea-lizado en otros idiomas usando algoritmos geneticos [8],arboles de decision y redes neuronales [9], programacionlogica inductiva [10], y gramaticas libres de contextoprobabilistas [11]. En [12] se utilizo la tecnica de progra-macion logica inductiva para el espanol y se obtuvieronalgunos resultados iniciales. En este artıculo se presentaun esquema distinto de codificacion del adoptado en [12]para los datos y se emplean arboles de decision, lo cualha dado buenos resultados.

Estructura silabica del espanolEmpezamos con un resumen de algunos elementos

acerca de la lengua espanola que seran de utilidad paracomprender el resto del trabajo.

El espanol se escribe utilizando el alfabeto latino, conla adicion de la n. Las vocales i y u se llaman vocalesdebiles, mientras que las otras son llamadas fuertes. Laletra u a veces lleva a dieresis, u, despues de la letrag. Las vocales se pueden acentuar, por ejemplo a. Es-tos detalles indican generalmente desviaciones de lo quecabrıa esperar si se siguen las reglas habituales de la or-tografıa espanola, y proporcionan informacion esencialpara los sistemas de texto a voz. De hecho, la pronun-ciacion de cualquier palabra en espanol puede ser perfec-tamente predicho a partir de su forma escrita, aun sinconocer el significado de la palabra. Por ejemplo, la nor-ma es ver si la ultima sılaba de una palabra termina enconsonante que no sea n o s, en cuyo caso la penultimasılaba se acentua. Sin embargo, si una vocal acentuadaaparece (solo se permite una vocal acentuada por pa-labra), entonces la sılaba de la vocal se acentua. Comopuede verse en estas normas, las sılabas son particular-mente importantes en el espanol, y una comprension delsilabeo es vital para su correcta pronunciacion.

Una sılaba es a menudo descrita como una combi-nacion o conjunto de una o mas unidades de sonido enun lenguaje que consta de una parte sonora, y puede ono contener partes menos sonoras que la flanquean. Estadescripcion puede relacionarse con los componentes desılaba en un modelo de ramificacion binaria en la queuna sılaba se divide en ramas de inicio y rima. La ramade la rima se divide a su vez en un nucleo y una coda.

En el caso del espanol, la parte sonora corresponde

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 22 / 32

al nucleo y por lo general consta de una sola vocal, aun-que la palabra y esta permitida. Ademas, los diptongosy triptongos estan sujetos a ciertas reglas. Por ejemplo,en el caso de diptongos, la regla es: una vocal debil, sinun acento escrito, se combinara con la vocal adyacente,que debe ser diferente, para formar un solo nucleo. Porlo tanto, las siguientes son silabaciones correctas de laspalabras con diptongos: rio, ju-lio, ai-re, qui-za, au-re-lio, mientras que rı-o, ma-es-tros, le-er y a-e-re-ano contienen diptongos. Observe como una vocal acen-tuada, por ejemplo en rıo, puede cambiar el silabeo deuna palabra.

La h, que es silenciosa en espanol, no rompe un dip-tongo, por lo que ahu-ma-do es el silabeo correcto. Unanorma similar se aplica a los triptongos en los que vocalesdebiles flanquean vocales fuertes, como Cuau-tla, con-sen-suais. Los triptongos son mucho menos frecuentesen el idioma.

Como muestran estos ejemplos, el numero de sılabasen una palabra no es siempre igual al numero de voca-les, y la pregunta que surge es como se puede realizar elsilabeo bajo estas circunstancias.

Para el espanol la representacion CV (de consonan-te (C) vocal (V)) de una palabra se puede utilizar parasilabeo. Con esta representacion, es posible desarrollarun conjunto de alrededor de 100 reglas [6] que se puedeaplicar de manera recursiva para silabear cualquier pala-bra en espanol. Con el fin de silabear cualquier segmentode la palabra, se consideran esencialmente tres casos enfuncion de si el segmento comienza con una V, CV o CC.Por ejemplo, si un segmento comienza con VCV, comolas tres primeras letras de aroma, entonces el principiode la palabra se separa en sılabas como V-CV para obte-ner a-roma. El algoritmo se aplicara luego a roma, conalgunas de las otras reglas.

Tambien hay normas en materia de los llamados pa-res inseparables de consonantes, como bl, dr, rr, y llque son siempre considerados como una sola consonan-te. Por ejemplo, la regla relativa a los segmentos de laforma VCV se aplica a la palabra arriba para producira-rriba, mientras que por otro lado rt no es inseparableen la palabra artesano que utiliza una regla diferente,que corresponde a VCCV, y se silabea inicialmente comoar-tesano. Esto tambien significa que el orden en que lasreglas son aplicadas es importante para lograr un silabeocorrecto.

Como podemos ver, incluso para un idioma como elespanol, con reglas bien definidas de silabeo, se requiereel conocimiento linguıstico para crear un algoritmo desilabeo basado en reglas. Es interesante preguntarse sitecnicas de aprendizaje maquinal pueden producir al-goritmos eficaces de silabeo, y nuestro objetivo aquı esponer a prueba la utilidad de arboles de decision paraesta tarea.

Metodo y datosEn este trabajo se utilizo un metodo para construir

los arboles de decision llamado CRUISE (por sus si-glas en ingles Classification Rule with Unbiased Inter-action Selection and Estimation). CRUISE fue desa-rrollado por [13] y esta disponible gratuitamente enwww.stat.wisc.edu/˜loh. Otros algoritmos de construc-cion de arboles, tales como ID3, tambien fueron utiliza-dos, pero se encontro que CRUISE tiene varias venta-jas, tales como ser un algoritmo rapido y que los arbolesde decision construidos son particularmente bajos y conmuy pocas ramas.

Con el fin de construir los arboles de decision conCRUISE, se requiere de una coleccion de ejemplos y cla-ses correspondientes que reflejen la estructura silabica delespanol. Aquı fueron elegidas tres clases para ser el inicio,el nucleo y la coda y representados por O, N, C (por sussiglas en ingles Onset, Nucleus y Coda). Los ejemplosse formaron a partir de una palabra en espanol al con-vertir primero la palabra a minusculas y luego anadirun sımbolo especial, en este caso ‘W’, a cualquiera delos extremos para representar espacios y para senalar elcomienzo y el final de un palabra. Finalmente una “ven-tana” se desplaza a lo largo de la palabra ampliada, y setoman cada vez tres caracteres, a lo cuales se asigna laclase correspondiente al caracter de en medio. Por ejem-plo, la palabra vieron se separa como vie-ron. Esto asu vez produce ONN-ONC y da lugar a los siguientes seisejemplos, junto con sus clases:

W v i O, v i e N, i e r N, e r o O, r o n N, o n W C

Esto significa que tres atributos se utilizaron para ca-da ejemplo, y que cada uno se reconoce por su posicionen el ejemplo (primera, segunda o tercera). La palabra yes muy comun y esta representada por el ejemplo: W yW N.

Los datos utilizados en los experimentos provienen detres fuentes: una historia corta de Mario Benedetti, unaversion de ortografıa moderna de la obra clasica de Mi-guel de Cervantes, “Don Quijote de la Mancha” [14], y uneditorial reciente de un diario mexicano. La dos prime-ras, la obra de Benedetti y la de Cervantes, son fuentesliterarias aunque casi 400 anos separadas en el tiempo,mientras que el editorial es de una naturaleza diferente,y su tema es acerca de las pensiones en una empresa des-centralizado del gobierno de Mexico. Los autores tienentres nacionalidades distintas.

Las fuentes fueron pre-tratadas para quitar los sımbo-los como los numeros y acronimos. Las primeras 500,1,000, 2,000 y 4,000 palabras fueron tomadas de las obrasde Benedetti y el Quijote, y 500 palabras del editorial.Estas palabras fueron utilizadas para crear los ejemploscomo se describio anteriormente y fueron etiquetados co-mo Bene500, Qui500, Pap500, etc. Se encontro que las

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 23 / 32

4,000 palabras de Benedetti y del Quijote dieron 1,426 y1,279 palabras diferentes y un total de 18,629 y 17,627ejemplos, respectivamente. Las 500 palabras de la edito-rial contenıan 250 diferentes palabras y produjeron 2,474ejemplos. La distribucion de los ejemplos entre las cla-ses O, N y C fue de aproximadamente 39%, 47%, 13%para cada conjunto. Estos conjuntos fueron utilizados co-mo datos de entrenamiento para construir los arboles dedecision con CRUISE. En todos los experimentos realiza-dos, los valores predeterminados disponibles en CRUISEfueron los que se tomaron para construir los arboles dedecision.

Con el fin de elegir los conjuntos de prueba, es intere-sante notar primero que el Quijote tiene mas de 370,000palabras, de las cuales casi 22,000 son palabras diferen-tes, c.f. [15]. De estas, mas de 10,000 aparecen solo unavez, mientras que las 1,000 palabras mas frecuentes re-presentan casi el 80% del numero total de las palabrasque se encuentran en el libro. Tres grupos, cada uno con1,000 palabras diferentes, fueron elegidos del Quijote. Losejemplos generados a partir de ellos se obtuvieron conel metodo descrito anteriormente y fueron etiquetados“Mas”, “Azar” y “Menos”. El conjunto “Mas” se gene-ra a partir de las 1,000 palabras mas frecuentes, “Azar”de una seleccion aleatoria de 1,000 palabras (de las casi22,000 palabras distintas), y “Menos” a partir de una se-leccion aleatoria de las 1,000 palabras que aparecen solouna vez. La idea detras de esta eleccion de conjuntos esponer a prueba a los arboles de decision con los ejemplosprovenientes de las palabras que frecuentemente o raravez se usan en el lenguaje. Al final, “Mas” contiene 5,618ejemplos, “Azar” tiene 7,833, y “Menos” tiene 8,465.

Resultados

Las Figuras 1 y 2 muestran los arboles de decisionobtenidos de Bene4000 y Qui4000. Los arboles son bas-tante bajos con un maximo de profundidad de cuatroniveles, a pesar de haber sido construidos a partir demas de 17,000 ejemplos. Todos los demas arboles tienenun comportamiento similar. Los tiempos necesarios pa-ra construir y probar los arboles de “Azar” fueron 44.5y 39.7 segundos, respectivamente. Para los arboles cons-truidos con Bene500, Qui500 y Pap500, fueron necesariosaproximadamente 4 segundos.

Segunda∈ S1

O

Tercera∈ S3 ∈ S4

N

Primera∈ S5

C

∈ S6

N

∈ S2

S1 = {b c d f g h j l m n p q r s t v x y z n}S2 = {a e i o u a e ı o u u}S3 = {a e h i l o r u x y a e ı n o u u}S4 = {W b c d f g j m n p q s t v z}S5 = {W}S6 = {a b c d e f g h i j l m n o p q r s t u v x y

z a e ı n o u u}

Figura 1. Arbol de decision entrenado con 4,000palabras de Benedetti

Segunda∈ S1

O

Tercera∈ S3 ∈ S4

Tercera∈ S7

O

Segunda∈ S11

C

∈ S12C

∈ S8

∈ S2

Segunda∈ S5

O

Tercera∈ S9 ∈ S10

N

Primera∈ S13

C

∈ S14

N

∈ S6

S1 = {b c d f g h j l m n p q r s t v x z n} S2 = {a e i o u y a e ı o u u}S3 = {a e i o u a e ı o u} S4 = {W b c d f g h j l m n p q r s t v x y z n u}S5 = {y} S6 = {a b c d e f g h i j l m n o p q r s t u v x z a e ı n o u u}S7 = {h l r u} S8 = {W a b c d e f g i j m n o p q s t u v x y z a e ı n o u}S9 = {a b c d e f g h i j l m n o p q r s t u v x y z a e ı n o u u} S10 = {W}S11 = {b c f g l p t} S12 = {a d e h i j m n o q r s u v x y z a e ı n o u u}S13 = {W} S14 = {a b c d e f g h i j l m n o p q r s t u v x y z a e ı n o u u}

Figura 2. Arbol de decision entrenado con 4,000 palabras del Quijote

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 24 / 32

Tabla I. Resultados de los arboles de decision en losconjuntos de prueba

Conjunto datos Ejemplos

%entren.

%“M

enos”

%“Azar”

%“M

as”

Bene500 2,231 100.0 99.2 99.4 99.9Bene1000 4,522 99.9 99.2 99.3 99.9Bene2000 9,249 99.9 99.3 99.4 99.9Bene4000 18,629 99.9 99.3 99.5 99.9Qui500 2,247 99.8 98.8 98.9 99.4Qui1000 4,440 99.7 99.3 99.5 99.7Qui2000 8,733 99.8 99.5 99.6 99.9Qui4000 17,627 99.8 99.4 99.5 99.7Pap500 2,474 100.0 99.3 99.4 99.6

La Tabla 1 contiene los resultados obtenidos con losarboles de decision construidos con el conjunto de datosque aparecen en la primera columna. La segunda colum-na da el numero de ejemplos en cada uno de los conjuntosdatos. Las siguientes cuatro columnas dan el porcentajede resultados correctos, obtenidos con el arbol correspon-diente en el conjunto de entrenamiento y los tres conjun-tos de prueba.

Los resultados de todas las pruebas muestran con-juntos que, como era de esperarse, cada vez tienen unnumero mayor de valores correctos. Los que van desde las1,000 palabras menos frecuentes hasta las 1,000 palabrasmas frecuentes. Todos los resultados, con la excepcionde Qui500, estan por encima del 99%. Una tasa de errordel 1.2% para el caso de Qui500 en “Menosß” representa98 errores. En la siguiente seccion se analizan los errores.

Discusion y conclusionesEn este trabajo hemos investigado el uso de los arbo-

les de decision para generar de manera automatica reglasde silabeo para el espanol. Usamos esquema de codifica-cion con tres caracteres y tres clases, correspondientes alinicio-nucleo-coda, se ha empleado y se ha aplicado a tex-to de diferentes fuentes para obtener conjuntos de entre-namiento y prueba. Las fuentes de texto se han escogidoa proposito por ser diferentes en terminos de sus auto-res y contenido. Arboles de decision fueron construidoscon la formacion conjuntos utilizando un metodo llama-do CRUISE. El objetivo ha sido ver si estas tecnicas sonefectivas, y que dificultades pueden surgir en el proceso.

Observamos primero en los resultados de la Tabla 1,que con tres caracteres se obtuvo una tasa de aciertosde mas del 90%, aun cuando se utilizaron tan solo 500

palabras (y en ese caso el numero de palabras diferentesera de alrededor de 250).

Las tres clases de O, N, y C son una opcion natural.Sin embargo, en el espanol la ambiguedad esta presenteen el proceso de silabeo. Por ejemplo, rio y rıo ambosproducen ONN, pero se silabean diferente como se ve enrio y rı-o. Estos errores surgen de las reglas que rigenlos diptongos y triptongos en espanol, y una vez identifi-cados, diferentes estrategias pueden ser empleadas parasu eliminacion, tales como ampliar el numero de clases.

En el caso del arbol de clasificacion construida conBene4000 hay 59 errores en “Menos”. De estos, 58 co-rresponden a un mal cambio de una coda para un inicio,y todo ocurre en el contexto de VCC. Un gran numerode estos errores VCC tiene lugar cuando un pronombreaparece en el final de una palabra, como los errores conarl de intentarla o osl en vivimosle; sin embargo,son tambien encontrados en ejemplos como el alr en lapalabra alrededores o exh en exhalaciones o esl dedeslumbrada. El otro error hecho por el arbol es el mis-mo que antes, confusion por parte del diptongo en ahı.

En el arbol de decision construido con Pap500 se mar-ca una dificultad interesante, ya que se descubrio que enel texto no figura ni n ni u; esto represento mas de lamitad de los errores cometidos. Una vez mas, este esun error de facil identificacion y remedio. El resto delos errores son similares en Bene4000 y erroneamente seasigna inicios en lugar de codas a las combinaciones deVCC. ¿Sugiere esto algo sobre el uso de los pronombresen el espanol antiguo?

En cualquier caso, ya que estamos interesados en laposibilidad de generar de forma automatica las reglasde silabeo y la reduccion de los tipos de errores, es in-teresante que los errores que se producen para los casosanteriores tienen en su mayor parte una explicacion sen-cilla y caen en categorıas especıficas. Esto proporcionael tipo de informacion que se necesita para agrandar losconjuntos de ejemplos de entrenamiento y ası reducir eltipo de errores cometidos, aunque de forma iterativa.

Por ultimo, aunque los textos son muy diferentes, eldesempeno demostrado para silabeo es muy bueno entodos los conjuntos de pruebas, incluyendo a “Menos”que es de los mas complicados. Lo anterior nos permiteconcluir que los arboles de decision representan una muybuena alternativa para generar reglas de silabeo para elespanol.✵

REFERENCIAS

1. Ostendorf M. (1999) “Moving beyond the ‘beads-on-a-string’ model of speech”, Proceedings of the AutomaticSpeech Recognition and Understanding.

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 25 / 32

2. Greenberg S. (1999) “Speaking in shorthand, a syllable-centric perspective for understanding pronunciation varia-tion”, Speech Communication, 29, pp.159–176.

3. Ganapathiraju A., Hamaker J., Ordowski M., DoddingtonG., Picone J. (2001) “Syllable-based large vocabulary con-tinuous speech recognition”, IEEE Transactions on Speechand Audio Processing, 9(4), pp. 358–366.

4. Nageshwara Rao M.,Thomas S., Nagarajan T., Murthy H.A.(2005) “Text-to-speech synthesis using syllable-like units”,Proceedings of National Conference on Communications,IIT pp. 277–280.

5. Lopez-Gonzalo E., Rodrıguez-Garcıa J.M. (1996) “Statisti-cal methods in data-driven modeling of spanish prosody fortext to speech”, 1996 International Conference on SpokenLanguage Processing, 3.

6. Figueroa K. (1998) “Sıntesis de voz en espanol, un enfoquesilabico”, Tesis de Licenciatura, Universidad Michoacana deSan Nicolas de Hidalgo.

7. Oliveira C., Castro Mourinho L., Teixeira A. (2005) “On eu-ropean portuguese automatic syllabification”, 2005 AnnualConference of the International Speech Communication As-sociation, pp. 2933–2936.

8. Belz A. (2000) Computational Learning of Finite-State Mo-dels for Natural Language Processing. Tesis doctoral, Schoolof Cognitive and Computing Sciences, University of Sussex,UK.

9. Tian J. (2004) “Data-driven approaches for automatic de-tection of syllable boundaries”, 2004 International Confe-rence on Spoken Language Processing, pp. 61–64.

10. Nerbonne J., Konstantopoulos S. (2004) “Phonotactics ininductive logic programming”, Advances in Soft Computing,pp. 493–502.

11. Muller, K. (2002) Probabilistic syllable modeling using un-supervised and supervised learning methods, Tesis doctoral,University of Stuttgart.

12. MacKinney-Romero R., Goddard J. (2005) “Inferring rulesfor finding syllables in spanish”. Lecture Notes in ComputerScience 3789, pp. 800- 805, Springer-Verlag.

13. Kim H., Loh W.-Y. (2001) “Classification trees with unbia-sed multiway splits”, Journal of the American StatisticalAssociation 96, pp. 589–604.

14. de Cervantes Saavedra M. (2005) El Ingenioso Hi-dalgo Don Quijote de la Mancha, version electronicade F.F. Jehle, 2005, basada en en la edicion moder-na de Rodolfo Schevill y Adolfo Bonilla. Obtenida de:users.ipfw.edu/jehle/wcdq.htm

15. Goddard J., Martınez A.E., MacKinney R., Martinez F.M.(2005) “The syllable structure of don Quijote”, 10th Inter-national Conference on Speech and Computer, pp. 251–254.

SOBRE LOS AUTORES

Rene MacKinney-Romero obtuvo el grado de licenciado en Computacion por la Universidad Auto-noma Metropolitana Unidad Iztapalapa. Tiene ademas el grado de maestrıa in Computation porla Universidad de Oxford en Inglaterra ası como un doctorado en Ciencias Computacionales por laUniversidad de Bristol tambien en Inglaterra. Actualmente es Profesor del Departamento de Inge-nierıa Electrica de la Universidad Autonoma Metropolitana. Sus intereses incluyen el aprendizaje dereglas automatico, el aprendizaje de orden superior y sus aplicaciones a problemas cotidianos.

John C.H. Goddard recibio una licenciatura (1st Class Hons) de la Universidad de Londres, y undoctorado en Matematicas de la Universidad de Cambridge. Es Profesor en el Departamento de In-genierıa Electrica de la Universidad Autonoma Metropolitana. Sus intereses incluyen reconocimientode patrones y algoritmos heurısticos aplicados a problemas de optimizacion.

Atencion patrocinadores & anunciantes

Komputer Sapiens es una revista de divulgacion en idioma espanol de temas relacio-nados con la Inteligencia Artificial, con un tiraje de 1,000 ejemplares. Informacion:

[email protected]

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 26 / 32

ARTICULO INVITADO

Minerıa de datos en el ambiente bancariopor Horacio Carvajal Sanchez Yarza

El ambiente bancario y la minerıa dedatos

El nivel de complejidad financiera actual ası comoel ambiente competitivo para la generacion de nego-cio y rentabilidad requiere fundamentar el proceso detoma de decision con base en el desarrollo de nivelesanalıticos avanzados. El conocimiento de que paso ypor que paso ya no es suficiente, hoy hay que conocerque esta pasando ahora, que va a pasar despues, que ac-ciones hay que tomar para optimizar los resultados [1].La disponibilidad de datos crece de forma exponencial enlas organizaciones, por lo que se presenta el reto de utili-zar de forma efectiva ese volumen de datos para apoyarlas decisiones de negocio.

Existen varias aplicaciones de la minerıa de datos enun ambiente bancario. Es importante buscar que la tareaanalıtica que se puede apoyar con procesos de minerıa dedatos permita realizar acciones que incidan en beneficiossobre el cliente. El nivel de exito de la analıtica se refle-jara principalmente en terminos de que tanto se puedallevar a la accion de negocio. Dicha analıtica debera be-neficiar al cliente generando alguna accion que resuelvasus necesidades, tal como resolucion preferencial de que-jas, manejo de la tasa de interes, manejo de comisiones,etc., de acuerdo a las caracterısticas del cliente y el valor(actual o potencial) que representa para la institucion.Asimismo, se debe generar un beneficio a la institucion,desde un incremento de lealtad del cliente hasta un in-cremento directo de ingresos/rentabilidad.

Definiciones principalesExisten varios elementos a considerar dentro de la

aplicacion de la minerıa de datos en un ambiente ban-cario. El primer elemento es el ciclo de vida del cliente,donde se pueden aplicar diversos modelos de minerıa dedatos tales como los que se muestran en la Figura 1.

El desarrollo de modelos requiere de diferentes defi-niciones tales como:

Cliente bueno/malo: probabilidad de mora (credi-to) y/o su rentabilidad (credito, captacion, inver-siones, etc.).

Temporalidad en el comportamiento de interes, porejemplo, morosidad en los ultimos 24 meses.

Severidad del comportamiento de interes, por ejem-plo, no contar con creditos castigados ni morosidadmayor a 90 dıas en los ultimos 24 meses.

Segmento al que el cliente pertenece.

Habitos tıpicos del segmento al que pertenece elcliente.

Nivel de lealtad del cliente, ası como su probabili-dad de abandono.

Esquemas a traves de los que se puede crecer larelacion con el cliente.

El nivel de exito del modelo depende de la definiciondel comportamiento de interes sobre el que el modelo seestara desarrollando. Esa definicion debe ser de beneficiopara el negocio.

Socios para una exitosa implementacionde negocios usando minerıa de datos

La tarea analıtica requiere de una colaboracion cer-cana de diferentes actores, incluyendo por lo menos a lassiguientes areas:

La labor analıtica usualmente se lleva a cabo por elarea de CRM (Administracion de la Relacion conel Cliente, del ingles Customer Relationship Mana-gement).

Para la colocacion de credito se debe cumplir conlas estrategias del area de “Riesgos”.

Figura 1. Ciclo de vida del cliente

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 27 / 32

Los objetivos de las estrategias de venta cruzada,activacion, desarrollo deben trabajarse junto con elarea de “Producto”, ası como con el area de “Mer-cadotecnia”. Es importante aclarar que esta ultimaarea tiene por labor el diseno de productos finan-cieros, por lo que no debe visualizarse simplementecomo un area de promocion.

Una institucion puede tener los mejores modelosde minerıa de datos pero para que realmente seanimplementados y tengan un beneficio de negocio,es fundamental trabajar con el area “Comercial”,la cual debera establecer esquemas de venta e in-centivos adecuados.

Un modelo de minerıa debe considerar como pun-to fundamental la creacion de relaciones leales yrentables, por lo que se debe tener una colabora-cion cercana con el area de “Rentabilidad” en laidentificacion de mezclas rentables de productos.Es posible que ciertos productos deban actuar co-mo“bateadores de sacrificio”, y que los sistemas deincentivos reconozcan y no castiguen esta accion yaque el resultado final es una mayor rentabilidad.

La recuperacion de creditos en situaciones de mo-rosidad es labor del area de “Cobranza”. El areaanalıtica puede interactuar con “Cobranza” en laelaboracion de modelos preventivos que faciliten lalabor de recuperacion.

Un actor fundamental es el area de “Sistemas”, elcual debe ser el apoyo que proporcione el ambientede base de datos, desarrollo de sistemas, paque-terıa analıtica, etc., requeridos en el desarrollo dela labor analıtica para el negocio.

Enfoque analıtico preventivo y evolutivohacia el concepto cliente

Uno de los objetivos que se busca en un proceso deminerıa de datos es un modelo que permita hacer pre-dicciones. Es importante analizar el umbral de predicciontomando en cuenta los siguientes elementos:

1. Cuando estara lista la informacion requerida.

2. Cuanto tiempo se requiere para su preparacion ytransformacion.

3. Cuanto tiempo se lleva la ejecucion del modelo.

4. Cuanto tiempo se requiere para informar al areacomercial y/o de producto.

5. Cuanto tiempo requieren las areas previas para to-mar accion.

Si el tiempo de los pasos 1 a 5 es de 2 meses, entoncesel modelo debera buscar predecir el comportamiento ob-jetivo del cliente a 2 meses, el hacerlo a un menor periodosimplemente no tendrıa una accion aplicativa factible.

El caracter preventivo de un modelo de minerıa dedatos va a permitir un mejor nivel de exito que el casode los modelos llamados de recuperacion o win-back. Unavez que el cliente ha tomado la decision de abandono, lalabor de recuperacion es significativamente mas difıcil ytiene una menor probabilidad de exito.

La estructura de las instituciones bancarias tantoen el extranjero como en Mexico se basa en productos.Existe un esfuerzo en migrar esta estructura de silo haciauna estructura que tome accion sobre el cliente como unaentidad. Esta evolucion tiene implicaciones importantes,tales como el concepto del producto que actua como“bateador de sacrificio” mencionado anteriormente, elcual requiere de un cambio en la estructura de incen-tivos, y probablemente tambien requiera migrar a unaadministracion por segmento y no por producto. Estosconceptos son fundamentales para la labor analıtica y eldesarrollo de modelos de minerıa de datos.

Aplicaciones comunes de minerıa dedatos en el ambiente bancario

Dentro de las aplicaciones de la minerıa de datos seencuentran las siguientes:

Procesos de segmentacion. La tecnica usual esla aplicacion de algoritmos de agrupamiento o clus-tering, donde se agrupan los elementos mas simi-lares entre ellos, que al mismo tempo sean los masdiferentes con respecto otros grupos de elementos.Existen muchos tipos de segmentaciones incluyen-do por valor, de comportamiento, de propension,basadas en lealtad, socio-demograficos y ciclo devida, actitud, necesidades [4].

Deteccion de fraudes. El caso tıpico de deteccionde fraudes ocurre en el area de tarjeta de credito,donde existen diversas aplicaciones de redes neu-ronales que permiten distinguir transacciones po-tencialmente fraudulentas. En este caso es funda-mental detener la transaccion en el momento queocurra por lo que el contar con un algoritmo quetenga un mayor nivel explicativo, tal como arboles,se vuelve secundario. El nivel de entrenamiento dela red es fundamental para incrementar el nivel decerteza y reducir el error. Como se muestra en la

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 28 / 32

Tabla I, se busca que el modelo identifique los casosde fraude (cierto positivo), los de no fraude (ciertonegativo) y reduzca el nivel de error (fraudes queno son fraudes, falso positivo; fraudes identificadoscomo no fraudes, falso negativo).

Tabla 1Fraude Sin fraude

Alarma Cierto positivo Falso positivoSin Falso negativo Cierto negativoalarma

Modelos de otorgamiento de credito. Estosmodelos utilizan tecnicas estadısticas para discri-minar entre lo que serıa un cliente potencialmen-te bueno de aquellos que se estimen como clien-tes potencialmente malos. La definicion de clientebueno/malo considera el comportamiento moroso.La tecnica usualmente utilizada es regresion logısti-ca. Este tipo de modelos requieren de un nivel detransparencia en la decision tomada. Por ejemplo,existen paıses donde es necesario proveer una expli-cacion en casos de rechazo de credito, algo que conuna tecnica como redes neuronales no serıa posible.

Modelos de propension. Estos modelos buscangenerar una calificacion o probabilidad de que tanpropenso es el cliente para llevar a cabo un ciertocomportamiento. Por ejemplo, un ambiente analıti-co ideal deberıa generar de forma regular la propen-sion del cliente para adquirir un seguro, una tarjetade credito, una inversion, una cuenta de cheques,etc., ası como su propension de lealtad/abandono.La decision de que ofrecer al cliente ya se convierteen una decision comercial que utiliza el resultadode modelos de minerıa de datos.

Modelos de secuencia. La tecnica usual para es-tos modelos es la canasta de mercado. Es importan-te visualizar el potencial del algoritmo, cuya aplica-cion en el mercado del detallista, como supermerca-dos, es natural, pero tambien se puede expandir almercado bancario. Con esta tecnica se encuentranmezclas de productos o compras a promocionar porsu valor para la institucion financiera.

Modelos de prevencion. Entre los modelos mascomunes en esta familia estan los relacionados conla retencion o prevencion de abandono, tanto di-recto como pasivo. Un cliente de tarjeta de creditopuede abandonar con la cancelacion directa de suplastico (abandono directo), o simplemente puededejar de utilizarlo (abandono pasivo). Usualmenteel evento de cancelacion se debe a una situacion deinconformidad, por lo que un modelo de preven-cion puede ser de poca efectividad. Por otra par-te, el abandono pasivo es mas sencillo de modelar

ya que se pueden encontrar comportamientos queindiquen la probabilidad de no utilizacion en unperiodo de tiempo dado. La metrica de abandonoes fundamental para el exito del modelo. Por ejem-plo, existe el caso de un modelo que utilizaba comometrica la existencia de saldo 0 durante 3 meses se-guidos, metrica totalmente sesgada en terminos deprediccion. Para estos casos se debe buscar la ten-dencia a traves de deltas o pendientes.

Deteccion de situaciones extraordinarias. Atraves de minerıa de datos se pueden tener modelosque generen alarmas en respuesta a una situacionextraordinaria. Un caso tıpico puede ser el de re-tiros extraordinarios que senalen una intencion deabandono del cliente. Es de reconocerse que el mo-delo no es inmune a casos como el retiro para unacompra importante, por ejemplo un automovil, loque no significa un comportamiento de abandono.

Modelos de campanas. Una de las areas mas di-rectas de llevar la analıtica a la accion de negocioson las campanas. La minerıa de datos permite evi-tar el “enfoque de escopeta” hacia un enfoque masdirigido. A traves de modelos se identifica a aque-llos clientes con una mayor propension de compra,lo que permite reducir el numero de contactos, y ala vez el costo de contacto, e incrementar el nivel derespuesta positiva. Modelos de segmentacion y depropension son usualmente utilizados en este caso.

Arquitectura para minerıa de datosUna arquitectura recomendable dentro de un ambien-

te de minerıa de datos incluye la creacion de una basede datos analıtica, donde el usuario tenga la posibilidadde llevar a cabo procesos de transformacion, redundanciade datos (“desnormalizacion”), y preparacion de datos.El descubrimiento de conocimiento se llega a convertirmas en un arte que en algo muy reglamentado. Existela ideas de que el proveer de un modelo multidimensio-nal es suficiente para que se pueda llevar a cabo la laboranalıtica. Aunque este tipo de modelos puede facilitar latarea de reportes estructurados, definitivamente no es laarquitectura que requiere la labor analıtica.

La mejor solucion en este caso es contar con un granalmacen central de datos (datawarehouse) solamenteorientado a lectura. A partir de este almacen central secrea un almacen para analıtica/minerıa de datos (data-mart analıtico), donde se realice esta labor analıtica.

Cuantos datos y periodosEn cierta ocasion al preguntar a uno de los autores

mas reconocidos dentro de la minerıa de datos sobreque tantos datos se deben tener y cuantos periodos, surespuesta fue muy sencilla: todos los datos, todos los

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Artıculos de divulgacion Komputer Sapiens 29 / 32

periodos. Este tema presenta controversia entre los de-partamentos de sistemas y el personal analıtico que llevaa cabo el proceso de minerıa de datos. La argumentacionradica en la utilizacion de recursos de computo contra laoportunidad de contar con un nivel optimo de detalle,completitud e historia para buscar soluciones de negocioa las problematicas que vayan surgiendo. Un departa-mento tecnologico siempre va a preguntar que se quierehacer, con cuantos periodos de tiempo, a que nivel dedetalle; la respuesta del area analıtica se puede funda-mentar en lo que se ha llevado a cabo, lo que se tieneplaneado, pero la realidad analıtica es que en el futurola necesidad de negocio difıcilmente permite predetermi-nar las necesidades de informacion, por ello entre mayordetalle e historia se tenga los procesos se facilitaran mas.

“Granularidad” de los datosEl poder analıtico que se obtiene al tener datos de

mucha “granularidad” es usualmente muy superior encomparacion al almacenamiento de datos con menor“granularidad”. Por otra parte, entre mayor “granulari-dad” se requerira de mayor poder de computo y de alma-cenamiento para llevar a cabo las tareas de preparaciony transformacion de datos. Una buena practica es con-tar con el menor nivel de “granularidad” pero al mismotiempo generar agrupaciones de datos de “granularidad”intermedia que permitan atacar problemas a diferentesniveles de conceptualizacion. Por ejemplo, si se considerael caso de tarjeta de credito, un nivel transaccional per-mite conocer a detalle los habitos del cliente para generarcampanas muy dirigidas. Por otra parte, si solamente serequiriera segmentar con base en caracterısticas globales,el nivel de dato requerido pudiera ser simplemente cono-cer si el cliente posee una tarjeta de credito, o el tipo decomercio en el que realiza sus transacciones.

Adicionalmente al dato original, el datamart analıti-co debera tener sumas, promedios, razones, deltas, mar-cas [4] que permitan reducir el tiempo de preparacion ytransformacion de datos, y ası concentrarse en el analisis.

Calidad de datosLa calidad de datos es fundamental para el proceso de

minerıa de datos. El alimentar un algoritmo de minerıade datos con datos erroneos puede resultar en un modelo

potencialmente danino para la estrategia de negocios.Por calidad no solamente debe entenderse ausencia deerrores en los datos, sino tambien calidad en el concepto.Por ejemplo, si se quiere determinar un universo poten-cial de clientes para la venta de creditos y no se revisasu morosidad interna y/o externa, se tiene el peligro deotorgar creditos con un alta probabilidad de no pago. Elprincipio de basura de entrada – basura de salida apli-ca totalmente a los ambientes de minerıa de datos. Lasaseveraciones de los proveedores deben considerarse concuidado, lo unico que permite que se alimente algo suciopara sacar algo limpio son las lavadoras. El conocimientoy sensibilidad de negocio, ası como el sentido comun sonfundamentales para la minerıa de datos.

ConclusionesLa minerıa de datos en el ambiente bancario va mas

alla de la simple aplicacion de algoritmos en el dato. Re-quiere de un conocimiento y sensibilidad hacia la accionde negocio. En ocasiones se puede llevar a cabo bajo sim-ples consultas SQL (del ingles Structured Query Langua-ge) o llegar hasta el desarrollo de algoritmos complejos.El punto fundamental es esa busqueda de accion de ne-gocio, donde se genere una accion que incremente el nivelde lealtad del cliente y su relacion con la institucion, be-neficiando a ambos en el logro de sus metas particulares.

El objetivo de este artıculo ha sido el dar una visionde como la minerıa de datos se aplica en un ambientebancario, y a la vez en como puede llevarse a cabo estalabor analıtica de forma exitosa. El tema es mucho masamplio de lo presentado, por lo que se recomienda revisarla bibliografıa anexa para mayor detalle.✵

REFERENCIAS

1. LaValle S., Hopkins M., Lesser E., Shockley R., KrushwitzN. (2010) Analytics: The new path to value, IBM Institutefor Business Value and MIT Sloan Management Review.

2. Davenport T.H., Harris J.G. (2010) Analytics at Work, Har-vard Business Press.

3. Berry M.J.A., Gordon S.L. (2011) Data Mining Techniquesfor Marketing, Sales, and Customer Relationship Manage-ment, New York: Wiley.

4. Tsiptsis K., Chorianopoulos A. (2011) Data Mining Tech-niques in CRM, New York: Wiley.

SOBRE EL AUTOR

Horacio Carvajal Sanchez Yarza es maestro en ciencias en Sistemas Inteligentes Basados enConocimiento, y maestro en filosofıa en Ciencia Computacional. Actualmente labora en el BancoMercantil del Norte en el area de CRM del departamento de Mercadotecnia. Ha sido profesor deposgrado en la Universidad Iberoamericana, la maestrıa en ciencias en el IIMAS y el Tecnologicode Monterrey, unidad Morelos. Ha sido miembro de la Mesa Directiva de la Sociedad Mexicana deInteligencia Artificial, SMIA.

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Columnas Komputer Sapiens 30 / 32

COLUMNAS

IA & Educaciona cargo de Julieta Noguez Monroy, [email protected]

Aprendiendo a aprenderCuando hablamos del aprendizaje humano, se puede

ver una importante evolucion en los ultimos anos, queva de la mano de los avances tecnologicos. Se proponela utilizacion de nuevos metodos y medios de ensenan-za, ası como tambien el dominio de competencias basi-cas que favorezcan el desarrollo de diversas capacidades,prestando especial atencion al aprendizaje de habilida-des que permitan aprender a aprender e interpretar, aorganizar, analizar y utilizar la informacion.

Aprender a aprender significa dar prioridad a los co-nocimientos procedimentales sobre los conceptuales, tra-tando de que los estudiantes adquieran herramientas pa-ra aprender. Es un proceso activo de construccion de nue-vas ideas o conceptos basados en el conocimiento previoo actual [1]. Aprender a aprender implica [2]:

La adquisicion y uso adecuado de estrategias cog-nitivas; es decir, de los procesos reflexivos que im-plican realizar una tarea.

El aprendizaje y utilizacion de estrategias meta-cognitivas (estrategias que permiten hacer una re-flexion de nuestros propios procesos de pensamien-to).

El desarrollo y aplicacion de modelos conceptuales.

Las tecnicas didacticas que promueven las habilida-des de aprender a aprender utilizan metodologıas de en-senanza-aprendizaje activas, por medio de las cuales sepretende alcanzar el desarrollo de las capacidades delpensamiento crıtico y del pensamiento creativo. Las ac-tividades de aprendizaje estan centradas en el estudiante,es decir, es un aprendizaje que solo puede adquirirse atraves de la implicacion, participacion, motivacion, aten-cion y trabajo constante del alumno: el estudiante noconstituye un agente pasivo sino que participa y se in-volucra en la tarea, necesariamente, para poder obtenerlos conocimientos o informaciones [3].

El foco se dirige a lo que los estudiantes aprenden yno en lo que se les ensena. Los estudiantes participan ac-tivamente en la construccion de su aprendizaje medianteinteraccion, experimentacion, analisis, discusion e inves-tigacion de nuevos contenidos de aprendizaje. Descubrenlos procesos y aplican nuevos conocimientos de una ma-nera relevante y significativa dentro y fuera del aula.

De igual manera que han evolucionado las tecnicasde ensenanza-aprendizaje humano, se ha buscado que lascomputadoras aprendan a aprender. La IA y la evolucionde las tecnologıas de la informacion han ido proveyendode herramientas para hacer esto posible.

Inteligencia computacional es una rama de la IA cen-trada en el estudio de mecanismos adaptable para permi-tir el comportamiento inteligente de sistemas complejosy cambiantes. Se ha realizado un gran esfuerzo tratan-do de que las computadoras “piensen”. Es decir, lograrla automatizacion de actividades vinculadas con los pro-cesos de pensamiento humano, entre las que destacanla resolucion de problemas, la toma de decisiones y elaprendizaje. Adicionalmente, con un enfoque racional sehan realizado estudios de los procesos que hacen posiblepercibir, razonar y actuar.

En este contexto el aprendizaje automatico empleatecnicas para que las computadoras se adapten a nuevascircunstancias y para detectar y extrapolar patrones [4].El Aprendizaje Automatico puede ser visto como un in-tento de automatizar algunas partes del metodo cientıfi-co mediante metodos matematicos. Aunque el objetivoinicial era permitir a las computadoras aprender, con losavances tecnologicos hoy en dıa se han enriquecido de laciencia cognitiva donde convergen modelos computacio-nales de la IA con tecnicas experimentales de sicologıapara tratar de que las computadoras aprendan a apren-der. Aun cuando muchas de las tecnicas requieren de su-pervision, calibracion y decisiones humanas, ha habidoevidencia del progreso de la inteligencia artificial.

El aprendizaje computacional tiene una amplia ga-ma de aplicaciones, incluyendo motores de busqueda,diagnosticos medicos, deteccion de fraude en el uso detarjetas de credito, analisis del mercado de valores, clasi-ficacion de secuencias de ADN, reconocimiento del hablay del lenguaje escrito, juegos y robotica [5]. ¡Vale la penaayudar a las computadoras a aprender a aprender!✵

REFERENCIAS

1. Castellano H.M. (2006) ¿Que cosa es “aprender a apren-der”?. Contexto Educativo. Revista Digital de Educacion yNuevas Tecnologıas. Numero 36, ano VI. http://contexto-educativo.com.ar/index.htm

2. Mateos A. N, Dos enfoques del concepto aprender a apren-der, http://www.rocaweb.com.pe/DOCUMENTOS/enfoqu-espsicopedagogicos.pdf. Consultada en agosto, 2011

3. McDermott L., Millikan L. (1990) What we teach and whatis learned—closing the gap. Am. J. Phys., Vol. 59, 1991, pp.301 - 315.

4. Russel S., Norving P.(2004) Inteligencia Artificial, un en-foque moderno. Ed. Pearson/Prentice Hall. ISBN: 978-84-205-4003-0

5. Mitchell, T. (1997). Machine Learning, McGraw Hill. ISBN0-07-042807-7

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Columnas Komputer Sapiens 31 / 32

COLUMNAS

Deskubriendo Konocimientoa cargo de Gildardo Sanchez Ante y Alejandro Guerra Hernandez,[email protected]

Artificial Intelligence for Games de Ian Millington

por Ricardo Sisnett Hernandez

Portada del libro, editorial Morgan Kaufmann.

Despues de Artificial Intelligence: A modern ap-proach de Russell y Norvig, es difıcil pensar que hayaotro libro en el que profesores y estudiantes cimienten sudocencia y estudios como lo hacemos con este. Sin em-bargo, la emergente industria de los video juegos y susderivados ha obligado a la academia a generar nuevastecnicas y literatura que esten a la altura de cualquierotra disciplina o sub-disciplina de la Inteligencia Artifi-cial.

Las areas de video juegos, juegos serios y simulacionrequieren un tipo muy particular de Inteligencia Arti-ficial, con retos y problemas especıficos y herramientaspara solucionarlos que no siempre encontramos en loslibros de IA clasica, es este el nicho donde Artificial In-

telligence for Games de Ian Millington puede situarsecomo una piedra angular.

Este libro es referido comunmente como “un manualcompleto de referencia”, un must-have o un “libro de ca-becera” y por lo general ha sido muy bien recibido tantopor profesionales como estudiosos. Sin embargo, la pre-gunta que debemos hacernos es: ¿que situa a ArtificialIntelligence for Games a la altura de uno de los masgrandes clasicos de esta disciplina?

El libro en sı es extenso, poco mas de 800 paginas, yaborda una gran gama de temas: desde historia y concep-tos hasta diseno de IA para tipos de juegos especıficos,y logra un gran trabajo evitando repetir temas de In-teligencia Artificial clasica, como algoritmos basicos debusqueda y logica, ası que todo el material es pertinentepara ese mercado del que hablabamos. El nivel tecni-co del libro en general es medio-alto, y supone que setiene conocimiento de matematicas 2D y 3D, conceptosde ciencias computacionales, y, obviamente, familiaridadcon algun lenguaje de programacion. Esto contrasta conla mayorıa de los libros de programacion de video juegos,que usualmente son de nivel introductorio y carecen delcorte academico del libro de Millington.

Conformado por trece capıtulos, agrupados por el au-tor en cuatro grandes temas: Inteligencia Artificial y Jue-gos, Tecnicas, Tecnologıas de soporte y Diseno de Inteli-gencia Artificial para Juegos. La primera parte (capıtulos1 y 2) describe aspectos muy generales de la historia dela inteligencia artificial, y en particular de la aplicacionde esta a los videojuegos. La segunda parte (capıtulos 3al 8) presenta algoritmos para el movimiento de caracte-res, comportamientos, fısica, planeacion de caminos, to-ma de decisiones, maquinas de estados, y da incluso unaintroduccion breve a temas de logica difusa, sistemas deMarkov, comportamientos orientados a metas, sistemasbasados en reglas, sistemas de pizarron y ejecucion de ac-ciones. Otros aspectos analizados en esta parte del libroson tacticas de aprendizaje y juegos de mesa. La terceraparte del libro (capıtulos 9 al 11) describe como algorit-mos de planificacion, comunicacion y otras herramientasayudan a soportar la creacion de videojuegos interesan-tes. Finalmente, la ultima parte habla de tecnicas paradisenar un buen videojuego. Incluso toca brevemente as-

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Año III, Vol. II. Julio - Diciembre 2011 Columnas Komputer Sapiens 32 / 32

pectos de conglomerados, formaciones y la ensenanza decaracteres.

Un aspecto positivo del libro es que para todos lostemas tecnicos, el autor presenta ejemplos y diagramasextensivamente, ademas de una explicacion verbal clara,concisa, ejemplificada y normalmente con los fundamen-tos matematico-computacionales necesarios. Para dichostemas el autor presenta, ademas, pseudocodigo con el al-goritmo o algoritmos explicados previamente y un listadode estructuras de datos o interfaces sugeridas, para queel lector pueda “brincar” mas facilmente de la explica-cion a la implementacion. Algo apreciado por el revisoren el uso de pseudocodigo es que se logra mantener abs-tracto de una plataforma en particular y se concentraen la idea principal, algo poco comun para este estilode libros que normalmente solo utilizan C++ o Lua enlos ejemplos. Desafortunadamente, el CD-ROM y el sitiode Internet recurren unicamente a este lenguaje para laimplementacion de los ejemplos y ejercicios.

Como cualquier caso, Artificial Intelligence for Ga-mes no es perfecto, y entre sus areas de mejora destacaque algunos de los bloques de pseudocodigo no dejancompletamente claro de donde proviene cierta informa-cion, es decir, se usan algunas variables o estructuras dedatos que no estan presentes como parametros, variableslocales o variables de clase. Por otro lado, algunos temasno son mencionados o abordados en profundidad, por loque es necesario apoyarse en otros libros o artıculos paraterminar de redondear el tema en cuestion, por ejemplo,el capıtulo que trata los sistemas de Markov tiene apenascuatro paginas, haciendo imposible entender el tema uti-lizando solo este libro. Ası mismo, la falta de ejercicioso problemas didacticos hace que la curva de aprendizaje

sea mas pronunciada, y que el lector o estudiante ten-ga que invertir mas tiempo recurriendo a otros libros oejercicios por su cuenta. Cabe destacar el uso frecuentede formulas y notacion matematica con la que quiza notodos los programadores de juegos amateur se sentirancomodos, y se hace mucho hincapie en el desempeno delos algoritmos (notacion O), por lo que experiencia enciencias computacionales y/o matematicas es necesariapara poder trabajar con este libro. Por ello posiblementemuchos aficionados se sentiran intimidados y se alejarande este libro cual si fuera el Necronomicon. Este no es unlibro que “lleve de la mano” a su lector, y en definitivaes un gran libro de referencia, mas que uno que pudieraleerse de principio a fin.

Como conclusion, la principal cualidad de este libroes que hace un excelente trabajo tomando la InteligenciaArtificial de video juegos y dandole un sentido academi-co, matematico y cientıfico, sin dejar de proporcionarherramientas reales para la industria, para los profesio-nales del area y estudiantes. Como hemos mencionadorepetidamente no es un libro para “primerizos” o curio-sos, ya que requiere conocimiento previo y familiaridadcon otras disciplinas. A pesar de ello, este libro definiti-vamente es una herramienta muy valiosa para el autor deesta contribucion, quien lo utiliza como referencia paraun par de clases de Inteligencia Artificial orientada a vi-deo juegos, y considera que deberıa estar en la bibliotecapersonal tanto de programadores de juegos profesionalesy academicos del area. Quiza en futuras ediciones po-damos verlo convertirse en esa “piedra angular” de laensenanza de este tema, justo con el Dragon Book, elDinosaur Book y A Modern Approach.✵

¡Publique en Komputer Sapiens!

Komputer Sapiens solicita artıculos de divulgacion en todos los temas de InteligenciaArtificial, dirigidos a un amplio publico conformado por estudiantes, academicos, empresa-rios, consultores y tomadores de decisiones. Los artıculos deben estar escritos en espanol ytener una extension entre 2,500 y 3,000 palabras.

Los topicos de interes de la revista son muy variados e incluyen: agentes computacionales, ambientes inteligen-tes, aplicaciones de la inteligencia artificial, aprendizaje computacional, buqueda y recuperacion de informacion,creatividad, demostracion automatica de teoremas, evaluacion de sistemas de inteligencia artificial, filosofıa de lainteligencia artificial, historia de la inteligencia artificial, inteligencia artificial distribuida, programacion de juegos,logicas, minerıa de datos, planificacion, procesamiento de lenguaje natural, razonamiento automatico, razonamientobajo incertidumbre, reconocimiento de patrones, redes neuronales, representacion del conocimiento, robotica, siste-mas multiagente, sistemas basados en el conocimiento, sistemas basados en el comportamiento, sistemas ubicuos,tutores inteligentes, vida artificial, vision computacional.

Instrucciones para autores e informacion general: www.komputersapiens.org.mx

c© 2011 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691

Membresıa a la SMIA

La cuota anual por membresıa a la Sociedad Mexicana de Inteligencia Artificial es de $ 1,000.00 (un mil pesos00/100 M.N.) si es usted un academico o profesional vinculado con la computacion. Si es usted estudiante de algunadisciplina afın a la computacion y tiene manera de comprobarlo documentalmente entonces la cuota anual es de$ 500.00 (quinientos pesos 00/100 M.N.).La cuota de membresıa debe pagarse mediante deposito bancario a la Sociedad Mexicana de Inteligencia ArtificialA.C. en la cuenta:

Banamex 0047040Sucursal 4152CLABE:002180415200470406

El comprobante de deposito puede ser digitalizado y enviado a [email protected]

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .sFormulario de Suscripcion a Komputer Sapiens

Datos del suscriptor (para envıo de la revista)

Tipo de suscripcion: © individual © institucionalNombre:

Nombre(s) Apellido paterno Apellido materno

Direccion:

Calle No. exterior No. interior Colonia

Codigo postal Ciudad Estado Paıs

Correo electronico Telefono Fax

Datos para envıo del recibo (completar si los datos no son los mismos del suscriptor)

Nombre:Nombre(s) Apellido paterno Apellido materno

Direccion:

Calle No. exterior No. interior Colonia

Codigo postal Ciudad Estado Paıs

Correo electronico Telefono Fax

Costo de las suscripciones 2011-2012Incluyen IVA y gastos de envıo por correo terrestre

Individuales Mexico: MX$ 165.00 EEUU & Cuba: MX$ 220.00 o US$ 20.00Otros paıses: MX$ 260.00 o US$ 26.00

Institucionales Mexico: MX$ 580.00 Incluye 3 ejemplares de cada volumen, disponible solo en Mexico

Depositar el monto de la suscripcion a la Sociedad Mexicana de Inteligencia Artificial A.C. en la cuenta:Banamex 0047040 Sucursal 4152 CLABE:002180415200470406

y enviar este formulario con copias del comprobante de pago y de la cedula de identificacion fiscal para emisionde factura, en caso de requerirse, a [email protected], o bien al fax +52(222) 266.31.52 ext.8302, atencion a Komputer Sapiens.

La Sociedad Mexicana de Inteligencia Artificial, A.C. y Komputer Sapiens apoyan la inicia-tiva de la Federacion Mexicana de Robotica, A.C. para que se declare

2012: Ano de la Robotica en Mexico

con el objetivo de impulsar carreras cientıficas en los jovenes mexicanos, y dar un ejemplode que Mexico desear apoyar decididamente el desarrollo de la robotica y las tecnologıasinteligentes, como uno de los puntales de su propio desarrollo economico.

La robotica es una disciplina que aglutina los esfuerzos de cientıficos, profesionales e industriales de diversasareas del conocimiento, como las ciencias exactas, las ciencias de la ingenierıa, y las ciencias cognitivas� Pocas disciplinas generan, como lo hace la robotica, el entusiasmo y el interes de la sociedad en suconjunto � La robotica tiene un lugar indiscutible como area estrategica de oportunidad y desarrollo �Los artefactos y soluciones roboticas tienen un alto valor agregado: son incorporados rapidamente a lascadenas productivas, retribuyen inversiones y apuntalan la competitividad � Mexico ha sido honrado alser elegido como la sede de RobCup 2012, y recibira por ese motivo 3,000 participantes de mas de 40paıses, que se encuentran a la vanguardia del desarrollo de la robotica en diversas esfuerzos que incluyenrobots futbolistas, robots de servicio, de rescate y entretenimiento �

Para saber mas sobre esta iniciativa y apoyarla, visite en el portal web:

www.femexrobotica.org/robotica2012

RoboCup Mexico 201218-24 June 2012Mexico Citywww.robocup2012.org

RoboCup is an international initiative that fosters research and education in Robotics and Artificial Inte-lligence through a variety of competitions including RoboCupSoccer, RoboCupRescue, RoboCup@Home,RoboCupJunior and other leagues.

The RoboCup Federation and the Mexican Robotics Federation are pleased to invite you to RoboCup2012 to be held in Mexico City from Monday 18th through Sunday 24th June 2012. The RoboCup WorldChampionship brings together every year close to 3,000 participants from different parts of the world tocompete in a number of advanced robotic leagues.

Se convoca a las Instituciones de Educacion Superior y a los Centros de Investigacion nacionales a sometersu propuesta para constituirse en institucion sede para los congresos 2012 de la SociedadMexicana de Inteligencia Artificial.

Fecha lımite de recepcion de propuesta: 30 de enero de 2012Fecha de notificacion: 15 de febrero de 2012

Para bases de la convocatoria, favor de referirse a www.smia.org.mx, www.micai.org, o comunicarsecon [email protected]