15
1 Reconocimiento Automático de Objetos en el Dominio Transformado: Desarrollo de Técnicas en Software y Hardware (Proyecto propuesto por: Dr. Osslan Osiris Vergara Villegas) Universidad Autónoma de Ciudad Juárez 1. Introducción La investigación en el procesamiento de imágenes digitales fue seleccionada por la Academia Nacional de Ingeniería de los Estados Unidos como uno de los veinte logros más importantes de ingeniería en el siglo veinte [ 1] . La importancia de dicho nombramiento se debe a que el procesamiento y reconocimiento de objetos es una actividad cotidiana de los seres humanos que todos los días, reconocen una multitud de objetos familiares y novedosos. El término Reconocimiento es utilizado para describir la habilidad de los seres humanos para identificar objetos basándose en un conocimiento previo. Esto se hace de manera inconsciente, a pesar del hecho de que dichos objetos pueden variar en forma, color, textura, etc. A los objetos se les reconoce desde diferentes vistas (de frente, de lado, o de espalda), en muchos lugares y en tamaños diferentes; aún cuando ellos son obstruidos parcialmente a su vista [2]. Es decir, los seres vivos frecuentemente utilizan las características típicas de los objetos, tanto visuales (tamaño, forma, color, textura, movimiento) y no visuales (olor, sabor, sonido, etc.), para reconocer a un objeto. A los diferentes aspectos relacionados al reconocimiento en la vida cotidiana de los seres humanos se agregan las tecnologías en procesamiento digital de imágenes. Por ejemplo, todos los días una gran cantidad de usuarios tienen acceso al Internet, los doctores revisan imágenes de tomografías o resonancia magnética para ofrecer un diagnóstico, los científicos utilizan imágenes astronómicas para entender el origen del universo, la NASA utiliza imágenes de satélite para generar nuevos descubrimientos, etc. Dada la dependencia que se está adquiriendo en la utilización de tecnologías asociadas a las imágenes se genera una gran demanda para obtener algoritmos y aplicaciones de procesamiento más efectivas y potentes. Además, se requiere que dichas aplicaciones sean rápidas, lo cual puede ser obtenido con hardware de propósito específico como puede ser un Procesador Digital de Señales (DSP por sus siglas en inglés) o un Arreglo de Compuertas de Campo Programables (FPGA por sus siglas en ingles). 2. Antecedentes La inspección o percepción visual puede considerarse como el resultado de un procesamiento de la información luminosa que llega a nuestros ojos por parte del cerebro. Debido a que la información visual es una de las principales fuentes de datos del mundo real, resulta útil el proporcionar a una computadora la capacidad para analizar imágenes (a partir de imágenes tomadas con cámaras digitales o analógicas), que junto con otros

Reconocimiento Automático de Objetos en el Dominio

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Reconocimiento Automático de Objetos en el Dominio

1

Reconocimiento Automático de Objetos en el Dominio Transformado: Desarrollo de Técnicas en Software y Hardware

(Proyecto propuesto por: Dr. Osslan Osiris Vergara Villegas)

Universidad Autónoma de Ciudad Juárez 1. Introducción La investigación en el procesamiento de imágenes digitales fue seleccionada por la Academia Nacional de Ingeniería de los Estados Unidos como uno de los veinte logros más importantes de ingeniería en el siglo veinte [1]. La importancia de dicho nombramiento se debe a que el procesamiento y reconocimiento de objetos es una actividad cotidiana de los seres humanos que todos los días, reconocen una multitud de objetos familiares y novedosos. El término Reconocimiento es utilizado para describir la habilidad de los seres humanos para identificar objetos basándose en un conocimiento previo. Esto se hace de manera inconsciente, a pesar del hecho de que dichos objetos pueden variar en forma, color, textura, etc. A los objetos se les reconoce desde diferentes vistas (de frente, de lado, o de espalda), en muchos lugares y en tamaños diferentes; aún cuando ellos son obstruidos parcialmente a su vista [2]. Es decir, los seres vivos frecuentemente utilizan las características típicas de los objetos, tanto visuales (tamaño, forma, color, textura, movimiento) y no visuales (olor, sabor, sonido, etc.), para reconocer a un objeto. A los diferentes aspectos relacionados al reconocimiento en la vida cotidiana de los seres humanos se agregan las tecnologías en procesamiento digital de imágenes. Por ejemplo, todos los días una gran cantidad de usuarios tienen acceso al Internet, los doctores revisan imágenes de tomografías o resonancia magnética para ofrecer un diagnóstico, los científicos utilizan imágenes astronómicas para entender el origen del universo, la NASA utiliza imágenes de satélite para generar nuevos descubrimientos, etc. Dada la dependencia que se está adquiriendo en la utilización de tecnologías asociadas a las imágenes se genera una gran demanda para obtener algoritmos y aplicaciones de procesamiento más efectivas y potentes. Además, se requiere que dichas aplicaciones sean rápidas, lo cual puede ser obtenido con hardware de propósito específico como puede ser un Procesador Digital de Señales (DSP por sus siglas en inglés) o un Arreglo de Compuertas de Campo Programables (FPGA por sus siglas en ingles). 2. Antecedentes La inspección o percepción visual puede considerarse como el resultado de un procesamiento de la información luminosa que llega a nuestros ojos por parte del cerebro. Debido a que la información visual es una de las principales fuentes de datos del mundo real, resulta útil el proporcionar a una computadora la capacidad para analizar imágenes (a partir de imágenes tomadas con cámaras digitales o analógicas), que junto con otros

Page 2: Reconocimiento Automático de Objetos en el Dominio

2

mecanismos como el aprendizaje hagan de ésta una herramienta capaz de detectar y ubicar objetos en el mundo real [3]. La información visual percibida es procesada en distintas formas con base en las características particulares de la tarea a realizar, por lo que la visión por computadora propone varias técnicas que permiten obtener una representación del mundo a partir del análisis de imágenes. En la actualidad, las imágenes digitales son ampliamente utilizadas en procesos de reconocimiento automático de objetos, inspección visual, clasificación, etc. Un problema que se encuentra en las imágenes digitales es que requieren grandes cantidades de bytes para su almacenamiento y grandes anchos de banda para su transmisión por lo que se ha vuelto una necesidad el poder encontrar formas de representar la información digital utilizando menos información que la original sin afectar el entendimiento de la misma, a dicho proceso se le conoce como compresión.

La posibilidad de representar la información visual de forma eficiente es uno de los principales fundamentos para muchas tareas de procesamiento de imágenes como por ejemplo: clasificación [4], compresión [5], filtrado [6] y extracción de características [7].

La eficiencia en la representación se refiere a la habilidad de capturar información significativa de un objeto de interés en una descripción pequeña. Desde el punto de vista práctico dicha representación debe ser realizada mediante transformaciones estructuradas y algoritmos rápidos [8].

Por lo que el poder diseñar sistemas que permitan la inspección automática

(reconocimiento) de objetos utilizando la estructura geométrica de las imágenes, y que además puedan ser implementados en dispositivos específicos de hardware, abre un campo muy amplio de aplicaciones industriales. Después de una revisión exhaustiva de revistas dedicadas al procesamiento de imágenes resulta obvia la importancia del proyecto propuesto. Por citar un ejemplo, en el año 2007 la revista, IEEE Transactions on Image Processing [9] publicó en sus doce números, aproximadamente 100 artículos de los 250 publicados, todos ellos relacionados con el reconocimiento de objetos y sus respectivas implicaciones. La tendencia se enfoca principalmente en la posibilidad de realizar el análisis de las imágenes no sólo en el dominio espacial (original) sino tambien en nuevos dominios, por ejemplo, el dominio wavelet [5], contourlet [8], ridgelet [10], wedgelet [11] y bandelet [12], por citar algunos. Gracias al análisis de las imágenes en los nuevos diferentes dominios se pueden desarrollar nuevos algoritmos y herramientas multidimensionales que ofrecen la ventaja de poder capturar de forma natural las estructuras geométricas de los objetos presentes en las imágenes. Dichas estructuras suelen ser muchas veces las características dominantes de las imágenes y datos multidimensionales.

Page 3: Reconocimiento Automático de Objetos en el Dominio

3

Además, con la posibilidad de representar las imágenes en nuevos dominios se puede obtener una definición más compacta de las mismas, lo que impacta de forma extraordinaria en la eficiencia de la representación. Lo anterior puede ser explotado para generar algoritmos que permitan realizar el reconocimiento en imágenes comprimidas, es decir, las que sólo conservan las características importantes para el reconocimiento. La ventaja de la representación eficiente permite llevar los algoritmos probados o implementados en software a dispositivos hardware de propósito específico. Dicha posibilidad permite un aumento en la velocidad de análisis y procesamiento de las imágenes lo que a su vez ofrece aumento en diferentes prestaciones del sistema como puede ser la velocidad. En las siguientes subsecciones se ofrecen los principales conceptos relacionados al presente proyecto de investigación. 2. 1 Inspección Visual Automática La inspección visual automática se define como “un proceso de control de calidad que, mediante técnicas de procesamiento digital de imágenes y reconocimiento de patrones, determina automáticamente si un producto se desvía de las especificaciones de fabricación” [13]. De esta manera, se pretende garantizar que los objetos inspeccionados pasen el control de calidad, y que además cumplan con las especificaciones que hayan sido establecidas en su producción por el fabricante mismo (usuario).

Para dar un ejemplo del proceso de inspección visual se puede utilizar un software comercial de National Instruments llamado “Vision Builder”. El cual es un ambiente de desarrollo configurable para visión por computadora que no requiere programación [14].

El software puede ser utilizado para comprobar visualmente cuando un producto es

ensamblado y manufacturado correctamente, previo reconocimiento del mismo. La primera prueba consiste en la verificación de la calidad de la abrazadera de una batería. La segunda prueba consiste en la inspección de un envase de spray que verifica. Al final proceso de inspección se define si las piezas cumplen con los criterios de calidad definidos o no es decir, los objetos son reconocidos como pertenecientes a cierto tipo de material. La figura 1 muestra las imágenes ejemplo para la verificación de la batería y el envase de spray.

Figura 1. Inspección de piezas industriales. a) Verificación de abrazadera de batería y b)

Verificación de un envase de spray.

Page 4: Reconocimiento Automático de Objetos en el Dominio

4

En una imagen, la información visual percibida es procesada en distintas formas con base en las características particulares de la tarea a realizar, de tal forma que se obtenga una descripción y representación de los objetos a partir del análisis de las imágenes tratadas. La calidad del modelo o descripción de los objetos que integran una imagen tiene una enorme influencia en el éxito o fracaso del reconocimiento. Por lo cual es recomendable trabajar con aquellas características que sean las más discriminantes. 2.2 Reconocimiento de patrones

Una gran cantidad de la información que se maneja en la vida real se presenta en la forma de patrones complejos: caras, textos escritos, enfermedades, música, flores, piezas industriales, etc. Tal complejidad es debida a la forma de tratar o procesar esos patrones por medio de una computadora.

Para la psicología, el problema central en el ámbito del reconocimiento de patrones es el estudio de los mecanismos por los que las señales externas estimulan los órganos sensoriales y se convierten en experiencias perceptuales significativas, o dicho de otra forma, cómo se realiza el etiquetado de estos estímulos tan complejos asignándoles un nombre. Dichos procesos continúan siendo desconocidos en su mayor parte y no se ha definido un modelo sobre cómo el sistema nervioso realiza este reconocimiento [15].

Por Reconocimiento de Patrones (RP) se entiende el procedimiento por el cual una descripción de un objeto se relaciona con un conjunto de descripciones [16]. La figura 2 muestra el esquema general de las etapas de un sistema de reconocimiento de patrones.

Figura 2. Etapas de un sistema de reconocimiento de patrones.

2.3 Representación de imágenes digitales Una imagen monocroma o simplemente una imagen se representa matemáticamente a través de una función bidimensional de intensidad de luz f(x, y), donde x e y representan

Page 5: Reconocimiento Automático de Objetos en el Dominio

5

las coordenadas espaciales, y el valor f en un punto cualquiera (x, y) es proporcional al brillo (o nivel de gris) de la imagen en ese punto [17]. La figura 2.7 muestra la forma en que se disponen los ejes de una imagen, pero puede ser que se manejen de forma invertida según sea conveniente. Una imagen digital, es aquella que ha sido discretizada tanto en las coordenadas espaciales como en el brillo [17]. La imagen digital para fines computacionales, puede ser representada por una matriz donde cada punto de la imagen es considerado como el valor obtenido del nivel de gris o color de ese punto. A estos elementos se les denomina píxeles o pels1.

Figura 3. Representación de los ejes de una imagen.

2.4 Transformación de dominio Los métodos de transformación son muy utilizados para el procesamiento de imágenes y señales, fueron originalmente creados para propósitos de codificación pero después encontraron uso en la restauración, mejora, segmentación, compresión, etc. Transformar significa cambiar la representación de una señal o una función utilizando operaciones matemáticas, gracias a dicha representación un problema complejo puede ser descompuesto en problemas más pequeños a los que se les pueden dar soluciones simples [18]. La transformación ofrece una representación alternativa que revela características que en el dominio original son difíciles de detectar.

Una imagen puede ser procesada tanto en el dominio espacial como en el dominio transformado. En el modelo general de procesamiento se toma una imagen de entrada y se realiza una transformación, después se aplica el procesamiento sobre la imagen transformada y a dicha imagen se le calcula la transformada inversa para regresarla al dominio original, dicho esquema se presenta en la figura 4.

1 Derivado de la abreviatura en inglés de picture elements.

Page 6: Reconocimiento Automático de Objetos en el Dominio

6

Figura 4. Esquema general de procesamiento de imágenes en el dominio transformado.

Al aplicar una transformación se persiguen tres objetivos principales: a) Reducción de la complejidad, b) Hacer evidentes ciertas características que en el dominio original eran difíciles de detectar u observar y c) Obtener la posibilidad de comprimir datos. Las propiedades deseables que debe tener una transformación son [19]:

1. Decorrelación de los datos, explotación de las ventajas del sistema visual humano y

compactación de energía. 2. Independencia de los datos.

3. Velocidad y separabilidad.

La transformación de dominio, permite: a) reducir la correlación entre los coeficientes transformados y b) tomar ventaja de la propiedad de compactación de energía para codificar solo una fracción de los coeficientes transformados sin producir demasiada distorsión [18]. 2.5 Representación geométrica de imágenes Las imágenes naturales tienen bordes irregulares o difusos, altas frecuencias, y otras características que exigen el máximo desempeño de los algoritmos de procesamiento actuales. Para mejorar las técnicas actuales de procesamiento es necesario explotar las estructuras geométricas de las imágenes, dado que dichas estructuras definen las zonas de cambio que proporcionan información importante para la percepción humana. La clave para poder distinguir características en imágenes reales es que dichas imágenes tienen una estructura geométrica intrínseca. La geometría ha sido considerada en matemáticas y en visión por computadora para modelar la información visual, los desafíos en exploración geométrica para procesamiento de imágenes provienen de la naturaleza discreta de los datos, así como de la robustez y eficacia [12]. Una primera aproximación a la geometría de una imagen está dada por el conjunto de curvas sobre las cuales la imagen es singular. En imágenes naturales, esta geometría no es regular (mal condicionada) por lo que el análisis armónico es la herramienta que aporta las técnicas más adecuadas para la representación. Las estructuras geométricas existen en una gran cantidad de modalidades de señales y traen consigo una gran cantidad de

Page 7: Reconocimiento Automático de Objetos en el Dominio

7

información perceptual. La figura 5 muestra imágenes con diferente complejidad geométrica.

Figura 5. Ejemplo de imágenes con diferente complejidad geométrica. a) Imagen con geometría

simple, b) caricatura, c) Imagen natural, d) Imagen sísmica, e) textura de madera y f) Fluido.

2.6 Compresión de imágenes El término compresión de imágenes se refiere al proceso de reducción del volumen de datos necesarios para representar una imagen cuya percepción final puede ser adaptada a la demanda de un usuario final desde el punto de vista de la distorsión [21].

La compresión de datos como disciplina tiene su origen en la teoría de la información

[22]. En la literatura existen diferentes formas de clasificar a las técnicas de compresión en: a) técnicas basadas en la forma de onda y b) técnicas basadas en modelos.

Los codificadores basados en la forma de onda intentan reproducir la forma de la

onda de la señal de entrada. Se clasifican principalmente en algoritmos con pérdida y sin pérdida de información [23].

Los métodos de compresión sin pérdida de información (lossless) se caracterizan

porque la tasa de compresión que proporcionan está limitada por la entropía (redundancia de datos) de la señal original. Los métodos de compresión con pérdida de información (lossy) logran alcanzar tasas de compresión más elevadas a costa de sufrir una pérdida de información sobre la imagen original [24].

Por otro lado los codificadores basados en modelos funcionan en términos de la

descripción del modelo de la fuente de datos a comprimir más un codificador. En la figura 6 se muestra una taxonomía de los métodos de compresión.

Page 8: Reconocimiento Automático de Objetos en el Dominio

8

Figura 6. Taxonomía de los métodos de compresión [25].

El esquema general de un compresor de imágenes con pérdidas de información conlleva tres etapas principales: Transformación de dominio, cuantificación y codificación de la entropía [25] dicho esquema se muestra en la figura 7.

Figura 7. Esquema general de un compreso de imágenes con pérdidas.

2.7 Implementación de técnicas en hardware específico: DSP y FPGA Los Procesadores Digitales de Señales (DSP), son microprocesadores diseñados específicamente para el procesado digital de una señal. El DSP tiene un conjunto de instrucciones, un hardware y un software optimizados para aplicaciones que requieran operaciones numéricas a muy alta velocidad [26]. Entre las principales aplicaciones de los DSP se encuentran el procesado de audio y video, y en general, cualquier problema que requiera de procesamiento en tiempo real. Una de las características más importantes de un DSP es la capacidad de realizar operaciones de multiplicación y acumulación (MAC) en sólo un ciclo de reloj. Dichas operaciones son las que más se utilizan en todos los algoritmos de procesamiento digital de imágenes lo cual resulta ser una gran ventaja.

Page 9: Reconocimiento Automático de Objetos en el Dominio

9

Figura 8. Esquema típico para el procesado digital de señales.

Por otro lado, los Arreglos de compuertas de Campo Programables (FPGA) son circuitos programables directamente por el usuario para ello se requiere de herramientas de costo relativamente bajo como lo son el software de desarrollo y el dispositivo grabador. Un FPGA se compone de arreglos de varios bloques programables, los cuales están interconectados entre si y con celdas E/S mediante canales de conexión verticales y horizontales [27]. Los FPGA son tecnologías de propósito específico y la figura 9 muestra un ejemplo de la arquitectura.

Figura 9. Arquitectura básica de un FPGA.

3. Descripción del problema Dada la importancia que tienen los procesos de reconocimiento de objetos en imágenes artificiales y el impacto que dichos algoritmos tienen en la vida cotidiana se plantea:

“La generación de una metodología de trabajo que permita utilizar imágenes provenientes de un proceso de digitalización, en el que las características importantes para el reconocimiento de los objetos presentes en ellas puedan ser detectadas y preservadas. Además dicha metodología puede ser implementada por medio de algoritmos de software, los cuales una vez que son probados pueden

Page 10: Reconocimiento Automático de Objetos en el Dominio

10

ser mejorados e implementados en dispositivos específicos de hardware para mejorar su desempeño.”

4. Objetivo y Metas El objetivo del trabajo de investigación es el siguiente:

“Proponer una metodología de trabajo en la cuál se pueda utilizar la geometría de las imágenes en el dominio transformado para llevar a cabo el reconocimiento de objetos; además, de que el modelo permita la implementación de los algoritmos obtenidos en dispositivos de hardware específico como los DSP o FPGA”.

Las metas que debe perseguir la metodología son:

• Se Podrá trabajar con imágenes estáticas de 8 y 24 bits. • Las imágenes serán analizadas tanto en el dominio espacial como en el dominio

transformado. • Se utilizarán las transformadas wavelet, contourlet y bandelet al menos. • Las características necesarias para el reconocimiento serán obtenidas en un

módulo de procesamiento digital de imágenes. • Las imágenes que se utilizan deben ser imágenes cuadradas potencias de dos. • Para el reconocimiento se deberán definir de manera a priori los objetos a

reconocer por ejemplo: tuercas, tornillos, manzanas, melones. Después se podrán definir los criterios para la clasificación.

• Para el desarrollo de los algoritmos se utilizará el lenguaje MATLAB que es la abreviación del laboratorio de matrices, por que es un lenguaje que brinda herramientas y componentes para la manipulación de imágenes a nivel de píxeles y brinda la posibilidad de realizar pruebas a los algoritmos de manera sencilla a diferencia del lenguaje C++.

• Para llevar los algoritmos a hardware se utilizarán dispositivos DSP o FPGA. 5. Metodología Para resolver el problema propuesto en este trabajo de investigación se plantean la siguiente metodología:

1) Revisión de artículos, libros y revistas para el estudio del estado del arte. 2) Estudio de las técnicas de caracterización para el reconocimiento automático de objetos. 3) Estudio de los métodos de representación geométrica de imágenes para ofrecer robustez al proceso de caracterización y reconocimiento de objetos. 4) Valoración de las técnicas de reconocimiento para determinar las secciones que pueden ser implementadas en hardware específico (DSP o FPGA). 5) Trabajar de manera conjunta los diferentes enfoques con sus respectivas adecuaciones.

Page 11: Reconocimiento Automático de Objetos en el Dominio

11

6) Codificación e implementación de las técnicas. 7) Realización de las pruebas con los algoritmos codificados. 8) Ajustes de los algoritmos. 9) Análisis de los resultados de investigación. 10) Escritura de un reporte de investigación.

6. Infraestructura disponible

• Procesador PXI de Nacional Instruments. • Procesador digital de señales (Da vinci). • Tarjetas Microcontroladores. • Celda de Manufactura Flexible. • Espacios de trabajo.

7. Incidencia del proyecto en el PIFI El reconocimiento de objetos es un área muy útil e importante dentro del procesamiento digital de imágenes y sus avances tienen repercusiones y aplicaciones en varios campos del quehacer cotidiano. Por otro lado, la inspección de objetos en el dominio transformado pretende encontrar o resaltar características de las imágenes que en el dominio original no eran tan obvias. Además es importante optimizar dichos algoritmos utilizando dispositivos específicos para el procesado digital de señales. Al juntar los tópicos antes mencionados se puede obtener un sistema de reconocimiento automático de objetos, que ofrece como ventaja adicional al reconocimiento, el aumento en la velocidad de procesamiento de los algoritmos. Las áreas tecnológicas presentes en la industria establecida en la región fronteriza del país, se pueden definir en términos generales como: la automotriz, telecomunicaciones, robótica, biomédica, aeroespacial/militar, tecnologías de la información, electrodomésticos y de consumo. Solamente la industria automotriz se encuentra en un nivel de madurez alta en la región. Las demás áreas tienen como característica común, que gran parte de la investigación y desarrollo de nuevos productos y modificación de los productos existentes se hace fuera de la región, lo que disminuye en gran medida el posible valor agregado de estos productos que puede ser aportado por gente de ciudad Juárez. Un alto porcentaje de valor agregado se da a través de las operaciones de manufactura. Aunque hasta hace algunos años, la principal atracción de las empresas para instalarse en ciudad Juárez fue la mano de obra barata. Esta situación ha cambiado, los ciclos de diseño a producto terminado son cada vez más cortos. Es decir, el tiempo que transcurre entre el diseño de producto y su fabricación, se ha reducido. Lo que obliga a las empresas a tener sus operaciones más concentradas y ágiles. Esto ha obligado a que las empresas tengan mas integrados sus departamentos de diseño y manufactura. Desafortunadamente,

Page 12: Reconocimiento Automático de Objetos en el Dominio

12

hasta hace poco, las instituciones de educación superior de la localidad, no tenían el elemento humano y/o técnico para complementar estas tareas. Además de los centros de diseño que ya existen en la localidad tales como los de Delphi y Valeo. Otras empresas tales como Thompson, Scientific Atlanta, Emmerson, Siemens entre otras, se encuentra en planes o ya están en proceso de formar centros de diseño y desarrollo de tecnología. Sin embargo, estos centros de diseño, los establecidos y los que se van establecer, necesitarán soporte y servicios en ciertas áreas del conocimiento como software embebido, inspección automatizada por medio de visión y prototipos de rápido lanzamiento al mercado. Se ha detectado que en la región existe la necesidad de sistemas de inspección automatizada debido a que no se cuentan con servicios de este tipo, teniendo que solicitarlo al extranjero cuando se necesitan. Esta constituye un área de oportunidad para el equipo de visión que se está solicitando. El presente proyecto lo podemos describir como un proyecto que impacta varios sectores de la industria regional y al ámbito académico. Las vertientes analizadas para el presente proyecto fueron la automotriz, la salud y la educación en el Instituto de Ingeniería y Tecnología (IIT) de la UACJ. La industria automotriz tiene, entre sus sistemas de inspección automatizada la inspección automática de: calidad en faros, tableros electrónicos, seguridad durante el traslado del vehículo, etc. En el área de la salud existen áreas tales como la inspección de catéteres, coloración de piel, detección de anormalidades en imágenes de rayos X entre otras. El presente proyecto impacta de forma directa a las líneas de Aplicación y Generación del Conocimiento (LGAC) del Cuerpo Académico de Instrumentación y Procesamiento de Señales. Dicha LGAC son instrumentación y procesamiento de señales y resulta obvio la relación de las mismas con el proyecto planteado. Por medio del mismo se pretende generar colaboraciones con diferentes instituciones del mundo que han tratado de abordar problemas similares a los referidos en el presente documento. Además, la posibilidad de integrar alumnos al proyecto ofrece una ventaja adicional, por medio de la cual se inyectan nuevas ideas de los jóvenes talentos universitarios. 8. Principales aportaciones

• Técnica para la caracterización y reconocimiento de objetos tanto en el dominio espacial como en el dominio transformado.

• Obtención y aprovechamiento de la estructura geométrica de objetos para utilizarla para el reconocimiento.

• Estudio completo de las transformadas wavelet, contourlet y bandelet. • Implementación de algoritmos de reconocimiento en software. • Mejora del desempeño de los algoritmos obtenidos por medio de su

implementación en hardware.

Page 13: Reconocimiento Automático de Objetos en el Dominio

13

• Al término del proyecto diferentes industrias se pueden ver beneficiadas, por ejemplo la industria medica, la industria de la telefonía celular, la industria médica entre otras.

9. Bibliografía 1. National Academy of Engineering, “Grand Challenges for Engineering”, disponible [online]:

http://www.nae.edu/nae/naehome.nsf, abril de 2008. 2. K. Kirkpatrick, “Object recognition”, Department of Psychology University of York, Reino

Unido, septiembre de 2001. 3. Departamento de ingeniería eléctrica de la división de estudios de postgrado de la Universidad

Nacional Autónoma de México, “Notas de visión por computadora”, UNAM, 18 de noviembre 1998.

4. K. Muneeswaran, L. Ganesan, S. Arumugam y K. Ruba Soundar, “Texture Classification

with Combined Rotation and Scale Invariant Wavelet Features”, Pattern Recognition, vol. 38, no. 10, pp. 1495 – 1506, 2005.

5. S.- C. Lo, H. Li y M. T. Freedman, “Optimization of Wavelet Decomposition for Image

Compression and Feature Preservation”, IEEE Transactions on Medical Imaging, vol. 22, no. 9, pp. 1141 – 1151, septiembre de 2003.

6. Ö. N. Gerek y A. Enis Cetin, “A 2-D Orientation-Adaptive Prediction Filter in Lifting

Structures for Image Coding”, IEEE Transactions on Image Processing, vol. 15, no. 1, pp. 106 – 111, enero de 2006.

7. M. Penedo, W. A. Pearlman, P. G. Tahoces, M. Souto y J.J. Vidal, “Region-Based Wavelet

Coding Methods for Digital Mammography”, IEEE Transactions on Medical Imaging, vol. 22 No. 10, pp. 1288 – 1296, octubre de 2003.

8. M. N. Do, Directional Multiresolution Image Representations, Tesis doctoral, laboratorio de

procesamiento de señales de la Escuela Politécnica Federal de Lausanne (EPFL), Lausanne Suiza, octubre de 2003.

9. IEEE Transactions on Image Processing, “IEEE xplore”, disponible [online]:

http://www.ieeexplore.ieee.org, abril de 2008. 10. E. J. Candès, Ridgelets: Theory and Applications, Tesis doctoral, Departamento de estadística,

Universidad de Stanford, U.S.A, 1998. 11. D. L. Donoho, “Wedgelets: Nearly - Minimax Estimation of Edges”, Annals of Statistics, vol.

27, no. 3, pp. 859 - 897, junio de 1999. 12. E. Le Pennec y S. G. Mallat, “Sparse Geometric Image Representations with Bandelets”,

IEEE Transaction on Image Processing, vol. 14, no. 4, pp. 423 - 438, abril de 2005.

Page 14: Reconocimiento Automático de Objetos en el Dominio

14

13. D. Mery, “Inspección visual automática”, Primer Congreso Internacional de Ingeniería Mecatrónica, Departamento de ingeniería informática Universidad de Santiago de Chile, Lima Perú, pp. 1 – 12, abril 2002.

14. National Instruments. Vision Builder, disponible [En línea]:

http://www.ni.com/vision/vbai.htm, U.S.A., 2005. 15. F. J. Portilla Muelas, Representación Local Multiescala de Imágenes, Modelado y Síntesis de

Texturas, Tesis doctoral, Escuela Técnica Superior de Ingenieros (E. T. S. I.) de Telecomunicación Universidad Politécnica de Madrid, enero 1999.

16. J. Ruiz Shulcloper, E. Alba Cabrera, M. Cortés Lazo y Grupo de R. P de Cuba – México,

Introducción al reconocimiento de patrones (enfoque lógico combinatorio), Departamento de ingeniería eléctrica CINVESTAV – IPN, D.F. Noviembre 1995.

17. R. C. Gonzalez y R. E. Woods, Digital Image Processing, Addison Wesley / Díaz de Santos,

U. S. A., 2000. 18. R. Ôktem, Transform Domain Algorithms for Image Compression and Denoising, Tesis de

maestría, Laboratorio de procesamiento de señales, Universidad Tecnológica de Tampere, Finlandia, mayo de 2000.

19. A. Youssef y A. Nakassis., “Lossy Compression Transforms a Lecturer Series of Data

Compression”, Instituto Nacional de Estándares y Tecnología, Gaithersburg Maryland, diciembre de 1999.

20. Mallat S. and Peyr´e G., A review of bandlet methods for geometrical image representation.

Numerical Algorithms, 44:205-234, Springer, 2007. 21. O. O. Vergara Villegas, R. Pinto Elías, P. Rayón Villela y A. Magadán Salazar, “Edge

Preserving Lossy Image Compression with Wavelets and Contourlets”, Proc. of the Electronics, Robotics and Automotive Mechanics Conference (CERMA), vol. 1, pp. 3 – 8, Cuernavaca Morelos México, septiembre de 2006.

22. D. J. Jackson y S. J. Hannah, “Comparative Analysis of Image Compression Techniques”,

Proc. of the Twenty-Fifth Southeastern Symposium on System Theory (SSST), pp. 513 – 517, Universidad de Alabama, marzo de 1993.

23. J. R. Clarke, “Image and Video Compression: A Survey”, Departamento de computación e

ingeniería eléctronica, Heriot - Watt University, Riccarton Escocia, 1999. 24. K. Dezhgosha, A. K. Sylla, y E. Ngouyassa, “Lossless and Lossy Image Compression

Algorithms for On-Board Processing in Spacecrafts”, Proc. of the IEEE National Aerospace and Electronics Conference (NAECON), vol. 1, pp. 416 – 423, Dayton, OH, USA, mayo de 1994.

25. V. Bhaskaran y K. Konstantinides, Image and video compression standards: Algorithms and

Architectures, Kluwer International Series in Engineering and Computer Science, noviembre de 1995.

Page 15: Reconocimiento Automático de Objetos en el Dominio

15

26. P. Lapsley Phil, J. Bier, A. Shoham y E. Lee, DSP Processor Fundamentals: Architectures and Features, IEEE Press, 1997.

27. C. Maxfield, The Design Warriors Guide to FPGA, Devices, Tools and Flows, Elsevier, 2004.