Upload
diego-nunez-ccallo
View
107
Download
1
Embed Size (px)
Citation preview
PROYECTO FIN DE CARRERA
RECONSTRUCCIN 3D DE
MODELOS UTILIZANDO TCNICAS DE VISIN ARTIFICIAL
AUTOR: Vil Ubieto, Karen
DIRECTORES: Arranz Domingo, lvaro
Alvar Mir, Manuel
Snchez Miralles, lvaro
MADRID, junio 2009
UNIVERSIDAD PONTIFICIA COMILLAS
ESCUELA TCNICA SUPERIOR DE INGENIERA (ICAI)
INGENIERO INDUSTRIAL
Autorizada la entrega del proyecto del alumno/a:
Karen Vil Ubieto
LOS DIRECTORES DEL PROYECTO
lvaro Arranz Domingo
Fdo.: Fecha: / /
Manuel Alvar Mir
Fdo.: Fecha: / /
lvaro Snchez Miralles
Fdo.: Fecha: / /
V B del Coordinador de Proyectos
lvaro Snchez Miralles
Fdo.: Fecha: / /
Resumen
i
Resumen
Uno de los objetivos de la visin artificial es conseguir que un ordenador
llegue a analizar una escena real como lo hara una persona. Para
conseguir este propsito, es necesario crear un modelo 3D de dicha
escena. La reconstruccin tridimensional tiene varias aplicaciones, como
la navegacin de un robot permitindole conocer en qu parte de la
escena se encuentra y poder planificar sus movimientos sin necesidad de
ayuda humana. Tambin es til para determinar magnitudes como
distancias, superficies o volmenes, lo cual puede ser aplicable para
controles de calidad ya que se pueden verificar los procesos y superficies
de los objetos que se estn fabricando. Otra aplicacin es la digitalizacin
de museos o monumentos histricos, para crear visitas virtuales a las
cuales los usuarios pueden acceder desde Internet. Estas son algunas de
las muchas utilidades existentes de la reconstruccin tridimensional y por
esta razn surge la necesidad de desarrollar este proyecto.
Lo que se pretende con este proyecto es conseguir un algoritmo que, a
partir de imgenes, llegue a crear un modelo tridimensional de un objeto.
Para conseguir dicho objetivo, en primer lugar se han estudiado las
diferentes tcnicas desarrolladas para la reconstruccin en 3D para
conocer las posibilidades existentes. Algunas de estas tcnicas como la
telemetra lser o la luz estructurada permiten reproducir modelos muy
exactos y precisos, pero con el inconveniente de emplear un equipo
costoso. Otras tienen tiempos de ejecucin muy altos como la visin
estreo densa y por ello se opt finalmente por una reconstruccin
estereoscpica dispersa basada en puntos de inters, al proporcionar una
solucin robusta y a la vez ms rpida que el resto de las tcnicas
investigadas.
A continuacin se analizaron los principales detectores de puntos de
inters (esquinas y bordes), implantando algunos de ellos como los
detectores Harris, KLT, SUSAN y CSS, para la deteccin de esquinas.
Resumen
ii
Los mejores resultados se obtuvieron con el detector de CSS, ya que es
el detector que ms esquinas del objeto detecta. Para la deteccin de
bordes se estudiaron los detectores de Roberts, Sobel, Canny y LoG
entre otros, siendo el Canny el que ms bordes reales del objeto obtena.
Todos los detectores implantados se probaron con imgenes reales para
realizar una comparacin entre ellos, atendiendo a criterios de eficacia y
rapidez.
Otro tipo de detectores estudiados fueron los que permiten la deteccin
de lneas rectas. El nico detector implantado fue el basado en
transformada de Hough, el cual se prob en distintas imgenes para
comprobar su eficacia en objetos de geometras rectas y tambin en
objetos redondeados.
Por ltimo se investig sobre la segmentacin en imgenes, ya que ste
es un paso esencial en todo proceso de reconstruccin. Se estudiaron e
implantaron algunas tcnicas, para conseguir separar un objeto del fondo
de manera ptima, como los contornos activos y k-means. Estas tcnicas
se compararon y probaron con distintas imgenes.
Ilustracin 1.Obtencin de un punto Q en el espacio.
Una vez estudiado e implementado todos los detectores de puntos de
inters y algoritmos de segmentacin, se llev a cabo la programacin de
un algoritmo que permitiera crear un modelo tridimensional. As, el
algoritmo final realiza una primera etapa de segmentacin donde separa
Resumen
iii
el objeto del fondo. De esta manera, se reduce la zona de trabajo.
Despus se procede a ejecutar un detector de esquinas, para identificar
los puntos de inters del objeto. Por ltimo se lleva a cabo la etapa de
reconstruccin en 3D, realizando una correspondencia de puntos entre las
dos imgenes para finalmente obtener sus puntos tridimensionales por un
proceso de triangulacin. Para comprobar la eficacia del algoritmo se
realizaron varias pruebas con varias imgenes tomadas por una cmara
estreo.
Los mejores resultados obtenidos con el algoritmo son con imgenes con
objetos de geometras rectas. Al tratarse de una reconstruccin
estereoscpica basada en esquinas, los resultados obtenidos con objetos
redondos no son los ptimos, puesto que estos objetos apenas contienen
esquinas. En la Ilustracin 2, se puede ver la reconstruccin de un cubo a
partir de una imagen.
Ilustracin 2. Reconstruccin 3D de un objeto.
El presente trabajo demuestra que se puede realizar un algoritmo que
reconstruya un objeto en el espacio, dejndose como trabajo futuro su
optimizacin para todo tipo de objetos. Adems constituye una importante
base para futuros desarrollos, ya que se han estudiado y comparado
muchas tcnicas para el anlisis de imgenes.
Summary
iv
Summary
One of the goals of artificial vision is to permit that a computer gets to
analyze a real scene, as a person would do. To achieve this purpose it is
necessary to create a 3D model of that scene. The three-dimensional
reconstruction has several applications, such as robot navigation, allowing
it to know in what part of the scene he is located and being able to plan its
movements without needing human help. It is also useful for determining
quantities such as distances, areas or volumes, which may be applicable
for quality controls as it can verify the processes and areas of objects that
are being manufactured. Another application is the digitization of historical
monuments and museums to create virtual tours, which users can access
from the Internet. These are some of the many uses of three-dimensional
reconstruction and for this reason there is a need to develop this project.
The purpose of this project is to obtain an algorithm that, based on
images, creates a three-dimensional model of an object. To achieve this
aim, in first place the different techniques developed about 3D
reconstruction were studied in order to know the different possibilities.
Some of these techniques such as telemetry laser or structured light
obtain models which are very accurate and precise, but with the
disadvantage of using expensive equipment. Others have very high
running times as dense stereo vision and therefore a stereoscopic
disperse reconstruction based on interest points was chosen, as it
provides a robust and faster solution than the other techniques
investigated.
Moreover, the main interest point detectors (corners and edges) were
analysed, and some were implemented such as detectors Harris, KLT,
SUSAN and CSS to detect corners. The best results were obtained with
detector CSS since it is the detector that more corners of the object
detects. For edge detection, detectors Roberts, Sobel, Canny and LoG
were studied among others, being Canny the detector that more real edge
of the object obtains. All implanted detectors were tested with real images
Summary
v
to make a comparison between them, according to efficiency and speed
criteria.
Another types of detectors studied were detectors for straight-line
detection The only detector implemented was based on the Hough
transform, which was tested on different images to verify its effectiveness
in straight line and rounded objects.
Finally segmentation in images was investigated, as this is an essential
step in every reconstruction process. Some of the techniques were studied
and implemented to obtain the separation of the object from the
background, like active contours and k-means. The different techniques
were compared and tested with different images.
Illustration 1. Obtaining the point Q in three-dimensions.
Having studied and implemented all the points of interest detection and
segmentation algorithms, the programming of an algorithm was carried out
that allowed to create a three-dimensional model.
Therefore, the final algorithm has a first stage, were a segmentation of the
image is done, separating the object from the background. In this way, the
area of detection is reduced and later on corner detection is performed.
The last step is the 3D reconstruction, where a matching between points
of the two images is done to finally obtain the tree-dimensional points by a
1. Introduccion 9
Disto rsin de lente Correccin de distorsin
Figura 1.9: Ejemplo de rectificacion de distorsion de lente.
Reconstruccion 3D
A partir de las vistas, mediante la tecnica de triangulacion, es posibleobtener un modelo 3D del objeto proyectado en las vistas. El principio
C1
C2
B
A
Q
O bjeto 3D
Vista 2
Vista 1
C entro ptico 2C entro ptico 1
Figura 1.10: Triangulacion: estimacion de Q a partir de A y B.
Summary
vi
triangulation process. To verify the efficiency of the algorithm different
tests were done with variety of images taken by the stereo camera.
The best results obtained with the algorithm are with images with objects
of straight geometries. As it a stereo reconstruction based on corners, the
results obtained with rounded objects are not son good, as these objects
dont contain so many corners. In Illustration 2, the reconstruction of a
cube is shown.
Illustration 2. 3D Reconstruction of an object.
This work shows that an algorithm can be done to reconstruct an object in
three-dimensions, leaving for future developments the optimization for all
kinds of objects. In addition it is an important basis for future
developments, as many different techniques for image analysis were
studied and compared.
DOCUMENTO N 1: MEMORIA
ndice
ii
Parte I Memoria ...................................................................................... 1Captulo 1 Introduccin......................................................................... 2
1 Introduccin..................................................................................... 21 Estudio de los trabajos existentes / tecnologas existentes....... 3
1.1 Tcnicas de reconstruccin .................................................................................31.2 Tcnicas multivistas .............................................................................................41.3 Cmara mvil o visin activa ...............................................................................51.4 Tcnicas de Luz Estructurada..............................................................................51.5 Telemetra Lser ..................................................................................................61.6 Conclusiones........................................................................................................6
2 Motivacin del proyecto ................................................................. 83 Objetivos ........................................................................................ 114 Metodologa / Solucin desarrollada........................................... 125 Recursos / herramientas empleadas........................................... 13
Captulo 2 Reconstruccin por visin estreo ................................. 141 Introduccin................................................................................... 14
1.1 Imagen digital.....................................................................................................141.2 Esquema de un sistema de visin artificial ........................................................15
2 Modelo de lente Pinhole ............................................................... 163 Visin estreo................................................................................ 194 Geometra Proyectiva ................................................................... 215 Geometra epipolar........................................................................ 226 Correspondencia estreo ............................................................. 237 Triangulacin................................................................................. 24
Captulo 3 Deteccin de Caractersticas ........................................... 261 Introduccin................................................................................... 262 Deteccin de esquinas ................................................................. 27
2.1 Harris y Stephens...............................................................................................282.2 Kanade-Lucas-Tomasi (KLT) .............................................................................302.3 Smith (SUSAN) ..................................................................................................31
ndice
iii
2.4 Curvature Scale Space (CSS) ...........................................................................322.5 Comparacin detectores de esquinas ...............................................................342.6 Conclusiones......................................................................................................43
3 Deteccin de bordes ..................................................................... 433.1 Operador Robert Cross......................................................................................453.2 Operador Sobel..................................................................................................463.3 Operador Prewitt ................................................................................................463.4 Canny.................................................................................................................463.5 LoG ....................................................................................................................503.6 Comparacin detectores de bordes ...................................................................503.7 Conclusiones......................................................................................................55
4 Lneas rectas ................................................................................. 554.1 Transformada de Hough ....................................................................................554.2 Pruebas detector de lneas rectas .....................................................................574.3 Conclusiones......................................................................................................57
Captulo 4 Segmentacin .................................................................... 591 Introduccin................................................................................... 592 Contornos Activos ........................................................................ 593 Kmeans .......................................................................................... 614 Comparacin de algoritmos de segmentacin de imgenes.... 62
Captulo 5 Algoritmo............................................................................ 701 Introduccin................................................................................... 702 Segmentacin................................................................................ 703 Deteccin de caractersticas........................................................ 714 Reconstruccin tridimensional.................................................... 72
4.1 Correspondencia estreo...................................................................................724.2 Triangulacin......................................................................................................75
Captulo 6 Matlab aplicado a visin artificial .................................... 761 Operaciones con matrices ........................................................... 76
1.1 Definicin de una matriz.....................................................................................761.2 Operadores ........................................................................................................771.3 Matrices particulares ..........................................................................................771.4 Acceso a elementos de una matriz ....................................................................77
ndice
iv
2 Programacin en MATLAB........................................................... 782.1 Sentencia if ........................................................................................................782.2 Sentencia for ......................................................................................................792.3 Sentencias while, break .....................................................................................79
3 Grficos.......................................................................................... 803.1 Plot .....................................................................................................................803.2 Plot3 ...................................................................................................................81
4 Funciones ms importantes de la Image Processing Toolbox 81
4.1 Introduccin........................................................................................................814.2 imread ................................................................................................................824.3 imwrite................................................................................................................824.4 imshow...............................................................................................................824.5 rgb2gray .............................................................................................................834.6 edge ...................................................................................................................834.7 imresize..............................................................................................................834.8 conv2..................................................................................................................834.9 imfilter.................................................................................................................834.10 immultiply .........................................................................................................84
Captulo 7 Resultados ......................................................................... 85Captulo 8 Conclusiones ..................................................................... 89Captulo 9 Futuros desarrollos........................................................... 91Bibliografa.............................................................................................. 92Parte II Manual de usuario .................................................................. 95Captulo 1 Deteccin de caractersticas ............................................ 96
1 Deteccin de esquinas ................................................................. 961.1 Detector de Harris ..............................................................................................961.2 Detector de KLT .................................................................................................971.3 Detector SUSAN ................................................................................................971.4 Detector CSS .....................................................................................................98
2 Deteccin de bordes ..................................................................... 983 Deteccin de lneas rectas ........................................................... 98
Captulo 2 Segmentacin .................................................................. 100
ndice
v
1 Contornos Activos ...................................................................... 1002 K-means ....................................................................................... 101
Captulo 3 Reconstruccin en 3D..................................................... 102
ndice de figuras
vi
FIGURA1.ROBOTMVIL ................................................................................................................................................. 9FIGURA2.MAPAEN3D................................................................................................................................................... 9FIGURA3.APLICACIONESENMEDICINA......................................................................................................................10FIGURA4.RECONSTRUCCINDEUNANFITEATRO ....................................................................................................10FIGURA5.CMARABUMBLEBEE2..............................................................................................................................13FIGURA6.IMAGENFORMADAPORPXELES ................................................................................................................14FIGURA7.EJEMPLODEIMAGENESTEREOSCPICA ....................................................................................................15FIGURA8.MODELODELACMARAPINHOLE ............................................................................................................16FIGURA9.IMAGENCONYSINDISTORSIN. ................................................................................................................18FIGURA10.MODELODEDOSCMARAS ......................................................................................................................19FIGURA11.OBTENCINDEUNPUNTOQENELESPACIO ........................................................................................20FIGURA12.GEOMETRAEPIPOLAR..............................................................................................................................23FIGURA13.DIFERENCIASENTREUNBORDEYUNAESQUINAENFUNCINDELAINTENSIDAD ..........................27FIGURA14.MSCARASDECONVOLUCIN3X3..........................................................................................................29FIGURA15.DIFERENTESMSCARASCIRCULARESENDIFERENTESPOSICIONESENLAIMAGEN........................31FIGURA16.DETECCINDEESQUINASENUNCUBODERUBIK ................................................................................37FIGURA17.DETECCINDEESQUINASDEUNAGRAPADORA....................................................................................39FIGURA18.DETECCINDEESQUINASENUNATALADRADORA...............................................................................40FIGURA19.DETECCINDEESQUINASENUNCOCHE................................................................................................42FIGURA20.CAMBIOSDEDIRECCINENLAINTENSIDADENFUNCINDELGRADIENTE .....................................44FIGURA21.MSCARASDECONVOLUCIN2X2DELOPERADORROBERTCROSS.................................................45FIGURA22.MSCARASDECONVOLUCIN3X3DELOPERADORSOBEL ................................................................46FIGURA23.MSCARASDECONVOLUCIN3X3DELOPERADORPREWITT ...........................................................46FIGURA24.EJEMPLODEIMAGENDE5X5PXELES ...................................................................................................48FIGURA25.ORIENTACINDELBORDESEGNLADIRECCINDELEJE...................................................................49FIGURA26.MSCARASDECONVOLUCINDEAPROXIMACINDELLAPLACIANO ................................................50FIGURA27.DETECCINDEBORDESENUNCUBODERUBIKCONLOSDISTINTOSDETECTORESDEBORDES ...51FIGURA28.DETECCINDEBORDESENUNAGRAPADORACONLOSDISTINTOSDETECTORESDEBORDES........52FIGURA29.DETECCINDEBORDESENUNATALADRADORACONLOSDISTINTOSDETECTORESDEBORDES ...53FIGURA30.DETECCINDEBORDESENUNCOCHECONLOSDISTINTOSDETECTORESDEBORDES ....................54FIGURA31.REPRESENTACINGRFICADELATRANSFORMADADEHOUGH(A)ENELESPACIOCARTESIANO,(B)ESPACIOPARAMTRICO ...............................................................................................................................57FIGURA32.DETECCINDELNEASRECTASENLOSDISTINTOSOBJETOS ..............................................................58FIGURA33.RESULTADOSDELASEGMENTACINDELOSOBJETOSUTILIZANDOCONTORNOSACTIVOS ............63FIGURA34.SEGMENTACINDELCUBODERUBIKUTILIZANDOKMEANSCONDISTINTONMERODECLUSTERS...............................................................................................................................................................................65FIGURA35.SEGMENTACINDEUNAGRAPADORAUTILIZANDOKMEANSCONDISTINTONMERODECLUSTERS..............................................................................................................................................................66FIGURA36.SEGMENTACINDEUNATALADRADORAUTILIZANDOKMEANSCONDISTINTONMERODECLUSTERS..............................................................................................................................................................67
ndice de figuras
vii
FIGURA37.SEGMENTACINDEUNCOCHEUTILIZANDOKMEANSCONDISTINTONMERODECLUSTERS.......68FIGURA38.IMAGENIZQUIERDADELCUBOENESCALADEGRISES..........................................................................71FIGURA39.IMAGENIZQUIERDADELCUBOSEGMENTADOPORCONTORNOSACTIVOS. .......................................71FIGURA40.IMAGENSEGMENTADADELCUBOYDETECCINDEESQUINAS. ..........................................................72FIGURA41.PUNTOSCORRESPONDIENTESENLAIMAGENDERECHA......................................................................73FIGURA42.LNEASEPIPOLARESENLAIMAGENDERECHA. .....................................................................................74FIGURA43.CORRESPONDENCIAENTREIMGENESCONFACTORDECONFIANZA. ...............................................74FIGURA44.RECONSTRUCCIN3DDEUNCUBOUTILIZANDOFACTORDECONFIANZA .......................................75FIGURA45.IMAGENESTEREOSCPICADEUNCUBO .................................................................................................85FIGURA46.RECONSTRUCCIN3DDELCUBO............................................................................................................86FIGURA47.RECONSTRUCCIN3DDELCUBODESDEOTRAVISTA. ........................................................................86FIGURA48.RECONSTRUCCIN3DDEUNCUBOUTILIZANDOFACTORDECONFIANZA .......................................87FIGURA49.IMAGENESTEREOSCPICADEUNAGRAPADORA ...................................................................................88FIGURA50.RECONSTRUCCIN3DDELAGRAPADORA ............................................................................................88
ndice de tablas
viii
TABLA1.TABLACOMPARATIVADELASDIFERENTESTCNICASDERECONSTRUCCIN ........................................ 7TABLA2.COMPARACINDELOSDETECTORESDEESQUINAS..................................................................................36TABLA3.COMPARACINDETECTORESDEESQUINASDELCUBODERUBIK ..........................................................38TABLA4.COMPARACINDETECTORESDEESQUINASENLAGRAPADORA..............................................................39TABLA5.COMPARACINDEDETECTORESDEESQUINASENUNATALADRADOR..................................................41TABLA6.TIEMPODEEJECUCINDELOSDETECTORESDEESQUINAENLAIMAGENDELCOCHE........................43TABLA7.TIEMPODEEJECUCINDELASEGMENTACINUTILIZANDOCONTORNOSACTIVOS .............................64TABLA8.TIEMPODEEJECUCINDELASEGMENTACINDELCUBODERUBIKCONKMEANS ............................65TABLA9.TIEMPODEEJECUCINDELASEGMENTACINDEUNAGRAPADORACONKMEANS ...........................66TABLA10.TIEMPODEEJECUCINDELASEGMENTACINDEUNATALADRADORACONKMEANS....................67TABLA11.TIEMPODEEJECUCINDELASEGMENTACINDEUNCOCHECONKMEANS......................................69TABLA12.COLOR,MARCADORESYESTILOSDELNEAPARALAFUNCINPLOT..................................................81
Parte I MEMORIA
Memoria. Introduccin
2
Captulo 1 INTRODUCCIN
1 Introduccin
En los ltimos aos, los algoritmos para la reconstruccin de objetos
reales en 3D han recibido atencin significativa, no slo en la visin
artificial, sino tambin como herramientas para una variedad de
aplicaciones en medicina, fabricacin, robtica, arqueologa y otros
campos que requieren modelado en tres dimensiones de ambientes
reales.
As, el objetivo principal de la reconstruccin 3D es obtener un modelo a
partir de una imagen, es decir, imitar la capacidad que tienen los seres
humanos de ver un mismo objeto en 3D cuando se le muestra una
imagen del objeto en 2D. Este objetivo se concibe como algo necesario
para conseguir un lenguaje grfico de comunicacin entre el ordenador y
el ser humano.
Algunas aplicaciones de la reconstruccin 3D se dan en el rea de
ingeniera biomdica. La reconstruccin de estructuras anatmicas a
partir de imgenes mdicas como resonancias magnticas se ha
convertido en una herramienta importante en el diagnostico mdico y la
planificacin de terapias y procedimientos quirrgicos.
Otros tipos de aplicaciones pueden ser la reconstruccin de ciudades,
edificios histricos o museos para visitas virtuales permitiendo al usuario
la visin del lugar con la sensacin de estar all.
La reconstruccin en tres dimensiones tambin puede ser utilizada en el
mbito industrial, como la creacin de modelos CAD en 3D para luego
fabricar prototipos.
En cambio, el propsito de la reconstruccin en 3D en visin artificial
permitir analizar las caractersticas de una imagen, de tal forma que se
podr detectar, localizar y reconocer objetos en imgenes. Por ejemplo, si
Memoria. Introduccin
3
se recrea un modelo tridimensional de una escena, este modelo podra
ser utilizado por un robot para navegar por la escena.
1 Estudio de los trabajos existentes / tecnologas
existentes
1.1 Tcnicas de reconstruccin
Como se ha comentado el objetivo de la visin 3D es recuperar la
informacin de profundidad o tercera dimensin a partir de imgenes.
La reconstruccin 3D es el proceso mediante el cual objetos reales son
reproducidos en un ordenador, manteniendo sus caractersticas fsicas
(dimensiones, volumen y forma). Existen diversas tcnicas de
reconstruccin, cuyo objetivo principal es obtener un algoritmo que sea
capaz de realizar la conexin del conjunto de puntos representativos del
objeto en forma de elementos de superficie. La eficiencia de las tcnicas
utilizadas define la calidad final de la reconstruccin.
Existen distintas propuestas en la literatura del proceso de reconstruccin
de objetos 3D que se podran clasificar en cinco grupos:
1. Tcnicas multivistas: permite extraer la informacin tridimensional mediante la puesta en correspondencia de las
informaciones bidimensionales procedentes de dos o ms
captadores de imagen (ver [1]).
2. Cmara mvil: denominada en alguna bibliografa como tcnicas
de visin activa, permite extraer la informacin 3D a partir del flujo de
imagen obtenido por un sensor, conocido el flujo de velocidades de
la cmara. En este caso donde los parmetros de las cmaras
cambian continuamente, y no es posible realizar una calibracin
clsica (ver [2]).
3. Tcnicas de luz estructurada: son tcnicas de visin activa en
cuanto que modifican las condiciones del entorno. La distorsin
producida por la proyeccin de patrones simples (rayos o planos),
Memoria. Introduccin
4
generados mediante luz coherente o luz lser, permite la extraccin
de la informacin tridimensional (ver [3]).
4. Telemetra lser: permiten determinar el mapa de profundidad de la escena con base al tiempo transcurrido entre la emisin y
deteccin de un pulso lser (ver [4]).
5. Control de parmetros pticos (Anlisis enfoque/ desenfoque): permiten determinar el mapa de profundidad de la escena a partir del nivel de enfoque en cada pxel de la escena (ver
[5]).
1.2 Tcnicas multivistas
El trmino multivista en visin se utiliza cuando existe ms de una vista de
una escena. A travs de varias imgenes de una escena, tomadas desde
distintos puntos de vista, se puede tener la idea de las caractersticas
tridimensionales de la escena en estudio.
Segn el nmero de imgenes que se emplee, se habla de visin bifocal
(dos imgenes o vistas), trifocal (tres imgenes o vistas), cuadrifocal
(cuatro imgenes o vistas) o n-focal (n imgenes o vistas), y en cada uno
de los casos se aplica una serie de restricciones basadas en la geometra.
La geometra de dos vistas es conocida tambin como la geometra
epipolar.
Dentro de la visin estreo tambin existen diferentes tipos de
reconstruccin: dispersa y densa, como se comenta en [6]. La
reconstruccin dispersa se basa en obtener las coordenadas
tridimensionales de ciertas partes de la escena, cuya proyeccin en las
imgenes se conocen como puntos de inters, los cuales pueden ser
bordes, esquinas u otro tipo de puntos caractersticos. Por lo general este
tipo de reconstruccin se utiliza en aplicaciones que necesitan conocer el
entorno rpidamente y sin mayor detalle, por ejemplo las aplicaciones en
tiempo real como la navegacin de robots mviles. Por el contrario la
reconstruccin densa implica obtener la totalidad de los puntos
proyectados de cada objeto de la escena. Principalmente se utiliza para
Memoria. Introduccin
5
aplicaciones relacionadas con la graficacin, realidad virtual y cualquier
otra cuyo objetivo sea modelar digitalmente de manera realista una
escena del mundo. El principal problema de este proceso es su consumo
computacional, ya que mientras la reconstruccin dispersa se centra en
puntos concretos, la densa exige una correlacin entre todos los puntos
de la imagen.
El desarrollo de las tcnicas de visin estreo ha sido objeto de un gran
esfuerzo de investigacin en los ltimos aos. El objetivo de la visin
estreo es resolver dos problemas (ver [7]): el problema de
correspondencia consistente en decidir para un punto del plano de
imagen izquierdo, que punto en el plano de imagen derecho es
correspondiente (son imgenes del mismo punto fsico). El segundo
problema es el problema de reconstruccin que trata de obtener, dados
dos puntos correspondientes en ambos planos de imagen, las
coordenadas 3D del punto en el espacio respecto a un sistema de
coordenadas del mundo (ver [8]).
1.3 Cmara mvil o visin activa
La visin activa permite la deteccin de objetos en movimiento y su
seguimiento a travs de la escena. Mediante sensores las cmaras
pueden moverse adecuadamente, de manera que exista una
correspondencia entre el mundo real y el virtual. Por lo general, se tratan
de sistemas retroalimentados que permiten obtener las imgenes de
mayor inters para realizar la reconstruccin. Adems, se pueden
controlar los parmetros de la cmara como el enfoque o el zoom. Este tipo de sistemas tienen un importante campo de aplicacin en la
robtica.
1.4 Tcnicas de Luz Estructurada
Dentro del campo de la visin tridimensional, existen un gran nmero de
tcnicas que hoy son empleadas con xito en numerosas aplicaciones
industriales. Entre todas ellas, se encuentra lo que se conoce como la luz
estructurada.
Memoria. Introduccin
6
Este tipo de sistema se caracteriza por ser un mtodo directo y activo. Un
mtodo directo se caracteriza por que se pueden obtener conclusiones
estudiando los datos obtenidos directamente de las imgenes como
comenta [9]. Adems, se trata de un sistema activo debido a que es
necesaria una fuente generadora de luz estructurada, por lo que introduce
un tipo de energa al entorno donde se realiza el estudio.
Los sistemas de luz estructurada se basan en estudiar la deformacin que
sufre un patrn de luz al ser intersecado por cualquier objeto. Este es el
problema principal de este tipo de herramientas, ya que se necesita un
tipo de luz concentrada en un punto. No valdra como sistema de
iluminacin, cualquiera de los sistemas normales que se emplean
actualmente, como bombillas o fluorescentes ya que, estn compuestos
por ondas de diferentes frecuencias provocando que el haz se difumine
por todo el entorno.
Una de las mejores soluciones es emplear un haz lser, ya que se
comporta en una luz ideal para este tipo de sistemas. Adems del patrn
de luz, es necesario tener una cmara que recoja todas las imgenes de
la deformacin del plano lser.
1.5 Telemetra Lser
La telemetra lser consiste en medir el tiempo de recorrido de un rayo
luminoso (lser) hasta la superficie de medida. Se puede medir de dos
formas: con la medida del tiempo de vuelo y el clculo por diferencia de
fase. En el primer caso los datos se obtienen midiendo el tiempo entre la
emisin del impulso luminoso y la observacin del retorno. En el segundo
se regula el impulso luminoso siguiendo una frecuencia determinada y se
mide el desfase entre el rayo emitido y la luz retornada.
1.6 Conclusiones
Las diferentes tcnicas de reconstruccin existentes presentan varias
ventajas e inconvenientes y por lo tanto dependiendo del fin de la
reconstruccin unas sern ms apropiadas que otras. La Tabla 1 muestra
una comparacin de las distintas tcnicas de reconstruccin. Las tcnicas
Memoria. Introduccin
7
de telemetra lser y luz estructurada consiguen construcciones con una
gran exactitud y precisin, pero tambin presentan varias desventajas
como el alto coste del equipo. Adems de que este tipo de tcnicas son
especialmente dependientes en la geometra del objeto y necesitan
ambientes muy controlados.
Por el contrario, la visin estereoscpica que se basa en la triangulacin
entre un punto de la escena y al menos dos proyecciones de este punto
sobre imgenes tomadas desde distintas perspectivas, es una de las
tcnicas ms utilizadas para la reconstruccin tridimensional, por su
robustez y su menor costo computacional y econmico.
Tabla 1. Tabla comparativa de las diferentes tcnicas de reconstruccin
Dentro de la visin estereoscpica, la reconstruccin dispersa permite
reducir an ms el consumo computacional. Este tipo de reconstruccin
limita la regin de estudio alrededor de posibles caractersticas de una
imagen como bordes o esquinas mientras que la reconstruccin densa
implica una comparacin de todos los puntos de las imgenes. Otra
manera de mejorar la precisin y eliminar ambigedad en el proceso de
correspondencia estereoscpica es el uso de ms de dos cmaras, sin
Mtodo Ventajas Inconvenientes
Telemetra lser
Luz estructurada Exactitud Precisin
Equipo caro Dependiente de la
geometra del objeto Ambientes
controlados
Visin estreo
dispersa Robusto Rpido Coste reducido
Menor exactitud Problemas con
ciertas texturas Sensible a
ambigedades
Visin estreo densa Reconstruccin
detallada Sensible a
ambigedades
Computacionalmente caro
Visin estreo con
n-vistas Menor error Geometra compleja Coste mayor
Memoria. Introduccin
8
embargo esto implica una mayor complejidad geomtrica y el coste de al
menos una cmara ms.
2 Motivacin del proyecto
La visin artificial constituye uno de los temas de investigacin que posee
en la actualidad un espectro ms amplio de posibles aplicaciones
industriales, y que en un futuro inmediato adquirir todava una mayor
relevancia. Muestra de ello son los mltiples esfuerzos que se dedican al
tema adems del inters que muestra la industria en estas aplicaciones.
En la actualidad, el desarrollo de nuevas tcnicas de procesamiento de
imgenes, as como la evolucin de los equipos informticos, permite
incluir la tercera dimensin como un objetivo real.
La estimacin de las coordenadas tridimensionales de un objeto en una
escena es til en muchas aplicaciones:
Control de calidad: En el control de calidad industrial se han hecho muy tiles las tecnologas tridimensionales, ya que pueden
verificar los procesos y las superficies de los objetos que se estn
fabricando.
Robots mviles: En el guiado de un robot mvil como en el de la Figura 1 se pueden aprovechar las reconstrucciones en 3D y as
poder detectar, localizar y reconocer objetos para facilitar la
navegacin por la escena.
Memoria. Introduccin
9
Figura 1. Robot mvil
Cartografa y topografa: Para la elaboracin de mapas
tridimensionales como en el de la Figura 2 e imgenes 3D de un
terreno.
Figura 2. Mapa en 3D
Memoria. Introduccin
10
Medicina: Ahora es muy comn que los ordenadores y los robots
estn ayudando a los mdicos con operaciones que antes no
podan llevarse a cabo. Adems de para las operaciones, tambin
se pueden utilizar para el estudio de enfermedades y deteccin de
tumores.
Figura 3. Aplicaciones en medicina
Modelado en 3D: En la creacin de maquetas o reconstruccin de visitas virtuales en ciudades como en el de la Figura 4, museos
Figura 4. Reconstruccin de un anfiteatro
En la reconstruccin en tres dimensiones se emplean diferentes mtodos
algunos de ellos ya mencionados anteriormente y por lo tanto lo que se
pretende en este proyecto es emplear aquellas tcnicas que mejor se
Memoria. Introduccin
11
adecuen tanto en efectividad y en velocidad en la reconstruccin de
objetos. El aspecto de la velocidad es importante, ya que en casi todas las
aplicaciones industriales se requiere que los sistemas funcionen en
tiempo real, por ello se utiliza una tcnica de reconstruccin basada en
puntos de inters que permite un menor tiempo de procesado.
Otro aspecto a tener en cuenta es el coste del equipo. Mientras que las
tcnicas de luz estructurada y telemetra lser desarrollan
reconstrucciones ms precisas y exactas, el coste de los equipos
necesarios es ms elevado.
Por tanto, la reconstruccin por visin estreo permite una solucin
robusta y rpida con un coste reducido.
3 Objetivos
El proyecto consiste en la reconstruccin de objetos basndose en el
anlisis de imgenes adquiridas desde un par de cmaras dispuestas en
forma paralela (cmaras estreo). Las cmaras utilizadas estarn
calibradas permitiendo obtener dos imgenes relacionadas entre s. A
partir de ese par de imgenes se deber generar una malla en tres
dimensiones, formada por puntos en tres dimensiones y rectas que unan
los puntos.
Por tanto los objetivos del proyecto son:
Anlisis de imgenes.
o Implantacin y comparacin de varios algoritmos de deteccin de esquinas.
o Implantacin y comparacin de varios algoritmos de deteccin de bordes.
o Implantacin y comparacin de varios algoritmos de deteccin de zonas de inters y/o segmentacin.
Reconstruccin en 3D de varios objetos sencillos (con aristas
rectas) a travs de imgenes, utilizando los algoritmos de
deteccin anteriormente implantados.
Memoria. Introduccin
12
4 Metodologa / Solucin desarrollada
Para llevar a cabo la reconstruccin, se realizarn las siguientes tareas:
Obtencin de imgenes: Se capturarn imgenes con la cmara estreo de diferentes objetos. Dichos objetos tendrn geometras
de creciente dificultad.
Deteccin de esquinas: Se buscarn varios algoritmos que sean
capaces de detectar las esquinas de las imgenes escogidas.
Adems de la implantacin de algunos de ellos en Matlab. Una vez
implantados se llevar a cabo un anlisis comparativo teniendo en
cuenta la calidad de los puntos detectados y el tiempo de
ejecucin. La deteccin de esquinas se aborda en la seccin de
Deteccin de esquinas dentro del Captulo 3, donde se explican los
distintos algoritmos y se muestran las imgenes de prueba.
Deteccin de bordes o aristas: Se investigarn los posibles
algoritmos capaces de detectar los bordes de las imgenes
escogidas. Adems de la implantacin de algunos de ellos en
Matlab. Se realizar una comparacin de los distintos algoritmos
atendiendo a criterios de calidad y tiempo de procesado. Este tipo
de deteccin se explica en la seccin Deteccin de Caractersticas
en el Captulo 3.
Deteccin de puntos de inters: Se analizar el estado del arte en este campo y se proceder a implantar los algoritmos ms
importantes. A continuacin se har una comparativa de los
distintos algoritmos. Entre las zonas de inters se estudia la
deteccin de lneas rectas en la seccin Lneas rectas en el
Captulo 3. Por el contrario la segmentacin de imgenes se
explica en un captulo aparte, Captulo 4.
Por ltimo, se realizar una reconstruccin en tres dimensiones de los
objetos utilizando los algoritmos encontrados que mejores resultados
obtengan. El algoritmo final se trata en el Captulo 5.
Memoria. Introduccin
13
5 Recursos / herramientas empleadas
El objetivo principal del proyecto es realizar un programa capaz de crear
una maya en tres dimensiones con la geometra de un objeto obtenido
con imgenes desde una cmara estreo.
Para conseguir esto se utilizar el programa Matlab especialmente la
librera de Image Processing. Tambin se emplear Simulink con la
librera Video and Image Processing.
La adquisicin de las imgenes a reconstruir se realizar con una cmara
estreo, estando las dos cmaras en paralelo y con una resolucin de
1024x768 pxeles. La cmara estreo empleada fue el modelo
Bumblebee2 como se muestra en la Figura 5.
Figura 5. Cmara Bumblebee 2
Memoria. Reconstruccin por visin estreo
14
Captulo 2 RECONSTRUCCIN POR VISIN
ESTREO
1 Introduccin
1.1 Imagen digital
Una imagen digital est compuesta por una matriz de elementos
rectangulares, denominados pxel y por lo tanto cada imagen digital est
compuesta de una matriz de pxeles (M x N) como muestra la Figura 6.
Figura 6. Imagen formada por pxeles
En imgenes en escala de grises se tienen todos los tonos de grises entre
blanco y negro, y por lo general se utilizan 256 tonos de escala de grises
para definir la imagen (8 bits), siendo el negro puro el 0 y el blanco el 255.
En el caso del color existen varios modelos para representarlo
digitalmente. Los ms utilizados en imagen digital son el modelo aditivo
(RGB = Red, Green, Blue) y el substractivo (CMYK = Cian, Magenta,
Yellow, Black). El modelo RGB forma todos los colores del espectro
Memoria. Reconstruccin por visin estreo
15
visibles mediante la mezcla de los tres colores bsicos, rojo, verde y azul,
en distinta intensidad y proporcin, por esta razn se denominan colores
aditivos. Por tanto, cada pxel en una imagen RGB est representado por
un conjunto de tres componentes.
1.2 Esquema de un sistema de visin artificial
El esquema bsico de un sistema de visin artificial es una cmara que
captura imgenes del mundo real, conectada a un ordenador que har los
clculos necesarios, mostrando al usuario el resultado mediante una
pantalla. El proceso de anlisis de la imagen consta de varias etapas:
adquisicin de la imagen, preprocesamiento, segmentacin, extraccin de
caractersticas, interpretacin o clasificacin.
Adquisicin de la imagen: se obtiene la imagen adecuada del objeto en estudio (ver Figura 7).
Figura 7.Ejemplo de imagen estereoscpica
Preprocesamiento: con el fin de mejorar la calidad de la imagen obtenida se emplean ciertos filtros digitales que eliminan el ruido en
la imagen.
Segmentacin: se identifican el objeto u objetos a estudiar. Extraccin de caractersticas: se detectan los atributos de inters
del objeto a estudiar. Interpretacin: por ltimo se lleva cabo una interpretacin del
objeto que en el caso de este proyecto se tratara de la propia
reconstruccin tridimensional del mismo.
Memoria. Reconstruccin por visin estreo
16
2 Modelo de lente Pinhole
Matemticamente, una cmara puede modelarse como una funcin de
transformacin que convierte puntos 3D a 2D. El modelo Pinhole suele
ser el habitual para modelar cmaras digitales y se muestra en Figura 8.
Un punto M en 3D se proyecta en el plano de la imagen a travs del
centro ptico C. El centro ptico se encuentra a una distancia del plano de
la imagen denominada distancia focal f.
El eje ptico de la Figura 8 es la recta que pasa por el centro ptico C y es
perpendicular al plano de la imagen. Por lo general, el centro ptico suele
estar entre el objeto y el plano de la imagen, sin embargo en algunas
ocasiones puede estar detrs del plano de la imagen.
Figura 8. Modelo de la cmara Pinhole
La lnea que une dos centros pticos se llama lnea base.
Un punto 3D M es proyectado en el plano de imagen como m. Este punto
m es la interseccin de la recta formada por los puntos C y M con el plano
de la imagen.
Si M= (X,Y,Z)T y m=(x,y)T se puede obtener una relacin:
Memoria. Reconstruccin por visin estreo
17
Ecuacin 1
donde la matriz
f 0 0 00 f 0 00 0 1 0
se llama matriz de perspectiva.
Otro aspecto a tener en cuenta es que, normalmente, los puntos de una
escena se representan en el sistema de coordenadas del mundo y no en
el de la cmara. Por lo tanto es necesario hacer una transformacin que
convierta coordenadas del mundo en coordenadas de la cmara (las
coordenadas de la cmara son las referidas a un sistema de referencia
con centro en el centro ptico de dicha cmara). Esta transformacin, se
trata de una rotacin y una traslacin que se representa mediante una
matriz llamada matriz de parmetros extrnsecos:
XYZ1
=
r11 r12 r13 txr21 r22 r23 tyr31 r32 r33 tz0 0 0 1
X 'Y 'Z '1
Ecuacin 2
siendo (X,Y,Z)T las coordenadas de la cmara y (X,Y,Z)T las
coordenadas del mundo.
La relacin entre las coordenadas de la cmara (X,Y,Z)T y las centrales de
la imagen (x,y) viene definido como:
nxnyn
=
f 0 0 00 f 0 00 0 1 0
XYZ1
Ecuacin 3
!
x
f=X
Z
y
f=Y
Z
"
# $ $
% $ $
&
nx
ny
n
'
(
) ) )
*
+
, , ,
=
f 0 0 0
0 f 0 0
0 0 1 0
'
(
) ) )
*
+
, , ,
-
X
Y
Z
1
'
(
) ) ) )
*
+
, , , ,
Memoria. Reconstruccin por visin estreo
18
Por ltimo, se debe mencionar la distorsin geomtrica causada por las
imperfecciones en la fabricacin y montaje de las lentes de la cmara, su
efecto es el mostrado en la Figura 9 . Esta distorsin se debe de tener en
cuenta porque afecta a los puntos del plano de la imagen:
xd = x + Dx (x,y)yd = y + Dy (x,y)
Ecuacin 4
La funcin de distorsin obtiene la imagen real a partir de la imagen ideal.
Figura 9. Imagen con y sin distorsin.
Para obtener las coordenadas laterales de la imagen en necesaria la
matriz K, llamada matriz de calibracin de la cmara.
x f = Kxxd + Cxy f = Kyyd + Cy
Ecuacin 5
En conclusin, un punto M=(X,Y,Z)T es proyectado en la imagen como
m=(xf,yf)T de tal manera que el modelo final que relaciona ambas
coordenadas sin distorsin es la Ecuacin 6.
Memoria. Reconstruccin por visin estreo
19
nx fny fn
=
Kx f 0 Cx 00 Ky f Cy 00 0 1 0
r11 r12 r13 txr21 r22 r23 tyr31 r32 r33 tz0 0 0 1
X 'Y 'Z '1
Ecuacin 6
Siendo los parmetros de la matriz de la izquierda de la Ecuacin 6
Kx f 0 Cx 00 Ky f Cy 00 0 1 0
los parmetros extrnsecos y los de la matriz de la
derecha
r11 r12 r13 txr21 r22 r23 tyr31 r32 r33 tz0 0 0 1
los parmetros intrnsecos. La multiplicacin de
ambas, resulta en la denominada matriz de proyeccin.
3 Visin estreo
Se conoce como visin estreo al empleo de dos o ms cmaras para
recuperar la informacin de profundidad de un objeto. Por lo general se
suele emplear un modelo de dos cmaras como el mostrado en Figura 10.
Figura 10. Modelo de dos cmaras
Se define como centro ptico al punto situado a una distancia igual a la
distancia focal del plano de la imagen y que permite proyectar la
informacin 3D en el plano de la imagen. La idea general es que sabiendo
que los puntos A y B de la Figura 11 son proyecciones de un mismo punto
tridimensional Q y conociendo los centros pticos de la proyeccin C1 y
Memoria. Reconstruccin por visin estreo
20
C2, se puede encontrar el punto Q a partir de la interseccin entre las dos
rectas y .
Figura 11. Obtencin de un punto Q en el espacio
La visin estereoscpica consta de las siguientes etapas:
Establecimiento de correspondencias: empareja en las
diferentes imgenes aquellos puntos 2D procedentes de un punto
3D comn.
Calibracin de las cmaras: una cmara se calibra mediante la determinacin de los parmetros intrnsecos y extrnsecos. Los
parmetros intrnsecos son aquellos que permiten describir la
geometra y ptica del conjunto cmara y tarjeta de adquisicin de
imgenes. Mientras que los parmetros extrnsecos son los que
describen la orientacin y posicin de la cmara, respecto a un
sistema de coordenadas conocido que se suele denominar sistema
de coordenadas mundo
Reconstruccin: determina por triangulacin la profundidad de los puntos del objeto en escena, recuperando la tercera dimensin
perdida durante el proceso de adquisicin de la imagen.
1. Introduccion 9
Disto rsin de lente Correccin de distorsin
Figura 1.9: Ejemplo de rectificacion de distorsion de lente.
Reconstruccion 3D
A partir de las vistas, mediante la tecnica de triangulacion, es posibleobtener un modelo 3D del objeto proyectado en las vistas. El principio
C1
C2
B
A
Q
O bjeto 3D
Vista 2
Vista 1
C entro ptico 2C entro ptico 1
Figura 1.10: Triangulacion: estimacion de Q a partir de A y B.
Memoria. Reconstruccin por visin estreo
21
4 Geometra Proyectiva
Existen dos tipos diferentes de geometras principales que se utilizan para
la reconstruccin, la Proyectiva y la Euclidiana.
La Geometra Euclidiana es un subconjunto de lo que se conoce como
Geometra Proyectiva. La geometra Proyectiva modela adecuadamente
el proceso de la proyeccin de imagen de una cmara fotogrfica porque
permite a parte de traslaciones y rotaciones, transformaciones en las
proyecciones de la perspectiva.
Si se supone un punto (x1,x2) en el plano Euclidiano, para representar ese
mismo punto en el plano Proyectivo hay que aadir una tercera
coordenada con un 1 al final (x1,x2,1).
El punto (x1,x2,1) ser el mismo punto que (nx1,nx2,n), siendo n el llamado
parmetro proyectivo y por lo tanto se podra definir el punto como
(nx1,nx2,nx3),
Si una recta en el plano Euclidiano se define como
ax1 + bx2 + c = 0
Ecuacin 7. Recta en el plano Euclidiano
en el plano proyectivo se obtendra
ax1 + bx2 + cx3 = 0
Ecuacin 8. Recta en el plano proyectivo
donde
lT x = xT l = 0
Ecuacin 9
siendo una recta
l = [a,b,c]T y un punto
x = [x1,x2,x3]T perteneciente a esa recta, de tal forma que existe una dualidad entre puntos y rectas, es decir,
los puntos y rectas tienen la misma representacin en el plano proyectivo.
Memoria. Reconstruccin por visin estreo
22
Para que un punto pertenezca a una recta en el plano proyectivo debe
satisfacer la Ecuacin 9.
Por tanto se pueden transformar rectas en puntos y puntos en rectas
donde:
l = Fx
Ecuacin 10
Adems, dadas dos rectas
l = [a,b,c]T y
l'= [a',b',c']T si se desea saber el punto de interseccin entre ambas se calcula como:
m = l l' Ecuacin 11
La recta que pasa por dos puntos x1, x2 queda definida por:
l = x1 x2
Ecuacin 12
Para transformar un punto en el plano proyectivo de nuevo al plano
Euclidiano solo es necesario dividir por la tercera coordenada.
5 Geometra epipolar
La geometra de dos vistas es conocida como la Geometra Epipolar. Un
punto M en el espacio es representado en dos imgenes como dos
puntos proyectados m1y m2. Los centro pticos de cada imagen C1 y C2
respectivamente como se presenta en la Figura 12(a). A partir de uno de
los puntos proyectados en las imgenes no se puede determinar M, sin
embargo se puede saber que el punto M debe estar en la recta que va
desde el centro ptico C1 hasta m1, como se ve en la Figura 12(b). Para
determinar el punto m2, se proyectan los posibles puntos de la recta entre
C1 y m1 (ver Figura 12(c)). Uno de los puntos proyectados ser m2, sin
embargo no se puede saber exactamente la ubicacin, solo que m2
pertenece a la proyeccin de la recta formada por C1 y m1. La proyeccin
de esta recta en la imagen se denomina recta epipolar y se puede
observar en la Figura 12(d).
Memoria. Reconstruccin por visin estreo
23
Figura 12. Geometra epipolar
A pesar de que no se pueda conocer el punto m2, es de gran utilidad
saber que el punto correspondiente a m1 en la segunda imagen est
sobre una lnea y no en cualquier zona de la imagen.
6 Correspondencia estreo
Se trata de encontrar el punto de la imagen izquierda en la imagen
derecha. La matriz fundamental F permite hallar la recta epipolar en una
imagen conocido un punto en la otra imagen. Esta matriz es constante
para una geometra bifocal dada, no depende ni de m1 y m2 ni M. Por
tanto conocido un punto en la imagen izquierda se obtiene la recta
epipolar en la imagen derecha, de tal forma que se reduce
significativamente la zona de bsqueda del punto en la imagen derecha.
Sin embargo an hay que realizar una bsqueda por la lnea epipolar.
Existen varios mtodos para obtener la correspondencia que se pueden
dividir en locales y globales.
Los mtodos globales aplican restricciones a la imagen entera. Por lo
general, estos mtodos suelen ser robustos. Adems se obtienen buenos
resultados, pero son computacionalmente costosos.
62 D.Mery: Vision Artificial
termino epipolar viene del griego epi (!`pi) que significa sobre, encima, ypolos (pioo) cuyo significado es punto de atraccion o uno de los dos puntosde una esfera que son intersectados por su eje de rotacion. La GeometraEpipolar lleva este nombre porque, como se vera mas adelante, a cada unade las dos imagenes se le asocia un epipolo.
La geometra de dos vistas es presentada en la Figura 4.1. Un punto 3DM es visto en las dos imagenes como m1 y m2 (ver Figura 4.1a). Como seestudio en el captulo anterior, la imagen es definida como la proyeccion delespacio 3D en un plano de imagen 2D por medio de un centro optico. Loscentros opticos en este caso son C1 y C2. A partir de m1 solamente no sepuede saber exactamente la ubicacion exacta de M , ya que en el procesode proyeccion se ha perdido la informacion de profundidad. Sin embargo, se
Imagen
1
Imagen 2
lnea epipolar
Imagen
1
Imagen 2
Imagen
1
Imagen 2
Imagen
1
Imagen 2
(d)(c)
(a) (b)
Figura 4.1: Geometra epipolar.
Memoria. Reconstruccin por visin estreo
24
En cambio, los mtodos locales emplean restricciones en los puntos
alrededor del que se desea evaluar. La desventaja de utilizar mtodos
locales es que generalmente obtienen falsas correspondencias sobretodo
en zonas donde las intensidades del punto son muy parecidas o cuando
puntos en la imagen izquierda no aparecen en la imagen derecha o
viceversa. Por el contrario estos mtodos son fciles de implantar y ms
rpidos que los globales.
Dentro de los locales existen los basados en caractersticas y los basados
en reas. El mtodo basado en rea es el que se emple para la
reconstruccin. Este mtodo utiliza la medida de correlacin para evaluar
la similitud entre un punto en la imagen izquierda y el posible
correspondiente en la derecha. Para ello se recorre la recta epipolar en la
imagen derecha y se calcula la correlacin en funcin de los valores de
intensidad de un vecindario del punto utilizando la suma normalizada de
diferencias al cuadrado. Al realizar la bsqueda en la lnea epipolar, puede ocurrir que existan varios puntos en la zona de la imagen de la derecha que se parezcan a los de la zona de la imagen de la izquierda. Si se define un factor que mida la similitud entre zonas, denominado factor de confianza, si hay varias zonas que se parecen, el factor de confianza ser cero. Esto es equivalente a que la funcin de correlacin a lo largo de la recta tiene varios mnimos locales que son comparables.
Para obtener mejores resultados, una vez que se determina el punto de la recta, se hace una bsqueda local del mximo en un cuadrado centrado en el punto. Si todos los puntos de la zona de bsqueda tienen un valor de correlacin parecido, se tratar de una zona sin texturas, con lo cual el factor de confianza ser pequeo. El factor de confianza permite determinar como de parecidos son los dos puntos hallados.
7 Triangulacin
Por ltimo, obtenidos los dos puntos en las dos imgenes se lleva a cabo
el proceso de triangulacin. La triangulacin es el proceso de encontrar
un punto tridimensional M a travs de sus proyecciones m1 y m2. Para
Memoria. Reconstruccin por visin estreo
25
ello, se debe encontrar el punto de corte de las rectas formadas por los
puntos m1 y m2 , y sus respectivos centros pticos. Dicho punto de corte
ser el punto tridimensional M. Generalmente, las rectas se cruzan en el
espacio y por lo tanto no existe solucin exacta. Para ello, se emplear la
tcnica de los mnimos cuadrados para obtener un punto de corte
aproximado.
Memoria. Deteccin de Caractersticas
26
Captulo 3 DETECCIN DE CARACTERSTICAS
1 Introduccin
En procesamiento de imgenes, el concepto de deteccin de
caractersticas se refiere a la obtencin de informacin de la imagen. Las
caractersticas resultantes sern subconjuntos del dominio de la imagen,
a menudo bajo la forma de puntos aislados, curvas continuas o regiones
conectadas.
Aunque no existe una definicin exacta de qu constituye una
caracterstica, se puede definir, como una parte interesante de una
imagen (interest point). Se suelen usar como punto de partida para
muchos algoritmos de visin por ordenador.
Debido a que el algoritmo se basa en dichas caractersticas, el algoritmo
ser tan bueno como sea su detector. Otra cosa a tener en cuenta, es que
un buen detector de caracterstica debe detectarla misma caracterstica
en dos o ms imgenes diferentes de la misma escena, es decir, una de
las propiedades que debe tener un detector de caractersticas es la
repetibilidad o repeticin.
Otras propiedades que debe tener un detector de caracterstica es
exactitud (ya que debe detectar la caracterstica en el pxel correcto) y
estabilidad (debe detectar la caracterstica despus de que la imagen
haya sufrido algn tipo de transformacin geomtrica como rotacin o
cambio de escala).
Existen varios detectores de caractersticas ya desarrollados, que varan
en el tipo de caracterstica a detectar, la complejidad computacional y la
repetibilidad. Estos detectores se pueden dividir en varios grupos siendo
los ms importantes los detectores de esquinas, de bordes y de lneas
rectas.
Memoria. Deteccin de Caractersticas
27
2 Deteccin de esquinas
Las esquinas en imgenes representan informacin til y son muy
importantes para describir objetos para su reconocimiento e identificacin.
Una esquina puede ser definida como la interseccin de dos bordes. Una
esquina tambin puede ser definida como un punto en el que hay dos
bordes con direcciones distintas y dominantes en la zona cercana al
punto. Otra forma de definir una esquina es como una zona donde las
variaciones de intensidad en las direcciones x e y son grandes o dicho de
otra manera una regin donde la intensidad vara en ambas direcciones.
Por el contrario, en un borde la intensidad slo vara en una direccin
como se ve en la Figura 13.
Un detector de esquinas requiere que se cumplan determinados
requisitos. En primer lugar, todas las esquinas verdaderas deben ser
detectadas y ninguna esquina falsa. En segundo lugar, las esquinas
detectadas tienen que estar correctamente localizadas. Adems el
detector debe tener repetibilidad (estabilidad), ser robusto ante ruido y ser
computacionalmente eficiente.
Para la deteccin de esquinas en imgenes existen numerosos
detectores, de los cuales aqu se van a tratar slo algunos: Harris y
Stephens, Kanade-Lucas-Tomasi (KLT), SUSAN y CSS.
Zona lisa: no hay
cambios en ninguna
direccin
Borde: slo hay cambio
de intensidad en una sola
direccin
Esquina: cambio de
intensidad en ambas
direcciones
Figura 13.Diferencias entre un borde y una esquina en funcin de la intensidad
Memoria. Deteccin de Caractersticas
28
2.1 Harris y Stephens
Este algoritmo propuesto por Harris y Stephens como se puede ver en
[10] es uno de los ms usados, y se basa en la idea de Moravec en [11]
de que una esquina est caracterizada por elevados cambios de
intensidad.
El algoritmo de Moravec, fue uno de los primeros algoritmos de deteccin
de esquinas. ste comprueba cada pxel en la imagen para ver si es una
esquina, teniendo en cuenta cmo de parecida es una ventana centrada
en el pxel con otras ventanas superpuestas centradas en pxeles
cercanos.
La similitud se mide tomando la suma de las diferencias al cuadrado
(SSD) entre las dos ventanas. Un nmero menor indica ms similitud.
Si el pxel se encuentra en una regin de intensidad uniforme entonces
las ventanas cercanas sern similares. Si el pxel est en un borde
entonces ventanas cercanas en una direccin perpendicular al borde
sern muy diferentes.
El detector de Harris es uno de los detectores de esquinas ms populares
debido a su invariancia a los cambios en rotacin, escala, iluminacin y
ruido.
El mtodo de Harris se basa en el clculo de la matriz de correlacin
estimada por las derivadas de primer orden para cada pxel, definida por
la matriz C de la Ecuacin 13:
C =
Ix
2
Ix
Iy
Ix
Iy
Iy
2
Ecuacin 13. Matriz de Correlacin
siendo I(x,y) la intensidad en nivel de grises .
Memoria. Deteccin de Caractersticas
29
Para calcular los gradientes se utilizan mscaras de convolucin 3x3,
siendo estas mscaras las de la Figura 14.
Figura 14.Mscaras de convolucin 3x3
En este detector la matriz C por lo general es suavizada con un filtro
gausiano
wG ()con desviacin tpica
, ya fijado.
Si se analizan los autovalores de la matriz, se puede determinar si el
punto es una esquina, un borde o ninguno de los dos. Al ser la matriz C
simtrica y semidefinida positiva, sus dos autovalores son positivos. Si en
un determinado punto los dos autovalores de la matriz C son grandes,
esto implica que cualquier cambio en cualquier direccin implica un
importante cambio de intensidad, y por lo tanto el punto ser una esquina.
Si por el contrario, slo uno de los autovalores es grande y el otro
pequeo, el punto ser un borde. Por ltimo si ambos autovalores son
pequeos, entonces el punto estar en una zona plana.
Se define el parmetro de deteccin de Harris como:
R = detC k(trazaC)2
Ecuacin 14. Parmetro de Harris
donde k es un parmetro de sensibilidad ajustable que se establece a
0,04 (sugerido por Harris).
El clculo de este parmetro hace que no sea necesario calcular los
autovalores explcitamente ya que es computacionalmente costoso. Para
ello es necesario determinar un lmite de R, de tal forma que el punto ser
Memoria. Deteccin de Caractersticas
30
una esquina si el parmetro de deteccin de Harris es mayor que el lmite
establecido.
En este mtodo, el nico parmetro que hay que considerar es el lmite de
R.
2.2 Kanade-Lucas-Tomasi (KLT)
El detector de esquinas Kanade-Lucas-Tomasi(KLT) expuesto en [12] y
[13] fue propuesto varios aos despus que el detector de Harris.
Este detector tambin se basa en clculo de la matriz C, como el detector
de Harris. Sin embargo en este caso s se calculan explcitamente los
autovalores.
Existen dos parmetros, el lmite del autovalor
2 y el tamao D de la
ventana DxD. El algoritmo se puede describir de tal forma que para cada
punto p de la imagen se calcula los autovalores de la matriz C,
considerando slo el autovalor
2 . A continuacin se busca el menor
autovalor
2 en el vecindario D del punto p, en el caso que dicho
autovalor
2 sea mayor que el lmite establecido, el punto p se pone en
una lista L de posibles esquinas.
Para evitar solapes, la lista L se pone en orden decreciente, de tal forma
que para cada punto p de la lista, los puntos que estn dentro del
vecindario DxD y tengan menor autovalor son eliminados.
El detector KLT detecta una lista de puntos que cumplen que
2 es mayor
al lmite y adems que el vecindario DxD de estos puntos no se solapan.
El lmite de
2 se puede estimar con un histograma de
2 , mientras que el
tamao del vecindario D suele estar entre 2 y 10.
Uno de los problemas que pueden surgir es que si se toman valores muy
grandes de D, las esquinas detectadas pueden moverse de la posicin
real.
Memoria. Deteccin de Caractersticas
31
2.3 Smith (SUSAN)
Smith desarroll un detector de esquinas en [14] basado en una idea muy
simple y completamente distinta al resto de los algoritmos ya existentes,
sin usar ninguna derivada.
SUSAN(Smallest Univalue Segment Assimilating Nucleus) detecta
esquinas y bordes y adems es ms resistente al ruido a pesar de que no
se requiere ningn filtrado. Cada pxel en la imagen es utilizado como el
centro de una mscara circular (normalmente se utiliza una mscara de
37 pixeles utilizando una ventana cuadrada de 5x5 con 3 pixeles a cada
lado).
Los valores de la escala de grises de la mscara circular son comparados
con el del pxel central, denominado ncleo.
Todos los pxeles con intensidad similar al ncleo son considerados como
parte de la misma estructura en la imagen como se puede ver en la Figura
15.
Figura 15. Diferentes mscaras circulares en diferentes posiciones en la imagen
Smith denomina a la parte oscura de la mscara the Univalue Segment
Assimilating Nucleus(USAN) como se puede observar en la Figura 15. El
USAN correspondiente a una esquina, es aquel cuya rea USAN es
menor que la mitad del rea total de la mscara (caso (a) en la Figura 15).
Memoria. Deteccin de Caractersticas
32
La intensidad del ncleo de la mscara es comparada con la intensidad
del resto de los otros pxeles que forman la mscara mediante la siguiente
funcin:
c(r,r0) =100eI (r)I (r0 )
t
6
Ecuacin 15. Comparacin de las intensidades
donde
r0 es la posicin del ncleo, r la posicin de cualquiera de los otros puntos de la mscara, I(r) es la intensidad de cualquier pxel y t es el
umbral de intensidad (brightness difference threshold).
Esta comparacin se realiza con todos los pixeles de la mscara circular,
siendo el total la Ecuacin 16.
n = c(r,r0)r
Ecuacin 16.
Un pxel se considera esquina si su rea USAN, n, es menor que la mitad
del rea USAN mxima posible (esta rea es 3700).
Finalmente, se crea una matriz/imagen intermedia, si n es mayor que el
umbral geomtrico g, entonces se pone un 0 en la imagen intermedia y
sino el valor de n.
Por ltimo se busca el mximo local de la matriz intermedia en una
ventana 5x5, siendo declaradas esquinas los pixeles que sean mximos
locales.
Para evitar esquinas falsas se calcula el centroide de los USAN,
calculando la distancia del centro de gravedad al ncleo. Por lo general,
una esquina verdadera tendr un centro de gravedad lejano al ncleo.
2.4 Curvature Scale Space (CSS)
Inicialmente el algoritmo CSS fue propuesto por Mokhtarian and Suomela
en [15] y [16], donde propusieron que las esquinas fueran localizadas en
multi-escala, mientras que su deteccin segua siendo en una escala.
Memoria. Deteccin de Caractersticas
33
Este algoritmo tena dos problemas: el primero era que si el parmetro
(desviacin tpica de la funcin gausiana, utilizada para calcular las
derivadas) era muy grande no detectaba esquinas verdaderas y el
segundo era que si era muy pequeo detectaba esquinas falsas. Tambin
exista el problema del umbral t, ya que ste era muy sensible.
El algoritmo utilizado fue un detector basado en el detector de esquinas
CSS, que en vez de utilizar un umbral global emplea un umbral adaptativo
local (adaptive local curvature threshold) desarrollado en [17].
El CSS original aplica un detector de bordes y extrae los contornos de los
bordes, uniendo los huecos entre los contornos y buscando las uniones
en T. Despus de extraer los bordes, se calcula la curvatura a una escala
alta, para cada contorno, siendo la definicin de curvatura:
(u, ) = X (u, ) Y (u,) X (u,) Y (u, )
X (u,)2 Y (u,)2( )1,5
Ecuacin 17.Clculo de la curvatura
Donde
X (u, ) = x(u) g (u,) ,
Y (u, ) = y(u) g (u,) ,
X (u, ) = x(u) g (u,) ,
Y (u, ) = y(u) g (u,) ,
es el operador
convolucin,
g(u, ) es la funcin gaussiana con desviacin tpica
y
g (u, ),
g (u, ) sus derivadas de primer y segundo orden.
A continuacin se localizan las esquinas utilizando escalas inferiores para
mejorar su localizacin y se comparan las esquinas marcadas como
uniones en T. Por ltimo se eliminan las esquinas cerradas.
El procedimiento utilizado con un umbral adaptativo local es muy similar al
original. En primer lugar se extraen los contornos o bordes de la imagen
con el detector de bordes Canny, obteniendo una imagen binaria.
A continuacin se unen los huecos entre contornos y se extraen los
contornos.
Se calcula la curvatura de todos los contornos a baja escala,
considerando los mximos locales de la curvatura como candidatos a
Memoria. Deteccin de Caractersticas
34
esquinas. Entre estos candidatos, se compara la curvatura con un umbral
local(adaptive threshold), en vez de global para eliminar las esquinas
redondeadas.
El umbral es calculado en funcin de la curvatura de la vecindad:
T(u) = C =1.5 1L1+ L2 +1 (i)i= uL 2
u+L 2
Ecuacin 18. Clculo del umbral local
donde
es la curvatura de la vecindad, u es la posicin de la posible
esquina en la curva, L1 y L2 son el tamao de ROS (regin definida
desde la mnima curvatura local de la vecindad hasta la siguiente, donde
la curvatura estrictamente decrece de la posible esquina a ambos lados) y
C es un coeficiente(normalmente vale 1,5).
Finalmente se comprueban los ngulos de los candidatos, para eliminar
cualquier esquina debida a ruido.
2.5 Comparacin detectores de esquinas
En primer lugar aunque sea haya definido el concepto de esquina, no
existe una definicin matemtica comnmente aceptada.
No existe ningn detector de esquinas preciso como se comenta en [18],
es decir que detecte todas las esquinas correctamente y no detecte falsas
esquinas.
Cabe destacar que el propsito de un detector de esquinas es que
muestre puntos que sean de inters.
Los cuatro mtodos descritos en las secciones previas son claras
representaciones de distintos tipos de detectores, que se basan en
distintas ideas. Harris y Stephens (Plessey) junto a Kanade-Lucas-Tomasi
(KLT) utilizan el clculo y las intensidades de la imagen para detectar
cambios importantes en las derivadas de primer orden.
Memoria. Deteccin de Caractersticas
35
Por el contrario, SUSAN se centra en el rea local, comprobando la
similitud de intensidad y el CSS utiliza un mtodo que se basa en el
clculo de la curvatura.
En primer lugar, Harris emplea una funcin para no tener que calcular los
autovalores, ya que son computacionalmente costosos y utiliza un umbral
explcito, mientras que KLT calcula los autovalores y emplea un umbral
implcito.
Comparado con los dems detectores, el detector de Harris es el ms
sencillo de implantar, pero sin embargo proporciona peores resultados.
Esto se debe al hecho de que no utiliza informacin del resto de la imagen
y opera solo en la vecindad del pxel a examinar. Adems a pesar de usar
un filtro gausiano, no es muy robusto al ruido.
Algunas bibliografas como en [19] afirman que el detector de Harris
proporciona buena repetibilidad en variaciones de rotacin e iluminacin,
sin embargo al implantar el algoritmo los resultados obtenidos no han sido
muy buenos.
KLT tiene el mismo problema que el algoritmo de Harris ya que se centra
en la vecindad del pxel a considerar, pero calcula explcitamente los
autovalores de la matriz local, lo que resulta en un algoritmo bastante
lento, ya que debe calcular dos autovalores para cada pxel de la imagen.
Las imgenes muy grandes tardan mucho tiempo en ser procesadas, por
el contrario, se puede decir que en general los resultados obtenidos son
buenos, las esquinas de la imagen son detectadas, pero algunos puntos
son detectados como falsas esquinas.
El mtodo SUSAN prometa ser un buen detector de esquinas, sin
embargo al llevar a cabo su implementacin los resultados no fueron los
esperados. Se podra considerar este mtodo como mejor detector de
bordes que de esquinas. La ejecucin del algoritmo es rpida, pero no
detecta muchos puntos que realmente sean esquinas, es decir detecta
muchas falsos positivos.
Memoria. Deteccin de Caractersticas
36
CSS es el mtodo ms moderno de los analizados y las esquinas son
definidas como el valor local mximo de la curvatura. Este algoritmo es el
ms complejo de implementar debido a sus clculos matemticos y que
se parte de la deteccin de bordes. Para la deteccin de los contornos de
los bordes de la imagen, su utiliza un detector de bordes (Canny) y por
tanto los resultados obtenidos varan en parte funcin de la calidad de la
deteccin de los bordes.
El CSS es el detector que mejores resultados da de los probados, y el
tiempo de su ejecucin es bastante rpido comparado con los anteriores.
En la Tabla 2, se resumen las principales caractersticas de los detectores
de esquinas analizados. Para probar los diferentes detectores de
esquinas se realizaron varias pruebas con distintas imgenes. Para
comprobar la rapidez de los detectores, se emple una imagen muy
simple consistente en un cuadrado y todos los algoritmos detectaron las
esquinas perfectamente. Para comprobar la deteccin de las esquinas se
empleo una imagen tomada con la cmara estreo de un cubo de Rubik
(250x250) (ver Figura 7).
Tabla 2. Comparacin de los detectores de esquinas
Parmetros Clculo de
Derivadas
Similitud de
intensidades
Clculo de
Curvatura
Harris
Rmin
KLT
2,D
SUSAN t
CSS
Memoria. Deteccin de Caractersticas
37
(a)Harris (b)KLT
(c)CSS (d)SUSAN
Figura 16. Deteccin de esquinas en un cubo de Rubik
Memoria. Deteccin de Caractersticas
38
Tabla 3. Comparacin detectores de esquinas del cubo de Rubik
Entre los detectores que se han implantado, el que mejores resultados
proporciona es el CSS. A pesar de que en la imagen probada, es el que
ms esquinas falsas detecta, es tambin el que ms esquinas verdaderas
detecta. El CSS y el KLT son los nicos que detectan las esquinas
imprescindibles, es decir, las del contorno del cubo mientras que el
detector de Harris, no detecta la mayora de estas esquinas como se ve
en la Figura 16. El KLT proporciona buenos resultados, sin embargo tarda
mucho en ejecutarse, comparado con el CSS y esto puede dar problemas
cuando se traten imgenes muy grandes. Otros ejemplos que se
emplearon para probar los mtodos fueron las imgenes de una
grapadora como los de la Figura 17.
Tiempo de
ejecucin
imagen simple
Esquinas
verdaderas
cubo Rubik
Esquinas
falsas
detectadas cubo Rubik
Tiempo de
ejecucin
cubo de Rubik
Harris 0,0414s 22 0 0,0971s
KLT 3,19s 38 0 5,1729s
SUSAN 0,0043s 28 6 0,0087s
CSS 0,26s 79 19 0,44s
Memoria. Deteccin de Caractersticas
39
(c)CSS
(d)SUSAN
Figura 17. Deteccin de esquinas de una grapadora
Tabla 4.Comparacin detectores de esquinas en la grapadora
El mtodo que ms esquinas detecta es el CSS, sin embargo el que mejor
detecta para esta imagen como se puede observar es el KLT, ya que
detecta menos falsas esquinas.
Tiempo de
ejecucin grapadora
Esquinas
verdaderas grapadora
Esquinas falsas
detectadas grapadora
Harris 0,164s 14 3
KLT 5,42s 22 7
SUSAN 0,0104s 7 4
CSS 0,5072s 16 12
(a)Harris (b)KLT
(d) SUSAN
Memoria. Deteccin de Caractersticas
40
Con una imagen que contiene esquinas y zonas redondeadas, como es el
caso de una taladradora, los resultados fueron los de la Figura 18.
Figura 18. Deteccin de esquinas en una taladradora
(a) Harris (b) KLT
(c) CSS (d) SUSAN
Harris
Memoria. Deteccin de Caractersticas
41
Tabla 5. Comparacin de detectores de esquinas en una taladrador
Los resultados obtenidos no son demasiado buenos, ya que los
algoritmos detectan las sombras, y adems es difcil saber que es una
esquina y que no lo es, al ser la taladradora un objeto redondeado.
Aunque se ve que algunos detectores, identificar alguna esquina del
objeto.
Tiempo de
ejecucin
taladradora
Esquinas
verdaderas
taladradora
Esquinas
falsas
detectadas taladradora
Harris 0,261s 10 22
KLT 9,8s 22 22
SUSAN 0,0181s 11 29
CSS 0,688s 10 21
(a) Harris
Memoria. Deteccin de Caractersticas
42
Figura 19. Deteccin de esquinas en un coche
(b)KLT
(c)CSS
(d)SUSAN
Memoria. Deteccin de Caractersticas
43
Es difcil comparar los distintos detectores con la imagen de un coche, ya
que esta imagen apenas contiene esquinas. Sin embargo se probaron los
distintos detectores para ver los resultados y el tiempo de ejecucin.
Tiempo de
ejecucin
coche
Harris 0,38s
KLT 11,1s
SUSAN 0,0205
CSS 1,10s
Tabla 6. Tiempo de ejecucin de los detectores de esquina en la imagen del coche
2.6 Conclusiones
Como conclusin se puede apreciar en todas las imgenes que los
detectores que proporcionan los resultados ms fiables y exactos son los
algoritmo de KLT y CSS. Pero como se ha comentado anteriormente el
mtodo empleado por KLT es muy lento. En el caso de que el nico
propsito fuera la deteccin de esquinas en una imagen este mtodo
sera el ms apropiado, sin embargo la deteccin de esquinas suele ser
uno de los pasos intermedios para cualquier tipo de reconstruccin y por
lo tanto debe ser lo ms rpido y eficiente posible.
3 Deteccin de bordes
La deteccin de bordes es clave en la reconstruccin tridimensional
porque se puede extraer informacin importante de la imagen, como
pueden ser las formas de los objetos que la componen. Los bordes
indican dnde estn los objetos, su forma, su tamao, y tambin ofrecen
informacin sobre su textura.
Memoria. Deteccin de Caractersticas
44
Los bordes son los puntos donde hay una frontera entre dos regiones de
la imagen. En general, pueden ser de cualquier forma, y pueden incluir
uniones, discontinuidades y extremos.
En la prctica, los bordes suelen ser d