23
LAS MATEMÁTICAS EN EL RETOQUE DIGITAL DE IMÁGENES Miguel A. Jorquera García Abril 2010

Las matemáticas en el retoque digital de imágenes

  • Upload
    jorquera

  • View
    27.370

  • Download
    4

Embed Size (px)

DESCRIPTION

Experiencia realizada con alumnos de bachillerato en abril de 2010 para dar a conocer las matemáticas que hay detrás del retoque digital de imágenes. Para ello se utilizó la herramienta de software libre Gimp.

Citation preview

Page 1: Las matemáticas en el retoque digital de imágenes

LAS MATEMÁTICASEN EL RETOQUE

DIGITAL DE IMÁGENES

Miguel A. Jorquera GarcíaAbril 2010

Page 2: Las matemáticas en el retoque digital de imágenes

1. PRESENTACIÓN

Debido a las tecnologías actuales el procesamiento de imágenes se ha convertido en un área

importante en nuestra sociedad debido a sus aplicaciones y a herramientas de fácil uso.

Algunos de los campos de aplicación del procesamiento de imágenes son: La fotografía digital,

procesamiento de vídeo para el control de tráfico y cámaras de vigilancia, reconstrucción y ayuda al

diagnóstico de imágenes médicas, reconstrucción de imágenes tomadas por satélites, vídeo digital, etc.

Para adentrarse en estos campos se requiere de fundamentos matemáticos de todas las ramas y por

supuesto también de la estadística.

Esta experiencia tiene como objetivo divulgar y fomentar el interés por las matemáticas en general y

por la estadística en particular. Para ello se ha dado una conferencia de 2 horas de duración a todos los

alumnos de 1º y 2º de bachillerato y después se dejó una semana para que realizaran las prácticas

correspondientes. Finalmente se pasó una encuesta para conocer las opiniones e inquietudes que hayan sido

despertadas tras la actividad.

La mayoría de los alumnos utilizan el ordenador e Internet de manera diaria y están continuamente

viendo y compartiendo imágenes. Incluso algunos han creado y/o retocado imágenes, bien para jugar o bien

para aprender, pero el caso es que han usado aplicaciones informáticas para tal fin.

Me pareció un buen punto de partida el retoque de imágenes digitales y su utilización en las revistas

de moda donde aparecen modelos muy atractivos. La frase “ésto está retocado con photoshop” se ha

convertido en algo habitual en las conversaciones sobre prensa rosa.

Es una buena oportunidad para mostrar las matemáticas que se esconden debajo de las imágenes y

retoque de las mismas (falta de contraste, luminosidad, falta de nitidez, ruido, distorsiones, corregir

imperfecciones de la piel, blanquear dientes, corregir ojos rojos, suavizar la piel, quitar arrugas, dar viveza al

pelo, mejorar labios, etc.) para conseguir mejorar la apariencia visual.

Aunque se dieron unas breves pinceladas sobre la investigación actual en el campo del

procesamiento y análisis de imágenes digitales, la conferencia se fue centrando en el retoque.

Para las prácticas se utilizó la herramienta Gimp que es “parecida” a Photoshop y que además es

software libre gratuito y multiplataforma. De esta forma se fomenta también los valores intrínsecos al

software libre en la educación.

Los fundamentos matemáticos que se han tratado en esta experiencia están relacionados con el

álgebra lineal (vectores, matrices y operaciones), análisis (aplicaciones lineales, funciones y e interpretación

de gráficas) y estadística (histograma, percentiles, campana de gauss, media, desviación típica, variaciones

con repetición, números combinatorios, probabilidad, distribución de probabilidad, etc.)

Page 3: Las matemáticas en el retoque digital de imágenes

2. DESARROLLO DEL TRABAJO

La actividad se divide en 3 partes: Conferencia, Prácticas y Encuesta-Evaluación.

A continuación se explica el desarrollo de la conferencia y la explicación de las prácticas.

Conferencia

Se reúnen a todos los alumnos de 1º y 2º de bachillerato (aproximadamente 60) en la biblioteca del

instituto donde se tiene preparado un ordenador con un vídeo-proyector para ir mostrando las distintas

páginas de una presentación preparada para la misma.

El guión de la conferencia fue: 1) Ejemplos de imágenes retocadas – 2) Imágenes como matrices

y operaciones – 3) Histograma – 4) Desenfoque Gaussiano.

1) Conferencia - Ejemplos de imágenes retocadas

Para captar la atención inicial, se empieza mostrando varios ejemplos que se pueden encontrar en

Internet sobre imágenes retocadas que luego se publican en revistas, donde aparece el antes y el después. Se

pueden ver claramente los cambios realizados y una mejora considerable para transformar una imagen de

apariencia normal en una profesional lista para incluir en la portada de una revista.

Sobretodo se distingue una mayor intensidad de los colores tanto de los labios, ojos, pelo y cara, piel

de la cara más lisa y depurada. También piel del cuerpo más bronceada, curvas de las caderas más

remarcadas y eliminación de “michelines”. A veces es necesario disimular arrugas, cambiar el color del pelo

y el realce de pecho.

Page 4: Las matemáticas en el retoque digital de imágenes

La última imagen que se muestra es la de una modelo donde los diseñadores al retocarla le quitaron

el ombligo, quedando patente la importancia de retocar imágenes reales que van a ver muchas personas y que

todo lo que se haga debe parecer real.

2) Conferencia – Imágenes como matrices y operaciones.

La 2ª parte de la conferencia trata de explicar la relación entre una imagen y una matriz de vectores

en el espacio. Para ello primero hay que definir lo que es un píxel, la profundidad de color y el modelo RGB.

Page 5: Las matemáticas en el retoque digital de imágenes

Un píxel (acrónimo del inglés picture element, "elemento de imagen") es la menor unidad

homogénea en color que forma parte de una imagen digital, ya sea esta una fotografía, un fotograma de vídeo

o un gráfico.

Ampliando lo suficiente una imagen digital (zoom), por ejemplo en la pantalla de un ordenador,

pueden observarse los píxeles que componen la imagen. Los píxeles aparecen como pequeños cuadrados o

rectángulos en color, en blanco o en negro, o en matices de gris. Las imágenes se forman como una matriz

rectangular de píxeles, donde cada píxel forma un área relativamente pequeña respecto a la imagen

total.

En las imágenes de mapa de bits o en los dispositivos gráficos cada píxel se codifica mediante un

conjunto de bits de longitud determinada (la llamada profundidad de color), por ejemplo, puede

codificarse un píxel con un byte (8 bits), de manera que cada píxel admite 256 variaciones (28 variaciones

con repetición de 2 valores posibles en un bit tomados de 8 en 8). En las imágenes de color verdadero, se

suelen usar tres bytes para definir un color, es decir, en total podemos representar un total de 224 colores,

que suman 16.777.216 opciones de color. (32 bits son los mismos colores que 24 bits, pero tiene 8 bits más

para transparencia)

Para poder transformar la información numérica que almacena un píxel en un color hemos de

conocer, además de la profundidad y brillo del color (el tamaño en bits del píxel), el modelo de color que

estamos usando. Por ejemplo, el modelo de color RGB (Red-Green-Blue) permite crear un color

componiendo tres colores básicos: el rojo, el verde y el azul. De esta forma, en función de la cantidad de

cada uno de ellos que usemos veremos un resultado u otro. Por ejemplo, el color amarillo se obtiene

mezclando el rojo y el verde. Las distintas tonalidades del amarillo se obtienen variando la proporción en que

intervienen ambas componentes. En el modelo RGB es frecuente que se usen 8 bits para representar la

proporción de cada una de las tres componentes primarias. De esta forma, cuando una de las componentes

vale 0, significa que esta no interviene en la mezcla y cuando vale 255 (28 - 1) significa que interviene

aportando el máximo de ese tono.

Por lo tanto, podemos representar una imagen (RGB) como una matriz de dimensiones m x n,

cuyos elementos son vectores de 3 dimensiones (3 canales RGB), con valores contenidos en los enteros

de 0 a 255 en un intervalo cerrado.

Page 6: Las matemáticas en el retoque digital de imágenes

A continuación podemos ver un ejemplo de una imagen 3x3 ampliada para tal efecto.

Podemos hacer operaciones sobre matrices (sumar, restar, multiplicar por un número, etc.) y cada

una de ellas tendrá un significado propio y se obtendrá una imagen diferente a la original.

Hay 4 tipos de operaciones:

● Procesamiento global: Cada píxel es tratado de forma independiente.

● Filtros y convoluciones: Se considera la vecindad local de los píxeles.

● Transformaciones geométricas: Se modifica el tamaño y la forma de las matrices.

● Transformaciones lineales: Fourier, wavelets, etc.

Veremos ejemplos de operaciones de procesamiento global y ejemplos de convoluciones.

Empezamos con operaciones de procesamiento global que se basan en operaciones de matrices.

● Ajuste de canales: Consiste en manipular la intensidad de sólo un canal (Rojo – Verde - Azul) a la

vez, dejando los otros dos intactos. Para ello se suma a la matriz de la imagen original otra cuyos

elementos son todos iguales a (p,0,0) donde el valor p es lo que variará el canal rojo. En el caso de

querer actuar sobre el canal verde sería (0,p,0) y (0,0,p) para el canal verde.

Page 7: Las matemáticas en el retoque digital de imágenes

● Ajuste de brillo: El brillo es el porcentaje de luminiscencia u oscuridad de un color que va de 0% al

100%. A la matriz inicial se le suma una cuyos elementos son todos iguales a (p,p,p), donde p

representa el parámetro de ajuste de brillo.

● Invertir colores: Consiste en invertir cada canal a su negativo. Se parte de una matriz cuyos

elementos son todos iguales a (255,255,255) y se le resta la matriz de la imagen original.

Page 8: Las matemáticas en el retoque digital de imágenes

● Ajuste de contraste: El contraste indica la diferencia entre zonas claras y oscuras.

3) Conferencia – Histograma

Ahora para poder mejorar el aspecto de muchas imágenes vamos a estudiar el histograma.

El histograma de una imagen es una función discreta que contabiliza el número de ocurrencias de

cada nivel de gris. Su representación es un diagrama donde el nivel de gris está en el eje de abcisas y la

frecuencia de cada nivel de gris en el eje de ordenadas. En imágenes de color podemos obtener el histograma

de cada canal por separado.

h(i) = Nº de veces que aparece el nivel de gris i en la imagen.

M x N = Dimensión de la matriz de imagen en píxeles.

p i =hi M⋅N

= Probabilidad.

El brillo se define como la media del histograma (el valor medio de gris).

f(x,y) representa el nivel del gris del píxel que está en las coordenadas (x,y).

Page 9: Las matemáticas en el retoque digital de imágenes

I es el número de grises que se ha empleado en la imagen.

La varianza del histograma se asocia al contraste de la imagen e indica la dispersión de los niveles

de grises en la misma.

El histograma proporciona información estadística de la imagen que es muy útil para conocer

el proceso de formación y poder mejorarla. Concretamente nos da información sobre el brillo y el

contraste de la imagen, y puede ser utilizado para ajustar estos parámetros, eliminar ciertas

tonalidades molestas, etc ...

Una buena imagen debe producir un histograma uniforme, repartido en todo el rango de valores. A

continuación se muestra un ejemplo del histograma correspondiente a una imagen proporcionado por Gimp.

Veamos unos ejemplos donde se muestran imágenes y la información que nos dan sus

correspondientes histogramas.

● Imagen oscura (falta luz) porque el histograma está a la izquierda.

Page 10: Las matemáticas en el retoque digital de imágenes

● Imagen clara (sobra brillo) porque el histograma está a la derecha.

● Imagen con poco contraste (muchos tonos medios) porque el histograma está en el centro.

● Imagen con mucho contraste (pocos tonos medios) porque el histograma está en los laterales.

Las operaciones de sumar, restar, multiplicar y dividir producen cambios en la imagen y por lo tanto

en el histograma. Realizar diferentes operaciones usando el histograma en lugar de sobre la totalidad de

la foto píxel a píxel resulta ventajoso porque reduce la carga computacional . Se pasa de una función

bidimensional f(x,y) con MxN valores a una función unidimensional H(p) con 2g valores. (siendo g el

número de bits empleados en la digitalización).

Page 11: Las matemáticas en el retoque digital de imágenes

Sumar: Incrementa el brillo y desplaza el histograma a la derecha.

Restar: Decrementa el brillo y desplaza el histograma a la izquierda.

Multiplicar: Aumenta la intensidad y estira el histograma a la izquierda.

Dividir: Disminuye la intensidad y encoge el histograma a la izquierda.

Un ejemplo del cambio producido en la suma es el siguiente:

Estas transformaciones de imágenes también se pueden ver mediante la curva tonal, donde para cada

valor de gris de entrada hay uno de salida. La función y = x representa la misma imagen original, es decir,

que la frecuencia de cada valor de gris sigue siendo la misma tanto a la entrada como a la salida. Si

modificamos esa función llamada curva tonal la imagen cambia y por tanto también su histograma.

La curva tonal puede ser una función lineal, exponencial, cuadrática, logarítmica, etc. y para decidir

Page 12: Las matemáticas en el retoque digital de imágenes

cuál es la que se utiliza se estudia el histograma. Veamos 3 ejemplos de curvas tonales que se utilizan mucho

para mejorar imágenes.

Veamos cómo mejorar el contraste de una imagen a partir del histograma y la curva tonal. En el

histograma podemos observar cómo el rango de valores va de m hasta M que indica que la imagen tiene poco

contraste y lo que pretendemos es buscar una transformación lineal que estire el histograma del intervalo

[m,M] a [0,255] para mejorar el contraste.

Con una simple regla de tres se obtiene la curva tonal que buscamos.

Oscurece los medios tonos

Aclara los medios tonos

Oscurece los tonos claros y aclara los

oscuros

Regla de tres

(x – m) / (M – m) = (f(x) – 0) / ((255 – 0))

f(x) = (x-m)*255/(M-m)

Page 13: Las matemáticas en el retoque digital de imágenes

Este método puede resultar desastroso en los casos donde hay píxeles con valores muy bajos o muy

altos. Por ejemplo si m=0 y M=255 la curva tonal resultante es la identidad y la imagen no cambiaría. En

estos casos es donde los percentiles nos pueden ayudar, por ejemplo, podemos coger como m el percentil 5 y

como M el percentil 95. También se puede utilizar el 10% - 90% dependiendo de cada situación.

La gráfica de la transformación lineal resultante se puede ver en la imagen del centro, donde

ajustando los valores de m y M se pueden ir viendo las diferentes imágenes retocadas.

Se pone de manifiesto la importancia del estudio estadístico del histograma de una imagen para

poder tomar una decisión óptima a la hora de mejorar las imágenes digitales.

Ecualización del histograma

La ecualización del histograma consiste en encontrar una transformación con la cual el histograma

pase a tener una representación uniforme donde todos los valores de gris tienen la misma frecuencia y por lo

tanto la probabilidad de cualquier nivel de gris es la misma. Con la ecualización trataremos de aproximarnos

al histograma ideal de una imagen.

Para todo valor de i, h i =M⋅NI

y por tanto la probabilidad p i =hi M⋅N

=1I

donde I es el número

de grises que se ha empleado en la imagen.

Partimos de la función de distribución de la imagen. Como se trata de una variable aleatoria discreta, se

define como el sumatorio de probabilidades desde el inicio de la variable hasta un valor prefijado y que si el

sumatorio abarca todo su rango vale 1.

F x =∑i=0

x

p i es la función de distribución de un histograma cualquiera.

En el caso de que se trate de un histograma uniforme, la función de distribución es

F x ' =∑i=0

x '

p i = x '1I

Igualando las dos funciones de distribución, la de la imagen original y la deseada podemos despejar x' y

obtener la transformación que ecualiza el histograma

F x =F x '

F x=x '1I

x '=F x I−1

que resulta: y=[F x I−1] , donde [] representa la parte entera.

Al igual que otras transformaciones, no funciona en todos los casos, pero es una forma de

Page 14: Las matemáticas en el retoque digital de imágenes

automatizar el proceso de mejora de una imagen buscando el histograma ideal a partir de una transformación

que hemos obtenido a partir de las funciones de distribución de dos histogramas. Veamos dos ejemplos de

ecualización de imágenes donde en uno la imagen mejora, pero en otro quizá el resultado obtenido no es el

deseado.

La ecualización del histograma también se utiliza para adaptar el histograma de una imagen al de

otra que sí tiene buena calidad, por ejemplo podemos modificar una imagen para que su histograma se

parezca al de otra que tiene buen contraste u otra imagen tomada del mismo lugar donde el contraste sea

mejor.

4) Conferencia – Desenfoque Gaussiano

Para obtener esa sensación profesional de piel lisa se utilizan los filtros o convoluciones. Son otro

tipo de operaciones diferentes a las globales donde se considera la vecindad local de los píxeles para calcular

el valor RGB del nuevo píxel. El color del píxel resultante será una combinación lineal de los píxeles

cercanos.

Hay que indicar un radio de acción para determinar cuáles son los píxeles cercanos y para que los

píxeles cercanos tengan más peso que los lejanos se utiliza la famosa “campana de Gauss”.

Page 15: Las matemáticas en el retoque digital de imágenes

Para llegar a comprender el concepto de convolución hay que empezar definiendo el concepto de

máscara o matriz de coeficientes.

Una máscara es una matriz de menor tamaño que la la imagen y cuyos elementos son los coeficientes

de la transformación lineal que se aplica para obtener el valor del nuevo píxel.

Veamos un ejemplo del filtro de la media para entenderlo mejor.

En la imagen podemos ver la máscara de orden 2 de la media, donde todos sus elementos son ¼. Si

colocamos la máscara en una posición válida sobre la matriz de un canal de la imagen lo que nos dice es

cómo se calcula en nuevo valor del píxel tras aplicar dicha máscara. En este caso el píxel situado en la

esquina inferior derecha será el resultado de hacer la media aritmética de los cuatro valores que están bajo la

máscara. En la imagen de la izquierda se puede observar que si colocamos la máscara sobre la submatriz

80 130115 154 de la imagen el valor del píxel situado en la esquina inferior derecha será la media

aritmética de los cuatro valores que es 80130115154

4=120 .

El píxel a modificar con una máscara se representa en verde más oscuro y suele ser el situado en el

centro.

De manera general lo que se hace para calcular el valor del píxel resultante es sumar todos los

productos elemento a elemento de la máscara y la submatriz de la imagen que queda debajo.

En el filtro de la media todos los píxeles tienen el mismo peso a la hora de calcular el resultado y el

efecto producido en la imagen no es tan bueno como en el filtro gaussiano donde los píxeles que están más

cerca tienen más peso que los más alejados.

Page 16: Las matemáticas en el retoque digital de imágenes

La máscara gaussiana se obtiene a partir de la siguiente función bidimensional:

Al igual que en la campana de Gauss unidimensional, al aumentar la varianza la curva se hace más

achatada lo que significa que se tienen en cuenta a píxeles vecinos más alejados. Si la varianza es más

pequeña se ponderará teniendo en cuenta sólo a píxeles más cercanos.

La varianza funciona como grado de ponderación de vecindad.

El filtro gaussiano requiere muchos cálculos y, a veces, se utiliza una aproximación llamado filtro

binomial. Se denomina también discretización gaussiana y se debe al Teorema Central del Límite que dice

que en ciertas condiciones la distribución binomial se aproxima a una normal. Vamos a utilizar los números

combinatorios que aparecen en la distribución binomial y que se obtienen del triángulo de Pascal o Tartaglia

para construir la máscara binomial que requiere muchos menos cálculos que la gaussiana.

El triángulo de Pascal lo podemos ver en la imagen de debajo a la izquierda y a la derecha se muestra

la forma en la que se construyen máscaras binomiales unidimensionales de distintos tamaños. La constante

multiplicadora se calcula de forma que los coeficientes de la máscara sumen 1.

Page 17: Las matemáticas en el retoque digital de imágenes

A partir de estas máscaras binomiales unidimensionales se obtienen las correspondientes

bidimensionales multiplicando por sí misma cada máscara unidimensional como si fuese una matriz. Por

ejemplo, para obtener la máscara binomial de tamaño 9=3x3 cogemos la máscara binomial unidimensional

de tamaño 3 (1 2 1) y la multiplicamos a la izquierda por su transpuesta obteniendo así una matriz 3x3. En

este caso la constante multiplicadora será 14

14= 1

16.

Esta forma de obtener la máscara binomial bidimensional, multiplicando dos máscaras

unidimensionales nos lleva al último concepto que veremos. Se trata de la posibilidad de separar una máscara

bidimensional en dos unidimensionales para que el cálculo sea más eficiente.

Los tres tipos de máscaras que hemos visto (media, gaussiana, binomial) son separables, es decir, se

pueden obtener multiplicando dos máscaras unidimensionales.

El número de operaciones se reduce bastante pasando de ser un algoritmo de o n2 a uno de

o 2n .

Por ejemplo en el filtro de la media si tenemos una máscara 5x5 se tendrían que realizar 25 sumas y

luego dividir por 25 para calcular cada valor. Si lo separamos, se realizarían para cada máscara

unidimensional 5 sumas y 1 división entre 5, que en total quedan 10 sumas y 2 divisiones. Se puede observar

que se reduce el número de sumas de 25 a 10.

Para pasar dos máscaras unidimensionales, primero se pasa una, por ejemplo la horizontal y luego a

la matriz resultante se le pasa la vertical.

Page 18: Las matemáticas en el retoque digital de imágenes

Las máscaras binomial y gaussiana también son separables lo que optimiza mucho los cálculos.

Otras posibles aplicaciones del efecto de desenfoque son la protección de testigos, haciendo que la

cara aparezca difuminada y resaltar objetos de interés que se consigue difuminando el resto de la imagen.

Aunque durante la conferencia se fueron intercalando las diapositivas y la herramienta Gimp para ir

haciendo en el momento los retoques explicados, al final se hizo un resumen de todo lo tratado y su puesta en

práctica con Gimp dejando como primera práctica que los alumnos repitieran lo mismo.

Se dejó claro que para dominar una herramienta como Gimp hace falta mucho tiempo y práctica y

que el objetivo de estas prácticas era entender la relación entre las matemáticas y el retoque digital y su

puesta en práctica de una manera rápida y sencilla.

1. Ajuste de canales: Menú Colores > Niveles

2. Ajuste de brillo: Menú Colores > Niveles y Colores > Brillo y contraste

3. Invertir colores: Menú Colores > Invertir

4. Ajuste de contraste: Menú Colores > Brillo y contraste

5. Histograma: Menú Colores > Info > Histogramas

6. Operaciones en el histograma: Menú Colores > Niveles

7. Curva tonal: Menú Colores > Curvas

8. Desenfoque Gaussiano: Menú Filtros > Desenfoque > Desenfoque gaussiano

Tras el resumen se explicaron algunas funcionalidades básicas de Gimp para que los alumnos

pudieran realizar las prácticas sin problemas. Se trataron detenidamente las formas de selección, las capas y

Page 19: Las matemáticas en el retoque digital de imágenes

la máscara rápida.

Por último se cogió la imagen de una modelo y se hicieron los siguientes retoques:

1. Eliminar las imperfecciones la piel con la herramienta de saneado.

2. Ajustar los colores desde el menú Colores > Curvas a partir del histograma.

3. Suavizar la piel de la cara aplicando una máscara rápida y aplicando un desenfoque gaussiano de

radio 7-10.

4. Si el resultado del desenfoque es poco realista aplicar un filtro de ruido HSV a la misma selección de

la máscara rápida para darle más realismo.

5. Blanquear los dientes. Para ello se seleccionan y se difumina la selección desde el menú Seleccionar

> Difuminar. Luego vamos al menú Colores > Tono y saturación y elegimos como color primario el

amarillo para aplicarle una saturación de 100.

6. Dar intensidad a los labios. Se seleccionan y se crea una nueva capa. En el menú Colores > Balance

de color, subimos el rojo y el magenta a nuestro gusto sin pasarnos. También se puede utilizar la

herramienta de pintura de marcado al fuego para oscurecer lo pliegues y aclarar brillos jugando con

la opacidad de esa herramienta.

7. Si es necesario se pueden corregir los ojos rojos y también blanquear.

8. Por último dar más viveza al pelo siempre que se pueda seleccionar de una manera sencilla porque

tiene el pelo recogido. Se selecciona el pelo con una máscara rápida y se mejora su color desde el

menú Colores > Curvas.

Con esto era suficiente para que los alumnos cogieran una imagen de Internet, de las utilizadas en la

conferencia o incluso una suya y la retocaran con Gimp para entregar la original y la retocada al cabo de una

semana.

Page 20: Las matemáticas en el retoque digital de imágenes

3. EXPERIMENTACIÓN EN EL AULA Y EVALUACIÓN

Pasada una semana de la conferencia se recogieron las imágenes retocadas por los alumnos y se pasó

una encuesta para valorar la experiencia y los conocimientos adquiridos en tan poco tiempo de forma

voluntaria.

Hay que tener en cuenta que en las clases de matemáticas no hay mucho tiempo para realizar

actividades extra ya que hay un currículo que dar y además en 2º de bachillerato están las Pruebas de Acceso

a la Universidad y por lo tanto no quedan muchas opciones. La experiencia tuvo lugar en abril de 2010, casi

a final de curso cuando los alumnos tienen más trabajo y pueden dedicar menos tiempo a este tipo de

actividades. Hubiera sido conveniente realizar la experiencia en el mes de noviembre y se tendrá en cuenta

para otras ocasiones.

1. ¿Habías oído antes la frase “eso está retocado con Photoshop”?

a) Sí

b) No

2. ¿Habías retocado antes alguna imagen digital? Si es así indica un poco el proceso.

a) Sí

Observaciones:

b) No

3. ¿Te imaginabas que las imágenes realmente son matrices de vectores?

a) Sí

b) No

4. ¿Qué es lo que más te ha gustado de la conferencia?

a) Los ejemplos de retoque digital.

b) Las matrices que se ocultan en las imágenes.

c) El histograma de una imagen.

d) La curva tonal de una imagen.

e) Retocar una imagen a partir del histograma.

f) El desenfoque gaussiano.

5. ¿Qué es lo que más te ha gustado de las prácticas?

a) Eliminar imperfecciones de la piel.

b) Mejorar brillo, contraste, etc.

c) Suavizar piel.

d) Blanquear dientes.

e) Retocar labios, ojos, pelo, etc.

6. ¿Ha servido la experiencia para entender mejor una aplicación de edición de imágenes?

Page 21: Las matemáticas en el retoque digital de imágenes

a) Mucho

b) Normal

c) Poco

d) Nada

7. ¿Ha servido la experiencia para ampliar y mejorar tus conocimientos de matemáticas y estadística?

a) Mucho

b) Normal

c) Poco

d) Nada

8. ¿La experiencia ha despertado tu interés sobre la edición de imágenes?

a) Mucho

b) Normal

c) Poco

d) Nada

9. ¿Cómo valorarías la experiencia en general del 1 al 10?

a) 1 2 3 4 5 6 7 8 9 10

10. ¿Sabes interpretar el histograma de una imagen? ¿Entiendes la importancia de la estadística en este

campo?

a) Sí

b) Regular

c) No

11. ¿En qué nos ayuda el histograma de una imagen y que aporta de nuevo con respecto a los cálculos

con matrices?

12. Después de estudiar el histograma y la curva tonal ¿Comprendes mejor la herramienta de Gimp >

Colores > Curvas? ¿Sabrías utilizarla sabiendo lo que haces?

a) Sí

b) Regular

c) No

13. ¿Recuerdas una utilidad de los percentiles en el retoque de imágenes?

a) Sí Coméntala:

b) No

14. ¿Para qué se utiliza la función de distribución de probabilidad en el histograma?

Conclusiones:

Tras analizar los resultados de la encuesta podemos obtener algunas conclusiones sobre la experiencia.

Todos los alumnos habían oído antes la frase “esto está retocado con Photoshop” y el 46% afirma

haber retocado una imagen en alguna ocasión. La mayoría han modificado el brillo y aplicado efectos como

poner una imagen en blanco y negro o sepia.

Page 22: Las matemáticas en el retoque digital de imágenes

Las aplicaciones utilizadas anteriormente han sido las propias que viene con una cámara de fotos

digital, Picasa y Photoshop. Se sorprenden de todas las matemáticas que hay detrás de conseguir un efecto

sencillo y no sabían que tras pulsar un botón de la barra de herramientas se hagan tantos cálculos en muy

poco tiempo.

Sólo un 12% sabían que las imágenes digitales se pueden ver como matrices de vectores,

posiblemente por una conferencia del curso pasado sobre esteganografía, donde se trataron también las

imágenes pero en esta ocasión para ocultar información.

Lo que más les gustó, con diferencia fueron los ejemplos mostrados al principio donde se veía el

antes y el después del retoque y la explicación y finalidad del desenfoque gaussiano. Este filtro tiene muchas

utilidades y se consiguen resultados sorprendentes si se aplica bien. Los alumnos ven una utilidad más de la

famosa “Campana de Gauss” en algo que no sospechaban ni remotamente. Es gratificante ver cómo después,

en clase van calculando los números correspondientes a la máscara gaussiana y/o binomial utilizando la

función de densidad de la distribución normal y el triángulo de Tartaglia. Dedicamos un tiempo de clase a

ello por la propia petición de los alumnos y a sabiendas de que estos contenidos no entraban para examen.

Teniendo más tiempo o modificando el currículo se podrían dedicar más horas a este tipo de

actividades que motivan más a los alumnos y pueden ser muy útiles.

El utilizar el histograma para mejorar una imagen y ver las imágenes como matrices de vectores

también fue bien valorado por la mayoría, mientras que la curva tonal y su aplicación parece ser no se

entendió muy bien. Aunque la curva tonal es imprescindible en cualquier programa de dibujo, no se apreció

así por parte de los alumnos o no llegaron a entenderla del todo, posiblemente por el poco tiempo dedicado.

En cuanto a las prácticas realizadas con Gimp, lo más llamativo para todos los alumnos ha sido la

eliminación de imperfecciones de la piel junto con el suavizado producido por el desenfoque gaussiano.

Aunque el tiempo dedicado a Gimp ha sido muy poco ya que esta herramienta necesita mucho más

para obtener un nivel aceptable, el 80% valora de manera muy positiva la experiencia para entender mejor

una aplicación de edición de imágenes. Y más de un 80% piensan que la experiencia les ha servido para

ampliar y mejorar sus conocimientos de matemáticas.

El interés despertado por el tema de edición de imágenes ha sido mucho para un 66% y normal para

un 30%.

Cabe destacar que la puntuación media de la experiencia por parte de los alumnos ha sido de un 8,5.

Por ello me siento recompensado todo el esfuerzo y tiempo dedicado a la preparación de la misma, aunque

luego al ponerla en práctica ha pasado rápidamente.

Page 23: Las matemáticas en el retoque digital de imágenes

Los resultados obtenidos de las preguntas más técnicas no han sido muy buenos y achaco todo al

poco tiempo dedicado, pero, de momento no se pueden sacar más minutos dentro del horario lectivo.

A la pregunta sobre si sabían interpretar el histograma de una imagen y la importancia de la

estadística en este concepto sólo un 25% responde que sí y un 75% indica que regular.

A la pregunta sobre en qué nos ayuda el histograma y qué aporta de nuevo con respecto a los

cálculos matriciales, las respuestas de los alumnos no son muy precisas, aunque de manera general todos

coinciden en que ayuda a mejorar la calidad de las imágenes digitales mejorando entre otras cosas el

contraste y las variaciones entre tonos oscuros, medios y claros. No comentan nada sobre la mejora

computacional que supone su uso en contra de los cálculos matriciales.

Pocos alumnos comentan la utilidad de los percentiles aunque coinciden en que es para distribuir

mejor el histograma al igual que la función de distribución de probabilidad. Su lenguaje no es muy correcto

pero se aproximan y hablan de la ecualización del histograma con frases como las que siguen a continuación:

• Para nivelar todos los contrastes.

• Para darle aproximadamente los mismos valores a todo, es decir, repartir la cantidad en todos

los valores.

• Para la ecualización del histograma y que así éste presente más tonos medios y menos

contraste.

4. REFERENCIAS

● http://dis.um.es/profesores/ginesgm/files/doc/pav/tema2.pdf

● http://dis.um.es/profesores/ginesgm/files/doc/pav/tema3.pdf

● http://dialnet.unirioja.es/servlet/articulo?codigo=2397428

● http://verona.fi-p.unam.mx/boris/teachingnotes/Capitulo4.pdf

● http://www.cs.buap.mx/~mmartin/pdi/pdi.html

● http://www.edukativos.com/apuntes/archives/432