15
Genera&ng Spanish Stegotext for fun and ¿profit?... Alfonso Muñoz Muñoz Escuela de Ingeniería Técnica de Telecomunicación (EUITT‐UPM). Departamento de Ingeniería y Arquitecturas TelemáFcas (DIATEL). Congreso de Seguridad ~ Rooted CON’2010 InvesFgador UPM ([email protected] )

Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

Embed Size (px)

Citation preview

Page 1: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

Genera&ng  Spanish  Stegotext  for  fun and ¿profit?... 

Alfonso Muñoz Muñoz 

Escuela de Ingeniería Técnica de Telecomunicación (EUITT‐UPM).  

Departamento de Ingeniería y Arquitecturas TelemáFcas (DIATEL). 

Congreso de Seguridad ~ Rooted CON’2010 

InvesFgador UPM  ([email protected]

Page 2: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

Esteganografía. Conceptos Previos.

Mensajes codificados ‐ botellas del minibar. Líbano. Mossad. Mayo 2009. 

Miembros de la Embajada Británica grabados  en espionaje en Rusia (2006). “Piedra Falsa” 

French 007 tells of great escape from Dubai wearing a wetsuit under a burka  

(August 2009, hDp://www.dailymail.co.uk) 

Congreso de Seguridad ~ Rooted CON’2010 

Page 3: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

Con pocas palabras…

Contenido Mul&media (pixel, coeficientes DCTs, índices paleta de colores…) 

Protocolos de comunicación, sistemas de ficheros,  tecnologías web (XML, HTML …) 

Ataques estadís&cos y clasificadores. Reducción de impacto (wet paper codes) 

hbp://stegsecret.sourceforge.net Congreso de Seguridad ~ Rooted CON’2010 

Page 4: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

Que buena está mi vecina…

Intereses  económicos,  políFcos,  militares,  control  social, seguridad nacional, terrorismo…. 

Echelon, Carnivore (DCS1000), OSEMINTI, SITEL, “Frechelon” …  

Inteligencia es la capacidad de entender, asimilar y elaborar información para uFlizarla adecuadamente (la información no es poder).

Congreso de Seguridad ~ Rooted CON’2010 

Hay  cosas  que  sabemos  que  sabemos. También hay cosas desconocidas conocidas, es decir que sabemos que hay algunas cosas que no sabemos.  Pero  también  hay  cosas  desconocidas  que desconocemos,  las  que  no  sabemos  que  no sabemos. 

Donald Rumsfeld, 2002.   Secretario Estadounidense de Defensa. 

Page 5: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

Esteganografía Lingüística

"In the beginning was the Word...". John 1:1

Esteganografía + Lingüística Computacional.

Congreso de Seguridad ~ Rooted CON’2010 

Líneas de Investigación:

Modificación de textos existentes y Generación automática de estegotextos.

¿Y si el único requisito para saber si un sistema es seguro fuera SABER LEER?…

¿Y si el único requisito para proteger un sistema fuera SABER ESCRIBIR?...

El mejor mensaje cifrado “es aquel que no lo parece”…

Para intentar descifrar un mensaje primero hay que “leerlo con exactitud…” (criptografía cuántica).

Page 6: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

El orden es importante…

TELECOMUNICACIÓN + INFORMÁTICA  =  TELEMÁTICA  (INGENIERÍA TELEMÁTICA) 

Ejemplo, Google N-gram corpus. 24GB compressed text files.

1.  Generar modelos para predecir como de probable es la aparición de una palabra en un texto para un lenguaje modelado dado, P(xi|xi-1,xi-2,…,xi-n).

Numberoftokens:1,024,908,267,229Numberofsentences:95,119,665,584Numberofunigrams:13,588,391Numberofbigrams:314,843,401Numberoftrigrams:977,069,902Numberoffourgrams:1,313,818,354Numberoffivegrams:1,176,470,663

3-gram data contained this corpus:

ceramicscollectablescollectibles55ceramicscollectablesfine130ceramicscollectedby52

Modelos estadísticos N-GRAM.

Congreso de Seguridad ~ Rooted CON’2010 

2. Utilidad de modelos N-Gram: statistical machine translation, speech recognition, checking spelling entity recognition, data mining…

INFORMÁTICA + TELECOMUNICACIÓN = 

(¿INGENIERÍA EN  INFORNICACIÓN?) 

INFORNICACIÓN   

Page 7: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

Generación Automática de Estegotextos

  Herramienta libre Stelin (JAVA) permite generar automáticamente estegotextos en lengua española basado en textos de entrenamiento. 

http://stelin.sourceforge.net

Congreso de Seguridad ~ Rooted CON’2010 

Page 8: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

Ejemplo de N-Gram. Atomicidad = Palabra

Congreso de Seguridad ~ Rooted CON’2010 

planeta por donde cruza errante la sombra de Caín criminal. ¡Gloria a Caín! Hoy  sólo  quedan  lágrimas  para  llorar.  No  hay  camino,  sino  estelas  en  la mar.  ¡FugiFva  ilusión  de  ojos  guerreros,  que  el  polvo  barre  y  la  ceniza avienta.  ¿Qué  has  hecho?  La muerte  no  hay  camino,  se  hace  camino  al andar. El que espera desespera, dice la mano viril que la blandiera, no por los  salones  de  sal‐si‐puedes  suena  el  rebato  de  la  tarde  en  la  arboleda! Mientras  el  corazón  pesado.  El  agua  en  sombra  pasaba  tan melancólicamente, bajo los arcos del puente al ímpetu del río sus pétreos tajamares;  la  guerra  nos  devuelve  los  muertos  milenarios  de  la  Ferra pamplonesa; encinas de Extremadura, a un ventanuco asoman, al declinar el sol, sobre el romero,  tan disparatada! sobre el campanario. Es una tarde musFa y desabrida de un otoño sin camino, como el niño que en la mar te empuje por valles y barrancas,  la tarde habrá caído sobre la Ferra, y una  

[ N=9, 126 bits úFles ocultos , clave=alfonso, Poesías Completas‐A.Machado]. [ST3221] Mandato: java –cp . stelin –h 9 poesías‐completas‐reducidas.txt datosAocultar.txt alfonso 

stego.out 

0,76 BIT - 1 PALABRA

Page 9: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

Consideraciones Estadísticas…

Congreso de Seguridad ~ Rooted CON’2010 

Page 10: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

Plantillas & Satanic Mode.

Ejemplo:  La habitación de Juan 

Congreso de Seguridad ~ Rooted CON’2010 

[ N=9, 126 bits úFles ocultos , clave=alfonso, Poesías Completas‐A.Machado]. [ST3221] Mandato: java –cp . stelin –h 9 poesías‐completas‐reducidas.txt datosAocultar.txt alfonso 

stego.out 

planeta por donde cruza errante la sombra de Caín criminal. ¡Gloria a Caín! Hoy  sólo  quedan  lágrimas  para  llorar.  No  hay  camino,  sino  estelas  en  la mar.  ¡FugiFva  ilusión  de  ojos  guerreros,  que  el  polvo  barre  y  la  ceniza avienta.  ¿Qué  has  hecho?  La muerte  no  hay  camino,  se  hace  camino  al andar. El que espera desespera, dice la mano viril que la blandiera, no por los  salones  de  sal‐si‐puedes  suena  el  rebato  de  la  tarde  en  la  arboleda! Mientras  el  corazón  pesado.  El  agua  en  sombra  pasaba  tan melancólicamente, bajo los arcos del puente al ímpetu del río sus pétreos tajamares;  la  guerra  nos  devuelve  los  muertos  milenarios  de  la  Ferra pamplonesa; encinas de Extremadura, a un ventanuco asoman, al declinar el sol, sobre el romero,  tan disparatada! sobre el campanario. Es una tarde musFa y desabrida de un otoño sin camino, como el niño que en la mar te empuje por valles y barrancas,  la tarde habrá caído sobre la Ferra, y una  

[WORD:en] [muerta][flota][.][bella][roja][en][,][sobre][arrebolada][y] [WORD:la][sus][la] [WORD:arboleda] [arboleda] [WORD:!] [!] [WORD:Mientras] [Mientras] [WORD:el] [el]       [WORD:corazón][querido][sueño][fondo][mar][temblor][semblante][Fctac][vino][aire][sol][ataúd][silencio][blanquecino][maestro][solitario][blanco][mármol][fruto][encanto][hálito][paFo][preFl][ambiente]…                                          

tarde en la dulce arboleda, ¡qué sensación!. Mientras SensiFve Mode. 

Ley  de  Zipf:    un  pequeño  número  de  palabras  son  uFlizadas  con mucha  frecuencia, mientras que  frecuentemente ocurre que un gran número de palabras son poco empleadas.  

Page 11: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

> java -cp . stelin -h 3 poesias-completas.txt datosAocultar.txt alfonso stego.out [ N=3, 126 bits útiles ocultos, clave=alfonso, Poesías Completas-A.Machado]. [ST180]

La tarde se ha ido llegando las hojas de la fuente se oía tañer de una tierra. Nunca se cansa. Pasado habían el agua muda que enorme muro de la fuente. Yo no conozco el agrio zumo dorado de amor. El tren, abril galán. ¡Oh, dime si son mías. La tarde caía, que a mi

La tarde se ha ido llegando y el viento contra las hojas esculpidas de la fuente se oía tañer de campanillas, melodía para una tierra entristecida. Esa fuente de la que fluye agua como néctar sin cesar. Nunca se cansa. Pasado 10 años ya no habían enamorados que bebieran el agua muda de la fuente que en otra época, tras un enorme muro, retaba a demostrar su amor bebiendo libertad de la fuente prohibida. Yo no conozco el agrio muro y tampoco el zumo dorado de amor de esos jóvenes. El tren del amor ya pasó, mi abril cuando fui galán pasó como estrella fugaz en el cielo. ¡Oh, dime si puedo recuperarlo!. Mis paranoias son mías pero puede que haya esperanza. La tarde caía, que rápido... a mi me pareció como un suspiro. 1 PALABRA – 1 BIT

55 /74/129(+5) palabras

1 PALABRA – 2 BIT

Plantillas vs OSEMINTI…

Congreso de Seguridad ~ Rooted CON’2010 

Page 12: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

agua de la fuente de la primavera blanca entre los verdes hojas el campo verde que a tu sombra, ¿No es más aparente escisión del ser. En la fuente de la tarde,  la fuente, en el campo verde, el agua, en el agua clara, casi con placidez de alma de la luna y de ceniza, estos limonares verdes. ¡Oh fe y la Ferra de una tarde muerta. ¡Ay, lo otro inasequible." Su reflexión autoinspecFva. ¿Ya no le lleva a la mar, está más allá de los montes, y en la Ferra.  Y  en  aquella  ausencia  en  esta  paz  con  los  ojos  abiertos  los  balcones  del  viejo pueblo paseando solo, en la Ferra de tu huerto, colmenar y campo y el poeta, y la luz y de la noche.  ¡Qué importa que en los ojos me recuerdan un día. Como atento no es,  y el campo. Juan lentamente avanza, sierra fría, y en los ojos de llama, el corazón del amor, en el alma. ¡Oh Ferra ingrata y fuerte olor de un sueño. Larga es la fuente de la vida, sin luna,  en  la  fuente  de  la  tarde,  dijeron  tu  pena,  sé  con  qué  se  hicieron?,  insiste  en preguntar lo que se apaga o beso que no es, y a la vera del camino. Recio viento sopla, Fenen la maldición en sus ojos? ¿Tu hermana es la canción que deje cenizas en la clara, casi de primavera, y el poeta  

> java -cp . stelin -h 3 poesias-completas.txt datosAocultar.txt alfonso stego.out

[ N=3, 570 bits, clave=perroblanco, Poesías Completas‐A.Machado]. [ST335] TEXTO: manifa 20:00 plaza cibeles policia id preparados 21:00 reFrada 

sicroniza twiber/perroblanco [94 caracteres] 

(239) 1 PALABRA – 2 BIT

(1PA/1BIT) 

agua de  la  fuente de  la primavera blanca entre  los álamos verdes y  las hojas amarillas. Fue ese el campo verde que recordó tu cara, a tu sombra delgada regaló una rosa, creció y floreció. ¿No es más aparente la escisión de tu belleza en una  rosa que del  ser  triste en el  cual  te has  converFdo?.  En  la  fuente de  la  arboleda ayer  tarde  recordé esa  rosa,  la fuente brotaba agua enrojecida, en el campo verde con álamos sedientos, donde el agua teñida fluía, en el agua poco clara, parecida a tu vida, vi  tu rostro. Vi tu rostro casi completo con la placidez de mi alma o de la luna y de ceniza es mi recuerdo, de ceniza. Tu olor me recuerda a estos limonares verdes entre los árboles.   ¡Oh fe bendita y valiente!. Fue en la  &erra de  una  ciudad  como  esta  donde  una  tarde muerta  te  declaré mi  amor.  ¡Ay,  que  pena!, me  regalastes  una sonrisa,  lo  otro  un  beso  tuyo  "fue  inasequible."  Su  reflexión  autoinspec&va,  algo  triste,  la  apartó  de  mi  lado.  ¿Ya marchó?, ya no le lleva a la mar su mirada perdida, está más allá de los montes,  y en la &erra clavado grité su nombre. Y en aquella ausencia, en esta soledad, busqué la paz con los ojos abiertos mirando a través de los balcones del viejo  pueblo donde nacimos.   Busqué tu aroma paseando solo, busqué en la &erra de tu huerto tu néctar, colmenar y hogar de tu dulce miel. Tu campo y tu huerto recuerdan nuestra infancia, como diría el poeta, y refleja la luz en la mañana y  de la noche estrellada.  ¡Qué importa todo esto ahora! que grite o en delirios los ojos llorando sangre me recuerdan un día tras otro tu aroma angelical. Como atento estoy a mis recuerdos no es cierto que,   y el todopoderoso es tesFgo, el campo esté desamparado. Juan mi fiel jardinero lentamente planta rosas, avanza poco a poco, porque la sierra fría no enFende  de  recuerdos  ni  de  anhelos, muerde  almas y  en  los  ojos  de  las  tormentas  se  vislumbra  la  fiereza,  la  llama negaFva, de  lucha encarnecida. Mientras el  corazón beba del amor, en el alma habrá esperanza.  ¡Oh &erra  ingrata y vacía, ayúdame a conquistar a mi amada!. Sé que fuerte es el olor de un sueño. Larga es la fuente de la vida, pero vacía sin  luna,  pensad  en  la  fuente  sin  agua  de  la  tarde,  vacía. Me  dijeron:  ¿tu  pena  es  comparFda?,  no  estás  solo  ella también sufrió. ¿Sus recuerdos sabes y sé con qué se hicieron?, insiste en preguntar Juan. Yo le recordé lo que se apaga no enFende de excusas, ni su abrazo ausente ni su boca o beso que no fue, ni es, y además a la vera del camino seguiré esperándola.  A pesar que no es fácil. Recio viento sopla, ¿quizás &enen la maldición en sus ojos tus amantes por desear tu boca?   ¿Tu hermana también te buscó sin aliento?, ¿que fue de tu familia?.   ¿Donde estarás?, recito con mi guitarra, es la canción que grito al aire y a fuego vivo deje cenizas en la clara madrugada, madrugada de olvido. Te escribo sin casi esperanza de recuperarte, así como vuelva la primavera, primavera que vence al duro invierno. Volveré a escribirte y el poeta que llevo dentro florecerá de nuevo, porqué estas letras esconden más que un pensamiento.APLAUSOS  

570 bits, manifa 20:00 plaza cibeles policia id preparados 21:00 re&rada sicroniza twiDer/perroblanco 

Congreso de Seguridad ~ Rooted CON’2010  Plantillas vs OSEMINTI…

Page 13: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

Congreso de Seguridad ~ Rooted CON’2010  Steganography Linguistic

Page 14: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

Seguridad y Conclusiones…

  La generación automáFca de estegotextos es una tarea realmente compleja si Fene en cuenta consideraciones estadísFcas y lingüísFcas. 

  La herramienta Stelin (variante mejorada de idea de Peter Wayner)   demuestra que es  viable  la  ocultación  de  una  centena  de  bits  con  una  relación  esfuerzo‐seguridad            aceptable.  

UFlidad  en  el  intercambio  de  mensajes  de  información,  urls  o  claves criptográficas. Ej, 128bits/6=21 caracteres | 640 bits/6=106 caracteres. 

Congreso de Seguridad ~ Rooted CON’2010 

  Se  generan  estegotextos  automáFcamente  en  lengua  española  con  una  buena imitación estadísFca de la fuente de entrenamiento. El uso de planFllas permite mejorar manualmente  la  seguridad  sintácFca‐semánFca  (coherencia  global)  del  estegotexto generado.  

Fa#gas, pero no tantas, que a fuerza de muchos golpes hasta el hierro se quebranta.  Manuel Machado. 

Congreso de Seguridad ~ Rooted CON’2010 

Page 15: Alfonso Muñoz - Generating Spanish Stegotext for fun and profit [RootedCON 2010]

Genera&ng  Spanish  Stegotext  for  fun and ¿profit?... 

Alfonso Muñoz Muñoz 

/* */  || ?? 

InvesFgador UPM ([email protected]

GRACIAS!!! :D 

Congreso de Seguridad ~ Rooted CON’2010