22
TEMA 6 Ma´ quinas moleculares basadas en ADN Mario de J. P´ erez Jim´ enez Grupo de investigaci´on en Computaci´on Natural Dpto. Ciencias de la Computaci´on e Inteligencia Artificial Universidad de Sevilla Computabilidad y Complejidad Curso 2011-12

Maquinas moleculares basadas en ADN - us

  • Upload
    others

  • View
    11

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Maquinas moleculares basadas en ADN - us

TEMA 6

Maquinas moleculares basadas en ADN

Mario de J. Perez JimenezGrupo de investigacion en Computacion Natural

Dpto. Ciencias de la Computacion e Inteligencia ArtificialUniversidad de Sevilla

Computabilidad y Complejidad

Curso 2011-12

Page 2: Maquinas moleculares basadas en ADN - us

Modelo de computacion: formaliza el concepto de procedimiento mecanico

I Dispositivos del modelo : maquinas

Maquina convencional: soporte electronico

Maquina no convencional: otro soporte distinto

La Computacion Natural:

I Redes Neuronales (W. McCulloch y W. Pitts , 1943).

I Algoritmos geneticos (J. Holland, 1975).

I Computacion molecular basada en ADN (L. Adlemann, 1994).

I Computacion celular con membranas (Gh. Paun, 1998–2000)

2 / 22

Page 3: Maquinas moleculares basadas en ADN - us

Maquinas moleculares basadas en ADN (I)

I Procedimientos matematicos vs procesos biologicos.

I L. Adleman materializo esta similitud (nov. 1994).

I Julio de 2000: interruptor a partir de una molecula.

I Sustituye la luz por una reaccion quımica.I Pueden disponer de mas de mil procesadores en el espacio ocupado

por un procesador.I Pueden aumentar la velocidad cien mil millones de veces.I Pueden reproducir cien ordenadores convencionales en el tamano de

un grano de sal fina.

I Simulacion bioquımica de una MT (E.Shapiro, nov. 2001)

3 / 22

Page 4: Maquinas moleculares basadas en ADN - us

Maquinas moleculares (II)

I Cromosomas:

I Descritos por Holfmeister, 1848I Codifica la informacion genetica (Principios del s. XX)I Proteınas + ADN (Claude, Porter, 1943 y Mirsky, 1947).

I ADN (J. Watson y F. Crick, 1951–1953)

I Descifran la estructura.

I Descubren el principio de complementariedad.

I Demuestran que las moleculas de ADN codifican toda la

informacion genetica.

I Justifican el uso de ciertas tecnicas para su manipulacion.

4 / 22

Page 5: Maquinas moleculares basadas en ADN - us

Estructura del ADN

ADN: polımero que, en su estructura lineal, consta de una serie de monomeros(nucleotidos).

Cada nucleotido consta de:

I Un azucar (desoxirribosa).

I Un grupo fosfato (P).

I Una base nitrogenada.

B

OHP

5

4

2

3

1’

Bases nitrogenadas: A, C, G, T. adenina, citosina, guanina y timina

5 / 22

Page 6: Maquinas moleculares basadas en ADN - us

Tipos de enlaces: fosfodiester y de hidrogeno.

Enlace fosfodiester: cadenas simples (polaridad).

P

B

5

4

2

3

1’

B1 2

5

4

3

2

1’

P

OH OH

P

B

5

4

2

3

1’

B

OH

5

4

3

2

1’

P

OH

43

6 / 22

Page 7: Maquinas moleculares basadas en ADN - us

Enlace de hidrogeno: A↔ T y C↔ G.Enlaces fosfodiester + enlaces de hidrogeno= cadenas dobles (estructura dedoble helice).

P

P

B

5

4

2

3

1’

B1 2

5

4

3

2

1’

P

OH OH

P

B

5

4

2

3

1’

B

OH

5

4

3

2

1’

P

OH

43

B B BB--

1 2 3 4

OHP PP

OH OH OH

1’

2

3

5

1’ 1’ 1’

2 2 2

3 3 3

4’ 4’ 4’4’

5 5 5’ ’’

’ ’ ’

’’’

- -

7 / 22

Page 8: Maquinas moleculares basadas en ADN - us

8 / 22

Page 9: Maquinas moleculares basadas en ADN - us

Estructura helicoidal de una molecula de ADN

9 / 22

Page 10: Maquinas moleculares basadas en ADN - us

Estructura de datos: moleculas de ADN

Operaciones con moleculas de ADN:

I Desnaturalizacion.

I Renaturalizacion.

I Medida de la longitud.

I Extraccion.

I Alargar (Enzima Polimerasa).

I Sıntesis.

I Cortar (Enzima Nucleasa).

I Empastar (Enzima Ligasa).

I Alterar.

I PCR.

I Lectura.

10 / 22

Page 11: Maquinas moleculares basadas en ADN - us

El experimento de L. Adleman

Noviembre de 1994: resolucion molecular de una instancia del problema delcamino hamiltoniano, en su version dirigida y con dos nodos distinguidos(experimento real).

3

4

6

52

0

1

Grafo usado en el experimento de Adleman

11 / 22

Page 12: Maquinas moleculares basadas en ADN - us

Este experimento:

I Primer ejemplo de computacion a nivel molecular.

I Nuevas perspectivas de las moleculas de ADN como estructura de datospeculiares.

I Posibilidad de usar el ADN para resolver instancias de problemascomputacionalmente intratables.

I Capacidad del ADN para simular computaciones de forma masivamenteparalela.

12 / 22

Page 13: Maquinas moleculares basadas en ADN - us

Implementacion en el laboratorio del algoritmo

Entrada: G = (V ,E); vi y vf ∈ V

? Generar todos los caminos de G .

? Rechazar caminos que no empiezan por vi y terminan en vf .

? Rechazar caminos que no contienen exactamente |V | nodos.

? Para cada u ∈ V , rechazar caminos que no contienen u.

Salida: SI, si queda algun camino; NO caso contrario.

13 / 22

Page 14: Maquinas moleculares basadas en ADN - us

Preparacion del tubo de ensayo inicial

I A cada i (0 ≤ i ≤ 6) se le asocia un oligo de longitud 20 mer.

I Notaremos si = s ′i s ′′i , en donde |s ′i | = |s ′′i | = 10.

s

s

s

’’

i

i

i

I A cada arco (i , j) ∈ E se le asocia el oligo

eij =

8>><>>:s ′′i s ′j si i 6= 0 ∧ j 6= 6s0s ′j si i = 0 ∧ j 6= 6s ′′i s6 si i 6= 0 ∧ j = 6s0s6 si i = 0 ∧ j = 6

I Se codifican caminos mediante doble hebras de ADN (usando oligos si ).Ejemplo:

ss s s’’ ’’’

s

’3 4 4 1

4 Camino 3→ 4→ 1

14 / 22

Page 15: Maquinas moleculares basadas en ADN - us

Consideraciones acerca del experimento de Adleman

I Procedimiento basado en filtrados.

I Ejecucion simultanea de operaciones moleculares.

I Tubo inicial: numero exponencial de cadenas.

I Numero de operaciones moleculares: lineal.

I Aparecen errores que pueden ser controlados.

I Boneh, Dunworth y Lipton (1995): hasta 1021 moleculas de ADN sepueden procesar.

I Ventajas potenciales:

? Velocidad de calculo: 1′2× 1018 versus 1012.? Consumo de energıa: 2× 1019 versus 109.? Densidad de informacion: 1 bit por nm3 versus 1 bit por 1012 nm3.

I Nacimiento de la computacion ADN.

I No proporciona un esquema algorıtmico.

15 / 22

Page 16: Maquinas moleculares basadas en ADN - us

Experimento de Lipton

Abril 1995: R.J. Lipton resuelve una instancia del problema SAT (experimentovirtual).Sea ϕ ≡ c1 ∧ ... ∧ cp con ci = li,1 ∨ ... ∨ li,ri , y conjunto de variablesVar(ϕ) = {x1, ..., xn}. Se le asocia un grafo dirigido

. . . .a a a a a a a

x x x x x

xxxxx

1 2 3 n+1nn-1

11

10

2

2 3

3 n-1

n-1 n

n1 1 1 1

0000

4

Grafo dirigido asociado a una formula proposicional con n variables

I Existen 2n caminos desde a1 hasta an+1.

I Existe una biyeccion entre el conjunto de caminos y las valoracionesrelevantes para ϕ.

16 / 22

Page 17: Maquinas moleculares basadas en ADN - us

Usa las ideas de Adleman.

Procedimiento basado en filtrados.

Primer esquema algorıtmico molecular.

Entrada: T0

para i ← 1 hasta p hacer

T1 ← T0; T0 ← ∅para j ← 1 hasta ri hacer

T ′ ← +(T1, l1i,j)

T1 ← −(T1, l1i,j)

T0 ← T0 ∪ T ′

Detectar(T0)

17 / 22

Page 18: Maquinas moleculares basadas en ADN - us

Modelos de computacion molecular basado en ADN

Modelos orientados a programas:

I Estructura de datos (tubos).

I Operaciones basicas (moleculares).

I Funcion semantica.

Ejemplo: el modelo restringido de L. Adleman (1995).

I Un agregado sobre un alfabeto Γ es un multiconjunto de sımbolos de Γ.

I Tubo: multiconjunto finito de agregados.

I Operaciones moleculares:

I Extraer.I Mezclar.I Detectar.

Es un modelo de computacion:

I Basado en procedimientos de filtrado

I Sin memoria de acceso aleatorio

18 / 22

Page 19: Maquinas moleculares basadas en ADN - us

El problema 3–COL

Dado un grafo no dirigido G, determinar si existeuna coloracion valida de G con tres colores .

El problema 3-COL es presuntamente intratable.

Disenamos un programa molecular que resuelve eficientemente 3–COL.

I Sea G = (V ,E) un grafo no dirigido, con V = {1, ..., n}.

I p1, ..., pn: codigos moleculares de los nodos.

I c1, c2, c3: codigos moleculares de los colores.

I Notaremos pi (cj) en lugar de (pi , cj) (pi tiene asignado el color cj).

I {e1, e2, ..., ep}: conjunto ordenado de aristas de G .

I ei = {e1i , e

2i }, con e1

i < e2i .

19 / 22

Page 20: Maquinas moleculares basadas en ADN - us

Una solucion del problema 3-COL en el modelo restringido

Consideremos el alfabeto:

Σ = {(p1, x1, p2, x2, ..., pn, xn) : ∀i (1 ≤ i ≤ n→ (xi = c1 ∨ xi = c2 ∨ xi = c3))}

Los elementos de Σ se pueden identificar con moleculas de ADN del tipop1x1p2x2...pnxn, cada una de las cuales representan una coloracion del grafo.

El tubo de entrada, T , es el siguiente multiconjunto finito:

T = {a ⊆ Σ : a es un conjunto unitario}

Dada una molecula σ = p1x1 . . . pnxn ∈ T y un numero i (1 ≤ i ≤ n),notaremos por (σ)i el color asociado al nodo codificado por pi .Es decir, pi (cj) ≡ (σ)pi = cj .

20 / 22

Page 21: Maquinas moleculares basadas en ADN - us

Idea del programa molecular:

I A partir del tubo inicial T0, que codifica todas las posibles coloracionesdel grafo con tres colores, se procede como sigue.

– Se elabora un tubo T1 seleccionando de T0 las coloraciones que sonvalidas para el subgrafo inducido por la arista e1. Para ello:

? Para cada j (1 ≤ j ≤ 3) se coloca en Tj las coloraciones quedan color j a e1

1 y en T ′j las coloraciones de Tj que dan a e11

un color distinto de j .? El tubo T1 sera la union de los tubos T ′1,T

′2,T

′3.

– Se elabora un tubo T2 seleccionando de T1 las coloraciones que son

validas para el subgrafo inducido por las aristas e1, e2 (procediendo

de manera analoga).

– El proceso se reitera p veces (siendo p el numero de aristas).

21 / 22

Page 22: Maquinas moleculares basadas en ADN - us

Un programa molecular que resuelve 3–COL

Estas ideas sugieren el diseno del siguiente programa molecular:

Entrada: T (contiene todas las posibles coloraciones de G)

Para i ← 1 hasta p hacer

T1 ← +(T , e1i (c1)); T ∗1 ← −(T , e1

i (c1))T2 ← +(T ∗1 , e

1i (c2)); T3 ← −(T ∗1 , e

1i (c2))

Para j ← 1 hasta 3 hacer

T ′j ← −(Tj , e2i (cj))

T ← T ′1 ∪ T ′2T ← T ∪ T ′3

Detectar(T)

22 / 22