Upload
others
View
25
Download
0
Embed Size (px)
Citation preview
5
BIOT
ECNO
LOGÍ
A APL
ICAD
A
Genómica y Medicina
INTRODUCCIÓNEstamos asistiendo a una revolución histórica. El reciente desarrollo de la
genética y de la genómica, con su potencial para modificar la noción de enfer-
medad y de envejecimiento, puede conducir a cambios difíciles de imaginar
pocos años atrás.
Esta revolución comenzaba con los experimentos de Gregorio Mendel en
la segunda mitad del siglo XIX, se desarrollaba en el siglo XX por mera curio-
sidad en la naturaleza de la herencia, y tendrá unas consecuencias trascendenta-
les en la salud humana en este siglo XXI.
Los elementos biológicos funcionales donde reside la herencia son los
genes, constituidos químicamente por largas moléculas de ADN. Los genes
se heredan de padres a hijos y determinan diferencias entre individuos que
se reflejan en rasgos físicos o de comportamiento. La disciplina que estudia
la influencia de genes concretos en la salud y la diversidad natural es la Ge-
nética.
La totalidad del ADN de un organismo se denomina genoma, constituye
su archivo genético y contiene el manual de instrucciones para toda la fisiolo-
gía de la especie. La disciplina que estudia la caracterización del genoma se
GENÓMICA Y MEDICINAOrlando Domínguez. Unidad de GenómicaCentro Nacional de Investigaciones Oncológicas, Madrid
Genómica y MedicinaBIOTECNOLOGÍA APLICADA6º Curso de
6
denomina Genómica.
La Genómica difiere
de la Genética en que
su campo de estudio
trasciende a los genes
individuales, abarcan-
do la estructura y fun-
ción de genes y demás
elementos funcionales
del genoma (Figura 1).
La Genómica nos
ayuda a conocer ras-
gos fundamentales sobre nosotros mismos, la complejidad del fun-
cionamiento de nuestras células, cómo han evolucionado y evolucio-
nan los seres vivos, cómo las células individuales se han
desarrollado hasta formar criaturas complejas, y qué es exactamente
lo que ocurre cuando enfermamos.
La reciente secuenciación del genoma humano y de otros ma-
míferos proporciona por vez primera un conocimiento global de la
herencia genética de nuestra especie. El conocimiento de la secuen-
cia del genoma supone también una contribución fundamental a la
Medicina, al facilitar la comprensión de las redes de interacciones de
las enfermedades genéticas complejas.
Casi cualquier enfermedad tiene alguna base genética. En la ac-
tualidad se conocen 2.400 genes humanos asociados con enfermedad ("disease
gene" en la base de datos Gene de http://www.ncbi.nlm.nih.gov/). Y más de
4.000 enfermedades tienen su origen en genes alterados heredados del padre o
de la madre.
En el pasado, la Medicina solía tener en cuenta a la genética sólo en casos
como los defectos congénitos, y en un reducido grupo de enfermedades asocia-
das a genes únicos que eran transmitidos según pautas de herencia mendeliana,
como la fibrosis quística, la anemia falciforme o la enfermedad de Huntington.
Los genes asociados a estas enfermedades se han podido identificar con relativa
facilidad por su alta penetrancia; es decir, porque sus mutaciones ocasionan en-
fermedad en una alta proporción de las personas que las presentan. Cuando una
persona tiene una mutación de este tipo, la probabilidad de que enferme es muy
• ADN cromosómico Genómica estructural
Secuenciación y
Transcripción organización
• ARNm, ARNnc Genómica funcional
Activación génica
Traducción
• Proteína Proteómica
Expresión proteica
Figura 1. Flujo de lainformación genéticadesde el gen a la proteínacon denominación de lasdisciplinas que estudianestos niveles a una escalaglobal. En color losprocesos que transformanla información desde elnivel de "archivo" del ADNhasta los nivelesfuncionales de ARNy proteína.
alta. La prevalencia de estas enfermedades en la población suele ser del orden 1
en 1.000 personas.
En cambio, muchas de las enfermedades más comunes, con una prevalen-
cia del orden de 1 en 100, tienen una base genética más compleja. La diabetes,
las enfermedades cardiovasculares, el cáncer, la enfermedad de Alzheimer, la
sensibilidad o resistencia a la infección por HIV, el asma o las enfermedades
mentales surgen de la interacción entre un número variable de genes y otros
factores como la dieta, el estilo de vida y la exposición a agentes ambientales.
En este sentido, la capacidad y amplitud de la Genómica facilitan la carac-
terización tanto de enfermedades genéticas hereditarias de tipo mendeliano co-
mo de las más complejas que dependen de la interacción de múltiples genes
con el ambiente.
PROYECTOS GENOMAEl genoma ha sido un terreno inexplorado hasta hace pocos años. En la
década de 1980 los científicos comenzaron a identificar genes cuyas variantes
originaban enfermedades. Encontrar el gen suponía poder detectar fallos o mu-
taciones en su funcionamiento, o identificar con facilidad la proteína causante
del efecto patológico. En 1983 se ubicó el gen responsable de la enfermedad
de Huntington en una región relativamente amplia del cromosoma 4. Pero aún
se necesitaba mayor precisión. La localización exacta de los genes seguía sien-
do tarea difícil. El procedimiento requería años de trabajo, "cartografiando" al
detalle las regiones que contenían el gen buscado, para encontrar finalmente al
responsable directo de la enfermedad.
Algunos investigadores trataban de imaginar formas más sistemáticas de
examinar el genoma, y en 1990 una iniciativa de los Institutos Nacionales de la
Salud y el Ministerio de Energía de EE.UU. (interesado inicialmente en la rela-
ción de la radiación con las mutaciones genéticas) marcó el inicio del Proyecto
del Genoma Humano.
Genoma Humano
Al comienzo del Proyecto del Genoma Humano (PGH) la tecnología
no estaba en condiciones de abordar la secuenciación de los tres mil millo-
7
BIOT
ECNO
LOGÍ
A APL
ICAD
A
Genómica y Medicina
nes de nucleótidos de su genoma. El desarrollo de nuevos tipos
de instrumentos secuenciadores y la competencia de la compañía
privada recién fundada, Celera Genomics, impulsaron el avance
del proyecto público. En junio de 2000 tanto Celera como el
proyecto público anunciaron la obtención de "borradores de tra-
bajo". En febrero de 2001 ambos grupos presentaron, en un acto
conjunto, los resultados obtenidos hasta el momento con el 90%
de la secuencia genómica (Figura 2) (1 y 2). Finalmente, el con-
sorcio público presentó una versión terminada al 99% en octubre
de 2004.
La secuenciación del genoma supone el conocimiento de la
composición molecular de todos nuestros genes, de su posición
relativa y absoluta, del detalle de las regiones que pueden defi-
nir su actividad en diferentes tejidos y situaciones. No supone
sin embargo que se puedan deducir automáticamente sus funciones ni su
funcionamiento, sus interacciones y su implicación en enfermedad. El
PGH fue sólo un primer paso en la comprensión de nuestra especie a ni-
vel molecular. Aún se ignora la función de la mayoría de los genes, que
constituyen sólo el 5% del genoma, y el papel que pueda jugar el 95%
restante.8
Genómica y MedicinaBIOTECNOLOGÍA APLICADA6º Curso de
Figura 2. Estrategiasempleadas para lasecuenciación del genoma(adaptado de NatureReviews Genetics 2; 573-583 (2001)). Dado que lossistemas de secuenciaciónactuales sólo soneficientes en fragmentosrelativamente cortos deADN, en primer lugar el ADNde los cromosomas delgenoma (representadoscomo libros) se fragmentaen segmentos de tamañosecuenciable.Posteriormente lasecuencia de estossegmentos se ensambla,reconstruyendo lasecuencia del cromosoma.La estrategia "a" empleaun paso intermedio declasificación y selección defragmentos y se conocecomo secuenciación deltipo shotgun jerárquico defragmentos seleccionados.La estrategia "b" noemplea clasificación niselección previa y seconoce como shotgun degenoma completo.
Similitud con otros genomas
La interpretación del genoma humano se ve facilitada con la secuenciación
de otros organismos, lo que permite identificar genes similares y comprender
su función.
En junio de 2001 Celera Genomics disponía de un borrador del genoma
del ratón que ofrecía a sus clientes por 45.000 dólares. En diciembre de 2002
un consorcio internacional hacía público un borrador de su genoma de alta ca-
lidad. Con la disponibilidad del genoma del ratón ya se disponía de un modelo
para estudiar el humano.
Siendo un mamífero, el ratón presenta numerosas similitudes con el hom-
bre. Ambos proceden de un ancestro común que vivía hace 75 millones de
años, y su parentesco hace que sus genomas conserven un notable parecido.
Ambas especies son tan parecidas que el 99% de los genes murinos se recono-
cen en algún gen homólogo de la especie humana.
Que los genes sean homólogos no significa que sean idénticos. La identi-
dad media entre genes homólogos humanos y murinos es del 85%. No obstan-
te, esta homología sí es suficiente para que codifiquen a proteínas con estructu-
ras similares, que probablemente desempeñen funciones idénticas.
En septiembre de 2005 se publicó el primer borrador completo de la se-
cuencia del chimpancé, la especie animal más emparentada y parecida al hom-
bre. El chimpancé y el hombre proceden de un ancestro común que vivía sólo
hace 7 millones de años. Difieren en el 1,2% de sus genomas, sus genes homó-
logos son idénticos en un 98% y sus tejidos y neuroanatomías son práctica-
mente indistinguibles. El genoma del chimpancé es la mejor referencia para
averiguar qué es lo que nos hace humanos.
¿Qué es lo que marca diferencias, morfológicas y de comportamiento, entre
las especies? La respuesta está en las pequeñas diferencias y en el empleo del co-
mún repertorio de genes. Los primates tienen los mismos genes activos en las
mismas células, salvo en el cerebro. El cerebro humano es mayor y usa con más
intensidad mayor número de genes. Se diría que la diferencia entre ambas espe-
cies la han marcado pequeños cambios de gran efecto en el desarrollo embriona-
rio, que habrían predispuesto a una expansión del córtex cerebral y al desarrollo
de la laringe en los homínidos. Como consecuencia se facilita el lenguaje y surge
un desarrollo conductual más avanzado que el del resto de los animales.
9
BIOT
ECNO
LOGÍ
A APL
ICAD
A
Genómica y Medicina
Las diferencias entre especies próximas residen en los pequeños detalles,
en forma de cambios de uno o unos pocos nucleótidos que se van acumulando
a lo largo de la evolución. Estas variaciones tienen la misma naturaleza que las
que definen las diferencias entre individuos de una misma especie, o que las
responsables de enfermedades.
RASGOS DEL GENOMA DE LOS MAMÍFEROS
Genomas con grandes desiertos
A pesar de que los genes representan la principal función bioló-
gica de cualquier genoma, en los mamíferos sólo comprenden una
fracción pequeña de su tamaño. Estos genomas, de 2.500-3.000 me-
gabases (Mb) de longitud, contienen grandes desiertos. Más de 600
Mb están ocupadas por segmentos de más de 500 kilobases (Kb) va-
cías de genes.
Sólo el 30% del genoma contiene genes (incluyendo a sus intro-
nes) y la suma de todas las secuencias codificantes de proteína ocupa
sólo el 1,5% del genoma. Como contraste, más del 50% del total es-
tá constituido por elementos repetitivos de función incierta.
Genes codificantes y no codificantes
Los productos más conocidos de los genes son las proteínas, pe-
ro también hay genes que no codifican a proteínas. Cuando se activa
un gen codificante de proteína, la información que contiene se con-
vierte en ARN mensajero (ARNm) que accede al sistema de produc-
ción que origina la proteína específica correspondiente. Cuando se
activan los genes que codifican a productos no proteicos su informa-
ción se convierte en ARN "no" codificante (ARNnc). Los genes no
codificantes conocidos dan lugar a ARN de transferencia, ARN ribo-
10
Genómica y MedicinaBIOTECNOLOGÍA APLICADA6º Curso de
Figura 3. Aspecto de unfragmento de unos 30 Kbde genoma humano,conteniendo un extremode gen codificante típico.De este gen serepresentan lossegmentos de ADN que setrasmiten al ARNm(exones, del 5º al 9º, E5 aE9, en rojo) interrumpidospor ADN no codificante(intrones, del 4º al 8º, I4 aI8) que también setranscriben a ARN, pero seeliminan (por el procesoconocido por splicing)durante la maduración aARNm. En la figura seomiten los segmentosfuncionales o exones 1-4.El exón "externo" E9 sueleser más largo que losexones internos. Éstosmiden unos 145 pb. Eltamaño medio de losintrones (no dibujados aescala) es de 3.000 pb.Como rasgo típico serepresenta un elementorepetitivo, de los queocupan el 50% del genoma.
sómico, pequeño ARN nucleolar o microARN. Estos tipos de productos tienen
funciones biológicas importantes al participar en procesos generales, como en
la regulación de la síntesis proteica o en la maduración de los ARNm recién
transcritos.
Un gen típico que codifica a proteína ocupa 27 Kb lineales de genoma,
aunque su secuencia codificante es sólo de 1,3 Kb (el 5%). La secuencia codi-
ficante está fragmentada en 9 exones a lo largo de esta longitud, el resto es se-
cuencia intrónica que se elimina después de la transcripción a ARN (Figura 3).
El reducido número de genes de los mamíferos
El catálogo de genes de un organismo representa su repertorio de ele-
mentos funcionales, y cuanto más compleja es una especie mayor es este
catálogo. Sorprendentemente en el hombre, y es un dato confirmado en
otros mamíferos, se han encontrado muchos menos de los esperados. Los
46 cromosomas humanos (2 cromosomas sexuales y 22 parejas de cromoso-
mas autosómicos) constituidos por tres mil millones de pares de bases, con-
tienen no más de 25 mil genes. En cuanto a tamaño bruto, los mamíferos
tenemos un genoma mayor que un insecto, pero apenas mayor al de un gu-
sano (Tabla 1).
11
BIOT
ECNO
LOGÍ
A APL
ICAD
A
Genómica y Medicina
Tabla 1. Contenido de ADN y de genes del genoma de varios organismosNº Tamaño
de Nº de del genoma
Organismo Especie genes cromosomas (Mb)
Bacteria M. genitalum 470 1 0,58
H. pylori 1.600 1 1,67
H. influenza 1.700 1 1,83
E. coli 4.300 1 4,64
Levadura S. cerevisiae 6.000 17 12
Insecto D. melanogaster 13.600 4 165
Gusano C. elegans 20.000 6 97
Planta A. thaliana 25.000 5 125
Mamífero H. sapiens / M. musculus 25.000 23 / 20 3.000 / 2.500
A pesar de ser menos de los esperados, nuestros genes se las han inge-
niado para amplificar su funcionalidad de variadas formas, creando y mante-
niendo nuevas estructuras y sistemas inexistentes en nuestros ancestros más
primitivos. Mediante el procesamiento alternativo (splicing del ARNm) la
mitad de los genes humanos originan de dos a cuatro productos diferentes
en lugar de sólo uno. Hay sistemas de amplificación adicionales posteriores
al nivel de la traducción, ya en el nivel proteico, y redes moleculares y celu-
lares con efectos reguladores que modulan y afinan la función génica. Una
clase de sistema que actúa directamente sobre el ADN cromosómico es el
"epigenético", que mediante la metilación del ADN y la modificación de
histonas modifican la actividad y el efecto génico.
Variación genética y SNPs
Como promedio, dos personas no emparentadas son idénticas en
el 99,9% de sus secuencias cromosómicas. No obstante y dado el ta-
maño del genoma, aunque sólo sean diferentes en un 0,1% esas dos
personas difieren en varios millones de posiciones, de bases de ADN.
La variación genética entre individuos reside en estas diferencias.
La forma más común de diferencia genética es el llamado "poli-
morfismo de un sólo nucleótido" o SNP (del inglés, Single Nucleoti-
de Polymorphism). Se trata de diferencias heredadas y heredables.
Cada persona hereda
dos copias de cada gen,
una de cada uno de sus
padres. Estas copias
pueden ser idénticas o
ligeramente diferentes.
La variación gené-
tica define las diferen-
cias en el color del ca-
bello, o de los ojos,
influye en la inteligen-
cia y en la aptitud para
el aprendizaje, así co-
mo afecta a caracterís-
12
Genómica y MedicinaBIOTECNOLOGÍA APLICADA6º Curso de
Figura 4. Las variaciones enla secuencia de ADN entreindividuos pueden ocasionaro no algún efectodependiendo de sunaturaleza y de la posicióndonde ocurran. Puedetratarse de efectos inocuoso asociados a enfermedad.Figura tomada del U.S.Department of EnergyHuman Genome Program,http://www.ornl.gov/hgmis.
ticas de importancia médica como la predisposición a enfermedades o la sensi-
bilidad a fármacos.
Cualquier gen podría ocasionar alguna enfermedad si cambiase lo sufi-
ciente. Cuando un gen presenta una mutación es posible que la proteína corres-
pondiente sea diferente al normal y, aunque no siempre ocurre, también es po-
sible que tenga un funcionamiento anómalo (Figura 4).
La mayor parte de las diferencias están en regiones del genoma que no co-
difican a proteína, incluyendo a los intrones dentro de los genes y a los grandes
desiertos genómicos. De los SNPs situados dentro de los genes, sólo unos
2.000 alteran la composición de la proteína resultante, constituyendo práctica-
mente las únicas variaciones funcionales. Dado que es en el nivel proteico don-
de se pueden manifestar las modificaciones, se infiere que sólo unos miles de
variaciones genéticas son las responsables de toda la diversidad humana.
El mapa de haplotipos
La predisposición a enfermedad y las diferencias que distinguen a un individuo
de otro residen en el 0,1% de sus genomas. Grupos de SNPs próximos se heredan
juntos por ser vecinos de la misma región cromosómica. Estos grupos de SNPs o
marcadores genéticos que se heredan en bloque se conocen como haplotipos.
Algunas correlaciones SNP-enfermedad son un efecto directo de la varian-
te genética en algún gen y en la salud. En la mayoría de los casos, sin embar-
go, el SNP es simplemente un marcador de diversidad biológica, que se asocia
con enfermedad porque se encuentra próximo al factor genético verdaderamen-
te responsable.
Mientras que un SNP constituye la variante de un único nucleótido, un ha-
plotipo representa un tramo de secuencia considerablemente mayor, con un
promedio de 25.000 nucleótidos, que junto a los SNPs que contiene suele here-
darse en bloque. SNPs y haplotipos son los elementos actualmente en boga en
la identificación de la base genética de las enfermedades.
La realización de un mapa de haplotipos, o Hap Map es el siguiente gran
esfuerzo colaborativo de gran parte de los científicos que lideraron el PGH. Por
su parte, y con un propósito similar, Craig Venter, el presidente de Celera Ge-
nomics que lideró el proyecto privado de secuenciación del genoma, se ha em-
barcado en el proyecto de secuenciar el de 1.000 personas, como objetivo in-
termedio de secuenciar posteriormente el de 10.000.
13
BIOT
ECNO
LOGÍ
A APL
ICAD
A
Genómica y Medicina
El propósito final de este tipo de proyectos es catalogar la variabilidad hu-
mana a nivel genómico, y tras realizar asociaciones con historias clínicas y ca-
racterísticas personales, descubrir dónde, en qué haplotipos, reside la base de
las enfermedades genéticas complejas, o la diferente respuesta a tratamientos
terapéuticos (3).
GENOMA Y ENFERMEDADUna aplicación clave de la investigación genómica ha sido la localización
de genes de función desconocida responsables de enfermedades. Estudios que
antes requerían años de trabajo se pueden realizar ahora en meses, comenzando
con la identificación in silico de genes candidatos y continuando con ensayos
de polimorfismos o mutaciones en pacientes y portadores.
Empleando la secuencia del genoma se han identificado decenas de genes
de enfermedad. La secuencia también ha ayudado a revelar el origen de altera-
ciones cromosómicas, como las delecciones recurrentes originadas en segmen-
tos repetidos y duplicaciones. Este es el origen de los síndromes de Smith-Ma-
genis y de Charcot-Marie-Tooth, o los síndromes de Prader-Willi/Angelman, el
velocardiofacial/DiGeorge y el de Williams.
La Genómica está ayudando a la ciencia médica facilitando la identifica-
ción de genes causales de enfermedad. Esta identificación conduce de inmedia-
to al diseño de ensayos genéticos para detección de portadores, y con el tiempo
llevará al desarrollo de terapias específicas.
Aplicación de tecnologías genómicas
Una variante del síndrome de muerte súbita infantil (SIDS) causaba epide-
mia en la comunidad Amish norteamericana. Ante los intentos infructuosos de
encontrar la causa de la enfermedad, un grupo de investigadores realizó un
abordaje genómico. Mediante biochips de ADN analizaron 10.000 SNPs distri-
buidos regularmente por el genoma en muestras de cuatro niños afectados y
sus familiares. Sólo en un plazo de dos meses encontraron que el locus genéti-
co de esta variante de SIDS estaba situado en una región del brazo corto del
cromosoma 6 que contenía varios genes. Examinando los genes localizados en
esta zona asociaron al denominado TSPYL con el SIDS, por su pauta de expre-
14
Genómica y MedicinaBIOTECNOLOGÍA APLICADA6º Curso de
sión en tejidos cerebrales y en testículo. Aunque afectaba tanto a niños como a
niñas, se daba la circunstancia de que los varones acusaban deficiencias en el
desarrollo de sus testículos. Secuenciando este gen se encontró una grave alte-
ración en ambas copias del gen en los pacientes, mientras que sus padres eran
portadores de la copia defectuosa. A partir de ahora, un simple ensayo genético
será suficiente para detectar a portadores y a pacientes (Mapping of sudden in-
fant death with dysgenesis of the testes syndrome (SIDDT) by a SNP genome
scan and identification of TSPYL loss of function. Proc Natl Acad Sci U S A.
2004, 101:11689).
Algunos genes están activos simultáneamente en la mayoría de los tejidos.
Otros son específicos de tejido, o sólo están activos en momentos determinados
del desarrollo, por ejemplo durante el desarrollo embrionario. Así como un gen
puede modular su actividad atendiendo a estímulos cambiantes, también puede
acusar una actividad anómala como causa o efecto de enfermedad
(Figura 5).
La tecnología de los biochips (o microarrays) de ADN permite el
estudio de la actividad de miles de genes simultáneamente en un solo
ensayo. Aprovechando las propiedades de la doble hélice del ADN,
basta un segmento de un gen para disponer de un sensor específico.
Se puede extraer el ARNm de una célula o tejido, aplicarlo sobre un
detector conteniendo sensores para decenas de miles de genes y me-
dir la actividad de todos ellos de forma simultánea (Figura 6).
Esta tecnología revela qué cambios en la actividad de qué ge-
nes acompañan al de-
sarrollo de la enfer-
medad, permitiendo
subclasificar patologí-
as heterogéneas que
los criterios tradicio-
nales no pueden re-
solver (5).
El cáncer es una
enfermedad genética
compleja y enorme-
mente heterogénea.
Las dificultades de
15
BIOT
ECNO
LOGÍ
A APL
ICAD
A
Genómica y Medicina
Figura 5. Los genes activosy su nivel de activación
difiere en cada tipocelular. Los genes están
regulados según sufunción y dentro de un
mismo tejido puedenactivarse o desactivarse
respondiendo a estímulosambientales cambiantes.
diagnóstico dan lugar a que con frecuencia se clasifiquen en el mismo
grupo pacientes con distinto pronóstico y distinta respuesta a terapia.
Un ejemplo de ello es el cáncer de mama, en el que pacientes clasifica-
das en el mismo estadio diagnóstico pueden diferir de forma marcada al
tratamiento y en la evolución clínica.
Se han realizado estudios con pacientes sin células tumorales en
los ganglios linfáticos en el momento del diagnóstico o ganglios linfáti-
cos negativos (N0). Un 70% de ellas se curan con cirugía y radiotera-
pia. Como el 30% restante puede desarrollar metástasis antes de cinco años, se
recurre a quimioterapia adyuvante para reducir el riesgo. En este punto hay que
decidir qué pacientes tienen mal pronóstico y son sometidos al tratamiento y
cuales tienen buen pronóstico y no lo necesitan.
Diferentes grupos de investigadores han encontrado que los tumores pri-
marios presentan actividades génicas que predicen su capacidad o intención
metastática. Analizando la actividad génica de decenas de miles de genes me-
diante biochips de ADN en muestras de tumor primario de centenares de pa-
16
Genómica y MedicinaBIOTECNOLOGÍA APLICADA6º Curso de
Figura 6. Metodologíagenómica del análsismasivo de la actividadgénica mediantemicroarrays de ADN. 1)Partiendo de biopsias o decultivos celulares se lesextrae su contenido enRNAm y se marcafluorescentemente parapermitir su visualizaciónposterior. 2) Se permiteque las fraccionesmarcadas de RNAinteraccionen con [hastadecenas de miles de]sondas génicasinmovilizadas en unsoporte sólido. 3)Adquisición de resultadoscomo intensidades deseñal fluorescente quereflejan la activacióngénica global de lasmuestras iniciales. 4)Análisis bioinformáticoque clasificafuncionalmente lasmuestras o extraeindicadores de evoluciónclínica.
cientes, diferentes grupos de investigadores han encontrado firmas
moleculares o perfiles de expresión genética que se correlacionan
con la capacidad metastática. Estas firmas moleculares las constitu-
yen mediciones de la activación de "sólo" decenas de genes (70-80)
identificados en los estudios iniciales.
Se ha encontrado que el empleo de pruebas diagnósticas basa-
das en la medición de la actividad de genes marcadores mejora la
precisión de los factores pronósticos tradicionales (Figura 7). Las
pacientes de bajo riesgo identificadas por la observación de los per-
files de expresión genética tienen más probabilidad de supervivencia
sin generar metástasis que las que han sido clasificadas por los crite-
rios St. Gallen y NIH. Asimismo las pacientes de alto riesgo identifi-
cadas por medio de perfiles de expresión genética tienen más proba-
bilidad de generar metástasis a largo plazo que las pacientes
identificadas por los criterios de Saint Gallen.
Empleando los criterios St. Gallen y NIH el 80% de las pacien-
tes reciben terapia adyuvante, mientras que las clasificaciones basa-
das en biopsias genéticas reducen el grupo de alto riesgo que precisa
quimioterapia al 30-40% del total. El número de pacientes de alto
riesgo asignadas erróneamente al grupo de buen pronóstico no difiere significa-
tivamente entre los dos métodos.
Además de proporcionar marcadores de subclasificación de enfermedad y de
pronóstico, las técnicas genómicas diseccionan con precisión los mecanismos pa-
17
BIOT
ECNO
LOGÍ
A APL
ICAD
A
Genómica y Medicina
Figura 7. Comparación delpronóstico realizado con
firmas genéticas y con loscriterios de la conferencia
de Saint Gallen. Laspacientes de alto riesgo
identificadas por medio deperfiles de expresióngenética tienen más
probabilidad de generarmetástasis a largo plazo
que las pacientesidentificadas por los
criterios de Saint Gallen. Laspacientes de bajo riesgo
según perfiles de expresióntienen más probabilidad desupervivencia que las que
han sido clasificadas por loscriterios de Saint Gallen
(tomado dehttp://www.agendia.com/).
tológicos. Muchos de los genes pertenecientes a las firmas moleculares mencio-
nadas están relacionados con el ciclo celular, la invasión, la metástasis y la an-
giogénesis, y son en sí mismos candidatos a constituirse en dianas terapéuticas.
También se está usando en el diseño de ensayos clínicos dirigidos. Las
tecnologías genómicas permiten seleccionar los pacientes que más probable-
mente se beneficien del tratamiento, reduciendo notablemente el número de pa-
cientes requeridos, abaratando costes y mejorando su eficacia (6).
Genómica, biocomputación y nuevas dianas terapéuticas
Buscando in silico genes de secuencia parecida a un grupo de 1.000 genes
conocidos implicados en enfermedad, se han encontrado 300 nuevos genes.
Cualquiera de ellos puede estar implicado en patologías similares a los anterio-
res. Por ejemplo, mutaciones en los genes homólogos presenilina 1 y presenili-
na 2 pueden conducir también a enfermedad de Alzheimer. Los genes homólo-
gos pueden constituir dianas terapéuticas alternativas al gen 'titular'. Así por
ejemplo se están intentando reactivar los genes de hemoglobina fetal para los
casos de beta-talasemia o anemia falciforme originadas por mutaciones en el
gen de la globina beta.
Las compañías farmacéuticas esperan que la mayoría de los nuevos com-
puestos futuros se basen en la genómica. Se ha estimado que prácticamente la
totalidad de los medicamentos en el mercado tradicional tienen como diana al-
guno de sólo 483 productos génicos (Tabla
2). Aunque sólo una minoría de los genes
humanos pueda ser diana, se espera que su
número exceda el de varios miles.
Buscando computacionalmente genes
de secuencia parecida a las 483 dianas
farmacéuticas clásicas en el genoma, se
encontraron 18 nuevos genes (1) como re-
ceptores para dopamina, receptores puri-
nérgicos y receptores para factores de cre-
cimiento similares a la insulina. Hay
indicios de que son genes funcionales y es
probable que constituyan nuevas dianas
terapéuticas de interés.
18
Genómica y MedicinaBIOTECNOLOGÍA APLICADA6º Curso de
Tabla 2. Clasificación bioquímica y abundanciarelativa de las 500 dianas terapéuticas clásicaspara los compuestos caracterizados comoseguros y efectivos6
Clases bioquímicas %
Factores de unión a ADN 2
Receptores nucleares 2
Canales iónicos 5
Desconocidos 7
Hormonas y factores de crecimiento 11
Enzimas 28
Receptores de membrana celular 45
Utilizando sistemas robotizados de alto rendimiento se puede identificar y
analizar de forma eficiente aquellos compuestos que estimulan o bloquean de-
terminadas rutas bioquímicas. Un ejemplo de este tipo de aproximación ha sido
el desarrollo de la droga STI-571 (Glivec), diseñada para bloquear la actividad
del gen bcr-abl. Su producto proteico aparece en la leucemia mieloide crónica
(LMC) como consecuencia de una translocación entre los cromosomas 9 y 22.
El STI-571 bloquea al producto bcr-abl produciendo resultados espectaculares
en pacientes de LMC avanzada.
Otros ejemplos del empleo de la genómica en la búsqueda de nuevas dia-
nas son los siguientes.
1) El neurotransmisor serotonina (5-HT) media sus respuestas de excita-
ción a través de receptores de membrana. El gen 5-HT3A produce re-
ceptores funcionales in vitro, pero con un rendimiento inferior al obser-
vado in vivo. Se había pensado que podrían existir genes homólogos
que produjeran algún otro tipo de receptor, pero no se habían encontra-
do. Examinando la secuencia del genoma se identificó un gen homólo-
go que estaba activo en amígdala, núcleo caudado e hipocampo. Efecti-
vamente se encontró que se trataba de otro receptor para serotonina y
se denominó 5-HT3B, forma complejos con el anterior 5-HT3A con un
comportamiento funcional similar al visto in vivo.
2) Las acciones contráctil e inflamatoria de los cisteinil-leucotrienos, co-
nocidos como sustancia reactiva de anafilaxis (SRS-A), requieren re-
ceptores específicos. El segundo receptor conocido, el CysLT2, tiene
un 38% de homología al nivel de proteína con el primero, y se identifi-
có buscando un homólogo en la secuencia humana a un candidato en-
contrado en rata. El gen de este receptor, con afinidad para diversos
leucotrienos, está localizado en una región del cromosoma 13 que está
ligada al asma atópico. Se ha visto que este gen se encuentra activo en
el músculo liso de las vías aéreas y en el corazón. Dado que los leuco-
trienos han sido dianas para el desarrollo para drogas contra el asma, el
encontrar un nuevo gen en el que confluyen estos indicios ofrece pistas
prometedoras.
3) La enfermedad de Alzheimer se caracteriza por una abundante depo-
sición de placas seniles de proteína beta-amiloide. La beta amiloide
aparece por procesamiento proteolítico del precursor APP en un me-
canismo que emplea al enzima BACE (beta-site APP cleaving enzy-
19
BIOT
ECNO
LOGÍ
A APL
ICAD
A
Genómica y Medicina
me). La búsqueda computacional de secuencias homólogas localizó a
un nuevo gen denominado BACE2, en una región del cromosoma 21
próxima a donde reside el gen de APP. Se hipotetiza que las copias
adicionales de tanto BACE2 como de APP en pacientes con el síndro-
me de Down puedan contribuir a la deposición acelerada de beta-ami-
loide vista en estos pacientes. Tanto BACE como BACE2 son dianas
para el desarrollo de antagonistas para la prevención de la enferme-
dad de Alzheimer.
LA GENÉTICA EN EL DESARROLLO DE LA MEDICINA
En este primer cuarto de siglo, la Medicina dependerá cada vez más de la
comprensión de la Genética, de la Genómica y del funcionamiento molecular
de los sistemas biológicos.
Se espera que la Genómica ayude a predecir la respuesta al tratamiento de
pacientes concretos, ya que con frecuencia las variaciones de sensibilidad pro-
ceden de variaciones genéticas. Por ejemplo, distintos pacientes degradan dis-
tintos compuestos a distinta velocidad. Una nueva disciplina llamada Farmaco-
genómica estudia la implicación de variaciones genéticas concretas en la
respuesta a drogas.
En los próximos años el impacto de la Genómica y la Genética en la Me-
dicina irá aumentando. El diagnóstico y el tratamiento del cáncer llegarán a
transformarse y será posible analizar cada tumor para determinar sobre qué ge-
nes concretos hay que incidir mediante terapia individualizada.
Es probable que para el 2010 existan pruebas genéticas predictivas para
numerosas enfermedades comunes, de modo que quien desee saberlo conoz-
ca su susceptibilidad y pueda adaptar su sistema de vida para prevenirla o
reducir su gravedad. Probablemente las pruebas genéticas predictivas se
aplicarán preferentemente en individuos con historias familiares de enferme-
dad o sometidos a riesgos por exposición según su tipo de vida. De hecho,
este tipo de prueba ya está disponible para algunos tipos de cáncer de mama
y de colon.
Al mercado irán llegando nuevas "drogas de diseño" basadas en prediccio-
nes y ensayos genómicos para diabetes, hipertensión, cáncer y enfermedades
mentales.
20
Genómica y MedicinaBIOTECNOLOGÍA APLICADA6º Curso de
El genoma está transformando el análisis, la clasificación y el tratamiento
de las enfermedades, tanto de las heredadas como de las adquiridas, y su com-
prensión detallada transformará la práctica médica de las próximas décadas.
GLOSARIO
ARN mensajero (ARNm). Molécula intermediaria entre el gen cromosó-
mico y la síntesis de proteínas. Las proteínas no se sintetizan a partir del ADN
cromosómico directamente sino que desde éste se construye una copia en ARN
mediante la transcripción. Esta copia en ARN se modifica con el splicing y se
convierte en ARNm, que dirige la síntesis proteica.
ARN no codificante (ARNnc). Molécula que se transcribe de un gen cro-
mosómico pero que no conduce (no codifica) a proteína.
Clonación. Proceso de aislamiento de un número suficiente de copias de
un fragmento homogéneo de ADN para su estudio.
Eucariota. Organismo cuyas células contienen su genoma en el comparti-
mento llamado núcleo. Los animales, plantas y hongos son eucariotas, por opo-
sición a los procariotas.
Exón. Segmento génico que se transcribe a ARNm y separado de otros exones
contiguos por intrones (véase "intrón"). Contiene secuencia codificante de proteína.
Genoma. El conjunto del material genético de una especie. Contiene ge-
nes y regiones intergénicas.
Haplotipo. Segmento de ADN que contiene varios genes o marcadores
genéticos que por su proximidad se heredan juntos, en bloque.
Intrón. Regiones que no codifican a secuencia proteica y que interrumpen a
los exones en el ADN cromosómico. Son eliminados del ARNm por un proceso de
escisión y empalme (splicing) de exones con anterioridad a la síntesis de proteína.
Kb. Kilobase. Véase "unidad de longitud".
Mb. Megabase. Véase "unidad de longitud".
Mutación. Alteración reciente del genoma. Las mutaciones pueden tener
en el individuo efectos positivos, negativos o resultar neutras. Si se transmite a
la progenie y con generaciones sucesivas se establece en los individuos de la
población se denomina polimorfismo.
Nucleótido. Tipo de molécula cuyo ensamblaje lineal en forma de largas
cadenas constituye el ADN o el ARN.
21
BIOT
ECNO
LOGÍ
A APL
ICAD
A
Genómica y Medicina
Pb. Par de bases. Véase "unidad de longitud".
Polimorfismo. Variaciones de secuencia entre individuos de una pobla-
ción. P.ej: SNPs. Inicialmente surge como mutación del genoma normal.
Procariota. Organismo unicelular con estructura interna sencilla y sin nú-
cleo. Las bacterias son procariotas, por oposición a los eucariotas.
Recombinación. Proceso por el que se intercambian segmentos de ADN
entre cromosomas equivalentes durante la formación del óvulo o los esperma-
tozoides. De esta forma los cromosomas de la descendencia difieren de los pa-
ternos.
Secuencia de ADN. El ADN es una combinación de moléculas sencillas
llamadas nucleótidos enlazadas a modo de eslabones en una cadena lineal.
Existen cuatro tipos de nucleótidos (denominados A, C, G y T) y su orden o
secuencia determina la información contenida en el ADN.
SNPs (léase "snips", de single nucleotide polymorphisms). Polimorfismo
de un único nucleótido. La mayor variación genética entre individuos reside en
los SNPs.
Splicing (escisión intrónica). Proceso que extrae los intrones, o segmen-
tos de secuencia no codificante de proteína, del precursor del ARNm. En
ocasiones también elimina exones, y dependiendo de qué exones permanez-
can en el ARNm el producto proteico final es diferente. Este proceso de es-
cisión alternativa da lugar a que de un mismo gen se puedan derivar distin-
tas proteínas.
Traducción. Proceso biológico de producción de proteínas, durante el que
se traduce la información codificada en el ARNm para sintetizar una proteína
específica. El ARNm constituye un molde lineal de nucleótidos que es traduci-
do siguiendo el código genético a secuencia lineal de aminoácidos en la proteí-
na naciente.
Transcripción. Producción de copias de ARN del ADN cromosómico.
Hay especies de ARN que terminan dirigiendo la síntesis de proteína (ARNm)
durante la traducción y otras que no conducen a proteína (ARNnc).
Unidad de longitud. Los tamaños en el genoma se miden en unidades fí-
sicas y genéticas. La unidad física es el tamaño o longitud del nucleótido o su
equivalente el par de bases, componente individual de la doble cadena del
ADN. Sus múltiplos son el Kilobase (Kb, mil bases) y la Megabase (Mb, 1 mi-
llón de bases). La unidad genética es el centiMorgan (cM) y su equivalencia
varía de 1 a 2 cM por Mb, según la zona cromosómica de que se trate.
22
Genómica y MedicinaBIOTECNOLOGÍA APLICADA6º Curso de
BIBLIOGRAFÍA1. International Human Genome Sequencing Consortium. Initial sequencing and analy-
sis of the human genome. Nature, 409 (15 de febrero), 860-921. 2001.
2. Venter JC, Adams MD, Myers EW et al. The Sequence of the Human Genome.
Science, 291 (16 de febrero), 1304-1351. 2001.
3. http://www.genome.gov/page.cfm?pageID=10001688
4. Drews J. Drug discovery: a historical perspective. Science, 287, 1960-1964. 2000.
5. Alizadeh AA, Eisen MB, Davis E et al. Distinct types of diffuse large B-cell lymp-
homa identified by gene expression profling. Nature, 403 (3 de febrero), 503-511.
2000.
6. Simon R y Maitournam A. Evaluating the efficiency of targeted designs for randomi-
zed clinical trials. Clinical Cancer Research, 10, 6759-6763, 2004.
7. Genomic Medicine, http://content.nejm.org/misc/genmed.shtml. Alan E. Guttmacher,
M.D., and Francis S. Collins, M.D., Ph.D., Editors. N Engl J Med. 2002 Nov
7;347(19):1512-20 y etc.
23
BIOT
ECNO
LOGÍ
A APL
ICAD
A
Genómica y Medicina