Upload
others
View
7
Download
0
Embed Size (px)
Citation preview
Predicción de Promotores y Elementos Reguladores
Pedro Eduardo TORRES JIMÉNEZ
CINVESTAV-Zacatenco
09 de julio del 2013
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 1 / 60
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 2 / 60
Predicción de Promotores y Elementos Reguladores Introducción
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 3 / 60
Predicción de Promotores y Elementos Reguladores Introducción
Introducción
Un problema relacionado con la predicción de genes es lapredicción de promotores
Los promotores son elementos de ADN localizados en los sitiosdonde inician los genes
Funcionan como sitios de unión en el proceso de transcripción degenes
Consisten en ARN Polimerasa y Factores de Transcripción
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 4 / 60
Predicción de Promotores y Elementos Reguladores Introducción
Introducción
Estos elementos de ADN regulan directamente la expresión delos genes
Los promotores y los elementos reguladores son determinadostradicionalmente por análisis experimental
Este proceso es extremadamente laborioso y tardado
La predicción computacional de promotores y elementosreguladores es útil para sustituir este proceso
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 5 / 60
Predicción de Promotores y Elementos Reguladores Introducción
Introducción
Sin embargo sigue siendo una tarea difícil:
Los promotores y los elementos reguladores no están claramentedefinidos y son muy diversos.
Cada gen parece tener una única combinación de motivosreguladores que determinan una única expresión temporal yespacial.
Los promotores y los elementos reguladores no pueden sertraducidos en secuencias de proteinas para incrementar lasensibilidad de su detección
Los sitios de los promotes y elementos reguladores que sepredicen son por lo general cortos (6 a 8 nucleótidos) y puedenser encontrados fácilmente debido al azar, lo que resulta en altosíndices de falsos positivos
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 6 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en procariotas
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 7 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en procariotas
Promotores y elementos reguladores en procariotas
En bacterias la transcripción es iniciada por una ARN polimerasala cual es una enzima multi-subunidad
La subunidad e.g σ70 de la ARN polimerasa es la proteina quereconoce las secuencias específicas hacia arriba del gen ypermite al resto de la enzima unirse
La secuencia hacia arriba donde la proteina σ se une constituye lasecuencia del promotor
Esta incluye los segmentos de secuencia ubicados a 35 y 10 bphacia arriba desde el sitio de inicio de la transcripción, tambiénconocidos como 35 box y 10 box respectivamente
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 8 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en procariotas
Promotores y elementos reguladores en procariotas
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 9 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en procariotas
Promotores y elementos reguladores en procariotas
Por ej. Para la subunidad σ en Escherichia coli, la -35 box tieneuna secuencia consenso de TTGACA y la -10 box tiene unasecuencia consenso de TATAAT
En adición a la ARN polimerasa también hay un número deproteinas que facilitan el proceso de transcripción conocidascomo factores de transcripción
Estas se unen a secuencias específicas de ADN para mejorar oinhibir las funciones de la ARN polimerasa
Las secuencias de ADN específicas a las cuales los factores detranscripción son unidos se llaman elementos reguladores
Estos elementos reguladores pueden unirse en la cercanía delpromotor o unirse a centenas de bp del promotor
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 10 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 11 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Promotores y elementos reguladores en eucariotas
La transcripción tiene una capa extra de complejidad, unconjuntno de tres distintos tipos de ARN polimerasa
Cada tipo de polimerasa transcribe diferentes conjuntos de genes
RNA polimerasa I y III son responsables de la transcripción deRNA ribosomal y ARNt respectivamente
RNA polimerasa II es responsable exclusivamente de transcribirgenes de proteinas codificantes (o síntesis de ARNm)
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 12 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Promotores y elementos reguladores en eucariotas
A diferencia de los procariotas, donde los genes forman unoperón con un promotor compartido, cada gen eucariótico tienesu propio promotor
El núcleo de varios promotores eucarióticos es la llamadaTATA-box, ubicada a 30 bp hacia arriba desde el sitio de inicio detranscripción, teniendo un motivo consenso TATA(A/T)A(A/T)
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 13 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Promotores y elementos reguladores en eucariotas
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 14 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Promotores y elementos reguladores en eucariotas
Sin embargo, no todos los promotores eucarióticos contienen laTATA-box
Las TATA-boxes son usadas como un indicador de existencia dealgún promotor
Varios genes tienen una secuencia iniciadora única, la cual esrica en piridiminas con un consenso (C/T)(C/T)CA(C/T)(C/T). Estesitio coincide con el sitio de inicio de transcripción
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 15 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotas
Algoritmos para predicciónAlgoritmos ab-initioPredicciones para procariotasPredicciones para eucariotasMétodos basado en huelas filogenéticas
Métodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 16 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Algoritmos para predicción
Pueden ser categorizados en:
Basados en ab-initio: Hacen predicciones escaneandosecuencias individuales
Basados en similitud: Hacen predicciones basadas enalineamiento de secuencias homólogas
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 17 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Algoritmos para predicción
Basados en perfiles de expresión: Usan perfiles construidos de unnúmero de secuencias de genes coexpresadas del mismoorganismo
Las predicciones por similitud son también conocidas comohuellas filogenéticas
Debido a que la ARN polimerasa II transcribe los ARNm, lamayoría de estos algoritmos se basan en la predicción depromotores en ARN polimerasa tipo II
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 18 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotas
Algoritmos para predicciónAlgoritmos ab-initioPredicciones para procariotasPredicciones para eucariotasMétodos basado en huelas filogenéticas
Métodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 19 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Algoritmos ab-initio
Este tipo de algoritmos predice promotores y elementosreguladores procarióticos y eucarióticos, basados en patrones desecuencias características
Algunos son basados en señales, dependiendo del tipo depromotores tales como las TATA-boxes, otros dependen deinformación, por ejemplo en frecuencias de hexámeros
Las ventaja de este tipo de algoritmos es que la secuencia puedeser aplicada como tal sin la necesidad de obtener informaciónexperimental.
Una limitante es la necesidad de entrenamiento, la cual hace lapredicción específica para ciertas especies
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 20 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Algoritmos ab-initio
Además este tipo de método tiene dificultad en descubrir nuevosmotivos
La manera convencional de detectar promotores o elementosreguladores es a través de patrones de secuencias representadospor expresiones regulares o con PSSM
Puntajes de coincidencia o no coincidencia en todas lasposiciones de la matriz son sumados. Este simple método tienedificultades para detectar entre promotores reales y aleatorios, ypor lo tanto genera altos índices de falsos positivos
Una nueva generación de algoritmos han sido diseñados paratomar en cuenta el orden de correlación de múltiplescaracterísticas usando funciones discriminantes, redesneuronales o HMMs.
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 21 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Algoritmos ab-initio
Para mejorar la especificidad, algunos algoritmos excluyenregiones de búsqueda y se centran en regiones de subida (0.5 a2.0 kbp) donde comunmente se localizan promotores
De esta manera la predicción de promotores y la predicción degenes están acopladas
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 22 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotas
Algoritmos para predicciónAlgoritmos ab-initioPredicciones para procariotasPredicciones para eucariotasMétodos basado en huelas filogenéticas
Métodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 23 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Predicciones para procariotas
Un aspecto único de los promotores en procariotas es ladeterminación de operones, debido a que los genes quecontienen un operón comparten un promotor común
Es por esto que la predicción de operones es la llave para lapredicción de promotores procarióticos
Hay métodos disponibles para la predicción de operones. El másacertado es un conjunto de reglas simples desarrolladas porWang et al (2004)
Este método depende de dos tipos de información: Orientación delos genes y distancia intergénica entre un par de genes y vínculosconservados entre genes basados en análisis genómicocomparativo
Un esquema de puntaje fue desarrollado para asignar operonescon distintos niveles de confianzaPedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 24 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Promotores y elementos reguladores en eucariotas
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 25 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Predicciones para procariotas
Este método identifica operones acertadamente, lo que facilita ala predicción de promotores
BPROM
FindTerm
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 26 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotas
Algoritmos para predicciónAlgoritmos ab-initioPredicciones para procariotasPredicciones para eucariotasMétodos basado en huelas filogenéticas
Métodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 27 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Predicciones para eucariotas
El método de ab-initio para predecir promotores y elementosreguladores en eucariotas depende de buscar las secuencias deentrada para hacer un matching con los patrones consenso depromotores conocidos.
Los patrones consenso son determinados experimentalmente,posteriormente compilados en perfiles y almacenados en unabase de datos para escanear secuencias desconocidas yencontrar patrones similares conservados
Este método tiende a generar altos índices de falsos positivos
Para incrementar la especificidad de la predicción, se ocupa unacaracterística unica de los eucariotas, la cual es la presencia deislas CpG
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 28 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Predicciones para eucariotas
Se sabe que varios genes de vertebrados se caracterizan por unaalta densidad de dinucleótidos CG cerca de la región delpromotor, traslapándose con el sitio donde la transcripción esiniciada
Combinando el enfoque de islas CpG con otras señales delpromotor la confiabilidad de la predicción es mejorada
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 29 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Predicciones para eucariotas
CpGProd
Epopine
Cluster-Buster
FirstEF
McPromoter
TSSW
CONPRO
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 30 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotas
Algoritmos para predicciónAlgoritmos ab-initioPredicciones para procariotasPredicciones para eucariotasMétodos basado en huelas filogenéticas
Métodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 31 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Métodos basado en huelas filogenéticas
Se ha observado que los promotores y elementos reguladores deorganismos estrechamente relacionados como los del humano yel ratón son altamente conservados. La conservación es tanto anivel de secuencia y a nivel de organización de los elementos
La identificación de elementos de ADN conservados nocodificantes que tienen roles funcionales se conocen comohuellas filogenéticas
Este método puede ser aplicado tanto a procariotas comoeucariotas
La selección de organismos para comparación es una importanteconsideración para este tipo de análisis
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 32 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Métodos basado en huelas filogenéticas
Si el par de organismos seleccionados son estrechamenterelacionados, como el del humano y el chimpancé la diferenciaentre las secuencias puede no ser suficiente para filtrarelementos funcionales
De otra manera, si los organismos tienen una distancia evolutivalarga como el humano y el pez, habrá divergencia evolutiva muygrande, los promotores y otros elementos funcionales seránindetectables
La ventaja de este tipo de algoritmos es que no es necesario elentrenamiento de los modelos probabilísticos
Potencial de descubrir nuevos motivos reguladores
Una limitante es la restricción de las distancias evolutivas desecuencias ortólogas
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 33 / 60
Predicción de Promotores y Elementos Reguladores Promotores y elementos reguladores en eucariotas
Métodos basado en huelas filogenéticas
ConSite
rVista
PromH
Bayes aligner
FootPrinter
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 34 / 60
Predicción de Promotores y Elementos Reguladores Métodos basados en perfiles de expresión
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 35 / 60
Predicción de Promotores y Elementos Reguladores Métodos basados en perfiles de expresión
Métodos basados en perfiles de expresión
Los genes con perfiles de expresión similares son consideradoscoexpresados.
La coexpresión se refiere al hecho de tener en común promotoresy elementos reguladores
Si esto es válido, las secuencias de subida de los genescoexpresados pueden ser alineados para revelar elementosreguladores en común reconocibles por factores de transcripciónespecíficos
El problema es que los elementos reguladores de genescoexpresados son cortos y débiles
Sus patrones son difíciles de discernir usando alineamientomúltiple de secuencias
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 36 / 60
Predicción de Promotores y Elementos Reguladores Métodos basados en perfiles de expresión
Métodos basados en perfiles de expresión
Deben usarse métodos tales como EM y Gibbs
EM es un algoritmo de extracción de motivos por medio deoptimización repetida de una PSSM a través de comparacionesde secuencias
Gibbs usa una optimización de matriz similar pero con unaestrategia más flexible y con una probabilidad más alta de obtenerel patrón óptimo
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 37 / 60
Predicción de Promotores y Elementos Reguladores Métodos basados en perfiles de expresión
Métodos basados en perfiles de expresión
MEME
AlignACE
Melina
INCLUSive
PhyloCon
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 38 / 60
Predicción de Promotores y Elementos Reguladores Regulación transcripcional
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 39 / 60
Predicción de Promotores y Elementos Reguladores Regulación transcripcional
Regulación transcripcional
La regulación transcripcional es uno de los procesos másimportantes a estudiar en la biología celular
La caracterización de promotores y TFBS para genes específicoses un tema muy estudiado
El modelo computacional estándar que describe las propiedadesde unión de los factores de transcripción es la PFM (PositionFrequency Matrix)
Una PFM se construye contando las ocurrencias de losnucleótidos en las columnas de un alineamiento de TFBScolectados de experimentos
La predicción es altamente correlacionada con propiedades deunión in vitro de los FT
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 40 / 60
Predicción de Promotores y Elementos Reguladores Regulación transcripcional
Regulación transcripcional
Sin embargo el objetivo de la investigación en regulación degenes es la identificación de sitios de unión que sonfuncionalmente importantes in vivo, lo cual es un gran reto
Los sitios funcionales pueden ser encontrados pero pueden serindistinguibles en otras predicciones, se emplean ciertos métodospara aumentar la selectividad, por ejemplo la comparación deespecies cruzadas como un filtro de selección (huellasfilogenéticas)
Existen dos partes importantes en el proceso de búsqueda deelementos reguladores: construir un modelo para un factor detranscripción de interés y la predicción de elementos reguladores
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 41 / 60
Predicción de Promotores y Elementos ReguladoresSelección de sitios para construir un modelo para las propiedades
de unión de un TF específico
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 42 / 60
Predicción de Promotores y Elementos ReguladoresSelección de sitios para construir un modelo para las propiedades
de unión de un TF específico
Selección de sitios para construir un modelo para laspropiedades de unión de un TF específico
En la práctica, los sitios usados para construir modelos de TF sonbasados en sitios funcionales extraidos de artículos publicados oconjuntos de sitios identificados por una serie de rondas deselección in vitro
Como mínimo cinco sitios o más son requeridos para un modeloimprovisado , donde más de veinte en la mayoria de los casos esadecuado para un modelo representativo.
Si la selección in vitro es usada, el número de sitios usualmenteno es un problema
Existe un peligro de sobreselección, esto es, los sitiosseleccionados no son representativos in vivo
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 43 / 60
Predicción de Promotores y Elementos Reguladores Alineamiento de sitios
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 44 / 60
Predicción de Promotores y Elementos Reguladores Alineamiento de sitios
Alineamiento de sitios
Una vez que se tienen los sitios es necesario alinearlos para laconstrucción subsecuente del modelo, es necesario construir lamatriz del modelo sin huecos
Se usan algunas herramientas, los patternfinder como MEME
Como un patternfinder es probabilístico, es recomendado aplicarel mismo conjunto de secuencias varias veces para obtener unasolución estable
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 45 / 60
Predicción de Promotores y Elementos Reguladores creando la PFM
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 46 / 60
Predicción de Promotores y Elementos Reguladores creando la PFM
creando la PFM
Cada columna en el alineamiento es evaluadaindependientemente, contando las instancias de A,G,C y T
Esto puede hacerse con una herramienta como EMBOSS
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 47 / 60
Predicción de Promotores y Elementos Reguladores conversión a PSSM
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 48 / 60
Predicción de Promotores y Elementos Reguladores conversión a PSSM
conversión a PSSM
Una PFM puede ser considerada como una representaciónprimaria para los modelos de unión de los factores detranscripción, pero aun no está optimizada para el escaneo desecuencias de genomas
La mayoría de los investigadores convierten estas matrices aPSSM, debemos calcular la probabilidad de agregar el nucleótidon es la posición c pn,c
pn,c =fn,c+0,25
√N
N+√
N
dado pn,c podemos convertir los valores de la matriz a valoreslogit. La conversión está dada por:
wn,c = log2(pn,c0,25)
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 49 / 60
Predicción de Promotores y Elementos Reguladores conversión a PSSM
conversión a PSSM
Un puntaje cuantitativo S para un sitio potencial es calculado conla suma de los valores relevantes de W, y está dado por:
S =∑d
i=1 wl,c
donde d es el número de columnas en W e i el nucleótidoencontrado en la posición c en el sitio potencial
como las matrices tienen distintos rangos de puntaje, senormalizan
Snorm = S−SminSmax−Smin ∗ 100
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 50 / 60
Predicción de Promotores y Elementos Reguladores conversión a PSSM
conversión a PSSM
donde S es el puntaje obtenido de alguna subsecuencia usandola PSSM
La manera más popular de representar estas secuencias esusando Logo
Intuitivamente la información contenida en una columna de laPFM corresponde a qué tan restringidos están los requerimientosde unión en cierta posición
La información contenida para una columna c en F está dada por
Ic = 2 +∑
n=A,C,G,T P(fn,c)log2p(fn,c)
p(fn,c) =fn,cN
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 51 / 60
Predicción de Promotores y Elementos Reguladores Compartiendo motivos
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 52 / 60
Predicción de Promotores y Elementos Reguladores Compartiendo motivos
Compartiendo motivos
Un problema en general es la falta de calidad en la mayoría de losfactores de transcripción registrados
Es por eso que se recomienda compartir nuestros modelosconstruidos
Algunas herramientas que permiten esto son JASPAR y PAZAR
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 53 / 60
Predicción de Promotores y Elementos Reguladores Localizar genes y promotores de interés en especies de referencia
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 54 / 60
Predicción de Promotores y Elementos Reguladores Localizar genes y promotores de interés en especies de referencia
Localizar genes y promotores de interés en especiesde referencia
Una vez que una región es seleccionada, es posible usar elnavegador para extraer secuencias relevantes para los siguientespasos
No hay reglas simples para localizar regiones candidatas. Engeneral se asume que la mayoría de las regiones reguladorascaen en las regiones de subida del inicio del sitio de transcripción
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 55 / 60
Predicción de Promotores y Elementos Reguladores Localizando secuencias ortólogas
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 56 / 60
Predicción de Promotores y Elementos Reguladores Localizando secuencias ortólogas
Localizando secuencias ortólogas
Alinear las dos secuencias usando un programa apropiado.
Elegir un programa que sea ideal para alinear secuencias de bajasimilitud, por ej LAGAN, BLAST no es ideal para este tipo deanálisis
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 57 / 60
Predicción de Promotores y Elementos Reguladores Identificando subsecuencias conservadas en el alineamiento
1 Predicción de Promotores y Elementos ReguladoresIntroducciónPromotores y elementos reguladores en procariotasPromotores y elementos reguladores en eucariotasMétodos basados en perfiles de expresiónRegulación transcripcionalSelección de sitios para construir un modelo para laspropiedades de unión de un TF específicoAlineamiento de sitioscreando la PFMconversión a PSSMCompartiendo motivosLocalizar genes y promotores de interés en especies dereferenciaLocalizando secuencias ortólogasIdentificando subsecuencias conservadas en el alineamiento
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 58 / 60
Predicción de Promotores y Elementos Reguladores Identificando subsecuencias conservadas en el alineamiento
Identificando subsecuencias conservadas en elalineamiento
La forma más común de seleccionar las subsecuenciasconservadas del genoma es usar una ventana deslizante
Una ventana con tamaño fijo se desliza sobre los alineamientos,contando el número de nucleótidos alineados idénticos
El nucleótido del centro de la ventana es etiquetado con elprocentaje de identidad
La ventana se desliza 1 bp a lo largo del alineamiento
Todos los nucleótidos que tienen una etiqueta mayor a un umbralse consideran conservados
Una elección típica es comparar humano-ratón en una ventana de50 bp y un umbral del 70 por ciento
Este análisis puede hacerse con herramientas como ConSite yrVista
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 59 / 60
Predicción de Promotores y Elementos Reguladores Identificando subsecuencias conservadas en el alineamiento
Identificando subsecuencias conservadas en elalineamiento
La interpretación de los resultados puede ser desalentadora,puesto que los modelos basados en matrices son propensos aproducir algunas predicciones falsas, aunque el método dehuellas filogenéticas pueda remover casi el 90 por ciento de laspredicciones comparado con el análisis simple de secuencias.
En general uno no debe esperar una única respuesta sinambiguedad
Sin embargo, en algunos casos el análisis puede acelerarsesignificativamente reduciendo el espacio de búsqueda a ciertasregiones reguladoras potenciales
Pedro Eduardo Torres Jiménez (CINVESTAV) Predicción de Promotores y Elementos Reguladores 09 de julio del 2013 60 / 60