29
CURSO DE FORMACIÓN CONTINUADA A DISTANCIA ACTUALIZACIONES EN EL LABORATORIO CLÍNICO BASES TECNOLÓGICAS DE PROTEÓMICA CLÍNICA CURSO 2007 - 2008 Nº 6

ACTUALIZACIONES EN EL LABORATORIO CLÍNICO BASES

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

CURSO DE FORMACIÓN CONTINUADA A DISTANCIA

ACTUALIZACIONES EN EL LABORATORIO CLÍNICO

BASES TECNOLÓGICAS

DE PROTEÓMICA CLÍNICA

CURSO 2007 - 2008 Nº 6

I.S.S.N.- 1988-7477 Título: Actualizaciones en el Laboratorio Clínico Editor: Asociación Española de Biopatología Médica Maquetación: AEBM Fecha de Distribución: Abril 2008

106

Bases tecnológicas de Proteómica

clínica

Antonio Suárez Sanz. Consultor especialista en Bioquímica Clínica del Hospital General Universitario Gregorio Marañón.

1 Introducción La Proteómica está dirigida al estudio del proteoma, que se define como el conjunto de todas las proteínas de un orgánulo subcelular, una célula, un tejido o un organismo completo. Tiene objetivos tales como la identificación de las proteínas, valorar su expresión, detectar sus modificaciones postraduccionales, conocer las interacciones de unas proteínas con otras o su función. La proteómica clínica es la aplicación de las técnicas y estrategias de la proteómica al campo de la medicina. Las aplicaciones de la Proteómica a la clínica se han potenciado notablemente desde la secuenciación del genoma humano, pues este logro ha aportado una base extensa para la identificación de las proteínas codificadas por los aproximadamente 30.000 genes que lo componen. Sin embargo el número de variantes de proteínas es mucho mayor debido a las isoformas, y las modificaciones postraduccionales que se dan en la célula como consecuencia de procesos patológicos, por causas naturales como el envejecimiento, o por un proceso de proteolisis altamente específica y limitada, que se denomina Proteolytic Processing, en el que a partir de proteínas con una determinada función se originan fragmentos con otras muy diferentes, que son los componentes del denominado peptidoma. Dada la estrecha relación que existe entre Genómica y Proteómica, los estudios genómicos y proteómicos se complementan, si bien es probable que alteraciones patofisiológicas, tales como la diabetes o el cáncer, estén más claramente reflejadas por sus expresiones proteómicas que por las genómicas; aunque las causas de la alteración sean genéticas, las consecuencias funcionales del error se manifiestan a nivel proteico en aspectos tales como pérdida de actividad, alteraciones de la regulación de sus funciones, o interacciones proteína-proteína aberrantes. Las modificaciones postraduccionales (PTMs: post-translational modifications) de las proteínas, indetectables mediante estudios genómicos, pueden provocar alteraciones en la función de proteínas que participan en procesos esenciales de la biología celular tales como el crecimiento, la proliferación o la apoptosis. También ha de tenerse en cuenta su mayor abundancia en medios biológicos con bajo contenido en mRNA como el plasma.

107

El progreso de los estudios proteómicos se ha visto impulsado por el desarrollo de diversas tecnologías de separación de proteínas como la electroforesis bidimensional (1) y la cromatografía en fase líquida en conexión con la espectrometría de masas (2), las basadas en la afinidad inmunológica y especialmente por la aplicación de la espectrometría de masas (MS; mass spectrometry) a su análisis, facilitado por las técnicas de ionización (3,4), y por el desarrollo de herramientas informáticas para el tratamiento del elevado numero de datos que se obtienen al aplicar estas nuevas técnicas analíticas de alto rendimiento. La aplicación de las técnicas proteómicas está provocando un cambio de planteamiento en los estudios de Patología, pues hasta ahora el conocimiento de la enfermedad y de los procesos patológicos ha sido necesariamente reduccionista, debido a las limitaciones de las tecnologías disponibles frente a la compleja naturaleza de los procesos fisiológicos y patológicos, que favorecía los planteamientos de estudios enfocados sobre áreas muy restringidas y eliminando variables dudosas. Sin embargo las nuevas tecnologías proteómicas están permitiendo abordar el estudio de la Patología a través de planteamientos globales (5). 2 TRATAMIENTO DE LAS MUESTRAS PARA EL ANÁLISIS PROTEÓMICO 2.1 Preparación de las muestras Las muestras destinadas al análisis proteómico están constituidas frecuentemente por una mezcla numerosa y compleja de proteínas, que difieren en gran medida en sus propiedades fisicoquímicas y biológicas. Los tipos de muestras que se analizan normalmente en la clínica son tejidos (biopsias de tumores), suero, plasma, líquido cefalorraquídeo, orina o saliva (6). Las diferencias en el procesado preanalítico de las muestras o la presencia de diferentes tipos celulares contaminantes en las piezas histológicas pueden redundar en la falta de repetitividad en los análisis. Por ello se hace necesario el empleo de protocolos estandarizados de su recogida, tratamiento, y conservación hasta el análisis, para minimizar este efecto. En cuanto a la heterogeneidad de las muestras de tejido se ha reducido mediante el uso de la tecnología de microdisección por láser. 2.1.1 Microdisección por láser Un requisito necesario para el análisis proteómico de tejidos es disponer de muestras homogéneas. Para ello se aplican técnicas mediante las que se pueden separar fragmentos reducidos de cortes histológicos, visualizados por microscopía óptica convencional, empleando para separar la muestra radiación láser. Existen dos procedimientos con fundamentos similares pero que difieren en algunos aspectos de su aplicación. 2.1.1.1 LCM (laser capture microdissection) En esta técnica la zona de interés se transfiere a una película de polímero termoplástico, mediante el uso de un láser infrarrojo de baja energía. El área de la película que recibe la energía del láser se expande y se adhiere a las células

108

subyacentes, y el calor momentáneo generado en la película se transfiere al vidrio del porta sin alterar las biomoléculas; cuando se separa la película del corte histológico lleva unida por los bordes las área recortadas, permaneciendo unido al porta el resto del corte histológico (7). 2.1.1.2 LMPC (laser microdissection and pressure catapulting) Se trata una tecnología de alta resolución mediante la cual pueden seleccionarse células aisladas o pequeñas porciones de tejido sin tomar contacto con la muestra que queda libre de contaminación (8). La tecnología se fundamenta en la adaptación de un láser UVA de pulsos a un microscopio con la posibilidad de dirigir el haz sobre un campo de diámetro reducido a través de las lentes del objetivo. Dentro del campo focal del láser se generan fuerzas que permiten el corte de la zona seleccionada (microdisección por láser) mientras que el tejido circundante permanece inalterado. En el punto focal el materia biológico se fotofragmenta en moléculas y átomos, sin transferencia de calor, por un fenómeno llamado ablación en frío, de manera que las substancias adyacentes, como las moléculas de ADN, ARN o proteínas, no se alteran y pueden someterse posteriormente a análisis. Usando el mismo láser, la célula aislada, o un grupo reducido de estas, pueden proyectarse y recogerse en un dispositivo de recepción sin que medie ningún tipo de contacto; es lo que se llama tecnología de catapultado por presión con láser (LPC; laser pressure catapulting). La secuencia de microdisección por láser y LPC componen la tecnología LMPC, que es idónea para la obtención de células específicas aisladas sin contaminación. 2.1.2 Prefraccionamiento de proteínas El prefraccionamiento de las muestras de proteínas es esencial en muchos casos para reducir su complejidad y concentrar selectivamente proteínas poco abundantes. Esta práctica está especialmente indicada en las muestras de suero o plasma que presentan grandes diferencias de concentración entre sus proteínas componentes. Así, en el plasma, la relación de concentraciones, denominada rango dinámico, entre la albúmina y la troponina I, es de 109 . Las 22 proteínas más abundantes aportan más del 99% de la masa de las proteínas plasmáticas, mientras que el 1% restante está compuesto por miles de proteínas, entre las que posiblemente se encuentren las de mayor interés biológico. Los valores muy elevados de rango dinámico en una muestra de plasma reducen la eficacia del análisis por MS de las proteínas minoritarias, de modo que la eliminación de las más abundantes se hace necesaria para la obtención de un perfil proteómico adecuado. La eliminación de las proteínas más abundantes, principalmente la albúmina, y la consiguiente concentración de las de mayor interés biológico, se basa en la aplicación de técnicas de precipitación selectiva y de afinidad. Últimamente, ante el interés creciente por los péptidos componentes del plasma, por su posible valor diagnóstico, se siguen estrategias dirigidas a aislarlos del plasma y su posterior análisis por MS.

109

Mediante el fraccionamiento subcelular se puede obtener información sobre la función y localización de las proteínas, incluidas las muy poco abundantes, Fig 1.

Fig 1. Representación esquemática de un protocolo de análisis proteómico, que parte de la preparación de la muestra, y llega hasta la identificación de las proteínas por MS. Proteomics Clin Appl (2007), 1: 4-17. La centrifugación es el método más eficaz para el aislamiento de los orgánulos subcelulares, siendo esencial la pureza de las fracciones para el análisis completo de los respectivos proteomas. Una estrategia de fraccionamiento en tres partes formadas por un sedimento nuclear, vesículas de membrana, y componentes citoplasmáticos, puede aplicarse mediante centrifugación en gradiente, o empleando kits de enriquecimiento de fracciones que requieren solo centrífugas de mesa. Para obtener un mayor grado de pureza, la centrifugación se ha de complementar con técnicas de afinidad empleando anticuerpos frente a proteínas de membrana presentes en la superficie del orgánulo a aislar. La aplicación de estas técnicas, aunque incrementa la pureza de las fracciones, no asegura que ésta sea total, pues en la célula se producen intercambios de proteínas entre diferentes orgánulos como consecuencia de los procesos fisiológicos naturales. 2.1.3 Purificación y disolución de las proteínas Con frecuencia, las proteínas se han de aislar de muestras que contienen otros componentes biológicos, tales como hidratos de carbono, lípidos y ácidos ucléicos. Los protocolos de purificación de las proteínas incluyen la homogeneización de las células o los tejidos que las contienen, seguida de la disolución en un medio acuoso constituido por detergentes como el CHAPS ( sulfato de 3-dimetilamonio-1-propano), Tween o SDS (sodium dodecyl sulfate),

110

que ayudan a disolver las proteínas y a separarlas de los componentes lipídicos. Otros componentes han de ser agentes reductores como el DTT (Dithiothreitol) y desnaturalizantes como la urea, que rompe los puentes de hidrógeno que participan en el mantenimiento de las estructuras tridimensionales de las proteínas. También es necesaria la presencia de ADNasas y ARNasa que degraden los ácidos nucléicos. Las proteasas de los tejidos deben desactivarse para evitar la degradación proteica y la pérdida de proteínas de peso molecular elevado; la presencia de Urea 8 M, de SDS al 2%, o una temperatura baja de homogeneización puede ser suficiente para inactivar una elevada proporción de proteasas, pero otras necesitan la presencia de inhibidores específicos, por lo que suelen añadirse combinaciones de estos durante el procesado de las muestras. Los iones salinos pueden interferir con la separación electroforética, por lo que deben eliminarse del medio cuando su concentración sea elevada (> 100 mM) (9). 3 TÉCNICAS DE SEPARACIÓN DE PROTEÍNAS Las numerosas técnicas que se emplean en proteómica para la separación de las proteínas pueden agrupase en dos conjuntos en función del principio separador que predomine en el proceso; i) técnicas basadas en gel, que son técnicas electroforéticas en las que se utilizan como soporte geles de poliacrilamida o sus derivados; ii) técnicas no basadas en gel, en las que se incluyen las cromatográficas y las de afinidad inmunológica de alto rendimiento 3.1 Técnicas basadas en gel La tecnología más utilizada para la separación de proteínas es la electroforesis en geles de poliacrilamida. Para algunas aplicaciones proteómicas la electroforesis monodimensional en gel es el método de elección. En él las proteínas se separan en función de su masa. Se trata de una técnica sencilla, reproducible y que permite la separación de proteínas de 10-300 kDa de peso molecular. Una de sus aplicaciones más comunes es la caracterización de las proteínas en un proceso de purificación (10). 3.1.1 Electroforesis bidimensional en geles de poliacrilamida: 2D-PAGE (two-dimensional polyacrylamide gel electrophoresis) Es la técnica de separación de proteínas de mayor difusión, ya que ofrece una resolución muy buena junto con la posibilidad de aplicación a una gran diversidad de muestras. En la 2D-PAGE las proteínas se separan en primer lugar por isoelectroenfoque (IEF; isoelectrofocusing) en función de sus pI, utilizando para ello un gel en el que existe un gradiente de pH, establecido mediante el empleo de substancias conocidas como anfolitos, aunque en la actualidad se ha generalizado el uso de inmovilinas con este fin. Posteriormente las proteínas se someten a una segunda separación en función de su peso molecular empleando geles de SDS-PAGE. Las proteínas separadas se disponen en la superficie del gel, donde se visualizan empleando colorantes como el azul Coomasie o el nitrato de plata, o fluorocromos como el SYPRO Ruby. Después de la separación y la tinción se pueden recortar las proteínas del gel, someterlas a

111

digestión con proteasas -normalmente tripsina- y analizar la mezcla de péptidos por MS. Sus grandes ventajas como técnica radican en la posibilidad de separar, visualizar y servir de “colector de fracciones” de miles de proteínas simultáneamente (1). Aunque la 2D-PAGE es la técnica de mayor difusión, tiene algunas limitaciones derivadas de la variabilidad entre geles, de la dificultad de automatización de la técnica y de la imposibilidad de aplicar a proteínas hidrofóbicas, muy básicas, de alto peso molecular o poco abundantes. La disponibilidad comercial de gradientes de pH preformados en tiras mediante inmovilinas (IPG; immobilized pH gradients) y de geles de alta resolución para la segunda dimensión ha incrementado considerablemente la reproducibilidad de la técnica, y su resolución, y ha ampliado los límites de aplicación impuestos por los pI extremos de las proteínas. 3.1.2 DIGE (difference gel electrophoresis) Se trata de una variante del método de 2D-PAGE por lo que se llama también 2D-DIGE. Esta técnica ha resuelto algunos de los problemas inherentes a la 2D-PAGE clásica, incrementando la velocidad de realización, la reproducibilidad y la sensibilidad, aunque también se incrementa el número de pasos de que consta el proceso, Fig 2 .

Fig 2. Esquema de la tecnología 2D-DIGE. En el procedimiento DIGE, se aíslan la muestra problema y la control, que se marcan con Cy3 y Cy5 respectivamente. Una muestra, que sirve como estándar se marca con Cy2. Las tres muestras marcadas se mezclan y se separan en 2D-PAGE. Después de la separación electroforética, el gel se escanea a las tres longitudes de onda y se analizan e integran las imagenes generadas. Por otro lado, las proteínas de interés se recogen y se identifican por MS. Proteomics Clin Appl (2007), 1:4-17.

112

Conceptualmente la técnica de DIGE se basa en el marcaje covalente de los extractos de proteínas a comparar con diferentes fluorocromos, como las cianinas Cy2, Cy3, o Cy5 o los colorantes Alexa. Los fluorocromos Cy se unen a través de enlaces amida a los grupos -NH2 de las proteínas, sin modificar el pI de éstas porque el residuo del colorante también se encuentra protonado a pH neutro o ácido. Al utilizar 2D-DIGE se pueden seguir dos procedimientos diferentes; i) el de marcaje mínimo; y ii) el de marcaje a saturación (11). En el procedimiento de marcaje mínimo, la relación proteína-fluorocromo que se hace reaccionar se mantiene en una proporción tal que solamente un 3% de las proteínas visualizadas en el gel estén marcadas, y por una sola molécula de fluorocromo. El protocolo normal de aplicación de la técnica consiste en marcar cada una de las muestras a comparar, a través de los residuos de lisina, con un fluorocromo diferente: Cy3 y Cy5 por ejemplo; una tercera muestra que actuará como estándar interno se hace reaccionar con Cy2, las muestras así marcadas se mezclan y se separan las proteínas por 2D-PAGE. En el gel así obtenido se cuantifica la fluorescencia emitida a cada una de las tres longitudes de onda diferentes que caracterizan a los respectivos residuos de Cy2, Cy3, y Cy5, usando un lector de fluorescencia, tipo Typhoon (GE Healthcare) y un software como DeCyder (GE Healthcare), que permiten el análisis diferencial de las manchas. Los geles se pueden revelar con colorantes de tipo SYPRO Ruby o Deep-Purple, recoger las áreas del gel que contiene las manchas e identificarla por MS. La comparación de los perfiles de expresión cuantitativa de las proteínas de las dos muestra es rápida y precisa, pues se basa en la utilización de las intensidades de fluorescencia relativa procedentes del mismo gel. Los protocolos de marcaje a saturación se aplican a muestras de tamaño reducido, por ejemplo muestras obtenidas por LCM. La variación con respecto al procedimiento anterior radica en que los fluorocromos empleados portan grupos reactivos de maleimida, que se unen a los residuos de cisteína de las proteínas a través de un enlace tioeter. La intensidad de la señal fluorescente de las proteínas marcadas es mayor y como consecuencia se incrementa el número total de proteínas detectables en el gel. Los inconvenientes que presenta esta técnica se deben a la recuperación desigual de los péptidos después de la digestión de las proteínas con tripsina, y a ser una técnica de rendimiento relativamente bajo. 3.2 Técnicas no basadas en gel 3.2.1 Cromatográficas Cromatografía líquida-Espectrometría de masas: LC-MS (liquid chromatography-mass spectrometry) Este grupo alternativo de técnicas de separación se basa en la cromatografía en fase líquida. Un sistema de LC consta de los siguientes elementos; i) una fuente de medio de elución (fase móvil); ii) una bomba conectada a un programador de flujo; iii) un inyector de muestras; iv) una

113

columna de separación cromatográfica (fase estacionaria); v) un detector de los analitos; vi) un dispositivo de integración de las señales del detector (Fig 3).

Fig 3. Sistema LC-MS esquematizado. El componente de MS está compuesto por una fuente que genera iones en fase de vapor, un analizador que los separa, y un detector en el que inciden finalmente. Los tipos de fuentes pueden ser diversos: ESI, NSI (nanospray ionization), o APCI (atmosferic pressure chemical ionization). Se indican también diferentes tipos de analizadores: TOF, Q o FTICR. Proteomics Clin Appl (2007), 1: 4-17.

Cuando se aplica al análisis proteómico, el sistema de LC se conecta con el espectrómetro de masas a través de una interfase para obtener un instrumento LC-MS en el que se combinan la capacidad separadora de la LC con la analítica de la MS. Un elemento clave en esta estructura es la interfase, a donde llega de forma continua durante el análisis el medio de elución con los analitos procedente de la separación cromatográfica; en ella se han de eliminar las substancias que acompañan a los analitos, y estos han de ionizarse y pasar a fase de vapor antes de entrar en el espectrómetro de masas. Existen diferentes tipos de interfases en las que pueden realizarse estas operaciones, tales como las de ionización química a presión atmosférica, o las de bombardeo atómico rápido.

La LC-MS es una técnica muy específica y sensible que se utiliza para la identificación de proteínas en muchos laboratorios de proteómica. Un protocolo de análisis frecuentemente aplicado se basa en la digestión de las proteínas con tripsina seguida de la identificación de los péptidos mediante LC-MS. Esta aproximación “sin gel” tiene muchas ventajas; i) es rápida; ii) se puede aplicar al análisis de mezclas complejas de proteínas a baja concentración; iii) se puede aplicar al análisis de muestras de pequeño tamaño, como las obtenidas a partir de fases iniciales del cáncer empleando LCM. La LC presenta variantes dependiendo del tipo de columnas con diferente principio separador que intervengan en el proceso cromatográfico, 1-D LC (one-dimensional liquid chromatography) cuando participa una única columna y 2-D LC (two-dimensional liquid chromatography) cuando participan dos columnas diferentes. En este caso se produce una primera separación (1ª dimensión) con una columna que puede ser de características

114

variables, frecuentemente de filtración en gel o de intercambio iónico, seguida de una separación en una columna RP (2ª dimensión); con esta disposición se consigue que los analitos estén disueltos en el medio más adecuado para su paso al espectrómetro de masas. La disposición básica descrita se puede modificar para obtener mejores rendimientos en función de las características de la muestra, que puede ser una mezcla de proteínas o bien de péptidos de diferentes tamaños. El sistema cromatográfico puede hacerse bastante más complejo que el básico antes descrito, ya que la presencia de columnas adicionales hace necesario colocar nuevas válvulas y dispositivos de división de flujo en el sistema, y ello redunda en un incremento de las dificultades para su automatización 3.2.2 Tecnología de identificación multidimensional de proteínas: MudPIT ( Multi-dimensional protein identification technology) Se trata de una variante de la técnica anterior, de la que se diferencia por la utilización de columnas bifásicas microcapilares (100 µm de diámetro interior), que están rellenas con dos fases estacionarias diferentes: el tramo inicial de la columna con una resina de intercambio catiónico tipo SCX, y el siguiente con RP, Fig 4.

Fig 4. Técnica de análisis multidimensional de proteínas (MudPitt). Mezclas complejas de péptidos procedentes de lisados celulares se separan en una columna microcapilar bifásica, rellena en su primer tramo con un intercambiador catiónico (SCX) y en el segundo con RP. Los péptidos separados en el cromatógrafo pasan al espectrómetro colocado a continuación a través de una interfase. Lab Invest (2004), 84: 1227-1244.

Las proteínas que atraviesan una columna bifásica se separan en el primer tramo por su carga (primera dimensión), y en el segundo por su hidrofobicidad (segunda dimensión). En la elución de la columna se utiliza en primer lugar, como fase móvil, un gradiente de concentración de sales, seguido de una rampa de concentración de disolvente orgánico para separar los péptidos de la RP que pasan a la interfase ESI de un espectrómetro. Esta técnica, además de proporcionar una separación de numerosos péptidos, es susceptible de automatización, de modo que se considera la técnica alternativa a la 2D-PAGE-MS, o bien complementaria a ella, pues permite analizar muestras de proteínas con valores de pI, hidrofobicidad, o concentración para las que aquella resulta ineficaz.

115

3.3 Técnicas basadas en la afinidad Microarrays de proteínas Es una metodología de alto rendimiento que permite detectar simultáneamente múltiples interacciones moleculares mediante la utilización de plataformas de proteínas similares a las de ADN, de modo que se pueden obtener perfiles de proteínas y sus modificaciones postraduccionales con un rendimiento muy superior a lo que permiten hacerlo otras técnicas basadas también en la afinidad inmunológica como el Western blot o el ELISA. Los inconvenientes de las técnicas basadas en microarrays se derivan de los costes de la obtención de anticuerpos y de la disponibilidad limitada de anticuerpos con elevada especificidad y afinidad. 3.3.1 Fundamento de los sistemas de microarrays En un proceso analítico basado en la utilización de arrays se produce una unión de ligandos (antígeno-anticuerpo, enzima-substrato, cadenas complementarias de ADN, etc), y el complejo formado ha de generar una señal que permita su detección. Uno de los ligandos , la molécula aceptora, se fija sobre una matriz sólida de naturaleza química diversa, frecuentemente nitrato de celulosa sobre un soporte de vidrio, y el otro ligando se encuentra libre y se le llama molécula diana. Las moléculas aceptoras se disponen como manchas circulares cuya superficie es crítica, pues ha de ser suficientemente pequeña para que al producirse la unión de ligandos (ej, Ag-Ab) la disminución de la concentración de moléculas diana sea inapreciable. En estas condiciones de ensayo la densidad de energía que emite el complejo formado por la unión de ligandos es máxima y constante, y el sistema funciona como un sensor de concentración (esto se da en tamaños de manchas en los que las moléculas receptoras sean menores de 0.1/KD, siendo KD la constante de disociación de la interacción de ligandos). Estas condiciones no se dan si las manchas son de área superior a la crítica, pues entonces emiten mayor señal en términos absolutos, pero las características del sistema no le permiten actuar como sensor de concentración ya que la cantidad de analito en la muestra que se está analizando ha disminuido de modo significativo (12). 3.3.2 Formatos de microarrays aplicados al estudio de las proteínas Existen diferentes formatos de microarrays (13) aplicados al estudio de las proteínas:

a) Arrays de tejidos (TMAs) Las moléculas aceptoras se encuentran dentro de las estructuras de cortes histológicos circulares de unos 600 µm de diámetro procedentes de muestras fijadas previamente en formol e incluidas en parafina (FEPP;formalin-fixated paraffin embedded). La detección de las moléculas de interés se hace por métodos inmunohistoquímicos (IHC; immunohistochemicals). Sus ventajas se derivan de la uniformidad en el tratamiento de las muestras, del ahorro de tiempo y trabajo y de la posibilidad de localizar las moléculas dentro de las estructuras subcelulares de que forman parte. Se utilizan frecuentemente en Oncología. Sus inconvenientes son similares a los del análisis microscópico

116

visual, como la subjetividad en las determinaciones y el carácter cualitativo o semicuantitativo de los resultados.

b) Arrays de proteínas (de anticuerpos o de fase directa). En este formato las moléculas aceptoras son anticuerpos frente a proteínas componentes de la muestra a analizar (Fig 5), que puede ser suero, un lisado celular, etc.

Fig 5. Esquemas de arrays de proteínas en fase directa FPAs (forward phase arrays) o de anticuerpos, y en fase reversa RPAs (reverse phase arrays), también llamados arrays de lisados de tejidos TLAs (tissue lysate arrays). En los FPAs, las moléculas de captura son anticuerpos y se fijan sobre un substrato de nitrocelulosa, y se unen a las proteínas antigénicas componentes de la muestra. Se pueden visualizar usando un segundo anticuerpo marcado con un cromóforo o fluoróforo. En los RPAs se inmoviliza el proteoma completo a analizar sobre el substrato de nitrocelulosa y se hace reaccionar con anticuerpos conocidos altamente específicos y sensibles. Ann Oncol, (2005), 16:16-22.

Permiten obtener el perfil proteico de una o dos muestras diferentes simultáneamente. Se utilizan frecuentemente en Inmunología, en el estudio de enfermedades autoinmunes o de citoquinas. La sensibilidad en la detección se puede incrementar mediante un sistema con amplificación por círculo rodante (RCA;rolling circle amplification). Los problemas que pueden presentarse en este método se derivan de la desnaturalización de los anticuerpos al fijarlos, de la modificación de la muestra al unirle los fluoróforos si se utiliza la técnica de dos marcadores en la detección, o de la necesidad de obtener dos anticuerpos para cada molécula diana si el revelado es tipo sandwich.

c) Arrays de Fase Reversa Las moléculas aceptoras suelen ser las proteínas componentes de lisados celulares (14), y en el array cada mancha procede de una muestra diferente (Fig 5). Las moléculas diana son anticuerpos conocidos. Permiten la obtención de perfiles de anticuerpos de numerosas muestras. Se necesitan cantidades de lisado muy pequeñas. Su aplicación es especialmente adecuada al estudio de transducción de señales. Presentan como inconvenientes la posibilidad de reacción cruzada frente los anticuerpos y la necesidad de utilizar múltiples portas.

117

4 Técnicas analíticas basadas en la MS El desarrollo de instrumentos sensibles capaces de analizar moléculas biológicas de gran tamaño ha facilitado en gran medida el estudio del proteoma. La evolución de los espectrómetros de masas que miden con gran precisión la masa de las moléculas, junto con el desarrollo de nuevos métodos de ionización (4,15), han hecho de la MS la herramienta más eficaz y universal para determinar la estructura primaria de las proteínas. También es muy eficaz para medir su abundancia. Generalmente, la medida de las masas de péptidos por MS es más precisa que la de las proteínas intactas; por este motivo se fragmentan las proteínas en péptidos antes de su análisis. 4.1 Espectrómetros de masas

Un espectrómetro de masas está compuesto por tres elementos: i) una fuente de iones; ii) el analizador de masas; y iii) el detector. La fuente de ionización genera iones a partir de la muestra a analizar; el analizador de masas separa los iones en función de la relación masa-carga (m/z) y el detector determina la masa de los iones. La m/z es la medida fundamental en el análisis por MS (9). Las fuentes de ionización actualmente más usadas son MALDI (matrix-assisted laser desorption/ionization) y ESI (electrospray ionization), pero existen otros tipos como NSI (nanospray ionization) o el APCI (atmospheric pressure chemical ionization). Los analizadores de masa que se utilizan en el análisis proteómico son de varios tipos: cuadrupolos, trampa iónica (ion-trap), TOF (Time Of Fligh) o FTICR (Fourier Transform Ion Cyclotron Resonance). Las características más relevantes de un analizador de masas son: i) la precisión, que es el grado en que refleja la verdadera m/z; ii) la resolución, que es la capacidad de discriminar iones con diferentes valores de m/z y iii) el intervalo de masa en que opera el analizador en condiciones óptimas. 4.2 Fuentes de Ionización Las fuentes de ionización convierten moléculas neutras en iones incorporando o extrayendo uno o más protones, de modo que estos pueden portar una o múltiples cargas; al estar en forma iónica se pueden analizar en el espectrómetro. El desarrollo de las técnicas de ionización llamadas soft o de baja energía, entre las que se encuentran las MALDI y las ESI, han sido esenciales para la implantación del análisis por MS de grandes moléculas, especialmente las proteínas.

118

4.2.1 MALDI En esta técnica de ionización la muestra a analizar, formada por péptidos y/o proteínas (A), se mezcla con una matriz química (M), por ejemplo ácido sinápico (ácido 3,5-dimetoxi-4-hidroxicinámico), cuyas moléculas se ionizan al incidir sobre ellas un rayo láser y transfieren un protón a las moléculas de la muestra (MH+ +A� M+ AH+), pasando a fase de vapor antes de entrar al interior del espectrómetro (Fig 6).

Fig 6. Esquemas de las fuentes de ionización de péptidos mas usuales en el analisis proteómico por MS. El método ESI volatiliza e ioniza los péptidos y proteínas en solución, esta se proyecta como spray en un campo electrico, donde las gotitas se reducen progresivamente su tamaño, y los péptidos adquieren cargas. En el método MALDI los analitos se cristalizan conjuntamente con una matriz compuesta por un ácido orgánico sobre un soporte sólido. Mediante pulsos de laser UV se consigue que los componentes de la mezcla adquieran una carga y pasen a fase de vapor. Lab Invest (2004), 84: 1227-1244. Existe una variante del concepto MALDI que recibe el nombre de SELDI (surface-enhanced laser desorption/ionization), introducido en 1993 (16). En este formato se incorpora un chip para proteínas de CiphergenTM (the ProteinChipR array, Ciphergen Biosystems, Freemont, CA) que las retiene selectivamente sobre superficies cromatográficas en fase sólida que difieren en sus características biofísicas y cromatográficas, en función de las cuales interaccionan con diferentes grupos de proteínas de la muestra( Fig 7).

119

Fig 7. Representación esquemática del procedimiento analítico SELDI-TOF. Parte A, chips formados por substancias con funciones químicas diversas para captar diferentes grupos de proteínas. Parte B, muestra el mecanismo de adsorcion-desorción de las proteínas y su ionización antes de entrar en el analizador de masas. Clin Chim Acta (2005), 357: 123-139.

Las superficies pueden presentar, entre otras, propiedades hidrofóbicas, de intercambio iónico, o poseer iones metálicos inmovilizados con una alta afinidad por las proteínas fosforiladas. Después de aplicar la muestra al chip éste se lava para eliminar los componentes que no han interaccionado, se incorpora ácido sinápico como matriz química, y se administra energía a las superficies mediante láser para vaporizar e ionizar la muestra como en MALDI. La técnica tiene algunas limitaciones, pues presenta una buena sensibilidad frente a las proteínas comprendidas en el intervalo de 20 a 30 kDa de masa molecular, pero frente a las de mayor masa disminuye. 4.2.2 ESI En este procedimiento los iones se generan a partir de una solución acuosa de los péptidos, de donde son extraídos e ionizados mediante el paso a través de un capilar en cuya salida existe un campo eléctrico de alto voltaje; la solución se proyecta a la salida del capilar como una dispersión de gotitas cargadas positivamente, eliminándose el disolvente progresivamente mediante un flujo de gas inerte caliente y quedando solo las moléculas cargadas (Fig 6). Las soluciones con pH ácido favorecen la protonación de las aminas N-terminales, y los nitrógenos imidazólicos de las Histidinas; por este motivo, los protocolos de ionización por ESI incluyen pasos de acidificación previos a la entrada de los iones al analizador. Las moléculas de masa superior a 1200 Da dan lugar a iones con más de una carga, de modo que una molécula proteica de 20 kDa puede captar entre 10 y 20 cargas positivas.

120

4.3 Analizadores de masas Los analizadores de masas miden la relación carga-masa de los iones generados por una fuente de ionización. En el análisis proteómico se emplean diversos tipos de analizadores de masas, entre los que se encuentran los cuadrupolos, los de trampa iónica, los de tiempo de vuelo (TOF, time of flight), y los de resonancia de ión ciclotrón con transformada de Fourier (FTICR, Fourier transform ion cyclotron resonance). Tambien se usan estructuras híbridas producto de la anexión de un tipo de analizador a otro (9,Lim et al, 2004). 4.3.1 Analizadores cuadrupolo (Q) Un cuadrupolo se compone de cuatro barras paralelas, con una disposición cuadrangular, que conducen la corriente eléctrica (Fig 8).

Fig 8. Tipos de analizadores de masas usados en el análisis proteómico. a) analizador Cuadrupolo (Q), en el que los iones se desvían entre cuatro polos formados por rodillos paralelos mediante la aplicación de potenciales alternativos de radiofrecuencia; b) en los analizadores de tiempo de vuelo (TOF), los iones se aceleran linealmente en el interior del tubo de vuelo hasta que impactan en el detector colocado en el extremo opuesto. Los iones de menor masa alcanzan mayor velocidad y llegan al detector antes que los mas pesados; c) Los analizadores de trampa iónica poseen un electrodo anular, un electrodo de entrada y uno de salida. Tienen la capacidad de atrapar los iones en un campo eléctrico tridimensional. Lab Invest (2004), 84:1227-1244.

Las cuatro barras forman un canal a través del cual migran los iones. El haz de iones que penetra en el cuadrupolo esta formado por una mezcla de estos con diversos valores m/z, pero se puede conseguir que sólo los iones de un intervalo de m/z determinado se desplacen a través del dispositivo hasta alcanzar el detector; para ello a las barras del cuadrupolo se les aplica, de forma adicional, una radiofrecuencia y un voltaje que les permiten mantener trayectorias estables, mientras que los demás se desvían y quedan excluidos. Los analizadores cuadrupolo forman buenas combinaciones con las fuentes ESI, pues toleran bien las presiones originadas en esta fuente de

121

ionización y la mayor amplitud de valores m/z a que dan lugar los iones con múltiples cargas. 4.3.2 Analizadores de tiempo de vuelo (TOF) En los analizadores de masa de tiempo de vuelo, los iones procedentes de la fuente de iones se aceleran linealmente dentro de un tubo de 0,5 a 2 m de longitud, por la acción de un potencial comprendido entre 1 y 20 kV, hasta que impactan en el detector situado al final del tubo (Fig 8). Dado que los iones tienen la misma energía pero diferente masa, los iones con menor m/z alcanzan velocidades mayores que los que tienen mayor m/z. La medida del tiempo que tarda el ión en alcanzar el detector permite determinar m/z. La técnica TOF tiene un poder de resolución de masa mayor de 12.000 Da. Aunque los analizadores TOF se combinan frecuentemente con fuentes de ionización MALDI, también puede hacerse con las ESI. Para el análisis proteómico también puede hibridarse con otros analizadores en diversas combinaciones, como con el Cuadrupolo, dando un sistema Q-TOF que mejora considerablemente el rendimiento analítico, o bien colocarse en tándem con otro analizador TOF y fuente de ionización MALDI, dando un equipo de estructura MALDI-TOF-TOF. 4.3.3 Analizadores de trampa iónica (Ion-trap) La característica distintiva del analizador de masas de trampa iónica es la capacidad de atrapar iones en un campo eléctrico tridimensional. Los iones quedan capturados en el centro del dispositivo durante un determinado intervalo de tiempo y luego se someten al análisis de masas (Fig 8). Los instrumentos de trampa iónica son muy versátiles y pueden combinarse fácilmente con separaciones por LC y con fuentes tipo ESI y MALDI. El desarrollo de analizadores de trampa iónica lineal con mayores capacidades de atrapamiento de iones ha expandido el rango dinámico de las muestras a analizar y la sensibilidad general de la técnica. 4.3.4 Analizadores FTICR Este instrumento puede considerarse como un tipo especial de analizador de masas de trampa iónica, pero tiene una característica distintiva: la célula de captura está rodeada por un campo magnético dentro del cual los iones atrapados describen un movimiento ciclotrónico circular en la célula alrededor del eje z del campo magnético. El valor m/z puede determinarse midiendo la frecuencia del movimiento de los iones y aplicando una transformada de Fourier. Los analizadores de masa FTICR son muy potentes, poseen una gran sensibilidad, alta precisión de masa y elevada resolución. Son especialmente compatibles con las fuentes de ionización ESI, aunque también pueden usarse con las MALDI. Su manejo es difícil, por lo que se elude su uso en el análisis proteómico de rutina.

122

4.3.5 Espectrómetros de masas en tándem (MS/MS(CID) La espectrometría de masas en tándem o MS/MS se realiza colocando dos espectrómetros de masa secuencialmente conectados a través de una célula de colisión. El primer espectrómetro de masas (MS1) se utiliza para seleccionar los iones con un determinado m/z, a los que se denomina iones precursores; estos se dirigen a la célula de colisión, donde chocan con moléculas de gas que los fragmentan en iones más pequeños en un proceso que se denomina disociación inducida por colisión (CID, collisión-induced dissociation). Los iones formados reciben el nombre de iones producto y su espectro de masas se determina en el segundo espectrómetro de masas (MS2). La MS/MS tiene la ventaja de que los compuestos se caracterizan por dos propiedades físicas; la masa iónica del ión precursor y la masa iónica de los iones producto. La fragmentación de los iones precursores suministra información estructural para determinar la secuencia de aminoácidos de los péptidos y para caracterizar las modificaciones postraduccionales de las proteínas. 4.4 Detectores Los espectrómetros de masas utilizan para la detección de los iones multiplicadores electrónicos, que emplean placas multiplicadoras o dínodos. Todas se fundamentan en el principio de la multiplicación de electrones, de forma que tras el choque de un ión sobre el primer dínodo se amplía el número de electrones con un factor muy elevado. 5 ESTRATÉGIAS DE IDENTIFICACIÓN DE PROTEÍNAS Las proteínas se pueden identificar a partir de los datos obtenidos por MS, siguiendo diferentes estrategias: i) La denominada de huella peptídica (PMF, peptide mass fingerprinting) o mapeo peptídico, y ii) Las basadas en la fragmentación de péptidos. Cuando se obtiene la secuencia total de aminoácidos se denomina secuenciación de novo, pero si se obtiene solo una secuencia parcial se utiliza junto con otros datos para obtener una etiqueta de secuencia. Para la técnica de huella peptídica se emplea MALDI-TOF MS y para la secuenciación de péptidos la espectrometría de masas en tándem MS/MS (17). 5.1 Huella peptídica La técnica de huella peptídica es el método más sencillo para la identificación de proteínas; en ella se combina la fragmentación en péptidos con la espectrometría de masas de estos y con el análisis informatizado de los datos obtenidos mediante un algoritmo matemático (Fig 9).

123

Fig 9. Diferentes estrategias para la identificación de proteínas mediante MS: Huella peptídica y etiqueta peptídica . J Chromatogr B (2003), 787: 101-128. Para fragmentar de forma controlada las proteínas se emplean proteasas, muy frecuentemente Tripsina, o medios químicos, como el bromuro de cianógeno, para romper enlaces peptídicos específicos. Los péptidos formados se analizan mediante MS, y sus masas se comparan con las masas de péptidos teóricos de proteínas contenidas en una base de datos. Las proteínas que presentan mayor número de péptidos, cuyas masas experimentales y teóricas coinciden, se consideran las de identidad más probable. La Tripsina es una proteasa muy adecuada para utilizar en esta técnica, pues es relativamente barata, es eficaz, y, dada su especificidad catalítica, genera abundantes péptidos de tamaño medio (8-10 aminoácidos), que son muy adecuados para el análisis por MS. Esta técnica tiene su aplicación óptima en la identificación de proteínas procedentes de especies cuyo genoma ha sido secuenciado y que se separan previamente por 2D-PAGE. De esta forma se dispone de la información contenida en bases de datos de secuencias proteicas deducidas a partir de las genómicas, y de los valores de pI y masa molecular suministrados por la electroforesis bidimensional. 5.2 Secuencia peptídica La secuencia peptídica se obtiene mediante la utilización de dos espectrómetros de masa en tándem (MS/MS). En el proceso tiene lugar la escisión al azar de los enlaces que unen los aminoácidos de un péptido, separado en el primer espectrómetro de masa del tándem y provocada por CID en la célula de colisión, lo que produce series de iones cuyos valores m/z

124

constituyen la información fundamental para la determinación de la secuencia, Fig 9. Los enlaces más lábiles del esqueleto peptídico son generalmente los enlaces amida, lo que conduce a la escisión entre aminoácidos. Los fragmentos se separan en el segundo espectrómetro de masas de acuerdo con su relación m/z. Los espectros de masas que se obtienen corresponden a series de iones fragmento secuenciales, que reflejan la secuencia de aminoácidos leída desde el extremo N-terminal o C-terminal. La nomenclatura de los péptidos lineales protonados adjudica a, b, c a los iones que contienen el N-terminal, y x, y, z a los que contienen el C-terminal (Fig 10).

Fig 10. Iones procedentes de la fragmentación de un péptido por CID (Collision-induced dissociation). La fragmentación tiene lugar, preferentemente, a lo largo del esqueleto peptídico. La rotura que mas frecuente se produce es la del enlace entre el C del grupo Carbonilo y el N del grupo amida, dando lugar a un ión y y a un ión b . Los fragmentos del péptido que portan una carga positiva y el NH2-terminal se designan como a,b,c y los que portan una carga positiva en el extremo CO2H-terminal se designan como x,y,z. Lab Invest, (2004), 84: 1227-1244.

La diferencia de masa de dos iones consecutivos del mismo grupo de letras representa la masa del residuo de aminoácido intercalado. Los iones fragmento internos, que no contienen ningún extremo, también aportan información para establecer la secuencia del péptido. Según la calidad de los datos obtenidos por fragmentación de péptidos se pueden seguir dos aproximaciones para su identificación; i) etiqueta de secuencia del péptido, cuando se llega a deducir solo una parte de su secuencia, y se basa en la comparación con una base de datos de dicha secuencia parcial de la masa del péptido precursor y de la localización de la secuencia conocida dentro del péptido precursor; ii) secuenciación de novo, que se obtiene cuando la fragmentación es tan buena que permite deducir la secuencia completa. Una vez conocida la secuencia de los péptidos se pasa a la identificación de la proteína, que puede hacerse comparando un número de péptidos mucho menor que en la identificación por PMF. Existen varios programas para comparar los espectros MS/MS con bases de datos de secuencias; los dos algoritmos de búsqueda más usados son: MASCOT (http:///www.matrixscience.com) y SEQUEST (http://fields.scripps.edu/sequest). Esta estrategia se aplica a la identificación de proteínas que forman parte de muestras complejas.

125

6 Aplicaciones de la proteómica basada en la MS Hay dos grandes grupos de aplicaciones de la Proteómica al estudio de la Patología humana; i) Proteómica de expresión, y ii) Proteómica funcional. La Proteómica de expresión hace referencia a la identificación y cuantificación de las proteínas expresadas en una muestra biológica, como suero o tejidos. Los resultados que se obtienen permiten la identificación de biomarcadores o proteínas específicas de una enfermedad, que pueden ser dianas terapéuticas. La proteómica funcional es la que aborda el estudio de las proteínas en su entorno funcional, lo que incluye la interacción de las proteínas con ADN o ARN, las interacciones proteína-proteína y las modificaciones postraduccionales tales como fosforilación o nitrosilación. Este último aspecto permite obtener información acerca de la función que realiza una proteína, identificando por ejemplo redes de rutas de señalización que sean características de estados fisiológicos y patológicos. 6.1 Proteómica de expresión 6.1.1 Perfil proteico La aplicación de las técnicas proteómicas a la clínica ofrece la posibilidad de obtener perfiles de proteínas a partir de muestras de tamaño reducido de suero o tejidos, sin que sea necesario su aislamiento previo. Un método cuya aplicación al campo de la proteómica clínica ha suscitado grandes expectativas es SELDI-TOF (Fig 7). Esta técnica utiliza para el análisis muestras reducidas de suero y puede procesar un número elevado de estas en poco tiempo ( 800/día). Los espectros de masas reflejan el contenido en proteínas y péptidos de las muestras. El análisis diferencial y estadístico del conjunto de datos obtenidos a partir de los perfiles proteicos de muestras procedentes de controles sanos y patológicos es una de las etapas más importantes de los estudios proteómicos. Para ello se aplican algoritmos matemáticos que permiten extraer de los espectros de masas la mejor combinación de marcadores para discriminar cada grupo. Este procedimiento se ha aplicado al análisis de patologías neoplásicas tales como cáncer de ovario, mama, próstata o hígado. La técnica se puede emplear también en el análisis de lisados de muestras citológicas o de tejido, detectando las transformaciones proteómicas que acompañan a las histológicas en los procesos cancerígenos, manifestando así su utilidad para encontrar nuevos biomarcadores que ayuden al diagnóstico mediante este tipo de muestras. A pesar de las grandes expectativas que ha generado esta técnica como herramienta analítica clínica, se ha observado falta de reproducibilidad de unos laboratorios a otros; esto parece deberse a la falta de uniformidad de los protocolos analíticos aplicados, que se derivan de aspectos tales como; a) la discriminación entre los grupos control y los patológicos se ha fundamentado en componentes diferentes de los perfiles proteicos; b) a la aplicación de algoritmos informáticos diferentes en el análisis de los datos; o c) al

126

inadecuado tratamiento preanalítico de las muestras. Estos aspectos son actualmente objeto de investigación para conseguir la estandarización necesaria antes de su aplicación definitiva a la clínica. 6.1.2 Análisis de imagen basado en la espectrometría de masas La MS se puede utilizar para el análisis de proteínas en cortes histológicos o en los obtenidos por microdisección con láser, permitiendo la comparación de la expresión de proteínas sobre la imagen de tejidos normales y los alterados por la enfermedad. Los espectros de masas obtenidos a intervalos diferentes se comparan para poder obtener la distribución espacial de las proteínas en las secciones de tejidos. Los análisis obtenidos usando esta aproximación han puesto de relieve la existencia de 1600 picos de proteínas diferentes en círculos de 1 mm de diámetro dentro de un mismo corte histológico. Mediante esta técnica se han podido diferenciar grupos de tumores distintos dentro del mismo grado histológico. 6.1.3 Cuantificación relativa 6.1.3.1 Marcaje con isótopos estables en cultivos celulares: SILAC (stable isotope labeling in cell culture) El marcaje de cultivos celulares con aminoácidos portando isótopos estables en su estructura es una estrategia de cuantificación para evaluar la diferente expresión de proteínas en dos poblaciones celulares diferentes. Los medios de cultivo son deficitarios en un aminoácido, que se aportará a los respectivos medios marcado con un isótopo estable de diferente peso atómico, por ejemplo con C12 y C13. Las dos poblaciones celulares incorporan metabólicamente los isótopos ligeros o pesados en la síntesis de sus respectivas proteínas celulares. Se aíslan las proteínas de cada una de las muestras, se mezclan en la proporción de 1:1 y se someten a análisis por MS: los péptidos con la misma composición en aminoácidos se diferenciarán por su masa, según porten isótopos ligeros o pesados. La cantidad relativa de una proteína en cada una de las poblaciones vendrá dada por la relación de los péptidos de igual composición. La secuencia exacta de los péptidos se puede conocer por MS/MS y nos permitirá identificar la proteína que presenta expresión diferencial en cada una de las condiciones estudiadas. Esta técnica presenta como limitación el que sólo se puede aplicar a sistemas en los que tenga lugar biosíntesis de proteínas. 6.1.3.2 Marcaje químico Cuando el marcaje metabólico no es el adecuado para un determinado tipo de análisis, las técnicas basadas en el marcaje químico son una buena alternativa Incorporación de O18 durante la proteolisis Durante la proteolisis se incorpora un átomo de O procedente del medio acuoso en el Carboxilo del extremo C-terminal que surge de la rotura del enlace peptídico(18). Este hecho es la base de la cuantificación relativa de las proteínas, pues permite la incorporación de Oxígeno pesado (O18) o ligero (O16)

127

durante la escisión proteolítica. En este método, una de las muestras a comparar se escinde en presencia de agua pesada (H2O18), mientras que la otra se escinde en presencia de agua no marcada (H2O16). La enzima que se emplea habitualmente es la Tripsina, aunque también pueden emplearse otras enzimas proteolíticas. Las muestras se mezclan después del proceso de digestión enzimática. Finalmente, la mezcla de péptidos se somete a análisis por MS. La pequeña diferencia de masas que se establece entre los péptidos de la misma secuencia es un inconveniente que se ve compensado por la sensibilidad creciente de los espectrómetros de masa. Otro inconveniente de la técnica es la incorporación relativamente tardía del isótopo, cuando ya se han producido numerosos pasos de purificación. La gran ventaja de esta técnica radica en el hecho de que la incorporación isotópica no se produce durante la biosíntesis, por lo que resulta de aplicación general. Método ICAT ( isotope-coded affinity tag) La estrategia ICAT es un procedimiento de cuantificación de proteínas de implantación relativamente reciente (19), y se basa en la utilización del reactivo de ICATTM , que se caracteriza porque se une a residuos de cisteína. En su estructura contiene también un residuo de biotina para facilitar la purificación de los péptidos. Se utilizan dos variantes: una ligera, que porta átomos de Hidrógeno en su molécula, y otra pesada, en la que algunos se han substituido por Deuterio (Fig 11).

Fig 11. Esquema del método experimental ICAT. Las muestras de proteínas procedentes de dos poblaciones celulares a comparar, se marcan con las versiones ligeras (con H) y pesadas (con D) del reactivo ICAT. Las proteínas marcadas se combinan, se separan por LC, empleando como fases estacionarias SCX, RP y cromatografía de afinidad con avidina, y se analizan por espectrometría en tandem para su identificación. Por otra parte, se puede determinar la abundancia relativa de las proteínas basándose en la relación de las cantidades de péptidos iguales pero marcados con diferentes isótopos . Lab Invest, (2004), 84: 1227-1244. Cada una de las muestras de proteínas a comparar se hace reaccionar con una de las variantes ligera o pesada y posteriormente se mezclan y se digieren con

128

tripsina; los péptidos marcados con el reactivo ICAT se separan en una columna de afinidad y se analizan mediante MS. Los péptidos con la misma secuencia pero procedentes de marcajes distintos se diferencian en una masa molecular de 9 Da, y su relación de cantidad indica la de las proteínas en las muestras de que proceden. La fragmentación posterior del péptido por MS/MS permite identificar la proteína. Esta técnica, en combinación con LC-MS/MS, permite la detección y cuantificación de proteínas y péptidos a partir de muestras complejas. 6.1.4 Cuantificación absoluta Se utiliza cuando es necesario conocer la cantidad exacta de una proteína en la muestra para poder dar por ejemplo el número de copias por célula. Se siguen estrategias clásicas de análisis cuantitativo basadas en la adición de un patrón interno, o en la obtención de curvas patrón de un péptido que forma parte de la proteína de interés. A diferencia de las técnicas relativas de cuantificación, es necesario identificar previamente la proteína que se quiere cuantificar. Un procedimiento relativamente extendido de cuantificación absoluta se basa en la obtención de una curva patrón utilizando un péptido sintético que sea representativo de los que se originan por hidrólisis con tripsina de la proteína a analizar, y que está marcado con un isótopo estable. Este péptido también se adiciona en cantidad conocida a la muestra a analizar. Después del análisis por MS se mide la relación de péptido sintético y endógeno, y puede calcularse la cantidad de éste por referencia a la curva patrón. Aunque pueden obtenerse muy buenos resultados, la exactitud de esta técnica está influida por el instrumental usado en el análisis, de modo que para la determinación de proteínas a muy baja concentración puede ser más ventajoso actualmente el empleo de ELISA o RIA, siempre que se disponga del correspondiente anticuerpo. 6.2 Proteómica funcional Modificaciones postraduccionales Las proteínas se modifican a partir de su estructura nativa y funcional a través de procesos postraduccionales siguiendo secuencias de reacciones constantes. La mayor parte de las modificaciones son reversibles y juegan un papel importante en la regulación de sus funciones biológicas. Se han descrito alrededor de 200 formas de modificaciones postraduccionales diferentes, tales como fosforilación, nitrosilación, glicosilación, ubiquitinación etc. La fosforilación ha recibido especial atención, pues la fosforilación reversible de las proteínas juega un papel esencial en la transducción de señales provocadas por estímulos extracelulares hasta el núcleo a través de los receptores de membrana. La fosforilación se produce en los aminoácidos serina, treonina, y tirosina, en una relación de 1800:200:1, y aunque la fosforilación entirosina es la menos frecuente ha sido la más estudiada.

129

7 Aplicaciones bioinformáticas a la proteómica Las aplicaciones bioinformáticas y bioestadísticas son elementos constituyentes de la Proteómica, ya que en todo estudio analítico de proteínas es necesaria su utilización en alguna de las fases en una medida que depende del tipo de metodología que se utilice; por ejemplo, su uso es imprescindible en el proceso de identificación de las proteínas. Por estos motivos, al iniciar un estudio proteómico se debe considerar previamente el tipo de datos que se van a producir, su volumen y cómo se van a guardar, para evitar verse rebasados por problemas derivados de su tratamiento. Las nuevas técnicas de análisis de proteínas producen series de datos de nuevo tipo, tanto por su gran volumen como por sus características; el origen de esta situación es múltiple; a) los ordenadores han incrementado la capacidad de almacenar y procesar datos; b) la facilidad de intercambio a través de Internet; c) la elevada producción de datos de las técnicas analíticas de alto rendimiento; y d) la aparición de nuevas técnicas capaces de transformar en datos cuantitativos los que hasta ahora eran solamente cualitativos, como ha ocurrido con las imágenes de geles de 2D-EDTA. Es interesante hacer notar que, aunque se producen grandes cantidades de nuevos datos, estos siguen siendo con frecuencia de carácter cualitativo o semicuantitativo. La mayoría de los datos numéricos producidos por la proteómica se expresan como unidades arbitrarias o relativas; por ejemplo, en las técnicas de microarrays de proteínas se cuantifican como unidades relativas de fluorescencia, y en las de MS la intensidad de los picos correspondientes a fragmentos moleculares se expresan como valores relativos al del pico mayor obtenido en el análisis. El gran volumen de datos generado en las técnicas proteómicas se ha de elaborar (data mining) para poder interpretar su significado biológico. Los softwares bioinformáticos que utilizan algoritmos matemáticos avanzados son herramientas útiles para estudiar la participación de las proteínas identificadas en las rutas de señalización, en las interacciones proteína-proteína, o en procesos patológicos como los estados cancerosos.

130

BIBLIOGRAFÍA 1) O´Farrell, P.H. High resolution two-dimensional electrophoresis of proteins. J Biol Chem (1975); 250: 4007-4021. 2) Neverova, I., Van Eyk, J.E. Role of chromatographic techniques in proteomic analysis. J Chromatogr B (2005); 815: 51-63.

3) Tanaka, K., Waki, H., Ido, Y. et al. Protein and polymer analyses up to m/z 100.000 by laser ionisation time-of-flight mass spectrometry. Rapid Commun Mass Spec (1998); 2: 151-153. 4) Fenn, J.B., Mann, M., Meng, CK. et al. Electrospray ionisation for mass spectrometry of large biomolecules. Science (1989); 246: 64-71. 5) Graham, D.R.M., Elliot, S.T., Van Eyk, J.E. Broad-based proteomic strategies: a practical guide to proteomics and functional screening. J Physiol (2005); 563: 1-9. 6) Gonzalez de Buitrago, J.M., Ferreira, L . Proteómica Clínica. Comité de Publicaciones de la Sociedad Española de Bioquímica Clínica y Patología Molecular (2006). 7) Nambiar, P.R., Boutin, S.R., Raja, R., Rosemberg, D.W. Global gene expression profiling: A complement to conventional histopatologic analysis of neoplasia. Vet Pathol (2005), 42: 735-752. 8) Burgemeister, R. New aspects of laser microdissection in research and routine. J Histochem Cytochem (2005); 53:409-412. 9) Lim, M.S., Elenitoba-Johnson, K.S.J. Proteomics in pathology research. Lab Invest (2004); 84: 1227-1244. 10) Gil, C.. La metodología proteómica, una herramienta para la búsqueda de función. Actualidad de la SEM (2003); 35: 12-20. 11) Pastwa, E., Somiari, E.B., Czyz, M., Somiari, R.I. Proteomics in human cancer research. Proteomics Clin App (2007); 7:4-17. 12) Templin, M.F., Stoll, D., Schrenk, M., Traub, P.C., Vöhringer, C.F., Joos, T.O. Protein microarray technology. Trends Biotechnology (2002); 20: 160-166. 13) Gulmann, C, Sheehan, K.M., Kay, E.W., Liotta, L.A., Petricoin, E.F. III. Array-based proteomics: mapping of protein circuitries for diagnostics, prognostics, and therapy guidance in cancer. J Pathol (2006); 208: 595-606.

131

14) Posadas, E. M., Simpkins, F., Liotta, L. A., MacDonald, C., Kohn, E.C. Proteomic analysis for the early detection and rational treatment of cancer-realistic hope? Ann Oncol (2005); 16: 16-22. 15) Yates I.I.I. JR. Mass spectrometry and the age of the proteome. J Mass Spectrom (1998); 33:1-19. 16) Hutchens, T.W., Yip, T.T. New desorption strategies for the mass spectrometric analysis of macromolecules. Rapid Commun Mass Spectrom (1993); 7: 576-580. 17) Pitarch, A., Sanchez, M., Nombela, C., Gil, C. Análisis of the Candida albicans proteome. I. Strategies and applications. J Chromatogr B (2003); 787:101-128. 18) Lill, J. Proteomic tools for quantitation by mass spectrometry. Mass Spectrometry Reviews (2003); 22:182-194. 19) Gigy, SP., Rist, B., Gerber SA., Turececk F., Gelb MH., Aebersol R. Quantitative analysis of complex protein mixtures using isotope-coded affinity tags. Nature Biotechnology (1999); 17: 994-999.