20
Acta bioi. Colomb., Vol. 125,2007 55 - 74 DISENO DE OliGONUCLEOTIDOS PARA EL ESTUDIO DE GENES CELUI.OLiTICOS Y SOLVENTOGENICOS EN CEPAS COLOMBIANAS DE Clostridium sp. (CLOSTRIDIACEAE) Oligonucleotide Probe Design for the Study of Cellulolytic and Solventogenic Genes in Colombian Clostridium sp. Strains (Clostridiaceae) JOSE DAVID MONTOYA SOLANO l , Quimico Farrnaceutico; ZULMA socio SUAREZ MORENO', M.5c.; DIEGO MAURICIO RIANO PACHON J , Bi6logo; DOLLYMONTOYA CASTANO" M.Sc., Dr. rer. nat.; FABIO ANCiZAR ARISTIZABAL GUTIERREZ', Ph, D, 'Grupo de Bioprocesos y Bioprospeccion, lnstituro de Biotecnologfa , Universidad Nacional de Colombia, Sede Bogota, ciudad universitaria, Carrera 30 No. 45-03. AA. 14490. Telefono: 57-13165000, exts. 16971 [email protected]@unal.edu.co 'Grupe de Bacteriologia y Bacrenologta Vegetal, Laboratorios ICGEB Trieste, ltalia. Telefono: +39-40-375 73 17. [email protected] 'Departamento de Biologia Molecular, Universidad de Potsdam. Potsdam, Alemania. Telefono: +49-331-9772809. d iria [email protected] "Departamento de Farmacia, Universidad Nacional de Colombia, Sede Bogota, ciudad universitaria, Carrera 30 No. 45-03. AA. 14490. Telefono: 57-13165000, ext. 14643. [email protected] Presentado el 2 de ocrubre de 2006, aceprado el 16 de mayo de 2007, corr ecciones 3 de ocrobre de 2007. RESUMEN EI objetivo de este estudio fue analizar las rutas merabolicas para la producci6n de solventes y degradaci6n de celulosa en cepas colombianas promisorias del genero Clostridium. Para ella se disenaron sondas de hibridaci6n que sirvieran para posteriores estudios de mejoramiento genecico de las cepas. Se construyo la base de datos denomi- nada MULTI-CLOST en Microsoft Access® con las secuencias de 485 genes involucra- dos en las rutas rnetabolicas arriba mencionadas, provenientes de 45 especies bacteria- nas y 10 especies fungicas. Los genes fueron agrupados de acuerdo al ripe de enzima y a los dominios catalfticos 0 de union a suscraro en el caso de las celulasas. Cada grupo se sornetio a alineamiento multiple en C1ustalW 1.83 y con base en los resultados se crearon subgrupos de sirnilitud mayor al 50%. Se Iocalizaron secuencias conservadas de longitud mayor a 19 nucleotidos en GeneDoc 2.6.002 y sus valores termodinamicos fueron estimados con GeneRunner v3.05, rnientras que la sensibiJidad yespecificidad fue verificada par busquedas en GenBank usando BLASTN 2.2.8. En total se obcuvieron 94 secuencias conservadas con las siguientes caracrerlscicas: longitud prornedio de 24

Oligonucleotide Probe Design for the Study of Cellulolytic

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Oligonucleotide Probe Design for the Study of Cellulolytic

Acta bioi Colomb Vol 1252007 55 - 74

DISENO DE OliGONUCLEOTIDOS PARA EL ESTUDIODE GENES CELUIOLiTICOS Y SOLVENTOGENICOS EN CEPAS

COLOMBIANAS DE Clostridium sp (CLOSTRIDIACEAE)

Oligonucleotide Probe Design for the Study of Cellulolyticand Solventogenic Genes in Colombian Clostridium sp Strains

(Clostridiaceae)

JOSE DAVID MONTOYA SOLANOl Quimico Farrnaceutico ZULMA

socio SUAREZ MORENO M5c DIEGO MAURICIO RIANO

PACHONJ Bi6logo DOLLYMONTOYA CASTANO MSc Dr rer natFABIO ANCiZAR ARISTIZABAL GUTIERREZ Ph D

Grupo de Bioprocesos y Bioprospeccion lnstituro de Biotecnologfa Universidad Nacional de Colombia Sede Bogota ciudad universitariaCarrera 30 No 45-03 AA 14490 Telefono 57-13165000 exts16971 -16954jdmontoyasunaleduco-dmontoyacunaleducoGrupe de Bacteriologia y Bacrenologta Vegetal Laboratorios ICGEBTrieste ltalia Telefono +39-40-375 73 17 suarezicgeborgDepartamento de Biologia Molecular Universidad de PotsdamPotsdam Alemania Telefono +49-331-9772809d iria norzuni-potsdamdeDepartamento de Farmacia Universidad Nacional de ColombiaSede Bogota ciudad universitaria Carrera 30 No 45-03 AA 14490Telefono 57-13165000 ext 14643 faarisrizabalgunaleduco

Presentado el 2 de ocrubre de 2006 aceprado el 16 de mayo de 2007 corr ecciones 3 de ocrobre de 2007

RESUMEN

EI objetivo de este estudio fue analizar las rutas merabolicas para la producci6n desolventes y degradaci6n de celulosa en cepas colombianas promisorias del generoClostridium Para ella se disenaron sondas de hibridaci6n que sirvieran para posterioresestudios de mejoramiento genecico de las cepas Se construyo la base de datos denomi-nada MULTI-CLOST en Microsoft Accessreg con las secuencias de 485 genes involucra-dos en las rutas rnetabolicas arriba mencionadas provenientes de 45 especies bacteria-nas y 10 especies fungicas Los genes fueron agrupados de acuerdo al ripe de enzima ya los dominios catalfticos 0 de union a suscraro en el caso de las celulasas Cada grupose sornetio a alineamiento multiple en C1ustalW 183 y con base en los resultados secrearon subgrupos de sirnilitud mayor al 50 Se Iocalizaron secuencias conservadas delongitud mayor a 19 nucleotidos en GeneDoc 26002 y sus valores termodinamicosfueron estimados con GeneRunner v305 rnientras que la sensibiJidad yespecificidadfue verificada par busquedas en GenBank usando BLASTN 228 En total se obcuvieron94 secuencias conservadas con las siguientes caracrerlscicas longitud prornedio de 24

56 Articulo - Disetio de oligonude6tidos para el estudio de genes celulolfticos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya et al

nucteocidos Tm promedio de 658 C Y contenido de (G+C) entre 143 y 600 Sedetermine que ninguna de las sondas disenadas forma estructuras secundarias establescan T m superior a 361 C De acuerdo a sus caractertsticas y valcres terrnodinamicosrodas las sondas podrlan ser utilizadas en la consrroccion de un micraarreglo a en reac-ciones de PCR para la identificacion de regiones relevantes en el mejoramiento del pro-ceso por ingenierta merabolica

Palabras clave sondas de oligonucleoridos Clostridium sp Microarreglos Bioin-formatica

ABSTRACT

The goal of the present study was to analyze the metabolic pathways involved in solventproduction and cellulose consumption by promising Colombian native strains of thegenus Clostridium Therefore a set of oligonucleotide probes was designed with the aimof analyzing potential targets for genetic improvement of the Colombian strains Thedatabase named MULTI-CLOST was created in Microsoft Accessreg using the sequencesfrom 485 genes involved in solventogenesis 13-propanodiol production and cellu-lolysis from 45 bacterial and 10 fungal species The genes were grouped according totheir respective enzyme function and to the catalytic domain or the substrate bindingdomain in the case of cellulases C1ustalW 183 was used for multiple alignment ofevery group Subgroups of sequences with more than 50 identity among themselveswere created Conserved sequences longer than 19 nucleotides were identified usingGeneDoc 26002 and their thermodynamic values were calculated with GeneRunnerv305 while their sensitivity and specificity were verified by searching in GenBank withBLASTN 228 Ninety-four conserved sequences were obtained with an average 24-nucleotide length 658degC average Tm and a (G+C) content between 143 and 600None of these probes forms stable secondary structures at temperatures higher than361degC According to the former results all of the probes could be used in an oligo-nucleotide microarray or in peR reactions for the identification of metabolic targets forimprovement of the industrial process

Key words Oligonucleotide probes Clostridium sp Microarrays Bioinformatics

INTRODUCCION

Este trabajo parte de la necesidad de una herramienta molecular adecuada para ladereccion de genes involucrados en los procesos de solventogenesis y cetulolisis encepas colombianas promisorias del genero Clostridium Dicho genera incluye especiessolventogenicas y no patcgenas empleadas exrensarnente desde principios del siglo XXpara la produccion de acerona butanol y etanol (jones eta 1986) Algunas de estasespecies tienen la capacidad de utilizar sustratos celul6sicos para la fermentaci6nacecobutflica los cuales reducen significativarnenre el costo total del proceso Tradi-cionalmente la renrabilidad industrial de la biosfntesis de estos solventes y la degrada-cion de celulosa depende de los rendimientos de la cepa y del costo de la Fuente de

Acta bioI Colomb Vol 1252007 57

carbono (Lynd et aI 2002 Pachauri et aI 2006) En el ambito internacional se hanpatentado varios procesos consolidados para la produccion biorecnologica de solven-tes con cepas bacterianas transformadas alcanzando altos rendimientos por medio delusc de sustratos economicos y enzimas de alta eficiencia (Nakamura et ai 2003 Zverlovetal 2006)

El Instituto de Biotecnologra de la Universidad Nacional de Colombia (IBUN) ha tr-a-bajado en el empleo de residuos agroindustriales y en la busqueda de cepas nativascon rendimientos superiores al de las cepas patron En la decade de 1990 se aislaron178 cepas de Clostridium a partir de suelos colombianos con el animo de encontrarcepas hiperproductoras de solventes En uno de los estudios realizados se seleccioria-ron 13 cepas reniendo como base la concentracion de solventes rotales -acetona bu-tanol y etanol- a partir de glucosa (Montoya et a 2000) Esrudios posteriores evi-denciaron que las cepas nativas de Clostridium pueden degradar sustratos celuloscoscomo pectina xilano carboximetil-celulosa y celulosa microcristalina (Montoya et aI2001) mientras que cinco de las cepas producen 13-propanodiol (13-PD) a partirde glicerol en mayor concentracion que Clostridium butyrieum DSM2478 (Cardenas et012006) Adicionalmenre los analisis de vanabilidad molecular por AFLP -AmplifiedFragment Lenght Polymorfism- PFGE -Putsed Field Gel Electrophoresis- e hibridizacion DNA-DNA sugieren que 10 de las cepas promisorias correspondertan a una nueva especiedel genero Clostridium filogeneticarnente muy cercana a C butyrieum (Arevalo 2001Suarez 2004 Jaimes et aI 2006) Esre conjunto de resultados permite considerar alas cepas nacivas como candidatas para el diseno de bioprocesos innovadores de pro-duccion de solvenres a nivel industrial Los rendimienros de las cepas prornisoriaspodrran ser mejorados por ingenierfa rnetabolca 10cual requiere del conocimienro delos genes de las rutas metabolicas involucradas en los procesos de solventogenesis ycelulolisis Los prirneros esrudios genecicos de las cepas promisorias incluyen la cons-truccion de una librerta genornica a partir de la cepa IBUN 22A en la cual se encontra-ron ocho clones con actividades exoglucanasa endoglucanasa y -glucosidasa (Vargaset aI 2002) Esrudios posteriores permitieron predecir genes hom61ogos a dhaBl ydhaT de C butyricum en las cepas narivas IBUN 22A IBUN 13A e IBUN 158B dlchosgenes codifican para las protefnas Glicerol Deshidratasa y 13-Propanodiol Oxidorre-ductasa involucradas en la producci6n de 13-PD a partir de gliceral (Montoya et al2006 Quilaguy etal comunicaci6n personal)

Un esrudio completo de los genes involucrados en las rutas metab61icas de Imeresrequiere de una estrategia mas eficieme basada en la informacion genomica que hasido obtenida a nivel mundial para el genera Clostridium Sin embargo hasta la fechaClostridium acetobutylicum Clostridium beJjerinckii Clostridium kluyveri y Clostridiumthermocellum son las unicas especies solvenrogenicas yjo celulolfticas no patogenas delgenero cuyo genoma ha sido completamenre secuenciado (Nailing et aI 2001Copeland etal 2007a Copeland etal 2007b Seedorfetal 2007) Un ensayo dehibridacion basado en sondas universales constiruye una buena alternativa puesroque permitirfa analizar la presencia y expresi6n de los genes involucrados en rod as lasrutas metab61icas sin necesidad de conocer previamente la secuencia genornica

58 Articulo - Dizeno de oligonucle6tidos pam el estudio de genes cetotottucos y solventoginicos en cepasde Clostridium sp (C1ostridiaceae) Montoya et a]

exacra de las cepas promisorias En esre trabajo se plantea el uso de un microarreglocomo ensayo de hibridaci6n puesto que los microarreglos poseen alta capacidad deprocesamiento de muesrras y su costo es comparable con el de orras tecnicas para elanal isis de perfiles de expresion como SAGE -Seriai Analysis or Gene Expresion- SSH -Suppression Substractive Hibridization- y M PSS -Massively Parallel Signature Sequencing-(Velvescu et a 1995 Bunney et aI 2003 Stoughton 2005) Los microarreglos deDNA son ensayos drigidos a la secuer-cia genomica de un organismo que permirenanalizar la concentracion relariva de una gran variedad de moleculas espectficas deDNA 0 RNA simultaneamenre Las muestras analizadas usual mente corresponden aDNA 0 RNA total extrado del cultivo bajo las condiciones de esrudio el cual es hi-bridizado con las sondas del microarreglo para determinar a presencia y nivel deexpresi6n de genes especificos (Stoughron 2005) Por medic de los microarreglos sepueden identificar fenotipos bacterianos espectficos asignarle funci6n a genes desco-nocidos agrupar genes en ruras metabolicas de interes idenrificar 105genes regula-dores de dichas rutas y otras funciones que resultan utiles en la comprension delmetabolismo fermenrarivo de las cepas nativas de Clostridium sp Por ejemplo esru-dios previos de cepas mutadas de C acetobutylicum usando un microarreglo genormcohan demostrado la presencia de genes reguladores necesarios para la solvenrogenesisy la esporulaci6n en el megaplasmido p50Ll (Tomas etal 2003 Alsakeretal 2005)EI objetivo de este articulo es proponer una merodologta para el diseiio de sondas deDNA utiles en la construcci6n de un microarreglo de oligonuclecridos 0 en otrosensayos de hibridacion enfocados al estudio y mejoramiento de las rutas metabolicasanrenormente mencionadas Las sondas para microarreglos pueden corresponder acDNAs preidentificados (RNA total retrotranscrito) 0 bien a una coieccion de oligo-nucleotidos disenados para genes espectficos EI uso de un microarreglo de oligonu-cleotidos supone ventajas en nuestro caso puesto que los oligonucteotidos basadosen secuencias consenso permiten detectar la expresion de genes conservados en espe-cies cuyo genoma aun no ha sido secuenciado como es el caso de las cepas colom-bianas de Clostridium sp La utilidad de esta merodologia ha sido demostrada entrabajos como la patente de Graham y Wollweber (1990) quienes disenaron oligonu-cle6tidos consenso para la detecci6n de middot-amilasas en diferentes especies del generoBacillus 0 bien en el trabajo de Matveeva etal (2004) quienes disenaron oligonucleo-tidos consenso dirigidos a genoma del VIH-1 a partir de regiones conservadas en 105alineamiencos multiples de sus variances EI uso de micro-arreglos de oligonucleotidostambien ha sido reportado para el genero Clostridium por Paredes etal (2007) quie-nes disenaron un microarreglo con oligomeros de 60 nucle6tidos para el analisismetab61ico en cepas mutadas de C acetobutylicum Este artfculo presenta una meto-dologfa para el diseno de oligonucleotidos a partir de secuencias geneticas publicadasen GenBank para especies bacterianas y fungicas represencativas de las rutas mera-b61icas de interes con la cual se busca compensar la baja cantidad de secuenciaspublicadas hasta la fecha para especies del genero Clostridium EI diseno esta basadoen la identificacion de secuencias conservadas en la mayor cantidad de especiesposible de forma que cad a sonda resurante sea util para detectar la presencia delmismo gen tanto en dichas especies como en las cepas nativas de Clostridium sp(partiendo de su cercanfa evolutiva ylo metab6Iica) En la metodologra propuesta se

Acta bioi Cotomb Vol 12 S 2007 59

han tenido en cuenta aspectos generales del disefio de oligonucleotides para micro-arreglos tales como su especificidad con respecto al gen objetivo su incapacidadpara formar homodtmeros 0 heterodrmeros con otras sondas la ausencia de estruc-turas secunda-ias y e control de parametres como longitud y Tm (punto de fusion)dentro de rangos previamente establecidos (Tolstrup et at 2003)

MATERIALES Y METODOS

CONSTRUCct6N DE LA BASE DE DATOS LOCAL MUlTImiddotClOST

A partir de una revision bibliografica se identificaron las enzimas que participan en laproduccion de aceta to butirato etanol acerona y butanol a partir de piruvato (Fig 1)asi como en la produccion de 13-propanodiol y dihidroxiacerona-P a partir de glicerol(Fig 2) en clostridios solvenrogenicos no pat6genos Tarnbien se identificaron lasenzimas involucradas en la degradaci6n de celulosa hasca glucosa incluyendo lasprorernas estrucrurales del celulosoma (complejo de cegradacion de sustratos celu-16sicos) y en la degradaci6n de polisecaridos de la hemicelulosa hasta los monosa-ceridos correspondienres (Fig 3 Schwarz 2001) Las secuencias de los genes con-es-pondientes fueron obtenidas en GenBank (Benson et al 2007) y UniProt (Bairoch et aI200S) para 16 especies del genero Clostridium y 29 generos de microorganismos relacio-nados (Tabla 1) Los registros de dichas secuencias fueron almacenados y categorizadosen una base de daros construioa en Microsoft Access XP Para cada registro se recopilola siguienre informacion nombre del gen numero de acceso de GenBank nombre de laprotefna codificada nomero de acceso de Uniprot especie conglomerado (si el genpertenece a uno) longitud del gen y longitud de la proteina

Piruvaro

H-FdH=f0A~L-- coFd co

1 72 Acetilfosfato y- Acenl-Coe ~ II Aceraldehrdc

I CoA CoA pAcetate CoA 5 CoA I Eranol I

5

I Acetona I + CO2

CoA-h idroxi b u tiri I-CoA

~H20

Crotonil-CoA I Butanol I 10 +11-1-- Butiraldehido

AcetoacelatO61

AcetoacetimiddotCoA

Butirato

4 3BuririlfosfalO 7

CoA

BlIrUII-CoA

CoA

Figura 1 Enzimas involucradas en la producci6n de solventes de Clostridium incluidas en la base dedatos 1 Fosfotransacerilasa 2 Acerato kinasa 3 Fosforransburirilasa 4 Burirato kinasa S Acero-acetilacil CoA transferasa 6 Acetoacetaro descarboxilasa 7 Acetaldehfdo deshidrogenasa 8Piruvato descarboxilasa 9 Alcohol deshidrogenasa 10 Buriraldehfdo deshidrogenasa 11 Butanoldeshidrogenasa

60 Articulo - Oiseno de oligoIJucle6tidos para el estudio de genes celutottucoe y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

NAD

H2--- Glicerol

-----1 2 41N~~H+WN~~NHHAidD~i~3naldehidO fT

Dihidroxiacerona

ATPj13-Propanodoll 5 ADP

Glucosa - ---+ Dihidroxiacecona P Cbcer aldehtdo 3 P

iPiruvato

Biomasa

NADHI-WImiddot

NAD+I

Glicerol ~ GlicerolmiddotP

Pi H20

Figura 2 Ruta de asimilaci6n de glicerol en Clostridium butyricum 1 Glicerol deshidratasa 2 Active-dar de la glicerol desbidratasa 3 13-PD deshidrogenasa 4 Glicerol deshidrogenasa 5 Dihidroxia-cerona kinase 6 Glicerol-Scfosfarasa 7 Glicerol kinasa

Para esta base de datos local se establecieron las siguientes categonas (1) Solventoge-nesis con las enzimas fosfotranscarboxilasas carboxilato kinasas CoA transferasasacetoacetate descarboxilasas aldehtdo deshidrogenasas y alcohol deshidrogenasasnecesarias para la producci6n de aceta to butiraco etanol butanol y acetona (jones yWoods 1986 Biebl et al 1999 Nailing et al 2001) (2) 1 3-Propanodiol donde sealmacenaron registros para las enzimas glicerol deshidratasa 13-PD deshidrogenasaglicerol deshidrogenasa dihidroxiacetona kinasa y glicerol-3-fosfatasal necesarias parala produccion de 13-propanodiol y glicerol (Biebl et af 1999) (3) Celulasas dondese incluyeron las protefnas estructurales que forman el andamio y el sistema de anclajedel celulosoma (Bayer eta 1998) asl como celulasas entre las que se cuentan exoglu-canasas endoglucanasas -glucosidasas xilanasas xilosidasas y mananasas (Coughlany Mayer 1992 Lucas et at 2001) La subcategoria Celulasas fue a su vez separada porfamilias de glicosil hidrolasas dominios de union a celulosa y dominios de homologfacon la capa 5 considerando la composici6n multidominio de estas enzimas (Rabinovichet at 2002) Adicionalmente se decidi6 incluir la categorfa Factor de transcripcionSpoOA dado que est a prorelna de esporutacion ha sido reconocida como factor detranscripci6n de los operones sol adc y bdh de producci6n de solventes (Harris et at2002) La lista completa de categorfas y subcategorfas se presenta en la Tabla 2

CONSTRUCCI6N DE AliMENTOS MULTIPLES CON ALTA CONSERVACl6N DE SECUENCIAS

Para cad a tipo de enzima las secuencias de los genes registrados en MULTI-CLOSTfueron recuperadas a partir de GenBank tomando siempre la cadena positiva de cadagen En el caso de la categorfa Celulasas los grupos fueron formados por familias dedominios catalfticos 0 de union a sustrato dentro de cada tipo de enzima (Bayer eta1998) Las secuencias de cada grupo fueron alineadas con el programa de alinea-miento multiple ClustalW 183 (Thompson et al 1994) usando la matriz de respecti-vamenre La calidad de los alineamientos multiples fue mejarada par eliminaci6n de

Acta bioi Colomb Vol 125 2007 61

jESpeCie ___

3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot2middot

bull

32

Solvenrogenesis Ce--

4

iJ~Ii 1 2

B~i1i~~bt]tiili~ltimiddotmiddot~middoti~middotmiddott bullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbull1bullbullbullbullbullbullbullbull17 - + + ~ 9 j

~Iimditni 2bullbullmiddotbullbullbullmiddotbullbullbullbullbullbullbullbullbull1 middotmiddotbullbullbullbullmiddotbullmiddotmiddotbullbullbullbullbull+7

PP + j ~~timi I + +

17

11

1

813

i

h

15 bullbullbullbullbullbull

13

51

1

L middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot4middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot8 _

14

2

2

39 bullbull bullbullbullbullbullbull

16

21

2

~

+ + 5

pcJ [ 24 + +

putidaTs alb

jl

4

95

12

Tabla 1 Rcgistros inclvidos por cada especie en las cacegortas de MU LTI-CLOST

3

95

62 Articulo - Oisetlo de oligol1l1c1e6tidos para el estudia de genes cetutoteicos y solventogenicos en ccpasde Clostridium sp (Clostriditlceae) Montoya er al

los genes con secuencia menos conservada hasra alcanzar un valor alineamientoC1ustaIW16 (peso de 1 para las concordancias y 0 en los demas casas Aiyar 2000) ylos valores de penalizacion Pv aperture y extension de gaps 15 y 666 superior a 65 enel promedio del Puntaje de Alineamientos Pareados (PAP) calculado por C1ustalWentre rod os los genes de cada alineamiento (este valor minimo se redujo a 50 en las fa-milias enziroaricas can alta variabilidad de secuencia como es el caso de las celulasasmultidominio) Los alineamientos multiples definitivos fueron construidos con los ge-nes restar-res utilizando los valores de penalizacion 15 y 666 para aperture y extensionde gaps (11 y 1 para las families enzimacicas can alta variabilidad de secuencia )

GHEnzimas incluidas en la base de datos

1 Celotasas [exo- y endoglucanasas2 Mananasas3 xrtanasas4 Prorerna andamtoS Proretnas adapradoras6 croretoas de anctaje7 Proieroas de (a capa S

Cetulosa

Pared (eubr

Microorganismo celulolioco

Figura 3 Componentes esrructurales y cacalrricos del celulosoma unidos a una celuia del microor-ganismo que 10 produce y al sustrato celul6sico simuheneamenre Dominies funcionales SLHhomologia con la capa S CH I Y CH II Cohesin I y II DK I Y DK IJ Dockerin I y II CBM modulo deunion a celulosa GH Glicosil hidrolasa

DISENO DE LAS SONDAS DE OliGONUCLEOTIDOS

A partir de los alineamientos detinitivos se exrrajeron secuencias con longirud minimade 19 nucleotidos conservadas en mas del 50 de los genes de cada alineamienroutilizando para ello el editor de alineamienros GeneDoc 26002 (Nicholas y Nicholas2001) La longitud minima requerida para las sondas fue establecida a partir de losresultados arrojados par BLASTN para sondas de 17 a 20 nucle6tidos dirigidas a unmismo gen de Endoglucanasa (Tabla 6) Para aumencar la probabilidad de que losoligonucleocidos diseriados puedan reconocer sus genes objerivo en las cepas prorni-sorias de Clostridium sp se seleccionaron siempre regiones conservadas en al menosuna especie de los ordeoes Clostridiales 0 Bacillales Las propiedades termodinamicasde las sondas disefiadas fueron calculadas con GeneRunner v305 (Hastings SoftwareNY) y se aceptaron solo aquellas cuya Tm segun la formula termodinamica de San-taLucia (1998) estuviera en el rango de 44 a 90 degC y que no formaran estructurassecundarias con Tm superior a 37 0c Esros criterios se establecieron considerando lastemperaturas de desnaturaizaci6n e hibridacion recomendadas usualmente para mi~croarreglos (42 ( Y95 ( respectivamenre Hedge et aI 2000 Schuchhardt et aI 2000Tomas et aI 2003 Tummala et al 2003 Rybicki 2005) Para comprobar la sensi-bilidad y especificidad de los oligonucleotidos diseiiados est os fueron sometidos abusquedas en GenBank 1410 (Benson et al 2007) usando la aplicacion BLAsTN228 (Altschul et aI 1997) se seleccionaron aquellos oligonucleotidos para los

Acta bioi Colomb Vol 12 S 2007 63

cuales rodos los regisrros reportados por BLASTN con Valor E (Expected Value) inferior aOOS correspondieran a genes can funcion equivalence a los genes del alineamientooriginal (los resultados de BLASTN son mas significativos cuando su valor E es menorpero el valor E tiende a ser conservative cuando la secuencia de busqueda es muy cottade manera que para secuencias de longitud menor a 40 nucleotidos los resultados convalor E lt 005 se pueden considerar especfficos Altschul et 01 1997) Por ultimo seestableciola ubicacion de cada sonda de ohgonuclectidos en sus genes objetivo usandoel programa Artemis vS (Rutherford et at 2000) y se determine el dominic funcionalcorrespondienre a cad a una por medic de busquedas de las prorefnas codificadas porlos genes objetivo en la base de daros CDD vl65 (Conserved Domain Database) usandoRPS~BLAST 226 (Reversed Position Specific BLAST Altschul et 01 1997)

A-~-id-og~~~i~y~~i~~t~i~~~~i(95 registros)

SU~~~~~~~f~Fosforransacen lasa

Aceraro kinasa

17

2

Butirato 16 II

Fosfotra nsbutiri lasa

Piruvaro

2

29

15

Aceroaceraro 26

17

4

Aldehrdo

Alcohol deshidrogenasade cadena carra

Bctwiiif~~~i~~j 1~3Ir~C~Od(n~~i~~Lbullbullbullbull3f t~Aceroacerilacil CoA 4 Celodexrrrn 2 Facrores de rranscripci6n SpoDAtransferase A (14 regisrros)~+

18

3

11

Arabinosidasas 7

transferasa B s Celobiosa fosforilasasProtefnas de la capa 5Prorernas adapradorasdel andarnioProrefnas de anclajedel celulosorna

232

SubcaregortaNo posee sobcaregona

5

Tabla 2 Numero de registros iocloidos en cada caregorta y subcategorfa de la base de datos MULTImiddotCLOST

RESULTADOS

CONSTRUCCl6N DE LA BASE DE DATOS MULTI-CLOST

La base de datos construida en Microsoft Access XP fue registrada bajo el nornbreMULTI-CLOST ante la Direcci6n Nacional de Derecho de Autor de Colombia (Libra13 Torno 17 Partida 142 del 20 de noviernbre de 2006 disponible en

64 Arrtculo Diseriode oligonucleotidos para el estudio de genes celuolftiws y solventogeniws en cepasde Clostridium sp (Clostridiaceae) Montoya et al

httpWIfNibununaleducolineasbioprocesosindexhtm) Esta base de datos con-riene registros de 485 genes que codifican para las enzimas y prorefnas estructuralesinvolucradas en la acidogenesis solvemogenesis degradaci6n de celulosa y producci6nde 13-PD en 55 especies bacrerianas y fungicas permitiendo recuperar las secuenciasde dichos genes y protein as en las bases de datos GenBank (Benson et al 2007) yUniProt (Bairoch et al 2005) De estos registros 95 corresponden a la caregorfa Solven-rogenesis 94 a la categorfa 1 3-Propanodiol 14 a la categona Factor de esporulaci6nSpoDA y 282 a la caregorta Celulasas la mas numerosa considerando la subdivisionadiciona per farnilias de dominios funcionales

i-S-ubc~tego~raFosfoi~ansacetE3-sa

No6rgaiiTsoClo~tidi~~ih~~~~ii~

i Acetat~middotmiddotki~middotasmiddotamiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot B~~i1i~-~biijismiddotBumiddottlmiddot~atmiddotomiddotmiddotkrnamiddotsamiddotmiddotmiddotmiddotmiddotmiddotmiddotFmiddotomiddot~fomiddottmiddot~amiddotnmiddotsb~middotti~iasamiddot

bilk

AF041S4i

Z99119middotmiddotmiddotmiddotmiddotAY46jmiddot1middot03 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddoti

AE007804M15393

AY251646

- clostidi~--beJemiddot~ckii----ciostid~-~cmiddot~tob~ampIi~~middot CAC30i6-

--P~~~at-od~~~amiddot~bmiddoto~i-iasamiddot middotio~~~~~middotomiddotbij~middotmiddot pd~ A~~tmiddotoa~etmiddotat~middotd~~~middotamiddot~middotbo~TIsmiddotaIc s~~~~i~~pi~~~~~i~~~~~~~~~I adcmiddotmiddotAldmiddotemiddothi~joai~ohofmiddot deshidrogenasa idium tetanimiddotB-~-t~-~~imiddotdmiddot~~hmiddotdgemiddot~middot~amiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotCmiddot C

rmiddotA~-~t~~middot~-~middottmiddotii-~i-imiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~CoA transferasa AA~~to~~~df~iiS~~~~~~~~~~~8 BH2258 AP001514I~_I_~~~_~_~s_~s celK F039030 Endoglucanasas creajecorina _ __ __~ eg~ Y1l1l3middotMamiddot~~middot~middotas~~ 1 middot 7c~~sp mane middotmiddotmiddotmiddotgt(9752middot0middotmiddotmiddotmiddotimiddotximiddotimiddot~asamiddotmiddotmiddotmiddot Ruminococcus abus _ Z~~ AB057589r p~-~~f~middot~middotmiddot~middotdmiddot~middot~middotimiddot~Ruminococcus flaveiJ~i~~ middotmiddotmiddotmiddotmiddotmiddotmiddotmiddott scaA j27i3969

~glucanasas Clostridium thermocellum licB X63355 ~ middotmiddotmiddot~gimiddot~~~~~middot~~-~~_ CIstridiu~ ~-~iipmiddot~~ i abgA L49336 -j

Xilosidasas j ~i~~~~i~0middott~~o~~--middot 1 middotbTBmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAmiddotmiddotJmiddotSmiddotOmiddotS4middotmiddotO5 j

rA-~binomiddot~idmiddotmiddot~~middot~ Bacteroidesmiddotmiddotih~t~jt~li~~ L BT1781 ~~~~~ middot~~middot~i~~~d-middotmiddot~~~-pamiddot smiddot middot~jo~~middot(h~~~~L~1 ~~ middotmiddot1 ~~~~~~

rmiddotGiice~~imiddotdesimiddotimiddotdmiddott~middotsmiddot~ K~b~i~middotii~p~emiddot~middot~j~ middotmiddotmiddotmiddotmiddot1 dh~j32middot U60992 ~middotl-j-pmiddot~~-p~middot~~dmiddot~imiddot - ~ deshidrogenasa Clostridium pasteurianum dhaT AF006034 R dii ~ dhaR U09771i middotGmiddotilmiddot~middotemiddot~of~jemiddotshdrogmiddotemiddotnmiddotasmiddotamiddot Cistjd~middotmiddotb~amp~~m middotmiddotmiddotmiddotmiddotmiddotmiddotdh~i5i AY1j~f5s1

middotomiddot~Imiddotamiddotce[omiddot~middotamiddotkimiddotnmiddotasa middotmiddot--middotmiddotmiddotimiddotmiddot ~~g~~~ ~~~~~~~ Sacch~romycescer~~j~i~~ gpp2 050469

-t-

CTC02182 AE015943

CPE1256 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAPOOjmiddotmiddots9middot

CAP0163 AE001438

F~-~-t~middot~middotmiddotd~middotmiddott~middot~middot~cmiddotipmiddot~-i6middot~middotmiddotmiddot SpaDA i E~~~~~~~~~~ 1 spoOA 1 U43514

Tabla 3 Secuencias represemativas de cada subcategorfa de MULTI-CLOST can su numero de accemiddotso a GenBank

Las especies mayoritarias de la categoria Celulasas son C acetoblJoliclJm y C thermocellumlas cuales representan el 25 de dicha categor(a mientras que en Solventogenesis el

Acta bioi Colomb Vol 1252007 65

mayor porcenraje (36) corresponde a las especies C acetobutylicum y Bacillus subtiiis Parsu parte la categorfa 13-Propanodiol contiene el 25 de secuencias de las especiesClostridium butyricum Clostridium petfringens y Citrobacter freundii En la Tabla 2 se muestrala cantidad de registros que fueron agregados a la base de datos para cad a subcategorfamientras que en la Tabla 3 se enlistan los numeros de acceso en GenBank para secuen-cias representativas de cada subcategorfa almacenadas en MULTI-CLOST Los numerosde acceso de GenBank y UniProt contenidos en cada regisrro perrniten recuperar la se-cuencia genetica e informacion de conglomerados a partir de GenBank asr como lasecuencia proteica e informacion biologica a partir de UniProt Todas las enzimas inclui-das en cada categorfa fueron utifizadas para realizar los alineamientos multiples

CONSTRUCCI6N DE ALJNEAMIENTOS MULTIPLES CON ALTA CONSERVACION DE SECUENCIAS

Las secuencias de los genes almacenados en MULTI-CLOST fueron usadas para crearlos alineamientos a partir de los cuales se disefiarfan las sondas de oligonucleotidesSe esrablecieron como criterios de seleccion los valores PAP mfnimos 65 y 50 deacuerdo con el contenido de secuencias conservadas en cad a ahnearmento eliminan-dose de cad a uno 105 genes que produjeran PAP inferiores a estes valores En el casode las celulasas se usaron parametres mas flexibles (apropiados para enzimas multi-dominie) y sus dominies funcionales se alinearon independienternenre Para losalineamientos de genes de las categorfas Solventogenesis 13-Propanodiol y Factorde esporulacion SpaDA se usaron las penalidades de aperture y extension de gaps [15-666] establecidas por defecto en ClustalW y apropiadas para genes conservados encoda su extension a craves de diversas especies En los alineamientos definitivos de ceu-lasas fue necesario flexibilizar dichas penalidades de forma que se pudieran alinear fa-cilmente los dominios conservados en cada familia enzirnatica En estes casos se utilize-ron las penalidades de apertura y extension [11- 1J correspondienres a las penalidadespar defecto usadas en algunas aplicaciones de BLAST (Altschul et aI 1997) De estaforma los alineamienros definitivos fueron construidos con tres combinaciones de pa-metros 65 - [15- 666J 50 - [15- 666J Y 50 - [11-1] (PAP - [apertura- extension degaps]) Con el uso de dichas combinaciones de parametres se obruvieron en rota I 56alineamientos definitivos para las cuatra categorias de MULTI-CLOST EI numero dealineamientos obtenidos en cada categorfa can las diferenres combinaciones de para-metros se muestra en la Tabla 4

Celulasas

alineamientos

97 cmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotFFacto~dde~~ii6spoioiA~-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotrmiddotmiddotmiddotmiddotmiddot~middot8 1

110

3

Tabla 4 Alineamienros Inulriples agrupados par las caregor(as de la base de daros MULTI-CLOST ypar los criterios de alincamienro

66 Articulo - Diseno de oligonucleotidos para el estudia de genes celuloitticos y solventoginicos en cepasde Clostridium sp (Clostridiaceae) MOlltoya et al

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

1060 1080TIT T

T~GC AAaAAaTa AATAC AC ag aGa

6661068

639675651

c

1100 1120

I_ A

A A

II I~A AA A -

T

T CA 718GGB 1120

c CT 6912C T 727

703TGG

GGT GAaAGAGCaATAAGACATGC AT GAaGT GC

Figura 4 Ahneamienro multiple para el factor de esporulacion SpoOA de cinco especies de Clostridiumusando un PAP minima de 65 y penalidades 15- 666 (apertura extension de gaps) La ultima lineamuescra la secuencia consenso donde las letras en mayuscula indican posiciones compleramenreconservadas y las leer-asen rninuscula indican posiciones conservadas en cuacro de las cinco secuen-cias Los bloque en negro indican regiones identicas miencras que los bloques en diferentes ronos degris muestran regiones parcialrnente conservadas

Dada la dificultad inhereme al alineamiento de genes provenienres de especies tandiversas como las analizadas el 77 de los alineamienros definicivos contiene dos acuatro genes y el 18 contiene cinco 0 seis genes En la Figura 4 a manera de ejemplose observa el alineamienro multiple de genes correspondiences a facto res de esporu-lacion SpaDA penenecienres a varias especies de closrridios

DISENO DE LAS SONDAS DE OLiGONUCLE6TIDOS

La estrategia de diserio de oligonucleocidos en esre trabajo esca enfocada a la obtencionde sondas que permitan ioenrificar cad a gen de inreres en cualquiera de las especies quecomponen los alinearnientos as como en las cepas colombianas de Clostridium sp Lalongirud minima de las sondas se establecio a partir de los resultados de busquedas enGenBank con sondas de longitud creciente disenadas para un gen Endoglucanasausando BLASTN Se encontro que con sondas de longitud inferior a 19 nucleotidos re-sulta imposible distinguir los resultados especfficos de los inespecificos a partir de losvalores de referencia Score y Valor E (Tabla 6 Altschul et al 1997) Dicha longitud seencuenrra en el rango de valores reportados para euroI diseno de sondas de oligonucleo-tidos para microarreglos (Guckenberger et al 2002 Lee et ai 2004) En total se obtu-vieron 94 sondas de oligonucleotidos algunas de las cuales se enlistan en la tabla 5 ycuyos resultados en la busqueda can BLASTN con Valor E inferior a 005 correspon-dieron en cada caso a las enzimas para las cuaes fueron diseriadas (Ia lista completa desondas esta disponible como material suplementario en http)jwwwibununaleducoIineasbioprocesosindexhtm) En promedio con cada sanda se pueden reconocer tresgenes espedficos para la enzima objetivo en GenBank tras las busquedas correspon~dienres con BLASTN 10cual sugiere que existe una buena probabilidad de reconocer losgenes hom610gos en las cepas promisorias de Clostridium Los resultados de las busque-das can RPS-BLAST indican que las sondas diseriadas para las rutas de acidogenesissolventogenesis y producci6n de 13-PD reconocen siempre el mismo dominio en cadagen miencras que en el caso de las celulasas cada sonda puede identiFicar varias enzi-

Acta bioi Colomb Vol 12 S 2007 67

mas de diversa funcion que poseen el mismo dominio funcional (considerando el ca-racter multidominio de las celulasas)

Oligo CAGCTTGAATTCTATCAGTG Oligo CAGCTTGAATTCTATCAGTro-gtucE2ti-de6t~aos Lo~i~td-9~ude6daas

Resuitildomiddot middot j ~~~~~J~~aio(middotEmiddotT-Res~middotltmiddotadomiddot middotmiddotmiddotmiddotl~~~E~I~~ viiarIc~i~i~~~d~Ci~~tidi~ 40 0009 Celulasa de Clostridium 38 gQ~~~)c~l~i~s~d~CI~~tidi~ ~middotmiddotmiddotmiddotmiddot40middotmiddotmiddotmiddotmiddotmiddotmiddot 0ori9middotrmiddotc~imiddot~i~smiddot~middotmiddotmiddotdmiddot~middotmiddotd~~middottidi~middotmiddotmiddotmiddotL 38 ~ 0034Ceimiddot~iilsmiddotamiddotmiddotddostldiu ~~~ 0009 c~i~f~middotsmiddotamiddotmiddotmiddot~fmiddotmiddotdo~middottjdjumiddot jiF _~deg034~

~~~~~~gg~~~~~t~~~~~ middot~middotmiddot~middot~middotmiddotl~~~~~t~ggmiddot~~~~t~~~~~~ 01

3 013

middotmiddotbFjAnmiddottmiddotemiddotrg~nlcoJeAmiddotthmiddot~middotif~middot~middot~ middotmiddotmiddotmiddotj6 613 bijAintmiddotemiddotrg~nmiddotcomiddotmiddotmiddotdeAmiddotmiddotmiddottiiamiddot~~n~middotimiddot middotmiddot 36middot 0136NAmiddot middotmiddot h middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot ~middotmiddot 34 6Ki i 6NAmiddotmiddotmiddotimiddotn[middotmiddotrg~nmiddotcamiddotmiddothumiddotmamiddotnomiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot_middot34middot _1053p~tmiddot~middotmiddot~~~d~~D~~~middotnmiddotmiddotjmiddot~middot~i) 34 652 middotp~middot~tmiddot~middoti~middot~middotmiddotdmiddotemiddotmiddot~middotnmiddoti6middotnmiddotmiddotdmiddot~middotr~[middota ~ 34 _ ~ 053

Fa(tormiddotmiddotamiddotnea FmiddotancanTh~mailo 34 bull 652~~~~p~~lt~~Jimiddot~pi~~~Ti~~~j4 652 i

Oligo CAGCTTGAATTCTATCAG Oligo CAGClTGAATTCTATCAlongimiddottudmiddotfS nmiddot-ietmiddottidoSmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot j middotLorigrcumiddotamiddotmiddotfjnumiddotde6ddosmiddotmiddotmiddotmiddotResljitild) middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~~~t~j~vilior-EResljitildo ~~~~~~ middotmiddotmiddotmiddotva-iarEC~(~i~s~dea~tdj~~ 36 r 0131 C~i~i~~adea~id~~~ 34 T 053c~i~i~s~dmiddotCiostdj~~middotmiddotmiddot 36 ojj Celulasa de Clostridi~middot~middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotbullmiddotmiddot 34 OS3iCelulasa de Clostridium -t- j6~ l middotbT3gtmiddotmiddotmiddotmiddotCeT~iilsmiddotamiddotdeClo5idiui bullj4 3 - 1bNAliltmiddot~rg~ilmiddotic~middotmiddotmiddothumiddotmamiddotn~ 36 6130 DNA intergenico humane 34 053

~ ~DmiddotNAmiddotmiddotlntmiddoterg~nmiddoticomiddotmiddotmiddothumiddotmamiddotno ~ middotmiddotmiddotmiddotmiddot3Kmiddot 6-j- i middotmiddotbmiddotNAmiddot~middotntemiddotrg~nmiddot~omiddothmiddot~middotmamiddotmiddotomiddot 34 053 ~ ~ bNAjnterglfi1Tco--aeif thaioi) 34 653 (lYNAlnterglfricoaeAihaioiio1 34 middot6middot5~rmiddotmiddot

bmiddotNAmiddotlntmiddotemiddotrg~nTcohtimanomiddot middotmiddotmiddotmiddotmiddotj4 J 653middotmiddotmiddotbmiddotNAlrlmiddotcmiddoterg~nicohumane 34 deg 53~PmiddotrmiddotocmiddotmiddotfnmiddotimiddotmiddotdmiddotmiddotmiddotumiddotrmiddottSilmiddotmiddotdmiddotracmiddotamiddotmiddot r middotmiddotmiddotmiddotmiddotmiddot34 sectsect~middotmiddotrmiddot~~middot~tmiddot~t~~~~~6E~middotmiddot~~~~~~__1 34middot QI~-

Tabla 6 Resultados de la busqueda can oligonucleotides de longirud crecienre para EndoglucanasaGH48 en GenBank usando BLASTN 228 Los resultados rorulados como Celulasa de Clostridiumcorresponden a registros de endoglucanasas (resultados especfficos) mientras que las cifras marca-das con un asterisco () corresponden al mayor puntaje y el menor Valor E obtenidos en cadabusqueda Se observa que con los oligos de 17 y 18 nucle6tidos se obtiene el mayor puncaje y elmenor Valor E tanto para los resulcados espedficos como para algunos inespedficos Por ello seestableci6 como norma para el disefio de sondas una longitud minima de 19 nucle6tidos Nota Lasmagnitudes del mayor Puntaje y el menor Valor E no son comparables entre los cuatro oligos ya queestas depend en directa e inversameme de la longicud de la secuencia de busqueda en BLASTN

Las sondas disenadas se encuentran distribuidas de la siguiente forma 25 corres-ponden a la caregorfa Solventogenesis 48 a la categorfa Celulasas (con sondaspara varias familias de dominios funcionales en cad a tipo de enzima) 19 a lt 13-Pro-panodiol y dos aJ factor SpoOA Los valores caracterfsticos promedio de las sondasdisefiadas fueron los siguientes longitud de 24 nucleotidos Tm termodinamica de658 degC contenido de (G+C) de 390 Tm de la horquilla mas estable (cuandoexiste) de 104 degC y 6G de uni6n al objetivo de -374 kCal(Mol De esta forma se(oncluye que todas las sondas disenadas pueden ser usadas para la construccion deun microarreglo hibridizado a 42degC (Cronin et a 2001) 0 bien para un ensayo deSouthern Blot realizado en condiciones similares (Harris et 01 2002) Se disenaronademas sondas para control positive negative y de purificacion de rRNA utilizandolos mismos criterios descritos anteriormente la sonda de control positivo 5-

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 2: Oligonucleotide Probe Design for the Study of Cellulolytic

56 Articulo - Disetio de oligonude6tidos para el estudio de genes celulolfticos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya et al

nucteocidos Tm promedio de 658 C Y contenido de (G+C) entre 143 y 600 Sedetermine que ninguna de las sondas disenadas forma estructuras secundarias establescan T m superior a 361 C De acuerdo a sus caractertsticas y valcres terrnodinamicosrodas las sondas podrlan ser utilizadas en la consrroccion de un micraarreglo a en reac-ciones de PCR para la identificacion de regiones relevantes en el mejoramiento del pro-ceso por ingenierta merabolica

Palabras clave sondas de oligonucleoridos Clostridium sp Microarreglos Bioin-formatica

ABSTRACT

The goal of the present study was to analyze the metabolic pathways involved in solventproduction and cellulose consumption by promising Colombian native strains of thegenus Clostridium Therefore a set of oligonucleotide probes was designed with the aimof analyzing potential targets for genetic improvement of the Colombian strains Thedatabase named MULTI-CLOST was created in Microsoft Accessreg using the sequencesfrom 485 genes involved in solventogenesis 13-propanodiol production and cellu-lolysis from 45 bacterial and 10 fungal species The genes were grouped according totheir respective enzyme function and to the catalytic domain or the substrate bindingdomain in the case of cellulases C1ustalW 183 was used for multiple alignment ofevery group Subgroups of sequences with more than 50 identity among themselveswere created Conserved sequences longer than 19 nucleotides were identified usingGeneDoc 26002 and their thermodynamic values were calculated with GeneRunnerv305 while their sensitivity and specificity were verified by searching in GenBank withBLASTN 228 Ninety-four conserved sequences were obtained with an average 24-nucleotide length 658degC average Tm and a (G+C) content between 143 and 600None of these probes forms stable secondary structures at temperatures higher than361degC According to the former results all of the probes could be used in an oligo-nucleotide microarray or in peR reactions for the identification of metabolic targets forimprovement of the industrial process

Key words Oligonucleotide probes Clostridium sp Microarrays Bioinformatics

INTRODUCCION

Este trabajo parte de la necesidad de una herramienta molecular adecuada para ladereccion de genes involucrados en los procesos de solventogenesis y cetulolisis encepas colombianas promisorias del genero Clostridium Dicho genera incluye especiessolventogenicas y no patcgenas empleadas exrensarnente desde principios del siglo XXpara la produccion de acerona butanol y etanol (jones eta 1986) Algunas de estasespecies tienen la capacidad de utilizar sustratos celul6sicos para la fermentaci6nacecobutflica los cuales reducen significativarnenre el costo total del proceso Tradi-cionalmente la renrabilidad industrial de la biosfntesis de estos solventes y la degrada-cion de celulosa depende de los rendimientos de la cepa y del costo de la Fuente de

Acta bioI Colomb Vol 1252007 57

carbono (Lynd et aI 2002 Pachauri et aI 2006) En el ambito internacional se hanpatentado varios procesos consolidados para la produccion biorecnologica de solven-tes con cepas bacterianas transformadas alcanzando altos rendimientos por medio delusc de sustratos economicos y enzimas de alta eficiencia (Nakamura et ai 2003 Zverlovetal 2006)

El Instituto de Biotecnologra de la Universidad Nacional de Colombia (IBUN) ha tr-a-bajado en el empleo de residuos agroindustriales y en la busqueda de cepas nativascon rendimientos superiores al de las cepas patron En la decade de 1990 se aislaron178 cepas de Clostridium a partir de suelos colombianos con el animo de encontrarcepas hiperproductoras de solventes En uno de los estudios realizados se seleccioria-ron 13 cepas reniendo como base la concentracion de solventes rotales -acetona bu-tanol y etanol- a partir de glucosa (Montoya et a 2000) Esrudios posteriores evi-denciaron que las cepas nativas de Clostridium pueden degradar sustratos celuloscoscomo pectina xilano carboximetil-celulosa y celulosa microcristalina (Montoya et aI2001) mientras que cinco de las cepas producen 13-propanodiol (13-PD) a partirde glicerol en mayor concentracion que Clostridium butyrieum DSM2478 (Cardenas et012006) Adicionalmenre los analisis de vanabilidad molecular por AFLP -AmplifiedFragment Lenght Polymorfism- PFGE -Putsed Field Gel Electrophoresis- e hibridizacion DNA-DNA sugieren que 10 de las cepas promisorias correspondertan a una nueva especiedel genero Clostridium filogeneticarnente muy cercana a C butyrieum (Arevalo 2001Suarez 2004 Jaimes et aI 2006) Esre conjunto de resultados permite considerar alas cepas nacivas como candidatas para el diseno de bioprocesos innovadores de pro-duccion de solvenres a nivel industrial Los rendimienros de las cepas prornisoriaspodrran ser mejorados por ingenierfa rnetabolca 10cual requiere del conocimienro delos genes de las rutas metabolicas involucradas en los procesos de solventogenesis ycelulolisis Los prirneros esrudios genecicos de las cepas promisorias incluyen la cons-truccion de una librerta genornica a partir de la cepa IBUN 22A en la cual se encontra-ron ocho clones con actividades exoglucanasa endoglucanasa y -glucosidasa (Vargaset aI 2002) Esrudios posteriores permitieron predecir genes hom61ogos a dhaBl ydhaT de C butyricum en las cepas narivas IBUN 22A IBUN 13A e IBUN 158B dlchosgenes codifican para las protefnas Glicerol Deshidratasa y 13-Propanodiol Oxidorre-ductasa involucradas en la producci6n de 13-PD a partir de gliceral (Montoya et al2006 Quilaguy etal comunicaci6n personal)

Un esrudio completo de los genes involucrados en las rutas metab61icas de Imeresrequiere de una estrategia mas eficieme basada en la informacion genomica que hasido obtenida a nivel mundial para el genera Clostridium Sin embargo hasta la fechaClostridium acetobutylicum Clostridium beJjerinckii Clostridium kluyveri y Clostridiumthermocellum son las unicas especies solvenrogenicas yjo celulolfticas no patogenas delgenero cuyo genoma ha sido completamenre secuenciado (Nailing et aI 2001Copeland etal 2007a Copeland etal 2007b Seedorfetal 2007) Un ensayo dehibridacion basado en sondas universales constiruye una buena alternativa puesroque permitirfa analizar la presencia y expresi6n de los genes involucrados en rod as lasrutas metab61icas sin necesidad de conocer previamente la secuencia genornica

58 Articulo - Dizeno de oligonucle6tidos pam el estudio de genes cetotottucos y solventoginicos en cepasde Clostridium sp (C1ostridiaceae) Montoya et a]

exacra de las cepas promisorias En esre trabajo se plantea el uso de un microarreglocomo ensayo de hibridaci6n puesto que los microarreglos poseen alta capacidad deprocesamiento de muesrras y su costo es comparable con el de orras tecnicas para elanal isis de perfiles de expresion como SAGE -Seriai Analysis or Gene Expresion- SSH -Suppression Substractive Hibridization- y M PSS -Massively Parallel Signature Sequencing-(Velvescu et a 1995 Bunney et aI 2003 Stoughton 2005) Los microarreglos deDNA son ensayos drigidos a la secuer-cia genomica de un organismo que permirenanalizar la concentracion relariva de una gran variedad de moleculas espectficas deDNA 0 RNA simultaneamenre Las muestras analizadas usual mente corresponden aDNA 0 RNA total extrado del cultivo bajo las condiciones de esrudio el cual es hi-bridizado con las sondas del microarreglo para determinar a presencia y nivel deexpresi6n de genes especificos (Stoughron 2005) Por medic de los microarreglos sepueden identificar fenotipos bacterianos espectficos asignarle funci6n a genes desco-nocidos agrupar genes en ruras metabolicas de interes idenrificar 105genes regula-dores de dichas rutas y otras funciones que resultan utiles en la comprension delmetabolismo fermenrarivo de las cepas nativas de Clostridium sp Por ejemplo esru-dios previos de cepas mutadas de C acetobutylicum usando un microarreglo genormcohan demostrado la presencia de genes reguladores necesarios para la solvenrogenesisy la esporulaci6n en el megaplasmido p50Ll (Tomas etal 2003 Alsakeretal 2005)EI objetivo de este articulo es proponer una merodologta para el diseiio de sondas deDNA utiles en la construcci6n de un microarreglo de oligonuclecridos 0 en otrosensayos de hibridacion enfocados al estudio y mejoramiento de las rutas metabolicasanrenormente mencionadas Las sondas para microarreglos pueden corresponder acDNAs preidentificados (RNA total retrotranscrito) 0 bien a una coieccion de oligo-nucleotidos disenados para genes espectficos EI uso de un microarreglo de oligonu-cleotidos supone ventajas en nuestro caso puesto que los oligonucteotidos basadosen secuencias consenso permiten detectar la expresion de genes conservados en espe-cies cuyo genoma aun no ha sido secuenciado como es el caso de las cepas colom-bianas de Clostridium sp La utilidad de esta merodologia ha sido demostrada entrabajos como la patente de Graham y Wollweber (1990) quienes disenaron oligonu-cle6tidos consenso para la detecci6n de middot-amilasas en diferentes especies del generoBacillus 0 bien en el trabajo de Matveeva etal (2004) quienes disenaron oligonucleo-tidos consenso dirigidos a genoma del VIH-1 a partir de regiones conservadas en 105alineamiencos multiples de sus variances EI uso de micro-arreglos de oligonucleotidostambien ha sido reportado para el genero Clostridium por Paredes etal (2007) quie-nes disenaron un microarreglo con oligomeros de 60 nucle6tidos para el analisismetab61ico en cepas mutadas de C acetobutylicum Este artfculo presenta una meto-dologfa para el diseno de oligonucleotidos a partir de secuencias geneticas publicadasen GenBank para especies bacterianas y fungicas represencativas de las rutas mera-b61icas de interes con la cual se busca compensar la baja cantidad de secuenciaspublicadas hasta la fecha para especies del genero Clostridium EI diseno esta basadoen la identificacion de secuencias conservadas en la mayor cantidad de especiesposible de forma que cad a sonda resurante sea util para detectar la presencia delmismo gen tanto en dichas especies como en las cepas nativas de Clostridium sp(partiendo de su cercanfa evolutiva ylo metab6Iica) En la metodologra propuesta se

Acta bioi Cotomb Vol 12 S 2007 59

han tenido en cuenta aspectos generales del disefio de oligonucleotides para micro-arreglos tales como su especificidad con respecto al gen objetivo su incapacidadpara formar homodtmeros 0 heterodrmeros con otras sondas la ausencia de estruc-turas secunda-ias y e control de parametres como longitud y Tm (punto de fusion)dentro de rangos previamente establecidos (Tolstrup et at 2003)

MATERIALES Y METODOS

CONSTRUCct6N DE LA BASE DE DATOS LOCAL MUlTImiddotClOST

A partir de una revision bibliografica se identificaron las enzimas que participan en laproduccion de aceta to butirato etanol acerona y butanol a partir de piruvato (Fig 1)asi como en la produccion de 13-propanodiol y dihidroxiacerona-P a partir de glicerol(Fig 2) en clostridios solvenrogenicos no pat6genos Tarnbien se identificaron lasenzimas involucradas en la degradaci6n de celulosa hasca glucosa incluyendo lasprorernas estrucrurales del celulosoma (complejo de cegradacion de sustratos celu-16sicos) y en la degradaci6n de polisecaridos de la hemicelulosa hasta los monosa-ceridos correspondienres (Fig 3 Schwarz 2001) Las secuencias de los genes con-es-pondientes fueron obtenidas en GenBank (Benson et al 2007) y UniProt (Bairoch et aI200S) para 16 especies del genero Clostridium y 29 generos de microorganismos relacio-nados (Tabla 1) Los registros de dichas secuencias fueron almacenados y categorizadosen una base de daros construioa en Microsoft Access XP Para cada registro se recopilola siguienre informacion nombre del gen numero de acceso de GenBank nombre de laprotefna codificada nomero de acceso de Uniprot especie conglomerado (si el genpertenece a uno) longitud del gen y longitud de la proteina

Piruvaro

H-FdH=f0A~L-- coFd co

1 72 Acetilfosfato y- Acenl-Coe ~ II Aceraldehrdc

I CoA CoA pAcetate CoA 5 CoA I Eranol I

5

I Acetona I + CO2

CoA-h idroxi b u tiri I-CoA

~H20

Crotonil-CoA I Butanol I 10 +11-1-- Butiraldehido

AcetoacelatO61

AcetoacetimiddotCoA

Butirato

4 3BuririlfosfalO 7

CoA

BlIrUII-CoA

CoA

Figura 1 Enzimas involucradas en la producci6n de solventes de Clostridium incluidas en la base dedatos 1 Fosfotransacerilasa 2 Acerato kinasa 3 Fosforransburirilasa 4 Burirato kinasa S Acero-acetilacil CoA transferasa 6 Acetoacetaro descarboxilasa 7 Acetaldehfdo deshidrogenasa 8Piruvato descarboxilasa 9 Alcohol deshidrogenasa 10 Buriraldehfdo deshidrogenasa 11 Butanoldeshidrogenasa

60 Articulo - Oiseno de oligoIJucle6tidos para el estudio de genes celutottucoe y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

NAD

H2--- Glicerol

-----1 2 41N~~H+WN~~NHHAidD~i~3naldehidO fT

Dihidroxiacerona

ATPj13-Propanodoll 5 ADP

Glucosa - ---+ Dihidroxiacecona P Cbcer aldehtdo 3 P

iPiruvato

Biomasa

NADHI-WImiddot

NAD+I

Glicerol ~ GlicerolmiddotP

Pi H20

Figura 2 Ruta de asimilaci6n de glicerol en Clostridium butyricum 1 Glicerol deshidratasa 2 Active-dar de la glicerol desbidratasa 3 13-PD deshidrogenasa 4 Glicerol deshidrogenasa 5 Dihidroxia-cerona kinase 6 Glicerol-Scfosfarasa 7 Glicerol kinasa

Para esta base de datos local se establecieron las siguientes categonas (1) Solventoge-nesis con las enzimas fosfotranscarboxilasas carboxilato kinasas CoA transferasasacetoacetate descarboxilasas aldehtdo deshidrogenasas y alcohol deshidrogenasasnecesarias para la producci6n de aceta to butiraco etanol butanol y acetona (jones yWoods 1986 Biebl et al 1999 Nailing et al 2001) (2) 1 3-Propanodiol donde sealmacenaron registros para las enzimas glicerol deshidratasa 13-PD deshidrogenasaglicerol deshidrogenasa dihidroxiacetona kinasa y glicerol-3-fosfatasal necesarias parala produccion de 13-propanodiol y glicerol (Biebl et af 1999) (3) Celulasas dondese incluyeron las protefnas estructurales que forman el andamio y el sistema de anclajedel celulosoma (Bayer eta 1998) asl como celulasas entre las que se cuentan exoglu-canasas endoglucanasas -glucosidasas xilanasas xilosidasas y mananasas (Coughlany Mayer 1992 Lucas et at 2001) La subcategoria Celulasas fue a su vez separada porfamilias de glicosil hidrolasas dominios de union a celulosa y dominios de homologfacon la capa 5 considerando la composici6n multidominio de estas enzimas (Rabinovichet at 2002) Adicionalmente se decidi6 incluir la categorfa Factor de transcripcionSpoOA dado que est a prorelna de esporutacion ha sido reconocida como factor detranscripci6n de los operones sol adc y bdh de producci6n de solventes (Harris et at2002) La lista completa de categorfas y subcategorfas se presenta en la Tabla 2

CONSTRUCCI6N DE AliMENTOS MULTIPLES CON ALTA CONSERVACl6N DE SECUENCIAS

Para cad a tipo de enzima las secuencias de los genes registrados en MULTI-CLOSTfueron recuperadas a partir de GenBank tomando siempre la cadena positiva de cadagen En el caso de la categorfa Celulasas los grupos fueron formados por familias dedominios catalfticos 0 de union a sustrato dentro de cada tipo de enzima (Bayer eta1998) Las secuencias de cada grupo fueron alineadas con el programa de alinea-miento multiple ClustalW 183 (Thompson et al 1994) usando la matriz de respecti-vamenre La calidad de los alineamientos multiples fue mejarada par eliminaci6n de

Acta bioi Colomb Vol 125 2007 61

jESpeCie ___

3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot2middot

bull

32

Solvenrogenesis Ce--

4

iJ~Ii 1 2

B~i1i~~bt]tiili~ltimiddotmiddot~middoti~middotmiddott bullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbull1bullbullbullbullbullbullbullbull17 - + + ~ 9 j

~Iimditni 2bullbullmiddotbullbullbullmiddotbullbullbullbullbullbullbullbullbull1 middotmiddotbullbullbullbullmiddotbullmiddotmiddotbullbullbullbullbull+7

PP + j ~~timi I + +

17

11

1

813

i

h

15 bullbullbullbullbullbull

13

51

1

L middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot4middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot8 _

14

2

2

39 bullbull bullbullbullbullbullbull

16

21

2

~

+ + 5

pcJ [ 24 + +

putidaTs alb

jl

4

95

12

Tabla 1 Rcgistros inclvidos por cada especie en las cacegortas de MU LTI-CLOST

3

95

62 Articulo - Oisetlo de oligol1l1c1e6tidos para el estudia de genes cetutoteicos y solventogenicos en ccpasde Clostridium sp (Clostriditlceae) Montoya er al

los genes con secuencia menos conservada hasra alcanzar un valor alineamientoC1ustaIW16 (peso de 1 para las concordancias y 0 en los demas casas Aiyar 2000) ylos valores de penalizacion Pv aperture y extension de gaps 15 y 666 superior a 65 enel promedio del Puntaje de Alineamientos Pareados (PAP) calculado por C1ustalWentre rod os los genes de cada alineamiento (este valor minimo se redujo a 50 en las fa-milias enziroaricas can alta variabilidad de secuencia como es el caso de las celulasasmultidominio) Los alineamientos multiples definitivos fueron construidos con los ge-nes restar-res utilizando los valores de penalizacion 15 y 666 para aperture y extensionde gaps (11 y 1 para las families enzimacicas can alta variabilidad de secuencia )

GHEnzimas incluidas en la base de datos

1 Celotasas [exo- y endoglucanasas2 Mananasas3 xrtanasas4 Prorerna andamtoS Proretnas adapradoras6 croretoas de anctaje7 Proieroas de (a capa S

Cetulosa

Pared (eubr

Microorganismo celulolioco

Figura 3 Componentes esrructurales y cacalrricos del celulosoma unidos a una celuia del microor-ganismo que 10 produce y al sustrato celul6sico simuheneamenre Dominies funcionales SLHhomologia con la capa S CH I Y CH II Cohesin I y II DK I Y DK IJ Dockerin I y II CBM modulo deunion a celulosa GH Glicosil hidrolasa

DISENO DE LAS SONDAS DE OliGONUCLEOTIDOS

A partir de los alineamientos detinitivos se exrrajeron secuencias con longirud minimade 19 nucleotidos conservadas en mas del 50 de los genes de cada alineamienroutilizando para ello el editor de alineamienros GeneDoc 26002 (Nicholas y Nicholas2001) La longitud minima requerida para las sondas fue establecida a partir de losresultados arrojados par BLASTN para sondas de 17 a 20 nucle6tidos dirigidas a unmismo gen de Endoglucanasa (Tabla 6) Para aumencar la probabilidad de que losoligonucleocidos diseriados puedan reconocer sus genes objerivo en las cepas prorni-sorias de Clostridium sp se seleccionaron siempre regiones conservadas en al menosuna especie de los ordeoes Clostridiales 0 Bacillales Las propiedades termodinamicasde las sondas disefiadas fueron calculadas con GeneRunner v305 (Hastings SoftwareNY) y se aceptaron solo aquellas cuya Tm segun la formula termodinamica de San-taLucia (1998) estuviera en el rango de 44 a 90 degC y que no formaran estructurassecundarias con Tm superior a 37 0c Esros criterios se establecieron considerando lastemperaturas de desnaturaizaci6n e hibridacion recomendadas usualmente para mi~croarreglos (42 ( Y95 ( respectivamenre Hedge et aI 2000 Schuchhardt et aI 2000Tomas et aI 2003 Tummala et al 2003 Rybicki 2005) Para comprobar la sensi-bilidad y especificidad de los oligonucleotidos diseiiados est os fueron sometidos abusquedas en GenBank 1410 (Benson et al 2007) usando la aplicacion BLAsTN228 (Altschul et aI 1997) se seleccionaron aquellos oligonucleotidos para los

Acta bioi Colomb Vol 12 S 2007 63

cuales rodos los regisrros reportados por BLASTN con Valor E (Expected Value) inferior aOOS correspondieran a genes can funcion equivalence a los genes del alineamientooriginal (los resultados de BLASTN son mas significativos cuando su valor E es menorpero el valor E tiende a ser conservative cuando la secuencia de busqueda es muy cottade manera que para secuencias de longitud menor a 40 nucleotidos los resultados convalor E lt 005 se pueden considerar especfficos Altschul et 01 1997) Por ultimo seestableciola ubicacion de cada sonda de ohgonuclectidos en sus genes objetivo usandoel programa Artemis vS (Rutherford et at 2000) y se determine el dominic funcionalcorrespondienre a cad a una por medic de busquedas de las prorefnas codificadas porlos genes objetivo en la base de daros CDD vl65 (Conserved Domain Database) usandoRPS~BLAST 226 (Reversed Position Specific BLAST Altschul et 01 1997)

A-~-id-og~~~i~y~~i~~t~i~~~~i(95 registros)

SU~~~~~~~f~Fosforransacen lasa

Aceraro kinasa

17

2

Butirato 16 II

Fosfotra nsbutiri lasa

Piruvaro

2

29

15

Aceroaceraro 26

17

4

Aldehrdo

Alcohol deshidrogenasade cadena carra

Bctwiiif~~~i~~j 1~3Ir~C~Od(n~~i~~Lbullbullbullbull3f t~Aceroacerilacil CoA 4 Celodexrrrn 2 Facrores de rranscripci6n SpoDAtransferase A (14 regisrros)~+

18

3

11

Arabinosidasas 7

transferasa B s Celobiosa fosforilasasProtefnas de la capa 5Prorernas adapradorasdel andarnioProrefnas de anclajedel celulosorna

232

SubcaregortaNo posee sobcaregona

5

Tabla 2 Numero de registros iocloidos en cada caregorta y subcategorfa de la base de datos MULTImiddotCLOST

RESULTADOS

CONSTRUCCl6N DE LA BASE DE DATOS MULTI-CLOST

La base de datos construida en Microsoft Access XP fue registrada bajo el nornbreMULTI-CLOST ante la Direcci6n Nacional de Derecho de Autor de Colombia (Libra13 Torno 17 Partida 142 del 20 de noviernbre de 2006 disponible en

64 Arrtculo Diseriode oligonucleotidos para el estudio de genes celuolftiws y solventogeniws en cepasde Clostridium sp (Clostridiaceae) Montoya et al

httpWIfNibununaleducolineasbioprocesosindexhtm) Esta base de datos con-riene registros de 485 genes que codifican para las enzimas y prorefnas estructuralesinvolucradas en la acidogenesis solvemogenesis degradaci6n de celulosa y producci6nde 13-PD en 55 especies bacrerianas y fungicas permitiendo recuperar las secuenciasde dichos genes y protein as en las bases de datos GenBank (Benson et al 2007) yUniProt (Bairoch et al 2005) De estos registros 95 corresponden a la caregorfa Solven-rogenesis 94 a la categorfa 1 3-Propanodiol 14 a la categona Factor de esporulaci6nSpoDA y 282 a la caregorta Celulasas la mas numerosa considerando la subdivisionadiciona per farnilias de dominios funcionales

i-S-ubc~tego~raFosfoi~ansacetE3-sa

No6rgaiiTsoClo~tidi~~ih~~~~ii~

i Acetat~middotmiddotki~middotasmiddotamiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot B~~i1i~-~biijismiddotBumiddottlmiddot~atmiddotomiddotmiddotkrnamiddotsamiddotmiddotmiddotmiddotmiddotmiddotmiddotFmiddotomiddot~fomiddottmiddot~amiddotnmiddotsb~middotti~iasamiddot

bilk

AF041S4i

Z99119middotmiddotmiddotmiddotmiddotAY46jmiddot1middot03 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddoti

AE007804M15393

AY251646

- clostidi~--beJemiddot~ckii----ciostid~-~cmiddot~tob~ampIi~~middot CAC30i6-

--P~~~at-od~~~amiddot~bmiddoto~i-iasamiddot middotio~~~~~middotomiddotbij~middotmiddot pd~ A~~tmiddotoa~etmiddotat~middotd~~~middotamiddot~middotbo~TIsmiddotaIc s~~~~i~~pi~~~~~i~~~~~~~~~I adcmiddotmiddotAldmiddotemiddothi~joai~ohofmiddot deshidrogenasa idium tetanimiddotB-~-t~-~~imiddotdmiddot~~hmiddotdgemiddot~middot~amiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotCmiddot C

rmiddotA~-~t~~middot~-~middottmiddotii-~i-imiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~CoA transferasa AA~~to~~~df~iiS~~~~~~~~~~~8 BH2258 AP001514I~_I_~~~_~_~s_~s celK F039030 Endoglucanasas creajecorina _ __ __~ eg~ Y1l1l3middotMamiddot~~middot~middotas~~ 1 middot 7c~~sp mane middotmiddotmiddotmiddotgt(9752middot0middotmiddotmiddotmiddotimiddotximiddotimiddot~asamiddotmiddotmiddotmiddot Ruminococcus abus _ Z~~ AB057589r p~-~~f~middot~middotmiddot~middotdmiddot~middot~middotimiddot~Ruminococcus flaveiJ~i~~ middotmiddotmiddotmiddotmiddotmiddotmiddotmiddott scaA j27i3969

~glucanasas Clostridium thermocellum licB X63355 ~ middotmiddotmiddot~gimiddot~~~~~middot~~-~~_ CIstridiu~ ~-~iipmiddot~~ i abgA L49336 -j

Xilosidasas j ~i~~~~i~0middott~~o~~--middot 1 middotbTBmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAmiddotmiddotJmiddotSmiddotOmiddotS4middotmiddotO5 j

rA-~binomiddot~idmiddotmiddot~~middot~ Bacteroidesmiddotmiddotih~t~jt~li~~ L BT1781 ~~~~~ middot~~middot~i~~~d-middotmiddot~~~-pamiddot smiddot middot~jo~~middot(h~~~~L~1 ~~ middotmiddot1 ~~~~~~

rmiddotGiice~~imiddotdesimiddotimiddotdmiddott~middotsmiddot~ K~b~i~middotii~p~emiddot~middot~j~ middotmiddotmiddotmiddotmiddot1 dh~j32middot U60992 ~middotl-j-pmiddot~~-p~middot~~dmiddot~imiddot - ~ deshidrogenasa Clostridium pasteurianum dhaT AF006034 R dii ~ dhaR U09771i middotGmiddotilmiddot~middotemiddot~of~jemiddotshdrogmiddotemiddotnmiddotasmiddotamiddot Cistjd~middotmiddotb~amp~~m middotmiddotmiddotmiddotmiddotmiddotmiddotdh~i5i AY1j~f5s1

middotomiddot~Imiddotamiddotce[omiddot~middotamiddotkimiddotnmiddotasa middotmiddot--middotmiddotmiddotimiddotmiddot ~~g~~~ ~~~~~~~ Sacch~romycescer~~j~i~~ gpp2 050469

-t-

CTC02182 AE015943

CPE1256 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAPOOjmiddotmiddots9middot

CAP0163 AE001438

F~-~-t~middot~middotmiddotd~middotmiddott~middot~middot~cmiddotipmiddot~-i6middot~middotmiddotmiddot SpaDA i E~~~~~~~~~~ 1 spoOA 1 U43514

Tabla 3 Secuencias represemativas de cada subcategorfa de MULTI-CLOST can su numero de accemiddotso a GenBank

Las especies mayoritarias de la categoria Celulasas son C acetoblJoliclJm y C thermocellumlas cuales representan el 25 de dicha categor(a mientras que en Solventogenesis el

Acta bioi Colomb Vol 1252007 65

mayor porcenraje (36) corresponde a las especies C acetobutylicum y Bacillus subtiiis Parsu parte la categorfa 13-Propanodiol contiene el 25 de secuencias de las especiesClostridium butyricum Clostridium petfringens y Citrobacter freundii En la Tabla 2 se muestrala cantidad de registros que fueron agregados a la base de datos para cad a subcategorfamientras que en la Tabla 3 se enlistan los numeros de acceso en GenBank para secuen-cias representativas de cada subcategorfa almacenadas en MULTI-CLOST Los numerosde acceso de GenBank y UniProt contenidos en cada regisrro perrniten recuperar la se-cuencia genetica e informacion de conglomerados a partir de GenBank asr como lasecuencia proteica e informacion biologica a partir de UniProt Todas las enzimas inclui-das en cada categorfa fueron utifizadas para realizar los alineamientos multiples

CONSTRUCCI6N DE ALJNEAMIENTOS MULTIPLES CON ALTA CONSERVACION DE SECUENCIAS

Las secuencias de los genes almacenados en MULTI-CLOST fueron usadas para crearlos alineamientos a partir de los cuales se disefiarfan las sondas de oligonucleotidesSe esrablecieron como criterios de seleccion los valores PAP mfnimos 65 y 50 deacuerdo con el contenido de secuencias conservadas en cad a ahnearmento eliminan-dose de cad a uno 105 genes que produjeran PAP inferiores a estes valores En el casode las celulasas se usaron parametres mas flexibles (apropiados para enzimas multi-dominie) y sus dominies funcionales se alinearon independienternenre Para losalineamientos de genes de las categorfas Solventogenesis 13-Propanodiol y Factorde esporulacion SpaDA se usaron las penalidades de aperture y extension de gaps [15-666] establecidas por defecto en ClustalW y apropiadas para genes conservados encoda su extension a craves de diversas especies En los alineamientos definitivos de ceu-lasas fue necesario flexibilizar dichas penalidades de forma que se pudieran alinear fa-cilmente los dominios conservados en cada familia enzirnatica En estes casos se utilize-ron las penalidades de apertura y extension [11- 1J correspondienres a las penalidadespar defecto usadas en algunas aplicaciones de BLAST (Altschul et aI 1997) De estaforma los alineamienros definitivos fueron construidos con tres combinaciones de pa-metros 65 - [15- 666J 50 - [15- 666J Y 50 - [11-1] (PAP - [apertura- extension degaps]) Con el uso de dichas combinaciones de parametres se obruvieron en rota I 56alineamientos definitivos para las cuatra categorias de MULTI-CLOST EI numero dealineamientos obtenidos en cada categorfa can las diferenres combinaciones de para-metros se muestra en la Tabla 4

Celulasas

alineamientos

97 cmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotFFacto~dde~~ii6spoioiA~-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotrmiddotmiddotmiddotmiddotmiddot~middot8 1

110

3

Tabla 4 Alineamienros Inulriples agrupados par las caregor(as de la base de daros MULTI-CLOST ypar los criterios de alincamienro

66 Articulo - Diseno de oligonucleotidos para el estudia de genes celuloitticos y solventoginicos en cepasde Clostridium sp (Clostridiaceae) MOlltoya et al

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

1060 1080TIT T

T~GC AAaAAaTa AATAC AC ag aGa

6661068

639675651

c

1100 1120

I_ A

A A

II I~A AA A -

T

T CA 718GGB 1120

c CT 6912C T 727

703TGG

GGT GAaAGAGCaATAAGACATGC AT GAaGT GC

Figura 4 Ahneamienro multiple para el factor de esporulacion SpoOA de cinco especies de Clostridiumusando un PAP minima de 65 y penalidades 15- 666 (apertura extension de gaps) La ultima lineamuescra la secuencia consenso donde las letras en mayuscula indican posiciones compleramenreconservadas y las leer-asen rninuscula indican posiciones conservadas en cuacro de las cinco secuen-cias Los bloque en negro indican regiones identicas miencras que los bloques en diferentes ronos degris muestran regiones parcialrnente conservadas

Dada la dificultad inhereme al alineamiento de genes provenienres de especies tandiversas como las analizadas el 77 de los alineamienros definicivos contiene dos acuatro genes y el 18 contiene cinco 0 seis genes En la Figura 4 a manera de ejemplose observa el alineamienro multiple de genes correspondiences a facto res de esporu-lacion SpaDA penenecienres a varias especies de closrridios

DISENO DE LAS SONDAS DE OLiGONUCLE6TIDOS

La estrategia de diserio de oligonucleocidos en esre trabajo esca enfocada a la obtencionde sondas que permitan ioenrificar cad a gen de inreres en cualquiera de las especies quecomponen los alinearnientos as como en las cepas colombianas de Clostridium sp Lalongirud minima de las sondas se establecio a partir de los resultados de busquedas enGenBank con sondas de longitud creciente disenadas para un gen Endoglucanasausando BLASTN Se encontro que con sondas de longitud inferior a 19 nucleotidos re-sulta imposible distinguir los resultados especfficos de los inespecificos a partir de losvalores de referencia Score y Valor E (Tabla 6 Altschul et al 1997) Dicha longitud seencuenrra en el rango de valores reportados para euroI diseno de sondas de oligonucleo-tidos para microarreglos (Guckenberger et al 2002 Lee et ai 2004) En total se obtu-vieron 94 sondas de oligonucleotidos algunas de las cuales se enlistan en la tabla 5 ycuyos resultados en la busqueda can BLASTN con Valor E inferior a 005 correspon-dieron en cada caso a las enzimas para las cuaes fueron diseriadas (Ia lista completa desondas esta disponible como material suplementario en http)jwwwibununaleducoIineasbioprocesosindexhtm) En promedio con cada sanda se pueden reconocer tresgenes espedficos para la enzima objetivo en GenBank tras las busquedas correspon~dienres con BLASTN 10cual sugiere que existe una buena probabilidad de reconocer losgenes hom610gos en las cepas promisorias de Clostridium Los resultados de las busque-das can RPS-BLAST indican que las sondas diseriadas para las rutas de acidogenesissolventogenesis y producci6n de 13-PD reconocen siempre el mismo dominio en cadagen miencras que en el caso de las celulasas cada sonda puede identiFicar varias enzi-

Acta bioi Colomb Vol 12 S 2007 67

mas de diversa funcion que poseen el mismo dominio funcional (considerando el ca-racter multidominio de las celulasas)

Oligo CAGCTTGAATTCTATCAGTG Oligo CAGCTTGAATTCTATCAGTro-gtucE2ti-de6t~aos Lo~i~td-9~ude6daas

Resuitildomiddot middot j ~~~~~J~~aio(middotEmiddotT-Res~middotltmiddotadomiddot middotmiddotmiddotmiddotl~~~E~I~~ viiarIc~i~i~~~d~Ci~~tidi~ 40 0009 Celulasa de Clostridium 38 gQ~~~)c~l~i~s~d~CI~~tidi~ ~middotmiddotmiddotmiddotmiddot40middotmiddotmiddotmiddotmiddotmiddotmiddot 0ori9middotrmiddotc~imiddot~i~smiddot~middotmiddotmiddotdmiddot~middotmiddotd~~middottidi~middotmiddotmiddotmiddotL 38 ~ 0034Ceimiddot~iilsmiddotamiddotmiddotddostldiu ~~~ 0009 c~i~f~middotsmiddotamiddotmiddotmiddot~fmiddotmiddotdo~middottjdjumiddot jiF _~deg034~

~~~~~~gg~~~~~t~~~~~ middot~middotmiddot~middot~middotmiddotl~~~~~t~ggmiddot~~~~t~~~~~~ 01

3 013

middotmiddotbFjAnmiddottmiddotemiddotrg~nlcoJeAmiddotthmiddot~middotif~middot~middot~ middotmiddotmiddotmiddotj6 613 bijAintmiddotemiddotrg~nmiddotcomiddotmiddotmiddotdeAmiddotmiddotmiddottiiamiddot~~n~middotimiddot middotmiddot 36middot 0136NAmiddot middotmiddot h middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot ~middotmiddot 34 6Ki i 6NAmiddotmiddotmiddotimiddotn[middotmiddotrg~nmiddotcamiddotmiddothumiddotmamiddotnomiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot_middot34middot _1053p~tmiddot~middotmiddot~~~d~~D~~~middotnmiddotmiddotjmiddot~middot~i) 34 652 middotp~middot~tmiddot~middoti~middot~middotmiddotdmiddotemiddotmiddot~middotnmiddoti6middotnmiddotmiddotdmiddot~middotr~[middota ~ 34 _ ~ 053

Fa(tormiddotmiddotamiddotnea FmiddotancanTh~mailo 34 bull 652~~~~p~~lt~~Jimiddot~pi~~~Ti~~~j4 652 i

Oligo CAGCTTGAATTCTATCAG Oligo CAGClTGAATTCTATCAlongimiddottudmiddotfS nmiddot-ietmiddottidoSmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot j middotLorigrcumiddotamiddotmiddotfjnumiddotde6ddosmiddotmiddotmiddotmiddotResljitild) middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~~~t~j~vilior-EResljitildo ~~~~~~ middotmiddotmiddotmiddotva-iarEC~(~i~s~dea~tdj~~ 36 r 0131 C~i~i~~adea~id~~~ 34 T 053c~i~i~s~dmiddotCiostdj~~middotmiddotmiddot 36 ojj Celulasa de Clostridi~middot~middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotbullmiddotmiddot 34 OS3iCelulasa de Clostridium -t- j6~ l middotbT3gtmiddotmiddotmiddotmiddotCeT~iilsmiddotamiddotdeClo5idiui bullj4 3 - 1bNAliltmiddot~rg~ilmiddotic~middotmiddotmiddothumiddotmamiddotn~ 36 6130 DNA intergenico humane 34 053

~ ~DmiddotNAmiddotmiddotlntmiddoterg~nmiddoticomiddotmiddotmiddothumiddotmamiddotno ~ middotmiddotmiddotmiddotmiddot3Kmiddot 6-j- i middotmiddotbmiddotNAmiddot~middotntemiddotrg~nmiddot~omiddothmiddot~middotmamiddotmiddotomiddot 34 053 ~ ~ bNAjnterglfi1Tco--aeif thaioi) 34 653 (lYNAlnterglfricoaeAihaioiio1 34 middot6middot5~rmiddotmiddot

bmiddotNAmiddotlntmiddotemiddotrg~nTcohtimanomiddot middotmiddotmiddotmiddotmiddotj4 J 653middotmiddotmiddotbmiddotNAlrlmiddotcmiddoterg~nicohumane 34 deg 53~PmiddotrmiddotocmiddotmiddotfnmiddotimiddotmiddotdmiddotmiddotmiddotumiddotrmiddottSilmiddotmiddotdmiddotracmiddotamiddotmiddot r middotmiddotmiddotmiddotmiddotmiddot34 sectsect~middotmiddotrmiddot~~middot~tmiddot~t~~~~~6E~middotmiddot~~~~~~__1 34middot QI~-

Tabla 6 Resultados de la busqueda can oligonucleotides de longirud crecienre para EndoglucanasaGH48 en GenBank usando BLASTN 228 Los resultados rorulados como Celulasa de Clostridiumcorresponden a registros de endoglucanasas (resultados especfficos) mientras que las cifras marca-das con un asterisco () corresponden al mayor puntaje y el menor Valor E obtenidos en cadabusqueda Se observa que con los oligos de 17 y 18 nucle6tidos se obtiene el mayor puncaje y elmenor Valor E tanto para los resulcados espedficos como para algunos inespedficos Por ello seestableci6 como norma para el disefio de sondas una longitud minima de 19 nucle6tidos Nota Lasmagnitudes del mayor Puntaje y el menor Valor E no son comparables entre los cuatro oligos ya queestas depend en directa e inversameme de la longicud de la secuencia de busqueda en BLASTN

Las sondas disenadas se encuentran distribuidas de la siguiente forma 25 corres-ponden a la caregorfa Solventogenesis 48 a la categorfa Celulasas (con sondaspara varias familias de dominios funcionales en cad a tipo de enzima) 19 a lt 13-Pro-panodiol y dos aJ factor SpoOA Los valores caracterfsticos promedio de las sondasdisefiadas fueron los siguientes longitud de 24 nucleotidos Tm termodinamica de658 degC contenido de (G+C) de 390 Tm de la horquilla mas estable (cuandoexiste) de 104 degC y 6G de uni6n al objetivo de -374 kCal(Mol De esta forma se(oncluye que todas las sondas disenadas pueden ser usadas para la construccion deun microarreglo hibridizado a 42degC (Cronin et a 2001) 0 bien para un ensayo deSouthern Blot realizado en condiciones similares (Harris et 01 2002) Se disenaronademas sondas para control positive negative y de purificacion de rRNA utilizandolos mismos criterios descritos anteriormente la sonda de control positivo 5-

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 3: Oligonucleotide Probe Design for the Study of Cellulolytic

Acta bioI Colomb Vol 1252007 57

carbono (Lynd et aI 2002 Pachauri et aI 2006) En el ambito internacional se hanpatentado varios procesos consolidados para la produccion biorecnologica de solven-tes con cepas bacterianas transformadas alcanzando altos rendimientos por medio delusc de sustratos economicos y enzimas de alta eficiencia (Nakamura et ai 2003 Zverlovetal 2006)

El Instituto de Biotecnologra de la Universidad Nacional de Colombia (IBUN) ha tr-a-bajado en el empleo de residuos agroindustriales y en la busqueda de cepas nativascon rendimientos superiores al de las cepas patron En la decade de 1990 se aislaron178 cepas de Clostridium a partir de suelos colombianos con el animo de encontrarcepas hiperproductoras de solventes En uno de los estudios realizados se seleccioria-ron 13 cepas reniendo como base la concentracion de solventes rotales -acetona bu-tanol y etanol- a partir de glucosa (Montoya et a 2000) Esrudios posteriores evi-denciaron que las cepas nativas de Clostridium pueden degradar sustratos celuloscoscomo pectina xilano carboximetil-celulosa y celulosa microcristalina (Montoya et aI2001) mientras que cinco de las cepas producen 13-propanodiol (13-PD) a partirde glicerol en mayor concentracion que Clostridium butyrieum DSM2478 (Cardenas et012006) Adicionalmenre los analisis de vanabilidad molecular por AFLP -AmplifiedFragment Lenght Polymorfism- PFGE -Putsed Field Gel Electrophoresis- e hibridizacion DNA-DNA sugieren que 10 de las cepas promisorias correspondertan a una nueva especiedel genero Clostridium filogeneticarnente muy cercana a C butyrieum (Arevalo 2001Suarez 2004 Jaimes et aI 2006) Esre conjunto de resultados permite considerar alas cepas nacivas como candidatas para el diseno de bioprocesos innovadores de pro-duccion de solvenres a nivel industrial Los rendimienros de las cepas prornisoriaspodrran ser mejorados por ingenierfa rnetabolca 10cual requiere del conocimienro delos genes de las rutas metabolicas involucradas en los procesos de solventogenesis ycelulolisis Los prirneros esrudios genecicos de las cepas promisorias incluyen la cons-truccion de una librerta genornica a partir de la cepa IBUN 22A en la cual se encontra-ron ocho clones con actividades exoglucanasa endoglucanasa y -glucosidasa (Vargaset aI 2002) Esrudios posteriores permitieron predecir genes hom61ogos a dhaBl ydhaT de C butyricum en las cepas narivas IBUN 22A IBUN 13A e IBUN 158B dlchosgenes codifican para las protefnas Glicerol Deshidratasa y 13-Propanodiol Oxidorre-ductasa involucradas en la producci6n de 13-PD a partir de gliceral (Montoya et al2006 Quilaguy etal comunicaci6n personal)

Un esrudio completo de los genes involucrados en las rutas metab61icas de Imeresrequiere de una estrategia mas eficieme basada en la informacion genomica que hasido obtenida a nivel mundial para el genera Clostridium Sin embargo hasta la fechaClostridium acetobutylicum Clostridium beJjerinckii Clostridium kluyveri y Clostridiumthermocellum son las unicas especies solvenrogenicas yjo celulolfticas no patogenas delgenero cuyo genoma ha sido completamenre secuenciado (Nailing et aI 2001Copeland etal 2007a Copeland etal 2007b Seedorfetal 2007) Un ensayo dehibridacion basado en sondas universales constiruye una buena alternativa puesroque permitirfa analizar la presencia y expresi6n de los genes involucrados en rod as lasrutas metab61icas sin necesidad de conocer previamente la secuencia genornica

58 Articulo - Dizeno de oligonucle6tidos pam el estudio de genes cetotottucos y solventoginicos en cepasde Clostridium sp (C1ostridiaceae) Montoya et a]

exacra de las cepas promisorias En esre trabajo se plantea el uso de un microarreglocomo ensayo de hibridaci6n puesto que los microarreglos poseen alta capacidad deprocesamiento de muesrras y su costo es comparable con el de orras tecnicas para elanal isis de perfiles de expresion como SAGE -Seriai Analysis or Gene Expresion- SSH -Suppression Substractive Hibridization- y M PSS -Massively Parallel Signature Sequencing-(Velvescu et a 1995 Bunney et aI 2003 Stoughton 2005) Los microarreglos deDNA son ensayos drigidos a la secuer-cia genomica de un organismo que permirenanalizar la concentracion relariva de una gran variedad de moleculas espectficas deDNA 0 RNA simultaneamenre Las muestras analizadas usual mente corresponden aDNA 0 RNA total extrado del cultivo bajo las condiciones de esrudio el cual es hi-bridizado con las sondas del microarreglo para determinar a presencia y nivel deexpresi6n de genes especificos (Stoughron 2005) Por medic de los microarreglos sepueden identificar fenotipos bacterianos espectficos asignarle funci6n a genes desco-nocidos agrupar genes en ruras metabolicas de interes idenrificar 105genes regula-dores de dichas rutas y otras funciones que resultan utiles en la comprension delmetabolismo fermenrarivo de las cepas nativas de Clostridium sp Por ejemplo esru-dios previos de cepas mutadas de C acetobutylicum usando un microarreglo genormcohan demostrado la presencia de genes reguladores necesarios para la solvenrogenesisy la esporulaci6n en el megaplasmido p50Ll (Tomas etal 2003 Alsakeretal 2005)EI objetivo de este articulo es proponer una merodologta para el diseiio de sondas deDNA utiles en la construcci6n de un microarreglo de oligonuclecridos 0 en otrosensayos de hibridacion enfocados al estudio y mejoramiento de las rutas metabolicasanrenormente mencionadas Las sondas para microarreglos pueden corresponder acDNAs preidentificados (RNA total retrotranscrito) 0 bien a una coieccion de oligo-nucleotidos disenados para genes espectficos EI uso de un microarreglo de oligonu-cleotidos supone ventajas en nuestro caso puesto que los oligonucteotidos basadosen secuencias consenso permiten detectar la expresion de genes conservados en espe-cies cuyo genoma aun no ha sido secuenciado como es el caso de las cepas colom-bianas de Clostridium sp La utilidad de esta merodologia ha sido demostrada entrabajos como la patente de Graham y Wollweber (1990) quienes disenaron oligonu-cle6tidos consenso para la detecci6n de middot-amilasas en diferentes especies del generoBacillus 0 bien en el trabajo de Matveeva etal (2004) quienes disenaron oligonucleo-tidos consenso dirigidos a genoma del VIH-1 a partir de regiones conservadas en 105alineamiencos multiples de sus variances EI uso de micro-arreglos de oligonucleotidostambien ha sido reportado para el genero Clostridium por Paredes etal (2007) quie-nes disenaron un microarreglo con oligomeros de 60 nucle6tidos para el analisismetab61ico en cepas mutadas de C acetobutylicum Este artfculo presenta una meto-dologfa para el diseno de oligonucleotidos a partir de secuencias geneticas publicadasen GenBank para especies bacterianas y fungicas represencativas de las rutas mera-b61icas de interes con la cual se busca compensar la baja cantidad de secuenciaspublicadas hasta la fecha para especies del genero Clostridium EI diseno esta basadoen la identificacion de secuencias conservadas en la mayor cantidad de especiesposible de forma que cad a sonda resurante sea util para detectar la presencia delmismo gen tanto en dichas especies como en las cepas nativas de Clostridium sp(partiendo de su cercanfa evolutiva ylo metab6Iica) En la metodologra propuesta se

Acta bioi Cotomb Vol 12 S 2007 59

han tenido en cuenta aspectos generales del disefio de oligonucleotides para micro-arreglos tales como su especificidad con respecto al gen objetivo su incapacidadpara formar homodtmeros 0 heterodrmeros con otras sondas la ausencia de estruc-turas secunda-ias y e control de parametres como longitud y Tm (punto de fusion)dentro de rangos previamente establecidos (Tolstrup et at 2003)

MATERIALES Y METODOS

CONSTRUCct6N DE LA BASE DE DATOS LOCAL MUlTImiddotClOST

A partir de una revision bibliografica se identificaron las enzimas que participan en laproduccion de aceta to butirato etanol acerona y butanol a partir de piruvato (Fig 1)asi como en la produccion de 13-propanodiol y dihidroxiacerona-P a partir de glicerol(Fig 2) en clostridios solvenrogenicos no pat6genos Tarnbien se identificaron lasenzimas involucradas en la degradaci6n de celulosa hasca glucosa incluyendo lasprorernas estrucrurales del celulosoma (complejo de cegradacion de sustratos celu-16sicos) y en la degradaci6n de polisecaridos de la hemicelulosa hasta los monosa-ceridos correspondienres (Fig 3 Schwarz 2001) Las secuencias de los genes con-es-pondientes fueron obtenidas en GenBank (Benson et al 2007) y UniProt (Bairoch et aI200S) para 16 especies del genero Clostridium y 29 generos de microorganismos relacio-nados (Tabla 1) Los registros de dichas secuencias fueron almacenados y categorizadosen una base de daros construioa en Microsoft Access XP Para cada registro se recopilola siguienre informacion nombre del gen numero de acceso de GenBank nombre de laprotefna codificada nomero de acceso de Uniprot especie conglomerado (si el genpertenece a uno) longitud del gen y longitud de la proteina

Piruvaro

H-FdH=f0A~L-- coFd co

1 72 Acetilfosfato y- Acenl-Coe ~ II Aceraldehrdc

I CoA CoA pAcetate CoA 5 CoA I Eranol I

5

I Acetona I + CO2

CoA-h idroxi b u tiri I-CoA

~H20

Crotonil-CoA I Butanol I 10 +11-1-- Butiraldehido

AcetoacelatO61

AcetoacetimiddotCoA

Butirato

4 3BuririlfosfalO 7

CoA

BlIrUII-CoA

CoA

Figura 1 Enzimas involucradas en la producci6n de solventes de Clostridium incluidas en la base dedatos 1 Fosfotransacerilasa 2 Acerato kinasa 3 Fosforransburirilasa 4 Burirato kinasa S Acero-acetilacil CoA transferasa 6 Acetoacetaro descarboxilasa 7 Acetaldehfdo deshidrogenasa 8Piruvato descarboxilasa 9 Alcohol deshidrogenasa 10 Buriraldehfdo deshidrogenasa 11 Butanoldeshidrogenasa

60 Articulo - Oiseno de oligoIJucle6tidos para el estudio de genes celutottucoe y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

NAD

H2--- Glicerol

-----1 2 41N~~H+WN~~NHHAidD~i~3naldehidO fT

Dihidroxiacerona

ATPj13-Propanodoll 5 ADP

Glucosa - ---+ Dihidroxiacecona P Cbcer aldehtdo 3 P

iPiruvato

Biomasa

NADHI-WImiddot

NAD+I

Glicerol ~ GlicerolmiddotP

Pi H20

Figura 2 Ruta de asimilaci6n de glicerol en Clostridium butyricum 1 Glicerol deshidratasa 2 Active-dar de la glicerol desbidratasa 3 13-PD deshidrogenasa 4 Glicerol deshidrogenasa 5 Dihidroxia-cerona kinase 6 Glicerol-Scfosfarasa 7 Glicerol kinasa

Para esta base de datos local se establecieron las siguientes categonas (1) Solventoge-nesis con las enzimas fosfotranscarboxilasas carboxilato kinasas CoA transferasasacetoacetate descarboxilasas aldehtdo deshidrogenasas y alcohol deshidrogenasasnecesarias para la producci6n de aceta to butiraco etanol butanol y acetona (jones yWoods 1986 Biebl et al 1999 Nailing et al 2001) (2) 1 3-Propanodiol donde sealmacenaron registros para las enzimas glicerol deshidratasa 13-PD deshidrogenasaglicerol deshidrogenasa dihidroxiacetona kinasa y glicerol-3-fosfatasal necesarias parala produccion de 13-propanodiol y glicerol (Biebl et af 1999) (3) Celulasas dondese incluyeron las protefnas estructurales que forman el andamio y el sistema de anclajedel celulosoma (Bayer eta 1998) asl como celulasas entre las que se cuentan exoglu-canasas endoglucanasas -glucosidasas xilanasas xilosidasas y mananasas (Coughlany Mayer 1992 Lucas et at 2001) La subcategoria Celulasas fue a su vez separada porfamilias de glicosil hidrolasas dominios de union a celulosa y dominios de homologfacon la capa 5 considerando la composici6n multidominio de estas enzimas (Rabinovichet at 2002) Adicionalmente se decidi6 incluir la categorfa Factor de transcripcionSpoOA dado que est a prorelna de esporutacion ha sido reconocida como factor detranscripci6n de los operones sol adc y bdh de producci6n de solventes (Harris et at2002) La lista completa de categorfas y subcategorfas se presenta en la Tabla 2

CONSTRUCCI6N DE AliMENTOS MULTIPLES CON ALTA CONSERVACl6N DE SECUENCIAS

Para cad a tipo de enzima las secuencias de los genes registrados en MULTI-CLOSTfueron recuperadas a partir de GenBank tomando siempre la cadena positiva de cadagen En el caso de la categorfa Celulasas los grupos fueron formados por familias dedominios catalfticos 0 de union a sustrato dentro de cada tipo de enzima (Bayer eta1998) Las secuencias de cada grupo fueron alineadas con el programa de alinea-miento multiple ClustalW 183 (Thompson et al 1994) usando la matriz de respecti-vamenre La calidad de los alineamientos multiples fue mejarada par eliminaci6n de

Acta bioi Colomb Vol 125 2007 61

jESpeCie ___

3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot2middot

bull

32

Solvenrogenesis Ce--

4

iJ~Ii 1 2

B~i1i~~bt]tiili~ltimiddotmiddot~middoti~middotmiddott bullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbull1bullbullbullbullbullbullbullbull17 - + + ~ 9 j

~Iimditni 2bullbullmiddotbullbullbullmiddotbullbullbullbullbullbullbullbullbull1 middotmiddotbullbullbullbullmiddotbullmiddotmiddotbullbullbullbullbull+7

PP + j ~~timi I + +

17

11

1

813

i

h

15 bullbullbullbullbullbull

13

51

1

L middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot4middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot8 _

14

2

2

39 bullbull bullbullbullbullbullbull

16

21

2

~

+ + 5

pcJ [ 24 + +

putidaTs alb

jl

4

95

12

Tabla 1 Rcgistros inclvidos por cada especie en las cacegortas de MU LTI-CLOST

3

95

62 Articulo - Oisetlo de oligol1l1c1e6tidos para el estudia de genes cetutoteicos y solventogenicos en ccpasde Clostridium sp (Clostriditlceae) Montoya er al

los genes con secuencia menos conservada hasra alcanzar un valor alineamientoC1ustaIW16 (peso de 1 para las concordancias y 0 en los demas casas Aiyar 2000) ylos valores de penalizacion Pv aperture y extension de gaps 15 y 666 superior a 65 enel promedio del Puntaje de Alineamientos Pareados (PAP) calculado por C1ustalWentre rod os los genes de cada alineamiento (este valor minimo se redujo a 50 en las fa-milias enziroaricas can alta variabilidad de secuencia como es el caso de las celulasasmultidominio) Los alineamientos multiples definitivos fueron construidos con los ge-nes restar-res utilizando los valores de penalizacion 15 y 666 para aperture y extensionde gaps (11 y 1 para las families enzimacicas can alta variabilidad de secuencia )

GHEnzimas incluidas en la base de datos

1 Celotasas [exo- y endoglucanasas2 Mananasas3 xrtanasas4 Prorerna andamtoS Proretnas adapradoras6 croretoas de anctaje7 Proieroas de (a capa S

Cetulosa

Pared (eubr

Microorganismo celulolioco

Figura 3 Componentes esrructurales y cacalrricos del celulosoma unidos a una celuia del microor-ganismo que 10 produce y al sustrato celul6sico simuheneamenre Dominies funcionales SLHhomologia con la capa S CH I Y CH II Cohesin I y II DK I Y DK IJ Dockerin I y II CBM modulo deunion a celulosa GH Glicosil hidrolasa

DISENO DE LAS SONDAS DE OliGONUCLEOTIDOS

A partir de los alineamientos detinitivos se exrrajeron secuencias con longirud minimade 19 nucleotidos conservadas en mas del 50 de los genes de cada alineamienroutilizando para ello el editor de alineamienros GeneDoc 26002 (Nicholas y Nicholas2001) La longitud minima requerida para las sondas fue establecida a partir de losresultados arrojados par BLASTN para sondas de 17 a 20 nucle6tidos dirigidas a unmismo gen de Endoglucanasa (Tabla 6) Para aumencar la probabilidad de que losoligonucleocidos diseriados puedan reconocer sus genes objerivo en las cepas prorni-sorias de Clostridium sp se seleccionaron siempre regiones conservadas en al menosuna especie de los ordeoes Clostridiales 0 Bacillales Las propiedades termodinamicasde las sondas disefiadas fueron calculadas con GeneRunner v305 (Hastings SoftwareNY) y se aceptaron solo aquellas cuya Tm segun la formula termodinamica de San-taLucia (1998) estuviera en el rango de 44 a 90 degC y que no formaran estructurassecundarias con Tm superior a 37 0c Esros criterios se establecieron considerando lastemperaturas de desnaturaizaci6n e hibridacion recomendadas usualmente para mi~croarreglos (42 ( Y95 ( respectivamenre Hedge et aI 2000 Schuchhardt et aI 2000Tomas et aI 2003 Tummala et al 2003 Rybicki 2005) Para comprobar la sensi-bilidad y especificidad de los oligonucleotidos diseiiados est os fueron sometidos abusquedas en GenBank 1410 (Benson et al 2007) usando la aplicacion BLAsTN228 (Altschul et aI 1997) se seleccionaron aquellos oligonucleotidos para los

Acta bioi Colomb Vol 12 S 2007 63

cuales rodos los regisrros reportados por BLASTN con Valor E (Expected Value) inferior aOOS correspondieran a genes can funcion equivalence a los genes del alineamientooriginal (los resultados de BLASTN son mas significativos cuando su valor E es menorpero el valor E tiende a ser conservative cuando la secuencia de busqueda es muy cottade manera que para secuencias de longitud menor a 40 nucleotidos los resultados convalor E lt 005 se pueden considerar especfficos Altschul et 01 1997) Por ultimo seestableciola ubicacion de cada sonda de ohgonuclectidos en sus genes objetivo usandoel programa Artemis vS (Rutherford et at 2000) y se determine el dominic funcionalcorrespondienre a cad a una por medic de busquedas de las prorefnas codificadas porlos genes objetivo en la base de daros CDD vl65 (Conserved Domain Database) usandoRPS~BLAST 226 (Reversed Position Specific BLAST Altschul et 01 1997)

A-~-id-og~~~i~y~~i~~t~i~~~~i(95 registros)

SU~~~~~~~f~Fosforransacen lasa

Aceraro kinasa

17

2

Butirato 16 II

Fosfotra nsbutiri lasa

Piruvaro

2

29

15

Aceroaceraro 26

17

4

Aldehrdo

Alcohol deshidrogenasade cadena carra

Bctwiiif~~~i~~j 1~3Ir~C~Od(n~~i~~Lbullbullbullbull3f t~Aceroacerilacil CoA 4 Celodexrrrn 2 Facrores de rranscripci6n SpoDAtransferase A (14 regisrros)~+

18

3

11

Arabinosidasas 7

transferasa B s Celobiosa fosforilasasProtefnas de la capa 5Prorernas adapradorasdel andarnioProrefnas de anclajedel celulosorna

232

SubcaregortaNo posee sobcaregona

5

Tabla 2 Numero de registros iocloidos en cada caregorta y subcategorfa de la base de datos MULTImiddotCLOST

RESULTADOS

CONSTRUCCl6N DE LA BASE DE DATOS MULTI-CLOST

La base de datos construida en Microsoft Access XP fue registrada bajo el nornbreMULTI-CLOST ante la Direcci6n Nacional de Derecho de Autor de Colombia (Libra13 Torno 17 Partida 142 del 20 de noviernbre de 2006 disponible en

64 Arrtculo Diseriode oligonucleotidos para el estudio de genes celuolftiws y solventogeniws en cepasde Clostridium sp (Clostridiaceae) Montoya et al

httpWIfNibununaleducolineasbioprocesosindexhtm) Esta base de datos con-riene registros de 485 genes que codifican para las enzimas y prorefnas estructuralesinvolucradas en la acidogenesis solvemogenesis degradaci6n de celulosa y producci6nde 13-PD en 55 especies bacrerianas y fungicas permitiendo recuperar las secuenciasde dichos genes y protein as en las bases de datos GenBank (Benson et al 2007) yUniProt (Bairoch et al 2005) De estos registros 95 corresponden a la caregorfa Solven-rogenesis 94 a la categorfa 1 3-Propanodiol 14 a la categona Factor de esporulaci6nSpoDA y 282 a la caregorta Celulasas la mas numerosa considerando la subdivisionadiciona per farnilias de dominios funcionales

i-S-ubc~tego~raFosfoi~ansacetE3-sa

No6rgaiiTsoClo~tidi~~ih~~~~ii~

i Acetat~middotmiddotki~middotasmiddotamiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot B~~i1i~-~biijismiddotBumiddottlmiddot~atmiddotomiddotmiddotkrnamiddotsamiddotmiddotmiddotmiddotmiddotmiddotmiddotFmiddotomiddot~fomiddottmiddot~amiddotnmiddotsb~middotti~iasamiddot

bilk

AF041S4i

Z99119middotmiddotmiddotmiddotmiddotAY46jmiddot1middot03 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddoti

AE007804M15393

AY251646

- clostidi~--beJemiddot~ckii----ciostid~-~cmiddot~tob~ampIi~~middot CAC30i6-

--P~~~at-od~~~amiddot~bmiddoto~i-iasamiddot middotio~~~~~middotomiddotbij~middotmiddot pd~ A~~tmiddotoa~etmiddotat~middotd~~~middotamiddot~middotbo~TIsmiddotaIc s~~~~i~~pi~~~~~i~~~~~~~~~I adcmiddotmiddotAldmiddotemiddothi~joai~ohofmiddot deshidrogenasa idium tetanimiddotB-~-t~-~~imiddotdmiddot~~hmiddotdgemiddot~middot~amiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotCmiddot C

rmiddotA~-~t~~middot~-~middottmiddotii-~i-imiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~CoA transferasa AA~~to~~~df~iiS~~~~~~~~~~~8 BH2258 AP001514I~_I_~~~_~_~s_~s celK F039030 Endoglucanasas creajecorina _ __ __~ eg~ Y1l1l3middotMamiddot~~middot~middotas~~ 1 middot 7c~~sp mane middotmiddotmiddotmiddotgt(9752middot0middotmiddotmiddotmiddotimiddotximiddotimiddot~asamiddotmiddotmiddotmiddot Ruminococcus abus _ Z~~ AB057589r p~-~~f~middot~middotmiddot~middotdmiddot~middot~middotimiddot~Ruminococcus flaveiJ~i~~ middotmiddotmiddotmiddotmiddotmiddotmiddotmiddott scaA j27i3969

~glucanasas Clostridium thermocellum licB X63355 ~ middotmiddotmiddot~gimiddot~~~~~middot~~-~~_ CIstridiu~ ~-~iipmiddot~~ i abgA L49336 -j

Xilosidasas j ~i~~~~i~0middott~~o~~--middot 1 middotbTBmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAmiddotmiddotJmiddotSmiddotOmiddotS4middotmiddotO5 j

rA-~binomiddot~idmiddotmiddot~~middot~ Bacteroidesmiddotmiddotih~t~jt~li~~ L BT1781 ~~~~~ middot~~middot~i~~~d-middotmiddot~~~-pamiddot smiddot middot~jo~~middot(h~~~~L~1 ~~ middotmiddot1 ~~~~~~

rmiddotGiice~~imiddotdesimiddotimiddotdmiddott~middotsmiddot~ K~b~i~middotii~p~emiddot~middot~j~ middotmiddotmiddotmiddotmiddot1 dh~j32middot U60992 ~middotl-j-pmiddot~~-p~middot~~dmiddot~imiddot - ~ deshidrogenasa Clostridium pasteurianum dhaT AF006034 R dii ~ dhaR U09771i middotGmiddotilmiddot~middotemiddot~of~jemiddotshdrogmiddotemiddotnmiddotasmiddotamiddot Cistjd~middotmiddotb~amp~~m middotmiddotmiddotmiddotmiddotmiddotmiddotdh~i5i AY1j~f5s1

middotomiddot~Imiddotamiddotce[omiddot~middotamiddotkimiddotnmiddotasa middotmiddot--middotmiddotmiddotimiddotmiddot ~~g~~~ ~~~~~~~ Sacch~romycescer~~j~i~~ gpp2 050469

-t-

CTC02182 AE015943

CPE1256 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAPOOjmiddotmiddots9middot

CAP0163 AE001438

F~-~-t~middot~middotmiddotd~middotmiddott~middot~middot~cmiddotipmiddot~-i6middot~middotmiddotmiddot SpaDA i E~~~~~~~~~~ 1 spoOA 1 U43514

Tabla 3 Secuencias represemativas de cada subcategorfa de MULTI-CLOST can su numero de accemiddotso a GenBank

Las especies mayoritarias de la categoria Celulasas son C acetoblJoliclJm y C thermocellumlas cuales representan el 25 de dicha categor(a mientras que en Solventogenesis el

Acta bioi Colomb Vol 1252007 65

mayor porcenraje (36) corresponde a las especies C acetobutylicum y Bacillus subtiiis Parsu parte la categorfa 13-Propanodiol contiene el 25 de secuencias de las especiesClostridium butyricum Clostridium petfringens y Citrobacter freundii En la Tabla 2 se muestrala cantidad de registros que fueron agregados a la base de datos para cad a subcategorfamientras que en la Tabla 3 se enlistan los numeros de acceso en GenBank para secuen-cias representativas de cada subcategorfa almacenadas en MULTI-CLOST Los numerosde acceso de GenBank y UniProt contenidos en cada regisrro perrniten recuperar la se-cuencia genetica e informacion de conglomerados a partir de GenBank asr como lasecuencia proteica e informacion biologica a partir de UniProt Todas las enzimas inclui-das en cada categorfa fueron utifizadas para realizar los alineamientos multiples

CONSTRUCCI6N DE ALJNEAMIENTOS MULTIPLES CON ALTA CONSERVACION DE SECUENCIAS

Las secuencias de los genes almacenados en MULTI-CLOST fueron usadas para crearlos alineamientos a partir de los cuales se disefiarfan las sondas de oligonucleotidesSe esrablecieron como criterios de seleccion los valores PAP mfnimos 65 y 50 deacuerdo con el contenido de secuencias conservadas en cad a ahnearmento eliminan-dose de cad a uno 105 genes que produjeran PAP inferiores a estes valores En el casode las celulasas se usaron parametres mas flexibles (apropiados para enzimas multi-dominie) y sus dominies funcionales se alinearon independienternenre Para losalineamientos de genes de las categorfas Solventogenesis 13-Propanodiol y Factorde esporulacion SpaDA se usaron las penalidades de aperture y extension de gaps [15-666] establecidas por defecto en ClustalW y apropiadas para genes conservados encoda su extension a craves de diversas especies En los alineamientos definitivos de ceu-lasas fue necesario flexibilizar dichas penalidades de forma que se pudieran alinear fa-cilmente los dominios conservados en cada familia enzirnatica En estes casos se utilize-ron las penalidades de apertura y extension [11- 1J correspondienres a las penalidadespar defecto usadas en algunas aplicaciones de BLAST (Altschul et aI 1997) De estaforma los alineamienros definitivos fueron construidos con tres combinaciones de pa-metros 65 - [15- 666J 50 - [15- 666J Y 50 - [11-1] (PAP - [apertura- extension degaps]) Con el uso de dichas combinaciones de parametres se obruvieron en rota I 56alineamientos definitivos para las cuatra categorias de MULTI-CLOST EI numero dealineamientos obtenidos en cada categorfa can las diferenres combinaciones de para-metros se muestra en la Tabla 4

Celulasas

alineamientos

97 cmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotFFacto~dde~~ii6spoioiA~-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotrmiddotmiddotmiddotmiddotmiddot~middot8 1

110

3

Tabla 4 Alineamienros Inulriples agrupados par las caregor(as de la base de daros MULTI-CLOST ypar los criterios de alincamienro

66 Articulo - Diseno de oligonucleotidos para el estudia de genes celuloitticos y solventoginicos en cepasde Clostridium sp (Clostridiaceae) MOlltoya et al

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

1060 1080TIT T

T~GC AAaAAaTa AATAC AC ag aGa

6661068

639675651

c

1100 1120

I_ A

A A

II I~A AA A -

T

T CA 718GGB 1120

c CT 6912C T 727

703TGG

GGT GAaAGAGCaATAAGACATGC AT GAaGT GC

Figura 4 Ahneamienro multiple para el factor de esporulacion SpoOA de cinco especies de Clostridiumusando un PAP minima de 65 y penalidades 15- 666 (apertura extension de gaps) La ultima lineamuescra la secuencia consenso donde las letras en mayuscula indican posiciones compleramenreconservadas y las leer-asen rninuscula indican posiciones conservadas en cuacro de las cinco secuen-cias Los bloque en negro indican regiones identicas miencras que los bloques en diferentes ronos degris muestran regiones parcialrnente conservadas

Dada la dificultad inhereme al alineamiento de genes provenienres de especies tandiversas como las analizadas el 77 de los alineamienros definicivos contiene dos acuatro genes y el 18 contiene cinco 0 seis genes En la Figura 4 a manera de ejemplose observa el alineamienro multiple de genes correspondiences a facto res de esporu-lacion SpaDA penenecienres a varias especies de closrridios

DISENO DE LAS SONDAS DE OLiGONUCLE6TIDOS

La estrategia de diserio de oligonucleocidos en esre trabajo esca enfocada a la obtencionde sondas que permitan ioenrificar cad a gen de inreres en cualquiera de las especies quecomponen los alinearnientos as como en las cepas colombianas de Clostridium sp Lalongirud minima de las sondas se establecio a partir de los resultados de busquedas enGenBank con sondas de longitud creciente disenadas para un gen Endoglucanasausando BLASTN Se encontro que con sondas de longitud inferior a 19 nucleotidos re-sulta imposible distinguir los resultados especfficos de los inespecificos a partir de losvalores de referencia Score y Valor E (Tabla 6 Altschul et al 1997) Dicha longitud seencuenrra en el rango de valores reportados para euroI diseno de sondas de oligonucleo-tidos para microarreglos (Guckenberger et al 2002 Lee et ai 2004) En total se obtu-vieron 94 sondas de oligonucleotidos algunas de las cuales se enlistan en la tabla 5 ycuyos resultados en la busqueda can BLASTN con Valor E inferior a 005 correspon-dieron en cada caso a las enzimas para las cuaes fueron diseriadas (Ia lista completa desondas esta disponible como material suplementario en http)jwwwibununaleducoIineasbioprocesosindexhtm) En promedio con cada sanda se pueden reconocer tresgenes espedficos para la enzima objetivo en GenBank tras las busquedas correspon~dienres con BLASTN 10cual sugiere que existe una buena probabilidad de reconocer losgenes hom610gos en las cepas promisorias de Clostridium Los resultados de las busque-das can RPS-BLAST indican que las sondas diseriadas para las rutas de acidogenesissolventogenesis y producci6n de 13-PD reconocen siempre el mismo dominio en cadagen miencras que en el caso de las celulasas cada sonda puede identiFicar varias enzi-

Acta bioi Colomb Vol 12 S 2007 67

mas de diversa funcion que poseen el mismo dominio funcional (considerando el ca-racter multidominio de las celulasas)

Oligo CAGCTTGAATTCTATCAGTG Oligo CAGCTTGAATTCTATCAGTro-gtucE2ti-de6t~aos Lo~i~td-9~ude6daas

Resuitildomiddot middot j ~~~~~J~~aio(middotEmiddotT-Res~middotltmiddotadomiddot middotmiddotmiddotmiddotl~~~E~I~~ viiarIc~i~i~~~d~Ci~~tidi~ 40 0009 Celulasa de Clostridium 38 gQ~~~)c~l~i~s~d~CI~~tidi~ ~middotmiddotmiddotmiddotmiddot40middotmiddotmiddotmiddotmiddotmiddotmiddot 0ori9middotrmiddotc~imiddot~i~smiddot~middotmiddotmiddotdmiddot~middotmiddotd~~middottidi~middotmiddotmiddotmiddotL 38 ~ 0034Ceimiddot~iilsmiddotamiddotmiddotddostldiu ~~~ 0009 c~i~f~middotsmiddotamiddotmiddotmiddot~fmiddotmiddotdo~middottjdjumiddot jiF _~deg034~

~~~~~~gg~~~~~t~~~~~ middot~middotmiddot~middot~middotmiddotl~~~~~t~ggmiddot~~~~t~~~~~~ 01

3 013

middotmiddotbFjAnmiddottmiddotemiddotrg~nlcoJeAmiddotthmiddot~middotif~middot~middot~ middotmiddotmiddotmiddotj6 613 bijAintmiddotemiddotrg~nmiddotcomiddotmiddotmiddotdeAmiddotmiddotmiddottiiamiddot~~n~middotimiddot middotmiddot 36middot 0136NAmiddot middotmiddot h middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot ~middotmiddot 34 6Ki i 6NAmiddotmiddotmiddotimiddotn[middotmiddotrg~nmiddotcamiddotmiddothumiddotmamiddotnomiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot_middot34middot _1053p~tmiddot~middotmiddot~~~d~~D~~~middotnmiddotmiddotjmiddot~middot~i) 34 652 middotp~middot~tmiddot~middoti~middot~middotmiddotdmiddotemiddotmiddot~middotnmiddoti6middotnmiddotmiddotdmiddot~middotr~[middota ~ 34 _ ~ 053

Fa(tormiddotmiddotamiddotnea FmiddotancanTh~mailo 34 bull 652~~~~p~~lt~~Jimiddot~pi~~~Ti~~~j4 652 i

Oligo CAGCTTGAATTCTATCAG Oligo CAGClTGAATTCTATCAlongimiddottudmiddotfS nmiddot-ietmiddottidoSmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot j middotLorigrcumiddotamiddotmiddotfjnumiddotde6ddosmiddotmiddotmiddotmiddotResljitild) middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~~~t~j~vilior-EResljitildo ~~~~~~ middotmiddotmiddotmiddotva-iarEC~(~i~s~dea~tdj~~ 36 r 0131 C~i~i~~adea~id~~~ 34 T 053c~i~i~s~dmiddotCiostdj~~middotmiddotmiddot 36 ojj Celulasa de Clostridi~middot~middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotbullmiddotmiddot 34 OS3iCelulasa de Clostridium -t- j6~ l middotbT3gtmiddotmiddotmiddotmiddotCeT~iilsmiddotamiddotdeClo5idiui bullj4 3 - 1bNAliltmiddot~rg~ilmiddotic~middotmiddotmiddothumiddotmamiddotn~ 36 6130 DNA intergenico humane 34 053

~ ~DmiddotNAmiddotmiddotlntmiddoterg~nmiddoticomiddotmiddotmiddothumiddotmamiddotno ~ middotmiddotmiddotmiddotmiddot3Kmiddot 6-j- i middotmiddotbmiddotNAmiddot~middotntemiddotrg~nmiddot~omiddothmiddot~middotmamiddotmiddotomiddot 34 053 ~ ~ bNAjnterglfi1Tco--aeif thaioi) 34 653 (lYNAlnterglfricoaeAihaioiio1 34 middot6middot5~rmiddotmiddot

bmiddotNAmiddotlntmiddotemiddotrg~nTcohtimanomiddot middotmiddotmiddotmiddotmiddotj4 J 653middotmiddotmiddotbmiddotNAlrlmiddotcmiddoterg~nicohumane 34 deg 53~PmiddotrmiddotocmiddotmiddotfnmiddotimiddotmiddotdmiddotmiddotmiddotumiddotrmiddottSilmiddotmiddotdmiddotracmiddotamiddotmiddot r middotmiddotmiddotmiddotmiddotmiddot34 sectsect~middotmiddotrmiddot~~middot~tmiddot~t~~~~~6E~middotmiddot~~~~~~__1 34middot QI~-

Tabla 6 Resultados de la busqueda can oligonucleotides de longirud crecienre para EndoglucanasaGH48 en GenBank usando BLASTN 228 Los resultados rorulados como Celulasa de Clostridiumcorresponden a registros de endoglucanasas (resultados especfficos) mientras que las cifras marca-das con un asterisco () corresponden al mayor puntaje y el menor Valor E obtenidos en cadabusqueda Se observa que con los oligos de 17 y 18 nucle6tidos se obtiene el mayor puncaje y elmenor Valor E tanto para los resulcados espedficos como para algunos inespedficos Por ello seestableci6 como norma para el disefio de sondas una longitud minima de 19 nucle6tidos Nota Lasmagnitudes del mayor Puntaje y el menor Valor E no son comparables entre los cuatro oligos ya queestas depend en directa e inversameme de la longicud de la secuencia de busqueda en BLASTN

Las sondas disenadas se encuentran distribuidas de la siguiente forma 25 corres-ponden a la caregorfa Solventogenesis 48 a la categorfa Celulasas (con sondaspara varias familias de dominios funcionales en cad a tipo de enzima) 19 a lt 13-Pro-panodiol y dos aJ factor SpoOA Los valores caracterfsticos promedio de las sondasdisefiadas fueron los siguientes longitud de 24 nucleotidos Tm termodinamica de658 degC contenido de (G+C) de 390 Tm de la horquilla mas estable (cuandoexiste) de 104 degC y 6G de uni6n al objetivo de -374 kCal(Mol De esta forma se(oncluye que todas las sondas disenadas pueden ser usadas para la construccion deun microarreglo hibridizado a 42degC (Cronin et a 2001) 0 bien para un ensayo deSouthern Blot realizado en condiciones similares (Harris et 01 2002) Se disenaronademas sondas para control positive negative y de purificacion de rRNA utilizandolos mismos criterios descritos anteriormente la sonda de control positivo 5-

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 4: Oligonucleotide Probe Design for the Study of Cellulolytic

58 Articulo - Dizeno de oligonucle6tidos pam el estudio de genes cetotottucos y solventoginicos en cepasde Clostridium sp (C1ostridiaceae) Montoya et a]

exacra de las cepas promisorias En esre trabajo se plantea el uso de un microarreglocomo ensayo de hibridaci6n puesto que los microarreglos poseen alta capacidad deprocesamiento de muesrras y su costo es comparable con el de orras tecnicas para elanal isis de perfiles de expresion como SAGE -Seriai Analysis or Gene Expresion- SSH -Suppression Substractive Hibridization- y M PSS -Massively Parallel Signature Sequencing-(Velvescu et a 1995 Bunney et aI 2003 Stoughton 2005) Los microarreglos deDNA son ensayos drigidos a la secuer-cia genomica de un organismo que permirenanalizar la concentracion relariva de una gran variedad de moleculas espectficas deDNA 0 RNA simultaneamenre Las muestras analizadas usual mente corresponden aDNA 0 RNA total extrado del cultivo bajo las condiciones de esrudio el cual es hi-bridizado con las sondas del microarreglo para determinar a presencia y nivel deexpresi6n de genes especificos (Stoughron 2005) Por medic de los microarreglos sepueden identificar fenotipos bacterianos espectficos asignarle funci6n a genes desco-nocidos agrupar genes en ruras metabolicas de interes idenrificar 105genes regula-dores de dichas rutas y otras funciones que resultan utiles en la comprension delmetabolismo fermenrarivo de las cepas nativas de Clostridium sp Por ejemplo esru-dios previos de cepas mutadas de C acetobutylicum usando un microarreglo genormcohan demostrado la presencia de genes reguladores necesarios para la solvenrogenesisy la esporulaci6n en el megaplasmido p50Ll (Tomas etal 2003 Alsakeretal 2005)EI objetivo de este articulo es proponer una merodologta para el diseiio de sondas deDNA utiles en la construcci6n de un microarreglo de oligonuclecridos 0 en otrosensayos de hibridacion enfocados al estudio y mejoramiento de las rutas metabolicasanrenormente mencionadas Las sondas para microarreglos pueden corresponder acDNAs preidentificados (RNA total retrotranscrito) 0 bien a una coieccion de oligo-nucleotidos disenados para genes espectficos EI uso de un microarreglo de oligonu-cleotidos supone ventajas en nuestro caso puesto que los oligonucteotidos basadosen secuencias consenso permiten detectar la expresion de genes conservados en espe-cies cuyo genoma aun no ha sido secuenciado como es el caso de las cepas colom-bianas de Clostridium sp La utilidad de esta merodologia ha sido demostrada entrabajos como la patente de Graham y Wollweber (1990) quienes disenaron oligonu-cle6tidos consenso para la detecci6n de middot-amilasas en diferentes especies del generoBacillus 0 bien en el trabajo de Matveeva etal (2004) quienes disenaron oligonucleo-tidos consenso dirigidos a genoma del VIH-1 a partir de regiones conservadas en 105alineamiencos multiples de sus variances EI uso de micro-arreglos de oligonucleotidostambien ha sido reportado para el genero Clostridium por Paredes etal (2007) quie-nes disenaron un microarreglo con oligomeros de 60 nucle6tidos para el analisismetab61ico en cepas mutadas de C acetobutylicum Este artfculo presenta una meto-dologfa para el diseno de oligonucleotidos a partir de secuencias geneticas publicadasen GenBank para especies bacterianas y fungicas represencativas de las rutas mera-b61icas de interes con la cual se busca compensar la baja cantidad de secuenciaspublicadas hasta la fecha para especies del genero Clostridium EI diseno esta basadoen la identificacion de secuencias conservadas en la mayor cantidad de especiesposible de forma que cad a sonda resurante sea util para detectar la presencia delmismo gen tanto en dichas especies como en las cepas nativas de Clostridium sp(partiendo de su cercanfa evolutiva ylo metab6Iica) En la metodologra propuesta se

Acta bioi Cotomb Vol 12 S 2007 59

han tenido en cuenta aspectos generales del disefio de oligonucleotides para micro-arreglos tales como su especificidad con respecto al gen objetivo su incapacidadpara formar homodtmeros 0 heterodrmeros con otras sondas la ausencia de estruc-turas secunda-ias y e control de parametres como longitud y Tm (punto de fusion)dentro de rangos previamente establecidos (Tolstrup et at 2003)

MATERIALES Y METODOS

CONSTRUCct6N DE LA BASE DE DATOS LOCAL MUlTImiddotClOST

A partir de una revision bibliografica se identificaron las enzimas que participan en laproduccion de aceta to butirato etanol acerona y butanol a partir de piruvato (Fig 1)asi como en la produccion de 13-propanodiol y dihidroxiacerona-P a partir de glicerol(Fig 2) en clostridios solvenrogenicos no pat6genos Tarnbien se identificaron lasenzimas involucradas en la degradaci6n de celulosa hasca glucosa incluyendo lasprorernas estrucrurales del celulosoma (complejo de cegradacion de sustratos celu-16sicos) y en la degradaci6n de polisecaridos de la hemicelulosa hasta los monosa-ceridos correspondienres (Fig 3 Schwarz 2001) Las secuencias de los genes con-es-pondientes fueron obtenidas en GenBank (Benson et al 2007) y UniProt (Bairoch et aI200S) para 16 especies del genero Clostridium y 29 generos de microorganismos relacio-nados (Tabla 1) Los registros de dichas secuencias fueron almacenados y categorizadosen una base de daros construioa en Microsoft Access XP Para cada registro se recopilola siguienre informacion nombre del gen numero de acceso de GenBank nombre de laprotefna codificada nomero de acceso de Uniprot especie conglomerado (si el genpertenece a uno) longitud del gen y longitud de la proteina

Piruvaro

H-FdH=f0A~L-- coFd co

1 72 Acetilfosfato y- Acenl-Coe ~ II Aceraldehrdc

I CoA CoA pAcetate CoA 5 CoA I Eranol I

5

I Acetona I + CO2

CoA-h idroxi b u tiri I-CoA

~H20

Crotonil-CoA I Butanol I 10 +11-1-- Butiraldehido

AcetoacelatO61

AcetoacetimiddotCoA

Butirato

4 3BuririlfosfalO 7

CoA

BlIrUII-CoA

CoA

Figura 1 Enzimas involucradas en la producci6n de solventes de Clostridium incluidas en la base dedatos 1 Fosfotransacerilasa 2 Acerato kinasa 3 Fosforransburirilasa 4 Burirato kinasa S Acero-acetilacil CoA transferasa 6 Acetoacetaro descarboxilasa 7 Acetaldehfdo deshidrogenasa 8Piruvato descarboxilasa 9 Alcohol deshidrogenasa 10 Buriraldehfdo deshidrogenasa 11 Butanoldeshidrogenasa

60 Articulo - Oiseno de oligoIJucle6tidos para el estudio de genes celutottucoe y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

NAD

H2--- Glicerol

-----1 2 41N~~H+WN~~NHHAidD~i~3naldehidO fT

Dihidroxiacerona

ATPj13-Propanodoll 5 ADP

Glucosa - ---+ Dihidroxiacecona P Cbcer aldehtdo 3 P

iPiruvato

Biomasa

NADHI-WImiddot

NAD+I

Glicerol ~ GlicerolmiddotP

Pi H20

Figura 2 Ruta de asimilaci6n de glicerol en Clostridium butyricum 1 Glicerol deshidratasa 2 Active-dar de la glicerol desbidratasa 3 13-PD deshidrogenasa 4 Glicerol deshidrogenasa 5 Dihidroxia-cerona kinase 6 Glicerol-Scfosfarasa 7 Glicerol kinasa

Para esta base de datos local se establecieron las siguientes categonas (1) Solventoge-nesis con las enzimas fosfotranscarboxilasas carboxilato kinasas CoA transferasasacetoacetate descarboxilasas aldehtdo deshidrogenasas y alcohol deshidrogenasasnecesarias para la producci6n de aceta to butiraco etanol butanol y acetona (jones yWoods 1986 Biebl et al 1999 Nailing et al 2001) (2) 1 3-Propanodiol donde sealmacenaron registros para las enzimas glicerol deshidratasa 13-PD deshidrogenasaglicerol deshidrogenasa dihidroxiacetona kinasa y glicerol-3-fosfatasal necesarias parala produccion de 13-propanodiol y glicerol (Biebl et af 1999) (3) Celulasas dondese incluyeron las protefnas estructurales que forman el andamio y el sistema de anclajedel celulosoma (Bayer eta 1998) asl como celulasas entre las que se cuentan exoglu-canasas endoglucanasas -glucosidasas xilanasas xilosidasas y mananasas (Coughlany Mayer 1992 Lucas et at 2001) La subcategoria Celulasas fue a su vez separada porfamilias de glicosil hidrolasas dominios de union a celulosa y dominios de homologfacon la capa 5 considerando la composici6n multidominio de estas enzimas (Rabinovichet at 2002) Adicionalmente se decidi6 incluir la categorfa Factor de transcripcionSpoOA dado que est a prorelna de esporutacion ha sido reconocida como factor detranscripci6n de los operones sol adc y bdh de producci6n de solventes (Harris et at2002) La lista completa de categorfas y subcategorfas se presenta en la Tabla 2

CONSTRUCCI6N DE AliMENTOS MULTIPLES CON ALTA CONSERVACl6N DE SECUENCIAS

Para cad a tipo de enzima las secuencias de los genes registrados en MULTI-CLOSTfueron recuperadas a partir de GenBank tomando siempre la cadena positiva de cadagen En el caso de la categorfa Celulasas los grupos fueron formados por familias dedominios catalfticos 0 de union a sustrato dentro de cada tipo de enzima (Bayer eta1998) Las secuencias de cada grupo fueron alineadas con el programa de alinea-miento multiple ClustalW 183 (Thompson et al 1994) usando la matriz de respecti-vamenre La calidad de los alineamientos multiples fue mejarada par eliminaci6n de

Acta bioi Colomb Vol 125 2007 61

jESpeCie ___

3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot2middot

bull

32

Solvenrogenesis Ce--

4

iJ~Ii 1 2

B~i1i~~bt]tiili~ltimiddotmiddot~middoti~middotmiddott bullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbull1bullbullbullbullbullbullbullbull17 - + + ~ 9 j

~Iimditni 2bullbullmiddotbullbullbullmiddotbullbullbullbullbullbullbullbullbull1 middotmiddotbullbullbullbullmiddotbullmiddotmiddotbullbullbullbullbull+7

PP + j ~~timi I + +

17

11

1

813

i

h

15 bullbullbullbullbullbull

13

51

1

L middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot4middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot8 _

14

2

2

39 bullbull bullbullbullbullbullbull

16

21

2

~

+ + 5

pcJ [ 24 + +

putidaTs alb

jl

4

95

12

Tabla 1 Rcgistros inclvidos por cada especie en las cacegortas de MU LTI-CLOST

3

95

62 Articulo - Oisetlo de oligol1l1c1e6tidos para el estudia de genes cetutoteicos y solventogenicos en ccpasde Clostridium sp (Clostriditlceae) Montoya er al

los genes con secuencia menos conservada hasra alcanzar un valor alineamientoC1ustaIW16 (peso de 1 para las concordancias y 0 en los demas casas Aiyar 2000) ylos valores de penalizacion Pv aperture y extension de gaps 15 y 666 superior a 65 enel promedio del Puntaje de Alineamientos Pareados (PAP) calculado por C1ustalWentre rod os los genes de cada alineamiento (este valor minimo se redujo a 50 en las fa-milias enziroaricas can alta variabilidad de secuencia como es el caso de las celulasasmultidominio) Los alineamientos multiples definitivos fueron construidos con los ge-nes restar-res utilizando los valores de penalizacion 15 y 666 para aperture y extensionde gaps (11 y 1 para las families enzimacicas can alta variabilidad de secuencia )

GHEnzimas incluidas en la base de datos

1 Celotasas [exo- y endoglucanasas2 Mananasas3 xrtanasas4 Prorerna andamtoS Proretnas adapradoras6 croretoas de anctaje7 Proieroas de (a capa S

Cetulosa

Pared (eubr

Microorganismo celulolioco

Figura 3 Componentes esrructurales y cacalrricos del celulosoma unidos a una celuia del microor-ganismo que 10 produce y al sustrato celul6sico simuheneamenre Dominies funcionales SLHhomologia con la capa S CH I Y CH II Cohesin I y II DK I Y DK IJ Dockerin I y II CBM modulo deunion a celulosa GH Glicosil hidrolasa

DISENO DE LAS SONDAS DE OliGONUCLEOTIDOS

A partir de los alineamientos detinitivos se exrrajeron secuencias con longirud minimade 19 nucleotidos conservadas en mas del 50 de los genes de cada alineamienroutilizando para ello el editor de alineamienros GeneDoc 26002 (Nicholas y Nicholas2001) La longitud minima requerida para las sondas fue establecida a partir de losresultados arrojados par BLASTN para sondas de 17 a 20 nucle6tidos dirigidas a unmismo gen de Endoglucanasa (Tabla 6) Para aumencar la probabilidad de que losoligonucleocidos diseriados puedan reconocer sus genes objerivo en las cepas prorni-sorias de Clostridium sp se seleccionaron siempre regiones conservadas en al menosuna especie de los ordeoes Clostridiales 0 Bacillales Las propiedades termodinamicasde las sondas disefiadas fueron calculadas con GeneRunner v305 (Hastings SoftwareNY) y se aceptaron solo aquellas cuya Tm segun la formula termodinamica de San-taLucia (1998) estuviera en el rango de 44 a 90 degC y que no formaran estructurassecundarias con Tm superior a 37 0c Esros criterios se establecieron considerando lastemperaturas de desnaturaizaci6n e hibridacion recomendadas usualmente para mi~croarreglos (42 ( Y95 ( respectivamenre Hedge et aI 2000 Schuchhardt et aI 2000Tomas et aI 2003 Tummala et al 2003 Rybicki 2005) Para comprobar la sensi-bilidad y especificidad de los oligonucleotidos diseiiados est os fueron sometidos abusquedas en GenBank 1410 (Benson et al 2007) usando la aplicacion BLAsTN228 (Altschul et aI 1997) se seleccionaron aquellos oligonucleotidos para los

Acta bioi Colomb Vol 12 S 2007 63

cuales rodos los regisrros reportados por BLASTN con Valor E (Expected Value) inferior aOOS correspondieran a genes can funcion equivalence a los genes del alineamientooriginal (los resultados de BLASTN son mas significativos cuando su valor E es menorpero el valor E tiende a ser conservative cuando la secuencia de busqueda es muy cottade manera que para secuencias de longitud menor a 40 nucleotidos los resultados convalor E lt 005 se pueden considerar especfficos Altschul et 01 1997) Por ultimo seestableciola ubicacion de cada sonda de ohgonuclectidos en sus genes objetivo usandoel programa Artemis vS (Rutherford et at 2000) y se determine el dominic funcionalcorrespondienre a cad a una por medic de busquedas de las prorefnas codificadas porlos genes objetivo en la base de daros CDD vl65 (Conserved Domain Database) usandoRPS~BLAST 226 (Reversed Position Specific BLAST Altschul et 01 1997)

A-~-id-og~~~i~y~~i~~t~i~~~~i(95 registros)

SU~~~~~~~f~Fosforransacen lasa

Aceraro kinasa

17

2

Butirato 16 II

Fosfotra nsbutiri lasa

Piruvaro

2

29

15

Aceroaceraro 26

17

4

Aldehrdo

Alcohol deshidrogenasade cadena carra

Bctwiiif~~~i~~j 1~3Ir~C~Od(n~~i~~Lbullbullbullbull3f t~Aceroacerilacil CoA 4 Celodexrrrn 2 Facrores de rranscripci6n SpoDAtransferase A (14 regisrros)~+

18

3

11

Arabinosidasas 7

transferasa B s Celobiosa fosforilasasProtefnas de la capa 5Prorernas adapradorasdel andarnioProrefnas de anclajedel celulosorna

232

SubcaregortaNo posee sobcaregona

5

Tabla 2 Numero de registros iocloidos en cada caregorta y subcategorfa de la base de datos MULTImiddotCLOST

RESULTADOS

CONSTRUCCl6N DE LA BASE DE DATOS MULTI-CLOST

La base de datos construida en Microsoft Access XP fue registrada bajo el nornbreMULTI-CLOST ante la Direcci6n Nacional de Derecho de Autor de Colombia (Libra13 Torno 17 Partida 142 del 20 de noviernbre de 2006 disponible en

64 Arrtculo Diseriode oligonucleotidos para el estudio de genes celuolftiws y solventogeniws en cepasde Clostridium sp (Clostridiaceae) Montoya et al

httpWIfNibununaleducolineasbioprocesosindexhtm) Esta base de datos con-riene registros de 485 genes que codifican para las enzimas y prorefnas estructuralesinvolucradas en la acidogenesis solvemogenesis degradaci6n de celulosa y producci6nde 13-PD en 55 especies bacrerianas y fungicas permitiendo recuperar las secuenciasde dichos genes y protein as en las bases de datos GenBank (Benson et al 2007) yUniProt (Bairoch et al 2005) De estos registros 95 corresponden a la caregorfa Solven-rogenesis 94 a la categorfa 1 3-Propanodiol 14 a la categona Factor de esporulaci6nSpoDA y 282 a la caregorta Celulasas la mas numerosa considerando la subdivisionadiciona per farnilias de dominios funcionales

i-S-ubc~tego~raFosfoi~ansacetE3-sa

No6rgaiiTsoClo~tidi~~ih~~~~ii~

i Acetat~middotmiddotki~middotasmiddotamiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot B~~i1i~-~biijismiddotBumiddottlmiddot~atmiddotomiddotmiddotkrnamiddotsamiddotmiddotmiddotmiddotmiddotmiddotmiddotFmiddotomiddot~fomiddottmiddot~amiddotnmiddotsb~middotti~iasamiddot

bilk

AF041S4i

Z99119middotmiddotmiddotmiddotmiddotAY46jmiddot1middot03 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddoti

AE007804M15393

AY251646

- clostidi~--beJemiddot~ckii----ciostid~-~cmiddot~tob~ampIi~~middot CAC30i6-

--P~~~at-od~~~amiddot~bmiddoto~i-iasamiddot middotio~~~~~middotomiddotbij~middotmiddot pd~ A~~tmiddotoa~etmiddotat~middotd~~~middotamiddot~middotbo~TIsmiddotaIc s~~~~i~~pi~~~~~i~~~~~~~~~I adcmiddotmiddotAldmiddotemiddothi~joai~ohofmiddot deshidrogenasa idium tetanimiddotB-~-t~-~~imiddotdmiddot~~hmiddotdgemiddot~middot~amiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotCmiddot C

rmiddotA~-~t~~middot~-~middottmiddotii-~i-imiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~CoA transferasa AA~~to~~~df~iiS~~~~~~~~~~~8 BH2258 AP001514I~_I_~~~_~_~s_~s celK F039030 Endoglucanasas creajecorina _ __ __~ eg~ Y1l1l3middotMamiddot~~middot~middotas~~ 1 middot 7c~~sp mane middotmiddotmiddotmiddotgt(9752middot0middotmiddotmiddotmiddotimiddotximiddotimiddot~asamiddotmiddotmiddotmiddot Ruminococcus abus _ Z~~ AB057589r p~-~~f~middot~middotmiddot~middotdmiddot~middot~middotimiddot~Ruminococcus flaveiJ~i~~ middotmiddotmiddotmiddotmiddotmiddotmiddotmiddott scaA j27i3969

~glucanasas Clostridium thermocellum licB X63355 ~ middotmiddotmiddot~gimiddot~~~~~middot~~-~~_ CIstridiu~ ~-~iipmiddot~~ i abgA L49336 -j

Xilosidasas j ~i~~~~i~0middott~~o~~--middot 1 middotbTBmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAmiddotmiddotJmiddotSmiddotOmiddotS4middotmiddotO5 j

rA-~binomiddot~idmiddotmiddot~~middot~ Bacteroidesmiddotmiddotih~t~jt~li~~ L BT1781 ~~~~~ middot~~middot~i~~~d-middotmiddot~~~-pamiddot smiddot middot~jo~~middot(h~~~~L~1 ~~ middotmiddot1 ~~~~~~

rmiddotGiice~~imiddotdesimiddotimiddotdmiddott~middotsmiddot~ K~b~i~middotii~p~emiddot~middot~j~ middotmiddotmiddotmiddotmiddot1 dh~j32middot U60992 ~middotl-j-pmiddot~~-p~middot~~dmiddot~imiddot - ~ deshidrogenasa Clostridium pasteurianum dhaT AF006034 R dii ~ dhaR U09771i middotGmiddotilmiddot~middotemiddot~of~jemiddotshdrogmiddotemiddotnmiddotasmiddotamiddot Cistjd~middotmiddotb~amp~~m middotmiddotmiddotmiddotmiddotmiddotmiddotdh~i5i AY1j~f5s1

middotomiddot~Imiddotamiddotce[omiddot~middotamiddotkimiddotnmiddotasa middotmiddot--middotmiddotmiddotimiddotmiddot ~~g~~~ ~~~~~~~ Sacch~romycescer~~j~i~~ gpp2 050469

-t-

CTC02182 AE015943

CPE1256 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAPOOjmiddotmiddots9middot

CAP0163 AE001438

F~-~-t~middot~middotmiddotd~middotmiddott~middot~middot~cmiddotipmiddot~-i6middot~middotmiddotmiddot SpaDA i E~~~~~~~~~~ 1 spoOA 1 U43514

Tabla 3 Secuencias represemativas de cada subcategorfa de MULTI-CLOST can su numero de accemiddotso a GenBank

Las especies mayoritarias de la categoria Celulasas son C acetoblJoliclJm y C thermocellumlas cuales representan el 25 de dicha categor(a mientras que en Solventogenesis el

Acta bioi Colomb Vol 1252007 65

mayor porcenraje (36) corresponde a las especies C acetobutylicum y Bacillus subtiiis Parsu parte la categorfa 13-Propanodiol contiene el 25 de secuencias de las especiesClostridium butyricum Clostridium petfringens y Citrobacter freundii En la Tabla 2 se muestrala cantidad de registros que fueron agregados a la base de datos para cad a subcategorfamientras que en la Tabla 3 se enlistan los numeros de acceso en GenBank para secuen-cias representativas de cada subcategorfa almacenadas en MULTI-CLOST Los numerosde acceso de GenBank y UniProt contenidos en cada regisrro perrniten recuperar la se-cuencia genetica e informacion de conglomerados a partir de GenBank asr como lasecuencia proteica e informacion biologica a partir de UniProt Todas las enzimas inclui-das en cada categorfa fueron utifizadas para realizar los alineamientos multiples

CONSTRUCCI6N DE ALJNEAMIENTOS MULTIPLES CON ALTA CONSERVACION DE SECUENCIAS

Las secuencias de los genes almacenados en MULTI-CLOST fueron usadas para crearlos alineamientos a partir de los cuales se disefiarfan las sondas de oligonucleotidesSe esrablecieron como criterios de seleccion los valores PAP mfnimos 65 y 50 deacuerdo con el contenido de secuencias conservadas en cad a ahnearmento eliminan-dose de cad a uno 105 genes que produjeran PAP inferiores a estes valores En el casode las celulasas se usaron parametres mas flexibles (apropiados para enzimas multi-dominie) y sus dominies funcionales se alinearon independienternenre Para losalineamientos de genes de las categorfas Solventogenesis 13-Propanodiol y Factorde esporulacion SpaDA se usaron las penalidades de aperture y extension de gaps [15-666] establecidas por defecto en ClustalW y apropiadas para genes conservados encoda su extension a craves de diversas especies En los alineamientos definitivos de ceu-lasas fue necesario flexibilizar dichas penalidades de forma que se pudieran alinear fa-cilmente los dominios conservados en cada familia enzirnatica En estes casos se utilize-ron las penalidades de apertura y extension [11- 1J correspondienres a las penalidadespar defecto usadas en algunas aplicaciones de BLAST (Altschul et aI 1997) De estaforma los alineamienros definitivos fueron construidos con tres combinaciones de pa-metros 65 - [15- 666J 50 - [15- 666J Y 50 - [11-1] (PAP - [apertura- extension degaps]) Con el uso de dichas combinaciones de parametres se obruvieron en rota I 56alineamientos definitivos para las cuatra categorias de MULTI-CLOST EI numero dealineamientos obtenidos en cada categorfa can las diferenres combinaciones de para-metros se muestra en la Tabla 4

Celulasas

alineamientos

97 cmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotFFacto~dde~~ii6spoioiA~-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotrmiddotmiddotmiddotmiddotmiddot~middot8 1

110

3

Tabla 4 Alineamienros Inulriples agrupados par las caregor(as de la base de daros MULTI-CLOST ypar los criterios de alincamienro

66 Articulo - Diseno de oligonucleotidos para el estudia de genes celuloitticos y solventoginicos en cepasde Clostridium sp (Clostridiaceae) MOlltoya et al

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

1060 1080TIT T

T~GC AAaAAaTa AATAC AC ag aGa

6661068

639675651

c

1100 1120

I_ A

A A

II I~A AA A -

T

T CA 718GGB 1120

c CT 6912C T 727

703TGG

GGT GAaAGAGCaATAAGACATGC AT GAaGT GC

Figura 4 Ahneamienro multiple para el factor de esporulacion SpoOA de cinco especies de Clostridiumusando un PAP minima de 65 y penalidades 15- 666 (apertura extension de gaps) La ultima lineamuescra la secuencia consenso donde las letras en mayuscula indican posiciones compleramenreconservadas y las leer-asen rninuscula indican posiciones conservadas en cuacro de las cinco secuen-cias Los bloque en negro indican regiones identicas miencras que los bloques en diferentes ronos degris muestran regiones parcialrnente conservadas

Dada la dificultad inhereme al alineamiento de genes provenienres de especies tandiversas como las analizadas el 77 de los alineamienros definicivos contiene dos acuatro genes y el 18 contiene cinco 0 seis genes En la Figura 4 a manera de ejemplose observa el alineamienro multiple de genes correspondiences a facto res de esporu-lacion SpaDA penenecienres a varias especies de closrridios

DISENO DE LAS SONDAS DE OLiGONUCLE6TIDOS

La estrategia de diserio de oligonucleocidos en esre trabajo esca enfocada a la obtencionde sondas que permitan ioenrificar cad a gen de inreres en cualquiera de las especies quecomponen los alinearnientos as como en las cepas colombianas de Clostridium sp Lalongirud minima de las sondas se establecio a partir de los resultados de busquedas enGenBank con sondas de longitud creciente disenadas para un gen Endoglucanasausando BLASTN Se encontro que con sondas de longitud inferior a 19 nucleotidos re-sulta imposible distinguir los resultados especfficos de los inespecificos a partir de losvalores de referencia Score y Valor E (Tabla 6 Altschul et al 1997) Dicha longitud seencuenrra en el rango de valores reportados para euroI diseno de sondas de oligonucleo-tidos para microarreglos (Guckenberger et al 2002 Lee et ai 2004) En total se obtu-vieron 94 sondas de oligonucleotidos algunas de las cuales se enlistan en la tabla 5 ycuyos resultados en la busqueda can BLASTN con Valor E inferior a 005 correspon-dieron en cada caso a las enzimas para las cuaes fueron diseriadas (Ia lista completa desondas esta disponible como material suplementario en http)jwwwibununaleducoIineasbioprocesosindexhtm) En promedio con cada sanda se pueden reconocer tresgenes espedficos para la enzima objetivo en GenBank tras las busquedas correspon~dienres con BLASTN 10cual sugiere que existe una buena probabilidad de reconocer losgenes hom610gos en las cepas promisorias de Clostridium Los resultados de las busque-das can RPS-BLAST indican que las sondas diseriadas para las rutas de acidogenesissolventogenesis y producci6n de 13-PD reconocen siempre el mismo dominio en cadagen miencras que en el caso de las celulasas cada sonda puede identiFicar varias enzi-

Acta bioi Colomb Vol 12 S 2007 67

mas de diversa funcion que poseen el mismo dominio funcional (considerando el ca-racter multidominio de las celulasas)

Oligo CAGCTTGAATTCTATCAGTG Oligo CAGCTTGAATTCTATCAGTro-gtucE2ti-de6t~aos Lo~i~td-9~ude6daas

Resuitildomiddot middot j ~~~~~J~~aio(middotEmiddotT-Res~middotltmiddotadomiddot middotmiddotmiddotmiddotl~~~E~I~~ viiarIc~i~i~~~d~Ci~~tidi~ 40 0009 Celulasa de Clostridium 38 gQ~~~)c~l~i~s~d~CI~~tidi~ ~middotmiddotmiddotmiddotmiddot40middotmiddotmiddotmiddotmiddotmiddotmiddot 0ori9middotrmiddotc~imiddot~i~smiddot~middotmiddotmiddotdmiddot~middotmiddotd~~middottidi~middotmiddotmiddotmiddotL 38 ~ 0034Ceimiddot~iilsmiddotamiddotmiddotddostldiu ~~~ 0009 c~i~f~middotsmiddotamiddotmiddotmiddot~fmiddotmiddotdo~middottjdjumiddot jiF _~deg034~

~~~~~~gg~~~~~t~~~~~ middot~middotmiddot~middot~middotmiddotl~~~~~t~ggmiddot~~~~t~~~~~~ 01

3 013

middotmiddotbFjAnmiddottmiddotemiddotrg~nlcoJeAmiddotthmiddot~middotif~middot~middot~ middotmiddotmiddotmiddotj6 613 bijAintmiddotemiddotrg~nmiddotcomiddotmiddotmiddotdeAmiddotmiddotmiddottiiamiddot~~n~middotimiddot middotmiddot 36middot 0136NAmiddot middotmiddot h middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot ~middotmiddot 34 6Ki i 6NAmiddotmiddotmiddotimiddotn[middotmiddotrg~nmiddotcamiddotmiddothumiddotmamiddotnomiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot_middot34middot _1053p~tmiddot~middotmiddot~~~d~~D~~~middotnmiddotmiddotjmiddot~middot~i) 34 652 middotp~middot~tmiddot~middoti~middot~middotmiddotdmiddotemiddotmiddot~middotnmiddoti6middotnmiddotmiddotdmiddot~middotr~[middota ~ 34 _ ~ 053

Fa(tormiddotmiddotamiddotnea FmiddotancanTh~mailo 34 bull 652~~~~p~~lt~~Jimiddot~pi~~~Ti~~~j4 652 i

Oligo CAGCTTGAATTCTATCAG Oligo CAGClTGAATTCTATCAlongimiddottudmiddotfS nmiddot-ietmiddottidoSmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot j middotLorigrcumiddotamiddotmiddotfjnumiddotde6ddosmiddotmiddotmiddotmiddotResljitild) middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~~~t~j~vilior-EResljitildo ~~~~~~ middotmiddotmiddotmiddotva-iarEC~(~i~s~dea~tdj~~ 36 r 0131 C~i~i~~adea~id~~~ 34 T 053c~i~i~s~dmiddotCiostdj~~middotmiddotmiddot 36 ojj Celulasa de Clostridi~middot~middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotbullmiddotmiddot 34 OS3iCelulasa de Clostridium -t- j6~ l middotbT3gtmiddotmiddotmiddotmiddotCeT~iilsmiddotamiddotdeClo5idiui bullj4 3 - 1bNAliltmiddot~rg~ilmiddotic~middotmiddotmiddothumiddotmamiddotn~ 36 6130 DNA intergenico humane 34 053

~ ~DmiddotNAmiddotmiddotlntmiddoterg~nmiddoticomiddotmiddotmiddothumiddotmamiddotno ~ middotmiddotmiddotmiddotmiddot3Kmiddot 6-j- i middotmiddotbmiddotNAmiddot~middotntemiddotrg~nmiddot~omiddothmiddot~middotmamiddotmiddotomiddot 34 053 ~ ~ bNAjnterglfi1Tco--aeif thaioi) 34 653 (lYNAlnterglfricoaeAihaioiio1 34 middot6middot5~rmiddotmiddot

bmiddotNAmiddotlntmiddotemiddotrg~nTcohtimanomiddot middotmiddotmiddotmiddotmiddotj4 J 653middotmiddotmiddotbmiddotNAlrlmiddotcmiddoterg~nicohumane 34 deg 53~PmiddotrmiddotocmiddotmiddotfnmiddotimiddotmiddotdmiddotmiddotmiddotumiddotrmiddottSilmiddotmiddotdmiddotracmiddotamiddotmiddot r middotmiddotmiddotmiddotmiddotmiddot34 sectsect~middotmiddotrmiddot~~middot~tmiddot~t~~~~~6E~middotmiddot~~~~~~__1 34middot QI~-

Tabla 6 Resultados de la busqueda can oligonucleotides de longirud crecienre para EndoglucanasaGH48 en GenBank usando BLASTN 228 Los resultados rorulados como Celulasa de Clostridiumcorresponden a registros de endoglucanasas (resultados especfficos) mientras que las cifras marca-das con un asterisco () corresponden al mayor puntaje y el menor Valor E obtenidos en cadabusqueda Se observa que con los oligos de 17 y 18 nucle6tidos se obtiene el mayor puncaje y elmenor Valor E tanto para los resulcados espedficos como para algunos inespedficos Por ello seestableci6 como norma para el disefio de sondas una longitud minima de 19 nucle6tidos Nota Lasmagnitudes del mayor Puntaje y el menor Valor E no son comparables entre los cuatro oligos ya queestas depend en directa e inversameme de la longicud de la secuencia de busqueda en BLASTN

Las sondas disenadas se encuentran distribuidas de la siguiente forma 25 corres-ponden a la caregorfa Solventogenesis 48 a la categorfa Celulasas (con sondaspara varias familias de dominios funcionales en cad a tipo de enzima) 19 a lt 13-Pro-panodiol y dos aJ factor SpoOA Los valores caracterfsticos promedio de las sondasdisefiadas fueron los siguientes longitud de 24 nucleotidos Tm termodinamica de658 degC contenido de (G+C) de 390 Tm de la horquilla mas estable (cuandoexiste) de 104 degC y 6G de uni6n al objetivo de -374 kCal(Mol De esta forma se(oncluye que todas las sondas disenadas pueden ser usadas para la construccion deun microarreglo hibridizado a 42degC (Cronin et a 2001) 0 bien para un ensayo deSouthern Blot realizado en condiciones similares (Harris et 01 2002) Se disenaronademas sondas para control positive negative y de purificacion de rRNA utilizandolos mismos criterios descritos anteriormente la sonda de control positivo 5-

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 5: Oligonucleotide Probe Design for the Study of Cellulolytic

Acta bioi Cotomb Vol 12 S 2007 59

han tenido en cuenta aspectos generales del disefio de oligonucleotides para micro-arreglos tales como su especificidad con respecto al gen objetivo su incapacidadpara formar homodtmeros 0 heterodrmeros con otras sondas la ausencia de estruc-turas secunda-ias y e control de parametres como longitud y Tm (punto de fusion)dentro de rangos previamente establecidos (Tolstrup et at 2003)

MATERIALES Y METODOS

CONSTRUCct6N DE LA BASE DE DATOS LOCAL MUlTImiddotClOST

A partir de una revision bibliografica se identificaron las enzimas que participan en laproduccion de aceta to butirato etanol acerona y butanol a partir de piruvato (Fig 1)asi como en la produccion de 13-propanodiol y dihidroxiacerona-P a partir de glicerol(Fig 2) en clostridios solvenrogenicos no pat6genos Tarnbien se identificaron lasenzimas involucradas en la degradaci6n de celulosa hasca glucosa incluyendo lasprorernas estrucrurales del celulosoma (complejo de cegradacion de sustratos celu-16sicos) y en la degradaci6n de polisecaridos de la hemicelulosa hasta los monosa-ceridos correspondienres (Fig 3 Schwarz 2001) Las secuencias de los genes con-es-pondientes fueron obtenidas en GenBank (Benson et al 2007) y UniProt (Bairoch et aI200S) para 16 especies del genero Clostridium y 29 generos de microorganismos relacio-nados (Tabla 1) Los registros de dichas secuencias fueron almacenados y categorizadosen una base de daros construioa en Microsoft Access XP Para cada registro se recopilola siguienre informacion nombre del gen numero de acceso de GenBank nombre de laprotefna codificada nomero de acceso de Uniprot especie conglomerado (si el genpertenece a uno) longitud del gen y longitud de la proteina

Piruvaro

H-FdH=f0A~L-- coFd co

1 72 Acetilfosfato y- Acenl-Coe ~ II Aceraldehrdc

I CoA CoA pAcetate CoA 5 CoA I Eranol I

5

I Acetona I + CO2

CoA-h idroxi b u tiri I-CoA

~H20

Crotonil-CoA I Butanol I 10 +11-1-- Butiraldehido

AcetoacelatO61

AcetoacetimiddotCoA

Butirato

4 3BuririlfosfalO 7

CoA

BlIrUII-CoA

CoA

Figura 1 Enzimas involucradas en la producci6n de solventes de Clostridium incluidas en la base dedatos 1 Fosfotransacerilasa 2 Acerato kinasa 3 Fosforransburirilasa 4 Burirato kinasa S Acero-acetilacil CoA transferasa 6 Acetoacetaro descarboxilasa 7 Acetaldehfdo deshidrogenasa 8Piruvato descarboxilasa 9 Alcohol deshidrogenasa 10 Buriraldehfdo deshidrogenasa 11 Butanoldeshidrogenasa

60 Articulo - Oiseno de oligoIJucle6tidos para el estudio de genes celutottucoe y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

NAD

H2--- Glicerol

-----1 2 41N~~H+WN~~NHHAidD~i~3naldehidO fT

Dihidroxiacerona

ATPj13-Propanodoll 5 ADP

Glucosa - ---+ Dihidroxiacecona P Cbcer aldehtdo 3 P

iPiruvato

Biomasa

NADHI-WImiddot

NAD+I

Glicerol ~ GlicerolmiddotP

Pi H20

Figura 2 Ruta de asimilaci6n de glicerol en Clostridium butyricum 1 Glicerol deshidratasa 2 Active-dar de la glicerol desbidratasa 3 13-PD deshidrogenasa 4 Glicerol deshidrogenasa 5 Dihidroxia-cerona kinase 6 Glicerol-Scfosfarasa 7 Glicerol kinasa

Para esta base de datos local se establecieron las siguientes categonas (1) Solventoge-nesis con las enzimas fosfotranscarboxilasas carboxilato kinasas CoA transferasasacetoacetate descarboxilasas aldehtdo deshidrogenasas y alcohol deshidrogenasasnecesarias para la producci6n de aceta to butiraco etanol butanol y acetona (jones yWoods 1986 Biebl et al 1999 Nailing et al 2001) (2) 1 3-Propanodiol donde sealmacenaron registros para las enzimas glicerol deshidratasa 13-PD deshidrogenasaglicerol deshidrogenasa dihidroxiacetona kinasa y glicerol-3-fosfatasal necesarias parala produccion de 13-propanodiol y glicerol (Biebl et af 1999) (3) Celulasas dondese incluyeron las protefnas estructurales que forman el andamio y el sistema de anclajedel celulosoma (Bayer eta 1998) asl como celulasas entre las que se cuentan exoglu-canasas endoglucanasas -glucosidasas xilanasas xilosidasas y mananasas (Coughlany Mayer 1992 Lucas et at 2001) La subcategoria Celulasas fue a su vez separada porfamilias de glicosil hidrolasas dominios de union a celulosa y dominios de homologfacon la capa 5 considerando la composici6n multidominio de estas enzimas (Rabinovichet at 2002) Adicionalmente se decidi6 incluir la categorfa Factor de transcripcionSpoOA dado que est a prorelna de esporutacion ha sido reconocida como factor detranscripci6n de los operones sol adc y bdh de producci6n de solventes (Harris et at2002) La lista completa de categorfas y subcategorfas se presenta en la Tabla 2

CONSTRUCCI6N DE AliMENTOS MULTIPLES CON ALTA CONSERVACl6N DE SECUENCIAS

Para cad a tipo de enzima las secuencias de los genes registrados en MULTI-CLOSTfueron recuperadas a partir de GenBank tomando siempre la cadena positiva de cadagen En el caso de la categorfa Celulasas los grupos fueron formados por familias dedominios catalfticos 0 de union a sustrato dentro de cada tipo de enzima (Bayer eta1998) Las secuencias de cada grupo fueron alineadas con el programa de alinea-miento multiple ClustalW 183 (Thompson et al 1994) usando la matriz de respecti-vamenre La calidad de los alineamientos multiples fue mejarada par eliminaci6n de

Acta bioi Colomb Vol 125 2007 61

jESpeCie ___

3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot2middot

bull

32

Solvenrogenesis Ce--

4

iJ~Ii 1 2

B~i1i~~bt]tiili~ltimiddotmiddot~middoti~middotmiddott bullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbull1bullbullbullbullbullbullbullbull17 - + + ~ 9 j

~Iimditni 2bullbullmiddotbullbullbullmiddotbullbullbullbullbullbullbullbullbull1 middotmiddotbullbullbullbullmiddotbullmiddotmiddotbullbullbullbullbull+7

PP + j ~~timi I + +

17

11

1

813

i

h

15 bullbullbullbullbullbull

13

51

1

L middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot4middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot8 _

14

2

2

39 bullbull bullbullbullbullbullbull

16

21

2

~

+ + 5

pcJ [ 24 + +

putidaTs alb

jl

4

95

12

Tabla 1 Rcgistros inclvidos por cada especie en las cacegortas de MU LTI-CLOST

3

95

62 Articulo - Oisetlo de oligol1l1c1e6tidos para el estudia de genes cetutoteicos y solventogenicos en ccpasde Clostridium sp (Clostriditlceae) Montoya er al

los genes con secuencia menos conservada hasra alcanzar un valor alineamientoC1ustaIW16 (peso de 1 para las concordancias y 0 en los demas casas Aiyar 2000) ylos valores de penalizacion Pv aperture y extension de gaps 15 y 666 superior a 65 enel promedio del Puntaje de Alineamientos Pareados (PAP) calculado por C1ustalWentre rod os los genes de cada alineamiento (este valor minimo se redujo a 50 en las fa-milias enziroaricas can alta variabilidad de secuencia como es el caso de las celulasasmultidominio) Los alineamientos multiples definitivos fueron construidos con los ge-nes restar-res utilizando los valores de penalizacion 15 y 666 para aperture y extensionde gaps (11 y 1 para las families enzimacicas can alta variabilidad de secuencia )

GHEnzimas incluidas en la base de datos

1 Celotasas [exo- y endoglucanasas2 Mananasas3 xrtanasas4 Prorerna andamtoS Proretnas adapradoras6 croretoas de anctaje7 Proieroas de (a capa S

Cetulosa

Pared (eubr

Microorganismo celulolioco

Figura 3 Componentes esrructurales y cacalrricos del celulosoma unidos a una celuia del microor-ganismo que 10 produce y al sustrato celul6sico simuheneamenre Dominies funcionales SLHhomologia con la capa S CH I Y CH II Cohesin I y II DK I Y DK IJ Dockerin I y II CBM modulo deunion a celulosa GH Glicosil hidrolasa

DISENO DE LAS SONDAS DE OliGONUCLEOTIDOS

A partir de los alineamientos detinitivos se exrrajeron secuencias con longirud minimade 19 nucleotidos conservadas en mas del 50 de los genes de cada alineamienroutilizando para ello el editor de alineamienros GeneDoc 26002 (Nicholas y Nicholas2001) La longitud minima requerida para las sondas fue establecida a partir de losresultados arrojados par BLASTN para sondas de 17 a 20 nucle6tidos dirigidas a unmismo gen de Endoglucanasa (Tabla 6) Para aumencar la probabilidad de que losoligonucleocidos diseriados puedan reconocer sus genes objerivo en las cepas prorni-sorias de Clostridium sp se seleccionaron siempre regiones conservadas en al menosuna especie de los ordeoes Clostridiales 0 Bacillales Las propiedades termodinamicasde las sondas disefiadas fueron calculadas con GeneRunner v305 (Hastings SoftwareNY) y se aceptaron solo aquellas cuya Tm segun la formula termodinamica de San-taLucia (1998) estuviera en el rango de 44 a 90 degC y que no formaran estructurassecundarias con Tm superior a 37 0c Esros criterios se establecieron considerando lastemperaturas de desnaturaizaci6n e hibridacion recomendadas usualmente para mi~croarreglos (42 ( Y95 ( respectivamenre Hedge et aI 2000 Schuchhardt et aI 2000Tomas et aI 2003 Tummala et al 2003 Rybicki 2005) Para comprobar la sensi-bilidad y especificidad de los oligonucleotidos diseiiados est os fueron sometidos abusquedas en GenBank 1410 (Benson et al 2007) usando la aplicacion BLAsTN228 (Altschul et aI 1997) se seleccionaron aquellos oligonucleotidos para los

Acta bioi Colomb Vol 12 S 2007 63

cuales rodos los regisrros reportados por BLASTN con Valor E (Expected Value) inferior aOOS correspondieran a genes can funcion equivalence a los genes del alineamientooriginal (los resultados de BLASTN son mas significativos cuando su valor E es menorpero el valor E tiende a ser conservative cuando la secuencia de busqueda es muy cottade manera que para secuencias de longitud menor a 40 nucleotidos los resultados convalor E lt 005 se pueden considerar especfficos Altschul et 01 1997) Por ultimo seestableciola ubicacion de cada sonda de ohgonuclectidos en sus genes objetivo usandoel programa Artemis vS (Rutherford et at 2000) y se determine el dominic funcionalcorrespondienre a cad a una por medic de busquedas de las prorefnas codificadas porlos genes objetivo en la base de daros CDD vl65 (Conserved Domain Database) usandoRPS~BLAST 226 (Reversed Position Specific BLAST Altschul et 01 1997)

A-~-id-og~~~i~y~~i~~t~i~~~~i(95 registros)

SU~~~~~~~f~Fosforransacen lasa

Aceraro kinasa

17

2

Butirato 16 II

Fosfotra nsbutiri lasa

Piruvaro

2

29

15

Aceroaceraro 26

17

4

Aldehrdo

Alcohol deshidrogenasade cadena carra

Bctwiiif~~~i~~j 1~3Ir~C~Od(n~~i~~Lbullbullbullbull3f t~Aceroacerilacil CoA 4 Celodexrrrn 2 Facrores de rranscripci6n SpoDAtransferase A (14 regisrros)~+

18

3

11

Arabinosidasas 7

transferasa B s Celobiosa fosforilasasProtefnas de la capa 5Prorernas adapradorasdel andarnioProrefnas de anclajedel celulosorna

232

SubcaregortaNo posee sobcaregona

5

Tabla 2 Numero de registros iocloidos en cada caregorta y subcategorfa de la base de datos MULTImiddotCLOST

RESULTADOS

CONSTRUCCl6N DE LA BASE DE DATOS MULTI-CLOST

La base de datos construida en Microsoft Access XP fue registrada bajo el nornbreMULTI-CLOST ante la Direcci6n Nacional de Derecho de Autor de Colombia (Libra13 Torno 17 Partida 142 del 20 de noviernbre de 2006 disponible en

64 Arrtculo Diseriode oligonucleotidos para el estudio de genes celuolftiws y solventogeniws en cepasde Clostridium sp (Clostridiaceae) Montoya et al

httpWIfNibununaleducolineasbioprocesosindexhtm) Esta base de datos con-riene registros de 485 genes que codifican para las enzimas y prorefnas estructuralesinvolucradas en la acidogenesis solvemogenesis degradaci6n de celulosa y producci6nde 13-PD en 55 especies bacrerianas y fungicas permitiendo recuperar las secuenciasde dichos genes y protein as en las bases de datos GenBank (Benson et al 2007) yUniProt (Bairoch et al 2005) De estos registros 95 corresponden a la caregorfa Solven-rogenesis 94 a la categorfa 1 3-Propanodiol 14 a la categona Factor de esporulaci6nSpoDA y 282 a la caregorta Celulasas la mas numerosa considerando la subdivisionadiciona per farnilias de dominios funcionales

i-S-ubc~tego~raFosfoi~ansacetE3-sa

No6rgaiiTsoClo~tidi~~ih~~~~ii~

i Acetat~middotmiddotki~middotasmiddotamiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot B~~i1i~-~biijismiddotBumiddottlmiddot~atmiddotomiddotmiddotkrnamiddotsamiddotmiddotmiddotmiddotmiddotmiddotmiddotFmiddotomiddot~fomiddottmiddot~amiddotnmiddotsb~middotti~iasamiddot

bilk

AF041S4i

Z99119middotmiddotmiddotmiddotmiddotAY46jmiddot1middot03 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddoti

AE007804M15393

AY251646

- clostidi~--beJemiddot~ckii----ciostid~-~cmiddot~tob~ampIi~~middot CAC30i6-

--P~~~at-od~~~amiddot~bmiddoto~i-iasamiddot middotio~~~~~middotomiddotbij~middotmiddot pd~ A~~tmiddotoa~etmiddotat~middotd~~~middotamiddot~middotbo~TIsmiddotaIc s~~~~i~~pi~~~~~i~~~~~~~~~I adcmiddotmiddotAldmiddotemiddothi~joai~ohofmiddot deshidrogenasa idium tetanimiddotB-~-t~-~~imiddotdmiddot~~hmiddotdgemiddot~middot~amiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotCmiddot C

rmiddotA~-~t~~middot~-~middottmiddotii-~i-imiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~CoA transferasa AA~~to~~~df~iiS~~~~~~~~~~~8 BH2258 AP001514I~_I_~~~_~_~s_~s celK F039030 Endoglucanasas creajecorina _ __ __~ eg~ Y1l1l3middotMamiddot~~middot~middotas~~ 1 middot 7c~~sp mane middotmiddotmiddotmiddotgt(9752middot0middotmiddotmiddotmiddotimiddotximiddotimiddot~asamiddotmiddotmiddotmiddot Ruminococcus abus _ Z~~ AB057589r p~-~~f~middot~middotmiddot~middotdmiddot~middot~middotimiddot~Ruminococcus flaveiJ~i~~ middotmiddotmiddotmiddotmiddotmiddotmiddotmiddott scaA j27i3969

~glucanasas Clostridium thermocellum licB X63355 ~ middotmiddotmiddot~gimiddot~~~~~middot~~-~~_ CIstridiu~ ~-~iipmiddot~~ i abgA L49336 -j

Xilosidasas j ~i~~~~i~0middott~~o~~--middot 1 middotbTBmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAmiddotmiddotJmiddotSmiddotOmiddotS4middotmiddotO5 j

rA-~binomiddot~idmiddotmiddot~~middot~ Bacteroidesmiddotmiddotih~t~jt~li~~ L BT1781 ~~~~~ middot~~middot~i~~~d-middotmiddot~~~-pamiddot smiddot middot~jo~~middot(h~~~~L~1 ~~ middotmiddot1 ~~~~~~

rmiddotGiice~~imiddotdesimiddotimiddotdmiddott~middotsmiddot~ K~b~i~middotii~p~emiddot~middot~j~ middotmiddotmiddotmiddotmiddot1 dh~j32middot U60992 ~middotl-j-pmiddot~~-p~middot~~dmiddot~imiddot - ~ deshidrogenasa Clostridium pasteurianum dhaT AF006034 R dii ~ dhaR U09771i middotGmiddotilmiddot~middotemiddot~of~jemiddotshdrogmiddotemiddotnmiddotasmiddotamiddot Cistjd~middotmiddotb~amp~~m middotmiddotmiddotmiddotmiddotmiddotmiddotdh~i5i AY1j~f5s1

middotomiddot~Imiddotamiddotce[omiddot~middotamiddotkimiddotnmiddotasa middotmiddot--middotmiddotmiddotimiddotmiddot ~~g~~~ ~~~~~~~ Sacch~romycescer~~j~i~~ gpp2 050469

-t-

CTC02182 AE015943

CPE1256 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAPOOjmiddotmiddots9middot

CAP0163 AE001438

F~-~-t~middot~middotmiddotd~middotmiddott~middot~middot~cmiddotipmiddot~-i6middot~middotmiddotmiddot SpaDA i E~~~~~~~~~~ 1 spoOA 1 U43514

Tabla 3 Secuencias represemativas de cada subcategorfa de MULTI-CLOST can su numero de accemiddotso a GenBank

Las especies mayoritarias de la categoria Celulasas son C acetoblJoliclJm y C thermocellumlas cuales representan el 25 de dicha categor(a mientras que en Solventogenesis el

Acta bioi Colomb Vol 1252007 65

mayor porcenraje (36) corresponde a las especies C acetobutylicum y Bacillus subtiiis Parsu parte la categorfa 13-Propanodiol contiene el 25 de secuencias de las especiesClostridium butyricum Clostridium petfringens y Citrobacter freundii En la Tabla 2 se muestrala cantidad de registros que fueron agregados a la base de datos para cad a subcategorfamientras que en la Tabla 3 se enlistan los numeros de acceso en GenBank para secuen-cias representativas de cada subcategorfa almacenadas en MULTI-CLOST Los numerosde acceso de GenBank y UniProt contenidos en cada regisrro perrniten recuperar la se-cuencia genetica e informacion de conglomerados a partir de GenBank asr como lasecuencia proteica e informacion biologica a partir de UniProt Todas las enzimas inclui-das en cada categorfa fueron utifizadas para realizar los alineamientos multiples

CONSTRUCCI6N DE ALJNEAMIENTOS MULTIPLES CON ALTA CONSERVACION DE SECUENCIAS

Las secuencias de los genes almacenados en MULTI-CLOST fueron usadas para crearlos alineamientos a partir de los cuales se disefiarfan las sondas de oligonucleotidesSe esrablecieron como criterios de seleccion los valores PAP mfnimos 65 y 50 deacuerdo con el contenido de secuencias conservadas en cad a ahnearmento eliminan-dose de cad a uno 105 genes que produjeran PAP inferiores a estes valores En el casode las celulasas se usaron parametres mas flexibles (apropiados para enzimas multi-dominie) y sus dominies funcionales se alinearon independienternenre Para losalineamientos de genes de las categorfas Solventogenesis 13-Propanodiol y Factorde esporulacion SpaDA se usaron las penalidades de aperture y extension de gaps [15-666] establecidas por defecto en ClustalW y apropiadas para genes conservados encoda su extension a craves de diversas especies En los alineamientos definitivos de ceu-lasas fue necesario flexibilizar dichas penalidades de forma que se pudieran alinear fa-cilmente los dominios conservados en cada familia enzirnatica En estes casos se utilize-ron las penalidades de apertura y extension [11- 1J correspondienres a las penalidadespar defecto usadas en algunas aplicaciones de BLAST (Altschul et aI 1997) De estaforma los alineamienros definitivos fueron construidos con tres combinaciones de pa-metros 65 - [15- 666J 50 - [15- 666J Y 50 - [11-1] (PAP - [apertura- extension degaps]) Con el uso de dichas combinaciones de parametres se obruvieron en rota I 56alineamientos definitivos para las cuatra categorias de MULTI-CLOST EI numero dealineamientos obtenidos en cada categorfa can las diferenres combinaciones de para-metros se muestra en la Tabla 4

Celulasas

alineamientos

97 cmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotFFacto~dde~~ii6spoioiA~-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotrmiddotmiddotmiddotmiddotmiddot~middot8 1

110

3

Tabla 4 Alineamienros Inulriples agrupados par las caregor(as de la base de daros MULTI-CLOST ypar los criterios de alincamienro

66 Articulo - Diseno de oligonucleotidos para el estudia de genes celuloitticos y solventoginicos en cepasde Clostridium sp (Clostridiaceae) MOlltoya et al

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

1060 1080TIT T

T~GC AAaAAaTa AATAC AC ag aGa

6661068

639675651

c

1100 1120

I_ A

A A

II I~A AA A -

T

T CA 718GGB 1120

c CT 6912C T 727

703TGG

GGT GAaAGAGCaATAAGACATGC AT GAaGT GC

Figura 4 Ahneamienro multiple para el factor de esporulacion SpoOA de cinco especies de Clostridiumusando un PAP minima de 65 y penalidades 15- 666 (apertura extension de gaps) La ultima lineamuescra la secuencia consenso donde las letras en mayuscula indican posiciones compleramenreconservadas y las leer-asen rninuscula indican posiciones conservadas en cuacro de las cinco secuen-cias Los bloque en negro indican regiones identicas miencras que los bloques en diferentes ronos degris muestran regiones parcialrnente conservadas

Dada la dificultad inhereme al alineamiento de genes provenienres de especies tandiversas como las analizadas el 77 de los alineamienros definicivos contiene dos acuatro genes y el 18 contiene cinco 0 seis genes En la Figura 4 a manera de ejemplose observa el alineamienro multiple de genes correspondiences a facto res de esporu-lacion SpaDA penenecienres a varias especies de closrridios

DISENO DE LAS SONDAS DE OLiGONUCLE6TIDOS

La estrategia de diserio de oligonucleocidos en esre trabajo esca enfocada a la obtencionde sondas que permitan ioenrificar cad a gen de inreres en cualquiera de las especies quecomponen los alinearnientos as como en las cepas colombianas de Clostridium sp Lalongirud minima de las sondas se establecio a partir de los resultados de busquedas enGenBank con sondas de longitud creciente disenadas para un gen Endoglucanasausando BLASTN Se encontro que con sondas de longitud inferior a 19 nucleotidos re-sulta imposible distinguir los resultados especfficos de los inespecificos a partir de losvalores de referencia Score y Valor E (Tabla 6 Altschul et al 1997) Dicha longitud seencuenrra en el rango de valores reportados para euroI diseno de sondas de oligonucleo-tidos para microarreglos (Guckenberger et al 2002 Lee et ai 2004) En total se obtu-vieron 94 sondas de oligonucleotidos algunas de las cuales se enlistan en la tabla 5 ycuyos resultados en la busqueda can BLASTN con Valor E inferior a 005 correspon-dieron en cada caso a las enzimas para las cuaes fueron diseriadas (Ia lista completa desondas esta disponible como material suplementario en http)jwwwibununaleducoIineasbioprocesosindexhtm) En promedio con cada sanda se pueden reconocer tresgenes espedficos para la enzima objetivo en GenBank tras las busquedas correspon~dienres con BLASTN 10cual sugiere que existe una buena probabilidad de reconocer losgenes hom610gos en las cepas promisorias de Clostridium Los resultados de las busque-das can RPS-BLAST indican que las sondas diseriadas para las rutas de acidogenesissolventogenesis y producci6n de 13-PD reconocen siempre el mismo dominio en cadagen miencras que en el caso de las celulasas cada sonda puede identiFicar varias enzi-

Acta bioi Colomb Vol 12 S 2007 67

mas de diversa funcion que poseen el mismo dominio funcional (considerando el ca-racter multidominio de las celulasas)

Oligo CAGCTTGAATTCTATCAGTG Oligo CAGCTTGAATTCTATCAGTro-gtucE2ti-de6t~aos Lo~i~td-9~ude6daas

Resuitildomiddot middot j ~~~~~J~~aio(middotEmiddotT-Res~middotltmiddotadomiddot middotmiddotmiddotmiddotl~~~E~I~~ viiarIc~i~i~~~d~Ci~~tidi~ 40 0009 Celulasa de Clostridium 38 gQ~~~)c~l~i~s~d~CI~~tidi~ ~middotmiddotmiddotmiddotmiddot40middotmiddotmiddotmiddotmiddotmiddotmiddot 0ori9middotrmiddotc~imiddot~i~smiddot~middotmiddotmiddotdmiddot~middotmiddotd~~middottidi~middotmiddotmiddotmiddotL 38 ~ 0034Ceimiddot~iilsmiddotamiddotmiddotddostldiu ~~~ 0009 c~i~f~middotsmiddotamiddotmiddotmiddot~fmiddotmiddotdo~middottjdjumiddot jiF _~deg034~

~~~~~~gg~~~~~t~~~~~ middot~middotmiddot~middot~middotmiddotl~~~~~t~ggmiddot~~~~t~~~~~~ 01

3 013

middotmiddotbFjAnmiddottmiddotemiddotrg~nlcoJeAmiddotthmiddot~middotif~middot~middot~ middotmiddotmiddotmiddotj6 613 bijAintmiddotemiddotrg~nmiddotcomiddotmiddotmiddotdeAmiddotmiddotmiddottiiamiddot~~n~middotimiddot middotmiddot 36middot 0136NAmiddot middotmiddot h middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot ~middotmiddot 34 6Ki i 6NAmiddotmiddotmiddotimiddotn[middotmiddotrg~nmiddotcamiddotmiddothumiddotmamiddotnomiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot_middot34middot _1053p~tmiddot~middotmiddot~~~d~~D~~~middotnmiddotmiddotjmiddot~middot~i) 34 652 middotp~middot~tmiddot~middoti~middot~middotmiddotdmiddotemiddotmiddot~middotnmiddoti6middotnmiddotmiddotdmiddot~middotr~[middota ~ 34 _ ~ 053

Fa(tormiddotmiddotamiddotnea FmiddotancanTh~mailo 34 bull 652~~~~p~~lt~~Jimiddot~pi~~~Ti~~~j4 652 i

Oligo CAGCTTGAATTCTATCAG Oligo CAGClTGAATTCTATCAlongimiddottudmiddotfS nmiddot-ietmiddottidoSmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot j middotLorigrcumiddotamiddotmiddotfjnumiddotde6ddosmiddotmiddotmiddotmiddotResljitild) middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~~~t~j~vilior-EResljitildo ~~~~~~ middotmiddotmiddotmiddotva-iarEC~(~i~s~dea~tdj~~ 36 r 0131 C~i~i~~adea~id~~~ 34 T 053c~i~i~s~dmiddotCiostdj~~middotmiddotmiddot 36 ojj Celulasa de Clostridi~middot~middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotbullmiddotmiddot 34 OS3iCelulasa de Clostridium -t- j6~ l middotbT3gtmiddotmiddotmiddotmiddotCeT~iilsmiddotamiddotdeClo5idiui bullj4 3 - 1bNAliltmiddot~rg~ilmiddotic~middotmiddotmiddothumiddotmamiddotn~ 36 6130 DNA intergenico humane 34 053

~ ~DmiddotNAmiddotmiddotlntmiddoterg~nmiddoticomiddotmiddotmiddothumiddotmamiddotno ~ middotmiddotmiddotmiddotmiddot3Kmiddot 6-j- i middotmiddotbmiddotNAmiddot~middotntemiddotrg~nmiddot~omiddothmiddot~middotmamiddotmiddotomiddot 34 053 ~ ~ bNAjnterglfi1Tco--aeif thaioi) 34 653 (lYNAlnterglfricoaeAihaioiio1 34 middot6middot5~rmiddotmiddot

bmiddotNAmiddotlntmiddotemiddotrg~nTcohtimanomiddot middotmiddotmiddotmiddotmiddotj4 J 653middotmiddotmiddotbmiddotNAlrlmiddotcmiddoterg~nicohumane 34 deg 53~PmiddotrmiddotocmiddotmiddotfnmiddotimiddotmiddotdmiddotmiddotmiddotumiddotrmiddottSilmiddotmiddotdmiddotracmiddotamiddotmiddot r middotmiddotmiddotmiddotmiddotmiddot34 sectsect~middotmiddotrmiddot~~middot~tmiddot~t~~~~~6E~middotmiddot~~~~~~__1 34middot QI~-

Tabla 6 Resultados de la busqueda can oligonucleotides de longirud crecienre para EndoglucanasaGH48 en GenBank usando BLASTN 228 Los resultados rorulados como Celulasa de Clostridiumcorresponden a registros de endoglucanasas (resultados especfficos) mientras que las cifras marca-das con un asterisco () corresponden al mayor puntaje y el menor Valor E obtenidos en cadabusqueda Se observa que con los oligos de 17 y 18 nucle6tidos se obtiene el mayor puncaje y elmenor Valor E tanto para los resulcados espedficos como para algunos inespedficos Por ello seestableci6 como norma para el disefio de sondas una longitud minima de 19 nucle6tidos Nota Lasmagnitudes del mayor Puntaje y el menor Valor E no son comparables entre los cuatro oligos ya queestas depend en directa e inversameme de la longicud de la secuencia de busqueda en BLASTN

Las sondas disenadas se encuentran distribuidas de la siguiente forma 25 corres-ponden a la caregorfa Solventogenesis 48 a la categorfa Celulasas (con sondaspara varias familias de dominios funcionales en cad a tipo de enzima) 19 a lt 13-Pro-panodiol y dos aJ factor SpoOA Los valores caracterfsticos promedio de las sondasdisefiadas fueron los siguientes longitud de 24 nucleotidos Tm termodinamica de658 degC contenido de (G+C) de 390 Tm de la horquilla mas estable (cuandoexiste) de 104 degC y 6G de uni6n al objetivo de -374 kCal(Mol De esta forma se(oncluye que todas las sondas disenadas pueden ser usadas para la construccion deun microarreglo hibridizado a 42degC (Cronin et a 2001) 0 bien para un ensayo deSouthern Blot realizado en condiciones similares (Harris et 01 2002) Se disenaronademas sondas para control positive negative y de purificacion de rRNA utilizandolos mismos criterios descritos anteriormente la sonda de control positivo 5-

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 6: Oligonucleotide Probe Design for the Study of Cellulolytic

60 Articulo - Oiseno de oligoIJucle6tidos para el estudio de genes celutottucoe y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

NAD

H2--- Glicerol

-----1 2 41N~~H+WN~~NHHAidD~i~3naldehidO fT

Dihidroxiacerona

ATPj13-Propanodoll 5 ADP

Glucosa - ---+ Dihidroxiacecona P Cbcer aldehtdo 3 P

iPiruvato

Biomasa

NADHI-WImiddot

NAD+I

Glicerol ~ GlicerolmiddotP

Pi H20

Figura 2 Ruta de asimilaci6n de glicerol en Clostridium butyricum 1 Glicerol deshidratasa 2 Active-dar de la glicerol desbidratasa 3 13-PD deshidrogenasa 4 Glicerol deshidrogenasa 5 Dihidroxia-cerona kinase 6 Glicerol-Scfosfarasa 7 Glicerol kinasa

Para esta base de datos local se establecieron las siguientes categonas (1) Solventoge-nesis con las enzimas fosfotranscarboxilasas carboxilato kinasas CoA transferasasacetoacetate descarboxilasas aldehtdo deshidrogenasas y alcohol deshidrogenasasnecesarias para la producci6n de aceta to butiraco etanol butanol y acetona (jones yWoods 1986 Biebl et al 1999 Nailing et al 2001) (2) 1 3-Propanodiol donde sealmacenaron registros para las enzimas glicerol deshidratasa 13-PD deshidrogenasaglicerol deshidrogenasa dihidroxiacetona kinasa y glicerol-3-fosfatasal necesarias parala produccion de 13-propanodiol y glicerol (Biebl et af 1999) (3) Celulasas dondese incluyeron las protefnas estructurales que forman el andamio y el sistema de anclajedel celulosoma (Bayer eta 1998) asl como celulasas entre las que se cuentan exoglu-canasas endoglucanasas -glucosidasas xilanasas xilosidasas y mananasas (Coughlany Mayer 1992 Lucas et at 2001) La subcategoria Celulasas fue a su vez separada porfamilias de glicosil hidrolasas dominios de union a celulosa y dominios de homologfacon la capa 5 considerando la composici6n multidominio de estas enzimas (Rabinovichet at 2002) Adicionalmente se decidi6 incluir la categorfa Factor de transcripcionSpoOA dado que est a prorelna de esporutacion ha sido reconocida como factor detranscripci6n de los operones sol adc y bdh de producci6n de solventes (Harris et at2002) La lista completa de categorfas y subcategorfas se presenta en la Tabla 2

CONSTRUCCI6N DE AliMENTOS MULTIPLES CON ALTA CONSERVACl6N DE SECUENCIAS

Para cad a tipo de enzima las secuencias de los genes registrados en MULTI-CLOSTfueron recuperadas a partir de GenBank tomando siempre la cadena positiva de cadagen En el caso de la categorfa Celulasas los grupos fueron formados por familias dedominios catalfticos 0 de union a sustrato dentro de cada tipo de enzima (Bayer eta1998) Las secuencias de cada grupo fueron alineadas con el programa de alinea-miento multiple ClustalW 183 (Thompson et al 1994) usando la matriz de respecti-vamenre La calidad de los alineamientos multiples fue mejarada par eliminaci6n de

Acta bioi Colomb Vol 125 2007 61

jESpeCie ___

3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot2middot

bull

32

Solvenrogenesis Ce--

4

iJ~Ii 1 2

B~i1i~~bt]tiili~ltimiddotmiddot~middoti~middotmiddott bullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbull1bullbullbullbullbullbullbullbull17 - + + ~ 9 j

~Iimditni 2bullbullmiddotbullbullbullmiddotbullbullbullbullbullbullbullbullbull1 middotmiddotbullbullbullbullmiddotbullmiddotmiddotbullbullbullbullbull+7

PP + j ~~timi I + +

17

11

1

813

i

h

15 bullbullbullbullbullbull

13

51

1

L middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot4middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot8 _

14

2

2

39 bullbull bullbullbullbullbullbull

16

21

2

~

+ + 5

pcJ [ 24 + +

putidaTs alb

jl

4

95

12

Tabla 1 Rcgistros inclvidos por cada especie en las cacegortas de MU LTI-CLOST

3

95

62 Articulo - Oisetlo de oligol1l1c1e6tidos para el estudia de genes cetutoteicos y solventogenicos en ccpasde Clostridium sp (Clostriditlceae) Montoya er al

los genes con secuencia menos conservada hasra alcanzar un valor alineamientoC1ustaIW16 (peso de 1 para las concordancias y 0 en los demas casas Aiyar 2000) ylos valores de penalizacion Pv aperture y extension de gaps 15 y 666 superior a 65 enel promedio del Puntaje de Alineamientos Pareados (PAP) calculado por C1ustalWentre rod os los genes de cada alineamiento (este valor minimo se redujo a 50 en las fa-milias enziroaricas can alta variabilidad de secuencia como es el caso de las celulasasmultidominio) Los alineamientos multiples definitivos fueron construidos con los ge-nes restar-res utilizando los valores de penalizacion 15 y 666 para aperture y extensionde gaps (11 y 1 para las families enzimacicas can alta variabilidad de secuencia )

GHEnzimas incluidas en la base de datos

1 Celotasas [exo- y endoglucanasas2 Mananasas3 xrtanasas4 Prorerna andamtoS Proretnas adapradoras6 croretoas de anctaje7 Proieroas de (a capa S

Cetulosa

Pared (eubr

Microorganismo celulolioco

Figura 3 Componentes esrructurales y cacalrricos del celulosoma unidos a una celuia del microor-ganismo que 10 produce y al sustrato celul6sico simuheneamenre Dominies funcionales SLHhomologia con la capa S CH I Y CH II Cohesin I y II DK I Y DK IJ Dockerin I y II CBM modulo deunion a celulosa GH Glicosil hidrolasa

DISENO DE LAS SONDAS DE OliGONUCLEOTIDOS

A partir de los alineamientos detinitivos se exrrajeron secuencias con longirud minimade 19 nucleotidos conservadas en mas del 50 de los genes de cada alineamienroutilizando para ello el editor de alineamienros GeneDoc 26002 (Nicholas y Nicholas2001) La longitud minima requerida para las sondas fue establecida a partir de losresultados arrojados par BLASTN para sondas de 17 a 20 nucle6tidos dirigidas a unmismo gen de Endoglucanasa (Tabla 6) Para aumencar la probabilidad de que losoligonucleocidos diseriados puedan reconocer sus genes objerivo en las cepas prorni-sorias de Clostridium sp se seleccionaron siempre regiones conservadas en al menosuna especie de los ordeoes Clostridiales 0 Bacillales Las propiedades termodinamicasde las sondas disefiadas fueron calculadas con GeneRunner v305 (Hastings SoftwareNY) y se aceptaron solo aquellas cuya Tm segun la formula termodinamica de San-taLucia (1998) estuviera en el rango de 44 a 90 degC y que no formaran estructurassecundarias con Tm superior a 37 0c Esros criterios se establecieron considerando lastemperaturas de desnaturaizaci6n e hibridacion recomendadas usualmente para mi~croarreglos (42 ( Y95 ( respectivamenre Hedge et aI 2000 Schuchhardt et aI 2000Tomas et aI 2003 Tummala et al 2003 Rybicki 2005) Para comprobar la sensi-bilidad y especificidad de los oligonucleotidos diseiiados est os fueron sometidos abusquedas en GenBank 1410 (Benson et al 2007) usando la aplicacion BLAsTN228 (Altschul et aI 1997) se seleccionaron aquellos oligonucleotidos para los

Acta bioi Colomb Vol 12 S 2007 63

cuales rodos los regisrros reportados por BLASTN con Valor E (Expected Value) inferior aOOS correspondieran a genes can funcion equivalence a los genes del alineamientooriginal (los resultados de BLASTN son mas significativos cuando su valor E es menorpero el valor E tiende a ser conservative cuando la secuencia de busqueda es muy cottade manera que para secuencias de longitud menor a 40 nucleotidos los resultados convalor E lt 005 se pueden considerar especfficos Altschul et 01 1997) Por ultimo seestableciola ubicacion de cada sonda de ohgonuclectidos en sus genes objetivo usandoel programa Artemis vS (Rutherford et at 2000) y se determine el dominic funcionalcorrespondienre a cad a una por medic de busquedas de las prorefnas codificadas porlos genes objetivo en la base de daros CDD vl65 (Conserved Domain Database) usandoRPS~BLAST 226 (Reversed Position Specific BLAST Altschul et 01 1997)

A-~-id-og~~~i~y~~i~~t~i~~~~i(95 registros)

SU~~~~~~~f~Fosforransacen lasa

Aceraro kinasa

17

2

Butirato 16 II

Fosfotra nsbutiri lasa

Piruvaro

2

29

15

Aceroaceraro 26

17

4

Aldehrdo

Alcohol deshidrogenasade cadena carra

Bctwiiif~~~i~~j 1~3Ir~C~Od(n~~i~~Lbullbullbullbull3f t~Aceroacerilacil CoA 4 Celodexrrrn 2 Facrores de rranscripci6n SpoDAtransferase A (14 regisrros)~+

18

3

11

Arabinosidasas 7

transferasa B s Celobiosa fosforilasasProtefnas de la capa 5Prorernas adapradorasdel andarnioProrefnas de anclajedel celulosorna

232

SubcaregortaNo posee sobcaregona

5

Tabla 2 Numero de registros iocloidos en cada caregorta y subcategorfa de la base de datos MULTImiddotCLOST

RESULTADOS

CONSTRUCCl6N DE LA BASE DE DATOS MULTI-CLOST

La base de datos construida en Microsoft Access XP fue registrada bajo el nornbreMULTI-CLOST ante la Direcci6n Nacional de Derecho de Autor de Colombia (Libra13 Torno 17 Partida 142 del 20 de noviernbre de 2006 disponible en

64 Arrtculo Diseriode oligonucleotidos para el estudio de genes celuolftiws y solventogeniws en cepasde Clostridium sp (Clostridiaceae) Montoya et al

httpWIfNibununaleducolineasbioprocesosindexhtm) Esta base de datos con-riene registros de 485 genes que codifican para las enzimas y prorefnas estructuralesinvolucradas en la acidogenesis solvemogenesis degradaci6n de celulosa y producci6nde 13-PD en 55 especies bacrerianas y fungicas permitiendo recuperar las secuenciasde dichos genes y protein as en las bases de datos GenBank (Benson et al 2007) yUniProt (Bairoch et al 2005) De estos registros 95 corresponden a la caregorfa Solven-rogenesis 94 a la categorfa 1 3-Propanodiol 14 a la categona Factor de esporulaci6nSpoDA y 282 a la caregorta Celulasas la mas numerosa considerando la subdivisionadiciona per farnilias de dominios funcionales

i-S-ubc~tego~raFosfoi~ansacetE3-sa

No6rgaiiTsoClo~tidi~~ih~~~~ii~

i Acetat~middotmiddotki~middotasmiddotamiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot B~~i1i~-~biijismiddotBumiddottlmiddot~atmiddotomiddotmiddotkrnamiddotsamiddotmiddotmiddotmiddotmiddotmiddotmiddotFmiddotomiddot~fomiddottmiddot~amiddotnmiddotsb~middotti~iasamiddot

bilk

AF041S4i

Z99119middotmiddotmiddotmiddotmiddotAY46jmiddot1middot03 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddoti

AE007804M15393

AY251646

- clostidi~--beJemiddot~ckii----ciostid~-~cmiddot~tob~ampIi~~middot CAC30i6-

--P~~~at-od~~~amiddot~bmiddoto~i-iasamiddot middotio~~~~~middotomiddotbij~middotmiddot pd~ A~~tmiddotoa~etmiddotat~middotd~~~middotamiddot~middotbo~TIsmiddotaIc s~~~~i~~pi~~~~~i~~~~~~~~~I adcmiddotmiddotAldmiddotemiddothi~joai~ohofmiddot deshidrogenasa idium tetanimiddotB-~-t~-~~imiddotdmiddot~~hmiddotdgemiddot~middot~amiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotCmiddot C

rmiddotA~-~t~~middot~-~middottmiddotii-~i-imiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~CoA transferasa AA~~to~~~df~iiS~~~~~~~~~~~8 BH2258 AP001514I~_I_~~~_~_~s_~s celK F039030 Endoglucanasas creajecorina _ __ __~ eg~ Y1l1l3middotMamiddot~~middot~middotas~~ 1 middot 7c~~sp mane middotmiddotmiddotmiddotgt(9752middot0middotmiddotmiddotmiddotimiddotximiddotimiddot~asamiddotmiddotmiddotmiddot Ruminococcus abus _ Z~~ AB057589r p~-~~f~middot~middotmiddot~middotdmiddot~middot~middotimiddot~Ruminococcus flaveiJ~i~~ middotmiddotmiddotmiddotmiddotmiddotmiddotmiddott scaA j27i3969

~glucanasas Clostridium thermocellum licB X63355 ~ middotmiddotmiddot~gimiddot~~~~~middot~~-~~_ CIstridiu~ ~-~iipmiddot~~ i abgA L49336 -j

Xilosidasas j ~i~~~~i~0middott~~o~~--middot 1 middotbTBmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAmiddotmiddotJmiddotSmiddotOmiddotS4middotmiddotO5 j

rA-~binomiddot~idmiddotmiddot~~middot~ Bacteroidesmiddotmiddotih~t~jt~li~~ L BT1781 ~~~~~ middot~~middot~i~~~d-middotmiddot~~~-pamiddot smiddot middot~jo~~middot(h~~~~L~1 ~~ middotmiddot1 ~~~~~~

rmiddotGiice~~imiddotdesimiddotimiddotdmiddott~middotsmiddot~ K~b~i~middotii~p~emiddot~middot~j~ middotmiddotmiddotmiddotmiddot1 dh~j32middot U60992 ~middotl-j-pmiddot~~-p~middot~~dmiddot~imiddot - ~ deshidrogenasa Clostridium pasteurianum dhaT AF006034 R dii ~ dhaR U09771i middotGmiddotilmiddot~middotemiddot~of~jemiddotshdrogmiddotemiddotnmiddotasmiddotamiddot Cistjd~middotmiddotb~amp~~m middotmiddotmiddotmiddotmiddotmiddotmiddotdh~i5i AY1j~f5s1

middotomiddot~Imiddotamiddotce[omiddot~middotamiddotkimiddotnmiddotasa middotmiddot--middotmiddotmiddotimiddotmiddot ~~g~~~ ~~~~~~~ Sacch~romycescer~~j~i~~ gpp2 050469

-t-

CTC02182 AE015943

CPE1256 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAPOOjmiddotmiddots9middot

CAP0163 AE001438

F~-~-t~middot~middotmiddotd~middotmiddott~middot~middot~cmiddotipmiddot~-i6middot~middotmiddotmiddot SpaDA i E~~~~~~~~~~ 1 spoOA 1 U43514

Tabla 3 Secuencias represemativas de cada subcategorfa de MULTI-CLOST can su numero de accemiddotso a GenBank

Las especies mayoritarias de la categoria Celulasas son C acetoblJoliclJm y C thermocellumlas cuales representan el 25 de dicha categor(a mientras que en Solventogenesis el

Acta bioi Colomb Vol 1252007 65

mayor porcenraje (36) corresponde a las especies C acetobutylicum y Bacillus subtiiis Parsu parte la categorfa 13-Propanodiol contiene el 25 de secuencias de las especiesClostridium butyricum Clostridium petfringens y Citrobacter freundii En la Tabla 2 se muestrala cantidad de registros que fueron agregados a la base de datos para cad a subcategorfamientras que en la Tabla 3 se enlistan los numeros de acceso en GenBank para secuen-cias representativas de cada subcategorfa almacenadas en MULTI-CLOST Los numerosde acceso de GenBank y UniProt contenidos en cada regisrro perrniten recuperar la se-cuencia genetica e informacion de conglomerados a partir de GenBank asr como lasecuencia proteica e informacion biologica a partir de UniProt Todas las enzimas inclui-das en cada categorfa fueron utifizadas para realizar los alineamientos multiples

CONSTRUCCI6N DE ALJNEAMIENTOS MULTIPLES CON ALTA CONSERVACION DE SECUENCIAS

Las secuencias de los genes almacenados en MULTI-CLOST fueron usadas para crearlos alineamientos a partir de los cuales se disefiarfan las sondas de oligonucleotidesSe esrablecieron como criterios de seleccion los valores PAP mfnimos 65 y 50 deacuerdo con el contenido de secuencias conservadas en cad a ahnearmento eliminan-dose de cad a uno 105 genes que produjeran PAP inferiores a estes valores En el casode las celulasas se usaron parametres mas flexibles (apropiados para enzimas multi-dominie) y sus dominies funcionales se alinearon independienternenre Para losalineamientos de genes de las categorfas Solventogenesis 13-Propanodiol y Factorde esporulacion SpaDA se usaron las penalidades de aperture y extension de gaps [15-666] establecidas por defecto en ClustalW y apropiadas para genes conservados encoda su extension a craves de diversas especies En los alineamientos definitivos de ceu-lasas fue necesario flexibilizar dichas penalidades de forma que se pudieran alinear fa-cilmente los dominios conservados en cada familia enzirnatica En estes casos se utilize-ron las penalidades de apertura y extension [11- 1J correspondienres a las penalidadespar defecto usadas en algunas aplicaciones de BLAST (Altschul et aI 1997) De estaforma los alineamienros definitivos fueron construidos con tres combinaciones de pa-metros 65 - [15- 666J 50 - [15- 666J Y 50 - [11-1] (PAP - [apertura- extension degaps]) Con el uso de dichas combinaciones de parametres se obruvieron en rota I 56alineamientos definitivos para las cuatra categorias de MULTI-CLOST EI numero dealineamientos obtenidos en cada categorfa can las diferenres combinaciones de para-metros se muestra en la Tabla 4

Celulasas

alineamientos

97 cmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotFFacto~dde~~ii6spoioiA~-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotrmiddotmiddotmiddotmiddotmiddot~middot8 1

110

3

Tabla 4 Alineamienros Inulriples agrupados par las caregor(as de la base de daros MULTI-CLOST ypar los criterios de alincamienro

66 Articulo - Diseno de oligonucleotidos para el estudia de genes celuloitticos y solventoginicos en cepasde Clostridium sp (Clostridiaceae) MOlltoya et al

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

1060 1080TIT T

T~GC AAaAAaTa AATAC AC ag aGa

6661068

639675651

c

1100 1120

I_ A

A A

II I~A AA A -

T

T CA 718GGB 1120

c CT 6912C T 727

703TGG

GGT GAaAGAGCaATAAGACATGC AT GAaGT GC

Figura 4 Ahneamienro multiple para el factor de esporulacion SpoOA de cinco especies de Clostridiumusando un PAP minima de 65 y penalidades 15- 666 (apertura extension de gaps) La ultima lineamuescra la secuencia consenso donde las letras en mayuscula indican posiciones compleramenreconservadas y las leer-asen rninuscula indican posiciones conservadas en cuacro de las cinco secuen-cias Los bloque en negro indican regiones identicas miencras que los bloques en diferentes ronos degris muestran regiones parcialrnente conservadas

Dada la dificultad inhereme al alineamiento de genes provenienres de especies tandiversas como las analizadas el 77 de los alineamienros definicivos contiene dos acuatro genes y el 18 contiene cinco 0 seis genes En la Figura 4 a manera de ejemplose observa el alineamienro multiple de genes correspondiences a facto res de esporu-lacion SpaDA penenecienres a varias especies de closrridios

DISENO DE LAS SONDAS DE OLiGONUCLE6TIDOS

La estrategia de diserio de oligonucleocidos en esre trabajo esca enfocada a la obtencionde sondas que permitan ioenrificar cad a gen de inreres en cualquiera de las especies quecomponen los alinearnientos as como en las cepas colombianas de Clostridium sp Lalongirud minima de las sondas se establecio a partir de los resultados de busquedas enGenBank con sondas de longitud creciente disenadas para un gen Endoglucanasausando BLASTN Se encontro que con sondas de longitud inferior a 19 nucleotidos re-sulta imposible distinguir los resultados especfficos de los inespecificos a partir de losvalores de referencia Score y Valor E (Tabla 6 Altschul et al 1997) Dicha longitud seencuenrra en el rango de valores reportados para euroI diseno de sondas de oligonucleo-tidos para microarreglos (Guckenberger et al 2002 Lee et ai 2004) En total se obtu-vieron 94 sondas de oligonucleotidos algunas de las cuales se enlistan en la tabla 5 ycuyos resultados en la busqueda can BLASTN con Valor E inferior a 005 correspon-dieron en cada caso a las enzimas para las cuaes fueron diseriadas (Ia lista completa desondas esta disponible como material suplementario en http)jwwwibununaleducoIineasbioprocesosindexhtm) En promedio con cada sanda se pueden reconocer tresgenes espedficos para la enzima objetivo en GenBank tras las busquedas correspon~dienres con BLASTN 10cual sugiere que existe una buena probabilidad de reconocer losgenes hom610gos en las cepas promisorias de Clostridium Los resultados de las busque-das can RPS-BLAST indican que las sondas diseriadas para las rutas de acidogenesissolventogenesis y producci6n de 13-PD reconocen siempre el mismo dominio en cadagen miencras que en el caso de las celulasas cada sonda puede identiFicar varias enzi-

Acta bioi Colomb Vol 12 S 2007 67

mas de diversa funcion que poseen el mismo dominio funcional (considerando el ca-racter multidominio de las celulasas)

Oligo CAGCTTGAATTCTATCAGTG Oligo CAGCTTGAATTCTATCAGTro-gtucE2ti-de6t~aos Lo~i~td-9~ude6daas

Resuitildomiddot middot j ~~~~~J~~aio(middotEmiddotT-Res~middotltmiddotadomiddot middotmiddotmiddotmiddotl~~~E~I~~ viiarIc~i~i~~~d~Ci~~tidi~ 40 0009 Celulasa de Clostridium 38 gQ~~~)c~l~i~s~d~CI~~tidi~ ~middotmiddotmiddotmiddotmiddot40middotmiddotmiddotmiddotmiddotmiddotmiddot 0ori9middotrmiddotc~imiddot~i~smiddot~middotmiddotmiddotdmiddot~middotmiddotd~~middottidi~middotmiddotmiddotmiddotL 38 ~ 0034Ceimiddot~iilsmiddotamiddotmiddotddostldiu ~~~ 0009 c~i~f~middotsmiddotamiddotmiddotmiddot~fmiddotmiddotdo~middottjdjumiddot jiF _~deg034~

~~~~~~gg~~~~~t~~~~~ middot~middotmiddot~middot~middotmiddotl~~~~~t~ggmiddot~~~~t~~~~~~ 01

3 013

middotmiddotbFjAnmiddottmiddotemiddotrg~nlcoJeAmiddotthmiddot~middotif~middot~middot~ middotmiddotmiddotmiddotj6 613 bijAintmiddotemiddotrg~nmiddotcomiddotmiddotmiddotdeAmiddotmiddotmiddottiiamiddot~~n~middotimiddot middotmiddot 36middot 0136NAmiddot middotmiddot h middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot ~middotmiddot 34 6Ki i 6NAmiddotmiddotmiddotimiddotn[middotmiddotrg~nmiddotcamiddotmiddothumiddotmamiddotnomiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot_middot34middot _1053p~tmiddot~middotmiddot~~~d~~D~~~middotnmiddotmiddotjmiddot~middot~i) 34 652 middotp~middot~tmiddot~middoti~middot~middotmiddotdmiddotemiddotmiddot~middotnmiddoti6middotnmiddotmiddotdmiddot~middotr~[middota ~ 34 _ ~ 053

Fa(tormiddotmiddotamiddotnea FmiddotancanTh~mailo 34 bull 652~~~~p~~lt~~Jimiddot~pi~~~Ti~~~j4 652 i

Oligo CAGCTTGAATTCTATCAG Oligo CAGClTGAATTCTATCAlongimiddottudmiddotfS nmiddot-ietmiddottidoSmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot j middotLorigrcumiddotamiddotmiddotfjnumiddotde6ddosmiddotmiddotmiddotmiddotResljitild) middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~~~t~j~vilior-EResljitildo ~~~~~~ middotmiddotmiddotmiddotva-iarEC~(~i~s~dea~tdj~~ 36 r 0131 C~i~i~~adea~id~~~ 34 T 053c~i~i~s~dmiddotCiostdj~~middotmiddotmiddot 36 ojj Celulasa de Clostridi~middot~middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotbullmiddotmiddot 34 OS3iCelulasa de Clostridium -t- j6~ l middotbT3gtmiddotmiddotmiddotmiddotCeT~iilsmiddotamiddotdeClo5idiui bullj4 3 - 1bNAliltmiddot~rg~ilmiddotic~middotmiddotmiddothumiddotmamiddotn~ 36 6130 DNA intergenico humane 34 053

~ ~DmiddotNAmiddotmiddotlntmiddoterg~nmiddoticomiddotmiddotmiddothumiddotmamiddotno ~ middotmiddotmiddotmiddotmiddot3Kmiddot 6-j- i middotmiddotbmiddotNAmiddot~middotntemiddotrg~nmiddot~omiddothmiddot~middotmamiddotmiddotomiddot 34 053 ~ ~ bNAjnterglfi1Tco--aeif thaioi) 34 653 (lYNAlnterglfricoaeAihaioiio1 34 middot6middot5~rmiddotmiddot

bmiddotNAmiddotlntmiddotemiddotrg~nTcohtimanomiddot middotmiddotmiddotmiddotmiddotj4 J 653middotmiddotmiddotbmiddotNAlrlmiddotcmiddoterg~nicohumane 34 deg 53~PmiddotrmiddotocmiddotmiddotfnmiddotimiddotmiddotdmiddotmiddotmiddotumiddotrmiddottSilmiddotmiddotdmiddotracmiddotamiddotmiddot r middotmiddotmiddotmiddotmiddotmiddot34 sectsect~middotmiddotrmiddot~~middot~tmiddot~t~~~~~6E~middotmiddot~~~~~~__1 34middot QI~-

Tabla 6 Resultados de la busqueda can oligonucleotides de longirud crecienre para EndoglucanasaGH48 en GenBank usando BLASTN 228 Los resultados rorulados como Celulasa de Clostridiumcorresponden a registros de endoglucanasas (resultados especfficos) mientras que las cifras marca-das con un asterisco () corresponden al mayor puntaje y el menor Valor E obtenidos en cadabusqueda Se observa que con los oligos de 17 y 18 nucle6tidos se obtiene el mayor puncaje y elmenor Valor E tanto para los resulcados espedficos como para algunos inespedficos Por ello seestableci6 como norma para el disefio de sondas una longitud minima de 19 nucle6tidos Nota Lasmagnitudes del mayor Puntaje y el menor Valor E no son comparables entre los cuatro oligos ya queestas depend en directa e inversameme de la longicud de la secuencia de busqueda en BLASTN

Las sondas disenadas se encuentran distribuidas de la siguiente forma 25 corres-ponden a la caregorfa Solventogenesis 48 a la categorfa Celulasas (con sondaspara varias familias de dominios funcionales en cad a tipo de enzima) 19 a lt 13-Pro-panodiol y dos aJ factor SpoOA Los valores caracterfsticos promedio de las sondasdisefiadas fueron los siguientes longitud de 24 nucleotidos Tm termodinamica de658 degC contenido de (G+C) de 390 Tm de la horquilla mas estable (cuandoexiste) de 104 degC y 6G de uni6n al objetivo de -374 kCal(Mol De esta forma se(oncluye que todas las sondas disenadas pueden ser usadas para la construccion deun microarreglo hibridizado a 42degC (Cronin et a 2001) 0 bien para un ensayo deSouthern Blot realizado en condiciones similares (Harris et 01 2002) Se disenaronademas sondas para control positive negative y de purificacion de rRNA utilizandolos mismos criterios descritos anteriormente la sonda de control positivo 5-

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 7: Oligonucleotide Probe Design for the Study of Cellulolytic

Acta bioi Colomb Vol 125 2007 61

jESpeCie ___

3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot2middot

bull

32

Solvenrogenesis Ce--

4

iJ~Ii 1 2

B~i1i~~bt]tiili~ltimiddotmiddot~middoti~middotmiddott bullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbullbull1bullbullbullbullbullbullbullbull17 - + + ~ 9 j

~Iimditni 2bullbullmiddotbullbullbullmiddotbullbullbullbullbullbullbullbullbull1 middotmiddotbullbullbullbullmiddotbullmiddotmiddotbullbullbullbullbull+7

PP + j ~~timi I + +

17

11

1

813

i

h

15 bullbullbullbullbullbull

13

51

1

L middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot4middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot8 _

14

2

2

39 bullbull bullbullbullbullbullbull

16

21

2

~

+ + 5

pcJ [ 24 + +

putidaTs alb

jl

4

95

12

Tabla 1 Rcgistros inclvidos por cada especie en las cacegortas de MU LTI-CLOST

3

95

62 Articulo - Oisetlo de oligol1l1c1e6tidos para el estudia de genes cetutoteicos y solventogenicos en ccpasde Clostridium sp (Clostriditlceae) Montoya er al

los genes con secuencia menos conservada hasra alcanzar un valor alineamientoC1ustaIW16 (peso de 1 para las concordancias y 0 en los demas casas Aiyar 2000) ylos valores de penalizacion Pv aperture y extension de gaps 15 y 666 superior a 65 enel promedio del Puntaje de Alineamientos Pareados (PAP) calculado por C1ustalWentre rod os los genes de cada alineamiento (este valor minimo se redujo a 50 en las fa-milias enziroaricas can alta variabilidad de secuencia como es el caso de las celulasasmultidominio) Los alineamientos multiples definitivos fueron construidos con los ge-nes restar-res utilizando los valores de penalizacion 15 y 666 para aperture y extensionde gaps (11 y 1 para las families enzimacicas can alta variabilidad de secuencia )

GHEnzimas incluidas en la base de datos

1 Celotasas [exo- y endoglucanasas2 Mananasas3 xrtanasas4 Prorerna andamtoS Proretnas adapradoras6 croretoas de anctaje7 Proieroas de (a capa S

Cetulosa

Pared (eubr

Microorganismo celulolioco

Figura 3 Componentes esrructurales y cacalrricos del celulosoma unidos a una celuia del microor-ganismo que 10 produce y al sustrato celul6sico simuheneamenre Dominies funcionales SLHhomologia con la capa S CH I Y CH II Cohesin I y II DK I Y DK IJ Dockerin I y II CBM modulo deunion a celulosa GH Glicosil hidrolasa

DISENO DE LAS SONDAS DE OliGONUCLEOTIDOS

A partir de los alineamientos detinitivos se exrrajeron secuencias con longirud minimade 19 nucleotidos conservadas en mas del 50 de los genes de cada alineamienroutilizando para ello el editor de alineamienros GeneDoc 26002 (Nicholas y Nicholas2001) La longitud minima requerida para las sondas fue establecida a partir de losresultados arrojados par BLASTN para sondas de 17 a 20 nucle6tidos dirigidas a unmismo gen de Endoglucanasa (Tabla 6) Para aumencar la probabilidad de que losoligonucleocidos diseriados puedan reconocer sus genes objerivo en las cepas prorni-sorias de Clostridium sp se seleccionaron siempre regiones conservadas en al menosuna especie de los ordeoes Clostridiales 0 Bacillales Las propiedades termodinamicasde las sondas disefiadas fueron calculadas con GeneRunner v305 (Hastings SoftwareNY) y se aceptaron solo aquellas cuya Tm segun la formula termodinamica de San-taLucia (1998) estuviera en el rango de 44 a 90 degC y que no formaran estructurassecundarias con Tm superior a 37 0c Esros criterios se establecieron considerando lastemperaturas de desnaturaizaci6n e hibridacion recomendadas usualmente para mi~croarreglos (42 ( Y95 ( respectivamenre Hedge et aI 2000 Schuchhardt et aI 2000Tomas et aI 2003 Tummala et al 2003 Rybicki 2005) Para comprobar la sensi-bilidad y especificidad de los oligonucleotidos diseiiados est os fueron sometidos abusquedas en GenBank 1410 (Benson et al 2007) usando la aplicacion BLAsTN228 (Altschul et aI 1997) se seleccionaron aquellos oligonucleotidos para los

Acta bioi Colomb Vol 12 S 2007 63

cuales rodos los regisrros reportados por BLASTN con Valor E (Expected Value) inferior aOOS correspondieran a genes can funcion equivalence a los genes del alineamientooriginal (los resultados de BLASTN son mas significativos cuando su valor E es menorpero el valor E tiende a ser conservative cuando la secuencia de busqueda es muy cottade manera que para secuencias de longitud menor a 40 nucleotidos los resultados convalor E lt 005 se pueden considerar especfficos Altschul et 01 1997) Por ultimo seestableciola ubicacion de cada sonda de ohgonuclectidos en sus genes objetivo usandoel programa Artemis vS (Rutherford et at 2000) y se determine el dominic funcionalcorrespondienre a cad a una por medic de busquedas de las prorefnas codificadas porlos genes objetivo en la base de daros CDD vl65 (Conserved Domain Database) usandoRPS~BLAST 226 (Reversed Position Specific BLAST Altschul et 01 1997)

A-~-id-og~~~i~y~~i~~t~i~~~~i(95 registros)

SU~~~~~~~f~Fosforransacen lasa

Aceraro kinasa

17

2

Butirato 16 II

Fosfotra nsbutiri lasa

Piruvaro

2

29

15

Aceroaceraro 26

17

4

Aldehrdo

Alcohol deshidrogenasade cadena carra

Bctwiiif~~~i~~j 1~3Ir~C~Od(n~~i~~Lbullbullbullbull3f t~Aceroacerilacil CoA 4 Celodexrrrn 2 Facrores de rranscripci6n SpoDAtransferase A (14 regisrros)~+

18

3

11

Arabinosidasas 7

transferasa B s Celobiosa fosforilasasProtefnas de la capa 5Prorernas adapradorasdel andarnioProrefnas de anclajedel celulosorna

232

SubcaregortaNo posee sobcaregona

5

Tabla 2 Numero de registros iocloidos en cada caregorta y subcategorfa de la base de datos MULTImiddotCLOST

RESULTADOS

CONSTRUCCl6N DE LA BASE DE DATOS MULTI-CLOST

La base de datos construida en Microsoft Access XP fue registrada bajo el nornbreMULTI-CLOST ante la Direcci6n Nacional de Derecho de Autor de Colombia (Libra13 Torno 17 Partida 142 del 20 de noviernbre de 2006 disponible en

64 Arrtculo Diseriode oligonucleotidos para el estudio de genes celuolftiws y solventogeniws en cepasde Clostridium sp (Clostridiaceae) Montoya et al

httpWIfNibununaleducolineasbioprocesosindexhtm) Esta base de datos con-riene registros de 485 genes que codifican para las enzimas y prorefnas estructuralesinvolucradas en la acidogenesis solvemogenesis degradaci6n de celulosa y producci6nde 13-PD en 55 especies bacrerianas y fungicas permitiendo recuperar las secuenciasde dichos genes y protein as en las bases de datos GenBank (Benson et al 2007) yUniProt (Bairoch et al 2005) De estos registros 95 corresponden a la caregorfa Solven-rogenesis 94 a la categorfa 1 3-Propanodiol 14 a la categona Factor de esporulaci6nSpoDA y 282 a la caregorta Celulasas la mas numerosa considerando la subdivisionadiciona per farnilias de dominios funcionales

i-S-ubc~tego~raFosfoi~ansacetE3-sa

No6rgaiiTsoClo~tidi~~ih~~~~ii~

i Acetat~middotmiddotki~middotasmiddotamiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot B~~i1i~-~biijismiddotBumiddottlmiddot~atmiddotomiddotmiddotkrnamiddotsamiddotmiddotmiddotmiddotmiddotmiddotmiddotFmiddotomiddot~fomiddottmiddot~amiddotnmiddotsb~middotti~iasamiddot

bilk

AF041S4i

Z99119middotmiddotmiddotmiddotmiddotAY46jmiddot1middot03 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddoti

AE007804M15393

AY251646

- clostidi~--beJemiddot~ckii----ciostid~-~cmiddot~tob~ampIi~~middot CAC30i6-

--P~~~at-od~~~amiddot~bmiddoto~i-iasamiddot middotio~~~~~middotomiddotbij~middotmiddot pd~ A~~tmiddotoa~etmiddotat~middotd~~~middotamiddot~middotbo~TIsmiddotaIc s~~~~i~~pi~~~~~i~~~~~~~~~I adcmiddotmiddotAldmiddotemiddothi~joai~ohofmiddot deshidrogenasa idium tetanimiddotB-~-t~-~~imiddotdmiddot~~hmiddotdgemiddot~middot~amiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotCmiddot C

rmiddotA~-~t~~middot~-~middottmiddotii-~i-imiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~CoA transferasa AA~~to~~~df~iiS~~~~~~~~~~~8 BH2258 AP001514I~_I_~~~_~_~s_~s celK F039030 Endoglucanasas creajecorina _ __ __~ eg~ Y1l1l3middotMamiddot~~middot~middotas~~ 1 middot 7c~~sp mane middotmiddotmiddotmiddotgt(9752middot0middotmiddotmiddotmiddotimiddotximiddotimiddot~asamiddotmiddotmiddotmiddot Ruminococcus abus _ Z~~ AB057589r p~-~~f~middot~middotmiddot~middotdmiddot~middot~middotimiddot~Ruminococcus flaveiJ~i~~ middotmiddotmiddotmiddotmiddotmiddotmiddotmiddott scaA j27i3969

~glucanasas Clostridium thermocellum licB X63355 ~ middotmiddotmiddot~gimiddot~~~~~middot~~-~~_ CIstridiu~ ~-~iipmiddot~~ i abgA L49336 -j

Xilosidasas j ~i~~~~i~0middott~~o~~--middot 1 middotbTBmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAmiddotmiddotJmiddotSmiddotOmiddotS4middotmiddotO5 j

rA-~binomiddot~idmiddotmiddot~~middot~ Bacteroidesmiddotmiddotih~t~jt~li~~ L BT1781 ~~~~~ middot~~middot~i~~~d-middotmiddot~~~-pamiddot smiddot middot~jo~~middot(h~~~~L~1 ~~ middotmiddot1 ~~~~~~

rmiddotGiice~~imiddotdesimiddotimiddotdmiddott~middotsmiddot~ K~b~i~middotii~p~emiddot~middot~j~ middotmiddotmiddotmiddotmiddot1 dh~j32middot U60992 ~middotl-j-pmiddot~~-p~middot~~dmiddot~imiddot - ~ deshidrogenasa Clostridium pasteurianum dhaT AF006034 R dii ~ dhaR U09771i middotGmiddotilmiddot~middotemiddot~of~jemiddotshdrogmiddotemiddotnmiddotasmiddotamiddot Cistjd~middotmiddotb~amp~~m middotmiddotmiddotmiddotmiddotmiddotmiddotdh~i5i AY1j~f5s1

middotomiddot~Imiddotamiddotce[omiddot~middotamiddotkimiddotnmiddotasa middotmiddot--middotmiddotmiddotimiddotmiddot ~~g~~~ ~~~~~~~ Sacch~romycescer~~j~i~~ gpp2 050469

-t-

CTC02182 AE015943

CPE1256 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAPOOjmiddotmiddots9middot

CAP0163 AE001438

F~-~-t~middot~middotmiddotd~middotmiddott~middot~middot~cmiddotipmiddot~-i6middot~middotmiddotmiddot SpaDA i E~~~~~~~~~~ 1 spoOA 1 U43514

Tabla 3 Secuencias represemativas de cada subcategorfa de MULTI-CLOST can su numero de accemiddotso a GenBank

Las especies mayoritarias de la categoria Celulasas son C acetoblJoliclJm y C thermocellumlas cuales representan el 25 de dicha categor(a mientras que en Solventogenesis el

Acta bioi Colomb Vol 1252007 65

mayor porcenraje (36) corresponde a las especies C acetobutylicum y Bacillus subtiiis Parsu parte la categorfa 13-Propanodiol contiene el 25 de secuencias de las especiesClostridium butyricum Clostridium petfringens y Citrobacter freundii En la Tabla 2 se muestrala cantidad de registros que fueron agregados a la base de datos para cad a subcategorfamientras que en la Tabla 3 se enlistan los numeros de acceso en GenBank para secuen-cias representativas de cada subcategorfa almacenadas en MULTI-CLOST Los numerosde acceso de GenBank y UniProt contenidos en cada regisrro perrniten recuperar la se-cuencia genetica e informacion de conglomerados a partir de GenBank asr como lasecuencia proteica e informacion biologica a partir de UniProt Todas las enzimas inclui-das en cada categorfa fueron utifizadas para realizar los alineamientos multiples

CONSTRUCCI6N DE ALJNEAMIENTOS MULTIPLES CON ALTA CONSERVACION DE SECUENCIAS

Las secuencias de los genes almacenados en MULTI-CLOST fueron usadas para crearlos alineamientos a partir de los cuales se disefiarfan las sondas de oligonucleotidesSe esrablecieron como criterios de seleccion los valores PAP mfnimos 65 y 50 deacuerdo con el contenido de secuencias conservadas en cad a ahnearmento eliminan-dose de cad a uno 105 genes que produjeran PAP inferiores a estes valores En el casode las celulasas se usaron parametres mas flexibles (apropiados para enzimas multi-dominie) y sus dominies funcionales se alinearon independienternenre Para losalineamientos de genes de las categorfas Solventogenesis 13-Propanodiol y Factorde esporulacion SpaDA se usaron las penalidades de aperture y extension de gaps [15-666] establecidas por defecto en ClustalW y apropiadas para genes conservados encoda su extension a craves de diversas especies En los alineamientos definitivos de ceu-lasas fue necesario flexibilizar dichas penalidades de forma que se pudieran alinear fa-cilmente los dominios conservados en cada familia enzirnatica En estes casos se utilize-ron las penalidades de apertura y extension [11- 1J correspondienres a las penalidadespar defecto usadas en algunas aplicaciones de BLAST (Altschul et aI 1997) De estaforma los alineamienros definitivos fueron construidos con tres combinaciones de pa-metros 65 - [15- 666J 50 - [15- 666J Y 50 - [11-1] (PAP - [apertura- extension degaps]) Con el uso de dichas combinaciones de parametres se obruvieron en rota I 56alineamientos definitivos para las cuatra categorias de MULTI-CLOST EI numero dealineamientos obtenidos en cada categorfa can las diferenres combinaciones de para-metros se muestra en la Tabla 4

Celulasas

alineamientos

97 cmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotFFacto~dde~~ii6spoioiA~-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotrmiddotmiddotmiddotmiddotmiddot~middot8 1

110

3

Tabla 4 Alineamienros Inulriples agrupados par las caregor(as de la base de daros MULTI-CLOST ypar los criterios de alincamienro

66 Articulo - Diseno de oligonucleotidos para el estudia de genes celuloitticos y solventoginicos en cepasde Clostridium sp (Clostridiaceae) MOlltoya et al

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

1060 1080TIT T

T~GC AAaAAaTa AATAC AC ag aGa

6661068

639675651

c

1100 1120

I_ A

A A

II I~A AA A -

T

T CA 718GGB 1120

c CT 6912C T 727

703TGG

GGT GAaAGAGCaATAAGACATGC AT GAaGT GC

Figura 4 Ahneamienro multiple para el factor de esporulacion SpoOA de cinco especies de Clostridiumusando un PAP minima de 65 y penalidades 15- 666 (apertura extension de gaps) La ultima lineamuescra la secuencia consenso donde las letras en mayuscula indican posiciones compleramenreconservadas y las leer-asen rninuscula indican posiciones conservadas en cuacro de las cinco secuen-cias Los bloque en negro indican regiones identicas miencras que los bloques en diferentes ronos degris muestran regiones parcialrnente conservadas

Dada la dificultad inhereme al alineamiento de genes provenienres de especies tandiversas como las analizadas el 77 de los alineamienros definicivos contiene dos acuatro genes y el 18 contiene cinco 0 seis genes En la Figura 4 a manera de ejemplose observa el alineamienro multiple de genes correspondiences a facto res de esporu-lacion SpaDA penenecienres a varias especies de closrridios

DISENO DE LAS SONDAS DE OLiGONUCLE6TIDOS

La estrategia de diserio de oligonucleocidos en esre trabajo esca enfocada a la obtencionde sondas que permitan ioenrificar cad a gen de inreres en cualquiera de las especies quecomponen los alinearnientos as como en las cepas colombianas de Clostridium sp Lalongirud minima de las sondas se establecio a partir de los resultados de busquedas enGenBank con sondas de longitud creciente disenadas para un gen Endoglucanasausando BLASTN Se encontro que con sondas de longitud inferior a 19 nucleotidos re-sulta imposible distinguir los resultados especfficos de los inespecificos a partir de losvalores de referencia Score y Valor E (Tabla 6 Altschul et al 1997) Dicha longitud seencuenrra en el rango de valores reportados para euroI diseno de sondas de oligonucleo-tidos para microarreglos (Guckenberger et al 2002 Lee et ai 2004) En total se obtu-vieron 94 sondas de oligonucleotidos algunas de las cuales se enlistan en la tabla 5 ycuyos resultados en la busqueda can BLASTN con Valor E inferior a 005 correspon-dieron en cada caso a las enzimas para las cuaes fueron diseriadas (Ia lista completa desondas esta disponible como material suplementario en http)jwwwibununaleducoIineasbioprocesosindexhtm) En promedio con cada sanda se pueden reconocer tresgenes espedficos para la enzima objetivo en GenBank tras las busquedas correspon~dienres con BLASTN 10cual sugiere que existe una buena probabilidad de reconocer losgenes hom610gos en las cepas promisorias de Clostridium Los resultados de las busque-das can RPS-BLAST indican que las sondas diseriadas para las rutas de acidogenesissolventogenesis y producci6n de 13-PD reconocen siempre el mismo dominio en cadagen miencras que en el caso de las celulasas cada sonda puede identiFicar varias enzi-

Acta bioi Colomb Vol 12 S 2007 67

mas de diversa funcion que poseen el mismo dominio funcional (considerando el ca-racter multidominio de las celulasas)

Oligo CAGCTTGAATTCTATCAGTG Oligo CAGCTTGAATTCTATCAGTro-gtucE2ti-de6t~aos Lo~i~td-9~ude6daas

Resuitildomiddot middot j ~~~~~J~~aio(middotEmiddotT-Res~middotltmiddotadomiddot middotmiddotmiddotmiddotl~~~E~I~~ viiarIc~i~i~~~d~Ci~~tidi~ 40 0009 Celulasa de Clostridium 38 gQ~~~)c~l~i~s~d~CI~~tidi~ ~middotmiddotmiddotmiddotmiddot40middotmiddotmiddotmiddotmiddotmiddotmiddot 0ori9middotrmiddotc~imiddot~i~smiddot~middotmiddotmiddotdmiddot~middotmiddotd~~middottidi~middotmiddotmiddotmiddotL 38 ~ 0034Ceimiddot~iilsmiddotamiddotmiddotddostldiu ~~~ 0009 c~i~f~middotsmiddotamiddotmiddotmiddot~fmiddotmiddotdo~middottjdjumiddot jiF _~deg034~

~~~~~~gg~~~~~t~~~~~ middot~middotmiddot~middot~middotmiddotl~~~~~t~ggmiddot~~~~t~~~~~~ 01

3 013

middotmiddotbFjAnmiddottmiddotemiddotrg~nlcoJeAmiddotthmiddot~middotif~middot~middot~ middotmiddotmiddotmiddotj6 613 bijAintmiddotemiddotrg~nmiddotcomiddotmiddotmiddotdeAmiddotmiddotmiddottiiamiddot~~n~middotimiddot middotmiddot 36middot 0136NAmiddot middotmiddot h middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot ~middotmiddot 34 6Ki i 6NAmiddotmiddotmiddotimiddotn[middotmiddotrg~nmiddotcamiddotmiddothumiddotmamiddotnomiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot_middot34middot _1053p~tmiddot~middotmiddot~~~d~~D~~~middotnmiddotmiddotjmiddot~middot~i) 34 652 middotp~middot~tmiddot~middoti~middot~middotmiddotdmiddotemiddotmiddot~middotnmiddoti6middotnmiddotmiddotdmiddot~middotr~[middota ~ 34 _ ~ 053

Fa(tormiddotmiddotamiddotnea FmiddotancanTh~mailo 34 bull 652~~~~p~~lt~~Jimiddot~pi~~~Ti~~~j4 652 i

Oligo CAGCTTGAATTCTATCAG Oligo CAGClTGAATTCTATCAlongimiddottudmiddotfS nmiddot-ietmiddottidoSmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot j middotLorigrcumiddotamiddotmiddotfjnumiddotde6ddosmiddotmiddotmiddotmiddotResljitild) middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~~~t~j~vilior-EResljitildo ~~~~~~ middotmiddotmiddotmiddotva-iarEC~(~i~s~dea~tdj~~ 36 r 0131 C~i~i~~adea~id~~~ 34 T 053c~i~i~s~dmiddotCiostdj~~middotmiddotmiddot 36 ojj Celulasa de Clostridi~middot~middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotbullmiddotmiddot 34 OS3iCelulasa de Clostridium -t- j6~ l middotbT3gtmiddotmiddotmiddotmiddotCeT~iilsmiddotamiddotdeClo5idiui bullj4 3 - 1bNAliltmiddot~rg~ilmiddotic~middotmiddotmiddothumiddotmamiddotn~ 36 6130 DNA intergenico humane 34 053

~ ~DmiddotNAmiddotmiddotlntmiddoterg~nmiddoticomiddotmiddotmiddothumiddotmamiddotno ~ middotmiddotmiddotmiddotmiddot3Kmiddot 6-j- i middotmiddotbmiddotNAmiddot~middotntemiddotrg~nmiddot~omiddothmiddot~middotmamiddotmiddotomiddot 34 053 ~ ~ bNAjnterglfi1Tco--aeif thaioi) 34 653 (lYNAlnterglfricoaeAihaioiio1 34 middot6middot5~rmiddotmiddot

bmiddotNAmiddotlntmiddotemiddotrg~nTcohtimanomiddot middotmiddotmiddotmiddotmiddotj4 J 653middotmiddotmiddotbmiddotNAlrlmiddotcmiddoterg~nicohumane 34 deg 53~PmiddotrmiddotocmiddotmiddotfnmiddotimiddotmiddotdmiddotmiddotmiddotumiddotrmiddottSilmiddotmiddotdmiddotracmiddotamiddotmiddot r middotmiddotmiddotmiddotmiddotmiddot34 sectsect~middotmiddotrmiddot~~middot~tmiddot~t~~~~~6E~middotmiddot~~~~~~__1 34middot QI~-

Tabla 6 Resultados de la busqueda can oligonucleotides de longirud crecienre para EndoglucanasaGH48 en GenBank usando BLASTN 228 Los resultados rorulados como Celulasa de Clostridiumcorresponden a registros de endoglucanasas (resultados especfficos) mientras que las cifras marca-das con un asterisco () corresponden al mayor puntaje y el menor Valor E obtenidos en cadabusqueda Se observa que con los oligos de 17 y 18 nucle6tidos se obtiene el mayor puncaje y elmenor Valor E tanto para los resulcados espedficos como para algunos inespedficos Por ello seestableci6 como norma para el disefio de sondas una longitud minima de 19 nucle6tidos Nota Lasmagnitudes del mayor Puntaje y el menor Valor E no son comparables entre los cuatro oligos ya queestas depend en directa e inversameme de la longicud de la secuencia de busqueda en BLASTN

Las sondas disenadas se encuentran distribuidas de la siguiente forma 25 corres-ponden a la caregorfa Solventogenesis 48 a la categorfa Celulasas (con sondaspara varias familias de dominios funcionales en cad a tipo de enzima) 19 a lt 13-Pro-panodiol y dos aJ factor SpoOA Los valores caracterfsticos promedio de las sondasdisefiadas fueron los siguientes longitud de 24 nucleotidos Tm termodinamica de658 degC contenido de (G+C) de 390 Tm de la horquilla mas estable (cuandoexiste) de 104 degC y 6G de uni6n al objetivo de -374 kCal(Mol De esta forma se(oncluye que todas las sondas disenadas pueden ser usadas para la construccion deun microarreglo hibridizado a 42degC (Cronin et a 2001) 0 bien para un ensayo deSouthern Blot realizado en condiciones similares (Harris et 01 2002) Se disenaronademas sondas para control positive negative y de purificacion de rRNA utilizandolos mismos criterios descritos anteriormente la sonda de control positivo 5-

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 8: Oligonucleotide Probe Design for the Study of Cellulolytic

62 Articulo - Oisetlo de oligol1l1c1e6tidos para el estudia de genes cetutoteicos y solventogenicos en ccpasde Clostridium sp (Clostriditlceae) Montoya er al

los genes con secuencia menos conservada hasra alcanzar un valor alineamientoC1ustaIW16 (peso de 1 para las concordancias y 0 en los demas casas Aiyar 2000) ylos valores de penalizacion Pv aperture y extension de gaps 15 y 666 superior a 65 enel promedio del Puntaje de Alineamientos Pareados (PAP) calculado por C1ustalWentre rod os los genes de cada alineamiento (este valor minimo se redujo a 50 en las fa-milias enziroaricas can alta variabilidad de secuencia como es el caso de las celulasasmultidominio) Los alineamientos multiples definitivos fueron construidos con los ge-nes restar-res utilizando los valores de penalizacion 15 y 666 para aperture y extensionde gaps (11 y 1 para las families enzimacicas can alta variabilidad de secuencia )

GHEnzimas incluidas en la base de datos

1 Celotasas [exo- y endoglucanasas2 Mananasas3 xrtanasas4 Prorerna andamtoS Proretnas adapradoras6 croretoas de anctaje7 Proieroas de (a capa S

Cetulosa

Pared (eubr

Microorganismo celulolioco

Figura 3 Componentes esrructurales y cacalrricos del celulosoma unidos a una celuia del microor-ganismo que 10 produce y al sustrato celul6sico simuheneamenre Dominies funcionales SLHhomologia con la capa S CH I Y CH II Cohesin I y II DK I Y DK IJ Dockerin I y II CBM modulo deunion a celulosa GH Glicosil hidrolasa

DISENO DE LAS SONDAS DE OliGONUCLEOTIDOS

A partir de los alineamientos detinitivos se exrrajeron secuencias con longirud minimade 19 nucleotidos conservadas en mas del 50 de los genes de cada alineamienroutilizando para ello el editor de alineamienros GeneDoc 26002 (Nicholas y Nicholas2001) La longitud minima requerida para las sondas fue establecida a partir de losresultados arrojados par BLASTN para sondas de 17 a 20 nucle6tidos dirigidas a unmismo gen de Endoglucanasa (Tabla 6) Para aumencar la probabilidad de que losoligonucleocidos diseriados puedan reconocer sus genes objerivo en las cepas prorni-sorias de Clostridium sp se seleccionaron siempre regiones conservadas en al menosuna especie de los ordeoes Clostridiales 0 Bacillales Las propiedades termodinamicasde las sondas disefiadas fueron calculadas con GeneRunner v305 (Hastings SoftwareNY) y se aceptaron solo aquellas cuya Tm segun la formula termodinamica de San-taLucia (1998) estuviera en el rango de 44 a 90 degC y que no formaran estructurassecundarias con Tm superior a 37 0c Esros criterios se establecieron considerando lastemperaturas de desnaturaizaci6n e hibridacion recomendadas usualmente para mi~croarreglos (42 ( Y95 ( respectivamenre Hedge et aI 2000 Schuchhardt et aI 2000Tomas et aI 2003 Tummala et al 2003 Rybicki 2005) Para comprobar la sensi-bilidad y especificidad de los oligonucleotidos diseiiados est os fueron sometidos abusquedas en GenBank 1410 (Benson et al 2007) usando la aplicacion BLAsTN228 (Altschul et aI 1997) se seleccionaron aquellos oligonucleotidos para los

Acta bioi Colomb Vol 12 S 2007 63

cuales rodos los regisrros reportados por BLASTN con Valor E (Expected Value) inferior aOOS correspondieran a genes can funcion equivalence a los genes del alineamientooriginal (los resultados de BLASTN son mas significativos cuando su valor E es menorpero el valor E tiende a ser conservative cuando la secuencia de busqueda es muy cottade manera que para secuencias de longitud menor a 40 nucleotidos los resultados convalor E lt 005 se pueden considerar especfficos Altschul et 01 1997) Por ultimo seestableciola ubicacion de cada sonda de ohgonuclectidos en sus genes objetivo usandoel programa Artemis vS (Rutherford et at 2000) y se determine el dominic funcionalcorrespondienre a cad a una por medic de busquedas de las prorefnas codificadas porlos genes objetivo en la base de daros CDD vl65 (Conserved Domain Database) usandoRPS~BLAST 226 (Reversed Position Specific BLAST Altschul et 01 1997)

A-~-id-og~~~i~y~~i~~t~i~~~~i(95 registros)

SU~~~~~~~f~Fosforransacen lasa

Aceraro kinasa

17

2

Butirato 16 II

Fosfotra nsbutiri lasa

Piruvaro

2

29

15

Aceroaceraro 26

17

4

Aldehrdo

Alcohol deshidrogenasade cadena carra

Bctwiiif~~~i~~j 1~3Ir~C~Od(n~~i~~Lbullbullbullbull3f t~Aceroacerilacil CoA 4 Celodexrrrn 2 Facrores de rranscripci6n SpoDAtransferase A (14 regisrros)~+

18

3

11

Arabinosidasas 7

transferasa B s Celobiosa fosforilasasProtefnas de la capa 5Prorernas adapradorasdel andarnioProrefnas de anclajedel celulosorna

232

SubcaregortaNo posee sobcaregona

5

Tabla 2 Numero de registros iocloidos en cada caregorta y subcategorfa de la base de datos MULTImiddotCLOST

RESULTADOS

CONSTRUCCl6N DE LA BASE DE DATOS MULTI-CLOST

La base de datos construida en Microsoft Access XP fue registrada bajo el nornbreMULTI-CLOST ante la Direcci6n Nacional de Derecho de Autor de Colombia (Libra13 Torno 17 Partida 142 del 20 de noviernbre de 2006 disponible en

64 Arrtculo Diseriode oligonucleotidos para el estudio de genes celuolftiws y solventogeniws en cepasde Clostridium sp (Clostridiaceae) Montoya et al

httpWIfNibununaleducolineasbioprocesosindexhtm) Esta base de datos con-riene registros de 485 genes que codifican para las enzimas y prorefnas estructuralesinvolucradas en la acidogenesis solvemogenesis degradaci6n de celulosa y producci6nde 13-PD en 55 especies bacrerianas y fungicas permitiendo recuperar las secuenciasde dichos genes y protein as en las bases de datos GenBank (Benson et al 2007) yUniProt (Bairoch et al 2005) De estos registros 95 corresponden a la caregorfa Solven-rogenesis 94 a la categorfa 1 3-Propanodiol 14 a la categona Factor de esporulaci6nSpoDA y 282 a la caregorta Celulasas la mas numerosa considerando la subdivisionadiciona per farnilias de dominios funcionales

i-S-ubc~tego~raFosfoi~ansacetE3-sa

No6rgaiiTsoClo~tidi~~ih~~~~ii~

i Acetat~middotmiddotki~middotasmiddotamiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot B~~i1i~-~biijismiddotBumiddottlmiddot~atmiddotomiddotmiddotkrnamiddotsamiddotmiddotmiddotmiddotmiddotmiddotmiddotFmiddotomiddot~fomiddottmiddot~amiddotnmiddotsb~middotti~iasamiddot

bilk

AF041S4i

Z99119middotmiddotmiddotmiddotmiddotAY46jmiddot1middot03 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddoti

AE007804M15393

AY251646

- clostidi~--beJemiddot~ckii----ciostid~-~cmiddot~tob~ampIi~~middot CAC30i6-

--P~~~at-od~~~amiddot~bmiddoto~i-iasamiddot middotio~~~~~middotomiddotbij~middotmiddot pd~ A~~tmiddotoa~etmiddotat~middotd~~~middotamiddot~middotbo~TIsmiddotaIc s~~~~i~~pi~~~~~i~~~~~~~~~I adcmiddotmiddotAldmiddotemiddothi~joai~ohofmiddot deshidrogenasa idium tetanimiddotB-~-t~-~~imiddotdmiddot~~hmiddotdgemiddot~middot~amiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotCmiddot C

rmiddotA~-~t~~middot~-~middottmiddotii-~i-imiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~CoA transferasa AA~~to~~~df~iiS~~~~~~~~~~~8 BH2258 AP001514I~_I_~~~_~_~s_~s celK F039030 Endoglucanasas creajecorina _ __ __~ eg~ Y1l1l3middotMamiddot~~middot~middotas~~ 1 middot 7c~~sp mane middotmiddotmiddotmiddotgt(9752middot0middotmiddotmiddotmiddotimiddotximiddotimiddot~asamiddotmiddotmiddotmiddot Ruminococcus abus _ Z~~ AB057589r p~-~~f~middot~middotmiddot~middotdmiddot~middot~middotimiddot~Ruminococcus flaveiJ~i~~ middotmiddotmiddotmiddotmiddotmiddotmiddotmiddott scaA j27i3969

~glucanasas Clostridium thermocellum licB X63355 ~ middotmiddotmiddot~gimiddot~~~~~middot~~-~~_ CIstridiu~ ~-~iipmiddot~~ i abgA L49336 -j

Xilosidasas j ~i~~~~i~0middott~~o~~--middot 1 middotbTBmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAmiddotmiddotJmiddotSmiddotOmiddotS4middotmiddotO5 j

rA-~binomiddot~idmiddotmiddot~~middot~ Bacteroidesmiddotmiddotih~t~jt~li~~ L BT1781 ~~~~~ middot~~middot~i~~~d-middotmiddot~~~-pamiddot smiddot middot~jo~~middot(h~~~~L~1 ~~ middotmiddot1 ~~~~~~

rmiddotGiice~~imiddotdesimiddotimiddotdmiddott~middotsmiddot~ K~b~i~middotii~p~emiddot~middot~j~ middotmiddotmiddotmiddotmiddot1 dh~j32middot U60992 ~middotl-j-pmiddot~~-p~middot~~dmiddot~imiddot - ~ deshidrogenasa Clostridium pasteurianum dhaT AF006034 R dii ~ dhaR U09771i middotGmiddotilmiddot~middotemiddot~of~jemiddotshdrogmiddotemiddotnmiddotasmiddotamiddot Cistjd~middotmiddotb~amp~~m middotmiddotmiddotmiddotmiddotmiddotmiddotdh~i5i AY1j~f5s1

middotomiddot~Imiddotamiddotce[omiddot~middotamiddotkimiddotnmiddotasa middotmiddot--middotmiddotmiddotimiddotmiddot ~~g~~~ ~~~~~~~ Sacch~romycescer~~j~i~~ gpp2 050469

-t-

CTC02182 AE015943

CPE1256 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAPOOjmiddotmiddots9middot

CAP0163 AE001438

F~-~-t~middot~middotmiddotd~middotmiddott~middot~middot~cmiddotipmiddot~-i6middot~middotmiddotmiddot SpaDA i E~~~~~~~~~~ 1 spoOA 1 U43514

Tabla 3 Secuencias represemativas de cada subcategorfa de MULTI-CLOST can su numero de accemiddotso a GenBank

Las especies mayoritarias de la categoria Celulasas son C acetoblJoliclJm y C thermocellumlas cuales representan el 25 de dicha categor(a mientras que en Solventogenesis el

Acta bioi Colomb Vol 1252007 65

mayor porcenraje (36) corresponde a las especies C acetobutylicum y Bacillus subtiiis Parsu parte la categorfa 13-Propanodiol contiene el 25 de secuencias de las especiesClostridium butyricum Clostridium petfringens y Citrobacter freundii En la Tabla 2 se muestrala cantidad de registros que fueron agregados a la base de datos para cad a subcategorfamientras que en la Tabla 3 se enlistan los numeros de acceso en GenBank para secuen-cias representativas de cada subcategorfa almacenadas en MULTI-CLOST Los numerosde acceso de GenBank y UniProt contenidos en cada regisrro perrniten recuperar la se-cuencia genetica e informacion de conglomerados a partir de GenBank asr como lasecuencia proteica e informacion biologica a partir de UniProt Todas las enzimas inclui-das en cada categorfa fueron utifizadas para realizar los alineamientos multiples

CONSTRUCCI6N DE ALJNEAMIENTOS MULTIPLES CON ALTA CONSERVACION DE SECUENCIAS

Las secuencias de los genes almacenados en MULTI-CLOST fueron usadas para crearlos alineamientos a partir de los cuales se disefiarfan las sondas de oligonucleotidesSe esrablecieron como criterios de seleccion los valores PAP mfnimos 65 y 50 deacuerdo con el contenido de secuencias conservadas en cad a ahnearmento eliminan-dose de cad a uno 105 genes que produjeran PAP inferiores a estes valores En el casode las celulasas se usaron parametres mas flexibles (apropiados para enzimas multi-dominie) y sus dominies funcionales se alinearon independienternenre Para losalineamientos de genes de las categorfas Solventogenesis 13-Propanodiol y Factorde esporulacion SpaDA se usaron las penalidades de aperture y extension de gaps [15-666] establecidas por defecto en ClustalW y apropiadas para genes conservados encoda su extension a craves de diversas especies En los alineamientos definitivos de ceu-lasas fue necesario flexibilizar dichas penalidades de forma que se pudieran alinear fa-cilmente los dominios conservados en cada familia enzirnatica En estes casos se utilize-ron las penalidades de apertura y extension [11- 1J correspondienres a las penalidadespar defecto usadas en algunas aplicaciones de BLAST (Altschul et aI 1997) De estaforma los alineamienros definitivos fueron construidos con tres combinaciones de pa-metros 65 - [15- 666J 50 - [15- 666J Y 50 - [11-1] (PAP - [apertura- extension degaps]) Con el uso de dichas combinaciones de parametres se obruvieron en rota I 56alineamientos definitivos para las cuatra categorias de MULTI-CLOST EI numero dealineamientos obtenidos en cada categorfa can las diferenres combinaciones de para-metros se muestra en la Tabla 4

Celulasas

alineamientos

97 cmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotFFacto~dde~~ii6spoioiA~-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotrmiddotmiddotmiddotmiddotmiddot~middot8 1

110

3

Tabla 4 Alineamienros Inulriples agrupados par las caregor(as de la base de daros MULTI-CLOST ypar los criterios de alincamienro

66 Articulo - Diseno de oligonucleotidos para el estudia de genes celuloitticos y solventoginicos en cepasde Clostridium sp (Clostridiaceae) MOlltoya et al

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

1060 1080TIT T

T~GC AAaAAaTa AATAC AC ag aGa

6661068

639675651

c

1100 1120

I_ A

A A

II I~A AA A -

T

T CA 718GGB 1120

c CT 6912C T 727

703TGG

GGT GAaAGAGCaATAAGACATGC AT GAaGT GC

Figura 4 Ahneamienro multiple para el factor de esporulacion SpoOA de cinco especies de Clostridiumusando un PAP minima de 65 y penalidades 15- 666 (apertura extension de gaps) La ultima lineamuescra la secuencia consenso donde las letras en mayuscula indican posiciones compleramenreconservadas y las leer-asen rninuscula indican posiciones conservadas en cuacro de las cinco secuen-cias Los bloque en negro indican regiones identicas miencras que los bloques en diferentes ronos degris muestran regiones parcialrnente conservadas

Dada la dificultad inhereme al alineamiento de genes provenienres de especies tandiversas como las analizadas el 77 de los alineamienros definicivos contiene dos acuatro genes y el 18 contiene cinco 0 seis genes En la Figura 4 a manera de ejemplose observa el alineamienro multiple de genes correspondiences a facto res de esporu-lacion SpaDA penenecienres a varias especies de closrridios

DISENO DE LAS SONDAS DE OLiGONUCLE6TIDOS

La estrategia de diserio de oligonucleocidos en esre trabajo esca enfocada a la obtencionde sondas que permitan ioenrificar cad a gen de inreres en cualquiera de las especies quecomponen los alinearnientos as como en las cepas colombianas de Clostridium sp Lalongirud minima de las sondas se establecio a partir de los resultados de busquedas enGenBank con sondas de longitud creciente disenadas para un gen Endoglucanasausando BLASTN Se encontro que con sondas de longitud inferior a 19 nucleotidos re-sulta imposible distinguir los resultados especfficos de los inespecificos a partir de losvalores de referencia Score y Valor E (Tabla 6 Altschul et al 1997) Dicha longitud seencuenrra en el rango de valores reportados para euroI diseno de sondas de oligonucleo-tidos para microarreglos (Guckenberger et al 2002 Lee et ai 2004) En total se obtu-vieron 94 sondas de oligonucleotidos algunas de las cuales se enlistan en la tabla 5 ycuyos resultados en la busqueda can BLASTN con Valor E inferior a 005 correspon-dieron en cada caso a las enzimas para las cuaes fueron diseriadas (Ia lista completa desondas esta disponible como material suplementario en http)jwwwibununaleducoIineasbioprocesosindexhtm) En promedio con cada sanda se pueden reconocer tresgenes espedficos para la enzima objetivo en GenBank tras las busquedas correspon~dienres con BLASTN 10cual sugiere que existe una buena probabilidad de reconocer losgenes hom610gos en las cepas promisorias de Clostridium Los resultados de las busque-das can RPS-BLAST indican que las sondas diseriadas para las rutas de acidogenesissolventogenesis y producci6n de 13-PD reconocen siempre el mismo dominio en cadagen miencras que en el caso de las celulasas cada sonda puede identiFicar varias enzi-

Acta bioi Colomb Vol 12 S 2007 67

mas de diversa funcion que poseen el mismo dominio funcional (considerando el ca-racter multidominio de las celulasas)

Oligo CAGCTTGAATTCTATCAGTG Oligo CAGCTTGAATTCTATCAGTro-gtucE2ti-de6t~aos Lo~i~td-9~ude6daas

Resuitildomiddot middot j ~~~~~J~~aio(middotEmiddotT-Res~middotltmiddotadomiddot middotmiddotmiddotmiddotl~~~E~I~~ viiarIc~i~i~~~d~Ci~~tidi~ 40 0009 Celulasa de Clostridium 38 gQ~~~)c~l~i~s~d~CI~~tidi~ ~middotmiddotmiddotmiddotmiddot40middotmiddotmiddotmiddotmiddotmiddotmiddot 0ori9middotrmiddotc~imiddot~i~smiddot~middotmiddotmiddotdmiddot~middotmiddotd~~middottidi~middotmiddotmiddotmiddotL 38 ~ 0034Ceimiddot~iilsmiddotamiddotmiddotddostldiu ~~~ 0009 c~i~f~middotsmiddotamiddotmiddotmiddot~fmiddotmiddotdo~middottjdjumiddot jiF _~deg034~

~~~~~~gg~~~~~t~~~~~ middot~middotmiddot~middot~middotmiddotl~~~~~t~ggmiddot~~~~t~~~~~~ 01

3 013

middotmiddotbFjAnmiddottmiddotemiddotrg~nlcoJeAmiddotthmiddot~middotif~middot~middot~ middotmiddotmiddotmiddotj6 613 bijAintmiddotemiddotrg~nmiddotcomiddotmiddotmiddotdeAmiddotmiddotmiddottiiamiddot~~n~middotimiddot middotmiddot 36middot 0136NAmiddot middotmiddot h middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot ~middotmiddot 34 6Ki i 6NAmiddotmiddotmiddotimiddotn[middotmiddotrg~nmiddotcamiddotmiddothumiddotmamiddotnomiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot_middot34middot _1053p~tmiddot~middotmiddot~~~d~~D~~~middotnmiddotmiddotjmiddot~middot~i) 34 652 middotp~middot~tmiddot~middoti~middot~middotmiddotdmiddotemiddotmiddot~middotnmiddoti6middotnmiddotmiddotdmiddot~middotr~[middota ~ 34 _ ~ 053

Fa(tormiddotmiddotamiddotnea FmiddotancanTh~mailo 34 bull 652~~~~p~~lt~~Jimiddot~pi~~~Ti~~~j4 652 i

Oligo CAGCTTGAATTCTATCAG Oligo CAGClTGAATTCTATCAlongimiddottudmiddotfS nmiddot-ietmiddottidoSmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot j middotLorigrcumiddotamiddotmiddotfjnumiddotde6ddosmiddotmiddotmiddotmiddotResljitild) middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~~~t~j~vilior-EResljitildo ~~~~~~ middotmiddotmiddotmiddotva-iarEC~(~i~s~dea~tdj~~ 36 r 0131 C~i~i~~adea~id~~~ 34 T 053c~i~i~s~dmiddotCiostdj~~middotmiddotmiddot 36 ojj Celulasa de Clostridi~middot~middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotbullmiddotmiddot 34 OS3iCelulasa de Clostridium -t- j6~ l middotbT3gtmiddotmiddotmiddotmiddotCeT~iilsmiddotamiddotdeClo5idiui bullj4 3 - 1bNAliltmiddot~rg~ilmiddotic~middotmiddotmiddothumiddotmamiddotn~ 36 6130 DNA intergenico humane 34 053

~ ~DmiddotNAmiddotmiddotlntmiddoterg~nmiddoticomiddotmiddotmiddothumiddotmamiddotno ~ middotmiddotmiddotmiddotmiddot3Kmiddot 6-j- i middotmiddotbmiddotNAmiddot~middotntemiddotrg~nmiddot~omiddothmiddot~middotmamiddotmiddotomiddot 34 053 ~ ~ bNAjnterglfi1Tco--aeif thaioi) 34 653 (lYNAlnterglfricoaeAihaioiio1 34 middot6middot5~rmiddotmiddot

bmiddotNAmiddotlntmiddotemiddotrg~nTcohtimanomiddot middotmiddotmiddotmiddotmiddotj4 J 653middotmiddotmiddotbmiddotNAlrlmiddotcmiddoterg~nicohumane 34 deg 53~PmiddotrmiddotocmiddotmiddotfnmiddotimiddotmiddotdmiddotmiddotmiddotumiddotrmiddottSilmiddotmiddotdmiddotracmiddotamiddotmiddot r middotmiddotmiddotmiddotmiddotmiddot34 sectsect~middotmiddotrmiddot~~middot~tmiddot~t~~~~~6E~middotmiddot~~~~~~__1 34middot QI~-

Tabla 6 Resultados de la busqueda can oligonucleotides de longirud crecienre para EndoglucanasaGH48 en GenBank usando BLASTN 228 Los resultados rorulados como Celulasa de Clostridiumcorresponden a registros de endoglucanasas (resultados especfficos) mientras que las cifras marca-das con un asterisco () corresponden al mayor puntaje y el menor Valor E obtenidos en cadabusqueda Se observa que con los oligos de 17 y 18 nucle6tidos se obtiene el mayor puncaje y elmenor Valor E tanto para los resulcados espedficos como para algunos inespedficos Por ello seestableci6 como norma para el disefio de sondas una longitud minima de 19 nucle6tidos Nota Lasmagnitudes del mayor Puntaje y el menor Valor E no son comparables entre los cuatro oligos ya queestas depend en directa e inversameme de la longicud de la secuencia de busqueda en BLASTN

Las sondas disenadas se encuentran distribuidas de la siguiente forma 25 corres-ponden a la caregorfa Solventogenesis 48 a la categorfa Celulasas (con sondaspara varias familias de dominios funcionales en cad a tipo de enzima) 19 a lt 13-Pro-panodiol y dos aJ factor SpoOA Los valores caracterfsticos promedio de las sondasdisefiadas fueron los siguientes longitud de 24 nucleotidos Tm termodinamica de658 degC contenido de (G+C) de 390 Tm de la horquilla mas estable (cuandoexiste) de 104 degC y 6G de uni6n al objetivo de -374 kCal(Mol De esta forma se(oncluye que todas las sondas disenadas pueden ser usadas para la construccion deun microarreglo hibridizado a 42degC (Cronin et a 2001) 0 bien para un ensayo deSouthern Blot realizado en condiciones similares (Harris et 01 2002) Se disenaronademas sondas para control positive negative y de purificacion de rRNA utilizandolos mismos criterios descritos anteriormente la sonda de control positivo 5-

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 9: Oligonucleotide Probe Design for the Study of Cellulolytic

Acta bioi Colomb Vol 12 S 2007 63

cuales rodos los regisrros reportados por BLASTN con Valor E (Expected Value) inferior aOOS correspondieran a genes can funcion equivalence a los genes del alineamientooriginal (los resultados de BLASTN son mas significativos cuando su valor E es menorpero el valor E tiende a ser conservative cuando la secuencia de busqueda es muy cottade manera que para secuencias de longitud menor a 40 nucleotidos los resultados convalor E lt 005 se pueden considerar especfficos Altschul et 01 1997) Por ultimo seestableciola ubicacion de cada sonda de ohgonuclectidos en sus genes objetivo usandoel programa Artemis vS (Rutherford et at 2000) y se determine el dominic funcionalcorrespondienre a cad a una por medic de busquedas de las prorefnas codificadas porlos genes objetivo en la base de daros CDD vl65 (Conserved Domain Database) usandoRPS~BLAST 226 (Reversed Position Specific BLAST Altschul et 01 1997)

A-~-id-og~~~i~y~~i~~t~i~~~~i(95 registros)

SU~~~~~~~f~Fosforransacen lasa

Aceraro kinasa

17

2

Butirato 16 II

Fosfotra nsbutiri lasa

Piruvaro

2

29

15

Aceroaceraro 26

17

4

Aldehrdo

Alcohol deshidrogenasade cadena carra

Bctwiiif~~~i~~j 1~3Ir~C~Od(n~~i~~Lbullbullbullbull3f t~Aceroacerilacil CoA 4 Celodexrrrn 2 Facrores de rranscripci6n SpoDAtransferase A (14 regisrros)~+

18

3

11

Arabinosidasas 7

transferasa B s Celobiosa fosforilasasProtefnas de la capa 5Prorernas adapradorasdel andarnioProrefnas de anclajedel celulosorna

232

SubcaregortaNo posee sobcaregona

5

Tabla 2 Numero de registros iocloidos en cada caregorta y subcategorfa de la base de datos MULTImiddotCLOST

RESULTADOS

CONSTRUCCl6N DE LA BASE DE DATOS MULTI-CLOST

La base de datos construida en Microsoft Access XP fue registrada bajo el nornbreMULTI-CLOST ante la Direcci6n Nacional de Derecho de Autor de Colombia (Libra13 Torno 17 Partida 142 del 20 de noviernbre de 2006 disponible en

64 Arrtculo Diseriode oligonucleotidos para el estudio de genes celuolftiws y solventogeniws en cepasde Clostridium sp (Clostridiaceae) Montoya et al

httpWIfNibununaleducolineasbioprocesosindexhtm) Esta base de datos con-riene registros de 485 genes que codifican para las enzimas y prorefnas estructuralesinvolucradas en la acidogenesis solvemogenesis degradaci6n de celulosa y producci6nde 13-PD en 55 especies bacrerianas y fungicas permitiendo recuperar las secuenciasde dichos genes y protein as en las bases de datos GenBank (Benson et al 2007) yUniProt (Bairoch et al 2005) De estos registros 95 corresponden a la caregorfa Solven-rogenesis 94 a la categorfa 1 3-Propanodiol 14 a la categona Factor de esporulaci6nSpoDA y 282 a la caregorta Celulasas la mas numerosa considerando la subdivisionadiciona per farnilias de dominios funcionales

i-S-ubc~tego~raFosfoi~ansacetE3-sa

No6rgaiiTsoClo~tidi~~ih~~~~ii~

i Acetat~middotmiddotki~middotasmiddotamiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot B~~i1i~-~biijismiddotBumiddottlmiddot~atmiddotomiddotmiddotkrnamiddotsamiddotmiddotmiddotmiddotmiddotmiddotmiddotFmiddotomiddot~fomiddottmiddot~amiddotnmiddotsb~middotti~iasamiddot

bilk

AF041S4i

Z99119middotmiddotmiddotmiddotmiddotAY46jmiddot1middot03 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddoti

AE007804M15393

AY251646

- clostidi~--beJemiddot~ckii----ciostid~-~cmiddot~tob~ampIi~~middot CAC30i6-

--P~~~at-od~~~amiddot~bmiddoto~i-iasamiddot middotio~~~~~middotomiddotbij~middotmiddot pd~ A~~tmiddotoa~etmiddotat~middotd~~~middotamiddot~middotbo~TIsmiddotaIc s~~~~i~~pi~~~~~i~~~~~~~~~I adcmiddotmiddotAldmiddotemiddothi~joai~ohofmiddot deshidrogenasa idium tetanimiddotB-~-t~-~~imiddotdmiddot~~hmiddotdgemiddot~middot~amiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotCmiddot C

rmiddotA~-~t~~middot~-~middottmiddotii-~i-imiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~CoA transferasa AA~~to~~~df~iiS~~~~~~~~~~~8 BH2258 AP001514I~_I_~~~_~_~s_~s celK F039030 Endoglucanasas creajecorina _ __ __~ eg~ Y1l1l3middotMamiddot~~middot~middotas~~ 1 middot 7c~~sp mane middotmiddotmiddotmiddotgt(9752middot0middotmiddotmiddotmiddotimiddotximiddotimiddot~asamiddotmiddotmiddotmiddot Ruminococcus abus _ Z~~ AB057589r p~-~~f~middot~middotmiddot~middotdmiddot~middot~middotimiddot~Ruminococcus flaveiJ~i~~ middotmiddotmiddotmiddotmiddotmiddotmiddotmiddott scaA j27i3969

~glucanasas Clostridium thermocellum licB X63355 ~ middotmiddotmiddot~gimiddot~~~~~middot~~-~~_ CIstridiu~ ~-~iipmiddot~~ i abgA L49336 -j

Xilosidasas j ~i~~~~i~0middott~~o~~--middot 1 middotbTBmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAmiddotmiddotJmiddotSmiddotOmiddotS4middotmiddotO5 j

rA-~binomiddot~idmiddotmiddot~~middot~ Bacteroidesmiddotmiddotih~t~jt~li~~ L BT1781 ~~~~~ middot~~middot~i~~~d-middotmiddot~~~-pamiddot smiddot middot~jo~~middot(h~~~~L~1 ~~ middotmiddot1 ~~~~~~

rmiddotGiice~~imiddotdesimiddotimiddotdmiddott~middotsmiddot~ K~b~i~middotii~p~emiddot~middot~j~ middotmiddotmiddotmiddotmiddot1 dh~j32middot U60992 ~middotl-j-pmiddot~~-p~middot~~dmiddot~imiddot - ~ deshidrogenasa Clostridium pasteurianum dhaT AF006034 R dii ~ dhaR U09771i middotGmiddotilmiddot~middotemiddot~of~jemiddotshdrogmiddotemiddotnmiddotasmiddotamiddot Cistjd~middotmiddotb~amp~~m middotmiddotmiddotmiddotmiddotmiddotmiddotdh~i5i AY1j~f5s1

middotomiddot~Imiddotamiddotce[omiddot~middotamiddotkimiddotnmiddotasa middotmiddot--middotmiddotmiddotimiddotmiddot ~~g~~~ ~~~~~~~ Sacch~romycescer~~j~i~~ gpp2 050469

-t-

CTC02182 AE015943

CPE1256 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAPOOjmiddotmiddots9middot

CAP0163 AE001438

F~-~-t~middot~middotmiddotd~middotmiddott~middot~middot~cmiddotipmiddot~-i6middot~middotmiddotmiddot SpaDA i E~~~~~~~~~~ 1 spoOA 1 U43514

Tabla 3 Secuencias represemativas de cada subcategorfa de MULTI-CLOST can su numero de accemiddotso a GenBank

Las especies mayoritarias de la categoria Celulasas son C acetoblJoliclJm y C thermocellumlas cuales representan el 25 de dicha categor(a mientras que en Solventogenesis el

Acta bioi Colomb Vol 1252007 65

mayor porcenraje (36) corresponde a las especies C acetobutylicum y Bacillus subtiiis Parsu parte la categorfa 13-Propanodiol contiene el 25 de secuencias de las especiesClostridium butyricum Clostridium petfringens y Citrobacter freundii En la Tabla 2 se muestrala cantidad de registros que fueron agregados a la base de datos para cad a subcategorfamientras que en la Tabla 3 se enlistan los numeros de acceso en GenBank para secuen-cias representativas de cada subcategorfa almacenadas en MULTI-CLOST Los numerosde acceso de GenBank y UniProt contenidos en cada regisrro perrniten recuperar la se-cuencia genetica e informacion de conglomerados a partir de GenBank asr como lasecuencia proteica e informacion biologica a partir de UniProt Todas las enzimas inclui-das en cada categorfa fueron utifizadas para realizar los alineamientos multiples

CONSTRUCCI6N DE ALJNEAMIENTOS MULTIPLES CON ALTA CONSERVACION DE SECUENCIAS

Las secuencias de los genes almacenados en MULTI-CLOST fueron usadas para crearlos alineamientos a partir de los cuales se disefiarfan las sondas de oligonucleotidesSe esrablecieron como criterios de seleccion los valores PAP mfnimos 65 y 50 deacuerdo con el contenido de secuencias conservadas en cad a ahnearmento eliminan-dose de cad a uno 105 genes que produjeran PAP inferiores a estes valores En el casode las celulasas se usaron parametres mas flexibles (apropiados para enzimas multi-dominie) y sus dominies funcionales se alinearon independienternenre Para losalineamientos de genes de las categorfas Solventogenesis 13-Propanodiol y Factorde esporulacion SpaDA se usaron las penalidades de aperture y extension de gaps [15-666] establecidas por defecto en ClustalW y apropiadas para genes conservados encoda su extension a craves de diversas especies En los alineamientos definitivos de ceu-lasas fue necesario flexibilizar dichas penalidades de forma que se pudieran alinear fa-cilmente los dominios conservados en cada familia enzirnatica En estes casos se utilize-ron las penalidades de apertura y extension [11- 1J correspondienres a las penalidadespar defecto usadas en algunas aplicaciones de BLAST (Altschul et aI 1997) De estaforma los alineamienros definitivos fueron construidos con tres combinaciones de pa-metros 65 - [15- 666J 50 - [15- 666J Y 50 - [11-1] (PAP - [apertura- extension degaps]) Con el uso de dichas combinaciones de parametres se obruvieron en rota I 56alineamientos definitivos para las cuatra categorias de MULTI-CLOST EI numero dealineamientos obtenidos en cada categorfa can las diferenres combinaciones de para-metros se muestra en la Tabla 4

Celulasas

alineamientos

97 cmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotFFacto~dde~~ii6spoioiA~-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotrmiddotmiddotmiddotmiddotmiddot~middot8 1

110

3

Tabla 4 Alineamienros Inulriples agrupados par las caregor(as de la base de daros MULTI-CLOST ypar los criterios de alincamienro

66 Articulo - Diseno de oligonucleotidos para el estudia de genes celuloitticos y solventoginicos en cepasde Clostridium sp (Clostridiaceae) MOlltoya et al

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

1060 1080TIT T

T~GC AAaAAaTa AATAC AC ag aGa

6661068

639675651

c

1100 1120

I_ A

A A

II I~A AA A -

T

T CA 718GGB 1120

c CT 6912C T 727

703TGG

GGT GAaAGAGCaATAAGACATGC AT GAaGT GC

Figura 4 Ahneamienro multiple para el factor de esporulacion SpoOA de cinco especies de Clostridiumusando un PAP minima de 65 y penalidades 15- 666 (apertura extension de gaps) La ultima lineamuescra la secuencia consenso donde las letras en mayuscula indican posiciones compleramenreconservadas y las leer-asen rninuscula indican posiciones conservadas en cuacro de las cinco secuen-cias Los bloque en negro indican regiones identicas miencras que los bloques en diferentes ronos degris muestran regiones parcialrnente conservadas

Dada la dificultad inhereme al alineamiento de genes provenienres de especies tandiversas como las analizadas el 77 de los alineamienros definicivos contiene dos acuatro genes y el 18 contiene cinco 0 seis genes En la Figura 4 a manera de ejemplose observa el alineamienro multiple de genes correspondiences a facto res de esporu-lacion SpaDA penenecienres a varias especies de closrridios

DISENO DE LAS SONDAS DE OLiGONUCLE6TIDOS

La estrategia de diserio de oligonucleocidos en esre trabajo esca enfocada a la obtencionde sondas que permitan ioenrificar cad a gen de inreres en cualquiera de las especies quecomponen los alinearnientos as como en las cepas colombianas de Clostridium sp Lalongirud minima de las sondas se establecio a partir de los resultados de busquedas enGenBank con sondas de longitud creciente disenadas para un gen Endoglucanasausando BLASTN Se encontro que con sondas de longitud inferior a 19 nucleotidos re-sulta imposible distinguir los resultados especfficos de los inespecificos a partir de losvalores de referencia Score y Valor E (Tabla 6 Altschul et al 1997) Dicha longitud seencuenrra en el rango de valores reportados para euroI diseno de sondas de oligonucleo-tidos para microarreglos (Guckenberger et al 2002 Lee et ai 2004) En total se obtu-vieron 94 sondas de oligonucleotidos algunas de las cuales se enlistan en la tabla 5 ycuyos resultados en la busqueda can BLASTN con Valor E inferior a 005 correspon-dieron en cada caso a las enzimas para las cuaes fueron diseriadas (Ia lista completa desondas esta disponible como material suplementario en http)jwwwibununaleducoIineasbioprocesosindexhtm) En promedio con cada sanda se pueden reconocer tresgenes espedficos para la enzima objetivo en GenBank tras las busquedas correspon~dienres con BLASTN 10cual sugiere que existe una buena probabilidad de reconocer losgenes hom610gos en las cepas promisorias de Clostridium Los resultados de las busque-das can RPS-BLAST indican que las sondas diseriadas para las rutas de acidogenesissolventogenesis y producci6n de 13-PD reconocen siempre el mismo dominio en cadagen miencras que en el caso de las celulasas cada sonda puede identiFicar varias enzi-

Acta bioi Colomb Vol 12 S 2007 67

mas de diversa funcion que poseen el mismo dominio funcional (considerando el ca-racter multidominio de las celulasas)

Oligo CAGCTTGAATTCTATCAGTG Oligo CAGCTTGAATTCTATCAGTro-gtucE2ti-de6t~aos Lo~i~td-9~ude6daas

Resuitildomiddot middot j ~~~~~J~~aio(middotEmiddotT-Res~middotltmiddotadomiddot middotmiddotmiddotmiddotl~~~E~I~~ viiarIc~i~i~~~d~Ci~~tidi~ 40 0009 Celulasa de Clostridium 38 gQ~~~)c~l~i~s~d~CI~~tidi~ ~middotmiddotmiddotmiddotmiddot40middotmiddotmiddotmiddotmiddotmiddotmiddot 0ori9middotrmiddotc~imiddot~i~smiddot~middotmiddotmiddotdmiddot~middotmiddotd~~middottidi~middotmiddotmiddotmiddotL 38 ~ 0034Ceimiddot~iilsmiddotamiddotmiddotddostldiu ~~~ 0009 c~i~f~middotsmiddotamiddotmiddotmiddot~fmiddotmiddotdo~middottjdjumiddot jiF _~deg034~

~~~~~~gg~~~~~t~~~~~ middot~middotmiddot~middot~middotmiddotl~~~~~t~ggmiddot~~~~t~~~~~~ 01

3 013

middotmiddotbFjAnmiddottmiddotemiddotrg~nlcoJeAmiddotthmiddot~middotif~middot~middot~ middotmiddotmiddotmiddotj6 613 bijAintmiddotemiddotrg~nmiddotcomiddotmiddotmiddotdeAmiddotmiddotmiddottiiamiddot~~n~middotimiddot middotmiddot 36middot 0136NAmiddot middotmiddot h middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot ~middotmiddot 34 6Ki i 6NAmiddotmiddotmiddotimiddotn[middotmiddotrg~nmiddotcamiddotmiddothumiddotmamiddotnomiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot_middot34middot _1053p~tmiddot~middotmiddot~~~d~~D~~~middotnmiddotmiddotjmiddot~middot~i) 34 652 middotp~middot~tmiddot~middoti~middot~middotmiddotdmiddotemiddotmiddot~middotnmiddoti6middotnmiddotmiddotdmiddot~middotr~[middota ~ 34 _ ~ 053

Fa(tormiddotmiddotamiddotnea FmiddotancanTh~mailo 34 bull 652~~~~p~~lt~~Jimiddot~pi~~~Ti~~~j4 652 i

Oligo CAGCTTGAATTCTATCAG Oligo CAGClTGAATTCTATCAlongimiddottudmiddotfS nmiddot-ietmiddottidoSmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot j middotLorigrcumiddotamiddotmiddotfjnumiddotde6ddosmiddotmiddotmiddotmiddotResljitild) middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~~~t~j~vilior-EResljitildo ~~~~~~ middotmiddotmiddotmiddotva-iarEC~(~i~s~dea~tdj~~ 36 r 0131 C~i~i~~adea~id~~~ 34 T 053c~i~i~s~dmiddotCiostdj~~middotmiddotmiddot 36 ojj Celulasa de Clostridi~middot~middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotbullmiddotmiddot 34 OS3iCelulasa de Clostridium -t- j6~ l middotbT3gtmiddotmiddotmiddotmiddotCeT~iilsmiddotamiddotdeClo5idiui bullj4 3 - 1bNAliltmiddot~rg~ilmiddotic~middotmiddotmiddothumiddotmamiddotn~ 36 6130 DNA intergenico humane 34 053

~ ~DmiddotNAmiddotmiddotlntmiddoterg~nmiddoticomiddotmiddotmiddothumiddotmamiddotno ~ middotmiddotmiddotmiddotmiddot3Kmiddot 6-j- i middotmiddotbmiddotNAmiddot~middotntemiddotrg~nmiddot~omiddothmiddot~middotmamiddotmiddotomiddot 34 053 ~ ~ bNAjnterglfi1Tco--aeif thaioi) 34 653 (lYNAlnterglfricoaeAihaioiio1 34 middot6middot5~rmiddotmiddot

bmiddotNAmiddotlntmiddotemiddotrg~nTcohtimanomiddot middotmiddotmiddotmiddotmiddotj4 J 653middotmiddotmiddotbmiddotNAlrlmiddotcmiddoterg~nicohumane 34 deg 53~PmiddotrmiddotocmiddotmiddotfnmiddotimiddotmiddotdmiddotmiddotmiddotumiddotrmiddottSilmiddotmiddotdmiddotracmiddotamiddotmiddot r middotmiddotmiddotmiddotmiddotmiddot34 sectsect~middotmiddotrmiddot~~middot~tmiddot~t~~~~~6E~middotmiddot~~~~~~__1 34middot QI~-

Tabla 6 Resultados de la busqueda can oligonucleotides de longirud crecienre para EndoglucanasaGH48 en GenBank usando BLASTN 228 Los resultados rorulados como Celulasa de Clostridiumcorresponden a registros de endoglucanasas (resultados especfficos) mientras que las cifras marca-das con un asterisco () corresponden al mayor puntaje y el menor Valor E obtenidos en cadabusqueda Se observa que con los oligos de 17 y 18 nucle6tidos se obtiene el mayor puncaje y elmenor Valor E tanto para los resulcados espedficos como para algunos inespedficos Por ello seestableci6 como norma para el disefio de sondas una longitud minima de 19 nucle6tidos Nota Lasmagnitudes del mayor Puntaje y el menor Valor E no son comparables entre los cuatro oligos ya queestas depend en directa e inversameme de la longicud de la secuencia de busqueda en BLASTN

Las sondas disenadas se encuentran distribuidas de la siguiente forma 25 corres-ponden a la caregorfa Solventogenesis 48 a la categorfa Celulasas (con sondaspara varias familias de dominios funcionales en cad a tipo de enzima) 19 a lt 13-Pro-panodiol y dos aJ factor SpoOA Los valores caracterfsticos promedio de las sondasdisefiadas fueron los siguientes longitud de 24 nucleotidos Tm termodinamica de658 degC contenido de (G+C) de 390 Tm de la horquilla mas estable (cuandoexiste) de 104 degC y 6G de uni6n al objetivo de -374 kCal(Mol De esta forma se(oncluye que todas las sondas disenadas pueden ser usadas para la construccion deun microarreglo hibridizado a 42degC (Cronin et a 2001) 0 bien para un ensayo deSouthern Blot realizado en condiciones similares (Harris et 01 2002) Se disenaronademas sondas para control positive negative y de purificacion de rRNA utilizandolos mismos criterios descritos anteriormente la sonda de control positivo 5-

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 10: Oligonucleotide Probe Design for the Study of Cellulolytic

64 Arrtculo Diseriode oligonucleotidos para el estudio de genes celuolftiws y solventogeniws en cepasde Clostridium sp (Clostridiaceae) Montoya et al

httpWIfNibununaleducolineasbioprocesosindexhtm) Esta base de datos con-riene registros de 485 genes que codifican para las enzimas y prorefnas estructuralesinvolucradas en la acidogenesis solvemogenesis degradaci6n de celulosa y producci6nde 13-PD en 55 especies bacrerianas y fungicas permitiendo recuperar las secuenciasde dichos genes y protein as en las bases de datos GenBank (Benson et al 2007) yUniProt (Bairoch et al 2005) De estos registros 95 corresponden a la caregorfa Solven-rogenesis 94 a la categorfa 1 3-Propanodiol 14 a la categona Factor de esporulaci6nSpoDA y 282 a la caregorta Celulasas la mas numerosa considerando la subdivisionadiciona per farnilias de dominios funcionales

i-S-ubc~tego~raFosfoi~ansacetE3-sa

No6rgaiiTsoClo~tidi~~ih~~~~ii~

i Acetat~middotmiddotki~middotasmiddotamiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot B~~i1i~-~biijismiddotBumiddottlmiddot~atmiddotomiddotmiddotkrnamiddotsamiddotmiddotmiddotmiddotmiddotmiddotmiddotFmiddotomiddot~fomiddottmiddot~amiddotnmiddotsb~middotti~iasamiddot

bilk

AF041S4i

Z99119middotmiddotmiddotmiddotmiddotAY46jmiddot1middot03 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddoti

AE007804M15393

AY251646

- clostidi~--beJemiddot~ckii----ciostid~-~cmiddot~tob~ampIi~~middot CAC30i6-

--P~~~at-od~~~amiddot~bmiddoto~i-iasamiddot middotio~~~~~middotomiddotbij~middotmiddot pd~ A~~tmiddotoa~etmiddotat~middotd~~~middotamiddot~middotbo~TIsmiddotaIc s~~~~i~~pi~~~~~i~~~~~~~~~I adcmiddotmiddotAldmiddotemiddothi~joai~ohofmiddot deshidrogenasa idium tetanimiddotB-~-t~-~~imiddotdmiddot~~hmiddotdgemiddot~middot~amiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotCmiddot C

rmiddotA~-~t~~middot~-~middottmiddotii-~i-imiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~CoA transferasa AA~~to~~~df~iiS~~~~~~~~~~~8 BH2258 AP001514I~_I_~~~_~_~s_~s celK F039030 Endoglucanasas creajecorina _ __ __~ eg~ Y1l1l3middotMamiddot~~middot~middotas~~ 1 middot 7c~~sp mane middotmiddotmiddotmiddotgt(9752middot0middotmiddotmiddotmiddotimiddotximiddotimiddot~asamiddotmiddotmiddotmiddot Ruminococcus abus _ Z~~ AB057589r p~-~~f~middot~middotmiddot~middotdmiddot~middot~middotimiddot~Ruminococcus flaveiJ~i~~ middotmiddotmiddotmiddotmiddotmiddotmiddotmiddott scaA j27i3969

~glucanasas Clostridium thermocellum licB X63355 ~ middotmiddotmiddot~gimiddot~~~~~middot~~-~~_ CIstridiu~ ~-~iipmiddot~~ i abgA L49336 -j

Xilosidasas j ~i~~~~i~0middott~~o~~--middot 1 middotbTBmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAmiddotmiddotJmiddotSmiddotOmiddotS4middotmiddotO5 j

rA-~binomiddot~idmiddotmiddot~~middot~ Bacteroidesmiddotmiddotih~t~jt~li~~ L BT1781 ~~~~~ middot~~middot~i~~~d-middotmiddot~~~-pamiddot smiddot middot~jo~~middot(h~~~~L~1 ~~ middotmiddot1 ~~~~~~

rmiddotGiice~~imiddotdesimiddotimiddotdmiddott~middotsmiddot~ K~b~i~middotii~p~emiddot~middot~j~ middotmiddotmiddotmiddotmiddot1 dh~j32middot U60992 ~middotl-j-pmiddot~~-p~middot~~dmiddot~imiddot - ~ deshidrogenasa Clostridium pasteurianum dhaT AF006034 R dii ~ dhaR U09771i middotGmiddotilmiddot~middotemiddot~of~jemiddotshdrogmiddotemiddotnmiddotasmiddotamiddot Cistjd~middotmiddotb~amp~~m middotmiddotmiddotmiddotmiddotmiddotmiddotdh~i5i AY1j~f5s1

middotomiddot~Imiddotamiddotce[omiddot~middotamiddotkimiddotnmiddotasa middotmiddot--middotmiddotmiddotimiddotmiddot ~~g~~~ ~~~~~~~ Sacch~romycescer~~j~i~~ gpp2 050469

-t-

CTC02182 AE015943

CPE1256 middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotAPOOjmiddotmiddots9middot

CAP0163 AE001438

F~-~-t~middot~middotmiddotd~middotmiddott~middot~middot~cmiddotipmiddot~-i6middot~middotmiddotmiddot SpaDA i E~~~~~~~~~~ 1 spoOA 1 U43514

Tabla 3 Secuencias represemativas de cada subcategorfa de MULTI-CLOST can su numero de accemiddotso a GenBank

Las especies mayoritarias de la categoria Celulasas son C acetoblJoliclJm y C thermocellumlas cuales representan el 25 de dicha categor(a mientras que en Solventogenesis el

Acta bioi Colomb Vol 1252007 65

mayor porcenraje (36) corresponde a las especies C acetobutylicum y Bacillus subtiiis Parsu parte la categorfa 13-Propanodiol contiene el 25 de secuencias de las especiesClostridium butyricum Clostridium petfringens y Citrobacter freundii En la Tabla 2 se muestrala cantidad de registros que fueron agregados a la base de datos para cad a subcategorfamientras que en la Tabla 3 se enlistan los numeros de acceso en GenBank para secuen-cias representativas de cada subcategorfa almacenadas en MULTI-CLOST Los numerosde acceso de GenBank y UniProt contenidos en cada regisrro perrniten recuperar la se-cuencia genetica e informacion de conglomerados a partir de GenBank asr como lasecuencia proteica e informacion biologica a partir de UniProt Todas las enzimas inclui-das en cada categorfa fueron utifizadas para realizar los alineamientos multiples

CONSTRUCCI6N DE ALJNEAMIENTOS MULTIPLES CON ALTA CONSERVACION DE SECUENCIAS

Las secuencias de los genes almacenados en MULTI-CLOST fueron usadas para crearlos alineamientos a partir de los cuales se disefiarfan las sondas de oligonucleotidesSe esrablecieron como criterios de seleccion los valores PAP mfnimos 65 y 50 deacuerdo con el contenido de secuencias conservadas en cad a ahnearmento eliminan-dose de cad a uno 105 genes que produjeran PAP inferiores a estes valores En el casode las celulasas se usaron parametres mas flexibles (apropiados para enzimas multi-dominie) y sus dominies funcionales se alinearon independienternenre Para losalineamientos de genes de las categorfas Solventogenesis 13-Propanodiol y Factorde esporulacion SpaDA se usaron las penalidades de aperture y extension de gaps [15-666] establecidas por defecto en ClustalW y apropiadas para genes conservados encoda su extension a craves de diversas especies En los alineamientos definitivos de ceu-lasas fue necesario flexibilizar dichas penalidades de forma que se pudieran alinear fa-cilmente los dominios conservados en cada familia enzirnatica En estes casos se utilize-ron las penalidades de apertura y extension [11- 1J correspondienres a las penalidadespar defecto usadas en algunas aplicaciones de BLAST (Altschul et aI 1997) De estaforma los alineamienros definitivos fueron construidos con tres combinaciones de pa-metros 65 - [15- 666J 50 - [15- 666J Y 50 - [11-1] (PAP - [apertura- extension degaps]) Con el uso de dichas combinaciones de parametres se obruvieron en rota I 56alineamientos definitivos para las cuatra categorias de MULTI-CLOST EI numero dealineamientos obtenidos en cada categorfa can las diferenres combinaciones de para-metros se muestra en la Tabla 4

Celulasas

alineamientos

97 cmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotFFacto~dde~~ii6spoioiA~-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotrmiddotmiddotmiddotmiddotmiddot~middot8 1

110

3

Tabla 4 Alineamienros Inulriples agrupados par las caregor(as de la base de daros MULTI-CLOST ypar los criterios de alincamienro

66 Articulo - Diseno de oligonucleotidos para el estudia de genes celuloitticos y solventoginicos en cepasde Clostridium sp (Clostridiaceae) MOlltoya et al

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

1060 1080TIT T

T~GC AAaAAaTa AATAC AC ag aGa

6661068

639675651

c

1100 1120

I_ A

A A

II I~A AA A -

T

T CA 718GGB 1120

c CT 6912C T 727

703TGG

GGT GAaAGAGCaATAAGACATGC AT GAaGT GC

Figura 4 Ahneamienro multiple para el factor de esporulacion SpoOA de cinco especies de Clostridiumusando un PAP minima de 65 y penalidades 15- 666 (apertura extension de gaps) La ultima lineamuescra la secuencia consenso donde las letras en mayuscula indican posiciones compleramenreconservadas y las leer-asen rninuscula indican posiciones conservadas en cuacro de las cinco secuen-cias Los bloque en negro indican regiones identicas miencras que los bloques en diferentes ronos degris muestran regiones parcialrnente conservadas

Dada la dificultad inhereme al alineamiento de genes provenienres de especies tandiversas como las analizadas el 77 de los alineamienros definicivos contiene dos acuatro genes y el 18 contiene cinco 0 seis genes En la Figura 4 a manera de ejemplose observa el alineamienro multiple de genes correspondiences a facto res de esporu-lacion SpaDA penenecienres a varias especies de closrridios

DISENO DE LAS SONDAS DE OLiGONUCLE6TIDOS

La estrategia de diserio de oligonucleocidos en esre trabajo esca enfocada a la obtencionde sondas que permitan ioenrificar cad a gen de inreres en cualquiera de las especies quecomponen los alinearnientos as como en las cepas colombianas de Clostridium sp Lalongirud minima de las sondas se establecio a partir de los resultados de busquedas enGenBank con sondas de longitud creciente disenadas para un gen Endoglucanasausando BLASTN Se encontro que con sondas de longitud inferior a 19 nucleotidos re-sulta imposible distinguir los resultados especfficos de los inespecificos a partir de losvalores de referencia Score y Valor E (Tabla 6 Altschul et al 1997) Dicha longitud seencuenrra en el rango de valores reportados para euroI diseno de sondas de oligonucleo-tidos para microarreglos (Guckenberger et al 2002 Lee et ai 2004) En total se obtu-vieron 94 sondas de oligonucleotidos algunas de las cuales se enlistan en la tabla 5 ycuyos resultados en la busqueda can BLASTN con Valor E inferior a 005 correspon-dieron en cada caso a las enzimas para las cuaes fueron diseriadas (Ia lista completa desondas esta disponible como material suplementario en http)jwwwibununaleducoIineasbioprocesosindexhtm) En promedio con cada sanda se pueden reconocer tresgenes espedficos para la enzima objetivo en GenBank tras las busquedas correspon~dienres con BLASTN 10cual sugiere que existe una buena probabilidad de reconocer losgenes hom610gos en las cepas promisorias de Clostridium Los resultados de las busque-das can RPS-BLAST indican que las sondas diseriadas para las rutas de acidogenesissolventogenesis y producci6n de 13-PD reconocen siempre el mismo dominio en cadagen miencras que en el caso de las celulasas cada sonda puede identiFicar varias enzi-

Acta bioi Colomb Vol 12 S 2007 67

mas de diversa funcion que poseen el mismo dominio funcional (considerando el ca-racter multidominio de las celulasas)

Oligo CAGCTTGAATTCTATCAGTG Oligo CAGCTTGAATTCTATCAGTro-gtucE2ti-de6t~aos Lo~i~td-9~ude6daas

Resuitildomiddot middot j ~~~~~J~~aio(middotEmiddotT-Res~middotltmiddotadomiddot middotmiddotmiddotmiddotl~~~E~I~~ viiarIc~i~i~~~d~Ci~~tidi~ 40 0009 Celulasa de Clostridium 38 gQ~~~)c~l~i~s~d~CI~~tidi~ ~middotmiddotmiddotmiddotmiddot40middotmiddotmiddotmiddotmiddotmiddotmiddot 0ori9middotrmiddotc~imiddot~i~smiddot~middotmiddotmiddotdmiddot~middotmiddotd~~middottidi~middotmiddotmiddotmiddotL 38 ~ 0034Ceimiddot~iilsmiddotamiddotmiddotddostldiu ~~~ 0009 c~i~f~middotsmiddotamiddotmiddotmiddot~fmiddotmiddotdo~middottjdjumiddot jiF _~deg034~

~~~~~~gg~~~~~t~~~~~ middot~middotmiddot~middot~middotmiddotl~~~~~t~ggmiddot~~~~t~~~~~~ 01

3 013

middotmiddotbFjAnmiddottmiddotemiddotrg~nlcoJeAmiddotthmiddot~middotif~middot~middot~ middotmiddotmiddotmiddotj6 613 bijAintmiddotemiddotrg~nmiddotcomiddotmiddotmiddotdeAmiddotmiddotmiddottiiamiddot~~n~middotimiddot middotmiddot 36middot 0136NAmiddot middotmiddot h middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot ~middotmiddot 34 6Ki i 6NAmiddotmiddotmiddotimiddotn[middotmiddotrg~nmiddotcamiddotmiddothumiddotmamiddotnomiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot_middot34middot _1053p~tmiddot~middotmiddot~~~d~~D~~~middotnmiddotmiddotjmiddot~middot~i) 34 652 middotp~middot~tmiddot~middoti~middot~middotmiddotdmiddotemiddotmiddot~middotnmiddoti6middotnmiddotmiddotdmiddot~middotr~[middota ~ 34 _ ~ 053

Fa(tormiddotmiddotamiddotnea FmiddotancanTh~mailo 34 bull 652~~~~p~~lt~~Jimiddot~pi~~~Ti~~~j4 652 i

Oligo CAGCTTGAATTCTATCAG Oligo CAGClTGAATTCTATCAlongimiddottudmiddotfS nmiddot-ietmiddottidoSmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot j middotLorigrcumiddotamiddotmiddotfjnumiddotde6ddosmiddotmiddotmiddotmiddotResljitild) middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~~~t~j~vilior-EResljitildo ~~~~~~ middotmiddotmiddotmiddotva-iarEC~(~i~s~dea~tdj~~ 36 r 0131 C~i~i~~adea~id~~~ 34 T 053c~i~i~s~dmiddotCiostdj~~middotmiddotmiddot 36 ojj Celulasa de Clostridi~middot~middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotbullmiddotmiddot 34 OS3iCelulasa de Clostridium -t- j6~ l middotbT3gtmiddotmiddotmiddotmiddotCeT~iilsmiddotamiddotdeClo5idiui bullj4 3 - 1bNAliltmiddot~rg~ilmiddotic~middotmiddotmiddothumiddotmamiddotn~ 36 6130 DNA intergenico humane 34 053

~ ~DmiddotNAmiddotmiddotlntmiddoterg~nmiddoticomiddotmiddotmiddothumiddotmamiddotno ~ middotmiddotmiddotmiddotmiddot3Kmiddot 6-j- i middotmiddotbmiddotNAmiddot~middotntemiddotrg~nmiddot~omiddothmiddot~middotmamiddotmiddotomiddot 34 053 ~ ~ bNAjnterglfi1Tco--aeif thaioi) 34 653 (lYNAlnterglfricoaeAihaioiio1 34 middot6middot5~rmiddotmiddot

bmiddotNAmiddotlntmiddotemiddotrg~nTcohtimanomiddot middotmiddotmiddotmiddotmiddotj4 J 653middotmiddotmiddotbmiddotNAlrlmiddotcmiddoterg~nicohumane 34 deg 53~PmiddotrmiddotocmiddotmiddotfnmiddotimiddotmiddotdmiddotmiddotmiddotumiddotrmiddottSilmiddotmiddotdmiddotracmiddotamiddotmiddot r middotmiddotmiddotmiddotmiddotmiddot34 sectsect~middotmiddotrmiddot~~middot~tmiddot~t~~~~~6E~middotmiddot~~~~~~__1 34middot QI~-

Tabla 6 Resultados de la busqueda can oligonucleotides de longirud crecienre para EndoglucanasaGH48 en GenBank usando BLASTN 228 Los resultados rorulados como Celulasa de Clostridiumcorresponden a registros de endoglucanasas (resultados especfficos) mientras que las cifras marca-das con un asterisco () corresponden al mayor puntaje y el menor Valor E obtenidos en cadabusqueda Se observa que con los oligos de 17 y 18 nucle6tidos se obtiene el mayor puncaje y elmenor Valor E tanto para los resulcados espedficos como para algunos inespedficos Por ello seestableci6 como norma para el disefio de sondas una longitud minima de 19 nucle6tidos Nota Lasmagnitudes del mayor Puntaje y el menor Valor E no son comparables entre los cuatro oligos ya queestas depend en directa e inversameme de la longicud de la secuencia de busqueda en BLASTN

Las sondas disenadas se encuentran distribuidas de la siguiente forma 25 corres-ponden a la caregorfa Solventogenesis 48 a la categorfa Celulasas (con sondaspara varias familias de dominios funcionales en cad a tipo de enzima) 19 a lt 13-Pro-panodiol y dos aJ factor SpoOA Los valores caracterfsticos promedio de las sondasdisefiadas fueron los siguientes longitud de 24 nucleotidos Tm termodinamica de658 degC contenido de (G+C) de 390 Tm de la horquilla mas estable (cuandoexiste) de 104 degC y 6G de uni6n al objetivo de -374 kCal(Mol De esta forma se(oncluye que todas las sondas disenadas pueden ser usadas para la construccion deun microarreglo hibridizado a 42degC (Cronin et a 2001) 0 bien para un ensayo deSouthern Blot realizado en condiciones similares (Harris et 01 2002) Se disenaronademas sondas para control positive negative y de purificacion de rRNA utilizandolos mismos criterios descritos anteriormente la sonda de control positivo 5-

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 11: Oligonucleotide Probe Design for the Study of Cellulolytic

Acta bioi Colomb Vol 1252007 65

mayor porcenraje (36) corresponde a las especies C acetobutylicum y Bacillus subtiiis Parsu parte la categorfa 13-Propanodiol contiene el 25 de secuencias de las especiesClostridium butyricum Clostridium petfringens y Citrobacter freundii En la Tabla 2 se muestrala cantidad de registros que fueron agregados a la base de datos para cad a subcategorfamientras que en la Tabla 3 se enlistan los numeros de acceso en GenBank para secuen-cias representativas de cada subcategorfa almacenadas en MULTI-CLOST Los numerosde acceso de GenBank y UniProt contenidos en cada regisrro perrniten recuperar la se-cuencia genetica e informacion de conglomerados a partir de GenBank asr como lasecuencia proteica e informacion biologica a partir de UniProt Todas las enzimas inclui-das en cada categorfa fueron utifizadas para realizar los alineamientos multiples

CONSTRUCCI6N DE ALJNEAMIENTOS MULTIPLES CON ALTA CONSERVACION DE SECUENCIAS

Las secuencias de los genes almacenados en MULTI-CLOST fueron usadas para crearlos alineamientos a partir de los cuales se disefiarfan las sondas de oligonucleotidesSe esrablecieron como criterios de seleccion los valores PAP mfnimos 65 y 50 deacuerdo con el contenido de secuencias conservadas en cad a ahnearmento eliminan-dose de cad a uno 105 genes que produjeran PAP inferiores a estes valores En el casode las celulasas se usaron parametres mas flexibles (apropiados para enzimas multi-dominie) y sus dominies funcionales se alinearon independienternenre Para losalineamientos de genes de las categorfas Solventogenesis 13-Propanodiol y Factorde esporulacion SpaDA se usaron las penalidades de aperture y extension de gaps [15-666] establecidas por defecto en ClustalW y apropiadas para genes conservados encoda su extension a craves de diversas especies En los alineamientos definitivos de ceu-lasas fue necesario flexibilizar dichas penalidades de forma que se pudieran alinear fa-cilmente los dominios conservados en cada familia enzirnatica En estes casos se utilize-ron las penalidades de apertura y extension [11- 1J correspondienres a las penalidadespar defecto usadas en algunas aplicaciones de BLAST (Altschul et aI 1997) De estaforma los alineamienros definitivos fueron construidos con tres combinaciones de pa-metros 65 - [15- 666J 50 - [15- 666J Y 50 - [11-1] (PAP - [apertura- extension degaps]) Con el uso de dichas combinaciones de parametres se obruvieron en rota I 56alineamientos definitivos para las cuatra categorias de MULTI-CLOST EI numero dealineamientos obtenidos en cada categorfa can las diferenres combinaciones de para-metros se muestra en la Tabla 4

Celulasas

alineamientos

97 cmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot3middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot

middotFFacto~dde~~ii6spoioiA~-middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotrmiddotmiddotmiddotmiddotmiddot~middot8 1

110

3

Tabla 4 Alineamienros Inulriples agrupados par las caregor(as de la base de daros MULTI-CLOST ypar los criterios de alincamienro

66 Articulo - Diseno de oligonucleotidos para el estudia de genes celuloitticos y solventoginicos en cepasde Clostridium sp (Clostridiaceae) MOlltoya et al

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

1060 1080TIT T

T~GC AAaAAaTa AATAC AC ag aGa

6661068

639675651

c

1100 1120

I_ A

A A

II I~A AA A -

T

T CA 718GGB 1120

c CT 6912C T 727

703TGG

GGT GAaAGAGCaATAAGACATGC AT GAaGT GC

Figura 4 Ahneamienro multiple para el factor de esporulacion SpoOA de cinco especies de Clostridiumusando un PAP minima de 65 y penalidades 15- 666 (apertura extension de gaps) La ultima lineamuescra la secuencia consenso donde las letras en mayuscula indican posiciones compleramenreconservadas y las leer-asen rninuscula indican posiciones conservadas en cuacro de las cinco secuen-cias Los bloque en negro indican regiones identicas miencras que los bloques en diferentes ronos degris muestran regiones parcialrnente conservadas

Dada la dificultad inhereme al alineamiento de genes provenienres de especies tandiversas como las analizadas el 77 de los alineamienros definicivos contiene dos acuatro genes y el 18 contiene cinco 0 seis genes En la Figura 4 a manera de ejemplose observa el alineamienro multiple de genes correspondiences a facto res de esporu-lacion SpaDA penenecienres a varias especies de closrridios

DISENO DE LAS SONDAS DE OLiGONUCLE6TIDOS

La estrategia de diserio de oligonucleocidos en esre trabajo esca enfocada a la obtencionde sondas que permitan ioenrificar cad a gen de inreres en cualquiera de las especies quecomponen los alinearnientos as como en las cepas colombianas de Clostridium sp Lalongirud minima de las sondas se establecio a partir de los resultados de busquedas enGenBank con sondas de longitud creciente disenadas para un gen Endoglucanasausando BLASTN Se encontro que con sondas de longitud inferior a 19 nucleotidos re-sulta imposible distinguir los resultados especfficos de los inespecificos a partir de losvalores de referencia Score y Valor E (Tabla 6 Altschul et al 1997) Dicha longitud seencuenrra en el rango de valores reportados para euroI diseno de sondas de oligonucleo-tidos para microarreglos (Guckenberger et al 2002 Lee et ai 2004) En total se obtu-vieron 94 sondas de oligonucleotidos algunas de las cuales se enlistan en la tabla 5 ycuyos resultados en la busqueda can BLASTN con Valor E inferior a 005 correspon-dieron en cada caso a las enzimas para las cuaes fueron diseriadas (Ia lista completa desondas esta disponible como material suplementario en http)jwwwibununaleducoIineasbioprocesosindexhtm) En promedio con cada sanda se pueden reconocer tresgenes espedficos para la enzima objetivo en GenBank tras las busquedas correspon~dienres con BLASTN 10cual sugiere que existe una buena probabilidad de reconocer losgenes hom610gos en las cepas promisorias de Clostridium Los resultados de las busque-das can RPS-BLAST indican que las sondas diseriadas para las rutas de acidogenesissolventogenesis y producci6n de 13-PD reconocen siempre el mismo dominio en cadagen miencras que en el caso de las celulasas cada sonda puede identiFicar varias enzi-

Acta bioi Colomb Vol 12 S 2007 67

mas de diversa funcion que poseen el mismo dominio funcional (considerando el ca-racter multidominio de las celulasas)

Oligo CAGCTTGAATTCTATCAGTG Oligo CAGCTTGAATTCTATCAGTro-gtucE2ti-de6t~aos Lo~i~td-9~ude6daas

Resuitildomiddot middot j ~~~~~J~~aio(middotEmiddotT-Res~middotltmiddotadomiddot middotmiddotmiddotmiddotl~~~E~I~~ viiarIc~i~i~~~d~Ci~~tidi~ 40 0009 Celulasa de Clostridium 38 gQ~~~)c~l~i~s~d~CI~~tidi~ ~middotmiddotmiddotmiddotmiddot40middotmiddotmiddotmiddotmiddotmiddotmiddot 0ori9middotrmiddotc~imiddot~i~smiddot~middotmiddotmiddotdmiddot~middotmiddotd~~middottidi~middotmiddotmiddotmiddotL 38 ~ 0034Ceimiddot~iilsmiddotamiddotmiddotddostldiu ~~~ 0009 c~i~f~middotsmiddotamiddotmiddotmiddot~fmiddotmiddotdo~middottjdjumiddot jiF _~deg034~

~~~~~~gg~~~~~t~~~~~ middot~middotmiddot~middot~middotmiddotl~~~~~t~ggmiddot~~~~t~~~~~~ 01

3 013

middotmiddotbFjAnmiddottmiddotemiddotrg~nlcoJeAmiddotthmiddot~middotif~middot~middot~ middotmiddotmiddotmiddotj6 613 bijAintmiddotemiddotrg~nmiddotcomiddotmiddotmiddotdeAmiddotmiddotmiddottiiamiddot~~n~middotimiddot middotmiddot 36middot 0136NAmiddot middotmiddot h middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot ~middotmiddot 34 6Ki i 6NAmiddotmiddotmiddotimiddotn[middotmiddotrg~nmiddotcamiddotmiddothumiddotmamiddotnomiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot_middot34middot _1053p~tmiddot~middotmiddot~~~d~~D~~~middotnmiddotmiddotjmiddot~middot~i) 34 652 middotp~middot~tmiddot~middoti~middot~middotmiddotdmiddotemiddotmiddot~middotnmiddoti6middotnmiddotmiddotdmiddot~middotr~[middota ~ 34 _ ~ 053

Fa(tormiddotmiddotamiddotnea FmiddotancanTh~mailo 34 bull 652~~~~p~~lt~~Jimiddot~pi~~~Ti~~~j4 652 i

Oligo CAGCTTGAATTCTATCAG Oligo CAGClTGAATTCTATCAlongimiddottudmiddotfS nmiddot-ietmiddottidoSmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot j middotLorigrcumiddotamiddotmiddotfjnumiddotde6ddosmiddotmiddotmiddotmiddotResljitild) middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~~~t~j~vilior-EResljitildo ~~~~~~ middotmiddotmiddotmiddotva-iarEC~(~i~s~dea~tdj~~ 36 r 0131 C~i~i~~adea~id~~~ 34 T 053c~i~i~s~dmiddotCiostdj~~middotmiddotmiddot 36 ojj Celulasa de Clostridi~middot~middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotbullmiddotmiddot 34 OS3iCelulasa de Clostridium -t- j6~ l middotbT3gtmiddotmiddotmiddotmiddotCeT~iilsmiddotamiddotdeClo5idiui bullj4 3 - 1bNAliltmiddot~rg~ilmiddotic~middotmiddotmiddothumiddotmamiddotn~ 36 6130 DNA intergenico humane 34 053

~ ~DmiddotNAmiddotmiddotlntmiddoterg~nmiddoticomiddotmiddotmiddothumiddotmamiddotno ~ middotmiddotmiddotmiddotmiddot3Kmiddot 6-j- i middotmiddotbmiddotNAmiddot~middotntemiddotrg~nmiddot~omiddothmiddot~middotmamiddotmiddotomiddot 34 053 ~ ~ bNAjnterglfi1Tco--aeif thaioi) 34 653 (lYNAlnterglfricoaeAihaioiio1 34 middot6middot5~rmiddotmiddot

bmiddotNAmiddotlntmiddotemiddotrg~nTcohtimanomiddot middotmiddotmiddotmiddotmiddotj4 J 653middotmiddotmiddotbmiddotNAlrlmiddotcmiddoterg~nicohumane 34 deg 53~PmiddotrmiddotocmiddotmiddotfnmiddotimiddotmiddotdmiddotmiddotmiddotumiddotrmiddottSilmiddotmiddotdmiddotracmiddotamiddotmiddot r middotmiddotmiddotmiddotmiddotmiddot34 sectsect~middotmiddotrmiddot~~middot~tmiddot~t~~~~~6E~middotmiddot~~~~~~__1 34middot QI~-

Tabla 6 Resultados de la busqueda can oligonucleotides de longirud crecienre para EndoglucanasaGH48 en GenBank usando BLASTN 228 Los resultados rorulados como Celulasa de Clostridiumcorresponden a registros de endoglucanasas (resultados especfficos) mientras que las cifras marca-das con un asterisco () corresponden al mayor puntaje y el menor Valor E obtenidos en cadabusqueda Se observa que con los oligos de 17 y 18 nucle6tidos se obtiene el mayor puncaje y elmenor Valor E tanto para los resulcados espedficos como para algunos inespedficos Por ello seestableci6 como norma para el disefio de sondas una longitud minima de 19 nucle6tidos Nota Lasmagnitudes del mayor Puntaje y el menor Valor E no son comparables entre los cuatro oligos ya queestas depend en directa e inversameme de la longicud de la secuencia de busqueda en BLASTN

Las sondas disenadas se encuentran distribuidas de la siguiente forma 25 corres-ponden a la caregorfa Solventogenesis 48 a la categorfa Celulasas (con sondaspara varias familias de dominios funcionales en cad a tipo de enzima) 19 a lt 13-Pro-panodiol y dos aJ factor SpoOA Los valores caracterfsticos promedio de las sondasdisefiadas fueron los siguientes longitud de 24 nucleotidos Tm termodinamica de658 degC contenido de (G+C) de 390 Tm de la horquilla mas estable (cuandoexiste) de 104 degC y 6G de uni6n al objetivo de -374 kCal(Mol De esta forma se(oncluye que todas las sondas disenadas pueden ser usadas para la construccion deun microarreglo hibridizado a 42degC (Cronin et a 2001) 0 bien para un ensayo deSouthern Blot realizado en condiciones similares (Harris et 01 2002) Se disenaronademas sondas para control positive negative y de purificacion de rRNA utilizandolos mismos criterios descritos anteriormente la sonda de control positivo 5-

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 12: Oligonucleotide Probe Design for the Study of Cellulolytic

66 Articulo - Diseno de oligonucleotidos para el estudia de genes celuloitticos y solventoginicos en cepasde Clostridium sp (Clostridiaceae) MOlltoya et al

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

CTC01569SPOA CLOSESPOA CLOPACAC2071SPOA CLODI

1060 1080TIT T

T~GC AAaAAaTa AATAC AC ag aGa

6661068

639675651

c

1100 1120

I_ A

A A

II I~A AA A -

T

T CA 718GGB 1120

c CT 6912C T 727

703TGG

GGT GAaAGAGCaATAAGACATGC AT GAaGT GC

Figura 4 Ahneamienro multiple para el factor de esporulacion SpoOA de cinco especies de Clostridiumusando un PAP minima de 65 y penalidades 15- 666 (apertura extension de gaps) La ultima lineamuescra la secuencia consenso donde las letras en mayuscula indican posiciones compleramenreconservadas y las leer-asen rninuscula indican posiciones conservadas en cuacro de las cinco secuen-cias Los bloque en negro indican regiones identicas miencras que los bloques en diferentes ronos degris muestran regiones parcialrnente conservadas

Dada la dificultad inhereme al alineamiento de genes provenienres de especies tandiversas como las analizadas el 77 de los alineamienros definicivos contiene dos acuatro genes y el 18 contiene cinco 0 seis genes En la Figura 4 a manera de ejemplose observa el alineamienro multiple de genes correspondiences a facto res de esporu-lacion SpaDA penenecienres a varias especies de closrridios

DISENO DE LAS SONDAS DE OLiGONUCLE6TIDOS

La estrategia de diserio de oligonucleocidos en esre trabajo esca enfocada a la obtencionde sondas que permitan ioenrificar cad a gen de inreres en cualquiera de las especies quecomponen los alinearnientos as como en las cepas colombianas de Clostridium sp Lalongirud minima de las sondas se establecio a partir de los resultados de busquedas enGenBank con sondas de longitud creciente disenadas para un gen Endoglucanasausando BLASTN Se encontro que con sondas de longitud inferior a 19 nucleotidos re-sulta imposible distinguir los resultados especfficos de los inespecificos a partir de losvalores de referencia Score y Valor E (Tabla 6 Altschul et al 1997) Dicha longitud seencuenrra en el rango de valores reportados para euroI diseno de sondas de oligonucleo-tidos para microarreglos (Guckenberger et al 2002 Lee et ai 2004) En total se obtu-vieron 94 sondas de oligonucleotidos algunas de las cuales se enlistan en la tabla 5 ycuyos resultados en la busqueda can BLASTN con Valor E inferior a 005 correspon-dieron en cada caso a las enzimas para las cuaes fueron diseriadas (Ia lista completa desondas esta disponible como material suplementario en http)jwwwibununaleducoIineasbioprocesosindexhtm) En promedio con cada sanda se pueden reconocer tresgenes espedficos para la enzima objetivo en GenBank tras las busquedas correspon~dienres con BLASTN 10cual sugiere que existe una buena probabilidad de reconocer losgenes hom610gos en las cepas promisorias de Clostridium Los resultados de las busque-das can RPS-BLAST indican que las sondas diseriadas para las rutas de acidogenesissolventogenesis y producci6n de 13-PD reconocen siempre el mismo dominio en cadagen miencras que en el caso de las celulasas cada sonda puede identiFicar varias enzi-

Acta bioi Colomb Vol 12 S 2007 67

mas de diversa funcion que poseen el mismo dominio funcional (considerando el ca-racter multidominio de las celulasas)

Oligo CAGCTTGAATTCTATCAGTG Oligo CAGCTTGAATTCTATCAGTro-gtucE2ti-de6t~aos Lo~i~td-9~ude6daas

Resuitildomiddot middot j ~~~~~J~~aio(middotEmiddotT-Res~middotltmiddotadomiddot middotmiddotmiddotmiddotl~~~E~I~~ viiarIc~i~i~~~d~Ci~~tidi~ 40 0009 Celulasa de Clostridium 38 gQ~~~)c~l~i~s~d~CI~~tidi~ ~middotmiddotmiddotmiddotmiddot40middotmiddotmiddotmiddotmiddotmiddotmiddot 0ori9middotrmiddotc~imiddot~i~smiddot~middotmiddotmiddotdmiddot~middotmiddotd~~middottidi~middotmiddotmiddotmiddotL 38 ~ 0034Ceimiddot~iilsmiddotamiddotmiddotddostldiu ~~~ 0009 c~i~f~middotsmiddotamiddotmiddotmiddot~fmiddotmiddotdo~middottjdjumiddot jiF _~deg034~

~~~~~~gg~~~~~t~~~~~ middot~middotmiddot~middot~middotmiddotl~~~~~t~ggmiddot~~~~t~~~~~~ 01

3 013

middotmiddotbFjAnmiddottmiddotemiddotrg~nlcoJeAmiddotthmiddot~middotif~middot~middot~ middotmiddotmiddotmiddotj6 613 bijAintmiddotemiddotrg~nmiddotcomiddotmiddotmiddotdeAmiddotmiddotmiddottiiamiddot~~n~middotimiddot middotmiddot 36middot 0136NAmiddot middotmiddot h middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot ~middotmiddot 34 6Ki i 6NAmiddotmiddotmiddotimiddotn[middotmiddotrg~nmiddotcamiddotmiddothumiddotmamiddotnomiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot_middot34middot _1053p~tmiddot~middotmiddot~~~d~~D~~~middotnmiddotmiddotjmiddot~middot~i) 34 652 middotp~middot~tmiddot~middoti~middot~middotmiddotdmiddotemiddotmiddot~middotnmiddoti6middotnmiddotmiddotdmiddot~middotr~[middota ~ 34 _ ~ 053

Fa(tormiddotmiddotamiddotnea FmiddotancanTh~mailo 34 bull 652~~~~p~~lt~~Jimiddot~pi~~~Ti~~~j4 652 i

Oligo CAGCTTGAATTCTATCAG Oligo CAGClTGAATTCTATCAlongimiddottudmiddotfS nmiddot-ietmiddottidoSmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot j middotLorigrcumiddotamiddotmiddotfjnumiddotde6ddosmiddotmiddotmiddotmiddotResljitild) middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~~~t~j~vilior-EResljitildo ~~~~~~ middotmiddotmiddotmiddotva-iarEC~(~i~s~dea~tdj~~ 36 r 0131 C~i~i~~adea~id~~~ 34 T 053c~i~i~s~dmiddotCiostdj~~middotmiddotmiddot 36 ojj Celulasa de Clostridi~middot~middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotbullmiddotmiddot 34 OS3iCelulasa de Clostridium -t- j6~ l middotbT3gtmiddotmiddotmiddotmiddotCeT~iilsmiddotamiddotdeClo5idiui bullj4 3 - 1bNAliltmiddot~rg~ilmiddotic~middotmiddotmiddothumiddotmamiddotn~ 36 6130 DNA intergenico humane 34 053

~ ~DmiddotNAmiddotmiddotlntmiddoterg~nmiddoticomiddotmiddotmiddothumiddotmamiddotno ~ middotmiddotmiddotmiddotmiddot3Kmiddot 6-j- i middotmiddotbmiddotNAmiddot~middotntemiddotrg~nmiddot~omiddothmiddot~middotmamiddotmiddotomiddot 34 053 ~ ~ bNAjnterglfi1Tco--aeif thaioi) 34 653 (lYNAlnterglfricoaeAihaioiio1 34 middot6middot5~rmiddotmiddot

bmiddotNAmiddotlntmiddotemiddotrg~nTcohtimanomiddot middotmiddotmiddotmiddotmiddotj4 J 653middotmiddotmiddotbmiddotNAlrlmiddotcmiddoterg~nicohumane 34 deg 53~PmiddotrmiddotocmiddotmiddotfnmiddotimiddotmiddotdmiddotmiddotmiddotumiddotrmiddottSilmiddotmiddotdmiddotracmiddotamiddotmiddot r middotmiddotmiddotmiddotmiddotmiddot34 sectsect~middotmiddotrmiddot~~middot~tmiddot~t~~~~~6E~middotmiddot~~~~~~__1 34middot QI~-

Tabla 6 Resultados de la busqueda can oligonucleotides de longirud crecienre para EndoglucanasaGH48 en GenBank usando BLASTN 228 Los resultados rorulados como Celulasa de Clostridiumcorresponden a registros de endoglucanasas (resultados especfficos) mientras que las cifras marca-das con un asterisco () corresponden al mayor puntaje y el menor Valor E obtenidos en cadabusqueda Se observa que con los oligos de 17 y 18 nucle6tidos se obtiene el mayor puncaje y elmenor Valor E tanto para los resulcados espedficos como para algunos inespedficos Por ello seestableci6 como norma para el disefio de sondas una longitud minima de 19 nucle6tidos Nota Lasmagnitudes del mayor Puntaje y el menor Valor E no son comparables entre los cuatro oligos ya queestas depend en directa e inversameme de la longicud de la secuencia de busqueda en BLASTN

Las sondas disenadas se encuentran distribuidas de la siguiente forma 25 corres-ponden a la caregorfa Solventogenesis 48 a la categorfa Celulasas (con sondaspara varias familias de dominios funcionales en cad a tipo de enzima) 19 a lt 13-Pro-panodiol y dos aJ factor SpoOA Los valores caracterfsticos promedio de las sondasdisefiadas fueron los siguientes longitud de 24 nucleotidos Tm termodinamica de658 degC contenido de (G+C) de 390 Tm de la horquilla mas estable (cuandoexiste) de 104 degC y 6G de uni6n al objetivo de -374 kCal(Mol De esta forma se(oncluye que todas las sondas disenadas pueden ser usadas para la construccion deun microarreglo hibridizado a 42degC (Cronin et a 2001) 0 bien para un ensayo deSouthern Blot realizado en condiciones similares (Harris et 01 2002) Se disenaronademas sondas para control positive negative y de purificacion de rRNA utilizandolos mismos criterios descritos anteriormente la sonda de control positivo 5-

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 13: Oligonucleotide Probe Design for the Study of Cellulolytic

Acta bioi Colomb Vol 12 S 2007 67

mas de diversa funcion que poseen el mismo dominio funcional (considerando el ca-racter multidominio de las celulasas)

Oligo CAGCTTGAATTCTATCAGTG Oligo CAGCTTGAATTCTATCAGTro-gtucE2ti-de6t~aos Lo~i~td-9~ude6daas

Resuitildomiddot middot j ~~~~~J~~aio(middotEmiddotT-Res~middotltmiddotadomiddot middotmiddotmiddotmiddotl~~~E~I~~ viiarIc~i~i~~~d~Ci~~tidi~ 40 0009 Celulasa de Clostridium 38 gQ~~~)c~l~i~s~d~CI~~tidi~ ~middotmiddotmiddotmiddotmiddot40middotmiddotmiddotmiddotmiddotmiddotmiddot 0ori9middotrmiddotc~imiddot~i~smiddot~middotmiddotmiddotdmiddot~middotmiddotd~~middottidi~middotmiddotmiddotmiddotL 38 ~ 0034Ceimiddot~iilsmiddotamiddotmiddotddostldiu ~~~ 0009 c~i~f~middotsmiddotamiddotmiddotmiddot~fmiddotmiddotdo~middottjdjumiddot jiF _~deg034~

~~~~~~gg~~~~~t~~~~~ middot~middotmiddot~middot~middotmiddotl~~~~~t~ggmiddot~~~~t~~~~~~ 01

3 013

middotmiddotbFjAnmiddottmiddotemiddotrg~nlcoJeAmiddotthmiddot~middotif~middot~middot~ middotmiddotmiddotmiddotj6 613 bijAintmiddotemiddotrg~nmiddotcomiddotmiddotmiddotdeAmiddotmiddotmiddottiiamiddot~~n~middotimiddot middotmiddot 36middot 0136NAmiddot middotmiddot h middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot ~middotmiddot 34 6Ki i 6NAmiddotmiddotmiddotimiddotn[middotmiddotrg~nmiddotcamiddotmiddothumiddotmamiddotnomiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot_middot34middot _1053p~tmiddot~middotmiddot~~~d~~D~~~middotnmiddotmiddotjmiddot~middot~i) 34 652 middotp~middot~tmiddot~middoti~middot~middotmiddotdmiddotemiddotmiddot~middotnmiddoti6middotnmiddotmiddotdmiddot~middotr~[middota ~ 34 _ ~ 053

Fa(tormiddotmiddotamiddotnea FmiddotancanTh~mailo 34 bull 652~~~~p~~lt~~Jimiddot~pi~~~Ti~~~j4 652 i

Oligo CAGCTTGAATTCTATCAG Oligo CAGClTGAATTCTATCAlongimiddottudmiddotfS nmiddot-ietmiddottidoSmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot j middotLorigrcumiddotamiddotmiddotfjnumiddotde6ddosmiddotmiddotmiddotmiddotResljitild) middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddot~~~t~j~vilior-EResljitildo ~~~~~~ middotmiddotmiddotmiddotva-iarEC~(~i~s~dea~tdj~~ 36 r 0131 C~i~i~~adea~id~~~ 34 T 053c~i~i~s~dmiddotCiostdj~~middotmiddotmiddot 36 ojj Celulasa de Clostridi~middot~middotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotmiddotbullmiddotmiddot 34 OS3iCelulasa de Clostridium -t- j6~ l middotbT3gtmiddotmiddotmiddotmiddotCeT~iilsmiddotamiddotdeClo5idiui bullj4 3 - 1bNAliltmiddot~rg~ilmiddotic~middotmiddotmiddothumiddotmamiddotn~ 36 6130 DNA intergenico humane 34 053

~ ~DmiddotNAmiddotmiddotlntmiddoterg~nmiddoticomiddotmiddotmiddothumiddotmamiddotno ~ middotmiddotmiddotmiddotmiddot3Kmiddot 6-j- i middotmiddotbmiddotNAmiddot~middotntemiddotrg~nmiddot~omiddothmiddot~middotmamiddotmiddotomiddot 34 053 ~ ~ bNAjnterglfi1Tco--aeif thaioi) 34 653 (lYNAlnterglfricoaeAihaioiio1 34 middot6middot5~rmiddotmiddot

bmiddotNAmiddotlntmiddotemiddotrg~nTcohtimanomiddot middotmiddotmiddotmiddotmiddotj4 J 653middotmiddotmiddotbmiddotNAlrlmiddotcmiddoterg~nicohumane 34 deg 53~PmiddotrmiddotocmiddotmiddotfnmiddotimiddotmiddotdmiddotmiddotmiddotumiddotrmiddottSilmiddotmiddotdmiddotracmiddotamiddotmiddot r middotmiddotmiddotmiddotmiddotmiddot34 sectsect~middotmiddotrmiddot~~middot~tmiddot~t~~~~~6E~middotmiddot~~~~~~__1 34middot QI~-

Tabla 6 Resultados de la busqueda can oligonucleotides de longirud crecienre para EndoglucanasaGH48 en GenBank usando BLASTN 228 Los resultados rorulados como Celulasa de Clostridiumcorresponden a registros de endoglucanasas (resultados especfficos) mientras que las cifras marca-das con un asterisco () corresponden al mayor puntaje y el menor Valor E obtenidos en cadabusqueda Se observa que con los oligos de 17 y 18 nucle6tidos se obtiene el mayor puncaje y elmenor Valor E tanto para los resulcados espedficos como para algunos inespedficos Por ello seestableci6 como norma para el disefio de sondas una longitud minima de 19 nucle6tidos Nota Lasmagnitudes del mayor Puntaje y el menor Valor E no son comparables entre los cuatro oligos ya queestas depend en directa e inversameme de la longicud de la secuencia de busqueda en BLASTN

Las sondas disenadas se encuentran distribuidas de la siguiente forma 25 corres-ponden a la caregorfa Solventogenesis 48 a la categorfa Celulasas (con sondaspara varias familias de dominios funcionales en cad a tipo de enzima) 19 a lt 13-Pro-panodiol y dos aJ factor SpoOA Los valores caracterfsticos promedio de las sondasdisefiadas fueron los siguientes longitud de 24 nucleotidos Tm termodinamica de658 degC contenido de (G+C) de 390 Tm de la horquilla mas estable (cuandoexiste) de 104 degC y 6G de uni6n al objetivo de -374 kCal(Mol De esta forma se(oncluye que todas las sondas disenadas pueden ser usadas para la construccion deun microarreglo hibridizado a 42degC (Cronin et a 2001) 0 bien para un ensayo deSouthern Blot realizado en condiciones similares (Harris et 01 2002) Se disenaronademas sondas para control positive negative y de purificacion de rRNA utilizandolos mismos criterios descritos anteriormente la sonda de control positivo 5-

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 14: Oligonucleotide Probe Design for the Study of Cellulolytic

68 Articulo - Diseno de oligonucleotidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Ciouridiaceae) Montoya et al

ATCATCCCTAACTCAACTGGTGCTG-3 se diserto a partir de la gliceraldehido-3P-deshidrogenasa de C acerobutylicurn mientras que la sonda de control negarivo 5-TGACAGATGAATCCGACACATGCAG-3 fue disenada con base en el gen de la op-sina cuyo producto (OPN1SW GenBank NM_001708) participa en la transduccionde la senal visible en la region azul del espectro eleccromagnetico hacia una serialelectroqufmica -proceso que ocu~re en el ojo humano- La sanda de control de pun-ficacion 5-TGGTCGGTACAATGAGATGCAACCT-3 fue disenada a partir del gen16SrRNA de la cepa IBUN 22A (Montoya et a 2001) Algunos de los oligonucleotidesdisenados tam bien podrfan ser utilizados como cebadores para PCR bien sea enreacciones individuales 0 en multiplex PCR En cada caso uno de los oligonudeocidosdisenados acruarfa como cebador forward mientras que como cebador reverse se po-drta utilizer un oligonucle6tido corto de secuencia alearona como el cebador RAPD-3(S-GTAGACCCGT-3 Amersham Pharmacia Biotech Suecia) reportado para RAPD -Random Amplified Polymorphic DNA- en Clostridium diffieile (Pelaez et 01 2002) Se seleccio-naron 27 oligonucle6tidos de los disefiados con la metodologta presentada anterior-mente utilizando para ello los criterios de diseno de cebadores de PCR descritos porRybicki (2005) Estos oligonucle6tidos podrtan ser utilizados en cuatro reacciones deMultiplex RT-PCR en Tiempo Real separadas de acuerdo a su temperatura de anilladoEI primer grupo (sondas 1-3-A 1-6-A 111-31-16-B 111-6-A)podria ser empleado en unareacci6n con una temperatura de anillado de 54degC el segundo grupo (sondas 1-12-B1-13 11-11111-2-A11-17-A11-17-B11-21-A11-22-C)en una reacci6n con temperatura deanillado maxima de 58degC el tercer grupo (sondas 11-12 11-7-AIII-l-B 11-12-A111-2-B111-511-21-B) en una reacci6n con temperatura de aniHado de 63degC y el cuarto grupo(sondas 1-9 11-8-B11-10-A lI-lD-B 11-152 111-8-A111-9)en una reaccion con tempe-ratura de anillado de 67degC Cabe mencionar que los parametres termodinamicospredichos con herramientas bioinforrnaricas deben ser ajustados a partir de los resulta-dos de ensayos de hibridacion preliminares

DISCUSION

La merodologfa seguida en este trabajo para el diseno de las sondas de oligonucleo-tides esta encaminada a encontrar secuencias conservadas a tr-aves de una variedad demicroorganismos de los dominios Eubacteria y Eukarya todos ellos representatives delas rutas merabolicas de interes Esta estrategia es pracnca euando se recurre a un en-sayo de hibridizacion en el eual la cantidad de sondas es limitada Sin embargo en unmicroarreglo puede incluirse una gran eantidad de sondas de manera que las secuen-eias conservadas y sus posibles replicas dejan muehos espacios libres que pueden serutilizados para pruebas adieionales Con el fin de obtener huellas de DNA de cad a cepay dar indicios sobre las relaciones evolutivas de sus genes se podrfa recurrir a una es-trategia adicional extraer de los alineamientos secueneias con los mismos criterios delongitud temperatura de fusion y ausencia de estructura seeundaria utilizados para los0ligonucle6tidos diseiiados pero esta vez en regiones que no sean compartidas por nin-guno de los genes de cada alineamiento AI utilizar estas secuencias como sondas seaproveeharfa de forma mas eficiente el espacio disponible en un microarreglo y al hallarpuntos hibridizados can una muestra podrfa decirse que la seeueneia deteetada tiene

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 15: Oligonucleotide Probe Design for the Study of Cellulolytic

Acta bioi Colomb Vol 125 2007 69

mayor similitud can el gen de una especie dererminada induida en el microarreglo Lautilizaci6n de sondas diseriadas a partir de secuencias conservadas en una varied ad deespecies constituye un ensayo exploratorio aunque no excluyente de forma que si unade estas sondas hibridiza con el DNA 0 el eDNA de la cepa investigada se tiene un in-dicio de la presencia del gen para e ccal ha sido disenada la sonda Si no se presentahibridizaci6n con las sondas diseriadas para una familia enzirnarica no podrfa asegu-rarse que la cepa no posea genes que codifiquen para enzimas de dicha familia

La clasificaci6n de las cepas nativas a nivel de especie ha presentado dificultades ysus caracteres taxonomicos unicos podrian conducir a su dasificaci6n como una nue-va especie dentro del genero Sin embargo aun si se lIegara a concluir que son cepasde la especie C butyricum el genoma de esta ultima no ha sido complecamente secuen-ciado ni existen por el memento proyectos genoma que la cobijen Por este motivo seconsider6 pertinence buscar secuencias de genes que sean caracteristicos del generoCfostridium pero que tambien se encuentren en otros generos relacionados

Como se presento en la metodologfa de construcci6n de la base de datos MULTI-CLOST se incluyeron en ella registros especies bacrenanas y fungices reJacionadascan Clostridium bien fuera par su clasificaci6n taxonomica 0 par exhibir las mismasrutas metabolicas Baja el primer criterio se incluyeron especies de los generos BacillusOceanobacitlus Geobacillus y Lactobacillus integrantes todos ellos del Filum Firmicutes(baccerias Gram (+)) as como otras bacterias del orden Clostridiales que exhiben lasrutas metabolicas pertinentes entre las que se cuentan varias especies de los generosThermoanaerobacterium Acetivibrio Butyrivibrio Ruminococcus y Caldicellulosiruptor (Lyndetal 2002 Coughlan y Mayer 1992 Rabinovich etal 2002 Tabla 1) Otros micro-organismos alejados filogeneticamenre del genero Clostridium fueron incluidos par sercelulolfticos reconocidos como es el caso de Cellulomonas [uni Hypocrea jecorina y variasespecies de los generos bacterianos Bacteroides y Fibrobacrer y de los hongosOrpinornyces y Pirornyces (Coughlan y Mayer 1992 Lynd etal 2002 Rabinovich etal2002) Por su parte las enrerobacterias pat6genas Klebsiella pneumoniae y Citrobacterfreundii fueron induidas por ser representativas de la produccion de 13-PD a partir deglicerol (Sun et al 2003) Por ultimo fue necesario incluir a las levaduras Saccharomycescerevisiae Schizosaccharomyces pombe y Zygosaccharomyces rouxii considerando que son losunicos microorganismos que pueden convertir el glicerol-P provenience de fa gluc61isisen glicerol (Biebl etal 1999)

Como se mostro en los resultados las subcategorfas de MULTI-CLOST con mayornumero de enzimas condujeron a la obtencion de una mayor cancidad de alinea-mientos y secuencias conservadas Se escogi6 C1ustalW 183 como softlare de alinea-miento con los parametros establecidos por defecto por ser 10 suficiencemmiddotente bajospara compensar la variaci6n considerable entre los genes de cada familia enzimaticaa craves de diferentes especies (Thompson et aI 1994) La combinaci6n de para-metros de alineamiento 65middot [15middot 666] (PAP minimomiddot [apercuramiddot extension de gaps])en C1ustalW fue aplicable a los grupos de genes que guardan una similitud conside-rable a 10 largo de toda su secuencia y con ella se obtuvieron 16 alineamientos la

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 16: Oligonucleotide Probe Design for the Study of Cellulolytic

70 Articulo - Diseno de oligonucle6tidos para el estudio de lenes celutouucos y solventogenicos en cepasde Clostridium sp (Clostridiaceae) Montoya er al

mayor parte correspondienres a la categorfa Solventogenesis EI PAP promedio enestes alineamientos va de 66 a 94 y se conformaron par grupos de dos a cinco genesPar su parte la cornbinacion 50 - [15- 666] fue aplicable a grupos de genes con PAPbajos pero que conservaban similitud significativa a craves de toda la secuencia Conesta combinaci6n de parametres se construyeron 30 alineamienros siendo la combi-naci6n con mayor aplicabilidad para los genes analizados en esre trabajo Con ella seobcuvieron los mayo res alineamientos que contienen hasta siete genes cada unoaunque los valores promedio de PAP descienden a un rango de 51 a 711 La com-binacion 50 - [11-1] conscirvyo la mejor opci6n en grupos cuyos genes compartensolo ciertos dominios funcionales como es el caso de la mayorfa de las celulasas mul-tidominio (Bayer et aI 1998) Con est a combinacion se construyeron 11 alineamien-tos con PAP promedio que van de 559 a 77 A partir de las regiones conservadas endichos alineamienro s se disenaron 94 sondas de ohgonucleotidos Uno de los prin-cipales sustentos teoricos para la busqueda de secuencias conservadas en los genesesrudiados es que en las especies correspondientes se han dernostrado eventos detransferer-cia horizontal siendo este de hecho el origen de varios operones en el geno-ma de C acetobutylicum (Nolting et al 2001) En este esrudio se dedujo la transferenciahorizontal de la Endoglucanasa V de Erwinia chrysantemi a Cellulomonas uda en dondese identifica como Endoglucanasa I a partir de sus semejanzas en cua nto a secuencianucleondica frecuencia de uso de cod ones y porcentaje de Gr C Sin embargo losgenes proveniences de especies fungicas y actinomicecos almacenados en MULTI-CLOST formaron casi invanablemenre alineamienros separados de aquellos en los cua-les se concenrraban genes de las clases Clostridia y Bacilli aun con el usa de parametresde alineamienco poco restrictivos (datos no mostrados) Este resulrado contrasta canla hipotesis adelamada par Garcta-Vallve et al (2000) en la que se propane que losgenes de celulasas en hongos del rumen fueron obtenidos mediante transferenciahorizontal a partir de bacterias del rumen (hipotesis reforzada por la au sen cia de in-trones en dichos genes) La base de datos MULTI-CLOST y las sondas de oligonucleo-tidos disenadas son herramientas muy utiJes para eJ mejoramienro futuro de las cepasnativas de Clostridium sp par ingenierfa metabolica puesto que permiten analizary comprender las rutas metabolicas implicadas en el consumo de sustraros de bajocosto y en la produccion de metabolitos de alto valor comercial en diferenres especiesCon MULTI-CLOST se obtiene una vision amplia de las especies que representan cadaruta metabolica asf como de las variaciones enzimaticas que existen entre eliasmientras que con las sondas de oligonucleotidos se puede analizar el perfil de expre-sion de los genes implicados en cada ruta La estrategia propues[a para el diseAode oligonucleo[idos guarda semejanza can la estra[egia propuesta en la patente deGraham y Wollweber (1990) para la deteccion de genes de a-Amilasa en diferentesespecies del genero Bacillus asr como can la estra[egia diseAada por Matveeva et al(2004) para el anal isis de variantes del virus VIH-1 par ensayos de hibridacion Sinembargo la estrategia para el analisis de rutas metab61icas en las cepas colombianasde Clostridium sp muestra ventajas con respecto a la especificidad de detecci6n y alacantidad de sand as obtenidas En la estrategia patentada por Graham y Wollweber

(1990) par ejemplo se recurre al uso de nucle6[idos ambiguos 0 bien se escogen numiddotcleotidos arbitrarios en las posiciones sin consenso de los alineamientos multiples

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 17: Oligonucleotide Probe Design for the Study of Cellulolytic

Acta bioi Colomb Vol 1252007 71

arriesgando de esta forma la especificidad y capacidad de deteccicn de las sondasresultantes Por otra parte la estrategia de Matveeva et 01 (2004) es muy similar alade este articulo en cuanto a la seleccion de sondas a partir de los alineamientos multi-ples por para metros de longitud valores cermodinamicos y formacion de estructurassecundarias 0 dtmeros perc su estructura automarizada y exhaustiva resulta pocopractice para el diseno de un numero limitado de sondas que cubran un am plio es-pectro de genes La estrategia utilizada en el presente estudio result6 eficaz para eldiserio de sondas dirigidas a regiones consenso de cada gen objetivo con las cualesse espera analizar en el futuro las rutas metab61icas de interes en las cepas colorn-bianas de Clostridium sp y as rnejorar eventual mente su rendimiento industrial

AGRADECIMIENTOS

Esre trabajo fue desarrollado dentro del marco del proyecto Producci6n de 13 Pro-panodiol a partir de glicerol generado del proceso productivo de Biodiesel emplean-do cepas nativas de Clostridium spp estudio del operon condiciones de produccionpar fermentaci6n y su viabilidad econ6mica c6digo 1101-12-17848 financiado parel Institute Colombiano Francisco Jose de Caldas COLCIENCIAS y la UniversidadNacional de Colombia

BIBlIOGRAFiA

AIYAR A The Use of CLUSTAL Wand CLUSTAL X for Multiple SequenceAlignment En Misener 5 Krawetz 5 editors Bioinfomarics Methods and protocolsNew Jersey Humana Press tnc 2000 p 221-239

ALSAKER K PAPOUTSAKIS E Transcriptional Program of Early Sporulation andStationary-Phase Events in Clostridium acetobutyiicum J Bacceriol 2005187(20)7103-7118

ALTSCHUL S MADDEN T SCHAFFER A ZHANGJ ZHANG Z MILLER W et01 Gapped BLAST and PSI-BLAST A New Generation of Protem Database SearchPrograms Nucleic Acids Res 199725( 17)3389-3402

AREvALO C Contribuci6n a la caracterizaci6n molecular de cepas nativas deClostridium spp con potencial biotecnol6gico [resis de maestrfa J Bogota DCPosgrado Interfacultades en Microbiologia Universidad Nacional de Colombia 2001

BAIROCH A APWEILER R WU C BARKER W BOECKMANN B FERRO 5 et01 The Universal Protein Resource (UniProt) Nucleic Acids Res 200533 D154-D159

BAYER E SHIMON L SHOHAM Y LAMED R Cellulosomes-5tructure andUltrastructure J Struct BioI 1998124(2-3)221-234

BENSON D KARSCH-MIZRACHI I LIPMAN D OSTELL J WHEELER DGenBank Nucleic Acids Res 200735(Database issue)D21-D25

BIEBL H MENZEL K ZENG A DECKWER W Microbial Production of 13-Propanediol Appi Microbiol Biotechnol 199952(3)289-297

BUNNEY W BUNNEY B VAWTER M TOMITA H LI J EVANS S et 01Microarray Technology A Review of New Strategies to Discover CandidateVulnerability Genes in Psychiatric Disorders AmJ Psychiatry 2003160(4)657-666

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 18: Oligonucleotide Probe Design for the Study of Cellulolytic

72 Artfculo Diseno de oligonucleotidos para el estudio de genes ceiuloliticos y solventogenicos en cepasde Clostridium sp [Ctostndiaceoe) Montoya er al

CARDENAS D PULIDO C ARAGON 0 ARISTlzABAL F SUAREZ Z MONTOYAD Evaluaci6n de la produccion de 13-propanodiol por cepas narivas de Clostridium spmediante fermentacion a partir de glicerol USP y glicerol industrial subproducto de laproducci6n de Biodiesel Rev Col Cienc Qufm Farm 200635(1 )120-137

COUGHLAN M MAYER F The Cellulose-Decomposing Bacteria and theirEnzyme Systems En Balows A editor The prokaryotes A Handbook on the Biologyof Bacteria 2 ed New York Springer-Verlag 1992 p 460-502

CRONIN M PHO M DUTTA D FRUEH F SCHWARCZ L BRENNAN TUtilization of New Technologies in Drug Trials and Discovery Drug Mecab Dispos2001 29(4)586-590

GARCIA-VALLVE S ROMEU A PALAU j Horizontal Gene Transfer ofGlycosylHydrolases of the Rumen Fungi Mol Bioi Evol 200017(3)352-361

GRAHAM B WOLLWEBER K Oligonucleotide Probes for Detection of Alpha-Amylase Genes Washington DC US Patent and Trademark Office 1990 LrSPatent 4917999

GUCKENBERGER M KURZ S AEPINUS C THEISS S HALLER S LEIMBACHT et at Analysis of the Heat Shock Response of Neisseria meningitidis with cDNA- andOligonucleotide-Based DNA Microarrays J Bacteriol 2002184(9)2546-2551

HARRIS L WELKER N PAPOUTSAKIS E Northern Morphological andFermentation Analysis of spoDA Inactivation and oOverexpression in Clostridiumocetobutylicum ATCC 824 J Bacteriol 2002184( 13)3586-3597

HEGDE P QI R ABERNATHY K GAY C DHARAP S GASPARD R et 01 AConcise Guide to cDNA Microarray Analysis Biotechniques 200029(3)548-562

JAIMES C ARISTIZABAL F BERNAL M SUAREZ Z MONTOYA D AFLPFingerprinting of Colombian Clostridium spp Strains Multivariate Data Analysis andIts Taxonomical Implications J Microbiol Methods 200667(1 )64-69

JONES D WOODS D Acetone-Butanol Fermentation Revisited Microbiol Rev198650( 4 )484-524

LEE I DOMBKOWSKI A ATHEY B Guidelines for Incorporating Non-PerfectlyMatched Oligonucleotides Into Target-Specific Hybridization Probes for a DNAMicroarray Nucleic Acids Res 200432(2)681-690

LUCAS R ROBLES A GALVEZ A GARCIA T PEREZ R ALVAREZ G Biodegrada-ci6n de la celulosa y la lignina jaen Junta Andalucia Consejena EDU 2001 p 14-62

LYND L WEIMER P VAN ZYL W PRETORIUS I Microbial Cellulose UtilizationFundamentals and Biotechnology Microbiol Mol Bioi Rev 200266(3)506-527-

MATVEEVA 0 FOLEY B NEMTSOVV GESTELAND R MATSUFUJI S ATKINSJ et al Identification of Regions in Multiple Sequence Alignments ThermodynamicallySuitable for Targeting by Consensus Oligonucleotides Application to HIV GenomeBMC Bioinformatics [serial online] 2004 [citado 5 Sep 2007] 5(44) [15 pancallas]Disponible en URL httpwwwpubmedcentralnihgovarticlerender fcgiartids419695

MONTOYA D SPITIA S SILVA E SCHWARZ W Isolation of Mesophilic Solvent-Producing Clostridia from Colombian Sources Physiological Characterization SolventProduction and Polysaccharide Hydrolysis J Biotechnol 200079(2) 117-126

MONTOYA D AREvALO C GONZALES 5 ARISTIZABAL F SCHWARZ WNew Solvent-Producing Clostridium sp Strains Hydrolyzing a Wide Range of

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 19: Oligonucleotide Probe Design for the Study of Cellulolytic

Acta bioi Cotomb Vol 125 2007 73

Polysaccharides are Closely Related to Clostridium butyricum J lnd MicrobicBiotechnol 2001 27(5)329-335

MONTOYA J SUAREZ Z MONTOYA 0 ARISTIZABAL F Analisis boinfor-matico y predicci6n de genes en secuencias gen6micas de Clostridium sp IBUN22ARev Col Biotecnol 20068(1 )57-64

NAKAMURA C WHITED G Metabolic Engineering for the MicrobialProduction of 13-Propanediol Curl Opin Biotechnol 200314(5)454-459

NICHOLAS K NICHOLAS H GeneDoc A Tool for Editing and AnnotatingMultiple Sequence Alignments [programa de ordenador online] Versi6n 26002Pittsburg (PA) Pittsburgh Supercomputing Center 2001 Disponible en URLhttpwwwpscedubiomedgenedoc

NOLLING J BRETON G OMELCHENKO M MAKAROVA K ZENG QGIBSON R et al Genome Sequence and Comparative Analysis of the Solvenr-Producing Bacterium Clostridium acetobutylicum J Bacteriol 2001 183( 16)4823-4838

PACHAURI N HE B Value-Added Utilization of Crude Glycerol from BiodieselProduction A Survey of Current Research Activities Portland 2006 ASABE AnnualInternational Meeting 2006 Paper Number 066223

PAREDES C SENGER R SPATH I BORDEN J SILLERS R PAPOUTSAKIS E AGeneral Framework for Designing and Validating Oligomer-Based DNA Microarraysand its Application to Clostridium acetobutyticurn Appl Environ Microbial2007 73( 14 )4631-4638

PELAEZ T ALCALA L ALONSO R RODRfGUEZ-CREIXEMS M GARCiA-LECHUZJ BOUZA E Reassessment of Clostridium difficile Susceptibility to Metronidazoleand Vancomycin Antimicrob Agents Chemother 200246(6)1647-1650

RABINOVICH M MELNICK M BOLOBOVA A The Structure andMechanism lof Action of Cellulolytic Enzymes Biochemistry Moscow 200267(8)850-871

RUTHERFORD K PARKHILLJ CROOKJ HORSNELL T RICE P RAJANDREAMM et al Artemis Sequence Visualisation and Annoration Bioinformatics200016( 10)944-945

RYBICKI E A Manual of Online Molecular Biology Techniques Cape TownUniversity of Cape Town 2005 Disponibe en URL httpwwwmcbuctaczarnaoual Mol Bioi Manualhtm

SANTALUCIAJ A Unified View of Polymer Dumbbell and Oligonucleotide DNANearest-Neighbor Thermodynamics Proc Nat Acad Sci USA 1998951460-1465

SCHUCH HARDT J BEULE 0 MALIK A WOLSKI E EICKHOFF H LEHRACHH et at Normalization Strategies for cDNA Microarrays Nucleic Acids Res200028(10)e47i-e47v

SCHWARZ W The Cellulosome and Cellulose Degradation by AnaerobicBacteria Appl Microbic Biotechnol 2001 56(5-6)634-649

STOUGHTON R Applications of DNA Microarrays in Biology Annu RevBiochem200574S3-82

SUAREZ Z Contribuci6n a la taxonomfa de 13 cepas nativas de Clostridium spmediante analisis multivariaoo de cecnicas de caracrerizacion ger-oclpicas y fenorf-picas [tesis de maestrfa] Bogota DC Posgrado tnterfaculcades en Microbiologfa Universidad Nacional de Colombia 2004

~-

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597

Page 20: Oligonucleotide Probe Design for the Study of Cellulolytic

74 Artrculo - Diseno de oligo1ucle6tidos para el estudio de genes celulolfticos y solventogenicos en ceposde Clostridium sp (Clostridiaceae) Montoya et al

SUN J VAN DER HEUVELJ sOUCAILLE P QU Y ZENG A et at ComparativeGenomic Analysis of Dha Regulon and Related Genes for Anaerobic GlycerolMetabolism in Bacteria Biotechnol Prog 200319(2)263-272

THOMPSON J HIGGINS D GIBSON T Clustal W Improving the Sensitivity ofProgressive Multiple Sequence Alignment Through Sequence Weighting Position-Specific Gap Penalties and Weight Matrix Choice Nucleic Acids Res199422(22)4673-4680

TOLSTRUP N NIELSEN P KOLBERG J FRANKEL A VlsslNG H KAUPPINENS OligoDesign Optimal Design of LNA (Locked Nucleic Acid) OligonucleotideCapture Probes for Gene Expression Profiling Nucleic Acids Res 200331(13)3758-3762

TOMAS C ALSAKER K BONARIUs H HENDRIKSEN W YANG H BEAMISHJ et ot DNA Array-Based Transcriptional Analysis of Asporogenous NonsolventogenicClostridium acetobutyicum strains sK01 and MS J Bacteriol 2003 185(15)4539-4547

TUMMALA 5 JUNNE 5 PAPOUTsAKls E Antisense RNA Downregulation ofCoenzime A Transferase Combined with Alcohol-Aldehyde DehydrogenaseOverexpression Leads to Predominantly Alcohologenic Clostridium acetobutylicumFermentations J Bacteriol 2003 185( 12)3644-3653

VELCULEsCU V ZHANG L VOGELSTEIN B KINZLER K Serial Analysis ofGene Expression Science 1995270484-487

VARGAS C MONTOYA D ARlsTlzABAL F Clonacion y expresion en Escherichiacoli de genes de celulasas de Clostridium IBUN 22A Rev Col Biotecnol 20024(1 )29-35

ZVERLOV V BEREZINA 0 VELIKODVORsKAYA G SCHWARZ W et atBacterial Acetone and Butanol Production by Industrial Fermentation in the SovietUnion Use of Hydrolyzed Agricultural Waste for Biorefinery Appl MicrobiolBiotechnol 200671 (5)587-597