Genetica Taller Bioinformatica

Embed Size (px)

DESCRIPTION

Un taller de generalidades de bioinformatica.

Citation preview

Taller de gentica, bioinformtica.Martes 28 de julio 2015ANDRES FELIPE GUTIERREZ ROBAYO

1.A. Cross-species inhibition of dUTPase via the Staphylococcal Stl protein perturbs dNTP pool and colony formation in Mycobacterium.Hirmond R, Szab JE, Nyri K, Tarjnyi S, Dobrotka P, Tth J, Vrtessy BG.DNA Repair (Amst). 2015 Jun;30:21-7. doi: 10.1016/j.dnarep.2015.03.005. Epub 2015 Mar 19.PMID: 25841100 Bacillus halodurans Strain C125 Encodes and Synthesizes Enzymes from Both Known Pathways To Form dUMP Directly from Cytosine Deoxyribonucleotides.Oehlenschlger CB, Lvgreen MN, Reinauer E, Lehtinen E, Pind ML, Harris P, Martinussen J, Willemos M.Appl Environ Microbiol. 2015 May 15;81(10):3395-404. doi: 10.1128/AEM.00268-15. Epub 2015 Mar 6.PMID: 25746996 dUTPase expression correlates with cell division potential in Drosophila melanogaster.Horvth A, Batki J, Henn L, Lukacsovich T, Rna G, Erdlyi M, Vrtessy BG.FEBS J. 2015 May;282(10):1998-2013. doi: 10.1111/febs.13255. Epub 2015 Mar 21.PMID: 25735890 Antimycobacterial activity of peptide conjugate of pyridopyrimidine derivative against Mycobacterium tuberculosis in a series of in vitro and in vivo models.Horvti K, Bacsa B, Szab N, Fodor K, Balka G, Rusvai M, Kiss , Mez G, Grolmusz V, Vrtessy B, Hudecz F, Bsze S.Tuberculosis (Edinb). 2015 Jun;95 Suppl 1:S207-11. doi: 10.1016/j.tube.2015.02.026. Epub 2015 Feb 13.PMID: 25728610 Phosphorylation of herpes simplex virus 1 dUTPase regulates viral virulence and genome integrity by compensating for low cellular dUTPase activity in the central nervous system.Kato A, Arii J, Koyanagi Y, Kawaguchi Y.J Virol. 2015 Jan;89(1):241-8. doi: 10.1128/JVI.02497-14. Epub 2014 Oct 15.PMID: 25320299

B.

C. La dUTPasa es una enzima que influye en los procesos de eliminacin de nucletidos (uracilo), cataliza o hidroliza el dUTP para evitar que se incorpore errneamente en el DNA se usa para estudios de eucariotas (bacterias etc), frmacos y se encontr que influye en varios procesos celulares relevantes como apoptosis. Ejemplo en la insercin del uraciloD. dUTP pyrophosphataseas a potential target for chemotherapeutic drug development.McIntosh EM, Haynes RH.Acta Biochim Pol. 1997;44(2):159-71. Review.PMID:9360704

HIV and human endogenous retroviruses: an hypothesis with therapeutic implications.McIntosh EM, Haynes RH.Acta Biochim Pol. 1996;43(4):583-92. Review.PMID:9104494 Structure and activity of the Saccharomyces cerevisiaedUTP pyrophosphataseDUT1, an essential housekeeping enzyme.Tchigvintsev A, Singer AU, Flick R, Petit P, Brown G, Evdokimova E, Savchenko A, Yakunin AF.Biochem J. 2011 Jul 15;437(2):243-53. doi: 10.1042/BJ20110304.PMID: 21548881

HumandUTP pyrophosphatase: cDNA sequence and potential biological importance of the enzyme.McIntosh EM, Ager DD, Gadsden MH, Haynes RH.Proc Natl Acad Sci U S A. 1992 Sep 1;89(17):8020-4. Erratum in: Proc Natl Acad Sci U S A 1993 May 1;90(9):4328.PMID: 1325640

E.

2.A. Uniprot es una base de datos que recopila la informacin sobre todas las protenas estudiadas y la Swiss-Prot es una base de datos para secuencia de proteinas.

B.B.A. Es una enzima involucrada en el metabolismo de nucleotidos que produce dUMP, que es el precursos de los nucleotidos de timina y disminuye la concentracion de dUTP y asi no se incorpore el uracilo en DNA.B.B Gen ontology describe a que procesos pertenece.B.C AlternativO: dUTP pyrophosphatase gen: Name:dut Synonyms:dnaS,sof Ordered Locus Names:b3640,JW3615

B.D. Tiene 151 aminoacidosC. FASTA: Secuencia y descripcion. >sp|P06968|DUT_ECOLI Deoxyuridine 5'-triphosphate nucleotidohydrolase OS=Escherichia coli (strain K12) GN=dut PE=1 SV=1MKKIDVKILDPRVGKEFPLPTYATSGSAGLDLRACLNDAVELAPGDTTLVPTGLAIHIADPSLAAMMLPRSGLGHKHGIVLGNLVGLIDSDYQGQLMISVWNRGQDSFTIQPGERIAQMIFVPVVQAEFNLVEDFDATDRGEGGFGHSGRQ

D.

3.

A. La opcin nr tambin llamada Non-redundant protein sequences es una base de datos que proporciona BLAST para la bsqueda de secuencias. El programa ordena las secuencias de acuerdo a un puntaje que es determinado por: La cobertura de la bsqueda, la identidad de la secuencia y E-value que es la cantidad de alineaciones que se puede encontrar por casualidad que tiene la misma puntacin que la alineacin que se est mirando, donde 7e es las alineaciones que tienen la misma puntacin entre 105 (7e-105). Al seleccionar la secuencia de menor puntaje se observa que se hace una comparacin en tres lneas, donde la superior es la secuencia que se busca, la inferior es la secuencia a comparar y la media es la secuencia que queda al hacer la comparacin donde se muestran las diferencias con un (+). En la secuencia se ve la diferencia en un aminocido.B.

4. a. TrEMBL es una base de datos que naci como respuesta al incremento de datos recolectados en proyectos genmicos, ya que Swiss-Prot , al ser una base alimentada por trabajos de codificacin manual, era incapaz de incluir todas las secuencias proteicas disponibles. TrEMBL contiene anlisis de alta calidad puesto que es una base computarizada.Las secuencias seleccionadas tienen en comn que no se repiten y adems son codificadas manualmente.b. >sp|P06968|DUT_ECOLI Deoxyuridine 5'-triphosphate nucleotidohydrolase OS=Escherichia coli (strain K12) GN=dut PE=1 SV=1MKKIDVKILDPRVGKEFPLPTYATSGSAGLDLRACLNDAVELAPGDTTLVPTGLAIHIADPSLAAMMLPRSGLGHKHGIVLGNLVGLIDSDYQGQLMISVWNRGQDSFTIQPGERIAQMIFVPVVQAEFNLVEDFDATDRGEGGFGHSGRQ>sp|P33316|DUT_HUMAN Deoxyuridine 5'-triphosphate nucleotidohydrolase, mitochondrial OS=Homo sapiens GN=DUT PE=1 SV=4MTPLCPRPALCYHFLTSLLRSAMQNARGARQRAEAAVLSGPGPPLGRAAQHGIPRPLSSAGRLSQGCRGASTVGAAGWKGELPKAGGSPAPGPETPAISPSKRARPAEVGGMQLRFARLSEHATAPTRGSARAAGYDLYSAYDYTIPPMEKAVVKTDIQIALPSGCYGRVAPRSGLAAKHFIDVGAGVIDEDYRGNVGVVLFNFGKEKFEVKKGDRIAQLICERIFYPEIEEVQALDDTERGSGGFGSTGKN>sp|P33317|DUT_YEAST Deoxyuridine 5'-triphosphate nucleotidohydrolase OS=Saccharomyces cerevisiae (strain ATCC 204508 / S288c) GN=DUT1 PE=1 SV=2MTATSDKVLKIQLRSASATVPTKGSATAAGYDIYASQDITIPAMGQGMVSTDISFTVPVGTYGRIAPRSGLAVKNGIQTGAGVVDRDYTGEVKVVLFNHSQRDFAIKKGDRVAQLILEKIVDDAQIVVVDSLEESARGAGGFGSTGN>sp|P11283|POL_MMTVC Gag-Pro-Pol polyprotein OS=Mouse mammary tumor virus (strain C3H) GN=gag-pro-pol PE=1 SV=2MGVSGSKGQKLFVSVLQRLLSERGLHVKESSAIEFYQFLIKVSPWFPEEGGLNLQDWKRVGREMKKYAAEHGTDSIPKQAYPIWLQLREILTEQSDLVLLSAEAKSVTEEELEEGLTGLLSASSQEKTYGTRGTAYAEIDTEVDKLSEHIYDEPYEEKEKADKNEEKDHVRKVKKIVQRKENSEHKRKEKDQKAFLATDWNNDDLSPEDWDDLEEQAAHYHDDDELILPVKRKVDKKKPLALRRKPLPPVGFAGAMAEAREKGDLTFTFPVVFMGESDDDDTPVWEPLPLKTLKELQSAVRTMGPSAPYTLQVVDMVASQWLTPSDWHQTARATLSPGDYVLWRTEYEEKSKETVQKTAGKRKGKVSLDMLLGTGQFLSPSSQIKLSKDVLKDVTTNAVLAWRAIPPPGVKKTVLAGLKQGNEESYETFISRLEEAVYRMMPRGEGSDILIKQLAWENANSLCQDLIRPMRKTGTMQDYIRACLDASPAVVQGMAYAAAMRGQKYSTFVKQTYGGGKGGQGSEGPVCFSCGKTGHIKRDCKEEKGSKRAPPGLCPRCKKGYHWKSECKSKFDKDGNPLPPLETNAENSKNLVKGQSPSPTQKGDKGKDSGLNPEAPPFTIHDLPRGTPGSAGLDLSSQKDLILSLEDGVSLVPTLVKGTLPEGTTGLIIGRSSNYKKGLEVLPGVIDSDFQGEIKVMVKAAKNAVIIHKGERIAQLLLLPYLKLPNPIIKEERGSEGFGSTSHVHWVQEISDSRPMLHISLNGRRFLGLLDTGADKTCIAGRDWPANWPIHQTESSLQGLGMACGVARSSQPLRWQHEDKSGIIHPFVIPTLPFTLWGRDIMKEIKVRLMTDSPDDSQDLMIGAIESNLFADQISWKSDQPVWLNQWPLKQEKLQALQQLVTEQLQLGHLEESNSPWNTPVFVIKKKSGKWRLLQDLRAVNATMHDMGALQPGLPSPVAVPKGWEIIIIDLQDCFFNIKLHPEDCKRFAFSVPSPNFKRPYQRFQWKVLPQGMKNSPTLCQKFVDKAILTVRDKYQDSYIVHYMDDILLAHPSRSIVDEILTSMIQALNKHGLVVSTEKIQKYDNLKYLGTHIQGDAVSYQKLQIRTDKLRTLNDFQKLLGNINWIRPFLKLTTGELKPLFEILNGDSNPISIRKLTPEACKALQLVNERLSIARVKRLDLSRPWSLCILKTEYTPTACLWQNGVLEWIHLPHISPKVITPYDIFCTQLIIKGRHRSKELFSKDPDYIVVPYTKVQFDLLLQEKEDWPISLLGFLGEVHFHLPKDPLLTFTLQTAIIFPHMTSTTPLEKGIVIFTDGSANGRSVTYIQGREPIIKENTQNTAQQAEIVAVITAFEEVSQSFNLYTDSKYVTGLFPEIETATLSPRTKIYTELRHLQRLIHKRQEKFYIGHIRGHTGLPGPLAQGNAYADSLTRILTALESAQESHALHHQNAAALRFQFHITREQAREIVKLCPNCPDWGHAPQLGVNPRGLKPRVLWQMDVTHVSEFGKLKYVHVTVDTYSHFTFATARTGEATKDVLQHLAQSFAYMGFPQKIKTDNAPAYVSRSIQEFLARWKISHVTGIPYNPQGQAIVERTHQNIKAQLNKLQKAGKYYTPHHLLAHALFVLNHVNMDNQGHTAAERHWGPISADPKPMVMWKDLLAGSWKGPDVLITAGRGYACVFPQDAETPIWVPDRFIRPFTERKEATPTPGTAEKTPPRDEKDQQKSPEDESSPHQREDGLATSAGVNLRSGGGS>sp|Q9IZT2|PRO_MMTVC Gag-Pro polyprotein OS=Mouse mammary tumor virus (strain C3H) GN=gag-pro PE=1 SV=1MGVSGSKGQKLFVSVLQRLLSERGLHVKESSAIEFYQFLIKVSPWFPEEGGLNLQDWKRVGREMKKYAAEHGTDSIPKQAYPIWLQLREILTEQSDLVLLSAEAKSVTEEELEEGLTGLLSASSQEKTYGTRGTAYAEIDTEVDKLSEHIYDEPYEEKEKADKNEEKDHVRKVKKIVQRKENSEHKRKEKDQKAFLATDWNNDDLSPEDWDDLEEQAAHYHDDDELILPVKRKVDKKKPLALRRKPLPPVGFAGAMAEAREKGDLTFTFPVVFMGESDDDDTPVWEPLPLKTLKELQSAVRTMGPSAPYTLQVVDMVASQWLTPSDWHQTARATLSPGDYVLWRTEYEEKSKETVQKTAGKRKGKVSLDMLLGTGQFLSPSSQIKLSKDVLKDVTTNAVLAWRAIPPPGVKKTVLAGLKQGNEESYETFISRLEEAVYRMMPRGEGSDILIKQLAWENANSLCQDLIRPMRKTGTMQDYIRACLDASPAVVQGMAYAAAMRGQKYSTFVKQTYGGGKGGQGSEGPVCFSCGKTGHIKRDCKEEKGSKRAPPGLCPRCKKGYHWKSECKSKFDKDGNPLPPLETNAENSKNLVKGQSPSPTQKGDKGKDSGLNPEAPPFTIHDLPRGTPGSAGLDLSSQKDLILSLEDGVSLVPTLVKGTLPEGTTGLIIGRSSNYKKGLEVLPGVIDSDFQGEIKVMVKAAKNAVIIHKGERIAQLLLLPYLKLPNPIIKEERGSEGFGSTSHVHWVQEISDSRPMLHISLNGRRFLGLLDTGADKTCIAGRDWPANWPIHQTESSLQGLGMACGVARSSQPLRWQHEDKSGIIHPFVIPTLPFTLWGRDIMKEIKVRLMTDSPDDSQDLc.

5. a. X01714, b. source 1..1609 /organism="Escherichia coli" /mol_type="genomic DNA" /db_xref="taxon:562"Promoter regulatory 286..291 /regulatory_class="promoter" /note="-35 region"Promoter regulatory 310..316 /regulatory_class="promoter" /note="-10 region"misc_feature 322..324 /note="put. transcription start region"regulatory 330..333 /regulatory_class="ribosome_binding_site" /note="put. rRNA binding site"c. >gi|41296|emb|X01714.1| E. coli dut gene for dUTPase (EC 3.6.1.23) (deoxyuridine 5'-triphosphate nucleotidohydrolase)CAGAGAAAATCAAAAAGCAGGCCACGCAGGGTGATGAATTAACAATAAAAATGGTTAAAAACCCCGATATCGTCGCAGGCGTTGCCGCACTAAAAGACCATCGACCCTACGTCGTTGGATTTGCCGCCGAAACAAATAATGTGGAAGAATACGCCCGGCAAAAACGTATCCGTAAAAACCTTGATCTGATCTGCGCGAACGATGTTTCCCAGCCAACTCAAGGATTTAACAGCGACAACAACGCATTACACCTTTTCTGGCAGGACGGAGATAAAGTCTTACCGCTTGAGCGCAAAGAGCTCCTTGGCCAATTATTACTCGACGAGATCGTGACCCGTTATGATGAAAAAAATCGACGTTAAGATTCTGGACCCGCGCGTTGGGAAGGAATTTCCGCTCCCGACTTATGCCACCTCTGGCTCTGCCGGACTTGACCTGCGTGCCTGTCTCAACGACGCCGTAGAACTGGCTCCGGGTGACACTACGCTGGTTCCGACCGGGCTGGCGATTCATATTGCCGATCCTTCACTGGCGGCAATGATGCTGCCGCGCTCCGGATTGGGACATAAGCACGGTATCGTGCTTGGTAACCTGGTAGGATTGATCGATTCTGACTATCAGGGCCAGTTGATGATTTCCGTGTGGAACCGTGGTCAGGACAGCTTCACCATTCAACCTGGCGAACGCATCGCCCAGATGATTTTTGTTCCGGTAGTACAGGCTGAATTTAATCTGGTGGAAGATTTCGACGCCACCGACCGCGGTGAAGGCGGCTTTGGTCACTCTGGTCGTCAGTAACACATACGCATCCGAATAACGTCATAACATAGCCGCAAACATTTCGTTTGCGGTCATAGCGTGGGTGCCGCCTGGCAAGTGCTTATTTTCAGGGGTATTTTGTAACATGGCAGAAAAACAAACTGCGAAAAGGAACCGTCGCGAGGAAATACTTCAGTCTCTGGCGCTGATGCTGGAATCCAGCGATGGAAGCCAACGTATCACGACGGCAAAACTGGCCGCCTCTGTCGGCGTTTCCGAAGCGGCACTGTATCGCCACTTCCCCAGTAAGACCCGCATGTTCGATAGCCTGATTGAGTTTATCGAAGATAGCCTGATTACTCGCATCAACCTGATTCTGAAAGATGAGAAAGACACCACAGCGCGCCTGCGTCTGATTGTGTTGCTGCTTCTCGGTTTTGGTGAGCGTAATCCTGGCCTGACCCGCATCCTCACTGGTCATGCGCTAATGTTTGAACAGGATCGCCTGCAAGGGCGCATCAACCAGCTGTTCGAGCGTATTGAAGCGCAGCTGCGCCAGGTATTGCGTGAAAAGAGAATGCGTGAGGGTGAAGGTTACACCACCGATGAAACCCTGCTGGCAAGCCAGATCCTGGCCTTCTGTGAAGGTATGCTGTCACGTTTTGTCCGCAGCGAATTTAAATACCGCCCGACGGATGATTTTGACGCCCGCTGGCCGCTAATTGCGGCCAGTTGCAGTAATATGACGCCGGATGACTTTTCATCCGGCGAGTTTCTTTAAACGCCAAACTCTTCGCGATAGGCCTTAACCGCCGCCAGATGTTCCGCCATTTCCGGCTTCTCTTCCAGGTiene 1609 nucleotidos.