28
Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions- Netzwerken in unterschiedlichen immunologischen Zuständen Freie Universität Berlin

Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Embed Size (px)

Citation preview

Page 1: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha

Fachbereich Mathematik und InformatikInstitut für InformatikStudiengang Bioinformatik

Bachelorarbeit

Identifizierung von Genexpressions-Netzwerken in unterschiedlichen immunologischen

Zuständen

Freie Universität Berlin

Page 2: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha2

Freie Universität Berlin

Co-Expression von Genen

Gene mit gleichen Funktionen unter Kontrolle eines Transkriptionsfaktors(TF) -> Co-Regulation

Korrelationsanalyse nach Pearson

Bestimmung der co-exprimierten Gene erfolgt durch den Vergleich biologischer Zustände (aktiv und inaktiv)

Aktiver biologischer Zustand: erhöhte Expression eines TFs und der von ihm gesteuerten Gene.

Erkennung von Co-Expressionsnetzwerken -> Aufdeckung regulatorischen Mechanismen und biologischen Zusammenhängen

Einleitung

Material und Methoden

Ergebnisse

Diskussion

Page 3: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha3

Freie Universität Berlin

Verwendete Software

Oracle VM VirtualBox (4.2.12) mit Linux als Betriebssystem HPS-System Soroban der Freien Universität Berlin Ruby (1.9.3p374) on Rails (3.2.9) R (3.0.1) und Bioconductor (2.12) Genesis (1.7.6)

Einleitung

Material und Methoden

Ergebnisse

Diskussion

Page 4: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha4

Freie Universität Berlin

Klinische Proben

32 Human Genome U133 Plus 2.0 Arrays

Zelltypen: - ,- (CD4, CD8), B (CD19)-Zellen, NK-Zellen (CD56) , Granulozyten (CD15), mit LPS, TNF und IFNa2α 90 Minuten stimulierte sowie unstimulierte Monozyten (CD14) und Kontrolle (Ctl 90)

Einleitung

Material und Methoden

Ergebnisse

Diskussion

Page 5: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha5

Freie Universität Berlin

Qualitätsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 6: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha6

Freie Universität Berlin

Qualitätsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

CD14 IFN Datensatz

Page 7: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha7

Freie Universität Berlin

Qualitätsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 8: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha8

Freie Universität Berlin

Qualitätsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 9: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha9

Freie Universität Berlin

Qualitätsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 10: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha10

Freie Universität Berlin

Qualitätsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 11: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha11

Freie Universität Berlin

Web-Applikation/Qualitätsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 12: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha12

Freie Universität Berlin

Web-Applikation/Qualitätsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 13: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha13

Freie Universität Berlin

Web-Applikation/Qualitätsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 14: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha14

Freie Universität Berlin

Web-Applikation/Qualitätsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 15: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha15

Freie Universität Berlin

Web-Applikation/Normalisierung

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 16: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha16

Freie Universität Berlin

Web-Applikation/Korrelationsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 17: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha17

Freie Universität Berlin

Web-Applikation/Korrelationsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 18: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha18

Freie Universität Berlin

Korrelationsanalyse

Untersuchter Datensatz: CD14, CD14_Ctl und mit IFN-α2a stimulierte CD14

1808 Korrelationspaare mit Korrelationskoeffizient >=0,99 für co-regulierte Gene bzw. <=-0,99 für entgegengesetzt regulierte Gene

869 Gene gehören zu diesem Netzwerk

Hierarchisches Clustering der Korrelationsmatrix zwischen allen beteiligten Genen und der Intensitätsmatrix

CD14 IFNa2a Datensatz

ND_51_CD14

ND_52_CD14

ND_53_CD14

ND_5_CD14_IFNa2a_90

ND_6_CD14_IFNa2a_90

ND_7_CD14_IFNa2a_90

ND_8_CD14_IFNa2a_90

ND_5_CD14_Ctl_90

ND_6_CD14_Ctl_90

ND_7_CD14_Ctl_90

ND_8_CD14_Ctl_90

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 19: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha19

Freie Universität Berlin

Korrelationsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

869 Gene

Page 20: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha20

Freie Universität Berlin

Korrelationsanalyse Filterungsmethode

Entfernung...

aller Korrelationen, die Probesets ohne Genzuweisung enthalten

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

von „Ausreißer“ Korrelationen durch Ermittlung von Standardabweichung (SD), Mittelwert (M) getrennt für die Kontrolle („CD14_Ctl“) und IFN-α2a und Ausschluss der Gene, deren SD/M Ratio >60% für die Kontrollen und >100% für IFN-α2a Stimulationen liegt

von Genen mit ähnlicher Expression in den Kontrollzuständen („CD14_Ctl“) und nach IFN-α2a Stimulation durch Ausschluss der Gene, deren SD/M Ratio über beide Zustände <60% liegt

Page 21: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha21

Freie Universität Berlin

Korrelationsanalyse Filterungsmethode

Entfernung aller Gene mit einer ähnlichen Expression in den CD14 Monozyten und nach IFN-α2a Stimulation durch die Ermittlung der maximalen Expressionswerte über beide Zustände und Ausschluss der Gene, deren Signalwert <31 ist

Einbeziehen von weiteren Stimulationen mit anderen Aktivatoren(TNF, LPS) in die Korrelationsberechnung und Filterung nach Korrelationskoeffizient >0,5 bzw. <-0,5

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 22: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha22

Freie Universität Berlin

Korrelationsanalyse

Minderung von 1808 auf 543 Korrelationen

Spezifizierung von 869 auf 151 beteiligte Gene

Stärkere Reduktionen durch die Entfernung von Genen mit stark streuender Expression innerhalb einer Gruppe und durch Hinzunahme von anderen Stimulationszuständen

Einbeziehen von mehreren Funktionszuständen -> Steigerung der Spezifität der Co-Expressionen.

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 23: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha23

Freie Universität Berlin

Korrelationsanalyse

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

151 Gene

869 Gene

Page 24: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha24

Freie Universität Berlin

Korrelationsanalyse

CD14 TNF Datensatz und CD14 IFN Datensatz niedriger Überlappungsgrad IFN induzierte Netzwerke haben eine hohe Spezifität für IFN

Überlappungsgrad von 52% zw. CD14 IFN und CD14 LPS LPS löst molekulare Reaktionen aus, die auch IFN induzieren

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

IFN TNF LPS cell types

IFN cell types

TNF cell types

LPS cell types

cell types

CD14 IFN TNF LPS

CD14 LPS

CD14 TNF

CD14 IFN

CD14 IFN LPS

CD14 IFN TNF

CD15 IFN

CD4 IFN

CD8 IFN

CD56 IFN

CD19 IFN

CD4 CD8 CD19 CD56 IFN

0%

20%

40%

60%

80%

100%

120%

Verteilung von Korrelationswerten

Page 25: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha25

Freie Universität Berlin

Korrelationsanalyse 151 Gene des IFN-induzierten Co-Expressionsnetzwerken Annotationsdatenbanken: KEGG Signalwege, Gene Ontology

biologische Prozesse

KEGG Signalwege:Cytokine-cytokine receptor interactionChemokine signaling pathway

GeneOntology:Cytokine-mediated signaling pathwaytype I interferone-mediated signaling pathwayresponse to virusinterferone-gamma-mediated signaling pathwayimmune response

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 26: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha26

Freie Universität Berlin

Diskussion

gezielte Auswahl der funktionellen Zuständen

Filterungsmethoden auf CD14 LPS Datensatz (713) und CD14 TNF Datensatz (2059)

Schnittmenge aller 3 Datensätzen -> 16 Gene

molekulare Interaktionen im Reagenzglas molekulare Reaktion bei jeder Immunaktivierung

Bezug zu den Signalwegmodellen

Referenzsignaturen im Sinne von Co-Regulationsnetzwerken

Einleitung

Material und Methoden

ErgebnisseQualitätsanalyseWeb-ApplikationKorrelationsanalyse

Diskussion

Page 27: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha27

Freie Universität Berlin

Page 28: Jekaterina Kokatjuhha Fachbereich Mathematik und Informatik Institut für Informatik Studiengang Bioinformatik Bachelorarbeit Identifizierung von Genexpressions-Netzwerken

Jekaterina Kokatjuhha28

Freie Universität Berlin

Quellenverzeichniss

Adelmeyer M, Warmuth E,. Finanzmathematik für Einsteiger: Von Anleihen über Aktien zu Optionen (2005) vieweg - 2.Auflage Alberts B, et al.. Molekularbiologie der Zelle (2004) Wiley-VCH - 4.Auflage Allocco DJ, Kohane IS, Butte AJ. Quantifying the relationship between co-expression, co-regulation and gene function (2004) BMC Bioinformatics http://

www.biomedcentral.com/1471-2105/5/18 Berrar DP, Dublitzky W, Granzow M. A Practical Approach to Microarray Data Analysis (2002) Kluwer Carmona-Saez P, Chagoyen M, Tirado F, Carazo JM, Pascual-Montano A. GENECODIS: A web-based tool for finding significant concurrent annotations in

gene lists (2007) Genome Biology 8(1):R3 Creighton CJ, Nagaraja AK, Hanash SM, Matzuk MM, Gunaratne PH. A bioinformatics tool for linking gene expression profiling results with public databases

of microRNA target predictions (2008) RNA Society Crowley J, Ankerst DP. Handbook of Statistics in Clinical Oncology (2006) Chapman & Hall/CRC - 2.Auflage De Rinaldis E, Lahm A. DNA Microarrays Current Applications (2007) Horizon - 1.Auflage) Drặghici S. Statistics and Data Analysis for Microarrays Using R and Bioconductor (2012) CRC PressTaylor & Francis Group - 2.Auflage Emmert-Streib F, Dehmer M. Analysis of Microarray Data (2008) Wiley-VCH Janeway CA, Travers P, Walport M, Shlomchik M. Immunologie (2002) Spektrum - 5.Auflage Hanahan D, Weinberg Ra. Hallmarks of cancer: the next generation (2011) Cell Zeitschrift

Hartung J, Elpelt B, Klösener K.-H. Statistik: Lehr- und Handbuch der angewandten Statistik (2005) Oldenbourg - 14.Auflage Hofmann WK. Gene Expression Profiling by Microarrays: Clinical Implications (2006) Camridge University Press - 1.Auflage Hübner J. Komplementäre Onkologie: supportive Maßnahmen und evidenzbasirte Empfehlungne (2008) Schattauer Knudsen S. Cancer Diagnostics with DNA Microarrays (2006) Wiley-Liss Murphy K, Travers P, Walport M. Janeway Immunologie (2009) Spektrum - 7.Auflage Müller-Esterl W. Biochemie (2004) Spektrum - 1.Auflage Nogales-Cadenas R, Carmona-Saez P, Vazquez M, Vicente C, Yang X, Tirado F, Carazo JM, Pascual-Montano A. GeneCodis: interpreting gene lists through

enrichment analysis and integration of diverse biological information (2009) Nucleic Acids Research. doi: 10.1093/nar/gkp416 Schendera CFG. Datenmanagement und Datenanalyse mit dem SAS-System (2004) Oldenburd

Shamith AS, Forster S, Auchettl K, Hertzog PJ. INTERFEROME: the database of interferon regulated genes (2009) Nucleic Acids Research Shoofs T, Müller-Tidow C. DNA methylation as a pathogenic event and as a therapeutic target in AML (2011) Cancel Treat Rev Siegenthaler W, Blum HE. Klinische Pathophysiologie (2006) Georg Thieme - 9.Auflage Sturn A, Quackenbush J, Trajanoski Z. Genesis: cluster analysis of microarray data (2002) Bioinformatics 18(1):207-8. Tabas-Madrid D, Nogales-Cadenas R, Pascual-Montano A. GeneCodis3: a non-redundant and modular enrichment analysis tool for functional genomics

(2012) Nucleic Acids Research. doi: 10.1093/nar/gks402 Wagener C, Müller O. Molekulare Onkologie: Entstehung, Progression, klinische Aspekte (2011) Thieme - 3.Auflage Weinberg JJM, Buchholz R. TNF-alpha Inhibitors (2006) Birkhäuser http://genecodis.cnb.csic.es/ abgerufen 10.08.2013 ArrayAnalysis http://www.arrayanalysis.org/, abgerufen 23.07.2013