Obduktion einer forensischen mtDNA Datenbank Hans-Jürgen Bandelt Fachbereich Mathematik...

Preview:

Citation preview

Obduktion einer forensischen mtDNA

Datenbank

Hans-Jürgen BandeltFachbereich Mathematik

Universität Hamburghttp://www.math.uni-hamburg.de/home/bandelt/

24. Spurenworkshop der Deutschen Gesellschaft für Rechtsmedizin in Köln (6.-7.2.2004)

H.-J. Bandelt & W. Parson  

Pathologie mitochondrialer

DNA Datensätze und Obduktion

der mtDNA Datenbank „D-Loop-BASE“

Eingereichter Artikel

Vorgeschichte

Auf dem 18. Spurenworkshop Magdeburg (13.-14.02.1998) waren 15 universitäre rechtsmedizinische Institute übereingekommen, eine forensische zentraleuropäische mtDNA Datenbank als gemeinsames Projekt am Magdeburger Institut zu installieren.

Auf dem 21. Spurenworkshop München (09.-10.02.2001) wurde von H. Wittig, K.-U. Sattler, D. Krause (Magdeburg) das realisierte Projekt „D-Loop-Base“ einer zentraleuropäischen Datenbank für nicht codierende mitochondriale Sequenzen vorgestellt:

„D-Loop-BASE im Internet - Eine neue Qualität der forensischen

mtDNA-Datenbank“

Holger Wittig, Mike Koecke, Kai-Uwe Sattler, Dieter Krause

D-Loop-BASE is online now Central European

database of mitochondrial DNA

International Congress Series 1239 (2003), S. 505–509

D-Loop-BASEhttp://www.d-loop-base.de/index1.htm

• Last database entry July 2001• Online since August 2001• Population samples:

1,266 from Germany, 195 from Switzerland, 102 from Austria, and 47 from 18 countries all over the world, 101 Asians; and several Africans

VorfallDie österreichische mtDNA Sequenz AUT56 von Parson et al. (1998), innerhalb des Rahmens16024–16400 (HV1) und 50–407 (HV2)sequenziert und an D-Loop-BASEeingesandt, wurde jetzt in D-Loop-BASE angefragt, aber konnte so nicht bestätigt werden!

Eingabedaten

HV1 Bereich 16024 - 16400

Abweichungen in HV116086.0 - C16129.0 - A16153.0 - A16214.0 - G16223.0 - T16271.0 - C16362.0 - C

HV2 Bereich 50 - 407

Abweichungen in HV273.0 - G106.0 - D107.0 - D108.0 - D109.0 - D110.0 - D111.0 - D263.0 - G309.1 - C315.1 - C

Ergebnis

Untersuchte Sequenzen Anzahl 9740 Abweichungen1 Abweichungen 2 Abweichungen 3 Abweichungen 4 Abweichungen 5 Abweichungen 6 Abweichungen 7 Abweichungen

0 0 0 0 0 0 0 0

8 Abweichungen9 Abweichungen 10 Abweichungen

1 0

2

usw. usw.

Weitere Ergebnisse:

• Anfrage gesondert für die HV1 Teilsequenz liefert 1 Treffer (d.h. 0 Abweichungen)!

• Anfrage gesondert für die HV2 Teilsequenz liefert 1 Treffer!

• Anfrage für HV1 & HV2 mit verkürztem Suchrahmen 16051–16365 & 73–340 liefert 1 Treffer!

„Good data quality is ensured by using

original sequences only.“

Wittig et al. (2000)

Forensic Science International 113, S. 113–118

Offensichtlich war D-Loop-BASE schon vor Onlinegang August 2001 als rechtsmedizinische mtDNA Datenbank dahingeschieden.

Eine Obduktion – virtuell im Netz durchgeführt – soll die Ursachen dafür klären.

Obduktionsergebnis Äußerer Befund:Feststellung der letalen Konzeptions-, Programmier,- und Eingabefehler

Innerer Befund:Rekonstruktion (in Teilen) des fehlerbehafteten Datenbestandes

Fachliche Stellungnahme

Äußerer BefundAnfrage der gesamten Kontrollregion HV1 (16024–16569) & HV2 (1–576) liefert 64 Sequenzen in D-Loop-BASE,

HV1 allein nur 44 Sequenzen;

HV2 allein nur 61 Sequenzen!

Letaler Programmierfehler!

Anfrage der artifiziellen Sequenz (Rekombinante)

16093.0-C 16224.0-C 16311.0-C

im Suchrahmen 16051–16365 & 72–340 liefert unter 1580 untersuchten Sequenzen 3 Treffer,

Aber dieselbe Sequenz angefragt im Suchrahmen 16051–16365 & 73–340 liefert unter 1581 untersuchten Sequenzen keinen Treffer!

Letaler Programmierfehler!

Anfragen einzelner Positionen: Suchrahmen HV1 16189–161891. Anfrage: – (d.h. CRS)2. Anfrage: 16189.0-T (wiederum CRS!)3. Anfrage: 16189.0-D (Deletion)4. Anfrage: 16189.0-G5. Anfrage: 16189.0-A6. Anfrage: 16189.0-C7. Anfrage: 16189.1-C (Insertion nach

16189)8. Anfrage: 16189.1-Ausw.11. Anfrage: 16189.0-C & 16189.1-C

Abweichungen: 0 1 2 3 4 >4--------------------------------------------------------------------CRS 1335 239 2 0 0 016189.0-T 0 1335 239 2 0 0 16189.0-D 0 1335 239 2 0 016189.0-G 0 1335 239 2 0 0 16189.0-A 1 1335 238 2 0 0 16189.0-C 238 1336 1 1 0 0 16189.1-C 0 1336 239 1 0 0 16189.1-A 0 1335 239 2 0 0 16189.1-G 0 1335 239 2 0 0 16189.1-T 0 1335 239 2 0 0 16189.0-C &16189.1-C 1 238 1335 1 1 0

Ergebnisse

Anfrage im Suchrahmen 16189–16190 mit 16189.0-C & 16189.1-C liefert 1 Treffer! D.h. 16189.1-C wurde regelwidrig kodiert!

Fazit:Sequenzen sind z.T. fehlerhaft eingegeben und unzulässig kodiert!

Jede Position mit mehr als zwei alternativen Nukleotiden wird hinsichtlich der Abweichungen falsch berechnet!

Folglich sind alle Abweichungsvektoren fehlerhaft!

„The D-Loop-BASE is now a profound basis for both frequency inquiries for expert opinions and scientific investigations into population genetic matters.“

Wittig et al. (2000)

Innerer BefundZiele:

1. Rekonstruktion der Teildatenbank „Negride“

2. Rekonstruktion der Teildatenbank „Mongolide“

3. Rekonstruktion einiger rekombinanter Sequenzen aus der Teildatenbank „Kaukasoide“

Unter „Negride“ gibt es nur 2 Sequenzen:

16093C 16129A 16189C 16278T 16300G 16311C 16354T 16390A 73G 146C 150T 195C 263G 315.1C

16129A 16183D 16189A 16215G 16223T 16278T 16294T 16311C 16360T 73G 151T 152C 182T 186A 189C 247A 263G 315A 315.1C

315A ist falsch: richtig wäre 316A!

Wittig et al. (2000)

„The original data are stored and supervised in a

separate database system with no online access.

It is part of our security system.“

Unter „Mongolide“ sollten sich die (fehlerhaften) 100 japanischen mtDNA Sequenzen von Seo et al. (1998) verbergen:Anfrage im Suchrahmen 16051–16399

von 16093C 16223T 16227G 16234T 16278T 16309G 16362C liefert:

Nächste Sequenz hat 3 Abweichungen.

Fast keine der originalen HV1 Teilsequenzen können durch Treffer bestätigt werden!

Ursache:Die einzige zusätzliche Sequenz hat nur eine obere HV1 Lesegrenze von 16261;

Dies hat durch Fehlprogrammierung intern alle anderen 100 Sequenzen nach 16261 abgeschnitten, so daß alle Mutationen danach als Abweichungen gezählt werden.

Werden all diese Mutationen weggelassen, so ergeben sich für 97 Sequenzen stets Treffer. Bei 3 Sequenzen haben wir überdies mit falschen Eingaben zu rechnen.

„Good data quality is ensured by using

original sequences only.“

Wittig et al. (2000)

Fehlerhafte Sequenzen (Rekombinanten) in der Teildatenbank „Kaukasoide“

fünfmal 16069T 16126C,

dreimal 16129A 16172C 16223T 16311C,

einmal 73G 263G 295T 309.1C 315.1C,

einmal 16069T 16126C 263G 309.1C 315.1C,

einmal 16069T 16126C 16193T 73G 152C 199C 204C 207A 250C 263G

309.1C 315.1C.

Anfragen im Suchrahmen 16051–16365 & 73–340 liefern als Treffer z.B.

Diese Sequenzen sind z.T. unpubliziert und dokumentieren ein erhebliches Ausmaß an Probenvertauschung im Labor oder Tabellenmix bei der Dokumentierung.

Es war der Magdeburger Gruppe seit dem Jahre 2001 bekannt, daß die von ihr betriebene Datenbank fehlerbehaftete publizierte sowie katastrophale unpublizierte Sequenzen enthält.

Fachliche StellungnahmeDie Magdeburger mtDNA Datenbank war zu keinem Zeitpunkt intakt:

schwere Konzeptionsmängel,

groteske Fehlprogrammierung,

falsche Eingaben,

fehlerbehaftete Sequenzen

lassen keinen wissenschaftlichen Wert und Zweck erkennen.

Donald Kennedy

Editor-in-Chief

Science 302 (5 Dec. 2003), p. 1625

EpilogMitochondriale DNA ist für die

Rechtsmedizin ein nebensächlicher Marker – der allerdings nicht nur so nebenher sequenziert werden kann, ohne daß schwerwiegende Artefakte

entstünden.Mitochondriale DNA Sequenzierung in der Rechtsmedizin hat dokumentiert, daß die grundsätzliche Problematik

der notorischen Präparateverwechslung und

Probenvertauschung noch nicht wirklich in den Griff

bekommen worden ist.

„Über die Ursache der Verwechslungen sollteKlarheit erlangt werden, umweiteren Verwechslungen vorzubeugen.“

Recommended