Upload
ngohuong
View
216
Download
1
Embed Size (px)
Citation preview
UNIVERSITEIT GENT
FACULTEIT FARMACEUTISCHE WETENSCHAPPEN
Vakgroep Farmaceutische Analyse
Laboratorium voor Analytische Chemie
Academiejaar 2010-2011
Manon BUYL
Eerste Master in de Farmaceutische Zorg
Promotor
Prof. Dr. L. Thienpont
Commissarissen
Dr. K. Van Uytfanghe
Prof. Dr. W. Lambert
VALIDATIE VAN EEN HPLC METHODE VOOR
DIPROPYLFTALAAT EN LITERATUURONDERZOEK
OVER STATISTISCHE ASPECTEN BIJ DE
INTERPRETATIE VAN DE DETECTIELIMIET
UNIVERSITEIT GENT
FACULTEIT FARMACEUTISCHE WETENSCHAPPEN
Vakgroep Farmaceutische Analyse
Laboratorium voor Analytische Chemie
Academiejaar 2010-2011
Manon BUYL
Eerste Master in de Farmaceutische Zorg
Promotor
Prof. Dr. L. Thienpont
Commissarissen
Dr. K. Van Uytfanghe
Prof. Dr. W. Lambert
VALIDATIE VAN EEN HPLC METHODE VOOR
DIPROPYLFTALAAT EN LITERATUURONDERZOEK
OVER STATISTISCHE ASPECTEN BIJ DE
INTERPRETATIE VAN DE DETECTIELIMIET
AUTEURSRECHT
“De auteur en de promotor geven de toelating deze masterproef voor consultatie beschikbaar
te stellen en delen ervan te kopiëren voor persoonlijk gebruik. Elk ander gebruik valt onder de
beperkingen van het auteursrecht, in het bijzonder met betrekking tot de verplichting
uitdrukkelijk de bron te vermelden bij het aanhalen van de resultaten uit deze masterproef.”
6 juni 2011
Promotor
Prof. Dr. L. Thienpont
Auteur
Manon Buyl
DANKWOORD
Woorden schrijven is niet zo moeilijk, de kunst is echter er een thesis van te maken. Eén van
mijn allereerste gesprekken met Dr. Stöckl gingen over kunst, muziek en schoonheid. Bij deze
wil ik ook graag mijn thesis in schoonheid beginnen met dit dankwoord.
Wetenschap is eigenlijk net zoals muziek maken: iedereen draait mee in een orkest en heeft
zijn rol in het geheel, naar muzikaliteit en karakter. Als masterstudente ben ik opgenomen
geweest in een goed orkest met prima mensen en een leuke melodie. Dit orkest staat onder
leiding van Professor Thienpont, een dirigente met een visie en enorme vakkennis die met
haar orkest de top wil bereiken. Ik bedank haar voor de kansen die ik gekregen heb te leren
en ontdekken hoe het orkest functioneert. Evenals dank ik haar voor de finale orkestratie en
ondersteuning van dit werk.
Graag wil ik ook Dr. Stöckl bedanken die als ervaren percussionist ons leerde luisteren naar
de maat en het ritme en mij geleerd heeft kritisch na te denken. Hij was ook diegene die ons
leerde hoe we de muziek moeten beschouwen en die klaarstond met wijze raad en daad.
Mijn dank gaat ook uit naar Katleen, de eerste viool, die mij binnen het orkest wegwijs heeft
gemaakt en de diverse secties heeft laten ontdekken. Ze is als een concertmeester die de
melodie speelde. Ik wil ook mijn dank betuigen aan Tania en Hilde, de celli die een dragende
en ondersteunende functie vertolken binnen het orkest. Graag wil ik ook de dames aan het
koper bedanken, met name Hedwig en Sofie. Ook al speelden jullie een andere melodie,
desalniettemin speelt iedere toon een belangrijke rol in het orkest.
Mijn dank gaat ook uit naar Sara en Linde, bij de houtblazers, waarbij Sara een hele
muzikale invulling gegeven heeft als haar rol als fluitiste.
Ook wil ik Arno bedanken met wie ik samen in dit orkest gestapt ben en met wie ik vele leuke
en muzikale momenten beleefd heb.
Tot slot wil ik ook het publiek bedanken, mijn familie en vrienden die mij gesteund hebben en
soms valse noten of onbegrijpelijk zware symfonieën hebben moeten aanhoren. Graag wil ik
ook Bernard bedanken voor de steun en het vertrouwen in een goede afloop. Een speciaal
woord wil ik richten tot mijn mama die me gesteund heeft in mijn passie voor muziek en die
me heeft geleerd om door te zetten, ook al waren er soms harde noten te kraken.
INHOUDSOPGAVE
DANKWOORD
LIJST MET GEBRUIKTE AFKORTINGEN
DEFINITIES
METROLOGISCHE TERMEN IN HET NEDERLANDS
1. INLEIDING ............................................................................................................................................ 1
1.1. METHODEVALIDATIE ................................................................................................................. 1
1.2. FTALATEN..................................................................................................................................... 3
1.2.1. Chemische en fysische eigenschappen ...................................................................................... 3
1.2.2. Gebruik ................................................................................................................................... 3
1.2.3. Gezondheid .............................................................................................................................. 4
2. OBJECTIEVEN ..................................................................................................................................... 5
3. MATERIALEN EN METHODEN ......................................................................................................... 6
3.1. MATERIALEN ............................................................................................................................... 6
3.2. STANDAARDEN EN STALEN ....................................................................................................... 6
3.3. APPARATUUR ............................................................................................................................... 8
3.3.1. HPLC toestel ........................................................................................................................... 8
3.3.2. Randapparatuur ...................................................................................................................... 9
3.4. METHODEN ................................................................................................................................... 9
3.4.1. Systeemcontrole ....................................................................................................................... 9
3.4.2. Validatie ................................................................................................................................ 12
3.5. STATISTIEK ................................................................................................................................. 19
3.6. LITERATUURONDERZOEK ....................................................................................................... 19
4. RESULTATEN ..................................................................................................................................... 20
4.1. SYSTEEM ..................................................................................................................................... 20
4.1.1. Systeemfunctiecontrole ........................................................................................................... 20
4.1.2. Systeemgeschiktheidscontrole................................................................................................. 20
4.2. VALIDATIE .................................................................................................................................. 21
4.2.1. Lineariteit .............................................................................................................................. 21
4.2.2. Kalibratie .............................................................................................................................. 23
4.2.3. Imprecisie .............................................................................................................................. 24
4.2.4. Detectielimiet ........................................................................................................................ 26
4.2.6. Methodenvergelijking ............................................................................................................ 28
4.2.7. Samenvatting validatie experimenten...................................................................................... 32
4.3. LITERATUURONDERZOEK ....................................................................................................... 33
4.3.1. VERSCHILLENDE BEPALINGEN VAN DE DETECTIELIMIET ............................................ 33
4.3.2. BENADERING BESCHREVEN VOLGENS CURRIE .............................................................. 38
4.3.3. BENADERING VOLGENS LINNET ....................................................................................... 43
4.3.4. Vergelijken principe van Linnet en Currie .............................................................................. 46
5. CONCLUSIE ........................................................................................................................................ 47
6. BIBLIOGRAFIE .................................................................................................................................. 49
ADDENDUM
LIJST MET GEBRUIKTE AFKORTINGEN
°C Graden Celsius
Å Ångström
ANOVA “Analysis of Variance” (Variantie Analyse)
AOAC “Association of Analytical Communities”
B “Standard Deviation of the Dialy Means” (Standaarddeviatie van het Daggemiddelde)
CI “Confidence Interval” (Betrouwbaarheidsinterval)
CL “Confidence Limits” (Betrouwbaarheidslimieten)
CLSI “Clinical and Laboratory Standards Institute”
CV “Coefficient of Variation” (Variatiecoëfficiënt)
D2 Deuterium
DBP “Dibutyl Phthalate” (Dibutylftalaat)
DEP “Diethyl Phthalate” (Diethylftalaat)
DMP “Dimethyl Phthalate” (Dimethylftalaat)
DPP “Dipropyl Phthalate” (Dipropylftalaat)
EP “Evaluation Protocol” (Evaluatieprotocol)
FDA “Food and Drug Agency”
HN-IQC “High-Normal Internal Quality Control” (Hoog-Normale Interne Kwaliteitscontrole)
HPLC “High Pressure Liquid Chromatography”
ICH “International Conference on Harmonisation”
ISO “International Standard Organisation”
IUPAC “International Union of Pure and Applied Chemistry”
LC “Liquid Chromatography” (Vloeistofchromatografie)
L-IQC “Lower Internal Quality Control” (Laag Intern Kwaliteitscontrole)
LLoQ “Lower Limit of Quantification” (Lage Kwantificatielimiet)
LoD “Limit of Detection” (Detectielimiet)
LoQ “Limit of Quantification” (Kwantificatielimiet)
min minuten
mV Millivolt
ODS “Octadecyl Silane”
OLR “Ordinary Lineair Regression” (Gewone Lineaire Regressie)
PI “Prediction Interval” (Voorspellingsinterval)
PVC “Polyvinyl Chloride”
S/N “Signal/Noise” (Signaal/Ruis)
SD “Standard Deviation” (Standaarddeviatie)
sdd “Between-day Standard Deviation” (Binnen-dag Standaarddeviatie)
SE “Systemic Error” (Systemische Fout)
SFSTP “Societe Francaise des Sciences et Techniques Pharmaceutiques”
sT “Total Standard Deviation” (Totale Standaarddeviatie)
swr “Within-run Standard Deviation” (Binnen-analyse Standaarddeviatie)
TE “Total Error” (Totale Fout)
UL “Upper Limit” (Bovenste Limiet)
ULoQ “Upper Limit of Quantification” (Hoge Kwantificatielimiet)
US-FDA “United States Food and Drug Administration”
UV Ultraviolet
VIS “Visible” (zichtbaar)
WLR “Weighted Linear Regression” (Gewogen Lineaire Regressie)
DEFINITIES
Measurand [1]
Quantity intended to be measured.
Quantity [1]
Property of a phenomenon, body, or substance, to which a number can be assigned with
respect to a reference.
Measurement [1]
Process of experimentally obtaining one or more quantity values that can reasonably be
attributed to a quantity.
Measurement unit [1]
Scalar quantity, defined and adopted by convention, with which any other quantity of the
same kind can be compared to express the ratio of the two quantities as a number.
Value of a quantity [1]
Number and reference together expressing magnitude of a quantity.
Measurement standard [1]
Realization of the definition of a given quantity, with stated quantity value and measurement
uncertainty, used as a reference.
Error [1]
Difference of measured quantity value and reference quantity value.
Systematic error [1]
Component of measurement error that in replicate measurements remains constant or varies in
a predictable manner.
Bias [1]
Systematic measurement error or its estimate, with respect to a reference quantity value.
Random error [1]
Component of measurement error that in replicate measurements varies in an unpredictable
manner.
Trueness [1]
Closeness of agreement between the average of an infinite number of replicate measured
quantity values and a reference quantity value.
Accuracy [1]
Closeness of agreement between a measured quantity value and a true quantity value of the
measurand.
Precision [1]
Closeness of agreement between indications obtained by replicate measurements on the same
or similar objects under specified conditions.
Uncertainty [1]
Parameter characterizing the dispersion of the quantity values being attributed to a
measurand.
Selectivity [1]
Capability of a measuring system, using a specified measurement procedure, to provide
measurement results, for one or more measurands, that do not depend on each other nor on
any other quantity in the system undergoing measurement.
Specific (in analysis)
A term which expresses qualitatively the extent to which other substances interfere with the
determination of a substance according to a given procedure. Specific is considered to be the
ultimate of selective, meaning that no interferences are supposed to occur
(http://goldbook.iupac.org).
Calibration [1]
Operation that, under specified conditions, in a first step establishes a relation between the
quantity values with measurement uncertainties provided by measurement standards and
corresponding indications with associated measurement uncertainties and, in a second step,
uses this information to establish a relation for obtaining a measurement result from an
indication.
Sensitivity [1]
Quotient of the change in the indication and the corresponding change in the value of the
quantity being measured.
Linear range
Concentration range over which the intensity of the signal obtained is directly proportional to
the concentration of the species producing the signal (http://goldbook.iupac.org).
Linearity (generic)
Ability of an analytical procedure to produce test results which are proportional to the
concentration (amount) of an analyte, either directly or by means of a well-defined
mathematical transformation.
Working interval [1]
Set of values of the quantities of the same kind that can be measured by a given measuring
instrument or measuring system with specified instrumental uncertainty, under defined
conditions.
Limit of detection (in analysis)
The limit of detection, expressed as the concentration, cL, or the quantity, qL, is derived from
the smallest measure, xL, that can be detected with reasonable certainty for a given analytical
procedure. The value of xL is given by the equation xL = xbi + k • sbi, where xbi is the mean
of the blank measures, sbi is the standard deviation of the blank measures, and k is a
numerical factor chosen according to the confidence level desired (http://goldbook.iupac.org).
Limit of detection [1]
Measured quantity value, obtained by a given measurement procedure, for which the
probability of falsely claiming the absence of a component in a material is β, given a
probability α of falsely claiming its presence.
Ruggedness (USP)
Degree of reproducibility of the results obtained under a variety of conditions, expressed as
%RSD. These conditions include different laboratories, analysts, instruments, reagents, days,
etc.
Robustness (ICH Q2A 1995)
The robustness of an analytical procedure is a measure of its capacity to remain unaffected by
small, but deliberate variations in method parameters and provides an indication of its
reliability during normal usage.
Referentie:
[1] BIPM, IEC, IFCC, ISO, IUPAC, IUPAP, OIML,.2007.
Metrologische termen in het Nederlands
Accuracy Nauwkeurigheid
Trueness Juistheid
Precision Precisie
Repeatability Herhaalbaarheid
Reproducibility Reproduceerbaarheid
Limit of detection Aantoonbaarheidsgrens
Limit of quantification Bepaalbaarheidsgrens
Referentie:
Maas C, Bravenboer J, van der Putten A, Salm M. Validatie van methoden. De Ware
Chemicus 1993;23:90-106.
Belgisch Instituut voor Normalisatie (BIN). Algemene criteria voor de werking van
beproevingslaboratoria (NBN – EN 45001). Brussel: BIN, 1990:7.
Nederlands Meetinstituut. Metrologische termen. www.nmi.nl
Thomas Linsinger. Vergelijking van een meetresultaat met de gecertificeerde waarde.
Application Note 1. Europese Gemeenschappen, 2005.
1
1. INLEIDING
1.1. METHODEVALIDATIE
Deze thesis handelt over de validatie van een HPLC-UV methode voor de bepaling van
dipropylftalaat (Dipropyl Phthalate, DPP). Validatie wordt volgens de ISO 9000-richtlijnen
gedefinieerd als: “confirmation, through the provision of objective evidence, that the
requirements, for a specific intended use or application have been fulfilled” (International
Standard ISO 9000, 2005). Algemeen wordt er dus nagegaan of een bepaalde analysemethode
geschikt is voor een bepaalde toepassing.
Noteer dat er een onderscheid dient gemaakt te worden tussen evaluatie- en validatie van
een methode. Hierbij is evaluatie een schatting van de prestatie van de toepassing en validatie
een toets van de schatting ten opzichte van aanvaardbaarheidscriteria voor de gespecificeerde
toepassing. Het is belangrijk om dit onderscheid te maken, om uit te maken welk type van
aanvaardbaarheidscriteria er dienen gebruikt te worden. Bij evaluatie van een methode kan dat
met behulp van zowel statistische- als analytische specificaties. Voor validatie van een
methode worden toepassingsgedreven specificaties gebruikt (Stöckl, 2007).
Om een succesvolle validatie uit te voeren, moet er eerst een validatieplan worden
uitgestippeld. Hierin wordt de toepassing, het toepassingsgebied en het doel van de methode
gedefinieerd. De te valideren prestatiekarakteristieken met bijhorende
aanvaardbaarheidscriteria of specificaties worden er ook in vastgelegd. Voor ieder experiment
dient er een validatieprotocol te worden gezocht of opgesteld. Er moet gebruik gemaakt
worden van gekwalificeerde materialen (zie 3.1.). Vervolgens kan gestart worden met het
uitvoeren van de validatie-experimenten. De resultaten van deze experimenten moeten
zorgvuldig worden gedocumenteerd. Deze worden ten slotte op een statistische manier
verwerkt en geïnterpreteerd (Stöckl, 2007).
De geschiktheid van een analysemethode wordt nagegaan aan de hand van verschillende
experimenten, deze zijn afhankelijk van de prestatiekarakteristieken die men wenst te
valideren. De experimenten die uitgevoerd worden gedurende de methodevalidatie zijn
gebaseerd op experimentele protocollen zoals deze van de Clinical and Laboratory Standards
Institute (CLSI) (Stöckl, 2007). De prestatiekarakteristieken die onderzocht zullen worden zijn
weergegeven in Tabel 1.1.
2
Tabel 1.1 Overzicht prestatiekarakteristieken die worden onderzocht tijdens de
methodevalidatie.
Wanneer de resultaten verzameld zijn, moet er beslist worden of deze voldoen aan de
vooropgestelde specificaties of niet. Dit kan op twee manieren: (i) bij de „oude‟ interpretatie
werd een beslissing genomen zonder een betrouwbaarheidsinterval (Confidence Interval, CI)
in acht te nemen. Hierbij werden de „naakte‟ waarden vergeleken met de specificaties en ging
er informatie verloren over het aantal metingen dat werd uitgevoerd en over de imprecisie van
de methode, (ii) de „moderne‟ interpretatie daarentegen vereist wel het gebruik van CI en
statistische significantietesten. In deze thesis zullen de gegevens volgens deze laatstgenoemde
manier geïnterpreteerd worden (Stöckl, 2007).
Wanneer er een -op statistiek gebaseerde- beoordeling wordt gemaakt hangt deze af van
het type aanvaardbaarheidscriteria dat gebruikt wordt, zoals reeds hierboven vermeld. Voor
statistische specificaties wordt de statistische test vergeleken met de nulhypothese. Bij
analytische specificaties wordt de statistische test vergeleken met de geschatte waarde bij een
stabiel proces. Voor de toepassingsgedreven specificatie wordt de statistische test vergeleken
met de validatielimiet. De statistische test kan bv. een F-test of een t-test zijn. Alternatief kan
er ook een 95% CI opgesteld worden (Stöckl, 2007).
Prestatiekarakteristieken
Lineariteit
Kalibratie
Imprecisie
Detectielimiet
Juistheid
Methodevergelijking
3
1.2. FTALATEN
1.2.1. Chemische en fysische eigenschappen
Ftalaten zijn esters van ortho-ftalaatzuur (C6H4(CO2H)2). Dit is een aromaat met twee
carbonzure groepen in ortho-configuratie. De algemene structuur van een ftalaat is
weergegeven in Figuur 1.1.
Figuur 1.1 Algemene structuur ftalaat (APEC)
De ftalaten onderscheiden zich in hun zijketen (R en R‟). De meest voorkomende
ftalaten zijn diethylftalaat (Diethyl Phthalate, DEP) (C6H4(COOC2H5)2) waarbij R en R‟ een
ethylfunctie zijn, dibutylftalaat (Dibutyl Phthalate, DBP) (C6H4[COO(CH2)3CH3]2) met een
butylgroep als R en R‟. Dit onderzoek spitst zich toe op DPP (C6H4[COO(CH2)2CH3]2)
waarbij beide R-groepen een propylfunctie zijn (ECPI, 2010).
DPP is stabiel bij normale temperatuur en druk. Het bevindt zich bij kamertemperatuur
in vloeibare toestand en is kleurloos. Het kookpunt bedraagt 317.5°C, de densiteit is
1.078 g/mL bij 25 °C. Het moleculair gewicht is 250.29 g/mol (Chemcas, 2011).
1.2.2. Gebruik
Ftalaten worden hoofdzakelijk gebruikt als weekmaker in polyvinyl chloride (PVC)
om deze zacht en flexibel te maken. PVC wordt aangewend voor verschillende doeleinden,
van vloerbekleding over speelgoed tot kabelomhulsel, zelfs als bestanddeel van medisch
materiaal en voedingsverpakking. Net door het gebruik van een weekmaker is er een
uitgebreid gebruik van PVC mogelijk in verschillende disciplines (ECPI, 2010).
4
Ftalaten worden niet enkel aangewend in PVC. Bepaalde ftalaten worden ook gebruikt
in cosmetica, als oplosmiddel en geurverspreider. Ze kennen ook een toepassing in lijmen,
verven en inkten (ECPI, 2010).
1.2.3. Gezondheid
Ondanks het feit dat ftalaten al meer dan 50 jaar gebruikt worden, bestaat er veel
controverse over het al dan niet schadelijk zijn van deze stoffen. De ftalaten gebruikt als
weekmaker zijn niet chemisch gebonden aan PVC. Ze kunnen lekken en migreren in voeding
en andere materialen. Producten die ftalaten bevatten en door consumenten gebruikt worden
kunnen dus resulteren in humane blootstelling door direct contact bij gebruik. Indirecte
blootstelling gebeurt door het lekken in andere producten of algemeen vervuiling van het
milieu. Mensen worden blootgesteld aan ftalaten door inslikken, inademen en dermaal contact
(Heudorf, et al., 2007). De primaire blootstelling aan ftalaten gebeurt bij het innemen van
voeding, voornamelijk voeding met hoog vetgehalte. Ftalaten met een laag moleculair
gewicht (DEP, DBP) worden voornamelijk dermaal geabsorbeerd. Hoe vluchtiger het ftalaat,
hoe makkelijker geabsorbeerd via inhalatie (ATSDR, 1995).
Een andere mogelijke bron voor blootstelling aan ftalaten is medicatie. De nood voor
plaats-specifieke dosering van medicatie heeft geleid tot het gebruik van enterische coatings.
Coating bestaat algemeen uit verschillende polymeren die weekmakers bevatten, inclusief
ftalaten zoals DEP en DBP (Hauser, et al., 2004). Ook medische apparatuur bevat ftalaten en
vormt daardoor een bron voor significante blootstelling van vatbare patiëntengroepen zoals
deze op intensieve zorgen (Schettler, 2006).
Blootstelling aan ftalaten resulteert in het algemeen in lage toxiciteit. Bij volwassen dieren
zijn de effecten van ftalaten op de reproductiviteit goed gekarakteriseerd. Zo treed er schade
op aan de gonaden na blootstelling aan hoge dosissen. Resultaten van recente studies geven
aan dat het voortplantingstelsel van ontwikkelende dieren zeer gevoelig is aan bepaalde
ftalaten. De fenotypische veranderingen die geobserveerd worden in mannelijke
nakomelingen van ratten, die gedurende de perinatale periode zijn blootgesteld, vertonen
opvallende kenmerken met menselijke voortplantingsstoornissen zoals cryptorchisme,
hypospadie en een laag aantal zaadcellen (Martino-Andrade, et al., 2010).
5
2. OBJECTIEVEN
De objectieven voor deze thesis bestaan uit twee delen. Het eerste deel handelt over een
validatie van een HPLC-UV methode voor de bepaling van DPP. In het tweede deel wordt
een literatuuronderzoek uitgevoerd over de statistische aspecten bij het interpreteren van de
detectielimiet.
Dagelijks, voordat de experimenten van start gaan, wordt het HPLC-UV toestel
gecontroleerd door het uitvoeren van een systeemgeschikheids- en systeemfunctiecontroletest.
Voor de validatie van DPP worden verschillende prestatiekenmerken onderzocht. De
experimenten die hieromtrent worden uitgevoerd zijn lineariteit, kalibratie, imprecisie,
juistheid en de detectielimiet. Voordat de validatie-experimenten van start gaan, worden
voorbereidende experimenten uitgevoerd voor het bepalen van een gepast regressiemodel. Er
wordt ook een methodevergelijking uitgevoerd aan de hand van gesimuleerde data.
Het is de bedoeling dat de experimenten zelfstandig gepland en uitgevoerd worden. Er
dient dan ook enige tijd uitgetrokken te worden om technieken zoals pipetteren en
oplossingen maken onder de knie te krijgen en om met het HPLC toestel te leren werken en
eventuele veranderingen toe te passen zoals een kolom vervangen. Alsook dient specifieke
software aangeleerd te worden om zelfstandig te kunnen werken.
Het literatuuronderzoek handelt over de detectielimiet en de verschillende statistische
theorieën die hieromtrent zijn ontstaan. De belangrijkste theorieën worden verder uitgediept.
Voor het literatuuronderzoek dient informatie verzamelt te worden uit verschillende
bronnen. Hiervoor moet de informatie op een kritische manier geëvalueerd kunnen worden.
6
3. MATERIALEN EN METHODEN
3.1. MATERIALEN
Er wordt 1 liter oplosmiddel gemaakt bestaande uit 77% methanol (gradiënt kwaliteit,
Romil Ltd,Cambridge, VK) en 23% water (super purity solvent, Romil Ltd). Dit wordt
bewaard bij 4°C. Het wordt gebruikt om glaswerk voor te spoelen en om stockoplossing,
standaarden en testmix aan te maken. De zuiverheid wordt onderzocht door een aantal keer
het oplosmiddel te injecteren en het bekomen chromatogram te controleren op interferenties
of onstabiele basislijn rond het retentievenster [3.0-5.0] minuten van DPP. De mobiele fase
wordt dagelijks opnieuw gemaakt en heeft dezelfde samenstelling als het oplosmiddel.
Er worden stockoplossingen gemaakt van dimethylftalaat (Dimethyl Phthalate, DMP)
(PESTANAL®, analytische standaard, Fluka - Sigma-Aldrich NV / MO, St. Louis, VS), DEP
(≥ 99.5% - Aldrich - Sigma-Aldrich NV), DPP (purum - ≥ 98.5% (HPLC) – Fluka - Sigma-
Aldrich NV) en uracil ( ≥ 99.0% - Sigma - Sigma-Aldrich NV). De stockoplossingen worden
bewaard bij 4°C. Er wordt van elk product 10 ml stockoplossing gemaakt op gravimetrische
wijze. Deze oplossingen worden gebruikt voor de aanmaak van stalen en standaarden.
De testmix wordt gebruikt voor de systeemgeschiktheidscontrole (zie 3.4.1.2.) en
bestaat uit gelijke concentraties van 3.12 µg/g van uracil, DMP, DEP en DPP. Uracil wordt
gebruikt om de dode tijd te bepalen. Er wordt 10 ml testmix gemaakt op gravimetrische wijze.
Dit wordt bewaard bij 4°C.
3.2. STANDAARDEN EN STALEN
De stalen voor de validatie van lineariteit en kalibratie worden gedefinieerd als
„standaarden‟. Er worden 5 standaarden gemaakt uitgaande van de stockoplossing van DPP
volgens het alternatieve mengprotocol beschreven in het CLSI-EP6 protocol. Tabel 3.1
beschrijft dit mengprotocol (CLSI, 2003).
7
Tabel 3. 1 Alternatief mengprotocol CLSI-EP6
Voor het bepalen van het concentratiebereik moeten er voorbereidende experimenten
uitgevoerd worden. De detectielimiet (Limit of Detection, LoD) van DPP wordt dan bepaald.
De LoD is de concentratie waarbij de signaal/ruis (Signal/Noise, S/N) gelijk is aan drie. Voor
het bepalen van de Lage Kwantificatielimiet (Lower Limit of Quantification, LLoQ) wordt de
concentratie voor LoD vermenigvuldigd met drie. Dit is eveneens de theoretische concentratie
van standaard 1. Voor Hoge Kwalificatielimiet (Upper Limit of Quantification, ULoQ) wordt
de concentratie van LLoQ vermenigvuldigd met vijftig. Dit geeft de theoretische concentratie
van standaard 5. De concentraties van LLoQ en ULoQ definiëren het werkbereik. De
bereiding van standaard 1 en 5 gebeurt gravimetrisch in maatkolven van 100 mL uitgaande
van de stockoplossing van DPP. De gravimetrisch bepaalde concentratie van standaard 1 en 5
bedragen respectievelijk 0.108 µg/g en 6.14 µg/g. De standaarden worden bewaard bij 4°C.
Zoals hierboven beschreven is de doelconcentratie voor het LoD-staal in de
voorbereidende experimenten bepaald. De stalen voor LoD worden dagelijks opnieuw
gemaakt. Standaard 1 wordt één op drie keer met oplosmiddel verdund. De concentratie wordt
gravimetrisch bepaald.
Voor de validatie van de imprecisie wordt het CLSI-EP5 protocol gevolgd. Dit schrijft
voor dat twee stalen gemaakt moeten worden. Het Lage Interne Kwaliteitscontrole staal (Low
Internal Quality Control (L-IQC) heeft een concentratie die in de buurt komt van de
concentratie van standaard 2. Het Hoog-Normale Interne Kwaliteitscontrole staal (High-
Normal Internal Quality Control, HN-IQC) benadert de concentratie van standaard 4. De
stalen worden bereid door de stockoplossing van DPP te verdunnen met oplosmiddel. Dit
gebeurt op gravimetrische wijze (CLSI, 2004).
Standaarden Benaming volgens concentratie Mengprotocol
Standaard 1 Laag Uit stockoplossing
Standaard 2 Medium laag Laag en medium (1:1)
Standaard 3 Medium Laag en hoog (1:1)
Standaard 4 Medium hoog Medium en hoog (1:1)
Standaard 5 Hoog Uit stockoplossing
8
Voor de validatie van de juistheid worden zes stalen gebruikt: drie stalen worden door
het labo afgeleverd, twee stalen zijn dezelfde als deze gebruikt voor de imprecisie-
experimenten en één staal wordt aangemaakt. De concentratie van alle stalen moet binnen het
werkbereik liggen. In Tabel 3.2 zijn alle stalen weergegeven met hun bijhorende
concentraties.
Tabel 3.2 Stalen en standaarden met bijhorende concentratie
Prestatiekenmerken Concentratie (µg/g)
Stockoplossing 1291
Standaard 1 0.108
Standaard 2 1.62
Standaard 3 3.11
Standaard 4 4.62
Standaard 5 6.14
L-IQC 2.68
HN-IQC 3.90
Juistheid staal 3.12
Juistheid onbekende 1 1.23
Juistheid onbekende 2 0.509
Juistheid onbekende 3 2.09
3.3. APPARATUUR
3.3.1. HPLC toestel
Het systeem bestaat uit een ontgasser DGU-20A5 (Shimadzu Corporation, Kyoto,
Japan), een UV-VIS detector SPD-20A „Prominence series‟ (Shimadzu Corporation) en een
pomp LC-20AT „Prominence series‟ (Shimadzu Corporation). Data wordt geregistreerd en
verwerkt met het programma LC solution versie 1.21 SP1 (Shimadzu Corporation).
Als injector wordt een manuele Rheodyne® 7725i injector gebruikt (Rheodyne®, CA,
VS) met een injectieloop van 5µL.
9
Er wordt gebruik gemaakt van een ODS hypersil kolom (Thermo Fisher Scientific
Inc., MA, VS). Dit is een C18 kolom die “end-capped” is met een partikel grootte van 5 µm
en een poriëngrootte van 120 Å. De dimensies van de kolom zijn 150 x 4.6 mm.
3.3.2. Randapparatuur
De stalen worden geïnjecteerd met een naald van 100 µL, model 710 van de 700
Series MICROLITER ® Syringes met een nauwkeurigheid tot op 1µL (Hamilton, Bonaduz,
Zwitserland).
Bij de bereiding van het oplosmiddel en de mobiele fase wordt voor de filtratie
gebruik gemaakt van een solvent filtratie apparaat (Alltech®, Deerfield, IL, VS) van 1L
aangesloten op een vacuumpomp. Hierbij worden filters gebruikt van Millipore type HVLP
0.45µm (Millipore, Billerica, MA, VS). Om eluens en mobiele fase te ontgassen wordt een
ultrasoon bad (Branson 1210, Bransonic®, Danbury, CT, VS) gebruikt.
Om de concentraties gravimetrisch te bepalen wordt gebruik gemaakt van een
analytische balans (Mettler AT261 DeltaRange ®, Mettler-Toledo GmbH, Laboratory &
Weighing Technologies, Greifensse, Zwitserland).
Om volumina te pipetteren worden er macropipetten (0.2 -2 ml; 1-10ml Calibras®
digital 832, Socorex Isba S.A., Ecublens, Zwitserland) en micropipetten (10-100µl, 20-200µl,
100-1000 µl Calibra® digital 822, Socorex Isba S.A.) gebruikt. Hierbij worden bijpassende
pipetpunten (ROLL s.a.s., Piove di Sacco, Italië) gebruikt. Het bepalen van de dichtheid
gebeurt met een draagbare dichtheidsmeter (DMA 35N, Anton Paar GmbH, Graz,
Oostenrijk).
3.4. METHODEN
3.4.1. Systeemcontrole
3.4.1.1. Systeemfunctiecontrole
Dagelijks wordt bij het opstarten van het HPLC-toestel gecontroleerd of het naar
behoren functioneert. Hiervoor worden een aantal operationele parameters gecontroleerd van
10
de pomp en de detector (zie Tabel 3.2). Indien aan de specificaties voor deze parameters
voldaan is kan overgegaan worden tot de systeemgeschiktheidscontrole (zie 3.4.1.2.).
Tabel 3.2 Parameters systeemfunctiecontrole voor HPLC
Parameters pomp
Totaal geleverde volume pomp < 180 L
Accuraatheid van het debiet ± 5 %
Parameters detector
Levensduur D2 lamp Maximum 2000 uur
Staal energie bij 220 nm > 800 mV
Referentie energie bij 220 nm > 800 mV
Ruis Maximum 0.006 mV
Basislijn stabiliteit over 5 minuten Maximum 0.01 mV
3.4.1.2. Systeemgeschiktheidscontrole
Deze controle wordt dagelijks uitgevoerd na de systeemfunctiecontrole (zie 3.4.1.1.).
Dit gebeurt om de algemene geschiktheid van het analytisch systeem voor de beoogde
toepassing te controleren voor de metingen van start gaan. De controle wordt uitgevoerd door
de testmix te injecteren en specifieke parameters te controleren voor DPP. Deze worden
vergeleken met opgelegde limietwaarden (zie Tabel 3.3). De parameters die gecontroleerd
worden zijn hieronder weergegeven, de formules zijn afkomstig uit de United States
Pharmacopeia (USP).
Retentietijd:
Retentietijd of afstand van de basislijn van het punt van injectie tot het loodrechte
snijpunt met de basislijn van het maximum van de piek dat overeenstemt met de component.
Oppervlakte en hoogte:
De piekoppervlakte is de oppervlakte onder de piek. De piekhoogte is de afstand
tussen het maximale punt van de piek loodrecht op de basislijn. Beide parameters zijn een
maat voor de hoeveelheid analyt.
11
Theoretisch plaatgetal:
(3.1)
N: Theoretisch plaatgetal
tR: Retentietijd (min)
W: Piekbreedte (min)
Het theoretisch plaatgetal, is een maat voor de kolomkwaliteit. Het theoretische
plaatgetal varieert met de component als ook met de kolom.
Symmetriefactor:
(3.2)
Tf: Symmetriefactor
W0.05: Breedte van de piek op vijf procent van de maximumhoogte (min)
: Piekbreedte van de eerste helft van de piek op 5% van de piekhoogte
(min)
Een waarde van één wijst op volledige symmetrie. Een waarde groter dan één wijst op
tailing. Een waarde kleiner dan één wijst op leading.
Resolutie:
(3.3)
Rs: Resolutie
tR en tpp: Retentietijd waarbij de tpp groter moet zijn dan tR.(min)
W en Wp: Piekbreedte halverwege de piekhoogte.(min)
Tabel 3. 3 Aanvaardbaarheidslimieten voor de parameters die gecontroleerd worden bij de
systeemgeschiktheidscontrole voor dipropylftalaat.
Parameters Aanvaardbaarheidslimiet voor DPP
Retentietijd (min) 3.99 ± 0.2
Oppervlakte 6600 ± 50%
Hoogte (mV) 900 ± 50%
Theoretisch plaatgetal Minimum 2000
Symmetriefactor Maximum 2
Resolutie Minimum 2
12
3.4.1.3. Analyse
Gedurende de validatie experimenten voor DPP wordt er gebruik gemaakt van een
isocratisch HPLC systeem. Dit wil zeggen dat de samenstelling van de mobiele fase constant
blijft gedurende de run. De mobiele fase heeft een samenstelling van 77% methanol en 23%
water. De pomp heeft een debiet van 1 mL/min. De UV-detector wordt ingesteld bij een
golflengte van 256 nm. Er wordt telkens ongeveer 30 µL analyt in de injector gebracht
(overvultechniek), hiervan gaat slechts 5µL over de kolom, omdat er gebruik wordt gemaakt
van een 5µL loop. Het injectievolume is hierdoor goed te reproduceren. De totale runtijd
bedraagt 5 minuten. Dagelijks wordt er een kalibratiecurve opgesteld om uit de
piekoppervlakte de overeenkomstige concentratie van het staal te bepalen. De kalibratie wordt
verder besproken bij de validatie (zie 3.4.2.). In Figuur 3.1 wordt een chromatogram
weergegeven van standaard 4 voor DPP met een concentratie van 4.62µg/g.
Figuur 3. 1 Chromatogram van standaard 4 gemeten op 31 maart 2011 met een concentratie
voor dipropyl ftalaat van 4.62 µg/g
3.4.2. Validatie
3.4.2.1. Lineariteit
Bij het bepalen van de lineariteit wordt het CLSI-EP6 protocol gevolgd. Dit schrijft
voor stalen te gebruikten die met elkaar gerelateerd zijn, zoals eerder beschreven bij de
standaarden en stalen (zie 3.2.). De vijf stalen worden in quadruplicaat gemeten en het
experiment wordt drie maal herhaald. Grafisch worden de waarden weergegeven in een
residuendiagram. Hieruit kan men vermoeden of er eventuele uitschieters aanwezig zijn. Dit
13
vermoeden wordt vervolgens al dan niet bevestigd met behulp van de Grubbs‟ test, hierbij
wordt getest op het 95% significantieniveau. Dit significantieniveau geldt voor alle verder
uitgevoerde Grubbs‟ testen. Indien er een uitschieter aanwezig is wordt deze uitgesloten voor
de verdere statistische verwerking. Uit het residuendiagram kan eveneens informatie gehaald
worden over de lineariteit. Zijn de punten in het diagram willekeurig verdeeld, dan wijst dit
op het bestaan van een verband. Bij de statistische verwerking wordt de “lack of fit”-test en de
tweedegraadspolynomiale test uitgevoerd. Deze zijn respectievelijk gebaseerd op de
ANOVA-test en lineaire regessie.
De lack of fit-test wordt gebruikt in het oudere CLSI-EP6 protocol. Dit is een soort
ANOVA test. Er wordt gebruik gemaakt van een éénzijdige F-test waarbij wordt nagegaan of
de variatie binnen de groepen verschillend is van de afstand van het gemiddelde tot de lijn.
Indien de verkregen p-waarde groter is dan vijf procent, is het verschil niet significant en kan
de nulhypothese aanvaard worden, en bestaat er dus een lineair verband. Deze test is sterk
afhankelijk van de variatie binnen de groepen. De test is minder gevoelig als een
tweedegraadspolynomiale test.
Bij de tweedegraadspolynomiale test –gebruikt in het nieuwe CLSI-EP6 protocol-
wordt een tweedegraadsfunctie opgesteld. De coëfficiënt van de hoogste exponent wordt met
behulp van een tweezijdige student‟s t-test getoetst op het 95% significantieniveau voor
significant verschil met nul. Indien de verkregen p-waarde groter is dan vijf procent, wordt de
tweedegraadsfunctie verworpen en is er een lineair verband. Indien de p-waarde kleiner is dan
vijf procent wijst dit erop dat de hoogste exponent verschillend is van nul. Indien het verband
niet lineair is, wordt het verschil tussen de resultaten bekomen via de vergelijking van
eerstegraads- en tweedegraadsfunctie getest tegen de specificatie van vijf procent. Wanneer
dit verschil groter is dan de specificatie van vijf procent is de fout te groot om toch een
eerstegraadsvergelijking toe te passen; is daarentegen het verschil kleiner dan vijf procent,
wordt toch de eerstegraadsfunctie gebruikt omdat de gemaakte fout nog aanvaardbaar geacht
wordt. Ondanks het feit dat het verband effectief tweedegraads is wordt er toch via een
eerstegraadsfunctie gewerkt.
14
3.4.2.2. Kalibratie
Om te onderzoeken wat het meest geschikte kalibratiemodel is worden dezelfde stalen
gebruikt als voor de lineariteit-experimenten (zie 3.2.). De stalen voor kalibratie worden
gedurende de methodevalidatie twee maal per dag gemeten, in stijgende en dalende
concentratie respectievelijk voor en na de experimenten. Het bepalen van het beste type
kalibratiecurve gebeurt door het vergelijken van vier typen kalibratiecurves, door middel van
vier verschillende regressiemodellen. Deze modellen zijn: ordinaire lineaire regressie
(Ordinary Linear Regression, OLR), OLR geforceerd door nul, OLR met nul als punt
inbegrepen en gewogen lineaire regressie (Weighted Linear Regression, WLR).
Het best passende regressiemodel wordt gekozen met behulp van de stalen die
gebruikt worden voor imprecisie (L-IQC- en HN-IQC staal). Van deze stalen wordt de
concentratie met de vier verschillende regressiemodellen berekend gedurende vijf dagen. De
variatie op de berekende concentratie met behulp van de variatiecoëfficiënt (Coefficient of
Variation, CV) en procentuele afwijking van de doelconcentratie wordt eveneens bepaald. De
methode met de laagste CV en procentuele afwijking kan beschouwd worden als het best
passende regressiemodel. Er kan ook getest worden of het intercept voor OLR significant
verschillend is van nul door een tweezijdig 95% CI op te stellen voor het intercept.
3.4.2.3. Imprecisie
Voor de validatie van de imprecisie wordt het CLSI-EP5 protocol gevolgd. Dit geeft
richtlijnen voor het uitvoeren van experimenten om de imprecisie te karakteriseren voor
chemische toepassingen. Het protocol stelt voorop dat er gedurende twintig dagen metingen
dienen uitgevoerd te worden. Hierbij worden dagelijks twee verschillende stalen gemeten in
duplicaat (zie 3.2.) (Kennedy, 2004).
Grafisch wordt in een puntendiagram de gemiddelde dagconcentratie uitgezet voor elk
staal. Er wordt eveneens een puntendiagram opgesteld voor het verschil van de
dagconcentraties. Hier kan gekeken worden of er mogelijks een uitschieter aanwezig is. De
aanwezigheid van een uitschieter kan onderzocht worden met behulp van de Grubbs‟ test.
Indien er uitschieters aanwezig zijn worden deze uitgesloten voor de verdere berekeningen.
15
Het protocol stelt specifieke berekeningen voor om statistisch de imprecisie te
bepalen. De volgende kenmerken worden berekend: binnen-analyse standaarddeviatie
(Within-run Standard Deviation, swr), standaarddeviatie van het daggemiddelde (Standard
Deviation of the Dialy Means, B), binnen-dag standaarddeviatie (Between-day Standard
Deviation, sdd) en de totale standaarddeviatie (Total Standard Deviation, sT). Hierbij worden
de bijpassende binnen-analyse CV (Within-run CV, CVwr) en totale analyse CV (Total CV,
CVT) berekend. De specificaties voor de CVwr en CVT bedragen respectievelijk 2% en 5%. Er
is aan de specificaties voldaan wanneer de experimentele CV‟s kleiner zijn dan de
vooropgestelde specificaties. Indien dit niet het geval is wordt door middel van de Chi²-test
nagegaan of de berekende experimentele Chi² waarde kleiner is dan de kritische Chi² waarde.
Een andere manier om statistisch de imprecisie te bepalen is met behulp van de single
factor ANOVA. Via het uitvoeren van deze test worden de swr, sdd en sT berekend. Hieruit kan
vervolgens de CVwr en CVT berekend worden (Stöckl, 2007).
3.4.2.4. Detectielimiet
Voor het bepalen van de LoD worden het staal gedurende dertien dagen gemeten in
enkelvoud (generisch protocol). Hiervan wordt de S/N ratio bepaald (zie Figuur 3.1). De ruis
wordt bepaald over een range van vijf maal de piekbreedte op vijftig procent van de
piekhoogte. Dit komt ongeveer overeen met vijftig meetpunten. Het signaal komt overeen met
de hoogte van de piek gemeten van het maximale punt tot de gemiddelde basislijn.
Figuur 3. 1 Illustratie van de bepaling van S/N verhouding (Dolan J.W., 2010)
16
De S/N-waarden worden grafisch weergegeven in een puntendiagram. Er kan gekeken
worden of er mogelijks uitschieters aanwezig zijn. Het al dan niet aanwezig zijn van
uitschieters kan berekend worden met behulp van de Grubbs‟ test. Indien er uitschieters
aanwezig zijn worden deze uitgesloten voor de verdere berekeningen.
Bij het berekenen van de S/N, wordt het gemiddelde van alle S/N waarden berekend.
Voor deze waarde wordt het CI bepaald. Er worden geen specificaties opgelegd voor de LoD
waarde.
3.4.2.5. Juistheid
De stalen voor juistheid (zie 3.2.) worden gedurende vijf dagen in singlicaat gemeten.
Grafisch worden de resultaten uitgezet ten opzichte van hun gemiddelde in een
verschildiagram. Dit diagram laat toe visueel na te gaan of er mogelijke uitschieters zijn. Voor
het statistisch testen op de aanwezigheid van uitschieters kan de Grubbs‟ test gebruikt
worden. Indien er uitschieters aanwezig zijn worden deze uitgesloten voor de verdere
berekeningen.
Het CI van het gemiddelde wordt eenzijdig berekend met behulp van volgende
formule:
(3.4)
CI: betrouwbaarheidsinterval
tα;v: students t-waarde voor significantieniveau α en “v”-vrijheidsgraden
SD: Standaarddeviatie
n: aantal metingen
Deze gegevens worden uitgezet in een procentueel verhoudingsdiagram waarbij
nagegaan wordt of de vooropgestelde specificatie van vijf procent overschreden wordt.
3.4.2.6. Methodevergelijking
Bij deze experimenten worden twee verschillende methoden met elkaar vergeleken.
Er wordt een gesimuleerde dataset ter beschikking gesteld, met specificaties zoals beschreven
17
in Tabel 3.3. Deze zijn geïnspireerd op eigen data bekomen uit de methodevalidatie
experimenten. De dataset geeft data voor een referentie- en routinemethode weer. Zij dienen
geïnterpreteerd te worden volgens de Bland & Altman (B&A)-benadering en volgens een
lineair regressiemodel.
Tabel 3. 4 Specificaties van de dataset gebruikt voor de methodevergelijking.
Gegevens Specificaties
Standaarddeviatie 0.1 µg/g
Werkbereik 0.1 – 6.1 µg/g
Gemiddelde 3.4 µg/g
Aantal resultaten 80
Een eerste evaluatie kan gebeuren op basis van een spreidingsdiagram. Hierin
worden de resultaten van beide methoden weergegeven. Bij gelijkwaardigheid van de twee
methoden heeft de trendlijn een richtingscoëfficiënt (rico) van één en een intercept van nul.
Afhankelijk van het concentratiebereik en de spreiding van de data rond de trendlijn kan het
echter moeilijk worden de verschillen tussen de methoden waar te nemen. Daarom wordt een
B&A-diagram gebruikt. Hiervan wordt zowel een procentueel als een absoluut
verschildiagram gemaakt. In beide gevallen worden de verschillen tussen de resultaten
bekomen met de testmethode ten opzichte van deze van de referentiemethode uitgezet.
Een maat voor de spreiding (1.96 SD) van de verschillen (d) wordt weergegeven als
„d ± 1.96 SD‟. Er wordt een CI opgesteld voor het gemiddeld verschil (Formule (3.4)) en voor
de „1.96 SD‟ (Formule (3.5)). Zowel d als 1.96 SD worden vergeleken met de vooropgestelde
specificaties voor systematische- en totale fout (systematic error, SE - Total error, TE).
Hierbij dient „d ± CI‟ binnen de limieten voor SE te liggen. De waarde voor „1.96 SD ± CI‟
dient binnen de limieten voor TE te liggen om te stellen dat beide methoden evenwaardig zijn.
(3.5)
CI (1.96 SD percentiel): confidentie-interval van 1.96 SD
tα;v: students t-waarde met α het significantieniveau en “v” de vrijheidsgraden
SD: Standaarddeviatie van het verschil tussen de individuele resultaten van de
methoden (µg/g)
n: aantal metingen
18
Het nadeel van de B&A-benadering is dat ze niet in staat is concentratie gebonden
fouten te detecteren. Daarom wordt er eveneens een regressieonderzoek, gebruikmakend van
OLR, uitgevoerd. Hierbij wordt nagegaan of er een lineair verband is tussen de twee
methoden. Grafisch wordt een spreidingsdiagram opgesteld aan de hand van de resultaten van
beide methoden. In het spreidingsdiagram wordt door deze resultaten een trendlijn
geconstrueerd. Deze geeft informatie over de proportionele en constante systematische fout
aan de hand van respectievelijk de rico en het intercept. Voor de minimale en maximale x-
waarde wordt de voorspelde y‟-waarde berekend. Voor y‟ (uitgedrukt als procentueel
verschil) wordt het CI opgesteld en dit wordt vergeleken met de vooropgestelde specificaties
voor de systematische fout. Voor y‟ wordt eveneens het voorspellingsinterval (Predictie
Interval, PI) opgesteld en dit wordt vergeleken met de vooropgestelde specificaties voor de
totale fout. Het CI drukt de onzekerheid van de trendlijn op de metingen uit terwijl het PI met
een bepaalde zekerheid de volgende meetresultaten bevat.
3.4.2.7. Specificaties
In Tabel 3.2 worden de specificaties weergegeven gebruikt tijdens de
methodevalidatie. Hierbij zijn de specificaties voor imprecisie doelwaarden voor een stabiel
proces. De overige specificaties daarentegen zijn limietstellingen.
Tabel 3. 5 Overzicht van de gebruikte specificaties voor de verschillende prestatiekenmerken
van de methodevalidatie
Prestatiekenmerken Specificaties
Imprecisie – CVwr 2 %1
Imprecisie – CVT 5 %1
Lineariteit 5 %2
Juistheid 5 %2
Methodevergelijking – totale fout 15 %2
Methodevergelijking – systemische fout 5 %2
1: Doelwaarde,
2: Limietstelling
19
3.5. STATISTIEK
Voor de statistische verwerking van de gegevens wordt gebruik gemaakt van CBstat
(Kristian Linnet, Charlottenlund, Denemarken) en Microsoft Excel 2007 (Microsoft
Corporation, Redmond, WA, VS). Voor de verwerking van de statistische gegevens van de
validatie wordt het Excel templaat Methval (STT-consulting, Horebeke, België) gebruikt.
3.6. LITERATUURONDERZOEK
Voor het literatuuronderzoek wordt informatie gezocht in verband met de detectielimiet.
Hiervoor worden eerst algemene zoekmachines gebruikt zoals “google” om algemene
informatie te verzamelen over het onderwerp. Vervolgens worden wetenschappelijke
zoekmachines gebruikt zoals “google scholar”, “pubmed” en “web of science” om de
zoekopdrachten te verfijnen. Er kan ook kennis gebaseerd gezocht worden in werken zoals de
“Europese Farmacopee”.
20
4. RESULTATEN
4.1. SYSTEEM
4.1.1. Systeemfunctiecontrole
De systeemfunctiecontrole wordt dagelijks uitgevoerd. Hierbij wordt aan alle
parameters voldaan die voorgeschreven zijn. Vooraleer de metingen van start gaan wordt
gewacht tot het systeem gestabiliseerd is. De ruis is dan kleiner dan 0.003 mV en de drift over
een periode van vijf minuten niet groter dan 0.01 mV. De druk van het gestabiliseerde
systeem wordt steeds genoteerd bij de desbetreffende mobiele fase en kolom. Deze druk
bedraagt gemiddeld (±SD) 68 ± 1.5 bar.
4.1.2. Systeemgeschiktheidscontrole
De systeemgeschiktheidscontrole wordt dagelijks uitgevoerd door de testmix te
injecteren. De parameters voor DPP worden gecontroleerd zoals beschreven bij de methoden
(zie 3.4.1.2.). Alle parameters voldeden aan de vooropgestelde specificaties. Het systeem
wordt hierdoor geschikt bevonden voor het uitvoeren van de validatie-experimenten voor
DPP. In Tabel 4.1 worden de gemeten parameters en de bijhorende aanvaardbaarheidslimieten
voor de systeemgeschiktheidscontrole weergegeven. In Figuur 4.1 is een chromatogram
weergegeven van een testmix.
Tabel 4. 1 Gemiddelde en standaarddeviatie van de parameters die gecontroleerd worden bij de
systeemgeschiktheidstest voor dipropylftalaat met bijhorende aanvaardbaarheidslimieten.
Parameters Gemiddelde ± SD Limieten
Retentietijd (min) 3.993 0.067 [3.79;4.19]
Oppervlakte 6672 89 [3300;9900]
Hoogte (mV) 917 19 [450;1350]
Theoretisch plaatgetal 6171 97 Minimum 2000
Tailing factor 1.148 0.009 Maximum 2
Resolutie 6.978 0.190 Minimum 2
21
Figuur 4. 1 Chromatrogram van de testmix met concentratie 3.12μg/g gebruikt voor
systeemgeschiktheidscontrole op 4 april 2011.
4.2. VALIDATIE
4.2.1. Lineariteit
Voor de lineariteitsvalidatie worden vijf stalen in quadruplicaat gemeten. Het
experiment wordt drie maal herhaald. In Figuur 4.2 zijn de diagrammen weergegeven van het
lineariteitsexperiment van 16 maart 2011. In Figuur 4.2 A is het residuendiagram
weergegeven. Er is geen duidelijke trend waar te nemen, waaruit men dus kan vermoeden dat
de waarden lineair zijn. Er kan ook worden nagegaan of er uitschieters aanwezig zijn met
behulp van de Grubbs‟ test. Dit blijkt niet het geval te zijn. In Figuur 4.2 B is het
spreidingsdiagram weergegeven. De correlatiecoëfficiënt geeft een goede correlatie weer.
DM
P
DE
P
DP
P
Ura
cil
22
Figuur 4. 2 Diagrammen van het lineariteitsexperiment van 16 maart 2011. A:
Residuendiagram. B: Spreidingsdiagram.
Voor de statistische verwerking van de gegevens wordt gebruik gemaakt van de lack
of fit-test en de tweedegraadspolynomiale test. In Tabel 4.2 zijn de p-waarden weergegeven
voor beide testen. Voor de lack of fit-test zijn voor de drie experimenten de waarden kleiner
dan 0.05, wat wijst op een „niet lineair‟ verband. De waarden voor de
tweedegraadspolynomiale test zijn groter dan 0.05, wat wijst op een lineair verband. Dit
verschil is te verklaren doordat de lack of fit-test geen echte regressie-analyse uitvoert maar
eerder een ANOVA zoals reeds beschreven bij methoden (zie 3.4.). De lack of fit-test zal de
variatie binnen de groepen vergelijken met de afstand van het gemiddelde tot de regressielijn.
Zoals te zien is in Figuur 4.2 A zal het vierde punt gezien worden als een uitschieter waardoor
de lineariteit wordt verworpen. Dit is in tegenstelling tot de tweedegraadspolynomiale functie
die een echte regressie-analyse uitvoerd. De functie voor de regressielijn wordt opgesteld en
voor de hoogste exponent van de tweedegraadsvergelijking wordt getoetst of deze al dan niet
significant verschillend is van nul. Hieruit blijkt dat er geen significant verschil is met nul en
dus de waarden een lineair verband hebben.
Tabel 4. 2 p-waarden voor lack of fit- en tweedegraadspolynomiale test voor de drie meetdagen
van het lineariteit experiment.
p-waarde lack of fit-test p-waarde tweedegraadspolynomiale test
16 maart 2011 0.0241 0.3991
17 maart 2011 0.0195 0.4143
21 maart 2011 0.0398 0.2663
-400.0
-300.0
-200.0
-100.0
0.0
100.0
200.0
300.0
0 2 4 6 8
Res
iduen
Concentratie (µg/g)
y = 2048.3x - 13.95
R² = 0.9997
0.0
2000.0
4000.0
6000.0
8000.0
10000.0
12000.0
14000.0
0 2 4 6 8
Opper
vla
kte
Concentratie (µg/g)A B
23
4.2.2. Kalibratie
Voor de keuze van de meest geschikte kalibratiecurve worden vier verschillende
regressiemodellen getest: OLR, OLR geforceerd door nul, OLR met nul ingesloten en WLR.
Voor het L-IQC en HN-IQC staal worden via de vier regressiemodellen gedurende vijf
meetdagen de concentratie berekend. Voor elk van de vier regressiemodellen wordt
vervolgens de CV op de resultaten en de afwijking van de doelwaarde bepaald. De resultaten
zijn weergegeven in onderstaande Tabel 4.3. Uit de resultaten kan afgeleid worden dat voor
het HN-IQC staal er nauwelijks een verschil is tussen OLR, OLR geforceerd door nul en het
regressiemodel met nul ingesloten. Voor het L-IQC staal is de procentuele afwijking het
laagst bij OLR geforceerd door nul wat wijst op een goede terugvinding. Ondanks het feit dat
de CV bij OLR geforceerd door nul het grootst is wordt besloten toch met OLR geforceerd
door nul verder te gaan. Dit na het opstellen van een 95% CI om na te gaan of het intercept
bekomen via OLR significant verschillend is van nul. Er wordt geen significant verschil
gevonden, waardoor kan gesteld worden dat er tussen OLR en OLR geforceerd door nul geen
significant verschil is. Dagelijks wordt de kalibratiecurve opgesteld met behulp van het
regressiemodel OLR geforceerd door nul (zie Figuur 4.3).
Tabel 4. 3 Procentuele afwijking en CV voor de concentratie van het L-IQC en HN-IQC staal
berekend voor de vier onderzochte regressiemodellen.
OLR OLR GEFORCEERD DOOR 0 0 INGESLOTEN WLR
LIQC AFWIJKING (%) 2.5 2.2 2.4 2.6
CV (%) 1.5 1.7 1.5 1.4
HIQC AFWIJKING (%) 2.8 2.8 2.8 3.1
CV (%) 1.1 1.1 1.1 1.4
24
Figuur 4. 3 Kalibratiecurve gemeten op 1 april 2011.
4.2.3. Imprecisie
Voor de validatie van imprecisie zijn de stalen van L-IQC en HN-IQC in duplicaat
gemeten gedurende veertien dagen. In werkelijkheid werd gebruik gemaakt van een
gereduceerd CLSI-EP5 protocol. In Figuur 4.4 zijn de puntendiagrammen weergegeven voor
het L-IQC staal. In het linkse puntendiagram A is de gemiddelde dagconcentratie
weergegeven. Uit het puntendiagram kan vermoed worden dat de binnen-dag gemiddelden
homogeen verdeeld zijn. De Grubbs‟ test bewijst dat er geen uitschieters aanwezig zijn. In
Figuur 4.4 B wordt het verschil van de dagconcentraties weergegeven. Dit is een maat voor de
binnen-analyse variatie. Aan de hand van het puntendiagram kan vermoed worden dat er een
uitschieter aanwezig is. Bij het uitvoeren van de Grubbs‟ test wordt echter het tegendeel
bewezen, er zijn dus geen uitschieters aanwezig.
Voor het HN-IQC staal zijn soortgelijke puntendiagrammen opgesteld. Voor de
gemiddelde dagconcentratie lijken de waarden homogeen verdeeld. De Grubbs‟ test bevestigt
dat er geen uitschieters aanwezig zijn. Bij het verschil in dagconcentraties lijken er twee
waarden toch verder te liggen dan de andere. Bij het uitvoeren van de Grubbs‟ test blijkt het
toch niet om uitschieters te gaan.
y = 2029.3x
R² = 0.9999
0
2000
4000
6000
8000
10000
12000
14000
0 1 2 3 4 5 6 7
Gem
iddel
de
opper
vla
kte
Concentratie (µg/g)
25
Op de resultaten van het L-IQC- en HN-IQC staal werd een “single factor” ANOVA
test uitgevoerd. Hieruit kan swr, sdd, sT, CVwr en CVT berekend worden. De CVT en CVwr
waarden kunnen vergeleken worden met de vooropgestelde specificaties zoals weergegeven
in Tabel 4.4. Hierin is te zien dat zowel het L-IQC- en HN-IQC staal aan de specificaties
voldoen.
Er wordt ook getest met een Chi²-test, of de experimentele waarden kleiner zijn dan de
kritische Chi²-waarden. Deze test is eenzijdig en wordt uitgevoerd op een 0.05
significantieniveau. Bij Chi² van de totale analyse (CVT) zijn de specificaties verschillend. Dit
is te wijten aan de berekeningen van de vrijheidsgraden voor de totale analyse. De resultaten
zijn terug te vinden in onderstaande Tabel 4.4. Ze bevestigen nogmaals dat aan de
specificaties voldaan is.
2.65
2.70
2.75
2.80
2.85
2.90
Gemiddelde
L-IQC
-0.08
-0.06
-0.04
-0.02
0.00
0.02
0.04
0.06
D (2-1)
L-IQC
Figuur 4. 4 Puntendiagram L-IQC staal. A: gemiddelde dagconcentratie van de verschillende
meetdagen. B: verschil van de dagconcentraties.
A B
26
Tabel 4. 4 Weergave van resultaten van het lage- en hoge IQC staal vergeleken met de
vooropgestelde specificties voor CV van binnen-analyse en totale CV.
4.2.4. Detectielimiet
Het LoD staal wordt gedurende dertien dagen gemeten en dagelijks wordt de
concentratie berekend. Deze bedraagt gemiddeld (±SD) 0.0365 ± 0.0028 µg/g. Omgerekend
en rekening houdend met de dichtheid van het oplosmiddel (0.8988 g/ml) en het volume van
de loop (5µL) geeft dit een massa (± SD) van 164.3 ± 12.5 pg DPP die op de kolom
geïnjecteerd wordt. De S/N waarde van elke meting wordt bepaald (Figuur 4.5) en uitgezet in
een puntendiagram (Figuur 4.6).
Figuur 4.5 Illustratie over hoe S/N waarde wordt berekend met chromatogram van 4 april 2011
met 163.9 pg DPP op de kolom.
De spreiding van de waarden lijkt homogeen en er zijn geen uitschieters merkbaar. De
Grubbs‟ test bevestigt dit ook. De gemiddelde S/N waarde wordt berekend, deze bedraagt 5.1
± 0.8. Voor de LoD zijn geen specificaties opgesteld.
Specificaties L-IQC HN-IQC
CVwr 2.0% 0.6% 1.8%
CVT 5.0% 1.4% 2.0%
Chi²wr 23.7 1.425 11.533
Chi²T (L-IQC) 26.3 1.2 -
Chi²T (HN-IQC) 37.7 - 4.1
27
Figuur 4. 6 Het puntendiagram van de S/N waarden voor de verschillende metingen van het LoD
staal.
4.2.5. Juistheid
Voor de terugvindingsexperimenten worden de zes stalen gedurende vijf dagen in
singlicaat gemeten. Het verschil van de gemeten concentratie met hun gemeten gemiddelde
concentratie wordt weergegeven in een verschildiagram (zie Figuur 4.7). Hieruit kan visueel
vermoed worden dat er geen uitschieters aanwezig zijn. Dit wordt getest met de Grubbs‟ test.
Deze bevestigt dat er geen uitschieters aanwezig zijn.
Figuur 4. 7 Verschildiagram dat het verschil tussen gemeten en gemiddelde concentratie
weergeeft voor de juistheidstalen. Van links naar rechts: Onbekende 2, Onbekende 1,
Onbekende 3, L-IQC, Juistheidstaal, HN-IQC.
In een procentueel verhoudingsdiagram (zie Figuur 4.8) wordt ook het CI
weergegeven. Merk op dat in het diagram de stalen gerangschikt zijn van laagste naar hoogste
3.0
4.0
5.0
6.0
7.0
8.0
9.0
S/N-waarde
-0.15
-0.10
-0.05
0.00
0.05
0.10
0.15
0 1 2 3 4 5
Ver
sch
il m
et g
emid
del
de
Concentratie (µg/g)
28
concentratie. Hieruit kan afgeleid worden dat de stalen homoscedastisch zijn, daar er geen
trend aanwezig is in de varianties. De specificaties schrijven een maximum afwijking voor
van vijf procent, waarbij de bovenste grens (Upper Limit; UL) 105% bedraagt. Voor
onbekende 2 en L-IQC overschrijdt de bovengrens van het CI deze van UL. Voor onbekende
2 wordt ook de ondergrens van het CI overschreden.. Van deze stalen kan niet met 95%
zekerheid gezegd worden dat ze aan de specificaties voldoen. Meer metingen zouden in dit
geval het CI voldoende kunnen verkleinen en uitsluitsel kunnen brengen of aan de
specificaties voldaan wordt. Hoeveel extra metingen nodig zijn kan via een power berekening
voorspeld worden.
Figuur 4. 8 Procentueel verhoudingsdiagram van de zes stalen met hun CI.
4.2.6. Methodenvergelijking
De gegevens worden weergegeven in een B&A-diagram (zie Figuur 4.9). Het CI van
het gemiddeld verschil overschrijdt de SE-limiet van vijf procent niet. Bij het controleren van
de TE-limiet wordt opgemerkt dat het CI van „d + 1.96 SD‟ de limietwaarde van vijftien
procent overschrijdt. Bij de onderste TE-limiet wordt de limietwaarde niet overschreden door
het CI.
On
bek
end
e 2
On
bek
end
e 1
On
bek
end
e 3 L
-IQ
C
Ju
isth
eid
staal
HN
-IQ
C
90
92
94
96
98
100
102
104
106
108
110
0 1 2 3 4 5 6
Pro
centu
ele
ver
ho
udin
g (
%)
Staalnummer
29
Figuur 4. 9 Bland & Altman diagram van de gesimuleerde data
In plaats van een procentueel verschildiagram op te stellen zoals het B&A-diagram in
Figuur 4.9, kan ook een absoluut verschildiagram worden opgesteld (zie Figuur 4.10). Omdat
de SD van de methode niet noodzakelijk constant is, kan gekozen worden om tot een bepaalde
concentratie met een absolute TE-limiet te werken. In dit geval wordt hiervoor als buigpunt
van de limiet de waarde één gekozen (op educatieve basis). Normaal is het buigpunt het punt
waarbij de SD van een constante naar stijgende waarde overgaat. Tot de waarde één is de
limiet constant, deze waarde is 15% van de concentratie van het buigpunt. Vanaf de waarde
één is er een constante stijging met rico 0.15. Alle waarden liggen binnen de vooropgestelde
specificaties.
-30
-25
-20
-15
-10
-5
0
5
10
15
20
25
30
0 1 2 3 4 5 6 7
Routi
ne-
Ref
ere
nti
e (%
)
Referentie concentratie (µg/g)
Gem.
verschil (%).
±1,96 SD
gem.
verschil(%)
±95% CI
SE limiet
TE limiet
30
Figuur 4. 10 Absoluut verschildiagram van de gesimuleerde data.
Het nadeel van de B&A-benadering is dat het geen concentratiegebonden fouten kan
detecteren. Daarom wordt er nog een lineair regressieonderzoek uitgevoerd. De resultaten van
het lineair regressieonderzoek zijn weergegeven in Figuur 4.11. Hierbij kan afgeleid worden
dat de correlatiecoëfficiënt 0.9968 bedraagt. Het interpreteren van de data met behulp van de
correlatiecoëfficiënt is echter misleidend. Deze is geen maat voor de overeenkomst tussen
twee methoden maar eerder een maat voor de sterkte van de relatie tussen twee variabelen.
Zolang de waarden rond eender welke rechte liggen, zal derhalve de correlatiecoëfficiënt goed
zijn. De correlatiecoëfficiënt is bovendien ook sterk afhankelijk van het werkbereik.
Aangezien bij deze methodevergelijking een groot werkbereik wordt gebruikt zal de
correlatiecoëfficiënt ook hoog zijn (Bland, et al., 1986). Daarom wordt de overeenkomst
tussen de referentie en routine methode statistisch geïnterpreteerd met behulp van OLR. In
Figuur 4.11 kan gezien worden dat de regressielijn niet op de rode referentierechte (y = x)
ligt. Dit komt door de afwijking van het intercept van nul, het 95% CI is [0.00577; 0.101]. Dit
wijst op een constante systematische fout. De richtingscoëfficiënt wijkt nagenoeg niet af van
de waarde één, het 95% CI is [0.990; 1.01], de laagste waarden zijn moeilijker te beoordelen.
-0.9
-0.7
-0.5
-0.3
-0.1
0.1
0.3
0.5
0.7
0.9
0 1 2 3 4 5 6 7
Rou
tine
-R
efer
nti
e (µ
g/g
)
Concentratie (µg/g)
TE limitTE-limiet
31
Figuur 4. 11 Spreidingsdiagram
In Tabel 4.5 wordt het CI en PI vergeleken met de specificaties voor respectievelijk SE
en TE ter hoogte van de minimale en maximale waarde concentratie. Voor de minimale
waarde wordt de limiet van zowel SE als TE overschreden. Bij de maximale waarden is
voldaan aan zowel de SE- als TE-limiet.
Tabel 4. 5 CI en PI in vergelijking met respectievelijke systemische- en totale fout voor de
laagste en hoogste concentratie.
CI (∆%) vergeleken met SE PI (∆%) vergeleken met TE
Minimale waarde (0.13µg/g) [10.77;69.18] [-89.99;169.95]
Maximale waarde (6.09µg/g) [0.51;1.65] [-1.77;3.93]
y = 1.0021x + 0.0534
R² = 0.9968
0
2
4
6
8
10
0 2 4 6 8 10
Ro
uti
ne
(µg/g
)
Referentie (µg/g)
Lijn Y=X
TE-limiet
Lineair
(Regressielijn)
32
4.2.7. Samenvatting validatie experimenten
Table 4.6 Samenvatende tabel van de resultaten van de verschillende prestatiekenmerken.
Prestatiekenmerken Specificatie Voldaan/ niet voldaan
Imprecisie – CVWR 2% Voldaan
Imprecisie – CVT 5% Voldaan
Lineariteit 5% Voldaan
Juistheid 5% Niet voldaan, meer metingen nodig
Methodevergelijking – TE 15% Voldaan voor hoge concentratie
Methodevergelijking – SE 5% Voldaan voor hoge concentratie
33
4.3. LITERATUURONDERZOEK
De LoD is al lange tijd en is nog steeds een van de meest controversiële concepten in de
analytische chemie. De vele verschillende definities en methoden hebben geleid tot een
situatie van misverstanden en verwarring (Boqué, et al., 2009). Verschillende oproepen tot
harmonisatie waren het gevolg. Eén van de pogingen tot harmonisatie werd ondernomen in
2004 door het “Environmental Protection Agency” (EPA), die een document publiceerden
met als titel “Revised Assessment of Detection and Quantitation Approaches”. Dit 254
pagina‟s bevattende document wordt afgesloten met het besluit dat: “EPA gelooft dat
discussie over alternatieven of verbetering van huidige detectie en kwantificatie concepten of
procedures moet verder gezet worden. Het is duidelijk dat er een brede interesse is in het
verbeteren van huidige procedures en gebruiken, maar dat men niet tot een consensus is
kunnen komen voor specifieke procedures.” (EPA, 2004). Er zijn zelfs veronderstellingen dat
er belangrijke fundamentele fouten in de LoD literatuur aanwezig zijn, die onderdeel zijn
geworden van de folklore (Voigtman, 2008).
Ook in andere vakgebieden wordt het onderwerp aangehaald. In het tijdschrift
“Epidemiology” verscheen bij de juli-editie van 2010 een supplement helemaal gewijd aan
deze problematiek. Het supplement beschrijft verschillende statistische methoden en modellen
voor het behandelen van de LoD zoals: de bepaling van de LoD gebruikmakend van lineaire
regressiemodellen, het Bayesian model en het gebruik van “multiple imputatie” waarvan
gesuggereerd wordt dat dit een veelbelovende methode kan zijn voor het analyseren van de
LoD. (Shisterman, et al., 2010).
Een interessante website die kan gebruikt worden voor het verdiepen in het thema is:
http://www.chemometry.com/Research/LOD.html. Hieronder zullen verschillende bepalingen
van de LoD besproken worden.
4.3.1. VERSCHILLENDE BEPALINGEN VAN DE DETECTIELIMIET
4.3.1.1. Bepaling met behulp van de kalibratiecurve.
De bepaling van de LoD met behulp van de kalibratiecurve werd voor het eerst
beschreven in 1970 door Hubaux A. en Vos R., gebaseerd op het predictie-interval (prediction
interval, PI) van een lineaire regressiemethode met homoscedastisch verdeelde data (zie
34
Figuur 4.12). Er worden twee betrouwbaarheidslimieten (Confidence Limits, CL)
gedefinieerd met een vooraf opgesteld betrouwbaarheidsniveau van 1-α-β. Wanneer een reeks
metingen zou uitgevoerd worden, zou α% van de data hoger dan de bovenlimiet liggen en β%
lager dan de onderlimiet. Noteer dat de publicatie spreekt over CL terwijl ze eigenlijk PI
bedoelt (Desimoni, et al., 2009). Noteer ook dat de vorm van de limieten een CI suggereert
(sterk vernauwend naar het gemiddelde toe). Het PI daarentegen is bijna lineair. Deze
benadering van de LoD is bijzonder complex omdat vanuit het signaaldomein voorspellingen
gemaakt worden naar het concentratiedomein. De oorspronkelijke benadering van Hubaux-
Vos wordt daarom soms als te eenvoudige gezien en nog uitgebreidere statistische modellen
worden voorgesteld om het probleem te beschrijven (Voigtman, 2008). Deze bepaling zal dan
ook niet verder behandeld worden in deze thesis.
Figuur 4. 12 Illustratie van de Hubaux-Vos-bepaling uit het oorspronkelijke artikel van 1970.
4.3.1.2. Bepaling via signaal over ruis verhouding.
De bepaling van de LoD met behulp van de S/N verhouding wordt door verschillende
richtlijnen vooropgesteld. De bepaling die aanbevolen wordt door de “Societe Francaise des
Sciences et Techniques Pharmaceutiques” (SFSTP) bestaat uit het bepalen van de maximale
amplitude van de basislijn gedurende een tijdsinterval dat overeenkomt met twintig maal de
breedte van de halve hoogte van de piek. De formule hiervoor opgesteld staat hieronder
weergegeven (Boqué, et al., 2009).
35
(4.1)
LD: Detectielimiet
z1-α: z-waarde voor significantieniveau 1-α
hnoise: helft van de maximale amplitude van de ruis
R: piekhoogte
Bij farmaceutische analyse worden dikwijls de richtlijnen van ICH, USP en Europese
farmacopee gevolgd. De ICH stelt voor de S/N waarde te bepalen door de verhouding te
nemen van het gemeten signaal van het laag geconcentreerde staal tot het signaal van de
basislijn. De LoD wordt beschouwd als de concentratie van de component met een S/N
verhouding van drie (Hubaux, et al., 1970). In de Europese farmacopee wordt de S/N waarde
als volgt gedefinieerd (Formule (4.2)) (Council of Europe, 2008).
(4.2)
S/N: signaal over ruis verhouding
H: Hoogte van de piek , dit is gemeten van het maximum van de piek tot de
geëxtrapoleerde basislijn van het signaal.
h: hoogte van de ruis wordt gemeten in het chromatogram in de buurt waar de
piek voorkomt.
Deze bepaling wordt gebruikt bij chromatografische toepassingen. Dit komt omdat de
benadering enkel kan gebruikt worden als er een basislijn met ruis aanwezig is. Deze methode
zal ook niet verder besproken worden in deze thesis.
4.3.1.3. Bepaling met behulp van de standaarddeviatie van de blanco.
Deze bepaling werd voor het eerst beschreven door Currie L.A. in 1968. De
“International Union of Pure and Applied Chemistry” (IUPAC) stelt ook de Currie-
benadering voor waarbij de LoD voor een bepaalde analysemethode gedefinieerd wordt als de
concentratie (cL) of de kwantiteit (qL) verkregen door de kleinste meting (xL) die kan
gedetecteerd worden met een behoorlijke zekerheid. De formule voor xL is hieronder
weergegeven (IUPAC, 2005-2009).
36
(4.3)
xL: waarde van de kleinste meting
: het gemiddelde van de blanco metingen
: standaarddeviatie van de blanco meting
: is een numerieke factor gekozen volgens het CI
Deze bepaling zal verder uitgediept worden in deze thesis.
4.3.1.4. Detectielimiet in farmaceutische discipline.
In onderstaande Tabel 4.1 zijn verschillende richtlijnen van verschillende organisaties
besproken die specifiek gebruikt worden in de farmaceutische discipline nl. “International
conference on harmonization” (ICH), “United States Food and Drug Administration” (US
FDA), “Association of Analytical Communities” (AOAC) en IUPAC. Om afbreuk van
interpretatie van de originele definitie te vermijden zijn deze in de tabel in het engels
weergegeven.
37
Tabel 4. 7 Vergelijking verschillende directieven van de detectielimiet methode validatie (Chandran, S, 2007).
Directieven ICH US FDA AOAC USP IUPAC
Definitie Lowest amount of analyte in the sample, which can be
detected but not necessarily
quantitated under stated
experimental conditions
Niet expliciet
beschreven
Lowest content that can be measured with reasonable
statistical certainty
Lowest amount of analyte in the sample which can be detected but not
necessarily quantitated under stated
experimental conditions
Smallest amount of conc. of analyte in the
sample that can be
reliably distinguished
from zero.
Methode 1. Door visuele evaluatie
2. Gebaseerd op de S/N.
Toepasbaar bij procedure die
basislijn ruis heeft.
Lage concentratie van analyt
wordt vergeleken met de
blanco.
3. Gebaseerd op SD van de respons en
richtingscoëfficiënt.
LOQ = 3.3 σ/s
s= richtingscoëfficiënt van de
kalibratiecurve
σ= SD van de respons
Niet
beschreven
Gebaseerd op meer dan 20
blanco‟s
Analyse van een staal met gekende
concentratie en door de minimale
concentratie vast te stellen waarbij de
analyt kan gedetecteerd worden. De
LoD moet voldoende laag zijn voor
analyse van stalen met gekende
concentratie van de analyt boven en
onder de vereiste LoD.
Niet gespecificeerd
Berekening Op basis van visueel
onderzoek of S / N dan dient
een chromatogram gepresenteerd te kunnen
worden
Op basis van berekening is
de schatting
gevalideerd door analyse van
een
geschikt aantal stalen die in de
buurt van de LoD liggen.
Niet
beschreven
De gemiddelde waarde van de
blanco metingen
(n=20) plus drie standaarddeviaties van
het gemiddelde, uitgedrukt in
analietconcentratie.
Niet gespecificeerd Niet gespecificeerd
Aanvaardbaarheidscriteria S/N > 2-3; niet gespecificeerd
in andere gevallen
Niet
beschreven
Niet gespecificeerd Niet gespecificeerd Niet gespecificeerd
38
4.3.2. BENADERING BESCHREVEN VOLGENS CURRIE
In 1995 verscheen door IUPAC in samenwerking met L.A. Currie de publicatie
“Nomenclature in evaluation of analytical methods including detection and quantification
capabilities” in Pure & Applied Chemistry. Dit document stelde onder andere een definitie op
voor de LoD die reeds beschreven is in Tabel 4.1. De theorie van de LoD wordt er
gedefinieerd als gebaseerd op het testen van hypothesen en de probabiliteit van fouten van de
eerste en tweede soort (zie verder). De probabiliteit voor een type I fout wordt weergegeven
door α, de probabiliteit van een type II fout door β (Boqué, et al., 2009) (Currie, 1995).
4.3.2.1.Kritische waarde
Bij het analyseren van vele blanco stalen zou er een concentratie verdeling ontstaan die
vergelijkbaar is met deze in Figuur 4.12. De concentratiewaarden zouden verdeeld zijn rond
nul met een bepaalde standaarddeviatie ( ). Om een “detectiebeslissing” te kunnen nemen
(analyt aanwezig of niet) moet men de kritische waarde (LC) definiëren. Het IUPAC
“definieert” LC als de waarde waarbij een onderscheid kan gemaakt worden tussen een
chemisch signaal en de ruis (Boqué, et al., 2009) (Currie, 1995).
De theorie voor de LoD is gebaseerd is op het testen van hypothesen. De nulhypothese
(H0) in dit geval stelt dat bij het meten van een staal, de geschatte waarde (L) gelijk is aan nul,
met andere woorden H0: L = 0. De alternatieve hypothese (HA) stelt dat bij het meten van een
staal de gemeten waarde (L) verschillend is van nul, ook genoteerd als: HA: L ≠ 0 (Currie,
1995).
Er werden ook twee soorten fouten vermeld. De fout van de eerste soort, ook wel type I
fout of vals-positieve genoemd. Dit wil zeggen dat er een kans bestaat dat bij het analyseren
van een blancostaal een resultaat verkregen wordt dat een concentratie voorstelt, hoger dan de
LC-waarde, zodat dus foutief zou besloten worden dat een analyt aanwezig is. De HA wordt
dan valselijk aanvaard (Boqué, et al., 2009).
Omgekeerd, bij het type II fout wordt foutief besloten dat er geen analyt aanwezig is.
Deze fout wordt ook verder nog besproken.
39
Figuur 4. 12 Verdeling van de waarden rond nul en weergave locatie van LC (Boqué, et al., 2009)
Bij de kritische waarde (LC) wordt er beslist of er iets- of niets gedetecteerd wordt. Deze
beslissing wordt genomen door het vergelijken van de geschatte waarde (L) met de kritische
waarde (LC) van de distributie. De kans op het overschrijden van LC is zodanig gekozen dat
deze niet groter is dan α als de analyt afwezig is (L=0) (Currie, 1995). Dit kan geschreven
worden als:
(4.4)
L: geschatte waarde
LC: kritische waarde
L=0: is voorwaarde van de nulhypothese
α: type I fout
Indien L normaal verdeeld is met een gekende variantie kan vergelijking (4.4) geschreven
worden als volgt:
(4.5)
: z-waarde voor een bepaald significantieniveau.
: standaarddeviatie van het blanco staal.
Als de geschatte standaarddeviatie van het blanco staal voorstelt (s0), gebaseerd op “v”-
vrijheidsgraden, dan wordt in volgens de Currie-benadering vervangen worden door een
student‟s t-test.
40
(4.6)
: t-waarde van de student-t verdeling met “v”-vrijheidsgraden en α als
significantieniveau.
: geschatte standaarddeviatie van het blanco staal.
4.3.2.2.Detectielimiet
Voor de LoD dient een waarde gekozen te worden die hoger ligt dan de LC-waarde. Want
indien de waarde van LC zou gekozen worden als minimaal detecteerbare concentratie. Zou in
50% van de gevallen een waarde lager dan LC gemeten worden en dus volgens de
detectiebeslissing aanvaard worden als blanco. Dit is weergegeven in Figuur 4.13 (Boqué, et
al., 2009).
Figuur 4. 13 Illustratie van de situatie wanneer LoD gelijk zou zijn aan LC (Boqué, et al., 2009).
Daarom wordt eerst de fout van de tweede soort besproken, ook wel type II fout of vals
negatief genoemd. Dit wil zeggen dat bij het analyseren van een staal met lage concentratie er
een resultaat verkregen wordt dat een concentratie heeft lager dan de LC-waarde. In dit geval
zou foutief besloten worden dat er geen analyt aanwezig is. De H0 wordt valselijk aanvaard
(Boqué, et al., 2009) (Currie, 1995).
De LoD moet dus een hogere concentratie hebben dan de LC-waarde om het risico op type
II fouten te verkleinen. Daarom moet een keuze gemaakt worden om een aanvaardbare
waarde voor β te kiezen (β: % lager dan LC). De standaardwaarden die door IUPAC voor α (α:
% groter dan LC) en β gebruikt worden bedragen voor elk 5% (zie Figuur 4.14) (Currie, 1995)
(Boqué, et al., 2009).
41
Figuur 4. 14 Weergave type I (α) en type II (β) fout (Boqué, et al., 2009).
De detectielimiet (LD) is de minimale concentratie die kan gedetecteerd worden, deze
beslissing wordt genomen door het vergelijken van de geschatte waarde (L) met de kritische
waarde (LC) van de distributie, zodanig dat de kans op een kleinere concentratie dan LC gelijk
is aan β als de analyt aanwezig is (dus L ≠0) (Currie, 1995). Dit kan geschreven worden als:
(4.7)
L: geschatte waarde
LC: kritische waarde
L=LD: voorwaarde voor de alternatieve hypothese
β: type II fout
Voor normaal verdeelde data met een gekende variantie wordt deze formule:
(4.8)
LC: kritische waarde
: waarde van de eenzijdig gestandaardiseerde normale verdeling voor een
bepaald significantieniveau (β).
: standaarddeviatie van het LoD staal.
In het speciale geval waarbij de variantie constant is tussen L=0 en L=LD kan het
rechter deel van vergelijking (4.8) gereduceerd worden tot ( . Als additioneel α
en β gelijk zijn geeft dit . Dit is met andere woorden gelijk aan 2LC. Als LC een
geschatte s0 gebruikt gebaseerd op “v”-vrijheidsgraden, dan wordt in de Currie-benadering
42
(z1-α+z1-β) vervangen door δα,β,v. Dit is een niet-centrale parameter voor de niet-centrale t-
verdeling. Voor α=β komt deze parameter overeen met 2t en kan weergegeven worden als
volgt: (Currie, 1995)
(4.9)
: niet-centrale parameter van de niet centrale t-verdeling voor α en β
voor “ v”-vrijheidsgraden.
: Standaarddeviatie van het blanco staal.
: t-waarde met “v”-vrijheidsgraden en significantieniveau α
Noteer dat de LoD hier anders wordt berekend dan besproken bij Linnet (4.3.3.).
Noteer ook dat σ0 moet gebruikt worden in vergelijking (4.9). Als enkel een geschatte waarde
s0 beschikbaar is, dan wil dit zeggen dat de minimaal detecteerbare waarde onzeker is over de
verhouding (σ/s). Gebruik makend van volgende formules kunnen betrouwbaarheidslimieten
voor LD berekend worden (Currie, 1995).
Als de resultaten normaal verdeeld zijn, dan is s²/σ² verdeeld als Χ²/v. Het 95% CI geschat
voor deze verhouding kan gegeven worden als:
(4.10)
Omgerekend geeft dit:
(4.11)
: Standaarddeviatie van steekproek
: aantal vrijheidsgraden
: Chi² waarde voor bepaald percentage voor “v”-vrijheidsgraden
Voor het berekenen van de 95% bovenste limiet van LD gebaseerd op de s0 voor n=5 wordt
dit: (Currie, 1995)
(4.12)
43
4.3.3. BENADERING VOLGENS LINNET
In 2004 publiceerde K. Linnet in het tijdschrift Clinical Chemistry het artikel “Partly
Nonparametric Approach for Determining the Limit of Detection”. Er wordt hierin
aangehaald dat de LoD zoals hierboven beschreven (zie 4.2.) een gaussiaanse verdeling
veronderstelt voor zowel de blanco als het gemeten staal en eveneens een lineaire
kalibratiecurve. Echter in deze „publictie‟ wordt de verdeling van de blanco vaak afgeknot aan
nul en is deze dus asymmetrisch en niet-gaussiaans (zie Figuur 4.15). Dit komt omdat
waarden kleiner dan nul beschouwd worden als nul. Daarom wordt een verdelingsvrije toets
procedure besproken. Deze procedure heeft het voordeel dat ze algemeen toepasbaar is zonder
dat het een bepaalde verdeling wordt verondersteld (Linnet, et al., 2004).
Figuur 4. 15 De blancowaarden zijn afgeknot aan nul. De blanco is asymmetrisch en niet-
gaussiaans verdeeld.
Voor de situatie in Figuur 4.15 waarbij de blancowaarden asymmetrisch en niet
gaussiaans verdeeld zijn, kan het 95e percentiel niet correct geschat worden door middel van
een parametrische benadering waarbij de limieten overeen zouden komen met: (Linnet, et al.,
2004)
(4.13)
: Limiet van de Blanco
: Gemiddelde van de blanco metingen
: SD van de blanco
B A
44
Noteer dat wanneer we deze formule voor een eenzijdig 95% CI vergelijken met
Formule (4.5) opgesteld door IUPAC in paragraaf 4.2., het gemiddelde niet wordt
meegerekend. Deze opmerking geldt ook voor de LoD (Linnet, et al., 2004).
De meest correcte manier om het 95e percentiel van een asymmetrische verdeling te
schatten is door het toepassen van de verdelingsvrije principes op geordende waarden. Het
aantal metingen van het blanco staal (nB) wordt gerangschikt volgens grootte. Dan kan het 95e
percentiel geschat worden als de waarde: (Linnet, et al., 2004)
(4.14)
nB: aantal metingen van een blanco staal
0.5: experimenteel bepaalde waarde voor 95e percentiel
Het limiterend percentiel van de blancoverdeling, welke α procent van de bovenste
staart van de verdeling afsnijdt, zal LoB genoemd worden (Figuur 4.15 B). De onzekerheid op
de schatting van de LoB voor de theoretische verdeling kan weergegeven worden voor de
standaard error van een niet-parametrisch geschat percentiel (SEnpar) dat overeenkomt met een
bepaald percentage (p) (Linnet K., 2004a.).
(4.15)
p: percentage van percentiel
d: is de densiteit van de verdeling aan het percentiel
N: Aantal stalen.
Deze vergelijking blijft geldig ook als de gaussiaanse verdeling afgeknot wordt aan
nul, zoals soms het geval bij de distributie van de blanco metingen. Noteer dat Linnet ook
parametrische bepalingen in acht neemt. Zo wordt de standaard-error van het parametrisch
geschatte percentiel geschreven als: (Linnet K., 2004a)
(4.16)
: oorspronkelijke standaarddeviatie
: standaard gaussiaanse afgeleide voor het gegeven percentiel
: aantal stalen
45
Indien de β waarde op 5% ligt voor een type II fout, dan moeten 95% van de waarden
hoger liggen dan de LoB. De concentratie van het staal in dit geval wordt gedefinieerd als de
minimaal detecteerbare concentratie wat overeenstemt met de LoD. Meestal is de distributie
van het staal gaussiaans, er kan dan een parametrische schatting gebeuren en in dit geval kan
het 5e percentiel van de verdeling bekomen worden door: (Linnet, et al., 2004)
(4.16)
μs: gemiddelde
σs: standaarddeviatie van de populatie
Algemeen kan gesteld worden dat
(4.17)
Indien de staalverdeling toch niet gaussiaans zou zijn, kan niet-parametrisch het 5e
percentiel van het staal geschat worden met de verdelingsvrije methode zoals hierboven
beschreven in Formule (4.14). Toch dient gezegd te worden dat de parametrische schatting
efficiënter is en daarom bij voorkeur dient gebruikt te worden (Linnet, et al., 2004).
De hoofdlijnen zoals hierboven beschreven zijn gebaseerd op theoretische
verdelingen. In de praktijk moet LoB geschat worden door herhaaldelijke metingen (nB) van
een blanco staal. De SD wordt bepaald uit de herhaaldelijke metingen van het staal met
relevante concentratie (ns). Dit is dus de methode om de LoD te schatten, op voorwaarde dat
het aantal herhaalde metingen (ns) niet te klein is. Volgende formule is een zuivere schatting
van Formule (4.17) (Linnet K., 2005)
(4.18)
: Geschatte LoD waarde
: Geschatte LoB waarde
: geschatte SD van de staal verdeling met “f”-vrijheidsgraden
:
is het (1-β) percentiel van de standaard gaussiaanse verdeling me t
“f”-vrijheidsgraden.
46
De onzekerheid van de LoDEST is samengesteld uit de componenten van de
onzekerheid van de LoBEST en van de metingen van de stalen. Een 95% CI voor de LoD kan
bekomen worden door het combineren van het 80% CI van de LoB en SDs, onder de
voorwaarde dat nb = ns en dat deze niet lager is dan 50 stalen. Het Bootstrap principe is een
alternatieve procedure die bij een lager aantal stalen kan gebruikt worden (Linnet, et al.,
2004).
4.3.4. Vergelijken principe van Linnet en Currie
De formules van de parametrische berekeningen van LC en LoB opgesteld door
respectievelijk Currie en Linnet zijn weergegeven in (4.6) en (4.13). Bij het doorvoeren van
de vereenvoudiging dat het gemiddelde van het blancostaal gelijk is aan nul, kunnen volgende
formules weergegeven worden als:
Indien deze formules berekend worden voor α =5 en aantal vrijheidsgraden = 4
bekomt men volgende uitdrukkingen in functie van SD.
Deze uitkomst is opmerkelijk daar het toch om dezelfde waarde gaat die wordt
berekend. Daarom wordt dit verder uitgewerkt in het addendum in bijlage.
47
5. CONCLUSIE
In deze masterthesis werd een HPLC-UV methode voor de bepaling van DPP gevalideerd.
Het zelfstandig plannen, werken en uitvoeren van de experimenten verliep heel vlot. Tevens is
er heel wat praktische kennis opgedaan over het gebruik en de werking van het HPLC-toestel.
Dit hield ook in dat werd aangeleerd aanpassingen uit te voeren, zoals een kolom vervangen
indien nodig. Er is ook kennis opgedaan over de gebruikte software van het HPLC toestel als
ook over statistische software als CBstat en dataverwerking software zoals Excel. Het
kalibratie onderzoek wees uit dat de OLR geforceerd door 0 het best passende regressiemodel
geeft. Tijdens de volledige validatieperiode voldeed het systeem dagelijks aan de
vooropgestelde systeemfunctie- en systeemgeschiktheidscontrole.
De validatie-experimenten toonden aan dat de lineariteit en imprecisie van de methode
voldeden aan de vooropgestelde specificaties. Voor de validatie van juistheid ligt het CI van
twee stalen buiten de limieten. Om uitsluitsel te geven over de juistheid zou het nodig zijn
meerdere metingen uit te voeren. De methodevergelijking gaf voor het procentuele B&A-
diagram aan dat zowel de SE als TE limiet overschreden werden, waaruit dient besloten te
worden dat de routinemethode significant verschillend is van de referentiemethode. Wanneer
gekeken wordt naar het absolute B&A-diagram met inclusie van absolute limieten in het lage
concentratie bereik, wordt opgemerkt dat de waarden wel binnen de specificaties vallen. Dus
dat de methoden niet significant verschillen. Aangezien het B&A-diagram geen rekening
houdt met concentratiegebonden fouten wordt een lineair regressieonderzoek uitgevoerd. Bij
lage concentraties wordt niet voldaan aan de specificaties van SE en TE, voor de hoge
concentraties echter wel. Het besluit uit de methodenvergelijking is dat er voor de hoge
concentraties geen significant verschil is tussen de routine- en referentiemethode, voor de lage
concentraties echter wel.
Het literatuuronderzoek over de LoD wees uit dat ondanks het eenvoudige concept er nog
steeds geen harmonisatie is. Ook al werden verschillende pogingen ondernomen door
organisaties en wetenschappers zoals Currie en Linnet. Er bestaat nog steeds geen
duidelijkheid over de terminologie en definities. De eenvoudigste berekeningen die
vooropgesteld zijn door verschillende wetenschappers stroken ook niet met elkaar. Dit zal in
vraag gesteld worden in het addendum bij deze thesis. Verder onderzoek is dan ook vereist
om duidelijkheid te brengen in deze problematiek.
48
Door middel van het literatuuronderzoek werden vaardigheden verworven over het
opzoeken van wetenschappelijke literatuur en informatie, en hoe deze massa informatie op
een kritische en efficiëntie manier kan verwerkt worden.
Er werd ook kennis gemaakt met verschillende soorten software voor het uitvoeren van
methodevalidatie. Zo kwam het bedrijf VWR (VWR international BVBA, Leuven, België) een
software pakket voorstellen, maar het programma “Agilent ChemStation Plus Method
Validation Pack” lijkt toch interessanter voor het uitvoeren van methodevalidatie.
49
6. BIBLIOGRAFIE
ATSDR. (1995). Toxicological Profile for dieethylphthalte. Atlanta : Agency for Toxic
Substances and Disease,
Bland, JM en Altman, DG. Statistical methods for assessing agreement between two methods
of clinical measurment (1986). 1 Lancet 307-310.
Boqué, R. en Vander Heyden, Y. The Limit of Detection. (2009). 22 LC-GC Europe. 82-85
Chandran, S. Comparison of various international guidelines for analytical method validation
(2007). 62, Pharmazie, 4-14
Currie, LA. Nomenclature in evaluation of analytical methods including detection and
quantification capabilities (IUPAC recommendations 1995). (1995) 67 Pure & Applied
chemistry . 1699-1723
Desimoni, E. en Brunetti, B. About estimating the limit of detection of heteroscedastic
analytical systems.(2009) 655 Analytica Chimica Acta. 30-37
Dolan, J.W.. Enhancing Signal-to-Noise. (2010) Special Issues Mar 1 LCGC
EPA. (2004). Revised Assessment of Detection and Quantitation Approaches. Washington
European Pharmacopoeia 6.0. [boekaut.] Council of Europa. Straatsburg : sn, 2008.
Hauser, R., Duty, S. en Godfrey-Bailey, L. Medications as a source of human exposure to
phthalates. (2004) 112 Environ. Health Perspect. 751-753
Heudorf, U., Mersch-Sundermann, V. en Angerer, J. Phthalates: Toxicology and
exposure.(2007) 210 International Journal of Hygiene and Enverionmental Health. 623-634
http ://www.chemcas.com.
http ://www.phthalates.com
http://be.mt.com/be/en/home/phased_out_products/others/AT261.html.
http://goldbook.iupac.org.
http://www.chemometry.com/Research/LOD.html
http://www.clsi.org/Content/NavigationMenu/Resources/HarmonizedTerminologyDatabase/H
armonized_Terminolo.htm.
http://www.freedrinkingwater.com.
http://www.sigmaaldrich.com/belgium-nederlands.html.
http://www.thermoscientific.com/ecomm/servlet/productsdetail?productId=11954633&group
Type=PRODUCT&searchType=0&storeId=11152.
Hubaux, A. en Vos, G. Decision and detection limits for linear calibration curves. (1970) 42
Analytical chemistry. 849-&
50
ICH. Validation of Analytical Procedures: Text and Methodology. (1995). UK : EMEA
International Standard ISO 9000. (2005). Quality management systems -- Fundamentals and
vocabulary. Genève
ISO. (2007). ISO/IEC Guide 99:2007 Vocabulaire international de métrologie -- Concepts
fondamentaux et généraux et termes associés (VIM).
Kaus, R. Detection limits and quantitation limits in the view of international harmonization
and the consequences for analytical laboratories. (1998) 3 Springer-Verlag, 150-154
Kennedy, John W. Evaluation of Precision Performance of Clinical Chemistry Devices;
Approved Guideline. (2004). 19 NCCLS.
Linnet, K. en Kondratovich, M. Appendix Non parametric Approach for Determining the
Limit of Detection (2004) (a). Clinical Chemistry, 50:4,732-740.
Linnet, K. en Kondratovich, M.. Partly Nonparametric Approach for Determining the Limit of
Detection (2004). Clinical Chemistry. 50:4, 732-740
Linnet, K. Estimation of the limit of detection with a bootstrap-derived standard error by a
partly non-parametric approach. Application to HPLC drug assays. (2005). Clin Chem Lab
Med, 43:4, 394-399.
Martino-Andrade, AJ. en Chahoud, I. Reproductive toxicity of phthalate esters. (2010). 54
Mol. Nutr. Food Res. 148-157
NCCLS EP5A2: Evaluation of Precision Performance of Quantitative Measurement
Methods; Approved Guidelines
NCCLS EP6A: Evaluation of the Linearity of Quantitative Measurement Procedures: A
Statistical Approach; Approved Guideline. Pennsylvania , (2003). ISBN 1
Schettler, T. Human exposure to phthalates via consumer products. (2006). 29 Int. J. Androl.
134-139
Shisterman, EF. en Little, RJ. Opening the Black box of biomarker measurement error.
(2010). 21 Epidemiology Supplemen 4 S1-S3
Stöckl, Dietmar. STT consulting. Imprecision. Method validation with confidence. (2007). 11-
14
Stöckl, Dietmar. STT consulting. Linearity. Method validation with confidence. (2007) 20-25
Stöckl, Dietmar. STT consulting. Method validation with confidence. Method validation with
confidence. (2007).
Voigtman, E.. Limits of detection and decision. Part 1. (2008) 63 Spectrochimica Acta, 115-
128
Detection decisions defined by the standard deviation of the
blank – Questions from “analytical freshmen”
Journal: Analytical Chemistry
Manuscript ID: ac-2011-013674
Manuscript Type: Letter
Date Submitted by the
Author: 30-May-2011
Complete List of Authors: Vermote, Arno; Universtity of Ghent, Faculty of Pharmaceutical
Sciences, Laboratory of Analytical Chemistry
Buyl, Manon; University of Ghent, Faculty of Pharmaceutical
Science, Laboratory of Analytical Chemistry
ACS Paragon Plus Environment
Analytical Chemistry
1
Detection decisions defined by the standard deviation of
the blank – Questions from “analytical freshmen”
Arno Vermote, Manon M.D.E.M. Buyl*
University of Ghent, Faculty of Pharmaceutical Sciences, Laboratory for Analytical Chemistry
AUTHOR EMAIL ADDRESS [email protected]
RECEIVED DATE
*CORRESPONDING AUTHOR: University of Ghent, Faculty of Pharmaceutical Sciences, Laboratory
for Analytical Chemistry. Tel: 09/264.81.04, Fax: 09/264.81.98, email: [email protected]
Page 1 of 9
ACS Paragon Plus Environment
Analytical Chemistry
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960
2
ABSTRACT
As pharmacy students in our 4th
academic year, we consider us “analytical freshmen”. Our master
thesises included a literature study about detection decisions based on the standard deviation of the
blank (sbi). The more the study progressed, the more we were puzzled. In the end, we were left with
more questions than answers: i) why is the literature on such a seemingly simple concept (LC = µ + z1-α
σ0) so divergent?; ii) different “k-values” are proposed for substituting “z”, which one is correct?; iii)
why was the blank dropped in the classical IUPAC paper?; iv) what is the logic to substitue z * σ0 with t
* sbi and what is the statistical meaning of the latter?; v) what is the statistical meaning of imposing the
confidence interval of a standard deviation upon a t-statistic?; vi) is the confidence interval of LC
adequately described by the confidence interval of sbi, by the confidence interval of a percentile, or by
another approach?; vii) why is there so little communication between different analytical application
fields for such fundamental issues as the LC?; viii) with respect to LC, has Columbus's egg been found in
a recent publication?
KEYWORDS
Limit of detection, Limit of the blank, prediction interval, confidence interval
Page 2 of 9
ACS Paragon Plus Environment
Analytical Chemistry
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960
3
MANUSCRIPT TEXT
To the Editor
We are two pharmacy students, just finishing our master thesis in our 4th
academic year. The
general topic of our thesises was method validation, including a literature review about detection
decisions. The more the literature study progressed, the more we were puzzled about the wealth of
literature on such a seemingly simple concept and why there today, still, is no common understanding
about the subject (see Reference 1 and the literature cited therein).1 In the end, we were left with more
questions than answers. Here, we present these questions (see table 1) with a focus on the so-called
“critical value for detection decisions”.2
Page 3 of 9
ACS Paragon Plus Environment
Analytical Chemistry
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960
4
Table 1: Questions from “analytical freshmen”
Why is there so much literature on such a seemingly simple concept and why is there, still, no
common understanding about the subject?
There are different “k-values” proposed as substitue for “z”, which one is correct?
Why has xbarbi been dropped in the classical IUPAC paper?
In the classical IUPAC paper, what was the logic to substitue z * σ0 with t * sbi and what is the
statistical meaning of the latter?
What is the statistical meaning of imposing the confidence interval of a standard deviation upon a
t-statistic?
Is the confidence interval of LC adequately described by the confidence interval of sbi, by the
confidence interval of a percentile, or by another approach?
Why is there so little communication between the different analytical application fields for such
fundamental issues as the LC?
With respect to LC, has Columbus's egg been found?9
Page 4 of 9
ACS Paragon Plus Environment
Analytical Chemistry
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960
5
The critical value for detection decisions (LC) (also called limit of the blank, LoB) is part of the
general concept of the limit of detection.2 The definition of LC is common across analytical application
fields and given by the equation LC = µ + z1-α σ0 (equation 1: see table 2), where µ is the population
mean of the blank measurements, z1-α is the one-sided z-value for a given probability (for example,
1.645 for 95% probability), and σ0 is the population standard deviation of the blank. A “generic”
equation for an experimentally estimated LC is given by the International Union of Pure and Applied
Chemistry (IUPAC), namely xL = xbarbi + k * sbi (equation 2; note, the IUPAC notation is retained
here). In the equation, xL is the smallest measure that can be detected with reasonable certainty for a
given analytical procedure, xbarbi is the mean of the blank measures, sbi is the standard deviation of the
blank measures, and k is a numerical factor chosen according to the confidence level desired.3
However, while the definition of LC is common across different application fields, the estimation
thereof shows striking differences between some, and the “k-factor” is one of the main reasons. For
example, Linnet4 used LC = xbarbi + Cn * z1-α * sbi (equation 3) while the classical IUPAC publication
2
uses LC = t1-α,ν * sbi (equation 4). In equation 3, Cn is a bias correction for sbi.5 Calculation of LC from 5
measurements (example in Reference 2) yields LC = xbarbi + 1.75 * sbi with equation 3 and LC = 2.13 *
sbi with equation 4, a striking difference for us. So, which of the k-factors is correct and why is xbarbi
dropped in the classical IUPAC publication? Further, we were particularly intrigued to uncover the logic
behind the substitution of z * σ0 with t * sbi in the IUPAC publication2 and what the statistical meaning
of the latter was. From our basic statistical education, two equations came into our mind, the one of the
confidence interval of a mean µ = xbarbi ± t1-α,ν * sbi/SQRT[n] (equation 5; SQRT = square root) and the
other of the prediction interval µ = xbarbi ± t1-α,ν * sbi/SQRT[1 + 1/n] (equation 6). Substituting n in
equation 5 with 1 and infinite in equation 6 would lead to t * sbi in both cases. However, in the first case
sbi cannot be calculated anymore, and in the latter case it would lead to the z-statistic. Anyway, we were
left with the question what t * s really addresses in statistical terms.
Page 5 of 9
ACS Paragon Plus Environment
Analytical Chemistry
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960
6
Table 2: Equations used in the manuscript (consecutive order)
Number Equation Meaning
1 LC = µ + z1-α * σ0 Concept for LC
2 xL = xbarbi + k * sbi Generic experimental estimate for LC
3 LC = xbarbi + Cn * z1-α * sbi Tolerance interval concept for LC
4 LC = t1-α,ν * sbi IUPAC concept for LC
5 µ = xbarbi ± t1-α,ν * sbi/SQRT[n] Confidence interval for a mean
6 µ = xbarbi ± t1-α,ν * sbi/SQRT[1 + 1/n] Prediction interval for the next result
Page 6 of 9
ACS Paragon Plus Environment
Analytical Chemistry
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960
7
There also arose questions in connection with the confidence intervals calculated in both
concepts. IUPAC2 used those of the standard deviation, while Linnet
4 used those of a centile.
Unfortunately, Linnet4 gives a simplified formula
6 which underestimates the confidence interval of a
centile for low n. Note, the confidence interval of a centile is de facto a tolerance interval7, and indeed,
tolerance intervals are used for detection decisions in wastewater analysis.8 Because the above, we used
a tabulated value for a one-sided tolerance interval in the calculation below (k = 4.21, 1-sided 95%
confidence and coverage).8 Calculation of the upper limit (UL) of LC from 5 measurements gives ULLC
= xbarbi + 4.21 * sbi with the tolerance interval and ULLC = 2.13 * (2.37 * sbi) = 5.06 * sbi with the
confidence interval of a standard deviation. Again, we are left with more questions than answers. What
is the statistical meaning of imposing the confidence interval of a standard deviation upon a t-statistic?
Why is the tolerance interval concept not addressed as such in certain fields of analysis? Why is it not
generally used? Why do different application fields not cross-reference each other?
Last but not least, it was stunning for us to read1 “Following promulgation (i.e., of Method 1631 B), a
lawsuit was filed challenging EPA on the validity of the method. The basis of the challenge included
several specific aspects of Method 1631 as well as the general procedures used to establish the MDL
(i.e., Method Detection Limit) and minimum level of quantitation (ML) published in the method”. This
happened in 1999, and to the best of our knowledge, all efforts since have not resulted in an agreement
about the procedure to be used for the MDL in the Clean Water Act. We conclude with our last
question: has the scientific community found Columbus's egg?: “Many labored to find the key to
accurately estimating XD (i.e., “Currie Detection Limit”) but there were too many false leads, statistical
errors, notational confusions and completely untested assumptions. With hindsight, it is obvious that the
non-central t distribution was lurking at the heart of the whole matter and it should have been unmasked
many years sooner”.9
Page 7 of 9
ACS Paragon Plus Environment
Analytical Chemistry
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960
8
ACKNOWLEDGMENT
We thank Prof. Dr. Linda Thienpont for encouraging us to write this letter and devoting senior research
scientist time for its guidance. We thank Dr. Dietmar Stöckl for providing guidance to this letter and for
his patience for answering our questions.
Page 8 of 9
ACS Paragon Plus Environment
Analytical Chemistry
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960
9
REFERENCES
1 Revised assessment of detection and quantitation approaches. U.S. Environmental Protection
Agency (EPA): Washington, 2004 .
2 Currie, L.A. Pure & Appl. Chem. 1995, 67, 1699-1723.
3 International Union of Pure and Applied Chemistry Goldbook Home Page.
http://goldbook.iupac.org/index.html (accessed May 25, 2011).
4 Linnet, K. Clin. Chem. Lab. Med. 2005, 43, 394-399.
5 Gurland J.; Tripathi R.C. Amer. Stat. 1971, 25, 30-32.
6 Altman D.G. Practical statistics for medical research. Chapman & Hall: Boca Raton, 1997; pp 422.
7 Chakraborti S.; Li J. Amer. Stat. 2007, 61, 331-336.
8 Gibbons R.D. Statistical Methods for Groundwater Monitoring. John Wiley & Sons: New York,
1994.
9 Voigtman E.; Abraham K.T. Spectrochim. Acta B 2011, 66, 105-113.
Page 9 of 9
ACS Paragon Plus Environment
Analytical Chemistry
123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960