Upload
haxuyen
View
214
Download
0
Embed Size (px)
Citation preview
Forbedring af billedkvalitet ved hjælp af optimering af processeringsparametre i digital radiografi
Af: Jane Kristine Rohde Hansen og Bo Rønne hold 59 Vejleder: Carsten A. Lauridsen Bachelor opgave Afleveret den 5. januar 2009 83.541 anslag inklusive mellemrum Professionshøjskolen Metropol Radiografuddannelsen Opgaven må gerne udlånes
Øverste billede på forsiden: skærmbillede af Canon MLT(S)
processeringsindstillinger.
Kilde: Canon - CXDI Image Processing Software MLT(S) -
USER'S MANUAL. Canon 2008 s 7.
Nederste billede på forsiden: røntgenbillede af et CDRAD-
fantom.
Kilde: Artinis - MANUAL CONTRAST-DETAIL PHANTOM
CDRAD 2.0 & CDRAD Analyser software Version 1.1. Artinis
Medical Systems S 20.
Abstract
Forbedring af billedkvalitet ved hjælp af optimering af
processeringsparametre i digital radiografi
Improving image quality by optimisation of processing
parameters in digital radiography
Indførelsen af digital radiografi har grundlæggende ændret radiografernes profession.
Denne teknologi tillader bl.a., at billedoptagelse, -bearbejdning og –visning kan
manipuleres uafhængigt af andre trin i billeddannelsen. Dette giver nye muligheder for
at billeder kan bearbejdes mhp. at fremstille bestemte strukturer eller patologi bedst
muligt, til gavn for patienterne. Digitaliseringen stiller ligeledes nye krav til viden om
de faktorer, der påvirker billeddannelsen og -kvaliteten. Alligevel har kun få har indsigt
i, hvordan processeringsalgoritmerne bearbejder og påvirker billederne.
I forskningsmæssig sammenhæng har relativt få studier gennemført systematiske
undersøgelser af, hvordan processeringsparameteroptimering kan forbedre billedkvalitet
/reducere patientdosis, skønt både international og dansk lovgivning påbyder dette.
Formålet med denne opgaven er at undersøge, hvordan billedkvaliteten af digitale
røntgenbilleder kan forbedres vha. optimering af processeringsparameter-indstillinger
fra to typer processeringssoftware – Phillips’ UNIQUE og Canons MLT(S).
Opgaven er overordnet inddelt i to hovedafsnit – en teoretisk del, der giver en
forståelsesramme for opgavens anden del, som præsenterer en besvarelse af opgavens
formål. Vi har valgt at gøre sidstnævnte vha. af såvel en teoretisk som en praktisk
tilgang. Den teoretiske vinkel belyses gennem analyse og diskussion af en
videnskabelig artikel omhandlende optimering af billedkvalitet vha.
processeringsparametre fra UNIQUE. Den praktiske vinkel belyses vha. analyse og
diskussion af et forsøg, vi har udført med processeringsparametre fra MLT(S).
Overordnet konkluderer vi, at billedkvaliteten kan forbedres vha. optimering af de
valgte processeringsparametre fra UNIQUE og MLT(S).
Vi finder, at en høj værdi af støjreducerende parametre kombineret med en lille værdi af
kantforstærkende parametre resulterer i den bedste billedkvalitet. Denne konklusion skal
dog tages med forbehold. Dels fordi det kun er et mindre udvalg af parametre, der er
undersøgt , dels fordi den anvendte metode til at måle billedkvalitet ikke kan stå alene,
når effekten af parameterkombinationerne skal evalueres.
Forbedring af billedkvalitet ved hjælp af optimering af processeringsparametre i digital radiografi
1. Problemstilling............................................................................................................s 1
2. Afgrænsning................................................................................................................s 3
3. Problemformulering....................................................................................................s 4
4. Nøgleord......................................................................................................................s 4
5. Overordnet metode......................................................................................................s 6
5.1 Opbygning af opgaven........................................................................................s 6
5.2 Begrundelse for og præsentation af valgte artikel..............................................s 6
5.3 Litteratursøgning............................................................................................... .s 7
5.4 Ordvalg................................................................................................................s 9
6. Første del - teoretisk baggrund................................................................................. s 10
6.1 CDRAD-fantom og IQF................................................................................... s 10
6.2 CDRAD-Analyser program..............................................................................s 12
6.3 Visual grading analysis (VGA) ........................................................................s 12
6.4 Faktorielle forsøgsdesigns................................................................................ s 13
6.5 Digital billeddataproduktion og –repræsentation............................................. s 15
6.6 Billedprocessering.............................................................................................s 17
6.6.1 Kontrast, brightness og LUT................................................................ s 17
6.6.2 Unsharp masking.................................................................................. s 18
6.6.3 Multifreqency processing (MFP) .........................................................s 20
Virkemåden bag MFP.............................................................. s 20
Opløsning i frekvensbånd....................................................... .s 20
Frequency processesing............................................................s 22
Rekonstruktion..........................................................................s 22
Udvalgte UNIQUE-parametre..................................................s 24
Udvalgte MLT(S)-parametre....................................................s 25
7. Anden del – optimering af processering...................................................................s 27
7.1 Teoretisk del – Eva Norrmans artikel...............................................................s 27
7.1.1 Beskrivelse af Eva Norrmans artikel ‘Optimization of image
process parameters through factorial experiments using a flat
panel detector’...................................................................s 27
7.1.2 Diskussion af Eva Norrmans resultater.................................................s 33
7.2 Praktisk del – forsøg.............................................................................s 36
7.2.1 Materialer og udstyr til forsøget............................................................s 36
7.2.2 Forsøgets udførelse...............................................................................s 36
7.2.3 Overvejelser i forbindelse med design af forsøg..................................s 38
Valg af røntgensystem og
billedbehandlingssoftware........................................................s 38
Valg af teknikfaktorer og forsøgsopstilling..............................s 39
Valg af metode til evaluering
af billedkvalitet.........................................................................s 39
Valg af processerings-parametre...............................................s 39
Praktiske hensyn ved forsøgets udførelse.................................s 42
7.2.4 Statistisk analyse af data.......................................................................s 43
Ensidig variansanalyse..............................................................s 43
Tukey-test..................................................................................s 44
7.2.5 Præsentation af forsøgsresultater..........................................................s 45
Tendenser i forsøgsresultaterne................................................s 45
Resultater af statistiske analyser...............................................s 49
7.2.6 Diskussion af forsøgsresultater.............................................................s 53
7.3 Samlet diskussion af Eva Norrmans artikel og vores forsøg............................s 55
8. Konklusion...............................................................................................................s 59
9. Perspektivering..........................................................................................................s 60
10. Litteraturliste...........................................................................................................s 61
11. Bilag....................................................................................................................... s 67
11.1 Bilagsoversigt....................................................................................................s 67
Bilag 1...............................................................................................................s 68
Bilag 2...............................................................................................................s 70
Bilag 3...............................................................................................................s 71
Bilag 4...............................................................................................................s 73
Bilag 5...............................................................................................................s 76
1
1. Problemstilling
Indførelsen af digitalt røntgenudstyr har ændret radiografien og dermed radiografernes
profession og arbejdsgang væsentligt – man kan ligefrem tale om et paradigmeskift (1).
Den digitale tidsalder tillader helt nye muligheder - eksempelvis lagres alle billeder i
elektroniske arkiver, hvilket bl.a. muliggør visning af samme billede flere steder på én
gang og fremsendelse af billeder over store afstande, hvilket åbner mulighed for
telemedicin. Et andet kendetegn ved digitaliseringen er, at billedoptagelse,
-bearbejdning og –visning er separerede processer, som kan manipuleres uafhængigt af
hverandre (2). Dette frembyder helt nye muligheder for at billeder kan bearbejdes mhp.
at fremstille bestemte strukturer eller bestemt patologi bedst muligt (3). Som følge af
dette, skabes der mulighed for at patientdosis kan reduceres, samtidig med at en høj
billedkvalitet bevares (4). Såvel en forbedring af diagnostikken som en reduktion af
dosis er til gavn for patienterne.
Da vi stod overfor at skulle vælge emne til denne opgave, ønskede vi at fordybe os i
noget, som vi manglede større indsigt i. Vi mente at digital radiografi ville være et godt
valg, bl.a. af følgende grunde:
I løbet af vores studietid har vi oplevet, at den digitale teknologi ikke blot byder på
mange nye muligheder, men også at den stiller nye krav til viden om de faktorer, der
påvirker billeddannelsen og -kvaliteten. Det er vores oplevelse, at mange muligheder
indenfor digital radopgrafi langt fra altid udnyttes optimalt, bl.a. pga. manglende
forståelse for, hvordan den digitale teknik fungerer. Det gælder på flere niveauer, både
blandt basisradiograferne og blandt folk med specialindsigt på området. Fx er det vores
oplevelse, at nogle radiografer med en ældre uddannelse er berøringsangste overfor
arbejdet med digital radiografi. Og kun få har indsigt i, hvordan
processeringsalgoritmerne bearbejder billederne, hvilke effekter de har på de færdige
billeders udseende, og hvordan de udnyttes i praksis.
At dette er en relevant problemstilling understøttes ligeledes i litteraturen. Her pointerer
flere, at udviklingen af den kliniske anvendelse af digital radiografi, ikke er begrænset
af manglen på tilgængelige teknikker, men mere af de professionelles forståelse for,
2
hvordan de fungerer (1, 5, 6). Problemstillingens relevans afspejles også af det faktum,
at processering har en udhyre stor effekt på det færdige billede og dermed på billedets
diagnostiske værdi (6, 7).
Den softwarebaserede og meget matematiske databehandling har sikkert en stor del af
skylden for denne manglende indsigt. Af andre faktorer med betydning kan nævnes, at
digital teknik indeholder langt flere variable end analoge røntgensystemer. De velkendte
teknik-faktorer som kV og mAs bør optimeres på ny i forhold til forskellige digitale
detektorer (pga. disses anderledes spektrale følsomhed (3, 8). Men særligt de mange
forskellige processeringsparametre giver et væld af muligheder for at manipulere med
billederne (2, 5).
Det er vores indtryk, at de mange potentielle kombinationsmuligheder af teknik- og
processeringsfaktorer ikke gennemprøves særlig systematisk mhp. optimering af
billedkvalitet og/eller reduktion af dosis. Sådanne tiltag er ellers lovmæssigt bestemt. I
både europæisk og dansk lovgivning påbydes det, at alle røntgenundersøgelser skal
optimeres mht. kvalitet og dosis (9, 10).
Gennemlæsning af diverse brugermanualer om billedprocessering har givet os det
indtryk, at disse ofte er overfladiske eller ligefrem mangelfulde. Endnu en forvirrende
faktor er, at forskellige producenters software indeholder forskellige parametre, som
grundlæggende virker mere eller mindre forskelligt, eller parametre, som har forskellige
navne trods lignende egenskaber. Samtidig er den videnskabelige litteratur på området
sparsom (11). Nogle studier undersøger effekten af en enkelt eller få
processeringsparametre (12-14), men få studier er mere omfattende og systematiske (4,
11, 15).
Vi mener således, at der er væsentlige grunde til at beskæftige sig mere med, hvordan
processeringssoftware til bearbejdning af digitale røntgenbilleder fungerer, og hvilke
effekter de har på røntgenbilledernes fremtræden og dermed på billedkvaliteten.
3
2. Afgrænsning
Der er mange aspekter ved digital radiografi, som kunne være interessante at fokusere
på i forhold maksimal udnyttelse af teknologiens muligheder for frembringelse af
diagnostisk gode røntgenbilleder. I denne opgave har vi valgt at fokusere på ét led i
fremstillingen af det færdige røntgenbillede, nemlig processering af ’'Digital X-ray'
(DX) røntgenbilleder. Vi vil gerne undersøge, hvordan røntgenbilleders billedkvalitet
kan forbedres vha. optimering af processeringsparametre. Vi ønsker at beskæftige os
med nogle udvalgte parametre fra to forskellige producenters processeringssoftware,
kaldet UNIQUE (produceret af Phillips) og MLT(S) (produceret af Canon).
Når man taler om billedkvalitet er det relevant at overveje, hvordan denne størrelse skal
måles og evalueres. Vi vil dog kun berøre denne problemstilling i det omfang, vi finder
det nødvendigt for at undersøge vores emne.
Optimering af billedkvalitet kædes ofte sammen med reduktion af dosis, fordi hensigten
med førstnævnte netop ofte er at reducere dosis. I denne opgave vil vores fokus være på
optimering af billedkvalitet, ikke på dosisreduktion.
4
3. Problemformulering
Hvordan kan billedkvaliteten af digitale røntgenbilleder forbedres vha. optimering af
processeringsparameter-indstillinger fra to typer processeringssoftware – UNIQUE og
MLT(S)?
4. Nøgleord
Billedkvalitet: denne størrelse er et vidt begreb, som kan beskrive forskellige kvaliteter
ved et røntgenbillede, alt afhængigt af billedets formål (16). Til brug i denne opgave har
vi valgt en definition baseret på to væsentlige og objektivt målbare egenskaber - den
rumlige opløsning og lavkonstrastopløsningen (17). Disse to størrelser kan udtrykkes i
én numerisk værdi i form af en ’Image Quality Factor’ (IQF). IQF kan måles objektivt
ud fra et røntgenbillede af et ’contrast-detail’-fantom (CDRAD-fantom) (18).
Digitalt røntgenbillede: denne betegnelse omfatter generelt alle former for ’Computed
Radiography’ (CR) og (DX), som er kendetegnede ved at billeddata eksisterer på
digital form (19). I denne opgave beskæftiger vi os udelukkende med DX. Når vi
anvender begrebet digitalt røntgenbillede, mener vi derfor et røntgenbillede optaget vha.
et DX-system.
Optimering: med dette begreb mener vi den proces, hvormed noget gøres optimalt i
forhold til et givent formål - her at forbedre billedkvaliteten.
Processeringsparametre: hermed mener vi de forskellige software-værktøjer, som
manipulerer det digitale billedes rådata mhp. at fremstille væsentlig information
indeholdt i billedets data.
Parameter-indstillinger: hermed menes det spænd af værdier, som den enkelte parameter
kan indstilles på.
5
Processeringssoftware: med dette mener vi software fra en given producent af
røntgenudstyr, indeholdende en samling af forskellige processeringsparametre. I denne
opgave fokuserer vi på UNIQUE og MLT(S).
6
5. Overordnet metode
I følgende afsnit vil vi give et overblik over opgavens indhold, beskrive vores
litteratursøgning, præsentere den litteratur, vi har udvalgt til besvarelse af
problemformuleringen samt gennemgå, hvorledes fagudtryk anvendes i opgaven.
5.1 Opbygning af opgaven
Opgaven er overordnet inddelt i to hovedafsnit – en teoretisk del (Første del - teoretisk
baggrund) indeholdende baggrundsinformation om relevante emner, der sidenhen
berøres under opgavens næste del (Anden del - optimering af processeringsparametre),
som udgør besvarelsen af problemformuleringen.
I opgavens anden del har vi valgt at besvare problemformuleringen vha. både en
teoretisk og en praktisk indgangsvinkel.
Den teoretiske vinkel udgøres af en videnskabelig artikel omhandlende optimering af
billedkvalitet vha. udvalgte processeringsparametre fra Phillips’ UNIQUE. Denne
artikels metodik og resultater vil vi beskrive og diskutere. En begrundelse for valget af
artiklen og en præsentation af dens forfatter følger nedenfor.
Den praktiske vinkel udgøres at et forsøg, vi selv har designet, udført, og hvis resultater,
vi har analyseret. Til dette forsøg har vi anvendt udvalgte processeringsparametre fra
Canon’s MLT(S). Vi vil beskrive forsøgsudførelsen og vores overvejelser i dennne
forbindelse, samt præsentere og diskutere dataanalysen og forsøgsresultaterne.
Vi vil derefter samle de vigtigste pointer fra disse to vinkler samt fra opgavens
teoretiske del, og diskuterer dette i en fælles diskussion - set i lyset af
problemformuleringens spørgsmål. Dette vil munde ud i en konklusion og en
perspektivering af de opnåede resultaters gyldighed og anvendelse indenfor vores
profession.
5.2 Begrundelse for og præsentation af valgte artikel
Til den teoretiske vinkel på besvarelsen af problemformuleringen, har vi valgt at
anvende artiklen Optimization of image process parameters through factorial
experiments using a flat panel detector. Artiklens hovedforfatter er Eva Norrman, og er
en del af hendes Ph.D-afhandling (20) ved Institut for Naturvidenskab på Örebro
7
Universitet i Sverige. Norrman er nu ansat som ansvarlig fysiker ved Örebro
Universitetshospital. Artiklen er publiceret i Physics in Medicine and Biology –
2007(4). I det efterfølgende vil vi referere til Eva Norrman eller hendes artikel som
’EN’.
Vi har valgt denne artikel, fordi den er en af de få systematiske, videnskabelige
undersøgelser af processeringsparametres effekt på billedkvalitet og af, hvorledes
billedkvalitet kan forbedres vha. parameteroptimering. EN’s forsøgsrække anvender
flere slags forsøgsdesigns og billedkvalitet-evalueringsmetoder, hvilket styrker
validiteten af hendes resultater. Ét af de anvendte forsøgsdesigns - det faktorielle
forsøgsdesign – har tjent som inspiration ved udformingen af vores eget forsøg. Vi har
været tiltrukket af dette forsøgsdesign, fordi det muliggør en systematisk, objektiv
undersøgelse af mange forskellige parameterkombinationer, både af de enkelte
parametres særegne effekter, og de samspil, der kan eksistere mellem parametre. Denne
systematiske tilgang mener vi, at mange andre undersøgelser af emnet har sprunget for
let hen over.
En anden årsag til valget af EN’s artikel er, at hun anvender samme eller lignende
udstyr som vi bruger i vores forsøg, hvilket muliggør en vis sammenligning af
resultaterne.
5.3 Litteratursøgning
Hovedparten af de anvendte artikler har vi fundet vha. søgninger i PubMed/MEDLINE.
Vi har både søgt bredt og snævert vha. følgende søgeord - alene eller i forskellige
kombinationer:
Brede søgeord:
‘digital x-ray’
‘image processing’
‘image quality’
‘algorithms’
‘optimization of postprocessing’
‘quality optimisation’
8
Specifikke søgeord:
‘multi frequency processing’, ‘multi objective frequency processing’,
‘multiscale processing’ og ‘MLT(S)’
‘multiscale image contrast amplification’ og ‘MUSICA’
’unified image quality enhancement’ og ‘UNIQUE’
‘unsharp masking’
Relevante artikler har vi brugt som udgangspunkt for videre søgninger, dels vha.
søgefunktionen ’related articles’ i PubMed/MEDLINE, dels ved at gennemgå
litteraturhenvisningerne fra de fundne artikler mhp. at finde nye referencer, primært
andre artikler og Ph.D. afhandlinger.
Fordi udbyttet fra søgninger på PubMed/MEDLINE i forhold til specifik litteratur om
forskellige slags processeringssoftware har været begrænset, har vi suppleret med
søgninger på Google med de specifikke søgeord. Herved har vi fundet flere relevante
artikler.
Vi har måttet konstatere, at det har været umuligt at anskaffe relevant litteratur om
Canons MLT(S), med undtagelse af forskellige udgaver af opsætnings- og
brugermanualer. Heller ikke personlig kontakt med en konsulent fra Santax (som sælger
Canons produkter) har givet udbytte. De anvendte opsætnings- og brugermanualer om
UNIQUE (21- 23) og MLT(S) (24-27) er venligst udleveret af de radiologiske
afdelinger på hhv. Rigshospitalet og Glostrup Hospital.
En tredje producents software – Agfas’ MUSICA – har været lettere tilgængelig mht.
fremskaffelse af litteratur. Da MUSICA, UNIQUE og MLT(S) er baserede på lignende
processeringsmetoder, har vi i den overordnede gennemgang af processeringsmetoderne
(beskrevet i afsnittet 6.6.3 Multifreqency processing), valgt at tage udgangspunkt i
MUSICA, selvom denne software ikke anvendes i opgaven. Vi vil supplere med teori
om de i opgaven undersøgte processeringsparametre vha. oplysninger fra de nævnte
manualer.
9
I forbindelse med udformningen af vores forsøgsdesign og den statistiske dataanalyse,
har vi anvendt flere lærebøger om faktorielt forsøgsdesign og statistisk dataanalyse (28-
30).
5.4 Ordvalg
I opgaven har vi valgt at anvende danske udtryk når disse er almindeligt kendte. I de
tilfælde, hvor der ikke findes gængse danske udtryk, har vi valgt at bruge de engelske
fagudtryk. Første gang det engelske udtryk optræder i teksten vil det være markeret med
’citationstegn’. Efterfølgende skrives udtrykket uden citationstegn.
10
6. Første del - teoretisk baggrund
I denne del af opgaven vil vi beskrive den underliggende teori bag de vigtigste begreber
og metoder, der anvendes i opgavens Anden del - optimering af
processeringsparametre.
Billedkvalitet kan måles og vurderes ved mange forskellige metoder, der spænder fra de
rent fysisk målbare til de observatørafhængige og mere klinisk anvendelige metoder (4).
Vi vil beskrive to metoder til at evaluere billedkvalitet. Den første er CDRAD-fantomet
og den tilhørende IQF. Desuden beskrives det analyseprogram, der beregner IQF. Både
EN og vi selv anvender CDRAD-fantom og analyseprogram.
Den anden billedkvalitet-evalueringsmetode er ’Visual Grading Analysis’ (VGA), som
er en metode, hvor anatomiske billeder vurderes ud fra opstillede kriterier. Denne
metode anvendes ligeledes af EN.
Dernæst vil vi give en kort indføring i de vigtigste principper i faktorielt forsøgsdesign,
fordi dette design anvendes af EN, ligesom vi selv har været inspireret af det under
opsætningen af vores forsøg.
Tilslut vil vi beskrive, hvorledes udvalgte processeringsmetoder fungerer. Vi vil her
først give en overordnet præsentation af digital datarepræsentation og af hele
processeringsforløbet for et digitalt røntgenbillede. Dernæst følger en beskrivelse af
virkningsmekanismerne for de valgte parametre fra UNIQUE og MLT(S), som
anvendes i hhv. EN’s og i vores eget forsøg.
6.1 CDRAD-fantom og IQF
CDRAD-fantomet består af en kvadratisk plade af plexiglas (PMMA) på 265 x 265 x 10
mm. Pladen er inddelt i 15 rækker og 15 søjler - dvs. i alt 225 felter. I de tre øverste
rækker er der i hver af disse firkanter boret ét hul, mens der i de øvrige rækker er boret
to huller. Hullernes diameter og dybde aftager logaritmisk fra 8,0 - 0,3 mm i hhv.
vertikal og horisontalt retning, således at hullerne bliver tiltagende mindre i både
diameter og dybde, når man bevæger sig fra øverste højre hjørne til nederste venstre
hjørne (31). Ændringen i huldiameter og –dybde repræsenterer hhv. variationen i rumlig
11
opløsning og i lavkontrastopløsning. Evnen til at afbilde disse huller, afspejler
røntgensystemets evne til at gengive små detaljer med lille kontrast (4, 31).
Billeder af CDRAD-fantomet kan både analyseres med det blotte øje og vha. et
computerprogram (fx CDRAD-Analyser). Uanset metode beregnes en IQF (se
nedenfor).
I hver firkant med to huller, vil det ene hul være placeret i centrum mens det andet hul
er placeret i et vilkårligt valgt hjørne. Under både visuel aflæsning og computerbaseret
analyse af et billede, skal positionen af det perifere hul bestemmes i de firkanter, som
ligger i grænseområdet mellem de akkurat synlige og de usynlige huller. De
observerede positioner sammenlignes med de sande positioner af hullerne.
IQF defineres som summen af produkterne af dybde og diameter af de akkurat-synlige
huller i hver række. Dette udtrykkes numerisk med formlen:
15
IQF = ∑ фi x Ci, th
i = 1
Hvor
i er søjlenummer (1-15)
th angiver ’threshold’ (dybden af det mindste akkurat synlige hul)
dvs.
Ci, th er dybden (i mm) af det mindste akkurat synlige hul
фi er huldiameteren (i mm) i søjle i
(32)
Jo mindre dybde og diameter de mindste synlige huller har, jo bedre høj- og
lavkontrastopløsning gengives af røntgensystemet. Derfor indikerer en mindre IQF-
værdi en bedre billedkvalitet. Typisk spænder IQF fra 20 til 100 (4).
12
IQF kan også udtrykkes som invers IQF (inv. IQF) – der beregnes som 1/IQF. Herved
opnås en ligefrem proportionalitet mellem numerisk værdi og billedkvalitet. I vores eget
forsøg har vi valgt denne måde at udtrykke IQF.
6. 2 CDRAD-Analyser program
Når computerprogrammet CDRAD-Analyser bruges til at beregne IQF, definerer
programmet først kanterne af fantomet (markeret med blyholdig maling). Kanterne
bruges til at bestemme positionerne af de 255 felter, som analyseres enkeltvist. I hvert af
disse felter identificerer programmet det centrale hul og afsøger så de fire hjørner mhp.
at lokalisere det perifere hul. Vha. en statistisk beregning afgøres det, om programmet
rent faktisk har fundet det perifere hul, eller om lokaliseringen er tilfældigt udført. Det
er muligt at ændre på signifikansniveau for programmet, hvilket ændrer fordelingen
mellem ’sande’ og ’tilfældige’ bestemmelser (31).
6.3 Visual grading analysis (VGA)
Hvis man benytter et antropomorft fantom eller evt. billeder af rigtige patienter til at
måle billedkvalitet, kan sådanne billeder vurderes vha. fx VGA, som er en subjektiv
evaluering udført af én eller flere observatører. En sådan metode er mere velegnet til at
vurdere den kliniske anvendelighed af et givent billede, sammenlignet med objektive
metoder som IQF (4).
Vurderingen af de undersøgte billeder udføres i forhold til et referencebillede, jævnfør
European Quality Criteria (EQC) (33). Ofte benyttes en absolut skala med fem trin fra
-2 til 2, hvor der til hvert trin hører en beskrivende term - ’meget dårligere’, ’dårligere’,
’ens’, ’bedre’ eller ’meget bedre’ end referencen. Inden analyse konverterer man oftest
data til tal, hvorved der kan udregnes en ’Visual grading analysis score’ (VGAS). Dette
udregnes som gennemsnittet af billederne i serien. Det skal bemærkes, at metoden
kritiseres for at mangle validitet, fordi sammenhængen mellem eksempelvis ’meget
dårlig’ og -2 er arbitrært valgt. Derfor er det statistisk forkert at udregne et gennemsnit i
form af VGAS (34).
13
6.4 Faktorielle forsøgsdesigns
EN anvender dette forsøgsdesign til nogle af sine forsøg, ligesom vi selv er inspireret af
det under opsætningen af vores forsøg. Der findes mange varianter af det faktorielle
forsøgsdesign, som er egnede til forskellige formål. Vi vil blot berøre de vigtigste
principper.
Faktorielle forsøg er grundlæggende opbygget således, at man vælger et bestemt antal
niveauer af et bestemt antal faktorer, og undersøger alle tænkelige kombinationer af
disse, hvor hver kombination udgør en observation. Fx anvendes hyppigt 2k-designet,
hvor man undersøger 2 niveauer (værdier) af k faktorer. De to niveauer kan eksempelvis
være høj og lav. Det måles, hvorledes de forskellige kombinationer af niveauer og
faktorer påvirker en given effektvariabel (28). En grafisk fremstilling af
kombinationsmulighederne i et faktorielt forsøgsdesign er illustreret i figur 1.
I denne opgave repræsenterer processeringsparametrene faktorerne, parameterværdierne
udgør niveauerne, mens effektvariablen er IQF. Dette uddybes nærmere i afsnit 7.1
Teoretisk del - Norrmans artikel.
Figur 1. Figuren illustrerer et faktorielt forsøgsdesign med 3 faktorer X1, X2 og X3, hver med 2 mulige niveauer. Dette udgør et såkaldt 23 forsøg. Hver kombination af en faktor og et niveau danner et hjørne i kuben Kilde: (35).
14
Faktorielle forsøgsdesign er en effektiv måde at undersøge både ’main effects’
(hovedeffekter) og ’interaction effects’ (interaktionseffekter) af mange faktorer på én
gang. En hovedeffekt defineres som den ændring i effektvariablen, som følger af at
ændre én faktors niveau fra lavt til højt. Hovedeffekten udtrykker således den
selvstændige effekt, som en given faktor har på effektvariablen.
En interaktionseffekt ses, når responset af én faktor afhænger af niveauerne af andre
faktorer. Dette viser, at de pågældende faktorer vekselvirker med hinanden, og effekten
på responsvariablen afhænger af egenskaberne ved denne interaktion. Tilstedeværelsen
af interaktionseffekter kan afsløres ved, at der ikke er en lineær sammenhæng mellem
effekten af en given faktor fra ét niveau til et andet niveau. Dette kan testes vha. et
såkaldt ’central composite design’, hvor der indføres ekstra datapunkter mellem
yderpunkterne (20, 28).
Når et faktorielt forsøgsdesigns planlægges, er det vigtigt at gøre sig hensigten klar.
Hvis det ønskes at screene et større antal faktorer mhp. at identificere dem med størst
effekt på effektvariablen, er et 2k-design med et stort interval mellem lav og høj værdi
ofte hensigtsmæssigt (20).
15
6.5 Digital billeddataproduktion og -repræsentation
Som følge af en eksponering vil hver pixel i en røntgendetektors matrix producere et
elektrisk signal, der er proportionelt med den absorberede strålingsenergi i den enkelte
pixel. Signalerne forstærkes, digitaliseres og transformeres, fx så pixelværdierne er
logaritmisk proportionelle med den absorberede strålingsenergi. Disse pixelværdier
udgør det eksponerede billedes rådata, og udgør materialet for den efterfølgende
processering (7, 36).
Rådata rummer tre typer af information: rumlig lokalisering (angiver en x, y position),
signalamplitude (som er proportionel med eksponeringsværdien og som omsættes til en
gråtoneværdi i billedet) og rumlig frekvens (som beskriver strukturstørrelser).
Høj rumlig frekvens-information (> 1 linjepar (lp)/mm) beskriver fine detaljer - fx
trabeklerne i en knogle - men beskriver samtidig en væsentlig del af billedstøjen. Lav
rumlig frekvens-information (< 0,1 lp/mm) beskriver større objekter og overordnede
ændringer i gråtoneværdi - fx mellem mediastinum og lunger. Mange
processeringsteknikker er baserede på amplitude- og rumlig frekvens-information (37,
38).
Diverse billedprocesseringsoperationer kan kategoriseres som præ-processering,
processering og post-processering alt afhængigt af, hvornår i forløbet data-
manipulationerne finder sted (37). Nøjagtigt hvilke processeringer, der anvendes
indenfor de forskellige kategorier, afhænger af producenten af røntgensystemets
hardware og software (39).
Hensigten med præ-processering er dels at producere rådata med en simpel relation til
den absorberede røntgenstråling, dels at korrigere for detektorsystemets fejl,
mangelfuldheder og uensartethed. Præ-processering omfatter typisk kortlægning af og
korrektion for døde pixels, fjernelse af elektronisk støj samt korrektion af inhomogenitet
mellem de enkelte pixelelementer Disse funktioner er indbyggede i detektorsystemet og
er uden for operatørens rækkevidde (36, 37).
16
Processering omfatter mange forskellige slags operationer, hvis egenskaber og
virkemåder afhænger af formålet med processeringen og af de enkelte producenters
softwaredesign.
Fælles er, at de virker på data således at én eller flere af følgende effekter på billedet
opnås:
• det fotograferede objekts dynamiske område fremstilles optimalt. Dette sker vha.
’exposure recognition’, som identificerer, hvilke eksponeringsværdier i rådata, der skal
repræsentere hhv. min. og maks. gråtoneværdierne i objektets dynamiske område.
Dernæst skal eksponeringsværdierne fra det valgte spænd af rådata præsenteres på en
passende gråtoneskala – dette sker vha. bestemte kontrastkurver (’look-up-table’ – LUT
- se nedenfor) (6, 36, 38).
• kontrasten i billedet gengives optimalt. Kontrastforstærkning har til hensigt at
optimere kontrastgengivelsen ved at øge kontrasten mellem lokale vævsstrukturer (lokal
kontrast) uden at ændre billedets overordnede kontrast (global kontrast). Herved opnås
et billede, der samtidig har høj kontrast og en bred eksponeringsspændvidde (36, 38).
• den rumlige opløsning af det digitale røntgensystem optimeres
(kantforstærkning). Kantforstærkning forbedrer synligheden af fine højkontrast detaljer,
som delvist går tabt fordi detektorsystemet mister noget af signalet under
dataopsamlingen. Teknikken virker ved at forstærke de højfrekvente signaler i billedet,
men har den side-effekt, at billedstøjen også forstærkes. En anden ulempe er, at
kantforstærkning kan introducere artefakter i billedet (36, 38).
• billedstøj undertrykkes. Støjreducerende processeringsmetoder forsøger at
mindske det visuelle indtryk af billedstøjen. Dette sker generelt ved at reducere
forstærkningen af de højfrekvente signaler, som både indeholder struktur- og
støjinformation. Konsekvensen af sådanne processeringer vil derfor reducere
skarpheden af de fine detaljer. Da kantforstærkning og støjereduktionsprocesseringer
således kommer i konflikt, er støjreducerende metoder forsøgt konstrueret således, at de
primært opererer i områder af billedet, som indeholder mindre mængder af fin-detaljeret
17
strukturinformation (36, 38), eller dæmper forstærkningen i undereksponerede områder,
som har et lille signal-støjforhold (hvor støjen er mere dominerende) (21).
Post-processering dækker over den manipulation, der kan udføres på det færdige
billede, fx på en PACS-station. Typisk drejer det sig om ændring af kontrast og
gråtoneværdier vha. window-level-manipulation. Sådanne ændringer er normalt ikke
permanente (37).
6.6 Billedprocessering
De overordnede processeringsværktøjer, der gennemgås i dette afsnit, er kontrast og
’brightness’ (og herunder LUT), ’Unsharp making’ og forskellige parametre indenfor
UNIQUE og MLT(S), som tilhører en processeringsklasse kaldet ’multifrequency
processesing’ (MFP). Alle disse parametre indgår i EN’s og/eller vores eget forsøg.
6.6.1 Kontrast, brightness og LUT
Kontrast og brightness påvirker billedets overordnede indtryk i form af kontrast og
lysstyrke. Det er en punktprocessering fordi den enkelte pixels værdi ændres uden
indflydelse fra nabopixelværdier. Punktprocesseringen kan være lineær (fx en additions-
funktion) eller non-lineær (fx en eksponentiel funktion) (39). Input- og outputværdierne
af en punktprocessering vises typisk vha. en tabel (look-up-table - LUT) eller en kurve,
som omsætter eksponeringsværdierne (input-værdierne) til gråtoner på display-
monitoren (output-værdierne), og dens form afhænger af den anvendte
punktprocessering. I digital radiografi anvendes oftest S-formede LUT-kurver, som
giver billedet et udseende, der ligner det fra film-folie systemerne - se figur 2.
Forskellige producenter tillader forskellige grader af kontrol over LUT-kurvens
udseende. Typisk kan kontrasten justeres ved at ændre hældningen af den rette del af
LUT-kurven, som benævnes gamma (39).
Gamma indgår som en af de undersøgte parametre i EN’s artikel. I vores eget forsøg
har vi valgt en lineær LUT-kurve frem for standard, der som nævnt er S-formet. Se
afsnit 7.2.3 Valg af processeringsparametre.
18
Figur 2. Figuren viser en LUT-kurve med outputværdier (gråtoneværdier) som funktion af inputværdier (eksponeringsværdier). Kontrasten i billedet justeres ved at ændre LUT- kurvens hældning, mens brightness justeres ved at flytte hele kurven til højre eller venstre. Kilde: (39) s 78.
6.6.2 Unsharp masking
Den mest anvendte processeringsteknik indenfor DX har traditionelt været ’unsharp
masking’ (UM), som oprindeligt var udviklet til at forbedre udseendet på thorax film-
foliebilleder (i begyndelsen af 80’erne) og siden blev udviklet til at optimere digitale
billeder på de første CR-systemer (Fuji, i begyndelsen af 90’erne) (36).
Vha. UM kan det fotograferede objekts dynamiske område reduceres mhp. at øge
kontrasten, ligesom UM kan bruges til kantforstærkning. Den klassiske UM har dog
flere uheldige side-effekter, bl.a. kan der introduceres artefakter omkring bratte
kontrastovergange i billedet (fx mellem en protese og vævet). Sådanne artefakter undgås
ved i stedet at benytte mere moderne processeringsmetoder som MFP (36, 39).
I korte træk virker UM ved, at en ’blurred’ (sløret) repræsentation af det originale
billede skabes. Dette kaldes et ’low-pass’ billede. Low-pass billedet subtraheres det
originale billede og herved skabes et ’high-pass’ billede, indeholdende den højfrekvente
19
billedinformation. High-pass billedet kombineres med det originale billede med en
passende vægtningsfaktor for således at opnå det kantforstærkede billede (36).
Det slørede low-pass billede dannes ved en såkaldt ’local neighbourhood operation’
vha. en ’kernel’ (et filter). Hver pixel i et ’neighbourhood’ svarende til kernel’ens
størrelse multipliceres med værdierne i kernel’en. Resultaterne af denne operationen
adderes og danner en ny pixelværdi i et nyt billede. Positionen af denne ny pixelværdi
svarer til positionen af kernel’ens center-pixel. (39). Processen er illustreret i figur 3.
Figur 3. Figuren illustrerer effekten af en 3x3 kernel. Værdien af hver pixel i et originalt billede bearbejdes med værdierne i de tilsvarende felter i kernel’en. Resultaterne af denne operationen adderes og danner en ny pixelværdi i et nyt billede. Kilde: (17) s 312.
Effekten af UM på det færdige billede afhænger af faktorer relateret til kernel’en – dens
værdier og dens størrelse. Effekten afhænger ligeledes af størrelsen af den
vægtningsfaktor (også kaldet forstærkningsfaktor), som kombinerer high-pass billedet
med originalbilledet (39). UM-kernel (UM-K) og UM-forstærkningsfaktor (UM-F) er to
parametre, som undersøges i EN’s artikel.
20
6.6.3 Multifreqency processing (MFP)
De nyeste processeringsmetoder er baserede på MFP, som principielt set anvender
samme teknik som UM, men processeringen er mere avanceret (36, 39). Fordelene er at
teknikken er mindre tilbøjelig til at producere artefakter og at billedets naturlige
udseende bevares. Til gengæld forstærkes dog en del billedstøj (40, 41).
MFP er den overordnede processeringsmetode, som de fleste af de i opgaven undersøgte
parametre falder ind under. Vi beskriver først princippet bag MFP og dernæst de
specifikke UNIQUE- og MLT(S)-parametre, som anvendes af EN eller os selv.
Virkemåden bag MFP
Som beskrevet i afsnittet ’Overordnet metode’, har vi måttet ty til Agfa’s MUSICA, for
at finde tilgængelig litteratur om MFP’s virkemåde. Vi formoder at MLT(S) og
UNIQUE har en del fællestræk med MUSICA mht. de grundlæggende principper for
nedbrydning af billedet i frekvensbånd (se nærmere nedenfor).
MUSICA er en forkortelse af ’Multiscale Image Contrast Amplification’. Overordnet
fungerer denne processering ved at opløse det originale billede (rådata) i et antal
billedelementer (frekvensbånd), som hver især repræsenterer individuelle frekvens- og
kontrastinformationer. Processeringsoperationene, hvis primære effekt er at forstærke
kontrasten i billedet, virker individuelt på de enkelte frekvensbånd, som tilslut atter
fusioneres til et færdigt og kontrastforstærket billede (40).
Opløsning i frekvensbånd
Opløsningen af billedet i frekvensbånd sker efter en transformationsmetode kaldet
’Laplacian pyramid transform’, hvor originalbilledet low-pass filtreres (sløres) med en
såkaldt ’5x5 Gaussian kernel’. Det heraf fremkomne billede halveres i opløsning (for at
reducere datamængden) og benævnes g1. Dette billede interpoleres til den originale
billedstørrelse, og subtraheres det originale billede. Produktet heraf er det første ’sub-
band’ billede – eller ’frekvensbånd’ (b0), som indeholder det fineste niveau i den
Laplacianske pyramide, dvs. de højeste frekvenser i billedet.
21
Processen gentages, nu på det reducerede low-pass billede fra før (g1), som low-pass
filtreres, halveres, interpoleres og subtraheres fra det forrige interpolerede low-pass
billede. Herved dannes et nyt frekvensbånd (b1), og så fremdeles indtil det sidste,
halverede billede fremkommer (gL), som kun fylder 1 pixel (40, 41) - se figur 4.
For hvert stadie i pyramideopløsningen reduceres detaljegraden trinvist, og
differencerne mellem de fortløbende, slørende filtreringer lagres i de tilhørende lag i
den Laplacianske pyramide. Disse udgør et antal frekvensbånd rummende den billedlige
information i form af detaljer på alle niveauer (40, 41). Et 2kx2k billede vil opløses i 11
frekvensbånd - også kaldet ’scales’ (heraf navnet ’multiscale frequency processing’)
(42).
Figur 4. Figuren viser første del af processeringen af et billede med MUSICA software. I venstre del opløses billedet i 11 frekvens bånd. Det højeste frekvensbånd kaldes g1 - det laveste g11. I højre del rekonstrueres billedet igen. Kilde: (41) s 93.
22
Frequency processesing
Den egentlige processering kan nu påføres de enkelte frekvensbånd, hvor der foretages
en non-lineær kontrastforstærkning, idet kontrasten af lavkontrast-stukturer forstærkes
mens kontrasten af højkontrast-strukturer mindskes. Herved øges synligheden af
strukturer med svag kontrast, samtidig med at billedets originale ’look’ bevares (40, 41).
Denne kontrast ’equalization’ er den basale og den væsentligste
billedforstærkningsmetode i MUSICA, og til mange undersøgelser er det den eneste
anvendte. Andre operationer kan dog også udføres, fx kantforstærkning (bruges til
ekstremitetsundersøgelser) og reduktion af det dynamiske område (benævnes ’lattitude
reduction’ i MUSICA - bruges fx til skulderundersøgelser) (41).
Et eksempel på disse MUSICA-parametres særegne effekt på et axial-billede af
Calcaneus ses i Figur 5.
Rekonstruktion
Efter processeringen er fuldført rekonstrueres billedet vha. den inverse transformation af
den Laplacianske pyramide. Processen udføres i den modsatte rækkefølge, startende fra
det største frekvensbånds-billede (40, 41).
En skematisk oversigt over principperne for MUSICA’s virkemåde ses i figur 6.
23
Figur 5. Figuren viser effekten af 3 MUSICA-processeringsparametre på et axial-billede af Calcaneus. På alle billederne er der valgt høje parameter værdier. Øverste venstre: Original billede. Øverste højre: Kantforstærkning. Små detaljer forstærkes meget, men der dannes også artefakter omkring kollimeringskanten. Nederste venstre: Kontrast equalization. Forstærker alle detaljer uden artefakt dannelse. Nederst højre: Lattitude reduction. Forbedrer synligheden af små og mellem store detaljer, men ikke i samme grad som Kontrast equalization. Eksempelvis er tæerne ikke synlige Kilde: (41) s 99.
24
Figur 6. Figuren illustrerer princippet i MUSICA-.processering med den Laplacianske pyramide. I venstre side ses nedbrydningen i frekvensbånd, i midten ses procesesseringen af individuelle frekvensbånd (både den grundlæggende ’contrast equalization’ og evt. supplerende processering), og til højre ses rekonstruktionen til det færdige, bearbejdede billede. Kilde: (41) s 97.
Udvalgte UNIQUE-parametre
UNIQUE er en forkortelse af ’Unified Image Quality Enhancement’. Følgende er
baseret på brugermanualerne til UNIQUE (21-23).
• ’ROI density’ bestemmer den gennemsnitlige gråtoneværdi i et område af størst
interesse (’Region of interest’ – ROI). Ændres ROI-density bliver hele billedet lysere
eller mørkere, hvilket svarer til at ændre brightness.
• ’Gamma’ repræsenterer hældningen på kontrastkurven og bestemmer den
overordnede kontrast i billedet, men påvirker ikke den lokale kontrast. En høj gamma
medfører således stor kontrast i billedet, men til gengæld et lille dynamisk område. Se i
øvrigt afsnittet ’Kontrast, brightness og LUT’.
• ’Noise compensation’ (NC) er en selektiv undertrykkelse af billedstøj.
Funktionen virker ved at undlade at forstærke højfrekvente strukturer i områder med
lille detektorsignal (lille SNR).
25
• ’Detail contrast enhancement’ (DCE) forstærker den lokale kontrast uden at
påvirke den globale kontrast.
• ’Unsharp-masking-kernel’ (UM-K – se afsnittet ’Unsharp masking’. Kaldes
også ’Sharpness kernel’).
• ’Unsharp-masking-forstærkningsfaktor’ (UM-F – se afsnittet ’Unsharp
masking’. Kaldes også ’Sharpness enhancement’).
Udvalgte MLT(S)-parametre
MLT(S) er en forkortelse af ‘Multiobjective Frequency Processing Function’. Denne
software er installeret på Santax DX, som vi har anvendt til vores forsøg. Følgende er
baseret på manualerne til MLT(S) (24-27).
MLT(S) indeholder tre overordnede processeringsfunktioner - ’Multiple frequency
processing’, ’Gradation conversion processing’ og ’Auto analysis processing’. Her
beskrives blot de tre funktioner i Multiple frequency processing, som vi har anvendt til
vores forsøg, nemlig ’Edge enhancement Effect’ (EE), ’Edge enhancement Frequency’
(EF) og ’Noise reduction’ (NR).
Edge enhancement forstærker kanter og dermed billedets skarphed. Parameteren er delt
i to under-parametre, nemlig ’Effect’ og ’Frequency-band’.
• Effect er vægtningsfaktoreren og bestemmer graden af forstærkning.
Forstærkningen sker på de enkelte frekvensbånd, som billedet er inddelt i.
Vægtningsfaktoren tilpasses automatisk den lokale kontrast af strukturerne, således at
højkontrast-strukturer forstærkes relativt mindre end lavkontrast-strukturer. Dette har til
hensigt at undgå uacceptabel forstærkning af støj.
Effect kan antage værdierne 1-20, hvor en højere værdi resulterer i en kraftigere
forstærkning.
26
• Med Frequency-band kan man vælge selektivt at øge forstærkningen af bestemte
frekvensbånd. Parameteren indeholder trinene 1-7, hvor en lavere frekvensværdi
resulterer i kraftigere forstærkning af større strukturer, mens en højere frekvensværdi
resulterer i kraftigere forstærkning af mindre strukturer. Canons manualer angiver ikke,
hvilke antal lp/mm i billedet, som de enkelte trin svarer til.
• Noise reduction reducerer billedstøjen ved at ekstrahere støj fra
strukturinformationen i de enkelte frekvensbånd. Opdelingen af data i hhv. støj- og
strukturinformation tager højde for detektordosis og kantovergange i billedet, da begge
forhold påvirker graden af støj. Noise reduction-parameteren kan antage værdierne 1-
10, hvor større værdier resulterer i en kraftigere støjreduktion (dvs. mere af rådata
henføres til støjkategorienj og fjernes fra billedet). For høje værdier kan resultere i
artefaktdannelse eller at noget af strukturinformationen i billedet går tabt.
27
7. Anden del - optimering af processeringsparametre
Denne del af opgaven udgør besvarelsen af problemformuleringen. Denne er inddelt i
en teoretisk del (EN’s artikel) og en praktisk del (vores eget forsøg), og resultaterne af
disse indfaldsvinkler samles mhp. en fælles diskussion.
Følgende afsnit omhandler artiklen af EN. Først beskrives artiklens metoder og
resultater overordnet, og dernæst følger en diskussion af disse.
7.1 Teoretisk del – Eva Norrmans artikel
7.1.1 Beskrivelse af Eva Norrmans artikel ‘Optimization of image process parameters
through factorial experiments using a flat panel detector’
En skematisk oversigt over indholdet af EN’s artikel samt faktuelle oplysninger vedr.
anvendt udstyr, er for overskuelighedens skyld anført i tabel 1.
Tabel 1. Oversigt over anvendte materialer, metoder og resultater fra Eva Norrmans artikel. Overordnede forsøgskarakteristika Detaljer om forsøg
Røntgen-system DX, flat-panel detektor Producent af processeringssoftware Phillips’ DigitalDiagnost Overordnet processeringsværktøj UNIQUE Undersøgte processeringsparametre ROI density
Gamma Detail contrast enhancement (DCE) UM-kernel (UM-K) UM-forstærkningsfaktor (UM-F) Noise compensation (NC)
Teknikparametre svarende til Undersøgelse af col. lumbalis Overordnet forsøgsdesign 1. For-forsøg designet jvf. faktorielle
forsøgsdesigns 2. Hovedforsøg med sammenligning af billeder i
forhold til referencebillede Materialer og målemetode til evaluering af billedkvalitet
1. CDRAD-fantom og COCIQ –analyse-software til måling af IQF
2. Alderson-fantom til vurdering af VGA-score Statistisk dataanalyse 1. Regressionsanalyse mm.
(CDRAD- billeder) 2. ’parret ordinal-data’ (Alderson-billeder)
Resultat
Ved optimering af UM-F, UM-K, DCE og NC kan samme IQF bibeholdes med 30 % dosisreduktion
28
EN undersøger dels effekten af udvalgte processeringsparametre på billedkvaliteten og
dels, hvorvidt billedkvaliteten kan fastholdes med en lavere effektiv patientdosis, ved at
ændre værdierne af visse processeringsparametre. EN’s forsøg er foretaget med
udgangspunkt i en undersøgelse af columna lumbalis. Først udføres et antal for-forsøg,
som bruges til at identificere de parametre og optimere de parameterværdier, der
resulterer i den bedste billedkvalitet. Disse optimerede parameterværdier anvendes så i
et hovedforsøg, hvor det undersøges om billedkvaliteten kan fastholdes, når den
effektive dosis reduceres. Som følge af hovedforsøgenes resultater, inkluderer EN
endnu en parameter i et opfølgende forsøg, svarende til et af for-forsøgene.
Til for-forsøgene bruges IQF som mål for ændringer i billedkvalitet (bemærk at en
stigning i IQF repræsenterer et fald i billedkvalitet). Der anvendes CDRAD-fantom og
et CDRAD-analyseprogram til produktion af data.
For-forsøgene spænder over tre forsøg designet i overensstemmelse med forskellige
varianter af faktorielle forsøgsdesigns (se afsnit 6.4 Faktorielle forsøgsdesigns). I første
omgang indgår fem processeringsparametre i forsøgene: ROI density, gamma, detail
contrast enhancement (DCE), unsharp masking kernel (UM-K) og unsharp masking
forstærkningsfaktor (UM-F).
I det 1. for-forsøg ’screenes’ de fem parametres effekt på IQF, som måles for hver
mulig kombination af de 5 parametre – og hver parameter afprøves ved hhv. en lav og
en høj værdi. Der anvendes brede intervaller af parameterværdier, fordi formålet er en
screening for, hvilke parametre, der er betydende.
Forsøget viser, at tre af de fem parametre har væsentlige hovedeffekter på IQF, nemlig
UM-F, UM-K og DCE. Når hver af parametrene ændres fra lave til høje værdier ses
følgende effekter på IQF: UM-F påvirker IQF positivt (dvs. ringere billedkvalitet), mens
UM-K og DCE påvirker IQF negativt (dvs. bedre billedkvalitet).
Forsøget viser også at der er interaktionseffekter mellem både to parametre (fx UM-F x
UM-K) og tre parametre (UM-F x UM-K x DCE), men forsøget kan ikke udrede den
underliggende mekanisme i disse interaktioner.
29
2. for-forsøg følger op på det første ved at anvende snævrere intervaller af
parameterværdier, som er tættere på klinisk anvendte værdier. Der anvendes ’central
composite forsøgsdesign’, hvor ekstra datapunkter mellem de lave og de høje værdier af
parametrene inkluderes. Hensigten med disse er at undersøge, hvorvidt effekten på IQF
er lineær, når en given parameter ændres fra lav til høj. Fravær af linearitet skyldes
parametrenes indbyrdes påvirkning af hinanden, således at værdien af én parameter har
betydning for en anden parameters effekt på billedkvaliteten.
Dette forsøg påviser en vigtig interaktionseffekt mellem UM-F og UM-K, som ændrer
konklusionerne baseret på hovedeffekterne af disse parametre: når UM-K står på den
lave værdi (altså en lille kernel-størrelse), så resulterer en øgning af UM-F i en stigning
i IQF (ringere billedkvalitet). Når UM-K står på en høj værdi, så resulterer en øgning af
UM-F i et fald i IQF (bedre billedkvalitet). Dvs. en høj UM-F forbedrer billedkvaliteten
når den kombineres med en stor kernel-størrelse, men forringer billedkvaliteten, når den
kombineres med en lille kernel-størrelse.
Forsøget påviser også en vigtig interaktionseffekt mellem UM-F og DCE: når UM-F har
en lav værdi, vil en øgning af DCE-værdien ikke have nogen effekt på IQF. Men når
UM-F har en høj værdi, vil en øgning i DCE reducere IQF (forbedre billedkvaliteten).
Dvs. en høj DCE forbedrer billedkvaliteten når den kombineres med en høj UM-F.
Kombineret med en lille UM-F har ændring i DCE ingen effekt på billedkvaliteten.
3. for-forsøg undersøger om billedkvaliteten kan bevares, når den effektive dosis
reduceres ved at justere kV og mAs. De parametre, som i forsøg 1 og 2 sås at have
størst effekt på billedkvaliteten (UM-F, UM-K og DCE), inkluderes i forsøget.
Parameterværdierne vælges, så de lave værdier svarer til dem anvendt i klinikken
(standard-værdier), og de høje værdier vælges i den retning, som i forsøg 1og 2 gav den
bedste effekt på billedkvaliteten (optimerede værdier). To sæt billeder optages ved to
forskellige kV-indstillinger (85 og 63 kV), som ligger hhv. over og under den klinisk
anvendte kV (70 kV), der anvendes som reference. Eksponering med 85 kV (og
tilpasning af mAs så detektordosis forbliver uændret) resulterer i en effektiv
dosisreduktion på 30 % sammenlignet med referencen. Ved eksponering med 63 kV
reduceres mAs så den effektive dosis svarer til den givet ved 85 kV-eksponeringen.
30
Derefter sammenlignes effekten på IQF når der processeres med hhv. de lave (standard)
og de høje (optimerede) parameterværdier. Referencen processeres med
standardværdierne og IQF beregnes til 43. Forsøgets elementer er illustreret i tabel 2.
Tabel 2. Oversigt over 3. for-forsøg i EN. Tabellen viser IQF ved forskellige kombinationer af eksponering (varierende kV) og processering (varierende parameterværdier). Parameterindstillingen ’lav’ svarer til standard-værdier anvendt i klinikken, mens parameterindstillingen ’høj’ svarer til optimerede værdier af parametrene UM-F, UM-K og DCE. Kombinationen af 70 kV-standardprocessering udgør referencen, som de øvrige kombinationer sammenlignes med. Den effektive dosis er angivet i forhold til referencen, som er svarende til den i klinikken givne dosis. kV Parameter-værdier IQF Dosis 70 (reference) Lav 43 Reference 85 Lav 57 30 % reduktion i
forhold til reference 85 Høj 49 30 % reduktion 63 Lav 46 30 % reduktion 63 Høj 45 30 % reduktion
Resultaterne for IQF viser, at for 85 kV-forsøget stiger IQF kraftigt i forhold til
referencen (fra 43 til 57), når standardparameterværdierne fastholdes. Når de
optimerede parameterværdier anvendes falder IQF til 49. Dvs. når kV øges og dosis
reduceres, så falder billedkvaliteten, men dette kan i en vis grad kompenseres vha.
optimerede processeringsparametre.
For 63 kV-forsøget ses en mindre stigning i IQF (til 46) ved standardparametre og en
næsten tilsvarende IQF (45) ved de optimerede parametre. Dvs. når kV og dosis sænkes,
reduceres billedkvaliteten lidt uanset de anvendte processeringsparametre. Her ses altså
ingen effekt af optimerede processeringsværdier sammenlignet med
standardprocessering.
Vha. de beskrevne for-forsøg har EN identificeret de parametre, som har størst effekt på
billedkvaliteten (UM-F, UM-K og DCE), og har optimeret værdierne af disse, så den
bedste billedkvalitet opnås.
De optimerede parametre anvendes så i et hovedforsøg, hvis forsøgsdesign og
billedkvalitetsevalueringsmetode er tættere på den kliniske praksis.
31
Hensigten er at evaluere, om de resultater, der blev opnået med CDRAD-fantomet, kan
reproduceres på billeder, der indeholder menneskelignende strukturer.
Til forsøget anvendes et Alderson-fantom og billedkvaliteten evalueres vha. VGA
baseret på etablerede kvalitetskriterier (EQC), og evalueringen udføres af fem
radiologer.
Forsøget sammenligner effekten af 3 forskellige kombinationer af parameterværdier.
Den 1. kombination anvender standard-værdierne. Den 2. og 3. kombination anvender
de optimerede værdier af UM-F og UM-K, mens DCE er sat til en hhv. lav og høj
værdi. Processering med de tre parameterkombinationer udføres på billeder optaget med
63, 70 og 85 kV og reduceret dosis, på samme vis som i 3. for-forsøg.
Til evalueringen anvendes ’70 kV-standard-processering’-billedet som reference, og de
øvrige billeder vurderes i forhold til dette. Data fra de fem radiologers vurderinger
behandles statistisk og omsættes til et nyt mål, ’relative position’ (RP), der kan antage
værdien -1 til 1. RP-værdien angiver, om ændringen i billedkvalitet, som følge af en
given kombination af kV og processering, er dårligere, ens eller bedre end reference-
billedet. RP udtrykker den samlede vurdering for et givent billede på tværs af de 5
radiologers individuelle vurderinger. Som et mål for variationen i vurderingerne på
tværs af de fem radiologer bruges ’relativ-rang-varians’ (RV), hvor en mindre værdi
angiver en mere homogen vurdering på tværs af gruppen. Resultaterne af forsøget ses i
tabel 3.
Det ses af tabel 3, at kombinationen 70 kV-opt.UM-F/UM-K-std.DCE giver den største
positive RP-værdi på 0,35. Dette angiver, at der er 35 % sandsynlighed for at
radiologerne scorer dette billede som værende af højere kvalitet end referencebilledet.
Den anden 70 kV-kombination (opt.UM-F/UM-K-opt.DCE) har en RP tæt på nul,
hvilket indikerer at dette billede vurderes meget lig referencebilledet.
Alle 85 kV-billederne har en signifikant negativ RP-værdi, som dog er aftagende når de
optimerede parametre anvendes. Dette indikerer, at alle 85 kV-billederne vurderes som
dårligere end standard-billedet, men at den optimerede processering i en vis grad
kompenserer for dette.
32
Alle 63-kV-billederne har en lille negativ RP-værdi, som ikke er signifikant forskellig
fra 0. Dette indikerer, at disse billeder vurderes meget lig referencebilledet – uanset
valget af processering.
Tabel 3. RP-værdier og RV-værdier samt tilhørende konfidensintervaller for hver kombination af kV og processeringsparametre. Der er tre forskellige kombinationer af processeringsparametre – én hvor alle tre parametre har standardværdi (lav), én hvor DCE har standardværdi og UM-F og UM-K har optimerede (høje) værdier og én hvor alle tre parametre har optimerede (høje) værdier. RP udtrykker den samlede vurdering for et givent billede sammenlignet med referencen. RV angiver, hvor homogen vurderingen af et givent billede har været på tværs af gruppen. Som reference er anvendt kombinationen ’70 kV-standard-processering’ (ej vist). Modificeret efter tabel 6 i (4). Parametervalg RP-værdi og 95 %
konfidensinterval RV-værdi og 95 % konfidensinterval
70 kV DCE Std. UMF Opt. UMK Opt.
0,35 (0,15 til 0,55)
0,35 (0,09 til 0,44)
70 kV DCE Opt. UMF Opt. UMK Opt.
0,04 (-0,15 til 0,23)
0,45 (0,16 til 0,61)
85 kV DCE Std. UMF Std. UMK Std.
-0,60 (-0,71til -0,49)
0,03 (0 til 0,02)
85 kV DCE Std. UMF Opt. UMK Opt.
-0,30 (-0,50 til -0,10)
0,29 (0,08 til 0,37)
85 kV DCE Opt. UMF Opt. UMK Opt.
-0,41 (-0,62 til -0,20)
0,44 (0,15 til 0,59)
63 kV DCE Std. UMF Std. UMK Std.
-0,07 (-0,21 til 0,07)
0,02 (0 til 0,01)
63 kV DCE Std. UMF Opt. UMK Opt.
-0,02 (-0,24 til 0,2)
0,59 (0,29 til 0,9)
63 kV DCE Opt. UMF Opt. UMK Opt.
-0,15 (-0,3 – 0,14)
0,43 (0,17 til 0,6)
33
Det ses også i tabellen, at RV-værdien er høj for de optimerede billeder (uanset kV)
sammenlignet med standardprocesseringerne, hvilket viser, at der er store individuelle
variationer på tværs af de fem radiologer. Dette indikerer, at radiologerne vurderer
billederne med de optimerede parametre forskelligt.
I VGA forsøget bemærkes det, at nogle af de optimerede billeder er mere støjfyldte. Af
denne grund vælger EN at inkludere parameteren Noise compensation (NC) i et ’4. for-
forsøg’ analogt til 3. for-forsøg, hvor de undersøgte parametre nu er NC, UM-F, DCE
og UM-K.
Resultaterne af dette forsøg viser, at de signifikante parametre er NC, UM-F og UM-K.
For 85 kV-forsøget opnås den mindste IQF med en lav UM-F, høj UM-K og høj NC.
For 63 kV-forsøget opnås den mindste IQF når alle tre parametre sættes til høj værdi.
Forsøget viser også, at høj NC har en positiv effekt på billedkvalitet uanset værdierne af
de andre parametre. Desuden ses en interaktion mellem alle tre parametre, hvor den
tidligere omtalte interaktion mellem UM-F og UM-K (se 2. for-forsøg) er mere udtalt
ved en lav værdi af NC.
7.1.2 Diskussion af Eva Norrman’s resultater
Vi opsummerer og diskuterer resultaterne af EN’s forsøgsrække.
Den første screening af et større antal parametre identificerer tre, som har en væsentlig
effekt på IQF, når parameterværdierne ændres fra lav til høj: UM-F, UM-K og DCE.
Resultaterne af de første par forsøg viser, at disse parametre har hovedeffekter og
interaktionseffekter på IQF.
UM-F’s hovedeffekt er at påvirke IQF positivt, men denne effekt påvirkes af værdien af
UM-K: ved en lille værdi af UM-K er effekten af UM-F svarende til dens hovedeffekt,
men ved en høj værdi af UM-K, resulterer en høj UM-F i en reduktion af IQF. Dvs. en
høj forstærkningsfaktor forbedrer billedkvaliteten når den kombineres med en stor
kernel-størrelse, men forringer billedkvaliteten, når den kombineres med en lille kernel-
størrelse.
UM-K’s hovedeffekt er at reducere IQF, dvs. en stor kernel forbedrer i sig selv
billedkvaliteten.
34
DCE’s hovedeffekt er at reducere IQF (forbedrer billedkvaliteten), men grundet en
interaktionseffekt mellem UM-F og DCE, forbedrer høj DCE kun billedkvaliteten når
den kombineres med en høj UM-F. Kombineret med en lille UM-F har DCE ingen
effekt på billedkvaliteten.
De første par forsøg viser altså, at en forbedret billedkvalitet kan opnås med
kombinationen af en stor kernel, høj forstærkningsfaktor og høj detail contrast
enhancement. Denne kombination udgør således de optimerede tre parametre.
3. forsøg sammenligner effekten på IQF ved hhv. standard og optimeret processering på
billeder optaget ved hhv. 63 og 85 kV.
Generelt bekræftes konklusionen vedr. hvilke værdier, der er optimale, bortset fra at der
ikke ses nogen effekt af at ændre DCE. Vi undrer os over, at dette forsøg ikke viser
samme resultat for DCE som de foregående forsøg. Måske skyldes det, at interaktionen
mellem UM-F og DCE kun ses i samspil mellem UM-F x UM-K x DCE.
Tilstedeværelsen af denne treleddede interaktion sås faktisk i første forsøg, men den
underliggende mekanisme kunne ikke afdækkes i dette forsøg. EN forfølger ikke denne
problemstilling nærmere i sin diskussion, men har dog inddraget denne observation ved
at inkludere hhv. en lav og en høj værdi af DCE sammen med optimerede værdier af
UM-F og UM-K til hovedforsøget.
Når IQF for de to eksponeringsværdier sammenlignes, viser forsøg 3 at billedkvaliteten
forbliver næsten uændret/lidt dårligere når dosis sænkes ved at reducere kV og mAs.
Der ses ikke nogen væsentlig effekt af anvendelse af optimerede versus standard
processering. Når dosis sænkes ved at øge kV, reduceres billedkvaliteten væsentligt,
men dette kan i en vis grad kompenseres ved at anvende optimerede parameterværdier.
EN forklarer forskellen på effekten (af at anvende optimerede parametre) på hhv. lav-
og høj kV-billederne med, at den positive effekt af kontrastoptimering vha. en stor UM-
K har mindre betydning på et lav-kV-billede. Her er kontrasten automatisk bedre
sammenlignet med et høj-kV-billede. Dette er efter vores mening en plausibel
forklaring.
35
I EN’s hovedforsøg undersøges det, om resultaterne opnået ved for-forsøgene udført
med CDRAD-fantom og IQF, kan reproduceres i en mere realistisk situation, hvor
billedkvaliteten vurderes vha. en VGA-analyse. Den bedste kombination i dette forsøg
er anvendelsen af optimerede værdier af UM-K og UM-F, standardværdi af DCE, og
brug af samme kV som i klinikken. Dette forsøg viser essentielt set det samme som 3.
for-forsøg – nemlig at anvendelse af højere kV forringer billedkvaliteten, hvilket til dels
kompenseres af optimerede parametre, men at anvendelse af lavere kV(og dosis) kan
bevare samme billedkvalitet, uanset valget af processeringsparametre.
Disse observationer er interessante af to grunde, dels fordi de viser, at resultaterne
opnået med CDRAD-fantom/IQF er sammenlignelige med resultaterne af Alderson-
fantom/VGA. Dels fordi det er interessant at billedkvaliteten forbliver næsten uændret
trods reduceret dosis, men at dette ses uanset om der anvendes optimerede
processeringsparametrene. Til gengæld ses de optimerede værdier at have en effekt ved
en højere kV, hvilket indikerer, at optimering af processeringsparametre har tiltagende
betydning jo mere billedets egen kontrast forringes som følge af anvendelse af en højere
kV.
VGA-analysen illustrerer også en anden vigtig pointe, nemlig at radiologerne opfatter
billeder, der er processerede med optimerede parametre, meget forskelligt. Dette viser,
at der ikke er konsensus om, hvad der er ’godt og skidt’ når man taler om
billedoptimering vha. processering. Samme pointe ses hos andre, der har undersøgt
dette emne (6, 15).
Som følge af resultaterne af VGA-forsøget, vælger EN at undersøge endnu en parameter
– NC, som derfor inkluderes i et nyt faktorielt forsøg. Dette viser dels, at NC har en stor
hovedeffekt, hvor høj NC forbedrer billedkvaliteten. Det viser også, at der er en
interaktionseffekt mellem NC, UM-F og UM-K, hvor lav NC forstærker
interaktionseffekten mellem UM-F og UM-K. Dette indikerer, at støjreduktion har en
vigtig effekt på billedkvaliteten, men EN har desværre ikke fulgt op på denne
observation i et nyt forsøg med VGA. Dette kunne ellers være interessant, fordi støj
tilsyneladende blev opfattet som forstyrrende i VGA-studiet, så inklusion af en
støjreducerende parameter kunne tænkes at have væsentlig betydning.
36
7.2 Praktisk del - forsøg
Dette afsnit udgør den praktiske indgangsvinkel til besvarelsen af
problemformuleringen – vores eget forsøg. I det følgende beskrives udførelsen af
forsøget og de overvejelser, vi har haft i denne forbindelse. Dernæst beskrives den
statistiske databehandling, efterfulgt af en præsentation og diskussion af forsøgets
resultater.
I nogle af afsnittene er en henvisning til bilag, der uddyber forskellige aspekter af
forsøget.
Forsøgets indhold og formål kan opsummeres i en enkel sætning:
Sammenligning af invers Image Quality Factor (inv. IQF) på billeder af CDRAD-
fantom optaget med et DX-system, ved forskellige kombinationer af
processeringsparameter-indstillinger af Canons MLT(S).
7.2.1 Materialer og udstyr til forsøget
• Røntgenrør
• DX-detektor
• Arbejdsstation med monitor og MLT(S) software
• To plader PMMA (plexiglas) 30 x 30 x 6 cm
• CDRAD-fantom
• CDRAD-Analyser-program
• Excel, MatLab og opslagstabeller til statistiske beregninger
En detaljeret liste over det anvendte udstyr ses i bilag 1.
7.2.2 Forsøgets udførelse
Forsøget blev udført på følgende måde:
• Detektoren blev placeret på gulvet.
• CDRAD-fantomet blev placeret mellem de to PMMA plader oven på detektoren
37
• Teknikfaktorerne blev indstillet svarende til en klinisk senge-thoraxundersøgelse
på Rigshospitalet:
Film-fokus-afstand: 150 cm
kV: 102
mAs: 1,2
raster: ej anvendt
• Fantomet blev eksponeret med 27 forskellige kombinationer af
processeringsparametre og parameterindstillinger (3 parametre, 3 indstillinger:
33 = 27) (se tabel 5 ). For hver af de 27 kombinationer udførtes tre replikater,
dvs. i alt 81 eksponeringer. De valgte parametre og parameterindstillinger
gennemgås i afsnittet Valg af processerings-parametre nedenfor.
• Hvert billede blev gemt i PACS og alle billeder blev efterfølgende brændt ned
på CD-rom.
• Billederne blev analyseret vha. CDRAD-Analyser program. Inv. IQF blev
beregnet for hvert billede.
• Resultaterne blev behandlet statistisk vha. F-max-test, ensidig varians analyse og
Tukey-test.
En skitse over forsøgsopstillingen ses på figur 7.
Figur 7. Skitse af
forsøgsopstilling.
38
7.2.3 Overvejelser i forbindelse med design af forsøg
Intentionen med udførelsen af vores eget forsøg har været at lave en systematisk
afprøvning af en række kombinationer af processeringsparametre og parameterværdier,
mhp. at undersøge hvilke(n) kombination(er) der giver en bedre billedkvalitet, evalueret
vha. ændringer i inv. IQF. Vi har derfor valgt at udføre forsøget med brug af et
CDRAD-fantom.
I forbindelse med udformningen af vores eget forsøg, har vi har ladet os inspirere af det
faktorielle forsøgsdesign med 2k observationer. Analogt til dette, har vi kombineret tre
parametre (’faktorer’ i faktoriel design-terminologi) hver indstillet på tre værdier
(’niveauer’) og målt inv. IQF for hver af de mulige kombinationer af parametre og
parameterværdier. Det samlede antal kombinationer er således, som nævnt, 33 = 27.
Bortset fra den systematiske gennemprøvning af alle kombinationer af de valgte
parametres værdier, har vi ikke ønsket at gennemføre et faktorielt forsøg, fordi den
statistiske behandling af forsøgsdata er for kompliceret til en opgave på dette niveau.
Nedenfor følger en beskrivelse af de væsentligste overvejelser omkring forsøgets design
og udførelse.
Valg af røntgensystem og billedbehandlingssoftware
Vi har valgt et Santax (Canon) – DX system af en række teoretiske og praktiske grunde:
• DX-systemer får tiltagende større markedsandele (12), hvorfor det er relevant
for vores profession at opnå en grundlæggende forståelse for, hvordan dette
system fungerer.
• Af praktiske grunde har DX været bedst at anvende til forsøget, fordi
afprøvningen af mange forskellige parameterkombinationer er tidskrævende, og
dermed lettest at gennemføre på et DX-system.
• Vi ønskede at arbejde med Multi frequency processesing (MFP) fordi denne
type billedprocessering i dag er den foretrukne processeringsmetode hos de store
producenter (6, 36).
• MLT(S) er tilgængelig på det DX-system, vi har valgt at arbejde med. Ulempen
ved MLT(S) er, at vi kun har haft begrænset adgang til litteratur om de
underliggende principper bag denne software.
39
Valg af teknikfaktorer og forsøgsopstilling
• I forbindelse med valg af teknikfaktorer ønskede vi at gøre forsøget så praksis-
nært som muligt. Da MLT(S) er udviklet til processering af thoraxbilleder af
voksne (27), var det naturligt at vælge teknikfaktorer svarende til en
thoraxundersøgelse. Vi valgte faktorerne til en sengethoraxoptagelse, fordi
forsøgsopstillingen af praktiske grunde mindede mest om dette.
• For at efterligne røntgenstrålernes opførelse under deres passage gennem en
patient (absorptionen,’beam-hardening’ og dannelsen af spredt stråling), har vi
placeret CDRAD-fantomet mellem to plader af PMMA på hver 6 cm’s tykkelse.
PMMA er brugt fordi dette materiale har egenskaber, der minder om
menneskeligt væv mht. røntgenabsorption, og ofte er anvendt i litteraturen til
lignende undersøgelser (11, 31, 43).
Valg af metode til evaluering af billedkvalitet
Vi har valgt et CDRAD-fantom og –Analyser til evaluering af billedkvalitet fordi:
• Inv. IQF (eller IQF), som fås ved analyse af billeder af CDRAD-fantomet,
dækker over to vigtige og objektivt målelige billedkvalitetsegenskaber - rumlig
opløsning og lavkontrastopløsning (17). Samtidig har CDRAD-fantomet de
fordele, at det er relativt nemt at anvende, at vi har mulighed for at måle
billedkvaliteten uafhængigt af andre professionelle (fx radiologer) og at metoden
har vist sig at give resultater svarende til mere helhedsorienterede metoder (18).
• Programmet CDRAD-Analyser er anvendt fordi programmet gjorde os fri af den
inter- og/eller intrasobserver variation der ville være, hvis vi skulle analysere
billederne manuelt (18). Desuden er det meget hurtigere at analysere billederne
vha. programmet frem for manuelt, hvilket gør det muligt at analysere mange
billeder.
Valg af processerings-parametre
• Vi har valgt at inkludere parametrene Edge-enhancement Effect (EE), Edge-
enhancement Frequency (EF) og Noise reduction (NR) i forsøget, mens vi har
40
udeladt Dynamic range adjustment (som bruges til at reducere dynamikområdet
i billeder med stort dynamikområde).
Dette skyldes at CDRAD-fantomet har et mindre dynamisk område, hvorfor
CDRAD-fantomet formodes at være mindre egnet til at undersøge effekten af
denne parameter.
• For hver af de tre parametre har vi valgt tre forskellige værdier, en lav, en
mellem og en høj. En oversigt over intervaller, standardindstillinger og de i
forsøget anvendte parameterværdier ses i tabel 4. En samlet oversigt over de
anvendte parameterkombinationer ses i tabel 5.
• Følgende brugerkontrollerede parametre har vi ladet stå på standardindstillinger:
Dynamic range adjustment (10 – kan indstilles i intervallet 1-20) samt kontrast
og brightnes (hhv. 15 og 8 - begge kan indstilles i intervallet 1-29).
• Vi har ændret LUT-kurven fra standardindstillingen (hvilket til thoraxoptagelser
er en S-formet kurve) til en lineær kurve, hvilket gav det bedste visuelle indtryk.
Da kontrastændringen i et CDRAD-fantom er mere jævn end i et rigtigt thorax-
billede (31), er det meningsfuldt at bruge en lineær LUT-kurve Dette stemmer
godt overens med det faktum, at lineære kurver anvendes til tekniske test (21).
Tabel 4. Interval, standardindstillinger og de i forsøget anvendte parameterværdier. Interval angiver det spænd af parameterværdier, som softwaren tillader. Standard er systemets standardindstilling for den givne parameter ved en sengethoraxoptagelse. Lav, Medium og Høj er de værdier, vi har valgt for parametrene i forsøget. Parametre anvendt i forsøget
Interval og defaultindstillinger for hver parameter
Parameterværdier anvendt i forsøget
Interval Standard Lav Medium Høj
Edge enhancement Effect (EE) 1-20 5 1 5 20
Edge enhancement Frequency (EF)
1-7 7 1 4 7
Noise reducktion (NR) 1-10 5 1 5 10
41
Tabel 5. Parameterkombinationer og tilhørende løbenumre anvendt i forsøget. Parametre: EE (Edge enhancement Effect), EF (Edge enhancement Frequency), NR (Noise Reduction). Parameterværdier: L (lav), M (medium), H (høj). De valgte værdier for de tre parametre ses i tabel 5. 1 EE-L, EF-L, NR-L 16 EE-M, EF-H, NR-L 2 EE-L, EF-L, NR-M 17 EE-M, EF-H, NR-M 3 EE-L, EF-L, NR-H 18 EE-M, EF-H, NR-H 4 EE-L, EF-M, NR-L 19 EE-H, EF-L, NR-L 5 EE-L, EF-M, NR-M 20 EE-H, EF-L, NR-M 6 EE-L, EF-M, NR-H 21 EE-H, EF-L, NR-H 7 EE-L, EF-H, NR-L 22 EE-H, EF-M, NR-L 8 EE-L, EF-H, NR-M 23 EE-H, EF-M, NR-M 9 EE-L, EF-H, NR-H 24 EE-H, EF-M, NR-H 10 EE-M, EF-L, NR-L 25 EE-H, EF-H, NR-L 11 EE-M, EF-L, NR-M 26 EE-H, EF-H, NR-M 12 EE-M, EF-L, NR-H 27 EE-H, EF-H, NR-H 13 EE-M, EF-M, NR-L 14 EE-M, EF-M, NR-M 15 EE-M, EF-M, NR-H
42
Praktiske hensyn ved forsøgets udførelse
• Vores oprindelige intention var et forsøgsdesign, hvor CDRAD-fantomet skulle
have været eksponeret tre gange (tre replikater), og hver replikat skulle have
været processeret med de forskellige processeringskombinationer. Hensigten
med denne fremgangsmåde ville være at fjerne effekten af ukontrollerbare
variationer i billedoptagelsen, som kan tænkes at introducere en vis usikkerhed
på resultaterne.
Denne fremgangsmåde kunne ikke lade sig gøre, fordi det viste sig umuligt at
processere samme billede flere gange og gemme hvert billede på ny i PACS. Vi
valgte derfor i stedet at eksponere et nyt billede for hver parameterkombination
og for hver replikat. Hensigten med replikaterne er at beregne et gennemsnit og
en standardafvigelse for hver parameterkombination.
• Dernæst var det vores intention at eksponere de forskellige kombinationer i
vilkårlig rækkefølge (udvalgt vha. ægte tilfældige tal) for at undgå at indføre en
evt. systematisk bias. Dette var dog ikke muligt fordi vi kun havde
undersøgelsesrummet til rådighed i begrænset tid.
I stedet eksponerede vi kombinationerne i den systematiske rækkefølge, som vi
havde skrevet dem op i.
• I forbindelse med dataanalysen vha. CDRAD-Analyser programmet havde
intentionen været at analysere hvert billede tre gange, for at undersøge om der
var en variation i programmets resultater. Vi afprøvede dette og fandt, at
programmet reproducerede nøjagtigt samme resultat. Vi valgte derfor at
analysere hvert billede én gang.
Under vores afprøvning af CDRAD-analyser programmet opdagede vi, at
programmet for at beregne inv. IQF korrekt, skal have defineret afgræsningen af
fantomets huller meget præcist. Programmet forsøger selv at finde denne
afgrænsning, men dette lykkedes ikke altid. I de tilfælde måtte vi manuelt
definere analyseområdet. Hvorvidt det var programmets automatiske eller en
manuel definition af analyseområdet, så ud til at indføre en mindre variation i
resultaterne.
43
7.2.4 Statistisk analyse af data
Data fra CDRAD-Analyser programmet blev opgjort både som en IQF- og en inv. IQF-
værdi. Vi har valgt at bruge inv. IQF. Gennemsnittet af inv. IQF for de tre replikater
indenfor hver parameterkombination er beregnet og anvendt i de efterfølgende
statistiske beregninger og til præsentationen af resultaterne.
Under de statistiske beregninger har vi valgt et signifikansniveau på 0,01, undtaget i
testen for varianshomogenitet (F-max test – se nedenfor), hvor signifikansniveauet er
0,05.
Vi gennemførte først en Fmax-test og en ensidig variansanalyse, og derefter en Tukey-
test. Vi beskriver her de væsentlige resultater. En detaljeret oversigt over de statistiske
beregninger ses i bilag 2-4.
Ensidig variansanalyse
Ved denne test undersøges det, om der er en statistisk signifikant forskel på datasættets
to mest ekstreme inv. IQF-værdier. Denne analyse forudsætter, at tre betingelse er
opfyldt vedr. replikaterne indenfor hver parameterkombination:
• Replikaterne skal være normalfordelte. Vi har ikke mulighed for at undersøge
om dette er tilfældet, da vi kun har tre replikater, men vi mener, at en sådan
antagelse er rimelig.
• Replikaterne skal være indbyrdes uafhængige. Vi véd, at dette er tilfældet.
• Replikaterne skal være varianshomogene. Dette har vi testet vha. en Fmax test.
Ved denne test undersøges det, om den største og den mindste varians, indenfor
hver af de 27 kombinationer, afviger signifikant fra hinanden. Vi fandt at Fmax
beregnet < Fmax tabel (se bilag 2), hvilket viser at varianserne er homogene
(29, 30).
Forudsætningerne for at gennemføre en ensidig variansanalyse er således opfyldte.
Denne analyse gennemføres ved at beregne en F-værdi, som sammenholdes med en
kritisk tabel-værdi (29). H0- og H1-hypoteserne er:
44
H0 = der er ingen forskel mellem de to mest ekstreme inv. IQF-værdier (og dermed
heller ikke mellem nogen af de øvrige værdier).
H1 = der er statistisk signifikant forskel på de to mest ekstreme inv. IQF-værdier.
Da Fberegnet> Ftabel (se bilag 3) forkastes H0. Som det ses af beregningerne i bilaget, er den
beregnede F-værdi mere end en faktor hundrede gange større end tabellens F-værdi,
dvs. resultatet er endog meget signifikant. Konklusion er derfor, at der er en signifikant
forskel mellem de to mest ekstreme inv. IQF-værdier, som repræsenterer hver deres
parameterkombination.
Tukey-test
Med denne test kan alle inv. IQF-værdier sammenlignes parvist med alle andre inv.
IQF-værdier, mhp. at identificere de parvise inv. IQF-værdier, der afviger signifikant fra
hinanden. Denne analyse forudsætter, at der er en signifikant forskel mellem de to mest
ekstreme inv. IQF-værdier og at antallet af replikater er ens for alle kombinationerne
(29). Begge forudsætninger er opfyldte.
Testen gennemføres på følgende måde (se bilag 4): alle parvise differencer mellem inv
IQF- værdierne for de 27 parameterkombinationer beregnes. Desuden beregnes test-
værdien T, som repræsenterer grænseværdien mellem de inv. IQF-værdier, der er
signifikant forskellige fra hinanden, og de, der ikke er. Dette sker ved, at identificere
alle de differencer, der er numerisk større end T-værdien – disse er signifikant
forskellige fra hinanden. Resultaterne af denne test beskrives i afsnit 7.2.5 Præsentation
af forsøgsresultater.
45
7.2.5 Præsentation af forsøgsresultater
I dette afsnit vil vi først beskrive de tendenser, som ses, når man betragter et
søjlediagram over forsøgsdata. Dernæst vil vi præsentere resultaterne af de statistiske
analyser. Resultaterne af begge dele diskuteres i afsnit 7.2.6 Diskussion af
forsøgsresultater.
Tendenser i forsøgsresultaterne
Forsøgets resultater ses på figur 8, som viser et søjlediagram over inv. IQF for hver af
de forskellige parameterkombinationer.
Der er nogle mønstre i variationerne af inv. IQF for de forskellige
parameterkombinationer, som springer i øjnene når man betragter figur 8. Disse mønstre
afspejles i den måde parameterværdierne er kombineret på. Vi vil derfor først beskrive
logikken i denne sammensætning af parameterkombinationer, se tabel 6.
Kombinationerne af parameterværdierne er konstrueret således, at parameterværdierne
varierer på en ordnet måde indenfor grupper af én, tre og ni parameterkombinationer:
Indenfor en gruppe af tre kombinationer (1-3, 4-6 osv). er det kun Noise reduction (NR)
der varierer fra lav (L) over mellem (M) til høj (H) værdi, mens de to andre
parameterværdier er konstante. Systematikken i variationen for Edge enhancement
Effect (EE) er, at denne holdes konstant indenfor grupper af 9 kombinationer, mens
Edge enhancement Frequency (EF) holdes konstant indenfor grupper af tre
kombinationer. Ligesom NR, stiger EE og EF også trinvist i værdi fra L til H.
Da vi i den følgende beskrivelse hele tiden holder gruppeinddelingen med tre
kombinationer for øje, vil vi benytte benævnelserne A-I for de fortløbende 9 grupper à
tre kombinationer.
De nedenfor beskrevne tendenser underbygges ikke nødvendigvis af de statistiske
analyser. Dette uddybes i afsnit 7.2.6 Diskussion af resultater.
Det ses på figur 8 at inv. IQF varierer i henhold til gruppeinddelingen, idet inv. IQF
stiger trinvist fra én parameterkombination til den næste indenfor hver gruppe.
Fælles for de kombinationer, hvor inv. IQF er den mindste i gruppen er, at de
indeholder NR-L.
46
Analogt hertil, er det fælles for kombinationerne med en mellemstor inv. IQF, at de
indeholder NR-M, og fælles for kombinationerne med stor inv. IQF, at de indeholder
NR-H. Indenfor den enkelte gruppe er det kun NR der varierer, mens EE og EF er
konstante.
Dette mønster indikerer, at NR har en stor effekt på inv. IQF og at en højere værdi af
NR resulterer i en højere inv. IQF-værdi, uanset værdien af EE og EF.
Når man betragter fordelingen af inv. IQF på tværs af grupperne ses også nogle
bestemte mønstre. Det ses, at de respektive lave, mellem og høje værdier af inv. IQF
forbliver ret konstante på tværs af gruppe A-E samt G. De tilsvarende værdier i Gruppe
F og H er indbyrdes jævnbyrdige, men lidt lavere end i gruppe A-E+G. Gruppe I
repræsenterer de laveste værdier i hele datasættet indenfor de respektive lave, mellem
og høje inv. IQF-værdier.
47
Tabel 6. Tabellen viser forsøgets sammensætning af parameterkombinationer og tilhørende inv. IQF-værdi. Løbenummer angiver rækkefølgen hvori parameterkombinationerne er eksponeret og præsenteret. Gruppe angiver inddelingen af parameterkombinationer, som er beskrevet i forbindelse med figur 8. Gruppe Løbenummer Parameter kombination Inv. IQF
Gruppe A 1 EE-L, EF-L, NR-L 1,31 2 EE-L, EF-L, NR-M 1,63 3 EE-L, EF-L, NR-H 2,03
Gruppe B 4 EE-L, EF-M, NR-L 1,30 5 EE-L, EF-M, NR-M 1,45 6 EE-L, EF-M, NR-H 2,17
Gruppe C 7 EE-L, EF-H, NR-L 1,28 8 EE-L, EF-H, NR-M 1,60 9 EE-L, EF-H, NR-H 1,95
Gruppe D 10 EE-M, EF-L, NR-L 1,28 11 EE-M, EF-L, NR-M 1,68 12 EE-M, EF-L, NR-H 2,09
Gruppe E 13 EE-M, EF-M, NR-L 1,26 14 EE-M, EF-M, NR-M 1,63 15 EE-M, EF-M, NR-H 1,95
Gruppe F 16 EE-M, EF-H, NR-L 1,16 17 EE-M, EF-H, NR-M 1,43 18 EE-M, EF-H, NR-H 1,75
Gruppe G 19 EE-H, EF-L, NR-L 1,32 20 EE-H, EF-L, NR-M 1,70 21 EE-H, EF-L, NR-H 1,99
Gruppe H 22 EE-H, EF-M, NR-L 1,16 23 EE-H, EF-M, NR-M 1,33 24 EE-H, EF-M, NR-H 1,60
Gruppe I 25 EE-H, EF-H, NR-L 0,77 26 EE-H, EF-H, NR-M 1,05 27 EE-H, EF-H, NR-H 1,29
48
Figur 8. Figuren viser et søjlediagram over inv. IQF ved de 27 forskellige parameterkombinationer, som udgør datasættet i vores forsøg. Gruppe A-F angiver inddelingen af parameterkombinationer i undergrupper, som beskrevet i teksten.
49
Hvis man betragter gruppe F-H+I er disse tre grupper kendetegnet ved, i modsætning til
gruppe A-E+G, at indeholde mellem og/eller høje værdier af både EE og EF. Dette indikerer,
at samtidige mellem/høje værdier af EE og EF har en negativ effekt på inv. IQF. Når gruppe
F-H+I sammenlignes internt, ses det at F og H har hhv. en mellemværdi af den ene og en høj
værdi af den anden parameter, mens I har høje værdier af både EE og EF. Dette understøtter
observationen, at samtidige mellem/høje værdier af EE og EF har en negativ effekt på inv.
IQF. Det indikerer også, at jo højere værdi af EE/EF jo mindre bliver inv. IQF.
Flere observationer indikerer dog, at mindst en af disse parametre skal have en høj værdi mens
den anden har en mellem værdi, for at inv. IQF påvirkes negativt: Fx ses det, at gruppe E
indeholder EE-M og EF-M, og inv. IQF-værdierne for E er svarende til dem fundet i A-D+G.
Desuden ses, at i alle de grupper, hvor den ene parameter EE eller EF er lav mens den anden
parameter varierer, er inv. IQF-værdierne ensartede (når man sammenligner de respektive NR-
L –M og -H-kombinationer). Det gælder både i de grupper, hvor EF er konstant lav, mens EE
stiger trinvist (gruppe A, D og G), og i de grupper, hvor EE er konstant lav og EF stiger
trinvist (grupper A-C).
Dette mønster indikerer, at bare den ene af parametrene EE eller EF er lav, så vil en høj værdi
af den anden parameter ikke påvirke inv. IQF negativt.
Datasættet kan også præsenteres ved at opstille kombinationerne i rangorden fra største til
mindste inv. IQF. Herved kan egenskaberne ved parameterkombinationerne karakteriseres i
henhold til placeringen indenfor denne rangorden. Herved fås essentielt set den samme
tolkning af effekterne af de tre parametre, som vi nåede frem til fra figur 8, blot illustreret på
en anden måde. Dette er vist i bilag 5.
Resultater af statistiske analyser
Som beskrevet i afsnittet ’Statistisk analyse af data’ har vi bearbejdet datasættet med ensidig
variansanalyse, som påviser en signifikant forskel på de to mest ekstreme inv. IQF-værdier.
De tilhørende parameterkombinationer er hhv. nr. 6 og nr. 25, som har den højeste og den
laveste inv. IQF-værdi.
50
Efter variansanalysen er næste trin at undersøge, hvilke parameterkombinationer, der afviger
signifikant fra hvilke andre parameterkombinationer. Dette har vi gjort vha. en Tukey-test,
som identificerer alle de parameterkombinationer, hvis inv. IQF afviger signifikant fra
hinanden. Resultaterne af Tukey-testen er vist i tabel 7. Her ses hver enkelt
parameterkombination 1-27 sammen med de tilhørende signifikant afvigende kombinationer
opført i kolonnerne nedenfor.
51
Tabel 7. Tabellen viser resultaterne af Tukey-testen. I øverste række er angivet parameterkombination 1-27. I kolonnerne under hver kombination er de parameterkombinationer angivet, som afviger signifikant fra hver af de 27 kombinationer. Signifikansniveauet er 0,01. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 3 6 1 3 3 1 3 6 1 3 16 1 3 6 1 3 3 13 3 16 1 3 3 6 1 2 3 6 25 4 6 6 2 6 12 4 6 22 4 6 25 4 6 6 16 6 22 4 6 6 12 2 3 6 9 26 5 9 9 4 9 25 5 9 25 5 9 26 5 9 9 22 9 25 5 9 9 25 3 6 9 12 7 12 12 5 12 26 7 12 26 7 12 7 11 12 25 12 26 7 11 12 26 4 8 12 15 10 15 15 7 15 10 15 8 15 10 12 15 26 15 10 12 15 5 9 15 21 13 21 21 8 21 13 21 10 18 13 15 21 21 13 15 21 6 11 21 25 16 25 25 10 25 16 25 13 21 16 18 25 25 16 18 25 7 12 25 17 13 17 16 25 17 20 17 20 8 14 19 14 19 17 19 21 19 21 9 15 22 16 22 19 22 22 10 18 23 17 23 22 23 23 11 20 25 19 25 23 25 25 12 21 26 22 26 24 26 26 13 24 27 23 27 25 27 27 14 24 26 15 25 27 17 26 18 27 19 20 21 23 24 27
52
Tabel 7 viser, at nr. 6 og nr. 25 er de kombinationer, som afviger fra flest andre
kombinationer, hvilket er i overensstemmelse med det faktum, at de repræsenterer de
mest ekstreme inv. IQF-værdier. Det ses også, at der er mange kombinationer, som
afviger signifikant fra hhv. kombination nr. 3, 6, 9, 12, 15, 21, 25 og 26. Nr. 3, 6, 9, 12,
15 og 21 har tilfælles, at de indeholder NR-H og tilhører en af grupperne A-E+G, dvs.
de grupper, som har de høje inv. IQF-værdier. Nr. 25 og 26 har tilfældes at de tilhører
gruppe I og repræsenterer de to laveste inv. IQF-værdier i datasættet. De resterende
kombinationsnumre tilhører lave/mellem inv. IQF-værdier fra gruppe A- E+G samt
lave/mellem/høje værdier i G+H samt den høje værdi i gruppe I. Dette indikerer, at
disse værdier ligger et sted mellem de mere ekstreme inv. IQF-værdier.
En række analyser af datasættet kan udledes fra Tukey testens resultater mhp. at
illustrere forskellige pointer. Af pladsmæssige hensyn har vi valgt kun at undersøge om
de vigtigste tendenser, vi observerede i figur a, kan understøttes af Tukey-testen. Dette
præsenteres i næste afsnit.
53
7.2.6 Diskussion af forsøgsresultater
I følgende afsnit beskriver og diskuterer vi, hvorvidt de mønstre, vi har beskrevet ud fra
figur 8, kan verificeres med resultaterne af Tukey-testen.
Figur 8 indikerer at NR har en væsentlig og positiv effekt på inv. IQF, når NR øges fra
lav til høj, uanset værdien af EE og EF. Tukey-testen bekræfter denne observation, fordi
der er signifikant forskel på mindste og største inv. IQF-værdi indenfor hver gruppe
(undtaget er gruppe H, som er den gruppe, hvor differencen mellem mindste og største
inv. IQF er mindst). Indenfor hver gruppe er det kun værdien af NR, der varierer.
Observationerne fra figur 8 vedr. effekterne af EE og EF er, at samtidige mellem/høje
værdier af disse parametre har en negativ effekt på inv. IQF, og at denne effekt
forstærkes, når parameterværdierne øges, men at den negative effekt af EE og EF ikke
ses, hvis én af parameterværdierne er lav.
Tukey-testens resultater viser, at der ikke er signifikante forskelle mellem de respektive
lave, mellem og høje inv. IQF-værdier mellem grupperne A-H. Omvendt er der
signifikante forskelle mellem mindste inv. IQF i gruppe I og de tilsvarende lave inv.
IQF-værdier i gruppe A-E+G. Tilsvarende er der signifikant forskel mellem midterste
inv. IQF i gruppe I og tilsvarende mellem inv. IQF-værdier i gruppe A,C-E+G samt
mellem højeste inv. IQF i gruppe I og tilsvarende høje inv. IQF-værdier i gruppe A-
E+G.
Tukey-testen bekræfter altså, at gruppe I (som indeholder samtidige høje værdier af EE
og EF) skiller sig markant ud fra de andre grupper. Der er til gengæld ingen statistisk
signifikant forskel mellem de respektive inv. IQF-værdier mellem gruppe F og H (som
indeholder én mellem og én høj værdi af hhv. EE og EF) versus gruppe A-E+G (som
indeholder forskellige kombinationer af lave og mellemværdier af EE og EF). Tukey-
testen bekræfter altså ikke den i figur 8 observerede tendens, at kombinationen af én
mellem og én høj værdi af EE og EF har en negativ effekt på inv. IQF sammenlignet
med lavere værdier af disse parametre. Med andre ord bekræfter Tukey-testen kun, at
samtidig høj værdi af EE og EF påvirker inv. IQF negativt. Resultaterne indikerer
ligeledes, at effekten af EE og EF afhænger af hinanden.
54
Oversat til almindelig billedkvalitetsterminologi viser forsøgets resultater, at høj værdi
af NR har en positiv effekt på billedkvaliteten, mens samtidige høje værdier af EE og
EF har en negativt effekt.
En sammenligning med de kliniske standardindstillinger (se tabel 4) viser, at EE er
indstillet på en mellemværdi, EF på en høj værdi og NR på en mellemværdi. Ifølge
resultaterne af vores forsøg er de kliniske indstillinger altså ikke optimale for at opnå en
høj billedkvalitet. Dette skal dog tages med forbehold, idet vores forsøgsopstilling og
dermed vores resultater ikke nødvendigvis er valide i forhold til en klinisk
sammenhæng, hvor billedkvaliteten vurderes ud fra evnen til at detektere patologiske
tilstande, frem for to fysiske mål (høj- og lavkontrastopløsning). En nærmere diskussion
af dette ses i afsnit 7.3 Samlet diskussion af Eva Norrmans artikel og vores forsøg.
55
7.3 Samlet diskussion af Eva Norrmans artikel og vores forsøg
I følgende afsnit vil vi først give en kort opsummering af EN’s og vores resultater, og
derefter præsentere en samlet diskussion af disse. Vi vil også diskutere resultaterne i
forhold til den teoretiske baggrund om processeringsparametre og i forhold til den
anvendte metode til at måle billedkvaliteten.
Da EN og vi selv anvender hhv. IQF og inv. IQF, vil vi i dette afsnit anvende begrebet
’billedkvalitet’.
Samlet set viser EN’s forsøg med CDRAD-fantom, at parametrene Noise compensation
(NC), Unsharp masking-kernel (UM-K) og Unsharp masking-forstærkningsfaktor (UM-
F) har den største effekt på billedkvaliteten. Parametrene har både hovedeffekter og
interaktionseffekter. En høj værdi af NC har en positiv effekt på billedkvaliteten,
uafhængigt af de andre parametres værdier. En høj UM-K har også en selvstændig,
positiv effekt på billedkvaliteten. Effekten af UM-F afhænger af et samspil med de
andre parametres værdier: En høj UM-F forbedrer billedkvaliteten når den kombineres
med en stor UM-K, men forringer billedkvaliteten, når den kombineres med en lille
UM-K. Denne interaktion mellem UM-F og UM-K er stærkest, når værdien af NC er
lille.
Hensigten med EN’s parameteroptimering er at bevare billedkvaliteten med reduceret
dosis. Derfor anvendes de optimerede parametre i nye forsøg, hvor effekten af
parameteroptimeringen undersøges, når de anvendes på billeder optaget med lavere
dosis. Disse studier anvender VGA, og viser bl.a. at radiologerne opfatter billeder, der
er processerede med optimerede parametre, meget forskelligt. Effekten af
parameteroptimeringen afhænger i høj grad af den anvendte kV: høj-kV billeder har en
dårligere iboende kontrast, og har derfor mest gavn af at processeres med optimerede
parametre.
Vores forsøg viser samlet set, at en høj værdi af Noise reduction (NR) har en
selvstændig, positiv effekt på billedkvaliteten. Samtidige høje værdier af Edge
enhancement Effect (EE) og Edge enhancement Frequency (EF) har derimod en negativ
effekt på billedkvaliteten.
56
EN’s for-forsøg og vores forsøg har flere fællestræk – i begge anvendes DX-udstyr,
billedkvaliteten måles med CDRAD-fantom og computerprogram til billedanalyse, og
alle kombinationer af parameterværdier undersøges. Der er også forskelligheder mellem
EN’s og vores forsøg. Selvom den anvendte processeringssoftware overordnet set
tilhører samme type (MFP), bruger EN og vi forskellig software. De undersøgte
parametre er derfor ikke ens, selv ikke sammenlignelige parametre som NC og NR.
Desuden er dataanalysemetoderne forskellige.
Ud fra vores forsøg fornemmer vi, at de undersøgte parametre, særligt EE og EF,
interagerer med hinanden på måder, som vi kun delvist kan afsløre vha. den anvendte
dataanalyse. Hvis man anvender terminologien fra det faktorielle forsøgsdesign,
indikerer vores forsøg, at effekten af NR er en ’hovedeffekt’, mens effekten af EE og
EF er en ’interaktionseffekt’. Vi ville formentligt kunne afsløre hoved- og
interaktionseffekter langt bedre vha. faktoriel dataanalyse, hvilket dog ligger uden for
opgavens rammer.
Et gennemgående resultat af både EN’s og vores forsøg er således, at forskellige
processeringsparametre interagerer med hinanden på komplekse måder. Dette faktum er
en udfordring i arbejdet med at optimere billedkvalitet vha. processeringsparametre. Det
viser, at der ikke findes simple svar på, hvad optimale parameterværdier er, og det
understreger vigtigheden af, at finde passende kombinationer af forskellige
parameterværdier. I mange tilfælde vil valget af optimerede parameterværdier i øvrigt
også være et kompromis mellem flere modstridende hensyn (2).
Et andet resultat, som både ses i EN’s og vores forsøg, er at brug af støjreducerende
processeringsparametre har stor og positiv effekt på billedkvaliteten. Dette er i
overensstemmelse med det faktum, at billedstøj er en vigtig kvalitetsreducerende faktor
i digital radiografi (5, 36).
Formålet med mange andre processeringsmetoder er derimod at forbedre den rumlige
opløsning ved at forstærke kanter i billedet. EE og EF er eksempler på sådanne metoder.
Kantforstærkning og støjreduktion er således to modsatrettede processeringer (36). Man
kunne formode, at der eksisterer et kompromis-niveau af begge slags parametre.
57
I vores forsøg, havde kraftig kantforstærkning (høje værdier af både EE og EF) en
meget uheldig effekt på billedkvaliteten, særligt hvis støjreduktionen samtidig var lav.
Det så ikke ud til, at der eksisterede et kompromis-optimum mellem kantforstærkning
og støjreduktion.
UM-F og UM-K, som blev anvendt i EN’s forsøg, kan også have en kantforstærkende
effekt. Hvis der anvendes en lille til mellemstor UM-K forstærkes kanter med en faktor,
der bestemmes af UM-F. EN’s resultater viser, at en lille UM-K (især sammen med en
stor UM-F) påvirkede billedkvaliteten negativt. Så også her ser det ud til, at kraftig
kantforstærkning påvirker billedkvaliteten negativt.
Disse konklusioner skal ses i lyset af den måde, hvormed billedkvaliteten er opgjort.
CDRAD-fantomet kan ikke bruges til at evaluere processeringens effekt på synligheden
af diverse anatomiske og patologiske strukturer, fx synligheden af diffuse infiltrater i
lungerne, som forekommer på billeder af mennesker. Sådanne strukturer kan maskeres
ved en kraftig kantforstærkning, der forstærker kartegningen i lungerne (6), eller ved for
kraftig støjreduktion, som både fjerner støj og fine strukturer med vigtig
billedinformation (36).
CDRAD-fantomet tillader ej heller en vurdering af, om et givent parametervalg
forårsager artefaktdannelse på kliniske billeder, eller hvorvidt en given processering
ændrer et billedets ’konventionelle’ udseende.
Flere kilder pointerer risikoen for at introducere artefakter i billederne, hvis der
anvendes ekstreme parameterværdier, som vi har gjort i vores forsøg (6, 26, 27). Andre
studier har vist, at et ’konventionelt’ udseende af billedet er en vigtig faktor for
radiologens opfattelse af dets diagnostiske værdi (6). Begge pointer illustrerer
nødvendigheden af, at supplere forsøg baseret på CDRAD-fantom, med forsøg, der er
klinisk realistiske, som gjort i EN’s artikel.
Resultaterne af EN’s og vores forsøg skal også tages med forbehold, fordi andre ikke
undersøgte parametre kunne tænkes at influere på effekterne af de undersøgte
parametre.
58
EN’s forsøg viser netop, at der er komplekse interaktioner mellem mange parametre,
som kan resultere i modstridende resultater alt afhængigt af, hvordan forskellige
parameterværdier kombineres.
En vigtig erkendelse i arbejdet med at optimere processeringsparametre er, at formålet
med billedet afgør, hvilke strukturer i billedet der er væsentlige, og dermed
hensigtsmæssige at fremhæve (5, 11). Fx har nogle udviklet processeringsalgoritmer
mhp. at optimere visualiseringen af katetre i mediastinum, hvilket har stor anvendelse
på intensivafdelinger (14). I andre tilfælde er formålet med et thoraxbillede at vurdere
patologiske tilstande i lungefelterne, hvilket kræver en helt anden processering (19).
59
8. Konklusion
Som opsamling på den samlede diskussion og til besvarelse af problemformulerings
spørgsmål, kan vi overordnet konkludere, at resultaterne af både Eva Norrmans og vores
eget forsøg tydeligt viser, at billedkvaliteten kan forbedres vha. optimering af de valgte
processeringsparametre indenfor både UNIQUE og MLT(S).
De i opgaven fundne resultater indikerer, at en høj værdi af støjreducerende parametre
kombineret med en lille værdi af kantforstærkende parametre resulterer i den bedste
billedkvalitet indenfor de undersøgte parameterkombinationer.
Denne konklusion skal dog tages med forbehold. Dels fordi det kun er et mindre udvalg
af parametre, der er undersøgt – ikke-undersøgte parametre kunne tænkes at influere på
effekten af de undersøgte parametre og ændre de ovennævnte konklusioner. Dels fordi
den anvendte metode til at måle billedkvalitet ikke kan stå alene, når effekten af
parameterkombinationerne skal evalueres.
60
9. Perspektivering
Vi viser i denne opgave, at der er stort potentiale i at forbedre billedkvaliteten vha.
optimering af de undersøgte processeringsparametre. Dette er givetvis en observation,
der kan generaliseres til også at gælde andre typer software og processeringsmetoder.
Det er åbenlyst, at forbedring af billedkvaliteten vha. processering vil have en stor
betydning for radiografien. Som beskrevet i problemfeltet vil en sådan optimering have
flere positive følgevirkninger - dels i form af billeder med forbedret diagnostisk værdi,
dels ved at give mulighed for at reducere den effektive patientdosis. Begge disse udfald
vil være til stor gavn for patienterne.
Opgaven illustrerer dog også, at en sådan optimeringsproces er vanskelig grundet de
komplekse samspil mellem mange faktorer og parametre, som influerer på
billedkvaliteten. Samtidigt skal det diagnostiske formål holdes for øje, idet forskellige
formål kan stille forskellige krav til et billede.
Kompleksiteten af de faktorer, der påvirker billedkvaliteten, illustrerer nødvendigheden
af at generere meget mere viden på området, som kan udmøntes i praktiske tiltag. Man
kunne fx forestille sig, at det i fremtidens røntgenudstyr ville være hensigtsmæssigt at
inkorporere mange forskellige processeringskombinationer, hver designet til at
fremstille en bestemt patologi bedst muligt. Herved kunne radiografen eller radiologen
få mulighed for at anvende den optimale kombination af parameterindstillinger,
afhængigt af det konkrete formål.
Kompleksiteten i den digitale billeddannelse demonstrerer også nødvendigheden af
bedre uddannelse af radiografer mhp. at varetage udvikling og implementering af
sådanne tiltag.
Det er nødvendigt at forstå den billeddannende proces, for til fulde at kunne forstå og
udnytte det potentiale, som rummes i den digitale radiografi.
61
10. Litteraturliste
1. Krupinski EA, Williams MB, Andriole K,Strauss KJ, Applegate K, Wyattf M et al.
Digital Radiography Image Quality: Image Processing and Display.
Journal of the American College of Radiology. Juni 2007; 4(6): 389-400. I alt 12 sider.
Tilgængelig: http://www.jacr.org/article/S1546-1440(07)00078-6/abstract
2. Båth M, Håkansson M, Hansson J, Månsson LG. A conceptual optimisation strategy
for radiography in a digital environment. Radiation Protection Dosimetry. 2005; 114(1-
3):230-235. I alt 6 sider. Tilgængelig: http://dx.doi.org/10.1093/rpd/nch567
3. Samei E, Dobbins JT, Lo JY, Tornai MP. A framework for optimising the
radiographic technique in digital x-ray imaging. Radiation Protection Dosimetry. 2005;
114(1-3):220–229. I alt 10 sider. Tilgængelig: http://dx.doi.org/10.1093/rpd/nch562
4. Norrman E, Geijer H, Persliden J. Optimization of image process parameters through
factorial experiments using a flat panel detector. Physics in Medicine and Biology. 7.
September 2007; 52(17): 5263-5276. I alt 15 sider. Tilgængelig:
stacks.iop.org/PMB/52/5263
5. Mol A. Image Processing Tools for Dental Applications. Applications of Digital
Imaging Modalities for Dentistry. April 2000; 44(2):299-318. I alt 19 sider.
6. Prokop M, Neitzel U, Schaefer-Prokop C. Principles of Image Processing in Digital
Chest Radiography. Journal of Thoracic Imaging. 2003; (18):148–164. I alt 17 sider.
7. Analoui M. Radiographic image enhancement. Part I spatial domain techniques.
Dentomaxillofacial Radiology. 2001; (30):1-9, I alt 9 sider.
8. Tingberg A, Sjöström D. Optimisation of image plate radiography with respect to
tube voltage. Radiation Protection Dosimetry. 2005; 114(1-3):286–293. I alt 7 sider.
Tilgængelig: http://dx.doi.org/10.1093/rpd/nch536
62
9. Council Directive 97/43/Euroatom of June 30 1997. Side 1-6. I alt 6 sider.
Tilgængelig:
http://ec.europa.eu/energy/nuclear/radioprotection/doc/legislation/9743_en.pdf
10. Bekendtgørelse nr. 975 af 16. december 1998. Bekendtgørelse om medicinske
røntgenanlæg til undersøgelse af patienter. Sundhedsstyrelsen journal nr. 3715-72-1998.
Kapitel 7 § 34. I alt 1 side. Tilgængelig:
https://www.retsinformation.dk/Forms/R0710.aspx?id=21071
11. Moore CS, Liney GP, Beavis AW, Saunderson R. A method to optimize the
processing algorithm of a computed radiography system for chest radiography. The
British Journal of Radiology. 20. August 2007; 80:724–730, I alt 6 sider. Tilgængelig:
http://bjr.birjournals.org/cgi/content/abstract/80/957/724
12. Redlich U, Hoeschen C, Doehring W. Assessment and optimisation of the image
quality of chest-radiography systems. Radiation Protection Dosimetry. 2005; 114(1-
3):264–268. I alt 4 sider. Tilgængelig: http://dx.doi.org/10.1093/rpd/nch559
13. Wiltz HJ, Petersen U, Axelsson B. Reduction of absorbed dose in storage phosphor
urography by significant lowering of tube voltage and adjustment of image display
parameters. Acta Radiologica. Juli 2005; 46(4):391-395. I alt 5 sider. Tilgængelig:
http://dx.doi.org/10.1080/02841850510021184
14. Nodine CF, Liu H, Miller WT, L. Kundel HL. Observer Performance in the
Localization of Tubes and Catheters on Digital Chest Images: The Role of Expertise
and Image Enhancement. Acad Radiol. 1996; 3:834-841. I alt 7 sider.
15. Yamada S, Murase K. Effectiveness of flexible noise control image processing for
digital portal images using computed radiography. The British Journal of Radiology.
2008; 78:519–527. I alt 8 sider. Tilgængelig: http://dx.doi.org/10.1259/bjr/26039330
63
16. Geijer H. Radiation dose and image quality in diagnostic radiology. Optimization of
the dose-image quality relationship with clinical experience from scoliosis radiography,
coronary intervention and a flatpanel digital detector. Acta Radiol. 2002; 43:9–43. I alt
35 sider.
17. Bushberg JT, Seibert JA, Leidholdt JR. EM, Boon JM. The Essential Physics of
Medical Imaging, Second Edition. Lippincott Williams & Wilkins, Philadelphia. 2002,
Kapitel 10, side 255-291 og side 312 I alt 37 sider.
18. Norrman E, Gårdestig M, Persliden J, Geijer H. A Clinical Evaluation of the Image
Quality Computer Program CoCIQ. Journal of Digital Imaging. Juni 2005; 18(2): 138-
144. I alt 6 sider. Tilgængelig: http://dx.doi.org/10.1007/s10278-004-1036-0
19. Williams MB, Krupinski EA, Strauss JK, Breeden WK, Rzeszotarski MS,
Applegate K, et al. Digital Radiography Image Quality: Image Acquisition. Journal of
the American College of Radiology. Juni 2007; 4(6):371-388. I alt 18 sider.
20. Normann E. Optimisation of radiographic imaging by means of factorial
experiments [ph.d]. Örebro Universitet, Studies in Physics 3, Universitetsbiblioteket
2007. Side 21-29. I alt 9 sider.
21. Philips. Brugsanvisning UNIQUE Billedbehandlingssoftware Udgave 1.0 Dansk.
Philips Medical Systems 2006. Side 1-44. I alt 44 sider.
22. Philips. Hurtig vejledning PCR Eleva, Philips Medical Systems 2007. Side 1-12.
I alt 12 sider.
23. Philips. PCR Eleva. Philips Medical Systems 2007. Side, 128,129,180. Ialt 3 sider.
24. Canon - CXDI-1 System Digital Radiography OPERATION MANUAL, Canon
2008. Side 71-75 I alt 5 sider.
64
25. Canon - CXDI-50G detektor specifikationer, Canon 2006. side 1-2. 2 sider i alt.
26. Canon - CXDI Image Processing Software MLT(S) - USER'S MANUAL, Canon
2008. Side 1-28. I alt 28 sider.
27. Canon - Multiobjective Frequency Processing Function Manual, Canon 2008.
Side 1-28. 28 sider i alt.
28. Montgomery DC. Design and Analysis of Experiments. 5th Edition.
Hoboken. New Jersey. John Wiley & Sons. 2001. Kapitel 5,6. Side 170-286 og side
304-305 I alt 119 sider.
29. Fowler J, Cohen L, Phil J. Practical Statistics for Field Biology. Second Edition.
Chichester. John Wiley & Sons. 1998. side 184 – 186 og side 243-247. (Appendix 9 og
10) I alt 8 sider.
30. Johansen K. Basal Sundheds-videnskabelig statestik – begreber og metode. 1.
udgave 2. oplag. København. Munksgaard Danmark. 2006. Side 111-115. I alt 5 sider.
31. Artinis - MANUAL CONTRAST-DETAIL PHANTOM CDRAD 2.0 & CDRAD
Analyser software Version 1.1. Artinis Medical Systems. The Netherlands.
http://www.artinis.com/ Side 1-28. I alt 28 sider.
32. Norrman E, Persliden J. A factorial experiment on image quality and radioation
dose. Radiation Protection Dosimetry. 2005; 114(1-3);246–252. I alt 6 sider.
Tilgængelig: http://dx.doi.org/10.1093/rpd/nch557
33. EUROPEAN COMMISSION. EUR 16260 EN. European Guidelines on Quality
Criteria for Diagnostic Radiographic Images. Side 1-88. 88 sider i alt. Tilgængelig:
ftp://ftp.cordis.lu/pub/fp5-euratom/docs/eur16260.pdf
65
34. Båth M, Månsson LG. Visual grading characteristics (VGC) analysis: a non-
parametric rank-invariant statistical method for image quality evaluation. The British
Journal of Radiology. 2007; 80: 169–176. I alt 7 sider. Tilgængelig:
http://dx.doi.org/10.1259/bjr/35012658.
35. NIST/SEMATECH e-Handbook of Statistical Methods. 5.3.3.3.1. Two-level full
factorial designs. FIGURE 3.1. [online]. [citeret 3. januar 2008]. Tilgængelig:
http://www.itl.nist.gov/div898/handbook/pri/section3/pri3331.htm
36. Flynn MJ. Image presentation: Implications of Processing and Display, A NIOSH
Scientific Workshop. March 12-13, 2008, Washington DC, USA. Side 1-34.
I alt 34 sider.
37. Lo WY, Puchalski SM. Digital Image Processing.Veterinary Radiology &
Ultrasound. 2008; 1(1):42-47. I alt 6 sider.
38. Prokop M, Schaefer-Prokop CM. Digital image processing. European Radiology
1997; 7(3):73-82. I alt 9 sider.
39. Davidson RA, Radiographic Contrast-Enhancement Masks in Digital Radiography
[Doctor of Philosophy]. New South Wales, School of Medical Radiation Sciences,
Faculty of Health Services, The University of Sydney 2006, Australia. Side 72-80 og
side 91-100. I alt 17 sider.
40. Vuylsteke P, Schoeters E. Multiscale Image Contrast Amplification (MUSICA),
SPIE Image Processing. 1994; 2167:551-560. I alt 9 sider.
41. Vuylsteke P, Schoeters E. Image Processing in Computed Radiography. DGZfP
Proceedings BB 67-CD. 1999; 16:87-101. I alt 14 sider.
42. Stahl M, Aach T, Dippel S. Digital radiography enhancement by nonlinear
multiscale processing. Med. Phys. Januar 2000; 27(1):56-65. I alt 10 sider.
66
43. Fujisaki T, Kimura M, Saitoh H, Abe S, Hiraoka T, Production design and
evaluation of a novel breast phantom with various breast glandular fractions. Radiat
Med 2006; 24(10):647–652 I alt 6 sider. Tilgængelig:
http://dx.doi.org/10.1007/s11604-006-0083-5
Total antal sider 725 sider.
67
11. Bilag
11.1 Bilagsoversigt
Bilag 1: Detaljeret oversigt over materialer og udstyr
Bilag 2: F-max test – undersøgelse for varianshomogenitet
Bilag 3: Ensidig variansanalyse/one-way ANOVA
Bilag 4: Tukey test
Bilag 5: Søjlediagram ’Invers IQF i aftagende rækkefølge’
Bilag 1
68
Detaljeret liste over materialer og udstyr.
Fantom:
CDRAD-fantom 2.0 (serie nr. 03023):
Producent: Artinis Medical Systems BV, St. Walburg 4, 6671 AS Zetten, The
Netherlands. Venligst udlånt af Herlev Hospital.
CDRAD Analyser software version 1.1 inkl. tilhørende manual :
Producent: Artinis Medical Systems BV, St. Walburg 4, 6671 AS Zetten, The
Netherlands. Lånt af og udført på CVU Lillebælt.
Alt nedenstående udstyr, samt røntgenrum er venligst udlånt af Rigshospitalet:
To kvadratiske plader plexiglas (polymethylmetaacrylat – PMMA) 30x30x6 cm.
Røntgenrør:
Varian Medical Systems, Salt Lake City, USA, Rør type A196,
Total filtrering 2,1 mm Al.
Udtagbar Santax DX røntgen detektor af typen flatpanel detektor med scintillator (GOS
– Gd2O2S:Tb) og amorf silicium (a-Si): CXDI-50G.
35*45 cm, 2208*2688 (5,9 mill.) pixels, 160*160 microns pixelpitch, 12 bit
gråtoneskala. Producent: Santax Medico, Dalgas Avenue 40, 8000 Århus C, Danmark
(Canon).
Monitor på arbejdsstation:
Totoku, ME201L, monochrome LCD-monitor.
Producent: TOTOKU ELECTRIC CO., LTD., Head Office 1-3-21 Okubo, Shinjuku-ku,
Tokyo 169-8543 Japan.
Bilag 1
69
Software:
Canon-software MLT(s) version 6.60.02.
Anvendte post-processerings-værktøjer er ’Edge Enhancement Effect’, ’Edge
Enhancement Frequency’ og ’Noise Reduction’.
Producent: Canon U.S.A., Inc., One Canon Plaza, Lake Success, NY 11042, USA.
PACS:
Agfa Impax 5.2.
Statistik udregning:
Statistiske udregninger udført i Microsoft Excel 2003 på PC med Windows XP
Professional Service Pack 3.
Tukey værdier udregnet i MathLab 7.1.0..246 service pack 3 med downloadet qTukey
function
Bilag 2
70
F-max test – undersøgelse for varianshomogenitet.
Summen af: kvardraterne af (replikaterne minus samlet gennemsnit): ∑(X- Xgennemsnit)2
(1,27 – 1,524)2 + (1,27 – 1,524)2 + (1,39 – 1,524)2 osv.
Varians = ∑(X- Xgennemsnit)2/n-1 =SD2
Summen af: (kvardraterne af (replikaterne minus samlet gennemsnit) / (n-1)):
(n=3)
(1,27 – 1,524)2 / 2 + (1,27 – 1,524)2 / 2 + (1,27 – 1,390)2 / 2 osv.
SD2(max) =0,186233
SD2(min) = 0,000233
F-max= SD2(max)/SD2(min) = 798,14
F-max tabel (29) s 243 appendix 9.
a = 27, fg = 2
Tabellen viser kun til a = 12. Tabelværdien for a= 12, fg =2 er 704.
Det har ikke været været muligt at finde tabeller der går højere op i antal samples.
Tallet stiger kraftigt med flere grupper, derfor antager vi at:
F-max beregnet < F-max tabel, dvs. der er varianshomogenitet for a = 0,05.
Bilag 3
71
Ensidig varians analyse/one-way ANOVA
Forudsætninger for ensidig varianstest: prøverne er varianshomogene, uafhængige og
normalfordelte. Opfyldelse af forudsætninger: normalfordeling antages. Prøverne er
indbyrdes uafhængige og varians homogenitet bekræftet ved F-max test.
Hypoteser:
H0 = alle 27 grupper har ens IQF
H1 = der er statistisk signifikant forsk på største og mindste IQF
Udregning af SAKT
Summen af kvardratet af total gennemsnit - replikat:
∑(Xtotal gennemsnit – X1)2
(1,542-1,270)2 + (1,542-1,270) 2 + (1,542-1,390) 2 osv.
SAKT = 10,617
Udregning af SAKM
Summen af kvartraterne af forskellen imellem total gennemsnit
og gruppens gennemsnit:
∑(Xtotal gennemsnit – Xgruppe gennemsnit)2
(1,542-1,310) 2 + (1,542-1,630) 2 + (1,542-2,030) 2 osv.
SAKM = 150,878
Udregning af rest afvigelse:
Summen af replikater - total gennemsnit - (gruppe gennemsnit - total gennemsnit)
∑(X1 - Xtotal gennemsnit – (Xgruppe gennemsnit - Xtotal gennemsnit))
1,270 -1,524 – (1,310-1,524) + 1,270 -1,524 – (1,310-1,524) + 1,390 -1,524 – (1,310-
1,524) osv.
Bilag 3
72
Udregning af SAKI
Summen af kvadraternes af restafvigelsen:
∑(Xrestafvigelse)2
SAKI = 0,964
Varians analyse:
Variansanalyseskema SAK fg Varians (SD2)
Inden for grupper SAKI 0,964 54 0,018
Imellem grupper SAKM 150,878 26 5,803
F= SD2M / SD2
I = 325,064 (Ftest)
F tabel 2,3273-2,4170 (a = 0,01)
Fra F tabel (29) s 244-247 appendix 10.
Ftest > F tabel, dvs. H0 forkastes.
Dvs. der er statistisk signifikant forskel mellem højeste og laveste IQF.
Bilag 4
73
Tukey Test.
Vi har nu med ensidig varians analyse fastslået at der er signifikant forskel på højeste og
laveste inv IQF værdi. Med en Tukey test vil vi nu undersøge om der er signifikant
forskel på andre inv IQF værdier.
Tukey-test
Med denne test kan alle inv IQF-værdier sammenlignes parvist med alle andre inv IQF-
værdier, mhp. at identificere de parvise inv IQF-værdier, der afviger signifikant fra
hinanden. Denne analyse forudsætter, at der er en signifikant forskel mellem de to mest
ekstreme inv. IQF-værdier og at antallet af replikater er ens for alle kombinationerne
(29). Begge forudsætninger er opfyldte.
Testen gennemføres på følgende måde: Alle parvise differencer mellem inv IQF-
værdierne for de 27 parameterkombinationer beregnes (vist i tabellen på de to næste
sider). Desuden beregnes test-værdien T, som repræsenterer grænseværdien mellem de
inv IQF-værdier, der er signifikant forskellige fra hinanden, og de, der ikke er. Dette
sker ved, at identificere alle de differencer, der er numerisk større end T-værdien – disse
er signifikant forskellige fra hinanden.
T beregnes således:
T = q x (√(SD2(I)/n))
q = 6.3362 q er en tabelværdi udregnet i MathLab for for signifikans niveau a=0,01
n = 3
T= 0,489
Hver værdi fra tabellen på de følgende 2 sider, der er nummerisk større end T-værdien,
repræsenterer 2 parameterkombinationer, som afviger signifikant fra hinanden. Disse
resultater er opsumeret i tabel 7 i afsnittet 7.2.4 Statistisk analyse af data.
Bilag 4
74
-0,3200 -0,7200 0,0100 -0,1433 -0,8566 0,0267 -0,2933 -0,6366 0,0334 -0,3700 -0,7833 0,0500 -0,3166 -0,6366 0,1534
-0,4000 0,3300 0,1767 -0,5366 0,3467 0,0267 -0,3166 0,3534 -0,0500 -0,4633 0,3700 0,0034 -0,3166 0,4734
0,7300 0,5767 -0,1366 0,7467 0,4267 0,0834 0,7534 0,3500 -0,0633 0,7700 0,4034 0,0834 0,8734
-0,1533 -0,8666 0,0167 -0,3033 -0,6466 0,0234 -0,3800 -0,7933 0,0400 -0,3266 -0,6466 0,1434
-0,7133 0,1700 -0,1500 -0,4933 0,1767 -0,2267 -0,6400 0,1933 -0,1733 -0,4933 0,2967
0,8833 0,5633 0,2200 0,8900 0,4866 0,0733 0,9066 0,5400 0,2200 1,0100
-0,3200 -0,6633 0,0067 -0,3967 -0,8100 0,0233 -0,3433 -0,6633 0,1267
-0,3433 0,3267 -0,0767 -0,4900 0,3433 -0,0233 -0,3433 0,4467
0,6700 0,2666 -0,1467 0,6866 0,3200 0,0000 0,7900
-0,4034 -0,8167 0,0166 -0,3500 -0,6700 0,1200
-0,4133 0,4200 0,0534 -0,2666 0,5234
0,8333 0,4667 0,1467 0,9367
-0,3666 -0,6866 0,1034
-0,3200 0,4700
0,7900
Bilag 4
75
-0,1200 -0,4433 -0,0100 -0,3866 -0,6833 0,1534 -0,0166 -0,2866 0,5434 0,2634 0,0234 0,2000 -0,1233 0,3100 -0,0666 -0,3633 0,4734 0,3034 0,0334 0,8634 0,5834 0,3434
0,6000 0,2767 0,7100 0,3334 0,0367 0,8734 0,7034 0,4334 1,2634 0,9834 0,7434 -0,1300 -0,4533 -0,0200 -0,3966 -0,6933 0,1434 -0,0266 -0,2966 0,5334 0,2534 0,0134 0,0233 -0,3000 0,1333 -0,2433 -0,5400 0,2967 0,1267 -0,1433 0,6867 0,4067 0,1667 0,7366 0,4133 0,8466 0,4700 0,1733 1,0100 0,8400 0,5700 1,4000 1,1200 0,8800 -0,1467 -0,4700 -0,0367 -0,4133 -0,7100 0,1267 -0,0433 -0,3133 0,5167 0,2367 -0,0033
0,1733 -0,1500 0,2833 -0,0933 -0,3900 0,4467 0,2767 0,0067 0,8367 0,5567 0,3167 0,5166 0,1933 0,6266 0,2500 -0,0467 0,7900 0,6200 0,3500 1,1800 0,9000 0,6600 -0,1534 -0,4767 -0,0434 -0,4200 -0,7167 0,1200 -0,0500 -0,3200 0,5100 0,2300 -0,0100 0,2500 -0,0733 0,3600 -0,0166 -0,3133 0,5234 0,3534 0,0834 0,9134 0,6334 0,3934 0,6633 0,3400 0,7733 0,3967 0,1000 0,9367 0,7667 0,4967 1,3267 1,0467 0,8067 -0,1700 -0,4933 -0,0600 -0,4366 -0,7333 0,1034 -0,0666 -0,3366 0,4934 0,2134 -0,0266 0,1966 -0,1267 0,3066 -0,0700 -0,3667 0,4700 0,3000 0,0300 0,8600 0,5800 0,3400 0,5166 0,1933 0,6266 0,2500 -0,0467 0,7900 0,6200 0,3500 1,1800 0,9000 0,6600 -0,2734 -0,5967 -0,1634 -0,5400 -0,8367 0,0000 -0,1700 -0,4400 0,3900 0,1100 -0,1300 -0,3233 0,1100 -0,2666 -0,5633 0,2734 0,1034 -0,1666 0,6634 0,3834 0,1434 0,4333 0,0567 -0,2400 0,5967 0,4267 0,1567 0,9867 0,7067 0,4667 -0,3766 -0,6733 0,1634 -0,0066 -0,2766 0,5534 0,2734 0,0334 -0,2967 0,5400 0,3700 0,1000 0,9300 0,6500 0,4100 0,8367 0,6667 0,3967 1,2267 0,9467 0,7067 -0,1700 -0,4400 0,3900 0,1100 -0,1300 -0,2700 0,5600 0,2800 0,0400 0,8300 0,5500 0,3100 -0,2800 -0,5200 -0,2400
Bilag 5
76
Inv. IQF i aftagende rækkefølge
0
0,5
1
1,5
2
2,5
EE-L, E
F-M, N
R-H 6
.
EE-M, E
F-L, N
R-H 1
2.
EE-L, E
F-L, N
R-H 3
.
EE-H, E
F-L, N
R-H 2
1.
EE-L, E
F-H, N
R-H 9
.
EE-M, E
F-M
, NR-H
15.
EE-M, E
F-H, N
R-H 18
.
EE-H, E
F-L, N
R-M 2
0.
EE-M, E
F-L, N
R-M 1
1.
EE-L, E
F-L, N
R-M 2
.
EE-M, E
F-M
, NR-M
14.
EE-H, E
F-M
, NR-H
24.
EE-L, E
F-H, N
R-M 8
.
EE-L, E
F-M, N
R-M 5
.
EE-M, E
F-H, N
R-M 1
7.
EE-H, E
F-M
, NR-M
23.
EE-H, E
F-L, N
R-L 19
.
EE-L, E
F-L, N
R-L 1
.
EE-L, E
F-M, N
R-L 4
.
EE-H, E
F-H
, NR-H
27.
EE-L, E
F-H, N
R-L 7
.
EE-M, E
F-L, N
R-L 1
0.
EE-M, E
F-M
, NR-L
13.
EE-H, E
F-M
, NR-L
22.
EE-M, E
F-H, N
R-L 1
6.
EE-H, E
F-H
, NR-M
26.
EE-H, E
F-H
, NR-L
25.
Parameter kombination
Inv.
IQF
Plateau I
Plateau II
Plateau III
Plateau IV
Plateau V
Bilag 5
77
Søjlediagrammet viser inv. IQF i aftagende rækkefølge. Man kan fornemme, at inv IQF-
værdierne grupperer sig på nogle trinvise ’plateauer’, som vi har angivet med nummrene I-
V. Vi vil kort skitsere egenskaberne ved de parameterkombinationer, som hvert plateau
består af.
Plateau I udgøres af de største inv IQF-værdier. Fælles for disse kombinationer er, at de
indeholder: NR-H + EE-L/M/H + EF-L/M/H (men højeste samtidige værdier er EE-M +
EF-M, hvis den ene er H, er den anden L).
Plateau II udgøres af de næststørste inv IQF-værdier. De indeholder flere slags
kombinationer: NR-H + EE-M/H + EF-M/H (men ikke samtidig EE-H + EF-H), eller
NR-M + EE-L/M/H + EF- L/M/H (men ikke samtidig EE-H + EF-H eller EE-H + EF-M).
Plateau III, som udgøres af en bred midtergruppe, indeholder:
NR-H + EE-H + EF-H, eller NR-M + EE-L/M/H + EF-M/H (men ikke samtidig EE-H +
EF-H), eller NR-L + EE-L/M/H + EF-L/M/H (men ikke samtidig EE-H + EF-H).
Plateau IV, en lille gruppe, indeholder:
NR-M + EE-H + EF-H, eller NR-L + EE-M/H + EF-M/H (hvoraf én er M og den anden H
og vice versa).
Plateau V udgøres af nr. 25 og dens lave inv IQF skiller sig markant ud fra alle de øvrige:
NR-L + EE-H + EF-H
En sammenfatning af dette mønster indikerer, at de højeste inv IQF-værdier fås med NR–H
kombineret med varierende, men ingen samtidige høje, værdier af EE og EF.
Bilag 5
78
Mellemværdier af inv IQF (plateau II og III) fås når NR-H kombineres med samtidige
mellem/høje niveauer af EE og EF eller når NR-L/M kombineres med samtidige
lave/mellem niveauer af EE og EF. De laveste inv IQF-værdier (plateau IV og V) fås når
NR-L/M kombineres med samtidige høje eller mellem/høje værdier af EE og EF.
Dette tyder dels på, at høj NR har en positiv effekt på inv IQF, mens samtidig høj EE og EF
har en negativ effekt på inv IQF. Det tyder også på, at blot den ene af de to parametre EE
eller EF er lav, så har en høj værdi af den anden ikke en negativ effekt. Til sidst ser det ud
til, at jo lavere NR, jo mindre værdi af EE og EF er nødvendig for at fremkalde den
negative effekt på inv IQF.
Denne tolkning er essentielt set den samme som vi nåede frem til vha. figur 8, blot
illustreret på en lidt anden måde.
På figuren observerede vi en gruppering i trinvise ’plateauer’ blandt forskellige
kombinationer. Tukey-testen viser, at der ikke er signifikante forskelle mellem
kombinationerne indenfor de enkelte plateauer, men viser heller ikke signifikante forskelle
mellem tilstødende kombinationer, der skiller to plateauer. Sådanne signifikante forskelle
ses kun når der er længere ’afstand’ mellem kombinationerne (fx mellem en værdi i plateau
II versus IV).