104
TÜRKİYE CUMHURİYETİ ANKARA ÜNİVERSİTESİ SAĞLIK BİLİMLERİ ENSTİTÜSÜ KLİNİK ARAŞTIRMALARDA SÜREKLİ SONUÇLU ÖLÇÜM TEKNİKLERİNİN UYUMUNUN İNCELENMESİNDE KULLANILAN İSTATİSTİKSEL YÖNTEMLER Gamze AKKOCA BİYOİSTATİSTİK ANABİLİM DALI YÜKSEK LİSANS TEZİ DANIŞMAN Doç. Dr. Yasemin GENÇ 2012 ANKARA

KLİNİK ARAŞTIRMALARDA SÜREKLİ SONUÇLU ÖLÇÜM …acikarsiv.ankara.edu.tr/browse/28499/tez.pdf · Gerçek Değerin Değişmediği Durumlarda Her Bir ... klinisyenlerin, konu

  • Upload
    others

  • View
    7

  • Download
    0

Embed Size (px)

Citation preview

1

TÜRKİYE CUMHURİYETİ

ANKARA ÜNİVERSİTESİ

SAĞLIK BİLİMLERİ ENSTİTÜSÜ

KLİNİK ARAŞTIRMALARDA SÜREKLİ

SONUÇLU ÖLÇÜM TEKNİKLERİNİN

UYUMUNUN İNCELENMESİNDE

KULLANILAN İSTATİSTİKSEL

YÖNTEMLER

Gamze AKKOCA

BİYOİSTATİSTİK ANABİLİM DALI

YÜKSEK LİSANS TEZİ

DANIŞMAN

Doç. Dr. Yasemin GENÇ

2012 – ANKARA

ii

Ankara Üniversitesi Sağlık Bilimleri Enstitüsü

Biyoistatistik Anabilim Dalı Yüksek Lisans Programı

çerçevesinde yürütülmüş olan bu çalışma, aşağıdaki jüri tarafından

Yüksek Lisans Tezi olarak kabul edilmiştir.

Tez Savunma Tarihi: 08 / 05 / 2012

Doç. Dr. Yasemin GENÇ

Ankara Üniversitesi

Jüri Başkanı

Prof. Dr. Atilla Halil ELHAN Doç. Dr. Pınar ÖZDEMİR

Ankara Üniversitesi Hacettepe Üniversitesi

Yrd. Doç. Dr. S. Kenan KÖSE Yrd. Doç. Dr. Derya ÖZTUNA

Ankara Üniversitesi Ankara Üniversitesi

iii

İÇİNDEKİLER

Kabul ve Onay ii

İçindekiler iii

Önsöz v

Simgeler ve Kısaltmalar vi

Şekiller vii

Çizelgeler viii

1. GİRİŞ 1

1.1. Genel Kavramlar 3

1.1.1. Doğruluk ve Kesinlik (Accuracy and Precision) 3

1.1.2. Ölçüm Hatası (Measurement Error) 6

1.1.3. Güvenilirlik (Reliability) 9

1.1.4. Geçerlilik (Validity) 11

1.2. Metot Karşılaştırma Çalışmalarında Uyumun Değerlendirilmesi 12

1.2.1. Uyumu Değerlendirmede Kullanılan İstatistiksel Yaklaşımlar 15

1.2.1.1. Tanımlayıcı Yöntemler 16

1.2.1.1.1. Saçılım Grafiği (Scatter Plot) 16

1.2.1.1.2. Bland – Altman Uyum Sınırları Grafiği (Difference Plot) 17

1.2.1.2. Ölçeklendirilemeyen Uyum İndisleri (Unscaled Summary

Indices)

19

1.2.1.2.1.Bland-Altman Yöntemi ile Uyum Sınırları (Limits of

Agreement with Bland-Altman Approach)

19

1.2.1.2.1.2. Karşılaşılabilecek Problemler ve Çözüm Yolları 25

1.2.1.2.1.2.1. Logaritmik Dönüşüm 25

1.2.1.2.1.2.2. Regresyon Yaklaşımı 27

1.2.1.2.2. Tekrarlanabilirlik (Repeatability) 30

1.2.1.2.2.1. Tekrarlı Ölçümler Kullanıldığında Uyumun Hesaplanması 32

1.2.1.2.2.1.1. Gerçek Değerin Değişmediği Durumlarda Her Bir

Denek Üzerinden Eşit Sayıda Tekrarlı Ölçüm Elde Edilmesi Durumu

33

1.2.1.2.2.1.2. Gerçek Değerin Değişmediği Durumlarda Her Bir

Denek Üzerinden Eşit Sayıda Olmayan Tekrarlı Ölçüm Elde Edilmesi

39

1.2.1.2.2.1.3. Gerçek Değerin Değiştiği Durumlarda Tekrarlı

Ölçümler

ile Oluşturulan Eşleştirilmiş Çiftler

40

1.2.1.2.3. Tekrar Elde Edilebilirlik (Reproducibility) 42

1.2.1.3. Ölçeklendirilebilen Uyum İndisleri (Scaled summary indices) 43

1.2.1.3.1. Sınıf İçi Korelasyon Katsayısı (Intraclass Correlation

Coefficient)

43

1.2.1.3.1.1. Çalışmanın Tasarımına Göre SKK Tahminleri 45

1.2.1.3.1.1.1. İki Yönlü Karma Etki Modeli 46

1.2.1.3.1.2. Çalışmanın Amacına Göre SKK Tahminleri 48

1.2.1.3.1.3. Kullanılan Ölçümlerin Elde Edilme Biçimine Göre SKK

Tahminleri

49

1.2.1.3.2. Concordance Korelasyon Katsayısı (Concordance

Correlation Coefficient)

52

1.2.1.3. Regresyon Yöntemleri 57

iv

1.2.1.3.1. Deming Regresyon Yöntemi 57

1.2.1.3.2. Passing - Bablok Yöntemi 62

2. GEREÇ VE YÖNTEM 65 2.1. Uygulama Verisi 65

2.2. Veri analizinde Kullanılan Programlar 67

3. BULGULAR 70

4. TARTIŞMA 87

5. SONUÇ VE ÖNERİLER 90

ÖZET 91

SUMMARY 92

KAYNAKLAR 93

ÖZGEÇMİŞ 96

v

ÖNSÖZ

Klinik araştırmalarda, metot karşılaştırma çalışmaları oldukça önemlidir. Tıpta,

zaman içersinde teknolojik gelişmelere paralel olarak daha çabuk yanıt veren, daha

ekonomik yeni bir metot önerilebilir. Geliştirailen yeni metodun ölçümlerinin,

referans (eski) metodun ölçümleri ile uyumu metot karşılaştırma yöntemleri

yardımıyla incelenir ve önerilen yeni metodun kullanılabilir olup olmadığına karar

verilir.

Yüksek Lisans tez konusunu seçerken ve tez süresince önemli katkıları olan, her

türlü yardım ve desteği sağlayan danışman hocam Doç. Dr. Yasemin GENÇ’e

teşekkür ederim.

Ayrıca tezin hazırlanma aşamasında yardımlarını ve desteğini hiç esirgemeyen

annem, babam, nişanlım Güvenç GÜRBÜZ, kardeşlerim Umut Can ve Onur

AKKOCA’ya teşekkür ederim.

vi

SİMGELER VE KISALTMALAR

BSI British Standards Institute

CKK Concordance Korelasyon Katsayısı

EKK En Küçük Kareler

FDA Food and Drug Administration

ISO International Organization for Standardization

SKK Sınıf-İçi Korelasyon Katsayısı

vii

ŞEKİLLER

Şekil 1.1. “ Doğruluk ” ve “ Kesinlik” kavramlarının görsel ifadesi 5

Şekil 1.2. Hata türlerinin şematik gösterimi 7

Şekil 1.3. Sabit Hata 7

Şekil 1.4. Orantısal Hata 7

Şekil 1.5. Rastgele Hata 8

Şekil 1.6. Hata türleri 8

Şekil 1.7. Eşitlik Doğrusu ile Saçılım Grafiği 13

Şekil 1.8. Saçılım grafiği ve Bland-Altman grafiğinin karşılaştırılması 19

Şekil 1.9. İki farklı metotla elde edilen kan basıncı değerleri 27

Şekil 1.10. Deming Regresyon ve EKK regresyon yöntemlerinde hata

değerlerinin minimize edilmesi

60

Şekil 2.1. Kifotik deformasyonu ölçmek için kullanılan metotlar 67

Şekil 2.2. MedCalc programının ana menüsü 68

Şekil 2.3. MedCalc programında metot karşılaştırma menüsü 69

Şekil 3.1. TL değerlerinin Post-op ve Bending metodu ile elde edilen

ölçümlerinin farklarına karşı ortalamalarının grafiği

72

Şekil 3.2. TL değerlerinin Post-op ve Truga metodu ile elde edilen

ölçümlerinin farklarına karşı ortalamalarının grafiği

74

Şekil 3.3. PT değerleri için Deming regresyon grafiği 78

Şekil 3.4. MT değerleri için Deming regresyon grafiği 80

Şekil 3.5. . MT değerleri için Passing-Bablok regresyon grafiği 81

Şekil 3.6. Kifoz deformasyonu ölçmede Metot 1 ve Metot 2 Karşılaştırması 84

Şekil 3.7. Kifoz deformasyonu ölçmede Metot 1 ve Metot 3 Karşılaştırması 84

Şekil 3.8. Kifoz deformasyonu ölçmede Metot 1 ve Metot 4 Karşılaştırması 85

viii

ÇİZELGELER

Çizelge 1.1. Sınıf içi korelasyon katsayısının hesaplanmasında kullanılan veri

seti için uygun notasyonel veri seti

44

Çizelge 1.2. Varyans analizi modelleri için varyans bileşenleri 46

Çizelge 1.3. SKK’nın kabul edilebilir seviyeleri 48

Çizelge 1.4. Çalışmanın tasarımına, amacına ve ölçümlerin elde edilme

biçimlerine göre hesaplanabilecek farklı SKK türleri

51

Çizelge 1.5. CKK’nın kabul edilebilir seviyeleri 56

Çizelge 2.1. Kifotik deformasyonu ölçmede kullanılan metotların tanımları 67

Çizelge 3.1. Veri setindeki değişkenlerin tanımlayıcı istatistikleri 70

Çizelge 3.2. Bland-Altman yönteminin uygulanabilmesi için Bending TL ve

Post-op TL ölçümlerine ilişkin varsayımların testi

71

Çizelge 3.3. Bland-Altman yöntemi uygulanan Bending TL ve Post-op TL

ölçümlerine ilişkin sonuçlar

72

Çizelge 3.4. Bland-Altman yönteminin uygulanabilmesi için Truga TL ve

Post-op TL ölçümlerine ilişkin varsayımların testi

73

Çizelge 3.5. Bland-Altman yöntemi uygulanan Truga TL ve Post-op TL

ölçümlerine ilişkin sonuçlar

74

Çizelge 3.6. Bending metodu ile elde edilen MT değerleri ile Post-op MT

değerleri arasındaki SKK tahmini

75

Çizelge 3.7. Truga metodu ile elde edilen MT değerleri ile Post-op MT

değerleri arasındaki SKK tahmini

76

Çizelge 3.8. Bending metodu ile elde edilen MT değerleri ile Post-op MT

değerleri arasındaki CKK tahmini

76

Çizelge 3.9. Truga metodu ile elde edilen MT değerleri ile Post-op MT

değerleri arasındaki CKK tahmini

77

Çizelge 3.10. PT değerleri için Deming regresyon analizi sonuçları 78

Çizelge 3.11. MT değerleri için Deming regresyon sonuçları 79

Çizelge 3.12. MT değerleri için Passing-Bablok regresyon analizi sonuçları 80

Çizelge 3.13. Veri setindeki değişkenlerin tanımlayıcı istatistikleri 82

Çizelge 3.14. Kifoz deformasyonu ölçmede kullanılan metotların Bland-

Altman yöntemi ile uyumunun değerlendirilmesi

85

Çizelge 3.15. Kifoz deformasyonu ölçmede kullanılan metotların SKK ile

uyumunun değerlendirilmesi

86

1

1. GİRİŞ

Teknolojik gelişmelere paralel olarak her geçen gün eskisinden daha iyi olduğu

düşünülen yeni metotlar önerilmektedir. Örneğin kan basıncı, kalp atışı oranı,

kolesterol düzeyi gibi klinik ölçümleri elde etmek için kullanılan referans (eski)

metotların yerini teknolojik ilerlemelerle birlikte yeni metotlar alabilir. Ancak

klinisyenlerin, konu ya da denek üzerindeki diğer etkiler olmadan ölçülen değerin

gerçek değerini (true value) tespit etmesi neredeyse imkansızdır. Tüm ölçümlerin

belirli bir hata içermesinin kaçınılmaz olduğu unutulmamalıdır. Güvenilir ve doğru

ölçüm basitçe, yeni ölçümün gerçek değer ile aynı olması veya gerçek değer ile

uyumlu olması olarak tanımlanabilir. Fakat yeni ölçümün, gerçek değer ile tam

olarak aynı olması pratikte pek mümkün değildir. Yeni ölçüm tolere edilebilecek bir

hata miktarı ile kabul edilebilir. Bu nedenle, yeni metot gerçek değerler yerine

referans metot ile kıyaslanarak değerlendirilir. Klinisyenler, bir parametreyi

ölçmeye yarayan ve eskisine göre daha ucuz ve çabuk yanıt veren yeni bir metot

bulunduğunda, bu metodu yaygın olarak kullanılan referans metot ile karşılaştırarak

metotların ne derece uyumlu sonuç verdiğini bulmak isterler. Burada uyum ile

kastedilen iki yöntemden elde edilen ölçüm değerlerinin eşit olmasıdır. Aynı

parametreyi ölçmek için kullanılan farklı metotlara ait ölçümler arasında genellikle

tam bir uyumun olması mümkün değildir. Ancak yeni metodun referans (eski)

metottan ne kadar farklı olduğunu bulmak mümkündür. Bu fark, klinik

yorumlamada problem yaratacak düzeyde değilse, yeni yöntem eski yöntem yerine

kullanılabilir ya da değişimli olarak her ikisi de kullanılabilir (Bland ve Altman,

1999).

Yeni bir ölçüm metodu ile referans olarak kullanılan ölçüm metodunun uyum

düzeyi çeşitli istatistiksel yöntemler kullanılarak incelenir. Daha önceki yıllarda

yapılan metot karşılaştırma çalışmalarında, uyumun ölçümünde genellikle klasik

istatistik yöntemlerinin kullanıldığı görülmektedir. Ancak bilinen bu klasik

2

yöntemlerin uyumu ölçmede yanlış sonuçlar verdiği gözlenmiş ve bu yöntemlere

alternatif yöntemler önerilmiştir.

Pearson korelasyon katsayısı, regresyon analizi, bağımlı gruplarda t testi gibi klasik

istatistiksel yöntemlere karşılık, Sınıf-İçi Korelasyon Katsayısı (SKK), Concordance

Korelasyon Katsayısı (CKK), Bland-Altman yöntemi, Deming regresyon ve

Passing-Bablok yöntemleri önerilen yöntemlerden bazılarıdır.

Ölçümlerin güvenilirliğini ve doğruluğunu ölçmek amacıyla yapılan çalışmalar 1886

yılında Galton ile başlamış olup, Bartko (1966), Shrout ve Fleiss (1979) ve

Vangeneugden (2004)’in güvenilirlik ölçütlerinden Sınıf-İçi Korelasyon Katsayısı

(SKK) konusundaki çalışmaları ile devam etmiştir. Ardından, SKK’ye alternatif

olarak Lin (1989) Concordance Korelasyon Katsayısını (CKK) geliştirmiş; Donner

(1998), Dunn (2002), Shoukri (2004) ise güvenilirlik çalışmalarının dizaynı

konusunda çalışmalar yapmışlardır. Deming (1943), klasik regresyon analizinden

farklı olarak her iki değişkenin de hata içerebileceği konusu üzerinde durmuş;

Passing ve Bablok (1983) da Deming regresyon tekniğine ek olarak her iki

değişkene ait verilerin hata değerlerinin normal dağılım varsayımını sağlamaması

durumu üzerinde durmuşlardır. Metotlar arasındaki uyumu değerlendirmek amacıyla

ise, Bland ve Altman (1986, 1995, 1999); Banhart (2002, 2005) gibi önemli

araştırmacılar farklı ölçütler geliştirmişlerdir.

Metot karşılaştırma çalışmalarında uyumu ölçmek için geliştirilen yaklaşımlar

aşağıdaki gibi sınıflandırılabilir:

(1) Tanımlayıcı yöntemler:

45 0 ’lik eşitlik doğrusu (identity (equality) line) ile eşleştirilmiş veri çiftleri

için saçılım grafiği

Bland – Altman saçılım grafiği

3

(2) Ölçeklendirilmeyen özet indisler (Unscaled summary indices):

Bland-Altman yöntemi ile uyum sınırları

Ölçümlerin farklarının mutlak değerine dayanan tekrarlanabilirlik

(repeatabilitiy) ve tekrar elde edilebilirlik (reproducibility) katsayıları

(3) Ölçeklendirilebilen özet indisler (Scaled summary indices):

Sınıf-İçi Korelasyon Katsayısı

Concordance Korelasyon Katsayısı

(4) Regresyon Modelleri

Deming regresyon yöntemi

Passing – Bablok regresyon yöntemi

Bu tez çalışmasında amaç, metot karşılaştırma çalışmalarında uyum düzeyini

belirlemek amacıyla geliştirilen istatistiksel yöntemleri tanıtmak, aralarındaki

farkları incelemek, metot karşılaştırma çalışmalarının dizaynını sunmak ve çalışma

dizaynına en uygun yöntemin nasıl seçileceğini açıklamaktır.

1.1. Genel Kavramlar

Uyum kavramını ve uyum düzeyini ölçmede kullanılan yöntemleri kavrayabilmek

için öncelikle, bu çalışmalarda sıklıkla kullanılan, “Doğruluk ve Kesinlik”, “Ölçüm

Hatası”, “Güvenilirlik” ve “Geçerlilik” kavramlarının anlaşılması önemlidir. Bu

amaçla, aşağıda bu kavramlara ilişkin açıklamalar yer almaktadır.

1.1.1. Doğruluk ve Kesinlik (Accuracy and Precision)

Birçok bilim dalında, bir ölçüm sisteminin doğruluğu, bir niceliğin ölçüm değerinin

asıl (gerçek) değerine olan yakınlığının derecesidir. Bir ölçüm sisteminin kesinliği

4

(tekrarlanabilirliği veya yinelenebilirliği) ise, aynı koşullarda elde edilen tekrarlı

ölçümlerin aynı sonucu verme derecesidir; ancak birçok sözlükte, “doğruluk” ve

“kesinlik” eş anlamlı olarak kullanılır. Doğruluk, “hatadan veya yanlışlıktan

arınmışlık” veya “ölçüm değerinin, gerçek veya standart değer ile uyumunun

derecesi” olarak tanımlanır. Kesinlik ise, “elde edilen ölçümlerin saflığının

(refinement) derecesi” veya “elde edilen tekrarlı ölçüm değerlerinin birbirine

yakınlığı” olarak tanımlanır. Burada saflığın derecesi (degree of refinement) ve

uyumun derecesi (degree of conformity) aynı şeyi ifade etmektedir. Bu iki terim

arasındaki ince fark, gerçek (referans) değere gereksinim duyulup duyulmamasıdır

(Barnhart ve ark., 2007). Bir ölçüm sisteminin doğruluğu belirlenmek istendiğinde,

gerçek değere gereksinim duyulurken; kesinlik belirlenmek istendiğinde elde edilen

ölçümlerin birbirine ne kadar yakın olduğu ile ilgilenilir ve bu nedenle gerçek

değere gereksinim duyulmaz.

Geçmişten bu yana, “doğruluk” ve “kesinlik” kavramlarının anlamları birbiriyle

karıştırılmaktadır. Bu iki kavram arasındaki karmaşa, her bir kavramın farklı

tanımlarının olmasından ve zaman zaman birbirlerinin yerine kullanılmalarından

dolayı günümüzde de giderilebilmiş değildir. Örneğin, biyoanalitik metot doğrulama

kılavuzu (Food and Drug Administration (1999)) olan FDA doğruluğu, “bir metot

ile elde edilen test sonuçlarının ortalamasının gerçek değere yakınlığı (closeness)”

olarak tanımlamıştır. Ortalamanın gerçek değerden sapması, yani sistematik

yanlılık, doğruluğun değeridir. FDA, kesinlik terimini ise, benzer koşullar altında

aynı homojen örneklemden seçilen örneklerden elde edilen bir grup ölçüm değeri

arasındaki uyumun yakınlığı olarak tanımlar. Bunun yanı sıra, ISO (International

Organization for Standardization (1994)), doğruluk terimini hem sistematik yanlılık

(trueness) hem de rastsal hatanın (kesinliğin) ölçüsü olarak kullanmıştır. Burada,

sistematik yanlılık, elde edilen birçok test sonucunun ortalaması ile gerçek değer

(veya kabul edilen referans değer) arasındaki uyumun yakınlığını (closeness of

agreement) ifade ederken; kesinlik, test sonuçları arasındaki uyumunun yakınlığını

ifade etmektedir. Diğer bir ifadeyle, ISO’nun tanımına göre “doğruluk” teriminin,

sistematik yanlılık ve rastsal hatanın her ikisini birden içerdiği söylenebilir.

5

ISO’nun, hem sistematik yanlılık (sistematik hata) hem de rastsal hatanın ölçümü

için sadece “doğruluk” terimini kullanmasına rağmen, istatistiksel araştırmalarda ve

medikal literatürde sistematik yanlılığı ölçmek için “doğruluk” teriminin; rastsal

hatayı ölçmek için ise “kesinlik” teriminin sıklıkla kullanıldığı gözlenmektedir. Bu

nedenle, bu tez çalışmasında da, sistematik yanlılık “doğruluk” teriminin ifadesi

olarak kullanılırken; “kesinlik” terimi beklenen değer etrafındaki rastsal hatanın

ifadesi olarak kullanılacaktır.

Doğruluk ve kesinlik kavramları arasındaki farkın daha iyi anlaşılması açısından

Şekil 1.1’in incelemesi faydalı olacaktır.

Düşük doğruluk Düşük doğruluk

Düşük kesinlik Yüksek kesinlik

Yüksek doğruluk Yüksek doğruluk

Düşük kesinlik Yüksek kesinlik

Şekil 1.1. “ Doğruluk ” ve “ Kesinlik ” kavramlarının görsel ifadesi

Şekil 1.1’de verilerin ortadaki nokta içersinde yer alması ölçümlerin doğruluğunun

arttığı anlamına gelirken; verilerin birbirine olan yakınlığı ise ölçümlerin

kesinliğinin arttığını ifade eder. Ölçümlerin hem birbirine yakın olması hem de

6

gerçek değere yakın olması ise hem doğruluğun hem de kesinliğin yüksek olduğunu

gösterir.

1.1.2. Ölçüm Hatası (Measurement Error)

Ölçüm, gerek ölçülen değişkeni, gerekse ölçüm işlemlerini az ya da çok etkileyen

birçok etkenin etkisi altında yapılan bir işlemdir.

Ölçülen özelliğin gerçek değeri ile ölçüm sonucu arasındaki farka ölçüm hatası

denir. İstatistiksel anlamda “hata” terimi, bağımsız değişkenle açıklanamayan

değişkenliğin bütün kaynakları olarak tanımlanır (Bruton ve ark., 2000).

Ölçüm sonuçlarına karışan hatalar, gözlemciden, ölçme aracından veya

metodundan, ölçümün elde edildiği ortamdan, ölçümlerin elde edildiği deneklerin

sözü edilen bu etkenlerle etkileşiminden kaynaklanabilir.

Klinik çalışmalarda tam olarak güvenilir ölçümler elde etmek neredeyse

imkânsızdır. Çünkü bütün gözlemcilerin, ölçüm aletlerinin, ölçümleri elde eden

kişilerin (raters) ölçümlerini bir miktar hata ile elde etmesi olasıdır; benzer olarak

deneklerden elde edilen yanıtlar da tutarlı olmayabilir. Bu nedenle, gözlenen ölçüm

değeri ( ix ), gerçek değer ( it ) ve hata ( ie ) bileşenlerinden oluşur. Bu durum,

iii etx

şeklinde gösterilebilir.

Sistematik hata (SE), rastgele hata (RE) olmak üzere iki hata türü vardır. Sistematik

hata da kendi içinde sabit ve orantısal hata olmak üzere ikiye ayrılır. Şekil 1.2. ve

1.6.’da hata türleri gösterilmiştir.

7

Şekil 1.2. Hata türlerinin şematik gösterimi

Sistematik hata (SE veya bias), ölçülen değerin, gerçek değerden uzaklaşma

derecesidir. Ölçülen büyüklüğe, ölçümü elde eden kişiye ve ölçme koşullarına bağlı

olarak sistematik hatalar değişebilir. Sabit hata, hata miktarının her ölçümde aynı

olması, değişmemesidir. Her bir ölçme işlemi için aynı yönde olup, hata miktarı her

bir ölçüm için değişmez. Orantısal hata ise, ölçümlerin büyüklüğü ile orantılı olarak

azalan ya da artan hatalardır ve regresyon doğrusunun eğiminden bulunur. Sabit ve

orantısal hataya ilişkin grafikler Şekil 1.3. ve Şekil 1.4’te gösterilmiştir.

Şekil 1.3. Sabit Hata Şekil 1.4. Orantısal Hata

Rastgele hata (RE), ölçülen değer için verilerin ortalama etrafındaki dağılımına göre

değişir. Verilerin ortalama etrafında yayılım ölçütü olan standart sapma (s) düzeyi,

rastgele hatanın göstergesidir. Hatanın kaynağı bilinmez. Ölçme sonuçlarına gelişi

HATA

RASTGELE HATA SİSTEMATİK HATA

SABİT HATA ORANTISAL HATA

ORANTISAL HATA

8

güzel karışan ve şansla ortaya çıkan hatalardır. Çok sayıda ölçme yapılarak rastgele

hataların ortalaması sıfıra yaklaştırılır.

Şekil 1.5. Rastgele Hata

Şekil 1.6. Hata türleri

Toplam hata ise, matematiksel olarak rastgele hata ve sistematik hatanın toplamı

olarak tanımlanabilir.

9

1.1.3. Güvenilirlik (Reliability)

Uzun yıllardan bu yana, güvenilirliği (reliability) ölçmek amacıyla farklı yöntemler

geliştirilmektedir. Güvenilirlik ilk olarak, sosyal ve davranışsal bilimler ile eğitim

alanlarında yapılan çalışmalarda kullanılmış; ardından psikoloji, biyoloji ve medikal

bilimlerde de yaygın olarak kullanılmaya başlanmıştır (Bartko, 1966; Donner, 1998;

Fisher, 1925; Lord ve Novick, 1968; Müller ve Büttner, 1994; McGraw ve Wong,

1996; Shrout ve Fleiss, 1979; Shrout, 1998; Shoukri ve arkadaşları, 2004;

Vangeneugden ve ark., 2004).

Güvenilirlik, tekrarlı ölçümlerin tutarlılığı ya da ölçümlerin tekrarlanabilirliği olarak

tanımlanır ve gerçek farklardan kaynaklanan toplam varyansın miktarının bir

ölçüsüdür (Bruton ve ark., 2000).

Gözlenen ölçüm değeri ( ix ), gerçek değer ( it ) ve ölçüm hatası ( ie ) unsurlarını da

dikkate alarak aşağıdaki şekilde ifade edilir:

iii etx

Uygulamada, sadece gözlem değeri ( ix ) olan ölçüm değeri bilinebilir. Gerçek değer

( it ) ve hata değeri ( ie ) hakkında bir bilgi elde edilemez. Hataların rastgele olarak

dağıldığı varsayımıyla, hatalar rastgele olarak pozitif ve negatif yönde gelişir ve

birbirlerini elemeleri sayesinde ölçüm hataları ortalaması sıfır olur (E( ie )=0). Bu

varsayımdan hareketle ölçmenin varyansı aşağıdaki gibi formüle edilebilir (Ercan ve

ark., 2004) :

222

etx

2

x : Gözlenen değerlerin varyansı

2

t : Gerçek değerlerin varyansı

10

2

e : Ölçüm hatalarının varyansı

Klasik test teorisinde, yukarıdaki bilgilerden faydalanarak bir ölçme aracının ne

derece güvenilir olduğu, gerçek değerlerin varyansının, toplam varyansa (gözlenen

değerler varyansına, 2

x ) oranıyla elde edilen güvenilirlik katsayısı ile anlaşılır.

Güvenilirlik katsayısı aşağıdaki formül yardımıyla bulunur:

2

2

x

tx

Elde edilen ölçümler, gerçek değere yaklaştıkça, ölçeğin güvenilirliği artar. Elde

edilen ölçümün gerçek değere yaklaşması, yani hata değerinin sıfıra yaklaşması

durumunda güvenilirlik katsayısı 1’e yaklaşır; bu durumda ise ölçme aracının

güvenilirlik düzeyi mükemmel olur. Bu durumun tam aksine, hata miktarı arttıkça

güvenilirlik azalır ve güvenilirlik katsayısı ise sıfıra yaklaşır (Bruton ve ark., 2000).

Literatürde yaygın olarak kullanılan güvenilirlik indisleri,

Yanlılık için hipotez testleri (Örneğin eşleştirilmiş t-testi, varyans analizi

vb.)

Korelasyon katsayıları (Örneğin Pearson korelasyon katsayısı, SKK vb.)

Ölçümlerin standart hatası

Değişim katsayısı

Tekrarlanabilirlik katsayısı

Bland-Altman %95 uyum sınırları

dır (Bruton ve ark., 2000).

11

1.1.4. Geçerlilik (Validity)

Geçerlilik, bir metodun ölçmeyi amaçladığı özelliği, başka herhangi bir özellikle

karıştırmadan, doğru olarak ölçebilme derecesidir. Başka bir ifadeyle, bir ölçme

aracının, geliştirilmiş bulunduğu konuda amaca hizmet etmesidir. Söz gelimi,

uzunluk ölçmek için geliştirilmiş bir araç olan metre, kişilerin boylarını ölçme

amacına hizmet eder; fakat kişilerin ağırlıklarını ölçme amacına hizmet etmez. Bu

demektir ki, bir ölçme aracı olarak metre uzunluk ölçmede geçerlidir; fakat ağırlık

ölçmede geçerli değildir.

Bir metodun kullanılmadan önce, geçerliliğinin incelenmesi ve değerlendirilmesi

gerekir. Bir metodun geçerliliğinin nasıl değerlendirileceği sorusundan önce

bilinmesi gereken konu, bir metotta birden çok geçerlilik türünün ve yönteminin

olabileceğidir. Uygulamada, geçerliliği birden fazla yöntemle belirlenmiş metotların

daha çok tercih edildiği bilinmektedir.

Seçilen referans değere (kriter veya gold standart) bağlı olarak, içerik geçerliliği

(content validity), yapı geçerliliği (construct validity), ölçüt geçerliliği (criterion

validity) gibi bazı önemli geçerlilik türleri vardır (Barnhart, 2007). İçerik

geçerliliği, geliştirilen ölçüm metodunun incelenen konuların tüm önemli alt

konularını içermesi olarak tanımlanır (Alpar, 2010). Yapı geçerliliği, doğrudan

ölçülemeyen bir özelliği ölçen bir metodun ölçme derecesi olarak tanımlanır ve

endişe, merak gibi doğrudan gözlemlenemeyen gizli yapıların ölçülmesi için

kullanılır. Ölçüt geçerliliği, bir referans değere göre geçerliliğin belirlenme sürecidir

ve uyum (concurrent) ve kestirim (predictive) geçerliliği olmak üzere ikiye ayrılır.

Uyum (var olan durum) geçerliliği, geçerli olduğu bilinen referans metot yerine

daha az zaman alan ya da kişiye belirli oranda daha az zarar vermesi gibi

nedenlerden dolayı başka bir metot önerildiğinde kullanılır. Kestirim geçerliliği,

standart ölçümü kestiren metot ya da değişkenlerden elde edilen bir ölçümü

kullanarak standardın kestirilme derecesi olarak tanımlanabilir (Alpar, 2010;

Barnhart, 2007).

12

Geçerli bir metotta bulunması gereken en önemli özellik, metodun güvenilir

olmasıdır. Metodun güvenilirliği ile ilgili kavramlardan bir önceki bölümde

bahsedilmiştir.

1.2. Metot Karşılaştırma Çalışmalarında Uyumun Değerlendirilmesi

Metot karşılaştırma çalışmalarında, aynı denek üzerinden farklı metotlarla elde

edilen ölçümler arasındaki uyum düzeyi merak edilir. Uyum, farklı metotlar ile elde

edilen ölçümlerin birbirine benzerliği iken; uyumsuzluk, elde edilen ölçümlerin

birbirine benzer olmayışlık düzeyini ifade eder. Ancak benzer koşullar altında aynı

metotla aynı denek üzerinden elde edilen tekrarlı ölçüm değerleri veya aynı amaç

için geliştirilmiş metotlarla aynı denek üzerinden alınan ölçümler, her bir ölçüm

prosedüründe karşılaşılması kaçınılmaz olan hata değeri nedeniyle genellikle

tamamen aynı olmazlar. Bu nedenle, ölçüm değerleri arasındaki uyumun ya da

yakınlığın tespit edilmesi gerekir.

Uyum, hem doğruluk (accuracy) hem de kesinlik (precision) terimlerini içerir. Eğer

ölçüm değerlerinden biri referans değer olarak kabul edilirse, uyum aynı zamanda

geçerlilik terimi ile de ilgili olacaktır. Bütün ölçüm değerlerinin aynı dağılımdan

geldiği varsayılırsa, uyum, bu ölçüm değerlerinin ortalamaları etrafındaki kesinliği

(precision) değerlendirir. Ölçüm değerleri arasında uyumsuzluk söz konusu

olduğunda, uyumsuzluğun sistematik yanlılıktan mı (systematic bias) ya da rastsal

hatadan mı kaynaklandığı tespit edilmelidir. Çünkü sistematik yanlılık (inaccuracy)

genellikle kalibrasyon yardımıyla sabitlenebilir; ancak rastsal hatayı (imprecission)

kontrol altına almak oldukça güçtür (Barnhart, 2007).

Uyum düzeyinin tahminine, iki metot ile aynı denek üzerinden elde edilen ölçümler

arasındaki farkın hesaplanması ile başlanır. Tüm denekler için ölçüm değerleri

birbirine eşit olduğunda, iki metot ya da aletin sonuçları arasında mükemmel uyum

olduğu söylenebilir. Bu durumda, iki metot ile elde edilen ölçüm değerlerine ait

13

saçılım grafiği çizildiğinde Şekil 1.7.’de görüleceği gibi tüm noktalar eşitlik doğrusu

üzerinden geçer (Bland ve Altman, 1999).

Şekil 1.7. Eşitlik Doğrusu ile Saçılım Grafiği

Daha önce de bahsedildiği gibi, ölçüm değerleri çoğu zaman bir miktar hata ile elde

edildiğinden yukarıdaki grafik ile genellikle karşılaşılmaz. Elde edilen ölçüm

değerleri çoğunlukla birbirine yakın değerler çıkar. Bu nedenle, ölçüm değerleri

arasındaki uyum ya da yakınlığa (closeness) ihtiyaç duyulur.

Uyum, mutlak uyum ve ilişkisel uyum olmak üzere iki şekilde incelenebilir. Mutlak

uyum, Stine (1989) tarafından tanımlanan ilişkisel (relational) uyum kavramının

özel bir durumudur (Barnhart, 2007). Uyum ölçüm değerleri arasındaki farkın

mutlak değerinin bir fonksiyonu olarak tanımlandığında, bu tür uyuma mutlak uyum

denir (Barnhart, 2007).

Her bir denekten aynı ölçüm değerinin elde edilmesi bekleniyorsa veya elde edilen

ölçüm değerleri arasındaki herhangi bir sistematik fark tolere edilmiyorsa mutlak

uyum kavramı kullanılır. Mutlak uyum, farklı metotlar ile aynı denek üzerinden elde

edilen ölçümlerin uyumunu mutlak farklara dayanarak değerlendirir ve literatürde

yaygın olarak kullanılan uyum türüdür (Barnhart, 2006).

14

İlişkisel uyum, metotlardan biriyle elde edilen ölçüm değerlerinin, diğeriyle elde

edilen ölçüm değerlerinin bir fonksiyonu olması durumudur (Barnhart, 2006).

İlişkisel uyum katsayısını tanımlamak için, öncellikle uyumu sağlamak amacıyla

ölçüm değerlerine uygulanacak olan dönüşümler (transformations) tanımlanmalıdır.

Örneğin, iki metot ile elde edilen iki ölçüm değeri arasındaki fark bir sabitse,

metotlar ile elde edilen ölçüm değerleri birbirleri ile uyumludur ve bu durumda

uygulanacak dönüşüm, aynı sabit değeri her bir ölçüm değerine eklemektir

(eklemeli uyum (additive agreement) ile ilgilidir). Yani metotlardan biriyle elde

edilen ölçüm değerlerinin her birine aynı sabit değer eklendiğinde diğer metoda ait

ölçüm değerleri elde edilir. Bu durum,

axxT )(

şeklinde gösterilebilir.

Benzer olarak, ilgilenilen durum doğrusal (linear) uyum olduğunda, metotlardan

biri ile elde edilen ölçümler, diğer metot ile elde edilen ölçümler ile sabit bir

doğrusal fonksiyon oluşturuyorsa, metotlar ile elde edilen ölçümlerin birbirleri ile

uyumlu olduğu söylenir (Barnhart, 2007). Bu durum ise,

bxaxT )( , 0b

şeklinde gösterilebilir.

İlişkisel uyum kavramına daha çok sosyal bilimler ile ilgili çalışmalarda rastlanır.

Biyomedikal ya da sağlık bilimlerinde ise, ilgilenilen her bir denek için gerçek

değerin belirlenmesi istendiğinden yaygın olarak mutlak uyum kavramı kullanılır.

Metot karşılaştırma çalışmalarında uyum gibi güvenilirlik kavramı ile de sıkça ve

farklı şekillerde karşılaşılır. Vangeneugden ve arkadaşları (2005) ve Molenberghs ve

arkadaşlarına (2007) göre, uyum bir denekten elde edilen ölçümlerin yakınlığının

15

derecesini değerlendirirken; güvenilirlik denekler arasındaki farkın derecesini yani

bir popülasyonda deneklerin birbirlerinden ayrılışlarını değerlendirir (Barnhart,

2007).

Güvenilirlik değerlendirilirken, ölçüm hataları, denekler arasındaki değişkenlik ile

ilgilidir ve deneklerin birbirinden ayrılışları hakkında bilgi edinilmesini sağlar. Eğer

deneklerden elde edilen değerler birbirinden farklı ise, ölçüm hatası denekler

arasındaki ayrılışın tespit edilmesini engellemeyecektir; ancak deneklerden elde

edilen ölçüm değerleri birbirine çok yakınsa, ölçüm hatası ile denekler arasındaki

ayrılış tespit edilemeyecek ve güvenilirlik parametreleri oldukça küçük çıkacaktır.

Bu nedenle, homojen popülasyonlarda uyum düzeyi yüksek, güvenilirlik düzeyi

düşük çıkarken; heterojen popülasyonlarda uyum düzeyi düşük, güvenilirlik düzeyi

yüksek çıkabilir. Bu durum, ölçeklendirilemeyen indisler uyumu değerlendirmede,

ölçeklendirilebilen indisler ise güvenilirliği değerlendirmede kullanılıyorsa

geçerlidir. Çünkü ölçeklendirilebilen indisler kimi zaman denekler arası

değişkenliğe (between-subject variability) bağlıdır ve sonuç olarak, bir

popülasyondan seçilen deneklerin birbirinden ayrılışlarının derecesini değerlendirir

(Barnhart, 2007).

Medikal çalışmalarda uyumun değerlendirilmesi konusuna, metot karşılaştırma ve

deney doğrulama çalışmalarında sıkça rastlanır. Bu tez çalışmasında, uyumu

değerlendirmek için kullanılan istatistiksel yaklaşımlar tanımlayıcı yöntemler,

ölçeklendirilemeyen uyum indisleri, ölçeklendirilebilen uyum indisleri ve regresyon

teknikleri başlıkları altında sınıflandırılacak ve tartışılacaktır.

1.2.1. Uyumu Değerlendirmede Kullanılan İstatistiksel Yaklaşımlar

Bu bölümde, metot karşılaştırma çalışmalarında uyumu değerlendirmek amacıyla

kullanılan yöntemler; tanımlayıcı yöntemler, ölçeklendirilemeyen özet indisler,

16

ölçeklendirilebilen özet indisler başlıkları altında incelenecek ve

detaylandırılacaktır:

1.2.1.1. Tanımlayıcı Yöntemler

Tanımlayıcı istatistikler, karşılaştırılacak metotlar ile elde edilen ölçüm değerleri

hakkında sezgisel olarak tahminlerde bulunabilmek açısından önem teşkil eder;

ancak bu tanımlayıcı istatistikler m metot ile elde edilen ölçüm değerleri arasındaki

uyumun derecesini ölçmek için yeterli değildir.

Metot karşılaştırma çalışmalarında, tanımlayıcı yöntemler saçılım grafiği (scatter

plot) ve Bland – Altman grafiği (difference plot) başlıkları altında incelenecektir. Bu

grafikler, verileri görsel olarak yorumlamak ve ölçümler arasındaki ilişkileri

incelemek açısından da önemlidir.

1.2.1.1.1. Saçılım Grafiği (Scatter Plot)

n birimden elde edilen X, Y değerler çifti xy koordinat alanında X değerleri x

ekseni, Y değerleri y ekseni ölçekleri kullanılarak kesişme noktaları biçiminde

belirlenir. Bu noktalardan oluşan grafiğe saçılım grafiği denir (Özdamar, K., 2003).

Saçılım grafiği, iki değişken arasındaki ilişkinin tipini, yönünü ve büyüklüğünü

belirlemeye yardımcı olan bir grafik türüdür.

Bu grafik, iki metoda ait tüm ölçümlerin tam olarak eşit olduğunu varsayan eşitlik

doğrusunu da (identity line) göstermektedir. Regresyon doğrusu için hesaplama

yapılmaz ya da regresyon doğrusu çizilmez. Çünkü burada bir metodun diğer metot

aracılığıyla bulunan tahmini ile ilgilenilmez; ancak teorik eşitlik ilişkisi ve bu

eşitlikten sapmalar ile ilgilenilir. Eşitlik doğrusu, yatay ve dikey eksendeki

ölçümlerin eşit olmasını simgeler ve her iki eksene de 45 0 lik açı yapar. Bu doğru,

17

görsel olarak metotlar arasındaki uyum düzeyinin ne kadar iyi olduğunu

değerlendirmeyi kolaylaştırır. Fakat metot karşılaştırmada ölçümlere ait değişim

aralığı geniş olduğunda, bu tür bir saçılım grafiğinin anlaşılması güç olabilir (Bland

ve Altman, 1999).

1.2.1.1.2. Bland – Altman Uyum Sınırları Grafiği (Difference Plot)

Aynı denekler üzerinden iki metot ile elde edilen ölçüm değerleri arasındaki

farkların, ortalamalarına karşı gösterildiği saçılım grafiğidir. Bu grafiğe aynı

zamanda “Bland – Altman Uyum Sınırları Grafiği” de denir.

Bland – Altman grafiğinde x eksenini, gerçek değerin bilinmemesinden dolayı,

gerçek değerin en iyi tahmin edicisi olan aynı denek üzerinden iki metot ile elde

edilen ölçümlerin ortalama değerleri oluşturur. y eksenini ise, iki metot ile aynı

denek üzerinden elde edilen ölçümler arasındaki fark değerleri oluşturur.

Gerçek değeri içeren referans metodun olduğu çalışmalarda, Bland – Altman

grafiğinin x-ekseni, araştırmacının hata yapma eğiliminden dolayı iki metotla elde

edilen ölçümlerin ortalaması yerine referans metodun ölçümlerini gösterir (Mantha,

2000).

Farklara karşı her bir değeri ayrı ayrı göstermek hatalıdır. Çünkü bu durumda farklar

birbiriyle ilişkili olur ki bu çok iyi bilinen istatistiksel bir problemdir.

Bland - Altman grafiği, ortalamalar (gerçek değer) ve farklar (hata) arasındaki olası

bir korelasyonun değerlendirilmesine de imkan verir (Mantha, 2000). Fark ve

ortalama değerleri arasında herhangi bir ilişkinin olması durumunda, bu ilişkinin

giderilmesi gerekir. Fark ve ortalamalar arasında ilişki olmaması gerekliliğinin

nedeni, sonuçların güven aralıkları da verilerek diğer popülasyonlara genellenmek

istenmesinden ileri gelir (Mantha, 2000).

18

Metotlar ile elde edilen ölçümler arasındaki ilişki doğrusal değilse veya standart

sapma ölçüm aralığı boyunca sabit değilse, doğrusallık ve ölçüm aralığı boyunca

sabit standart sapma verilerin logaritmik dönüşümünün alınması yoluyla sağlanabilir

(Carstensen, 2010).

Yukarıda anlatılanların yanı sıra, Bland – Altman grafiği yanlılığın (farkların

sistematik olarak sıfırdan farklı olup olmadığının) ve rastgele hatanın (farkların ne

kadar yaygın olduğunun) değerlendirilmesine de olanak tanır. Grafikteki noktaların,

x eksenine yatay uzanan uyum sınırları ( DD S96.1 ) arasında olması beklenir.

Metotlar arasındaki uyumsuzluk ise, işaretlenen noktaların yatay olarak çizilen sıfır

ekseninden sapmalarıyla ölçülebilir.

Metot karşılaştırma çalışmalarında, Bland – Altman grafiği, ölçüm değerleri

arasındaki farkların büyüklüğünü ve bu değerlerin gerçek değerden (true value) ne

derece farklı olduğu hakkında bilgi vermesi nedeniyle saçılım grafiğine göre daha

üstündür.

Aşağıdaki Bland – Altman ve saçılım grafiği, Mayil S. Krsihnam ve arkadaşlarının

2009 yılında yaptıkları çalışmada göğüs aortik hastalıkları için SSFP MR anjiyografi

ve klasik CE-MRA metotlarının karşılaştırılması çalışmasından alınmıştır

(Krishnam ve ark., 2009):

19

Şekil 1.8. Saçılım grafiği ve Bland-Altman grafiğinin karşılaştırılması

a. Saçılım grafiği SSFP MRA ve CE-MRA metotları arasındaki korelasyonun

(r=0.99) oldukça fazla olduğu görülmektedir.

b. Bland-Altman grafiğinde bütün noktaların uyum sınırları içinde olduğu

gözlenmektedir.

1.2.1.2. Ölçeklendirilemeyen Uyum İndisleri (Unscaled Summary Indices)

1.2.1.2.1. Bland-Altman Yöntemi ile Uyum Sınırları (Limits of Agreement with

Bland-Altman Approach)

Metot karşılaştırma çalışmalarında esas amaç, iki metodun değişimli olarak

kullanılabilmesi için elde edilen sonuçların yeterince uyumlu olup olmadığını

belirlemektir. Uyumu belirlemek amacıyla kullanılan klasik yöntemler olan,

kalibrasyon istatistikleri olarak da bilinen, korelasyon ve en küçük kareler regresyon

analizi çoğu zaman araştırmacıyı yanlış yönlendirir. Uyumu araştırmada bu

yöntemlerin kullanılması aşağıdaki nedenlerden dolayı doğru değildir:

20

1. Korelasyonun derecesi örneklemdeki sonuçların dağılım genişliğine bağlıdır.

Dağılım genişliği büyük olan örneklemlerde, dağılım genişliği dar olan

örneklemlere göre korelasyon daha yüksek çıkar. Örneğin, bu durum 3.0 ve 5.5 g/dl

gibi dar dağılım genişliğine sahip Albümin değerleri için dezavantajken, 0 ve 43

gibi büyük dağılım genişliğine sahip ALT ölçümleri için avantajdır (Genç ve ark.,

2003).

2. Örneklemdeki sonuçların dağılım genişliğine bağlı olarak, dağılım genişliği

büyük olan örneklemlerde korelasyon yüksek çıkarken, elde edilen ölçüm

değerlerinin arasındaki farkın büyük olabilmesinden dolayı uyum düşük çıkabilir.

Çünkü korelasyon katsayısı rastgele hataya duyarlı iken, orantısal hataya duyarlı

değildir. Örneğin, A metodu, B metodu ile elde edilen ölçümlerin 2 katını veriyorsa,

iki metodun sonuçları arasında tam bir korelasyon bulunurken, zayıf bir uyumluluk

elde edilecektir. Çünkü bu durumda ölçümler arasında rastgele hata yokken,

kuvvetli bir orantısal hata vardır ve korelasyon katsayısı bu hatayı belirleyemez

(Genç ve ark.,2003).

3. Korelasyon katsayısının anlamlılığının testi, “iki metot arasında ilişki ya da

bağıntı yoktur” hipotezinin testidir. Aynı değeri ölçmek için dizayn edilen iki

metodun ilişkili olup olmadığını test etmek gereksizdir. Çünkü aynı metodu ölçmek

için dizayn edilen iki metodun ilişkili olması beklenen bir durumdur (Genç ve ark.,

2003).

4. Regresyon doğrusunun eğimi iki metot arasındaki uyum ile ilgili bilgi verebilir;

ancak regresyon doğrusunun eğimi elde edilen ölçüm değerlerinin dağılım

genişliğinden önemli ölçüde etkilenir (Pollock, 1992).

5. Doğrusal regresyon analizi metot karşılaştırma çalışmalarında kullanılan klasik

yöntemlerden bir diğeridir. Regresyon analizinin amacı, noktalara en yakın doğruyu

çizebilmek için a ve b katsayılarını kestirmektir ( bxay ). a ve b katsayılarının

testi 0’a karşı yapılır. Fakat uyumu göstermede regresyon analizi kullanılacaksa,

21

regresyon eğrisi a=0 ve b=1’e karşı test edilmelidir. Yani iki metoda ait değerler

saçılım grafiğinde eşitlik doğrusu (line of equality) üzerinde olmalıdır.

6. Regresyon analizi X bağımsız değişkeni ile Y bağımsız değişkeni arasındaki

ilişkiyi inceler. Uyumu göstermede regresyon analizi kullanılırken hangi yönteme

ait verilerin X, hangilerinin Y olarak kabul edilmesi gerektiğine dair bir bilgi yoktur

(Saraçlı, 2009).

7. Regresyon analizinde, iki metot ile yapılan ölçüm sonuçlarından birincisi Y,

ikincisi X ölçümleri olarak düşünüldüğünde, klasik regresyon yöntemleri

doğasından dolayı X metodu ile yapılan ölçümlerin hata içermediği, mevcut hatanın

Y metodundan kaynaklandığı varsayılır. X metodu ile elde edilen ölçümlerde

meydana gelebilecek hatalar dikkate alınmadığından yanlış sonuçlara ulaşılacaktır.

Klasik istatistik yöntemlerinin yukarıda bahsedilen dezavantajlarından dolayı, bu

yöntemlere alternatif olarak, Bland ve Altman iki metoda ait ölçümler arasındaki

uyumu değerlendirmek için farklı bir istatistiksel yöntem önermişlerdir ve zaman

içersinde Bland-Altman yönteminin kullanım sıklığının arttığı gözlenmiştir. 1995

yılında yayınlanan metot karşılaştırma çalışmalarında Bland - Altman yönteminin

kullanım oranı %8 iken, bu oran 1996 yılında %14, son yıllarda ise %31-36’lara

kadar artmıştır (Mantha, 2000).

Bland ve Altman tarafından geliştirilen uyum sınırları (Limits of Agreement

(LOA)), iki metodun uyumunu değerlendirirken yaygın olarak kullanılan bir

yöntemdir. Bu yöntem, ilk olarak iki metodu karşılaştırmak için kullanılmış, daha

sonraları J metodun ikili karşılaştırmaları için de kullanılmaya başlanmıştır

(Barnhart, 2007).

Bland – Altman yönteminin ilk adımı, aynı denek üzerinden iki metot ile elde edilen

değerlerin farklarının alınmasıdır (Barnhart, 2007). Daha sonraki aşamada ise, iki

metottan elde edilen ölçümlerin ortalamasına karşı saçılım grafiği çizilir. Bu grafik,

22

tanımlayıcı yöntemler konusunda daha önce bahsedildiği gibi, ölçüm hataları

(farklar) ve gerçek değerler (gerçek değerler genellikle elde edilemediğinden onun

en iyi kestiricisi olan ortalamalar) arasında olabilecek herhangi bir ilişkinin

incelenmesine de olanak sağlar. Ayrıca bu grafikten yanlılığın (bias) (farkların

sistematik olarak sıfırdan farklı olup olmadığının) ve hatanın (farkların ne kadar

yaygın olduğunun) incelenmesi de mümkündür (Genç ve ark., 2003).

Örneklemdeki deneklerden elde edilen değerlere ait farkların ortalaması (metotlar

arası fark) tahmin edilen yanlılıktır. Ayrıca, farkların standart sapması ( DS ) ise, bu

ortalama etrafındaki rastsal dalgalanmaların ölçülmesini sağlar.

Farklar ve ortalamalar arasında ilişki yoksa iki metot arasındaki uyum, farkların

ortalaması ( d ) ve standart sapması ( DS ) kullanılarak incelenebilir.

21 iii YYD , i. denek üzerinden, iki metot ile elde edilen tek (single) ölçüm

değerleri arasındaki fark olsun. iD ’lerin normal dağıldığı varsayımı altında

)( iD DE ve )(2

iD DVar ’dir. Bulunan farklar normal dağılıma sahip

olduğunda, farkların sıfırın etrafında rastgele dağılması ve %95’inin “ DD 96.1

ile DD 96.1 ” arasında olması beklenir. Bu durum altında ortalamalar ve farklar

arasında ilişki olmadığı söylenebilir. Bu yöntemde, DD 96.1 “uyum sınırları”

olarak adlandırılır ve iki metot ile elde edilen ölçüm değerleri arasındaki farkların

%95’inin uyum sınırları arasında olması beklenir. Küçük örneklemler için uyum

sınırları bulunurken, tablo değerini (n-1) serbestlik derecesi için t tablosundan

yararlanarak bulmak daha doğru olacaktır. (Barnhart, 2007, Genç ve ark., 2003).

Uyum sınırları daha açık bir ifadeyle şu şekilde açıklanabilir. Metot-1 biyokimyasal

bir değeri ölçmede rutin olarak kullanılan bir metot olsun. Metot-2 ise, Metot-1

yerine kullanılması düşünülen yeni bir metot olsun. D= Metot-1 - Metot-2 olarak

düşünüldüğünde, Metot-1 ile elde edilen ölçüm değerleri ve Metot-2 ile elde edilen

23

değerleri arasındaki fark %95 güven düzeyinde DD 96.1 arasında olmalıdır. Bu

sınırların kabul edilebilir düzeyde olup olmadığının istatistiksel bir cevabı yoktur.

Buna araştırmayı planlayan kişi karar verebilir. Kabul edilebilir uyum sınırlarına,

veriler toplanmaya başlanmadan önce çalışma planlandığı zaman karar verilmelidir.

İstatistiksel olarak bulunan limitin mutlak değeri, kabul edilebilir fark ( 0d )

değerinden daha az ise, iki metodun uyumunun iyi olduğu söylenebilir, yani iki

metot için bulunan “uyum sınırları” (farkların ortalaması DS96.1 ) klinik olarak

anlamlı ise, iki metodun değişimli olarak kullanılabileceği sonucuna varılır.

Tekrarlı olmayan veriler için uyum sınırları, D yerine iD ’nin örneklem ortalaması

olan d , 2

D yerine de iD ’nin örneklem varyansı olan 2

DS konarak tahmin edilebilir.

Farkların normal dağıldığı varsayımı sağlandığında, uyum sınırları için güven

aralıkları ve standart hata hesaplanabilir. n örneklem genişliği olduğunda, d ’nin

varyansı n

SD

2

, DS ’nin varyansı ise yaklaşık olarak )1(2/2 nSD olarak tahmin edilir.

Çünkü 2

DS ’nin dağılımı )1/(22 nD şeklindedir ve 2 ’nin varyansı yaklaşık

olarak 2

1’dir. Bu durumda uyum sınırlarının varyansı aşağıdaki gibi olur (Barnhart,

2007, Bland ve Altman, 1999):

)(96.1)()96.1( 2

dd SVardVarSdVar

)1(2

96.12

22

n

S

n

S dd

22

)1(2

96.11dS

nn

(1.1)

n yeterince büyük olduğunda bu eşitlik, aşağıdaki ifadeye yaklaşır:

n

SSdVar d

d

22

2

96.11)96.1(

24

n

Sd

2

92.2

n

S

n

S dd

22

392.2 (1.2)

olur. Bu durumda tahmin edilen uyum sınırlarının standart hatası,

n

SSdSE d

d

2

3)96.1(

)(71.1 dSE (1.3)

olacaktır.

Uyum sınırlarına ait varyansın bulunmasının amacı, tahmin edilen uyum sınırının

kesinliğini (precision) belirleyebilmektir.

Farklar ve ortalamalar arasında ilişki olmadığında, n örneklem genişliği olduğunda

%95 güven düzeyinde n-1 serbestlik derecesi ile t tablosundan yararlanılarak

farkların ortalaması )(d için güven aralığı,

n

SDtd (1.4)

olarak bulunur.

Tahmin edilen uyum sınırları için %95 güven aralığı (GA) ise aşağıdaki gibi elde

edilir (Barnhart, 2007, Mantha ve ark., 2000):

Uyum alt sınırı için güven aralığı

25

Ortalama için GA - 1.96 DS =

n

StSd D

D

2

3)96.1(

Uyum üst sınırı için güven aralığı

Ortalama için GA + 1.96 DS =

n

StSd D

D

2

3)96.1( (1.5)

Farklar ve ortalamalar arasında ilişki gözlenirse, uyum sınırları yukarıda verilen

yöntemle bulunamaz. Fark ve ortalama arasında ilişki olmaması gerekliliği,

sonuçların diğer popülasyonlara genellenmek istenmesinden doğar. Bu problemi

ortadan kaldırmak için uygulanabilecek ilk yöntem verilere logaritmik dönüşüm

uygulamaktır. Bu yöntemle var olan bu ilişki ortadan kaldırılabilirse uyum sınırları

anti-logaritma kullanılarak tekrar hesaplanabilir.

1.2.1.2.1.2. Karşılaşılabilecek Problemler ve Çözüm Yolları

Metot karşılaştırma çalışmalarında karşılaşılabilecek en önemli problemler, farklar

ile ortalamalar arasında ilişki olması durumu ve sabit olmayan varyanslılık

durumudur.

Farklar ve ortalamalar arasında ilişki olmaması ve ölçüm değerleri aralığı boyunca

varyansların sabit olması (homoscedasticity) anlamına gelen sabit varyanslılık

varsayımlarının sağlanıp sağlanmadığı, Bland – Altman saçılım grafiğinde görsel

olarak fark edilebilir. Bu problemlerin giderilebilmesi için literatürde en sık

kullanılan yöntem logaritmik dönüşüm ve regresyon yöntemleridir.

1.2.1.2.1.2.1. Logaritmik Dönüşüm

Metot karşılaştırma çalışmalarında yukarıda bahsedilen problemlerden biriyle

karşılaşıldığında, daha hızlı ve kolay yorumlanabildiği için öncelikle logaritmik

26

dönüşüm yöntemine başvurulur. Analize başlamadan önce her iki ölçüm değerine

uygulanan logaritmik dönüşüm, standart yaklaşımı kullanmaya olanak tanır (Bland

ve Altman, 1999). Prensipte diğer dönüşümler de kullanılabilirken (karekök alma ya

da tersini alma gibi), sadece logaritmik dönüşümün orijinal verilerle ilgili kolayca

yorum yapılabilmesine olanak tanıması tercih edilmesini sağlar.

Logaritmik dönüşüm uygulandıktan sonra elde edilen sonuçlar farkların yüzdesel

logaritmik değerleri olduğundan yorumlanması oldukça güçtür. Verilere logaritmik

dönüşüm uygulandığında, çıkan sonuçlar ilgili verilerin logaritmik oranlarıdır.

Ancak, logaritmik dönüşüm uygulanan verilere geri-dönüşüm (anti-log)

uygulandığında, y ekseninde gerçek ölçüm değerlerinin oranlarına ait sınırlar elde

edilirken; x ekseninde gerçek değerlerin geometrik ortalaması elde edilir (Bland ve

Altman, 1999, Carstensen, 2010). Böylelikle, logaritmik değerlerin farklarıyla

uğraşmak yerine, kolaylıkla her bir denek için elde edilen iki ölçüm değerinin oranı

hesaplanabilir ve bu değerlerin ortalaması ve standart sapması kullanılarak Şekil

1.9’da görüldüğü gibi ilgili uyum limitleri hesaplanabilir (Bland ve Altman, 1999).

Bu nedenle, logaritmik dönüşüm uygulanan veriler hakkında yorum yapmak

kolaydır.

Bir örnekle anlatılacak olursa, Bland ve Altman’ın 1999 yılında yayınladıkları

makalede denekler üzerinden kan basıncı değerleri elde edilmiş ve elde edilen

Bland- Altman grafiği (Şekil 1.9.a) yardımıyla farklar ve ortalamalar arasında ilişki

olduğu gözlenmiştir. Bu probleme çözüm olarak, verilere logaritmik dönüşüm

uygulanmıştır. Logaritmik dönüşüm uygulandığında ise, bu ilişkinin giderildiği

görülmektedir (Şekil 1.9.b). Bahsedilen grafikler aşağıdaki gibidir:

27

Şekil. 1.9. İki farklı metotla elde edilen kan basıncı değerleri.

a. Logaritmik dönüşüm uygulanmayan verilere ait Bland-Altman grafiğidir.

b.Verilere logaritmik dönüşüm uygulanmış verilere ait grafiktir.

Standart sapmanın ölçüm büyüklükleri ile birlikte artması durumunda, Bland-

Altman logaritmik dönüşümü önerirken; diğer bazı araştırmacılar y eksenindeki

değerlerin yüzde değerlerinin bulunmasını önermişlerdir ve bu yaklaşımlar arasında

sonuçların çok farklı bulunmadığını gözlemlemişlerdir. Bazı çalışmalarda, örneğin

Haixin Lei ve arkadaşlarının (2002) Clinical Chemistry’de yayınladıkları makalede,

yüzdesi alınmış verilerin grafiğinin çizilmesi tercih edilmiştir. Çünkü bu durumda,

verilere geri dönüşüm uygulamaya gereksinim duyulmadan veriler grafikten direkt

olarak okunabilmektedir.

Verilerin yüzdesini alarak değerlendirme yapmak yaygın olarak kullanılan bir

yöntem olmadığından, bu tez çalışmasında dönüşüm uygulanması gereken bir

durumla karşılaşılması durumunda logaritmik dönüşüm kullanılacaktır.

1.2.1.2.1.2.2. Regresyon Yaklaşımı

Bazı durumlarda, farklar ve ortalamalar arasındaki ilişki karmaşık olabilir ve

logaritmik dönüşüm bu problemi çözmede yeterli olmayabilir. Örneğin, metotlar ile

28

elde edilen ölçüm değerlerinden küçük olanlar için farklar bir yönde eğilim

gösterirken; büyük ölçüm değerleri için diğer yönde eğilim gösterebilir. Logaritmik

dönüşüm, ölçüm değerlerinin büyüklüğü ile farklar arasındaki ilişkiyi gidermez

(Bland ve Altman, 1999).

Sabit varyanslılık varsayımının sağlanıp sağlanmadığı Bland – Altman saçılım

grafiği ile anlaşılabilir. Grafikte, ölçüm değerlerinin büyüklüğüne bağlı olarak

ölçüm değerleri arasındaki fark değerlerinin artması ya da azalması durumu

gözlenirse, bu probleme regresyon yaklaşımı kullanılarak çözüm getirilebilir

(Carstensen, 2010). Bu durumda ilk olarak, iki metoda ait ölçümlerin

ortalamalarının (A) bağımsız değişken, farklarının (D) bağımlı değişken olduğu

varsayılarak regresyon denklemi oluşturulur. Eğer ölçümlere ait saçılım grafiğinde

belirgin bir eğim yoksa regresyon denklemi aşağıdaki gibi olur:

AbbD 10

^

(1.6)

Eğim ( 1b ) istatistiksel olarak anlamlı değilse, ^

D farkların ortalaması olan d ’ye eşit

olur. Eğer 1b sıfırdan önemli düzeyde farklı ise, A (ortalama) olarak tahmin edilen

herhangi bir gerçek değer için Eşitlik 1.6.’dan metotlara ait ölçümler arasındaki fark

tahmin edilir.

Analizin ikinci aşamasında, mükemmel uyum doğrusu (line of best fit) etrafındaki

değişim dikkate alınır. A ile tahmin edilen ölçüm değerinin büyüklüğünün bir

fonksiyonu olarak Eşitlik 1.6.’dan, artıkların saçılım grafiği modellenir. Bu

modelleme, ölçüm değerinin büyüklüğü her ne olursa olsun artıkların normal

dağıldığı varsayımı altında yapılır. A bağımsız değişken ve artıkların mutlak değeri

R olduğunda aşağıdaki eşitlik elde edilir:

AccR 10

^

(1.7)

29

Eğer artıklar sıfır ortalama ve 2 varyans ile normal dağılıyorsa, artıkların mutlak

değeri /2 ortalama ile yarı-normal dağılıma* sahip olur. Böylece, artıkların

standart sapması sabitlenmiş değerlerin 2/ ile çarpılması ile elde edilir. Uyum

sınırları ise, yukarıda gösterilen iki regresyon modelinin birleştirilmesi ile elde edilir

(Carstensen, 2010, Bland ve Altman, 1999).

Eğer DS sabit değilse, ilişkiyi belirlemek için doğrusal regresyon yeterli olacaktır.

Ancak, eğer R ve A arasında önemli bir ilişki yoksa, tahmin edilen standart sapma

Eşitlik 1.6.’da elde edilen artıkların yani düzeltilmiş farkların standart sapmasıdır.

Genel bir ifadeyle, metotlar ile elde edilen ölçüm değerlerinin farklarının beklenen

değeri AbbD 10

^

’dir ve %95 güven düzeyinde uyum sınırları,

^^^^

46.22/96.1 RDRD

veya

AccAbb 1010 46.2 (1.8)

olarak elde edilir.

* Yarı-normal dağılımın 1 standart sapma ile beklenen değeri

0

0

22 |)2/)[exp(2/2()2/exp()2/2()( xdxxxXE

/2)10)(2/2(

30

1.2.1.2.2. Tekrarlanabilirlik (Repeatability)

Tekrarlanabilirlik, aynı koşullar altında elde edilen (aynı metot, aynı laboratuar,

benzer zaman dilimi, her iki ölçüm için de aynı metodu kullanan aynı gözlemci vb.)

ve aynı denek üzerinde tekrar eden ölçümler arasındaki değişimin bir ölçüsüdür.

Aynı denek üzerinden tekrarlı ölçümler alınırken, her bir ölçüm değeri birbirinden

bağımsız olarak elde edilir. Böylelikle, araştırmacının elde ettiği her bir ölçümün bir

önceki ölçüm veya ölçümlerden bağımsız bilgiler içerdiği sonucuna varılabilir.

Pratikte, bu durumu sağlamak zor olabilir; ancak ölçümlerin bu şekilde alınması

sonuçların daha sağlıklı çıkmasını sağlayacaktır (Bland ve Altman, 1999).

Bu ölçüt, bir metodun kullanılabilir olup olmadığına karar vermede önemli bir role

sahip olduğu gibi iki metodu karşılaştırırken de kullanılır. Ancak ilginçtir ki, tekrarlı

ölçümler metot karşılaştırma çalışmalarında nadiren kullanılır. Bu nedenle de, metot

karşılaştırma çalışmaları için önemli olan bir detay göz ardı edilmiş olur. Her bir

metot ile her bir denek üzerinden yalnızca bir ölçüm değeri elde edilirse, hangi

metodun tekrarlanabilirliğinin ya da kesinliğinin (precision) daha iyi olduğu tahmin

edilemez (Bland ve Altman, 1999).

Tekrarlanabilirlik, metotların uyumunu önemli ölçüde etkilemektedir. Metotlardan

birinin zayıf tekrarlanabilirliğe sahip olması, bir bakıma aynı denek üzerinden alınan

tekrarlı ölçümlerin oldukça büyük bir varyasyona sahip olduğu anlamına gelir. Bu

durumda, iki metot arasındaki uyumunun da zayıf olması kaçınılmazdır. İki metoda

ait ölçümlerin ortalama olarak birbirleriyle uyum düzeyi çok benzer olsa bile,

metotlardan biri zayıf tekrarlanabilirliğe sahipse bu iki metot arasındaki uyumun

zayıf olmasına neden olur. Referans metot, zayıf tekrarlanabilirliğe sahipse, yeni

metot mükemmel olsa bile referans metot ile uyumlu çıkmayacaktır. Eğer, her iki

metot da zayıf tekrarlanabilirliğe sahipse, problem daha da büyüyecek ve çok büyük

bir olasılıkla metotlar arasındaki uyum düzeyi zayıf olacaktır (Bland ve Altman,

1999, Genç ve ark., 2003).

31

Metot karşılaştırma çalışmalarında iki metot uyumlu çıkarsa, bu metotlardan

tekrarlanabilirliği yüksek olanın diğerine göre daha üstün olduğu söylenebilir (Genç

ve ark., 2003).

Aynı metot ile elde edilen tekrarlı ölçümler kullanıldığında o metoda ait

tekrarlanabilirliği ölçmek amacıyla, uyum sınırlarını belirlemek için kullanılan

yaklaşıma benzer bir yaklaşım kullanılır. Bir metodun tekrarlanabilirliğinin düşük

ya da yüksek olması, söz konusu metotların standart sapmaları kıyaslanarak

anlaşılabilir. Grup içi (within subject) standart sapma ya da iki ölçüm değeri

arasındaki farkların standart sapması, ws , tek yönlü varyans analizi (ANOVA)

kullanılarak tahmin edilebilir. Her bir standart sapma, aynı metot ile elde edilen iki

ölçüm değerine ait fark değerlerinin sınırlarını belirlemek için de kullanılabilir.

Analizi yapmak çok kolaydır. Çünkü genellikle aynı denekten elde edilen ilk ölçüm

ile ikinci ölçüm arasında sistematik bir fark olması beklenmediğinden, tekrarlar

arasındaki farkların ortalamasının sıfır olması beklenir. Şayet ilk ve ikinci ölçüm

değerleri arasında sistematik bir farklılık olursa, ölçüm değerlerinin gerçek tekrarlar

olmadığı sonucuna varılır (Bland ve Altman, 1999). Gerçek tekrar, ölçüm

değerlerinin aynı koşullar altında elde edilmesi olarak tanımlanır (Barnhart, 2007).

Metotlara ait tekrarlanabilirlik, tekrarlanabilirlik katsayıları hesaplanarak

karşılaştırılabilir. British Standards Institute (BSI) tarafından tanımlanan

tekrarlanabilirlik katsayısı hataların normal dağıldığı varsayımı altında ws296.1

veya ws77.2 olarak tahmin edilir. Deneklerin %95’i için aynı metot ile elde edilen

iki ölçüm değerine ait tekrarlanabilirlik değeri ws296.1 veya ws77.2 olacaktır.

Her bir metot için elde edilen tekrarlanabilirlik katsayıları, %95 güven düzeyindeki

uyum sınırları ile karşılaştırılabilir. %95 güven düzeyindeki uyum sınırları - ws77.2

ve ws77.2 aralığı ile benzerdir. Eğer metotlara ait tekrarlanabilirlik katsayıları ile

uyum sınırları benzerse, metotlar arasındaki uyumsuzluk, tekrarlanabilirliğin düşük

olması olarak açıklanır. Uyum sınırları, elde edilen tekrarlanabilirlik değerinden

32

önemli ölçüde genişse, iki metot arasındaki uyumu düşüren başka faktörler var

demektir (Bland ve Altman, 1986; Bland ve Altman, 1999).

Grup içi standart sapmanın kullanılması, sınıf içi korelasyon katsayısı gibi diğer

tekrarlanabilirlik yaklaşımlarının uygun olmadığı anlamına gelmez. Daha sonraki

bölümlerde diğer tekrarlanabilirlik yaklaşımları da açıklanacaktır.

1.2.1.2.2.1. Tekrarlı Ölçümler Kullanıldığında Uyumun Hesaplanması

Metot karşılaştırma çalışmalarında, iki metot ile aynı denek üzerinden tekrarlı

ölçümler alındığında, elde edilen bütün verilerin kullanılması gerekir. Bu durumda

akla gelecek ilk yöntem, her bir denek üzerinden her bir metotla elde edilen tekrarlı

ölçümlerin ortalamasının hesaplanması, ardından da iki metodu uyum sınırları

yöntemini kullanarak karşılaştırmak için, elde edilen bu ortalama çiftlerinin

kullanılmasıdır (Bland ve Altman, 1999). Daha anlaşılır bir şekilde anlatılacak

olunursa, yukarıdaki adımlar uygulandığında veri şemasında, her bir metot ile her

bir denek üzerinden tek bir ölçüm değeri alınması durumundaki görüntü elde edilir.

Yanlılığın tahmini, ortalamaların kullanılmasından etkilenmeyecektir; fakat farklara

ait standart sapmanın tahmini oldukça küçük olacaktır. Çünkü bazı ölçüm

hatalarının etkisi ortadan kalkacaktır. Burada esas ilgilenilen, tekrarlı ölçümlerin

ortalamaları arasındaki farkların değil, tek ölçümler (single measurements)

arasındaki farkların standart sapmasıdır (Bland ve Altman, 1999). Ancak klasik

yaklaşımda, çoklu ölçümlerin kullanılması daha uygunken, standart klinik ölçümün

tek bir değer (single value) olduğu varsayılır. Örneğin, maksimum nefes alış hızı

(peak expiratory flow) gibi klinik çalışmalarda aynı denek üzerinden elde edilen iki

veya daha fazla tekrarlı ölçüme ait ortalamanın kullanılması alışılmış olandır ve bu

durumda uyum sınırları yöntemi ortalamalar üzerinde direk olarak uygulanır.

Tekrarlı ölçümler için iki farklı durum ele alınabilir. İlk durum, aynı denek

üzerinden elde edilen ölçüm değerlerinin deney süresi boyunca değişmemesi, yani

33

gerçek değerin değişmemesi durumudur. Bu duruma, aynı gün içinde alınan

şahdamarı arter daralması verileri örnek gösterilebilir. Bu gibi değerler, aynı gün

içersinde önemli bir değişim göstermezler. İkinci durum ise, deney süresince elde

edilen kan basıncı, vücutta günlük bazı kimyasalların salgılanması veya bir durumun

farklı koşullar altında öncesi ve sonrası ölçümleri gibi ölçüm değerlerinin sabit

olmaması, yani gerçek değerin değişmesi durumudur. Bu gibi değerler ise, anlık

değişimler gösterebilirler.

Yukarıda açıklanan ilk durum için her bir metot ile her bir denekten elde edilen

tekrarlı ölçüm sayısının eşit olması gerekliliği yok iken; ikinci durumda her bir

metot ile her bir denekten elde edilen tekrarlı ölçüm sayılarının eşit olması gerekir.

Bir sonraki bölümde, eşit sayıda tekrarlı ölçümler alınması ve eşit sayıda olmayan

tekrarlı ölçümler alınması durumları için uyum sınırlarının nasıl bulunduğu

anlatılacaktır (Bland ve Altman,1999; Bland ve Altman, 2007).

1.2.1.2.2.1.1. Gerçek Değerin Değişmediği Durumlarda Her Bir Denek

Üzerinden Eşit Sayıda Tekrarlı Ölçüm Elde Edilmesi Durumu

Her iki metot aracılığıyla aynı denek üzerinden tekrarlı ölçümler alındığında, her bir

metotla elde edilen ölçüm değerleri, yaklaşık olarak o denekten o metot ile elde

edilen ölçümlerin beklenen değeri (ortalaması) etrafında dağılır. Bu ortalamaların

her iki metot için de aynı olması şart değildir. Metotlara ait ölçümlerin ortalamaları

arasındaki fark denekten deneğe değişecektir. Bu değişkenlik metot x denek

etkileşimini meydana getirecektir. İki metoda ait ölçümler X ve Y ile gösterilecektir.

Burada, her bir metot aracılığıyla ölçülen tek ölçümler (single measurements)

arasındaki farka (D = X – Y) ait varyans ile ilgilenilecektir. Her bir metot için

varyans ayrı ayrı incelenecek olursa:

Var (X) = 222

xwxIt

Var (Y) = 222

ywyIt

34

Burada 2

t gerçek değerlere ait varyans, 2

xI ve 2

yI metot x denek etkileşimine ait

varyans, 2

xw ve 2

yw ise aynı metotla elde edilen ölçümlere ait grup içi varyansı

göstermektedir. Her bir metotla elde edilen tek ölçüm değerleri (single

measurements) için gruplar arası farklara ilişkin varyans ise aşağıdaki formül ile

bulunur:

22222)( ywxwyIxIDYXVar (1.9)

Bu varyans değerinin, her bir denek üzerinden elde edilen ölçümlere ait ortalamalar

( YXD ) kullanılarak elde edilmesi istenir ve böylece )( YXVar değerine

ulaşılabilir. Bu durumda, tekrarlara ait ortalamaların kullanılması nedeniyle grup içi

(within subject) varyans azalacaktır; fakat bu deneğe özgü (patient-specific) farkları

gösteren etkileşim terimini etkilemeyecektir. Böylece,

x

xwxIt

mXVar

222)(

bulunur.

Burada xm , X metoduyla elde edilen her bir deneğe ait gözlem sayısını

göstermektedir.

Benzer olarak,

y

yw

yItm

YVar

2

22)(

olur. Böylece,

35

y

yw

Iy

x

xwxI

mmDVarYXVar

2

22

2)()(

olarak elde edilebilir.

D ’nin dağılımı yalnızca hata ve etkileşime bağlıdır. Çünkü gerçek değerler, farkları

alınan X ve Y’nin her ikisini birden içermektedir. Her iki metotla her bir denekten

elde edilen ölçüm değerlerinin farklarına ilişkin varyans değerini bulmak için Eşitlik

1.9’dan aşağıdaki formül elde edilir:

22 11

11)()( yw

y

xw

x mmDVarYXVar

(1.10)

2

ds , grup-içi ortalamalar arasındaki farklara ait gözlenen varyans olduğunda,

düzeltilmiş varyans da denilen 2)( dYXVar değeri aşağıdaki Eşitlik 1.11 ile

tahmin edilir:

2222^ 1

11

1 yw

y

xw

x

dd s

ms

ms

(1.11)

Çalışmalarda yaygın olarak her bir metotla her bir denekten yalnızca iki ölçüm

değeri elde edilmesi nedeniyle Bland-Altman şu formülü öne sürmüştür:

22

222

2^ywxw

dd

sss

Standart hatanın yaklaşık olarak değeri ve uyum sınırları için güven aralığı

aşağıdaki gibi bulunur. Ölçüm hatalarının dağılımı normal dağılıma sahiptir ve

bağımsızdır. Ölçüm hataları, n denek için n( 22 /)1 xwxwx sm , n ( )1xm serbestlik

36

derecesi ile ki-kare dağılımına sahiptir ve bu nedenle 2n ( )1xm varyansa sahiptir.

Böylece,

)1(

2)(

42

x

xwxw

mnsVar

)1(

2)(

4

2

y

yw

ywmn

sVar

(1.12)

Eşitlik 1.11’de verilen düzeltme teriminin varyansı ise,

22 1

11

1 yw

y

xw

x

sm

sm

Var

)1(

211

)1(

211

42

42

y

yw

yx

xw

x mnmmnm

(1.13)

2

4

2

4 )1(2)1(2

y

ywy

x

xwx

nm

m

nm

m

(1.14)

olur.

Benzer olarak, 2

ds ’nin varyansı ise

1

2)(

4

2

nsVar d

d

(1.15)

olur.

Eşitlik 1.14 ve 1.15’de elde edilen değerler ile, Eşitlik 1.11’den elde edilen

denkleme ilişkin varyans,

2

4

2

442^ )1(2)1(2

1

2)(

y

ywy

x

xwxdd

nm

m

nm

m

nVar

(1.16)

37

elde edilir.

İyi bilinen,

)var()(

))((

2

)(

zdz

zdfzfVar

zEz

durumundan, aşağıdaki

2

)(2

1)(

zEzzzVar

)(

)(4

1)( zVar

zEzVar

sonucu elde edilir.

)(^

dVar için,

2

4

2

44

2

^ )1(2)1(2

1

2

4

1)(

y

ywy

x

xwxd

d

dnm

m

nm

m

nVar

=

2

4

2

44

2

)1()1(

12

1

y

ywy

x

xwxd

d nm

m

nm

m

n

(1.17)

Farklarının ortalamasının ( d ) varyansı nd

2^

olarak tahmin edilir ve ortalama ve

farkların standart sapması bağımsızdır. Bu tahminler Eşitlik 1.18’de yerine

konulacak olursa, uyum sınırlarının ( dd^

96.1 ) varyansı aşağıdaki formül ile

tahmin edilir:

2

4

2

44

2^

22^

^ )1()1(

12

96.1)96.1(

y

ywy

x

xwxd

d

dd

nm

sm

nm

sm

n

s

ndVar

(1.18)

38

2 yx mm olduğunda bu eşitlik aşağıdaki gibi olur:

n

s

n

s

n

s

ndVar

ywxwd

d

dd

4412

96.1)96.1(

444

2^

22^

^

1 yx mm olduğunda yani ölçümler tekrarlı olarak alınmadığında, d

^

’nin yerine

direkt ds ’nin tahmini kullanılır ve böylece tıpkı Bölüm 1.2.1.2.1’deki gibi,

12

96.1)96.1(

4

2

22^

n

s

sn

sdVar d

d

dd

=

)1(2

96.11 22

nnsd

olur.

Böylece,

)1(2

96.11)96.1(

22

^

nnsdSE dd

olur. Bu değerler uyum sınırlarının %95 güven aralıkları için de kullanılır.

Burada standart hatayı bulmak için kullanılan formül, Bölüm 1.2.1.2.1.’deki gibi

metotlar ile yalnızca tek bir ölçüm elde edildiğinde kullanılan formül ile benzerdir.

Tekrarlı ölçümlerin kullanılması yalnızca her bir metodun kesinliğinin (precision)

eksikliğinden ve metot x denek etkileşimi bileşeninden kaynaklanan varyansı bir

miktar azaltmaktadır. Eğer bu çok büyükse (yani eğer bir deneğe ait tekrarlı

ölçümlerin farkı çok fazlaysa), her bir denek üzerinden daha fazla tekrarlı ölçümün

alınması uyum sınırlarının kesinliğini arttırmayacaktır. Bu nedenle, her bir denek

39

üzerinden iki tekrarlı ölçüm alınması savunulur. Böylece, her bir metot ile her bir

denek üzerinden iki tekrarlı ölçüm alındığında metotların tekrarlanabilirliği daha

kolay incelenebilir.

1983 yılında Bland ve Altman tarafından yayınlanan makalede metot x denek

etkileşimi göz ardı edilmiştir; ancak yine Bland ve Altman tarafından 1999 yılında

yayınlanan makalede daha önce kullandıkları yaklaşımın yetersiz olduğunu kabul

edip, daha üstün olan bu yaklaşımı makalelerinde sunmuşlardır.

1.2.1.2.2.1.2. Gerçek Değerin Değişmediği Durumlarda Her Bir Denek

Üzerinden Eşit Sayıda Olmayan Tekrarlı Ölçüm Elde Edilmesi

Bu bölümde, her bir denek üzerinden farklı sayıda tekrarlı ölçüm alınması durumu

incelenecektir. X ve Y metodu ile i. denek üzerinden alınan ölçüm sayıları xim ve

yim notasyonları ile gösterilecektir. iW , ortalama ve 2 varyansa sahip olan

im gözlemin ortalaması olduğunda, varyans im/2 olacaktır. Bu durumda,

ortalamaların beklenen varyansı aşağıdaki gibidir:

211

)(

i

imn

WVar (1.19)

i.denek için, X metodu ile elde edilen xim gözlem; Y metodu ile elde edilen yim

gözlem vardır. Her bir denek için, iki metotla elde edilen ölçümlerin ortalamaları

arasındaki fark hesaplanır, ardından da bu farkların varyansları hesaplanır. Bu

varyansın beklenen değeri ise Eşitlik 1.20’deki gibi tahmin edilir:

2222 1111)( yw

yi

yIxw

xi

xImnmn

DVar

(1.20)

40

Böylece xxi mm ve yyi mm olduğunda, bulunan bu değerler Eşitlik 1.10’da

yerine konulursa aşağıdaki formül elde edilir:

22 111

111)()( yw

yi

xw

xi mnmnDVarDVar

(1.21)

Eşit sayıda tekrarlı ölçümler olmaması durumunda, kontrol edilmesi gereken ilk

varsayım, deneklere ait ortalamaların varyanslardan bağımsız olması durumudur.

Her bir metot için ayrı ayrı, denekler içi standart sapmaya karşı denek

ortalamalarının saçılım grafiği çizildiğinde ortalamalar ve varyanslar arasında bir

ilişki olmadığı gözlemlenebilir. Aynı şekilde, her bir denek için iki metodun

ortalamalarına karşı farklarının saçılım grafiği çizilebilir. Yine aynı şekilde

bağımsızlık varsayımı sağlanmalıdır. Metotların her biri için ayrı ayrı tek yönlü

varyans analizi kullanılarak 2

xw ve 2

yw bulunur. Bu durumda,

ximn

11 ve

yimn

11

birbirine eşit olur. Çünkü her bir denek dengelenir.

1.2.1.2.2.1.3. Gerçek Değerin Değiştiği Durumlarda Tekrarlı Ölçümler ile

Oluşturulan Eşleştirilmiş Çiftler

Bölüm 1.2.1.2.2.1.1 ve 1.2.1.2.2.1.2’de gerçek değerin değişmediği yani sabit

olduğu varsayılmıştı; ancak bazı durumlarda gerçek değerin sabit olması mümkün

değildir. Klinik çalışmalarda, kan basıncı gibi bazı değerler kısa zaman dilimleri

içinde bile değişiklik gösterebilir. Gerçek değerin çiftten çifte değiştiği durumlarda,

iki metot ile her bir denek üzerinden elde edilen ölçüm değerleri eşleştirilir ve

varyans bileşenleri yöntemi yardımıyla uyum sınırları elde edilir. Eşleştirilmiş her

41

bir ölçüm çiftinin farkları kullanılır. i.denek üzerinden j. ölçüm çiftinin farkı için

model,

ijiij EIBD

olur.

Bu modelde, B sabit yanlılık değerini, iI metot x denek etkileşim terimini, ijE ise,

ilgili ölçüm çiftinin için denek içi rastsal hatasını belirtmektedir. ijD ’nin varyansı

ise,

222

dwdId

dir.

2

dI ve 2

dw değerleri tek yönlü varyans analizi yöntemi yardımıyla tahmin edilebilir.

n denek ve i.denek için im tane gözlem çiftinin olduğu varsayılsın. Varyans analizi

sonucunda, denekler-içi ya da hatanın kareler ortalaması ( wMS ) ve denekler-arası

kareler ortalaması ( bMS ) elde edilir. Buradan, wdw MS2^

ve

wb

i

iidI MSMS

mn

mm

)1(

222^

olur. Bu tahmin değerlerinin toplamı ise 2^

d değerini verir. id i.denek için farkların

ortalaması olduğunda, ortalama yanlılık ( d ),

i

ii

m

dm olarak tahmin edilir.

Böylece, %95 güven düzeyinde uyum sınırları tahmin edilebilir.

42

1.2.1.2.3. Tekrar Elde Edilebilirlik (Reproducibility)

Tekrar elde edilebilirlik, farklı koşullar altında, aynı metot ile aynı denek üzerinden

elde edilen ölçüm değerlerinin değişiminin ya da kesinliğinin (precision) ölçüsüdür.

Tekrarlanabilirlik gibi tekrar elde edilebilirlik de tekrarlı ölçümler ile çalışıldığında

değerlendirilebilir (Carstensen, 2010). FDA (2001), tekrar elde edilebilirliği iki

farklı laboratuarda elde edilen ölçümlerin ya da kısa bir zaman periyodunda aynı

işlem koşulları altında metotlar ile elde edilen ölçüm değerlerinin kesinliği olarak

tanımlar. ISO (1994) ise, tekrar elde edilebilirliği, tekrar elde edilebilirlik koşulları

altında ölçümlerin aynı metotla aynı (identical) denekler üzerinden; ancak farklı

gözlemcilerin farklı donanımlar kullanarak farklı laboratuarlarda elde edildiği

bağımsız test sonuçları arasındaki uyumun yakınlığı olarak tanımlar.

Literatürde yaygın olarak ISO’nun tanımı kullanılır. Bu terim daha geniş bir şekilde

tanımlanacak olursa, tekrar elde edilebilirlik olası bütün koşullar altında, aynı

denekler üzerinden elde edilen ölçümler arasındaki uyumun yakınlığıdır. Bütün olası

koşullardan kasıt, pratikte farklı laboratuardan farklı gözlemciler vb. gibi somut

durumlar ile elde edilen ölçümlerdir. Ancak bir çalışmada tekrar elde edilebilirlik

değerlendirilmek isteniyorsa, ölçümler alınırken elde edilen ölçüm değerinin (kan

basıncı gibi) zaman içinde değişmediğinden emin olunmalıdır.

Tekrar elde edilebilirlik rastgele seçilen farklı laboratuar, farklı donanımlar vb.

arasındaki değişimi değerlendirir ve pratikte metot karşılaştırma çalışmalarında

nadiren kullanılır.

43

1.2.1.3. Ölçeklendirilebilen Uyum İndisleri (Scaled Summary Indices)

1.2.1.3.1. Sınıf-İçi Korelasyon Katsayısı (Intraclass Correlation Coefficient)

Güvenilirlik (reliability), bir ölçümün rastsal hatadan arınmış olması, ölçümlerin

tekrarlanabilirliği ya da tekrarlı ölçümlerin tutarlılığı olarak tanımlanır. Yani aynı

koşullar altında, aynı ölçüm metodu ya da gözlemci ile aynı denekten alınan tekrarlı

ölçümlerin aynı yanıtı vermesi ölçümün güvenilir olmasının koşuludur.

Bland ve Altman’ın 1996 yılında yayınladıkları makalede bir ölçüm metoduna ait

güvenilirlik, o metot ile elde edilen tekrarlı ölçümler arasındaki korelasyon olarak

tanımlanmıştır (Bland ve Altman, 1996).

Sağlık bilimlerinde, daha çok gözlemci uyumunun incelendiği güvenilirlik

çalışmalarına sıkça rastlanmaktadır; ancak bu çalışma, metotlar arasındaki uyum

incelendiğinden gözlemci yerine metot uyumunun güvenilirliğine dair bir çalışma

olacaktır.

Bu tür çalışmalarda en temel amaç, aynı denekten elde edilen çoklu ölçümlerin

uyumunun değerlendirilmesidir. Bir denekten elde edilen çoklu ölçüm, aynı metot

ile alınan tekrarlı ölçümler olabileceği gibi, iki ya da daha fazla sayıda metot ile

alınan ölçümler de olabilir (Çizelge 1.1). Ölçümler sürekli olduğunda, ilk durumda,

metot-içi uyum, ikinci durumda ise metotlar-arası uyum, sınıf içi korelasyon

katsayısı (SKK) ya da uyum ilişkisi katsayısı kullanılarak değerlendirilir (Ateş ve

ark., 2009).

SKK aynı sınıfa ait ölçümler arasındaki ilişki miktarını belirlemek amacıyla

geliştirilmiştir. Örneğin, bir batında doğan yavruların ağırlıkları (g) arasındaki ilişki,

ikizlerin IQ değerleri veya kan basınçları arasındaki ilişkinin ölçümünde SKK

kullanılır.

44

SKK, toplam varyansın grup-içi ve gruplar-arası varyans olarak ayrılması ile elde

edilen varyans tahminlerinin kullanılarak elde edildiği bir korelasyon katsayısıdır

(Bruton ve ark., 2000). En temel tanımıyla SKK, deneklerden elde edilen ölçümlere

dayanan varyansların oranıdır ve aynı sınıfa ait ölçümler arasındaki ilişki miktarını

belirlemek amacıyla geliştirilmiştir (McGraw ve Wong, 1996).

Çizelge 1.1. Sınıf içi korelasyon katsayısının hesaplanmasında kullanılan veri seti

için uygun notasyonel veri seti

22

2' )(

DİDA

DAijij yycorrSKK

(1.22)

Bu eşitlikte kullanılan, 2

DA ; denekler arası varyansı, 2

Dİ ; denekler içi varyansı

ifade etmektedir.

Üzerinde çalışılan veri, Çizelge 1.1’de de gösterildiği gibi, n değerlendirilen birim

(denek) ve değerlendirilen birimler hakkındaki k farklı değerlendirmeden

oluşmaktadır. Değerlendirilen birimlerin daha geniş bir populasyondan rastgele

seçilmiş bir örneklem olduğu varsayılarak SKK’nın tahmini değeri, bu veriye

uygulanan varyans analizi sonucunda elde edilen kareler ortalamasına

dayandırılmaktadır (McGraw ve Wong, 1996).

45

Temelleri ilk olarak Fleiss ve Shrout tarafından atılan SKK’nın farklı deney

düzenlerinde kullanılmak üzere geliştirilmiş çok sayıda türü bulunmaktadır. Buna

bağlı olarak, çalışmanın tasarımı, amacı ve ölçümlerin elde edilme şekline bağlı

olarak SKK hesaplamasında kullanılan farklı formüller mevcuttur.

1.2.1.3.1.1. Çalışmanın Tasarımına Göre SKK Tahminleri

En uygun SKK’nın seçimi için verilmesi gereken ilk karar, veri setinin tek yönlü ya

da iki yönlü varyans analizi modellerinden hangisi kullanılarak değerlendirileceğidir

(Ateş ve ark., 2009). İlgilenilen veriye tek ya da iki yönlü varyans analizi

uygulanmasına göre uygun korelasyon katsayısı seçilmektedir. Tek ya da iki yönlü

varyans analizinden hangisinin kullanılacağına Çizelge 1.4’te verilen durumlar

yardımıyla karar verilir.

SKK çalışmalarında, denek faktörü her zaman rastgele faktör olarak

değerlendirilirken; metotların, metotlar popülasyonundan rastgele olarak seçildiği ya

da sabit olduğu varsayılır. Metot karşılaştırma çalışmalarında, karşılaştırılacak

metotlar, çalışılan konuya özel metotlar olduğundan herhangi bir metotlar

havuzundan rastgele seçilemez; yani karşılaştırılmak istenen rastgele olarak seçilmiş

iki metot değil, özel olarak belirlenmiş (fixed) iki metottur. Klasik SKK

çalışmalarında modelde her bir metoda ait ölçüm hatası aynı varsayılır ki bu hem

çok güçlü bir varsayımdır hem de gerekçesi, dayanağı yoktur (Bland ve Altman,

1990).

Bu durumda şöyle bir çıkarım yapılabilir; SKK çalışmalarında gözlemci uyumu ile

ilgileniliyorsa, gözlemcinin etkisi modelin tanımlanmasında etkili olur. Eğer

gözlemcinin etkisi rastgele ise, “rastgele etki modeli”, sabit ise “karma etki modeli”

olarak tanımlanır. Ancak metot etkisi rastgele olamayacağından, bu tez

çalışmasında yalnızca iki yönlü karma etki modeli incelenecektir.

46

1.2.1.3.1.1.1. İki Yönlü Karma Etki Modeli

İki yönlü karma etki modeli, n sayıda denek, k sayıda metot ile değerlendirilir. Her

bir denek üzerinden, çalışma için belirlenmiş olan k tane metodun her biri ile en az

bir ölçüm alınır. Metot etkisinin sabit; yani metot havuzundan rastgele seçilmediği

ve denek etkisinin rastgele olduğu varsayılır. Bu durumda, SKK’yi tanımlamak için

iki yönlü karma etkili ANOVA modeli kullanılır (Barnhart, 2006):

ijjiij hmdX i = 1,2,…,n; j= 1,2,….,k (1.23)

Bu eşitlikte, , tüm ölçümler için kitle ortalamasını, id denek etkisini, jm metot

etkisini, ijh ise hata terimini gösterir. id bileşeninin, modeldeki diğer bileşenlerden

bağımsız olduğu, 0 ortalama ve 2

d varyansı ile normal dağıldığı varsayılır. Hata

teriminin ( ijh ) ise, bağımsız olduğu, 0 ortalama ve 2

h varyans ile normal dağıldığı

varsayılır. 0jm kısıtı altında

k

j

jm km1

22 )1/( ’dir (Shrout ve Fleiss, 1979 ).

Çizelge 1.2. Varyans analizi modelleri için varyans bileşenleri

McGraw ve Wong’un 1996 yılında yayınladıkları “Forming Inferences About Some

Intraclass Correlation Coefficient” makalesinde etkileşim faktörü çalışmaya dahil

Değişim Kaynağı Serbestlik Derecesi Kareler Ortalaması Beklenen Kareler

Ortalaması

Denekler arası (DA) n-1 DAKO 22

hdk

Denekler içi (Dİ) n (k-1) Dİ

KO 22

hm

Metotlar arası (MA) k-1 MAKO 22

hmn

Hata (n-1) (k-1) HATAKO 2

h

47

edilmişse de; bu tez çalışmasında, modeller elde edilirken, denek x gözlemci

etkileşiminin etkisi ihmal edilecektir.

İki yönlü karma etki modeli için SKK;

Her bir metotla tek bir ölçüm alındığında,

222

2

)1,3(hmd

dSKK

(1.24)

Her bir metotla tekrarlı ölçümler alındığında,

k

kSKKhmd

d

/)(),3(

222

2

(1.25)

olarak hesaplanır.

SKK değeri,

k metot ya da gözlemci için [-(1/(k-1)), +1]

2 metot ya da gözlemci için [-1, +1]

arasında olmalıdır.

Metotların uyumunu değerlendirmek için bulunan SKK değerleri Çizelge 1.3

yardımıyla yorumlanabilir.

48

Çizelge 1.3. SKK’nın kabul edilebilir seviyeleri

Sınıf içi korelasyon değeri Kabul edilebilir seviye

1.00 – 0.95 mükemmel uyum

0.94 – 0.85 yüksek uyum

0.84 – 0.70 orta düzeyde uyum

0.69 – 0.00 kabul edilemez düzeyde uyum

SKK’nin önemlilik testi 0’a karşı 0F istatistiği kullanılarak yapılır. N denek sayısı

olduğunda, [(N-1), (N-1)] serbestlik derecesi ileHATA

DA

KO

KOF 0 olarak hesaplanır

(Bartko, 1994).

)(SKK ’ye ait )1( % güven aralığı için,

)]1(),1(;/[ 2/10 NNFFFalt

)]1(),1(;[ 2/10 NNFFFüst

olur ve güven aralığı,

]1/[)1()(]1/[)1( üstüstaltalt FFSKKFF

olarak hesaplanır.

1.2.1.3.1.2. Çalışmanın Amacına Göre SKK Tahminleri

SKK tahminleri, ilişkinin “tutarlılık (consistency)” ya da “mutlak uyum (absolute

agreement)” olarak değerlendirilmesine bağlı olarak değişir. İki yönlü modellerde

tutarlılık ve mutlak uyumun her ikisini de temel alan SKK tahminleri elde edilebilir.

Tutarlılık ve mutlak uyum arasındaki kavramsal fark, ölçümlerden veya metotlardan

kaynaklanan sistematik değişkenliğin nasıl değerlendirildiği ile açıklanır. Mutlak

49

uyum için SKK hesaplanırken, metotlar arasındaki sistematik değişkenlik dikkate

alınır ve SKK formülünün paydasına metot varyansı, yani metotların ana etkisi

eklenir. Bu şekilde elde edilen SKK, “mutlak uyum” olarak değerlendirilir. Ancak

metotlar varyans kaynağı olarak kabul edilmiyorsa, SKK formülünün paydasında bu

değişkenliğe ilişkin varyans yer almaz ve elde edilen SKK, “tutarlılık” ölçümü

olarak değerlendirilir. (McGraw ve Wong, 1996; Ateş ve ark., 2009).

2222

2

) (hmmd

duyummutlakSKK

(1.26)

Mutlak uyumun değerlendirildiği çalışmalarda, aynı metot ile elde edilen tekrarlı

ölçümlerin ya da farklı metotlar ile elde edilen ölçümlerin tamamen aynı olması

istenir. Tutarlılığın değerlendirildiği çalışmalarda ise, elde edilen SKK tahminleri

toplanabilirlik indeksidir ve bu indeks bir değişkenin (y) bir diğer değişkene (x) bir

diğer sabit ile (y=x+b) eşitlenmesinin derecesini ölçer.

1.2.1.3.1.3. Kullanılan Ölçümlerin Elde Edilme Biçimine Göre SKK Tahminleri

SKK hesaplanırken temel olarak tekrarlı ölçümler ve tekrarlı olmayan ölçümler

olmak üzere tasarlanmış iki plan vardır. Her bir metot ile yalnızca bir ölçüm değeri

elde ediliyorsa, yani metotlar arasındaki uyum tek bir ölçüm değerine göre

inceleniyorsa “tek (single)”, her bir metot ile her bir denekten çoklu ölçüm alınıp

ortalama değerleri üzerinden uyum inceleniyorsa, “ortalama (average)” seçeneği

kullanılmalıdır. Ortalamalar ile uyum inceleniyorsa, sonuçlar tek ölçüme göre daha

güvenilir olur. Bunun sebebi, çoklu ölçümler ile elde edilen sonuçların daha

güvenilir olmasıdır. Ortalama seçeneğine bağlı olarak SKK tahmini yapılırken,

denekler içi varyans terimi, kullanılan ölçüm sayısına bağlı olarak düzeltilir.

Tek ölçüm güvenilirliği ile ortalama ölçüm güvenilirliği arasında şöyle bir bağıntı

vardır:

50

1)1(

tek

tekortalama

rk

krr (1.27)

Bu bağıntı Spearman-Brown kestirim formülü olarak adlandırılır. Burada, tekr tek

ölçüm güvenilirliğini, ortalamar ise ortalama ölçüm güvenilirliğini göstermektedir. Bu

formülden k çekildiği zaman;

)1(

)1(

tekortalama

ortalamatek

rr

rrk

(1.28)

elde edilir. Bu formülde k, ortalama ölçüm (average measure) için güvenilirliğinin,

güvenilir bir şekilde hesaplanması için uygun olan tekrar sayısını vermektedir.

Ayrıca bu formülde yer alan tekr ve ortalamar ya geçmiş çalışmalardan yararlanılarak

ya da bir pilot çalışmadan yararlanılarak hesaplanır (McGraw ve Wong, 1996).

Bu bölümde, çalışmanın tasarımına, amacına ve ölçümlerin elde ediliş biçimine göre

hesaplanabilecek olası farklı SKK tahminleri özet olarak tabloda gösterilmiştir.

51

Çizelge 1.4. Çalışmanın tasarımına, amacına ve ölçümlerin elde edilme biçimlerine

göre hesaplanabilecek farklı SKK türleri

SKK

Türleri

Tanım

SKK(3,1) C Her bir metot ile her denekten ölçüm alınır. Metot etkisi sabittir.

SKK, tek bir ölçüm kullanılarak hesaplanır.

Tutarlılık tanımına göre SKK hesaplanır.

SKK(3,1) A Her bir metot ile her denekten ölçüm alınır. Metot etkisi sabittir.

SKK, tek bir ölçüm kullanılarak hesaplanır.

Mutlak uyum tanımına göre SKK hesaplanır.

SKK(3,k) C Her bir metot ile her denekten ölçüm alınır. Metot etkisi sabittir.

SKK, “k” ölçümün toplamı ya da ortalaması kullanılarak elde

edilir.

Tutarlılık tanımına göre SKK hesaplanır.

SKK(3,k) A Her bir metot ile her denekten ölçüm alınır. Metot etkisi sabittir.

SKK, “k” ölçümün toplamı ya da ortalaması kullanılarak elde

edilir.

Mutlak uyum tanımına göre SKK hesaplanır.

Bu tabloda SKK değerlerine ilişkin ilk terim model türünü (3: İki yönlü karma etki

modeli), ikinci terim kullanılan ölçümlerin elde edilme biçimini (1: tek ölçüm, k:

toplam/ortalama ölçüm) göstermektedir. SKK (*,*) C , tutarlılık tanımına göre; SKK

(*,*) A ise mutlak uyum tanımına göre hesaplanan SKK tahminini ifade etmektedir

(Ateş ve ark., 2009).

Literatürde, metot içi ve metotlar arası uyumu değerlendirirken en sık kullanılan

güvenilirlik ölçütü SKK’dır ve SKK tahminleri MEDCALC, SPSS gibi paket

programlar yardımıyla kolaylıkla hesaplanabilir.

52

1.2.1.3.2. Concordance Korelasyon Katsayısı (Concordance Correlation

Coefficient)

Metot karşılaştırma çalışmalarında uyumu değerlendirmek için sıkça kullanılan

yöntemlerden biri de Concordance korelasyon katsayısıdır (CKK). CKK ilk olarak,

Lin (1989) tarafından sürekli veriler kullanıldığında metotlar arasındaki uyumu

değerlendirmek amacıyla geliştirilmiştir. Son zamanlarda çıkan makalelerde;

örneğin, Chinchilli ve arkadaşları (1996) metot karşılaştırma ve tekrarlanabilirlik

çalışmaları için Concordance korelasyon katsayısını önermişlerdir. Ayrıca Zar

(1996) çalışmasında, Concordance korelasyon katsayısının, t testine, Pearson

moment çarpım korelasyon katsayısına, regresyon ve varyasyon katsayısına göre

olan üstünlüklerine değinmiştir. Lin (1989)’de, CKK’nin asıl avantajının metot

karşılaştırma ve tekrarlanabilirlik çalışmalarında sistematik yanlılığı ve rastgele

hatayı göz önüne alması olduğunu ileri sürmüştür. (Atkinson ve ark., 1997).

Metot karşılaştırma ve tekrarlanabilirlik çalışmalarında korelasyon katsayısının

kullanılması en geniş olarak Bland ve Altman (1986, 1995) tarafından eleştirilmiştir.

Bunun yanında, SKK’nın kullanılması ise denekler arasındaki değişkenliğin

tamamını ölçmesi ve doğruluğu (ölçmek) konusunda yetersiz olması nedeniyle

Atkinson (1995), Lin (2001), Barnhart ve Williamson (2001) tarafından

eleştirilmiştir. Bu yöntemlerle ilgili esas problem, örneklem heterojenliğine çok

duyarlı olmalarıdır. Bu durumda, geniş varyasyonlu bir örneklemde, çok yüksek

değerli r elde etmek çok kolay olur. Heterojenlik uyum çalışmalarında çok sık

karşılaşılan bir problemdir. Çünkü araştırmacılar metodun sonuçlarını değişkenin

tüm değişim aralığında denemek isterler. Örneğin, Chinchilli ve arkadaşları (1996)

tarafından verilen örnekte kolestrolün dağılım genişliği 50 ile 350 mg/dl arasındadır.

Heterojenliğe karşı olan bu duyarlılık, biyolojik ölçüm araçlarının geçerlilik ve

tekrarlanabilirliklerinin yanlış ölçülmesine sebep olur. SKK ve CKK arasındaki en

belirgin farklardan biri de, CKK’nin metotlar ile elde edilen ölçümlerin yerlerinin

değiştirilemediği durumlarda kullanılmasıdır. Ancak, iki yönlü karma modelde,

mutlak uyuma ilişkin SKK, CKK ile benzer sonuçlar verir (Atkinson ve ark., 1997;

Bland ve Altman, 1986, 1995; Corrasco ve Jover, 2003, Lin 1983 ).

53

CKK, kesim noktasının sıfır olduğu ve eğimin “1” olduğu kısıtları altında aynı ölçek

ile ölçülmüş X ve Y değişkenleri arasındaki doğrusal (lineer) ilişkiyi; yani her bir

ölçüm çiftinin 045 ’lik açı ile çizilen doğruya olan uzaklığını değerlendirir. CKK’yi,

Pearson korelasyon katsayından ayıran bu kısıttır. Pearson korelasyon katsayısında

böyle bir kısıtlama yoktur (Lin, 1989; Chichilli ve ark., 1996).

Her bir metot ile elde edilen ölçümler Y 1i ve Y 2i (i=1, 2, …, n); metotlara ait

ölçümlerin ortalama vektörü ),( 21 ve kovaryans matrisi,

2

2

2

12

2

12

2

1

ile normal dağılımdan bağımsız olarak seçilmiş örnek çiftleri olsun. Lin (1989), X

ve Y arasındaki uyumun derecesi farkların karelerinin beklenen değeri

]))[(( 2

21 YYE ile karakterize etmiştir.

)2(])[( 12

2

2

2

1

2

21

2

21 YYE

21

2

21

2

21 )1(2)(

Bu formülde, , Pearson korelasyon katsayısıdır. Bu ifade aynı zamanda 045 ’lik

doğrudan dikey farklılıkların karelerinin beklenen değerlerine eşittir. Eşitlik

çizgisinden herhangi bir ayrılış 1^

C olmasına neden olur (Lin, 1989).

Buna göre CKK ( C ),

bC CYYYYE

YY

2

21

2

2

2

1

12

21

2

21

21

)(

2

),cov(2])[(

),cov(2 (1.29)

54

olarak formüle edilir. Bu formülde, )( 11 YE , )( 22 YE , )var( 11 Y ,

)var( 22 Y ve ),cov( 2112 YY ’dır. C , +1 ve –1 arasında değişir. -1, negatif

yönlü mükemmel bir uyumu ifade ederken; 0, uyumun olmadığını; +1 ise, pozitif

yönlü mükemmel uyumu ifade eder.

12 ]2/)/1[( uCb

21 /

2121 /)( u

dir. bC , “yan düzeltme faktörü ” olarak adlandırılır ve eşitlik doğrusunun regresyon

denkleminden elde edilen doğruya uzaklığının ölçüsü olarak tanımlanır. bC ’ye

doğruluk ölçüsü (measure of accuracy) de denebilir ve 0 ile 1 arasında ( 10 bC )

değer alır. bC =1 olması, eşitlik doğrusundan ayrılış olmadığı anlamına gelmektedir.

Eşitlik doğrusundan herhangi bir ayrılış 1 olsa bile 1C olmasına neden olur

(Lin, 1989).

CKK ( C ), aşağıdaki özellikleri taşır:

-1 ile +1 arasında değer alır ve Pearson korelasyon katsayısının mutlak

değerinden daha büyük bir değer alamaz. Yani, 11 c

Pearson korelasyon katsayısının sadece sıfıra eşit olduğu bir durumda

CKK’da sıfıra eşit olacaktır.

Ortalamalar ve varyanslar birbirine eşit ise, C , Pearson korelasyon

katsayısına eşit olur. Yani, YX ve YX olduğu durumda C

olur.

Sadece aşağıdaki durumlarda 1C olur.

01222

YXYXYX ya da

1 , YX ve YX ya da

55

Metotlar ile elde edilen ölçüm çiftleri arasında mükemmel bir uyum

(örneğin, 1, 1; 2, 2; 3, 3; 4, 4; 5, 5) var ise 1C veya mükemmel

ters yönde bir ilişki (örneğin, 5, 1; 4, 2; 3, 3; 2, 4; 1, 5) var ise

1C olur.

n bağımsız örneklem çifti için, C ’nin örneklem tahmini,

2

212

2

2

1

12^

)(

2

YYSS

Sc

(1.30)

olur. Bu formülde,

n

i

ijj Yn

Y1

1,

2

1

22 )(1

i

jijj YYn

S , j= 1, 2 (1.31)

ve

n

i

ii YYYYn

S1

221112 ))((1

(1.32)

dir.

C ile ilgili istatistiksel çıkarsama yapabilmek için, Lin (1989) iki değişkenli

normal dağılım gösteren örneklemler için ters hiperbolik tanjant dönüşümünün (ya

da Z dönüşümünün) kullanılmasını önerir. Z dönüşümü,

C

CCZ

1

1ln

2

1)(tanh 1

(1.33)

şeklinde elde edilir.

56

Z’nin ^

Z kestirimini bulmak için, C ’nin yerine ^

C konulur. ^

Z transformasyonu

yapılmasının sebebi, ^

Z ’nin, ^

C ’den daha iyi asimtotik özellikler taşımasıdır. Lin

(1989), ^

Z ’nin asimtotik varyansını aşağıdaki gibi tanımlar:

222

44

22

23

22

222

)1(

2

)1(

)1(4

)1(

)1(

2

1^

C

C

C

CC

C

C

Z n

(1.34)

Bu formülde, 21

12

ve

4/1

21

21 )(

’dir. Z için asimtotik %100(1- )

güven aralığı,

),(),( 2/1,2

^^

2/1,2

^^^^^^

nZnZUL tZtZZZ

olur.

Metotların uyumunu değerlendirmek için bulunan CKK değerleri Çizelge 1.5

yardımıyla yorumlanabilir.

Çizelge 1.5. CKK’nın kabul edilebilir seviyeleri

Concordance korelasyon değeri Kabul edilebilir seviye

> 0.99 mükemmel uyum

0.95 – 0.98 yüksek uyum

0.90 – 0.94 orta düzeyde uyum

< 0.89 kabul edilemez düzeyde uyum

57

1.2.1.3. Regresyon Yöntemleri

Klinik çalışmalarda, ele alınan iki metot arasındaki uyumu araştırmada yaygın

olarak kullanılan yöntemlerden birinin de regresyon yöntemi olduğu dikkat

çekmektedir. Ele alınan iki metotla elde edilen ölçümler dikkate alındığında,

metotlardan herhangi birisi bağımlı, diğeri bağımsız değişken olarak düşünülür. Bu

durumda, klasik regresyon yaklaşımında En Küçük Kareler (EKK) yöntemi

varsayımına göre bağımsız değişkenin herhangi bir ölçüm hatası içermediği, yani

standart sapmasının sıfır olduğu, ortaya çıkan hataların bağımlı değişken olarak

seçilen metottan kaynaklandığı ve bağımlı değişkene ait standart sapmanın ölçüm

aralığı boyunca sabit olduğu varsayılmaktadır ve regresyon denklemindeki eğim

katsayısı sıfıra karşı sınanmaktadır. Ancak, her iki metot ile elde edilen ölçümlerin

de hata içermesinin mümkün olabileceği düşünüldüğünde, klasik regresyon analizi

yaklaşımının araştırmayı yanlış sonuçlara götürmesi kaçınılmaz olacaktır. Bu

noktadan yola çıkılarak, yani her iki metot ile elde edilen ölçümlerin de hata

içerebileceği düşünülerek kurulan regresyon modelleri, literatürde “Tip II regresyon

modelleri” olarak ifade edilmektedir ve bu tez çalışmasında Tip II regresyon

modellerinden olan Deming Regresyon ve Passing-Bablok yöntemleri

incelenecektir.

1.2.1.3.1. Deming Regresyon

Adını Alman araştırmacı Edwards Deming’dan alan bu yöntemin temelleri,

Deming’in 1943 yılında yazdığı “Statistical Adjustment of Data” isimli kitabında,

En Küçük kareler (Ordinary Least-Squares) regresyon yönteminin eksik yanlarını

ele alması ile atılmıştır. Bu yöntem, X ve Y değişkenlerinden hangisinin bağımlı

değişken olarak alınacağının bilinmediği durumlarda, her iki değişkendeki hataların

da dikkate alınması gerektiğinin vurgulanması üzerine geliştirilmiştir.

58

Klinik çalışmalarda son yıllarda oldukça önerilen bir yöntem de Tip II regresyon

yöntemlerinden biri olan Deming regresyondur. Deming (1943) çalışmasında her iki

değişkenin de hatalı ölçümlere sahip olması durumunda gözlem değerlerine en iyi

uyacak doğru denklemini verecek fonksiyonun minimize edilmesini önermiştir.

EKK analizinde Şekil 1.10’te de görüleceği gibi sadece bağımlı y değişkenine ilişkin

hata

n

i

ii

n

i

yyD1

2^

1

2 minimize edilmeye çalışılıp en uygun regresyon

doğrusunu bulmak için 0b (eğim) ve 1b (kesim) noktası bulunur (Cornbleet ve

Gochman, 1979).

xbby 10 (1.35)

Deming regresyon tekniğinde her iki değişkenin içerdiği hatalar eş zamanlı olarak

minimize edilmeye çalışılır. Deming regresyon ve EKK regresyon arasındaki fark

Şekil 1.10’teki grafikte de açıkça görülebilir. Deming regresyon tekniğinde

minimize edilmek istenen HKT değeri Eşitlik 1.35’teki gibi hesaplanır.

2^

2^

)()( iiii YYXXHKT (1.36)

Deming regresyona ait regresyon doğrusunu kestirmek için Eşitlik 1.36’da görülen

değerinin bilinmesi gerekir. değeri, karşılaştırılacak olan iki metodun

varyansları oranıdır. Bu değer Eşitlik 1.37’de görüldüğü gibi hesaplanır.

2

2

ey

ex

S

S (1.37)

Bu formülde 2

exS ve 2

eyS sırası ile X ve Y metotları ile elde edilen ölçüm değerlerine

ilişkin hataların varyanslarıdır.

59

Deming regresyon yönteminde, X ve Y metotlarının hataların Gaussian (normal)

dağıldığı varsayılır.

Deming regresyon yöntemi kullanılarak metotlar karşılaştırılmak isteniyorsa ilk

olarak değeri bilinmelidir. , sapmanın karesinin toplamlarını doğru üzerinde

minimize ederek açının belirlenmesine olanak sağlar. Deming regresyon

yönteminde, her iki metot ile elde edilen ölçümlerin standart sapması önemli ölçüde

birbirinden farklı olabilse de, simgesi ile gösterilen iki varyansın oranı sabit

(nonconstant) kabul edilmiştir. Varyans oranlarının sabit olduğu varsayıldığında, bu

tekniğe Standartlaştırılmış Temel Bileşenler Analizi denir (Linnet, 1993).

Ancak metot karşılaştırma çalışmalarında bazı durumlarda araştırmacı

karşılaştırılacak X ve Y metotlarının her ikisi hakkında da bilgi sahibi olmayabilir

ve bu metotlar ile elde edilen ölçüm değerlerinin varyansının hangisinin payda

hangisinin paydada olacağını bilemeyebilir. Bu durumda, araştırmacı değerini 1

olarak alır. Buna ek olarak her bir metot ile tek bir ölçüm elde edilmesi durumunda

da genellikle değeri 1 alınır. değerinin 1 olarak ele alınması durumunda

Optimal Deming Regresyon yöntemi söz konusu olmaktadır. =1 olduğunda Şekil

1.10’teki gibi bahsedilen açı 090 olur (Linnet, 1998; Saraçlı, 2008).

60

Şekil 1.10. Deming Regresyon ve EKK regresyon yöntemlerinde hata değerlerinin

minimize edilmesi

Lamda değeri 1’e eşit olduğunda, yani her bir metot ile elde edilen ölçüm

değerlerinin varyansı sabit olduğunda, gözlem noktasının doğruya olan dik uzaklığı

söz konusu olmakta ve bu durumda gözlem değerlerinden regresyon doğrusuna

çizilen dikey ve yatay uzaklıklar sonucunda oluşan üçgen ikizkenar dik üçgen

olmakta, bu da Deming regresyon sonuçlarının ortogonal regresyon yöntemi ile aynı

olduğu anlamına gelmektedir (Saraçlı, 2008; Saraçlı,ve ark., 2009).

Deming regresyonda, x ve y değişkeni için ayrı ayrı hata değeri

2^

ii xxA ve

2^

ii yyB şeklinde bulunur. Bu durumda, 22 BAC olur (Cornbleet ve

Gochman, 1979).

Deming regresyon yönteminde, tahmin edilmek istenen regresyon denklemine ait

eğim katsayısı olan 1 , Eşitlik 1.27 yardımı ile elde edilmektedir.

61

p

pquuq

2

4 22

1

(1.38)

Bu formülde,

2

xxu i

2

yyq i

))(( yyxxp ii

olarak elde edilir.

Kesim noktası olan 0 katsayısı ise EKK regresyon yöntemine benzer bir şekilde

Eşitlik 1.39’daki gibi elde edilir.

xy 10 (1.39)

Deming regresyonda, sabit terim ve eğim katsayısı için sunulan genel

formülasyonlar pratikte oldukça karışıktır. Eğim ve kesim noktasına ait standart

hatanın tahmini için ise birçok prosedür önerilmektedir. Eğim ve kesim noktaları ile

bu değerlerin standart hatalarının hesabı için normal dağılım varsayımının

sağlanmasına gerek duyulmayan, yani parametrik olmayan bir yöntem olan Jacknife

gibi bilgisayar tabanlı bir yöntem kullanılabilir (Linnet, 1993).

Tez çalışmasının bu bölümünde, literatürde en sık rastlanan EKK regresyon

yönteminin metot karşılaştırma çalışmalarında kullanılması durumunda hatalı

sonuçlar verebileceği üzerinde durulmuş; yerine Deming regresyon yönteminin

kullanılmasının avantajları sunulmuştur.

62

1.2.1.3.2. Passing - Bablok Yöntemi

Passing-Bablok regresyon yöntemi parametrik olmayan Tip II regresyon

yöntemlerinden biridir ve diğer Tip II regresyon yöntemleri gibi her iki metot ile

elde edilen ölçümlerin bir miktar hata ile elde edilebileceği ihtimalini göz önünde

bulundurur. Parametrik olmayan bu yöntem ile ilgili hesaplamalar ölçüm

değerlerinin sıra numaralarına bağlı olarak yapılır ve test metodu ile referans metot

(X ve Y metotları) ile elde edilen verilerin bağımsız olduğu varsayılır (Magari,

2002).

Passing ve Bablok (1983), eğim ve kesim noktasının tahminini aşağıdaki eşitlikler

yardımıyla yapmıştır. n tane ),( ii yx ölçüm çifti olduğunda ve ),( ii YX ise bu

değerlerin beklenen değerleri olduğunda,

ji

ji

ijxx

yyb

nji 1 (1.40)

ve sırasıyla X ve Y metotlarıyla elde edilen ölçüm değerlerinin aynı dağılımdan

gelen rastsal hata değerleri olmak üzere, elde edilmek istenen Passing-Bablok

regresyon denklemine ilişkin eğim katsayısı ve kesim katsayısı Eşitlik 1.41 -

1.43’ten yararlanılarak hesaplanır (Passing ve Bablok, 1983):

jiji

jiji

ijXX

YYb

ii XY 10 ve jiij XXd

olduğundan,

63

bd

bd

bd

bdb

ji

ij

ji

ij

jiij

jiij

ij )(

)(

)(

)(

(1.41)

ijz ve ijz , bağımsız ve aynı dağılımdan gelen hata değerlerini göstermektedir.

KN

KN

KN

bb

b

122

2

1

1

.2

1

ise sayıçift N ,

ise sayı tek , N

(1.42)

Bu formülde N örneklem genişliği, K ise 1ijb olan ijb değer sayısıdır.

Bu yöntem ile elde edilecek regresyon denklemine ait sabit terim )( 0 aşağıdaki

eşitlik yardımıyla bulunur (Saraçlı ve Çelik, 2011).

ii xymed 10 (1.43)

n tane ),( ii yx ölçüm çifti olduğunda ve ),( ii YX ise bu değerlerin beklenen

değerleri olduğunda,

ii XY 10 veya ii BYAX (1.44)

Yukarıda 0 ve 1 ’in tahmin edicisi olan değerler aşağıdaki özellikleri gösterir

(Passing ve Bablok, 1983):

ijij

ijij

zd

zdb

64

1

1

B ve

1

0

A

Bu yöntemin uygulamada verdiği sonuçlar incelendiğinde, Deming regresyon

yöntemi kadar etkili olduğu söylenemez (Saraçlı, 2008).

Bu tez çalışmasının amacı, klinik araştırmalarda referans metot yerine önerilen test

metodunun ölçüm değerlerinin, referans metot ile elde edilen ölçüm değerleri ile

uyumunun uygun istatistiksel yöntemler kullanılarak değerlendirilmesidir. Bu

istatistiksel analizler sonucunda, karşılaştırılan metotların değişimli olarak birbirleri

yerine kullanılabileceği ya da test edilen metodun kullanılabilir olduğu sonucuna

varılır.

65

2. GEREÇ VE YÖNTEM

2.1. Uygulama Verisi

Çalışmamızda iki ayrı veri seti üzerinde uygulama yapılmıştır. Bu verilerin elde

edildiği metotların birbirleriyle ne derece uyumlu sonuçlar verdiğini bulmak için

Bland-Altman yöntemi, Sınıf-İçi Korelasyon Katsayısı, Concordance Korelasyon

Katsayısı, Deming Regresyon ve Passing-Bablok Regresyon Yöntemleri

kullanılmıştır.

Veri 1. Her bir metot ile her bir denek üzerinden tek ölçümün alındığı veri seti

Veri 1, Alanay ve arkadaşlarının 2009 yılında yaptıkları çalışmaya ait verilerdir. Bu

çalışmada, kemikteki proximal thoracic (PT), main thoracic (MT) ve thoracolumbar

(TL) eğriliklerinin esneklik oranları, ameliyat öncesinde referans metot olduğu

bilinen Bending X Rays (BXR) metodu ve ameliyat sırasında Truga metodu ile

ölçülmüştür. Bunların yanında, PT, MT ve TL değerleri ameliyat sonrasında da

ölçülerek gerçek değerler elde edilmiştir. Burada amaç, Bending ve Truga

metotlarının gerçek değerler ile ne kadar uyumlu olduğunu tespit etmektir.

Bland-Altman yöntemi kullanılarak, Bending ve Truga metotları ile elde edilen TL

değerleri ayrı ayrı gerçek TL değerleri olan Post-op değerler ile karşılaştırılarak

hangi metodun gerçek değerlerle daha uyumlu sonuçlar verdiğine bakılmıştır.

Bending ve Truga metotları kullanılarak elde edilen MT değerleri ise Sınıf-İçi

Korelasyon Katsayısı, Concordance Korelasyon Katsayısı, Deming ve Passing-

Bablok regresyon yöntemleri kullanılarak karşılaştırılmıştır.

66

Bending ve Truga metotları kullanılarak elde edilen PT değerleri ise Deming

regresyon yöntemi ile incelenmiş ve daha sonra neden bu değerleri Bland-Altman

yöntemi ile değerlendirmenin daha iyi olacağı anlatılmıştır.

Veri 2. Tekrarlı ölçümlere ilişkin yöntemlerin incelendiği veri seti

Tekrarlı ölçümlere ilişkin bu veriler Alanay ve arkadaşlarının 2007 yılında Original

Article dergisinde yayınlanan “Radiographic measurement of sagittal plane

deformity in patients with osteoporoticspinalş fractures evaluation of intrinsic

error” adlı makalesinden alınmıştır.

Hacettepe Üniversitesi Tıp Fakültesi’nde yapılan bu çalışmada, yaşlı bireylerde

Osteoporotic Vertebral Compression Fracture (OVCF) hastalığından kaynaklanan,

lokal sagital alan deformasyonunu değerlendirmede kullanılan 4 farklı metodun

uyum düzeyinin incelenmesi amaçlanmıştır.

Tekrarlı ölçümlerle çalışıldığı için uygulamada yalnızca Bland-Altman,

Tekrarlanabilirlik ve Sınıf-İçi korelasyon katsayısı yöntemleri ile metotların uyumu

incelenmiştir.

Bu metotlar ile ilgili açıklamalar Şekil 2.1 ve Çizelge 2.1’de gösterilmiştir.

67

Şekil 2.1. Kifotik deformasyonu ölçmek için kullanılan metotlar

Çizelge 2.1. Kifotik deformasyonu ölçmede kullanılan metotların tanımları

Metotlar Tanım

a. Metot 1 Çatlak omurganın alt ve üst plağı arasındaki açıyı ölçer.

b. Metot 2 Çatlak omurganın yalnızca alt plağı ve çatlağın hemen üstündeki

omurganın alt plağı arasındaki açıyı ölçer.

c. Metot 3 Çatlak omurganın aşağısındaki omurun üst plağı ile çatlak

omurganın yukarısındaki omurun alt plağı arasındaki açıyı ölçer.

d. Metot 4 Çatlak omurganın aşağısındaki omurun alt plağı ile çatlak

omurganın yukarısındaki omurun üst plağındaki açıyı ölçer.

2.2. Veri analizinde Kullanılan Programlar

Çalışmamızda veri analizi için ağırlıklı olarak “MedCalc” paket programı

kullanılmıştır. Bu program biyomedikal araştırmalar için geliştirilmiş bir program

olup diğerlerine göre metot karşılaştırma yöntemlerine daha fazla yer verilmiştir.

68

MedCalc programının yanı sıra “Analyse-it” ve “SPSS” paket programlarından da

yararlanılmıştır.

MedCalc Programının Ana Ekranı

MedCalc paket programının ana menüsü Şekil 2.2’de görüldüğü gibidir. Dosya

açmak için menüden File Open seçilip veri dosyası sisteme aktarılabilir veya

File New seçilerek veriler elle girilebilir. Veriler açıldıktan ya da oluşturulduktan

sonra Şekil 2.3’te görüldüğü gibi Statistics menüsünden yapılmak istenen analiz

seçilebilir.

Şekil 2.2. MedCalc programının ana menüsü

69

Şekil 2.3. MedCalc programında metot karşılaştırma menüsü

70

3. BULGULAR

Veri 1. Her bir metot ile her bir denek üzerinden tek ölçümün alındığı veri seti

Kemikteki PT, MT ve TL eğriliklerinin esneklik oranlarına ilişkin tanımlayıcı

istatistikler Çizelge 3.1’de verilmiştir. Veriler 61 denek üzerinden elde edilmiş,

ancak eksik veri nedeniyle iki tanesi çalışma dışı bırakılmıştır.

Çizelge 3.1. Veri setindeki değişkenlerin tanımlayıcı istatistikleri

Metotlar

N

Ortalama

Standart

Sapma

Min-Maks

Bending

PT 59 11,34 8,14 0 - 38

MT 59 25,10 19,63 1 – 90

TL 59 11,39 11,64 0 - 56

Truga

PT 59 11,64 7,15 0 – 41

MT 59 20,00 12,21 1 - 65

TL 59 12,72 9,25 1 - 42

Post-op

PT 59 9,16 5,84 0 - 29

MT 59 13,05 10,07 0 - 53

TL 59 11,73 10,12 0 - 41

Min: En küçük değer; Maks: En büyük değer

Bland-Altman Yöntemi

Bu çalışmada, ameliyat sonrası gerçek değerlerin olması özel bir durum

oluşturmaktadır. Bu nedenle, Bending ile Post-op değerleri arasındaki uyum ve

71

Truga ile Post-op değerleri arasındaki uyum düzeyleri elde edilmiş ve bu iki

metottan hangisinin gerçek değerler ile daha uyumlu olduğu bulunmuştur.

Bland-Altman yöntemini uygulamak için farkların yaklaşık olarak normal dağılıma

uyup uymadığı ve istatistiksel olarak farklar ve ortalamalar arasında anlamlı bir

ilişki olup olmadığı incelenmiştir. Farklar, yaklaşık olarak normal dağılıma

uyuyorsa ve istatistiksel olarak farklar ve ortalamalar arasında ilişki yoksa iki metot

arasındaki uyum farkların ortalaması ve standart sapması kullanılarak Bland-Altman

yöntemi ile incelenebilir.

1. Post-op TL değerleri ile Bending metodu ile elde edilen TL değerleri

arasındaki uyumun incelenmesi

Çizelge 3.2’de de görüldüğü gibi, Post-op TL değerleri ile Bending metodu ile elde

edilen TL değerleri arasındaki farklar normal dağılım göstermektedir. Bu değerlere

ait farklar ve ortalamalar arasında ise istatistiksel olarak anlamlı bir ilişki

bulunmamıştır.

Çizelge 3.2. Bland-Altman yönteminin uygulanabilmesi için Bending TL ve Post-op

TL ölçümlerine ilişkin varsayımların testi

Bland-Altman yönteminin gerektirdiği her iki varsayım da sağlandığı için Post-op

değerleri ile Bending metodu ile elde edilen ölçümlerin uyumu bu yöntem ile

incelenebilir.

Varsayım Sınaması Normallik Testi

(Shapiro-Wilk)

Korelasyon

(Pearson korelasyon)

TL

FARK

(Post-op – Bending)

p = 0,160

ORTALAMA-FARK

(Post-op – Bending)

-0, 157

(p=0,236)

72

0 10 20 30 40 50

-40

-30

-20

-10

0

10

20

30

40

Ortalama (tl_post - tl_bend)

Far

k (t

l_po

st -

tl_b

end)

Mean

0,3

-1.96 SD

-21,9

+1.96 SD

22,5

Şekil 3.1. TL değerlerinin Post-op ve Bending metodu ile elde edilen ölçümlerinin

farklarına karşı ortalamalarının grafiği

Şekil 3.1’de görüldüğü gibi Bland-Altman grafiğindeki TL ölçüm değerlerinin

farkları ve ortalamalarına ait noktaların önemli miktarı uyum sınırları içinde

olduğundan, bu değerlere ait farklar ve ortalamalar arasında ilişki olmadığı

sonucuna varılır.

Çizelge 3.3. Bland-Altman yöntemi uygulanan Bending TL ve Post-op TL

ölçümlerine ilişkin sonuçlar

TL Farklar (Post-op - Bending) %95 Güven Aralığı

Ortalama ± SS 0,34 ± 11,33 -2,6 - 3,3

Alt Limit -21,9 -26,9 - -16,8

Üst Limit 22,5 17,5 - 27,6

Elli dokuz denek üzerinden iki metot ile elde edilen TL değerlerinin farklarına ait

ortalama 0,34, standart sapma ise 11,33’tür. Farkların ortalamasına ait % 95 güven

aralığı ise -2,6 ile 3,3 olarak elde edilmiştir. Farkların ortalaması ve standart sapması

kullanılarak elde edilen uyum sınırları %95 güven düzeyinde, -21,9 ve 22,5 olarak

73

bulunmuştur. Bu sonuca göre, Bending metodu ile ölçülen TL değerleri, Post-op

değerlerinden 21,9 o büyük, 22,5 o küçük bulunabilir.

Uyum sınırlarının alt limiti olan -21,9 değeri için %95 Güven Aralığı -26,9 ile –

16,8 olarak bulunmuşken; üst limiti olan 22,5 değeri için 17,5 ile 27,6 olarak elde

edilmiştir.

2. Post-op TL değerleri ile Truga metodu ile elde edilen TL değerleri arasındaki

uyumun incelenmesi

Çizelge 3.4’de de görüldüğü gibi, Post-op TL değerleri ile Truga metodu ile elde

edilen TL değerleri arasındaki farklar normal dağılım göstermektedir. Bu değerlere

ait farklar ve ortalamalar arasında ise istatistiksel olarak anlamlı bir ilişki

bulunmamıştır.

Çizelge 3.4. Bland-Altman yönteminin uygulanabilmesi için Truga TL ve Post-op

TL ölçümlerine ilişkin varsayımların testi

Bland-Altman yönteminin gerektirdiği her iki varsayım da sağlandığı için Post-op

değerleri ile Truga metodu ile elde edilen ölçümlerin uyumu bu yöntem ile

incelenebilecektir.

Varsayım Sınaması Normallik Testi

(Shapiro-Wilk)

Korelasyon

(Pearson korelasyon)

TL

FARK

(Post-op – Truga)

p = 0,570

ORTALAMA-FARK

(Post-op – Truga)

0,123

(p=0,352)

74

0 10 20 30 40 50

-25

-20

-15

-10

-5

0

5

10

15

20

Ortalama (tl_post - tl_truga)

Fark

(tl_

post

- tl_

truga

)

Mean

-1,0

-1.96 SD

-16,2

+1.96 SD

14,2

Şekil 3.2. TL değerlerinin Post-op ve Truga metodu ile elde edilen ölçümlerinin

farklarına karşı ortalamalarının grafiği

Şekil 3.2’de görüldüğü gibi Bland-Altman grafiğindeki TL ölçüm değerlerinin

farkları ve ortalamalarına ait noktaların önemli miktarı uyum sınırları dışında

olmadığından bu değerlere ait farklar ve ortalamalar arasında ilişki olmadığı

sonucuna varılır.

Çizelge 3.5. Bland-Altman yöntemi uygulanan Truga TL ve Post-op TL ölçümlerine

ilişkin sonuçlar

TL Farklar (Post-op - Truga) %95 Güven Aralığı

Ortalama ± SS -1,0 ± 7,8 -3,0 - 1,0

Alt Limit -16,2 -19,7 - -12,7

Üst Limit 14,2 10,7 - 17,7

SS; Standart Sapma

Elli dokuz denek üzerinden iki metot ile elde edilen TL değerlerinin farklarına ait

ortalama -1,0±7,8’dir. Farkların ortalamasına ait % 95 güven aralığı ise -3,0 ile 1,0

olarak bulunmuştur. Farkların ortalaması ve standart sapması kullanılarak elde

edilen %95 güven düzeyinde uyum sınırları, -16,2 ve 14,2 olarak elde edilmiştir. Bu

75

sonuca göre Truga metodu ile ölçülen TL değerleri, Post-op değerlerinden 16,2 o

büyük, 14,2 o küçük bulunabilir.

Uyum sınırlanın alt limiti olan -16,2 değeri için %95 güven aralığı -19,7 ile -12,7

iken; üst limiti olan 14,2 değeri için 10,7 ile 17,7 olarak elde edilmiştir.

Sınıf-İçi Korelasyon Katsayısı (SKK)

Çalışmamızın bu bölümünde, SPSS paket programı kullanılarak Bending metodu ile

ölçülen MT değerleri ile Post-op MT değerleri arasındaki SKK ve Truga metodu ile

ölçülen MT değerleri ile Post-op MT değerleri arasındaki SKK değerleri tahmin

edilmiş ve bu iki metottan hangisinin gerçek değerler ile daha uyumlu sonuçlar

verdiği bulunmuştur.

Analizlerde, metot x denek etkileşimi göz ardı edilmiştir. Aynı denek üzerinden

Bending ve Truga metotları ile elde edilen MT değerlerine ilişkin mutlak uyumu ve

tutarlılığı ölçen SKK değerinin her ikisi de hesaplanmıştır. Her bir metot ile tek bir

ölçüm değeri elde edildiğinden tek ölçüm SKK değerleri ile ilgilenilmiştir.

1. Post-op MT değerleri ile Bending metodu ile elde edilen MT değerleri

arasındaki SKK’nın incelenmesi

Çizelge 3.6. Bending metodu ile elde edilen MT değerleri ile Post-op MT değerleri

arasındaki SKK tahmini

Bending / Post op

%95 Güven Aralığı F Değeri p

Alt Sınır Üst Sınır

SKK (Mutlak Uyum) 0,50 0,034 0,74 4,59 <0,001

SKK (Tutarlılık) 0.64 0.47 0.77 4,59 <0,001

76

2. Post-op MT değerleri ile Truga metodu ile elde edilen MT değerleri

arasındaki SKK’nın incelenmesi

Çizelge 3.7. Truga metodu ile elde edilen MT değerleri ile Post-op MT değerleri

arasındaki SKK tahmini

Bu durumda, MT değerlerini ölçmede Truga metodunun, Bending metoduna göre

Post-op MT değerleri ile biraz daha uyumlu sonuçlar verdiği gözlenmektedir.

Concordance Korelasyon Katsayısı (CKK)

Çalışmamızın bu bölümünde, Bending ve Truga metotları ile elde edilen MT

değerlerinin Post-op MT değerleri ile uyumu CKK tahmin edilerek bulunmuştur.

Böylece metotlar arasındaki uyum doğruluk ve kesinlik kavramları da

değerlendirilerek incelenmiş; daha sonra da sonuçlar mutlak uyumu değerlendiren

SKK değeri ile karşılaştırılmıştır.

1. Post-op MT değerleri ile Bending metodu ile elde edilen MT değerleri

arasındaki CKK’nın incelenmesi

Çizelge 3.8. Bending metodu ile elde edilen MT değerleri ile Post-op MT değerleri

arasındaki CKK tahmini

Bending/

Post-op

CKK

( bc C )

%95 Güven Aralığı *

(kesinlik)

C b **

(doğruluk) Alt sınır Üst sınır

MT 0,49 0,37 0,60 0,79 0,62

*Pearson korelasyon katsayısı,

** yanlılık düzeltme faktörü

Truga / Post op

%95 Güven Aralığı F Değeri p

Alt Sınır Üst Sınır

SKK (Mutlak Uyum) 0,71 0,06 0,90 12,24 <0,001

SKK (Tutarlılık) 0.85 0.76 0.91 12,24 <0,001

77

2. Post-op MT değerleri ile Truga metodu ile elde edilen MT değerleri

arasındaki CKK’nın incelenmesi

Çizelge 3.9. Truga metodu ile elde edilen MT değerleri ile Post-op MT değerleri

arasındaki CKK tahmini

Truga/

Post-op

CKK

( bc C )

%95 Güven Aralığı *

(kesinlik)

C b

**

(doğruluk) Alt sınır Üst sınır

MT 0,71 0,59 0,80 0,86 0,82

*Pearson korelasyon katsayısı,

** yanlılık düzeltme faktörü

Bir önceki bölümde, Bending ve Truga metotları ile elde edilen MT değerlerinin

Post-op MT değerleri ile uyumu SKK (mutlak uyum) değeri ile incelendiğinde,

Truga metodunun Bending metoduna göre gerçek değerler ile daha uyumlu sonuçlar

verdiği gözlenmişti. Bu bölümde, CKK ile SKK (mutlak uyum) değerinin benzer

sonuçlar verdiği gözlenmiş ve Truga metodunun Bending metoduna göre gerçek MT

değerleri ile daha uyumlu sonuçlar verdiği doğrulanmıştır.

Deming Regresyon Yöntemi

Çalışmamızın bu bölümünde, öncelikle Bending ve Truga metotları ile elde edilen

PT değerleri arasındaki uyum; daha sonra ise Bending ve Truga metotları ile elde

edilen MT değerleri arasındaki uyum Deming regresyon yöntemi ile incelenmiş ve

bu iki durum karşılaştırılmıştır.

Bu yöntem kullanılırken Bending ve Truga metotlarına ait hata değerlerinin normal

dağıldığı varsayılmıştır (Saraçlı, 2008).

78

1. Bending ve Truga metotları ile elde edilen PT değerleri arasındaki uyumun

incelenmesi

Çizelge 3.10. PT değerleri için Deming regresyon analizi sonuçları

(Referans) / (Test)

Bending / Truga

Yanlılık

(Bias)

%95 Güven

Aralığı

Standart

Hata

p

Kesim - Sabit(Constant) 2,01 -0,40 4,42 1,204 0,10

Eğim - Orantısal(Proportional) 0,85 0,63 1,07 0,110 0,18

Bulunan sonuçlara göre, kesim noktası 2,01’dir ve bu değere ait güven aralığı sıfır

değerini içermektedir. Eğim değeri ise 0,85’tir ve bu değere ait güven aralığı bir

değerini içermektedir. Bu durumda, Bending ve Truga metotları ile elde edilen PT

değerleri arasında sistematik ve orantısal yanlılık gözlenmediği sonucuna varılır.

Deming regresyon doğrusuna ait denklem ise, y=2,01+0,85x olarak bulunur. Şekil

3.3’te eşitlik doğrusu ile Deming regresyon doğrusu bir arada gösterilmiştir ve bu

grafikten Bending ve Truga metotları ile elde edilen PT değerlerinin birbirleri ile

uyumlu sonuçlar verdiği gözlenmektedir.

Şekil 3.3. PT değerleri için Deming regresyon grafiği

79

Ölçümler arasında herhangi bir sistematik veya orantısal hata bulunmadığından

Deming regresyon yöntemi yerine Bland-Altman yönteminin kullanılması tercih

edilir.

Bending ve Truga metotları ile elde edilen PT değerleri arasındaki uyum Bland-

Altman yöntemi ile incelendiğinde, Truga metodu ile elde edilen PT değerlerinin,

Bending metodu ile elde edilen PT değerlerinden 9,94 o büyük veya 9,33 o küçük

çıkabileceği sonucu bulunmuştur.

2. Bending ve Truga metotları ile elde edilen MT değerleri arasındaki uyumun

incelenmesi

Çizelge 3.11. MT değerleri için Deming regresyon sonuçları

(Referans) / (Test)

Bending / Truga

Yanlılık

(Bias)

%95 Güven

Aralığı

Standart

Hata

p

Kesim - Sabit(Constant) 5,06 2,49 7,63 1,285 <0,001

Eğim - Orantısal(Proportional) 0,60 0,49 0,70 0,051 <0,001

Bulunan sonuçlara göre, kesim noktası 5,06’dir ve bu değere ait güven aralığı sıfır

değerini içermemektedir. Eğim değeri ise 0,60’tır ve bu değere ait güven aralığı da

bir değerini içermemektedir. Bu durumda, Bending ve Truga metotları ile elde

edilen MT değerleri arasında hem sistematik hem de orantısal yanlılık gözlendiği

sonucuna varılır. Deming regresyon doğrusuna ait denklem ise, y referans metot

olan Bending metodu, x ise test metodu olan Truga metodu olmak üzere

y=5,06+0,60x olarak bulunur. Şekil 3.4’te eşitlik doğrusu ile Deming regresyon

doğrusu bir arada gösterilmiştir.

80

Şekil 3.4. MT değerleri için Deming regresyon grafiği

Görüldüğü üzere, Deming regresyon doğrusu ile eşitlik doğrusu birbirinden oldukça

farklıdır. Bu, metotlar arasında mutlak uyumun iyi bir düzeyde olmadığını gösterir;

ancak bulunan regresyon denklemi yardımıyla Truga metodu ile elde edilen değerler

kullanılarak Bending metodu ile bulunacak MT değerleri tahmin edilebilir.

Passing-Bablok Regresyon Yöntemi

Çalışmamızın bu bölümünde, daha önce Deming regresyon yöntemi ile incelenen

Bending ve Truga metotları ile elde edilen MT değerleri arasındaki uyum,

parametrik olmayan Passing-Bablok regresyon yöntemi ile incelenmiştir.

Çizelge 3.12. MT değerleri için Passing-Bablok regresyon analizi sonuçları

(Referans) / (Test)

Bending / Truga Yanlılık

(Bias)

%95 Güven Aralığı

Kesim - Sabit(Constant) 5,89 3,36 7,65

Eğim - Orantısal(Proportional) 0,54 0,43 0,64

81

Bulunan sonuçlara göre, kesim noktası 5,89’dur ve bu değere ait güven aralığı sıfır

değerini içermemektedir. Eğim değeri ise 0,88’dir ve bu değere ait güven aralığı bir

değerini içermemektedir. Bu durumda, Bending ve Truga metotları ile elde edilen

MT değerleri arasında hem sistematik hem de orantısal yanlılık gözlendiği sonucuna

varılır. Passing-Bablok regresyon doğrusuna ait denklem ise, y referans metot olan

Bending metodu, x ise test metodu olan Truga metodu olmak üzere y=5,89+0,54x

olarak bulunur. Şekil 3.5’te eşitlik doğrusu ile Passing-Bablok regresyon doğrusu bir

arada gösterilmiştir.

Şekil 3.5. . MT değerleri için Passing-Bablok regresyon grafiği

Görüldüğü üzere, Passing-Bablok regresyon doğrusu ile eşitlik doğrusu birbirinden

oldukça farklıdır. Bu, metotlar arasında iyi düzeyde bir mutlak uyumun olmadığını

gösterir; ancak bulunan regresyon denklemi yardımıyla Truga metodu ile elde edilen

değerler kullanılarak Bending metodu ile bulunacak MT değerleri tahmin edilebilir.

Veri 2. Tekrarlı ölçümlere ilişkin yöntemlerin incelendiği veri seti

Bu veriler 35 denek üzerinden her bir metot ile her bir denek üzerinden tekrarlı

ölçümler alınarak elde edilmiştir. Kifoz deformasyonunu ölçmek için geliştirilen bu

82

metotlar aracılığıyla Emre Acaroğlu, Akın Çil, Bas Pijnenburg, Muharrem Yazıcı

tarafından 34 denek üzerinde uygulanmıştır. Ancak bu çalışmada, yalnızca Emre

Acaroğlu tarafından elde edilen tekrarlı ölçümler ile analiz yapılacaktır ve eksik veri

nedeniyle bir denek çalışma dışı bırakılmıştır. Ayrıca, çalışmada hangi metodun

referans metot olduğu hakkında bilgi verilmediği için Metot 1 referans metot kabul

edilecek ve diğer metotların Metot 1 ile uyumu incelenecektir.

Yapılan ölçümler OVCF hastalığına sahip yaşları 55 – 75 arasında değişen 34 kişiye

aittir. Bu verilere ait tanımlayıcı istatistikler Çizelge 3.13’de verilmiştir.

Çizelge 3.13. Veri setindeki değişkenlerin tanımlayıcı istatistikleri

N Metot 1 Metot 2 Metot 3 Metot 4

Ortalama SS Ortalama SS Ortalama SS Ortalama SS

1 2 13,5 3,5 15,0 0,0 13,5 0,7 29,0 0,0

2 2 13,5 0,7 12,5 3,5 17,0 4,2 43,0 5,6

3 2 9,0 0,0 8,0 0,0 2,5 0,7 19,5 7,7

4 2 20,0 0,0 13,5 0,7 5,0 7,0 32,5 2,1

5 2 14,0 2,8 15,5 2,1 10,5 0,7 12,0 1,4

6 2 10,5 0,7 8,00 2,8 7,0 5,6 11,5 2,1

7 2 15,0 0,0 12,5 2,1 2,0 0,0 1,5 0,7

8 2 8,5 2,1 12,5 3,5 10,0 0,0 21,0 1,4

9 2 20,5 0,7 20,0 1,4 13,5 0,7 31,0 0,0

10 2 17,5 2,1 19,0 1,4 15,0 0,0 22,0 5,6

11 2 13,0 1,4 12,5 3,5 11,5 2,1 9,0 0,0

12 2 12,0 2,8 13,5 4,9 15,0 2,8 22,0 2,8

13 2 12,0 0,0 9,5 0,7 2,0 0,0 9,5 0,7

14 2 20,0 1,4 22,0 0,0 20,0 1,4 43,5 6,3

15 2 15,0 2,8 12,0 0,0 4,5 4,9 20,5 0,7

16 2 19,5 0,7 20,5 2,1 17,5 0,7 46,5 2,1

17 2 16,5 0,7 10,5 0,7 6,5 3,5 33,0 7,7

18 2 11,5 2,1 11,5 0,7 11,0 8,4 21,0 1,4

19 2 20,0 1,4 15,0 1,4 1,5 2,1 8,5 0,7

20 2 14,0 2,8 5,0 0,0 14,0 2,8 21,0 5,6

83

21 2 14,5 3,5 14,0 2,8 11,0 1,4 21,0 1,4

23 2 8,5 2,1 6,0 1,4 7,0 4,2 12,0 0,0

24 2 13,5 2,1 11,5 0,7 5,5 3,5 14,0 0,0

25 2 14,5 2,1 16,5 2,1 13,0 0,0 18,5 2,1

26 2 15,0 0,0 14,5 2,1 13,5 2,1 29,0 1,4

27 2 7,5 3,5 3,0 2,8 10,0 0,0 19,0 1,4

28 2 7,5 0,7 3,5 0,7 2,5 0,7 0,0 0,0

29 2 15,0 0,0 19,0 1,4 20,0 0,0 32,0 2,8

30 2 16,5 0,7 16,0 0,0 14,0 0,0 26,5 2,1

31 2 7,5 2,1 2,0 2,8 10,5 3,5 7,5 0,7

32 2 3,0 1,4 5,0 1,4 9,0 0,0 3,5 3,5

33 2 5,5 3,5 7,0 1,4 14,5 0,7 27,5 0,7

34 2 12,0 1,4 12,0 2,8 11,0 1,4 14,5 2,1

SS; Standart Sapma

Bland-Altman Yöntemi ve Tekrarlanabilirlik

Çalışmamızın bu bölümünde kifoz deformasyonu ölçmek için geliştirilmiş dört

metodun uyumu incelenmiştir. Kifoz deformasyon değerinin gerçek değeri sürekli

değişim gösterebilecek bir değer olamayacağından grafikler ve Bland-Altman

analizi sonucunda bulunan değerler gerçek değerlerin sabit olması durumuna göre

yapılmıştır. Bu nedenle grafiklerde, denek sayısı kadar nokta vardır ve bu noktaların

boyutu denek üzerinden alınan tekrarlı ölçüm sayısı ile orantılı olarak değişir. Bu

çalışmada, her bir denekten eşit sayıda tekrarlı ölçüm alındığından bütün noktaların

boyutları aynıdır.

84

0 5 10 15 20 25

-8

-6

-4

-2

0

2

4

6

8

10

Ortalama (Metot-1 - Metot-2)

Fark

(Met

ot-1

- M

etot

-2)

Mean

1,0

-1.96 SD

-6,2

+1.96 SD

8,3

Şekil 3.6. Kifoz deformasyonu ölçmede Metot 1 ve Metot 2 Karşılaştırması

5 10 15 20 25

-15

-10

-5

0

5

10

15

20

Ortalama (Metot-1 - Metot-3)

Fa

rk (

Me

tot-

1 -

Me

tot-

3)

Mean

2,5

-1.96 SD

-10,9

+1.96 SD

15,9

Şekil 3.7. Kifoz deformasyonu ölçmede Metot 1 ve Metot 3 Karşılaştırması

85

0 5 10 15 20 25 30 35 40

-30

-25

-20

-15

-10

-5

0

5

10

15

20

Ortalama (Metot-1 - Metot-4)

Far

k (M

etot

-1 -

Met

ot-4

)

Mean

-7,6

-1.96 SD

-28,0

+1.96 SD

12,7

Şekil 3.8. Kifoz deformasyonu ölçmede Metot 1 ve Metot 4 Karşılaştırması

Çizelge 3.14. Kifoz deformasyonu ölçmede kullanılan metotların Bland-Altman

yöntemi ile uyumunun değerlendirilmesi

Farklara ait %95 Güven Aralığı

Ortalama Standart Sapma Alt Sınır Üst Sınır

Metot 1 - Metot 2 1,04 3,67 -6,17 8,25

Metot 1 – Metot 3 2,51 6,85 -10,92 15,94

Metot 1 – Metot 4 -7,6 10,38 -27,95 12,75

Metot 1; referans metot olduğunda, Metot 2 ile elde edilen ölçümler Metot 1 ile elde

edilen ölçümlerden 6,17 o büyük, 8,25 o küçük; Metot 3 ile elde edilen ölçümler

Metot 1 ile elde edilen ölçümlerden 10,92 o büyük, 15,94 o küçük; Metot 4 ile elde

edilen ölçümler Metot 1 ile elde edilen ölçümlerden 27,95 o büyük, 12,75 o küçük

çıkabilir. Bu durumda, kifoz deformasyonu ölçmede Metot 1 ile elde edilen

ölçümlerin en çok Metot 2 ile elde ölçüm değerleri ile uyumlu olduğu; en az da

Metot 4 ile elde edilen ölçümler ile uyumlu olduğu gözlenmiştir.

86

Ölçümler tekrarlı olarak elde edildiğinde, her bir metoda ait grup-içi standart

sapmalar karşılaştırılarak hangi metodun tekrarlanabilirliğinin daha fazla olduğu

tahmin edilebilir. Grup-içi standart sapması küçük olan metodun tekrarlanabilirliği

daha fazladır. Yapılan inceleme sonucunda referans metot olan Metot-1 ile elde

edilen ölçümlerin grup-içi standart sapması (5,09) diğer metotlarınkine göre daha

küçüktür. Metot-2 ile elde edilen ölçümlerin grup-içi standart sapması, 5,49; Metot-

3 ile elde edilen ölçümlerin grup-içi standart sapması 6,65; Metot-4 ile elde edilen

ölçümlerin grup-içi standart sapması ise 11,78 olarak bulunmuştur. Bu durumda

kifoz deformasyonu ölçmede, tekrarlanabilirliği en fazla olan ve güvenilir sonuçlar

veren metotların Metot-1 ve Metot-2 olduğu sonucuna varılabilir.

Sınıf-İçi Korelasyon Katsayısı (SKK)

SKK, her bir metot ile tek bir ölçüm elde edilmesi durumunda iki yönlü karma etki

modeli kullanılarak tahmin edilebileceği gibi, ölçümler tekrarlı olduğunda da tahmin

edilebilir. Burada, SPSS paket programı kullanılarak Metot-1, Metot-2, Metot-3,

Metot-4 ile tekrarlı ölçümler alınarak elde edilen kifoz deformasyon değerlerinin

uyumu SKK ile değerlendirilmiştir.

Çizelge 3.15. Kifoz deformasyonu ölçmede kullanılan metotların SKK ile

uyumunun değerlendirilmesi

Metotlar

SKK

%95 Güven Aralığı F

Değeri

p

Alt Sınır Üst Sınır

SKK (Mutlak Uyum) 0,65 0,38 0,80 3,95 <0,001

SKK (Tutarlılık) 0.77 0.73 0.81 3,95 <0,001

Kifoz deformasyonu ölçmek için geliştirilen metotların ölçümlerine ilişkin SKK

(mutlak uyum) değeri 0,65 olarak bulunmuşken; SKK (tutarlılık) değeri 0.77 olarak

bulunmuştur.

87

4. TARTIŞMA

Bu tez çalışmasında, metot karşılaştırma çalışmalarında kullanılan yöntemler, tek

ölçüm (single measurement) ve tekrarlı ölçüm olarak elde edilmiş olan iki ayrı veri

seti üzerinde uygulanmıştır. Kullanılan veriler, ilgili metotlar ile elde edilmiş ölçüm

değerleridir ve metotlar ile elde edilen bu ölçüm değerleri karşılaştırılarak metotların

uyumu hakkında sonuca varılmıştır.

Metotları karşılaştırmak için Bland-Altman yöntemi, Sınıf-içi korelasyon katsayısı

(SKK), Concordance korelasyon katsayısı (CKK), Deming regresyon ve Passing-

Bablok regresyon yöntemleri kullanılmıştır.

Metotlar arasındaki uyumu incelemek amacıyla, metotlar ile yalnızca bir ölçüm elde

edilmesi durumu için veriler üzerinde Bland-Altman yöntemi, SKK, CKK, Deming

regresyon ve Passing-Bablok yöntemlerinin her biri kullanılmışken; metotlar ile

tekrarlı ölçümler elde edilmesi durumunda yalnızca Bland-Altman,

Tekrarlanabilirlik ve SKK yöntemleri kullanılmıştır.

Her bir metot ile her bir denek üzerinden tek ölçümün alındığı veri seti

Elli dokuz denek üzerinden Bending ve Truga metotları ile PT, MT ve TL kemik

ölçüm değerleri elde edilmiş ve referans metot olduğu bilinen Bending ve Truga

metotları ile elde edilen ölçüm değerlerinin uyumu incelenmiştir.

Gerçek TL değerleri olan Post-op TL ile Bending ve Truga metotlarının her ikisi ile

elde edilen TL değerlerinin farklarının normal dağıldığı test edilmiş; farklar ve

ortalamalar arasında istatistiksel olarak anlamlı bir ilişki bulunmamıştır. Ancak

Bland-Altman uyum grafiği incelendiğinde hem Post-op TL ile Bending metodu ile

88

elde edilen TL değerlerine hem de Post-op TL değerleri ile Truga metodu ile elde

edilen TL değerlerine ait grafiklerde megafonik bir görüntü tespit edilmiştir. Uyum

sınırlarına ait %95 güvenle elde edilen aralıkların geniş olmasının bundan

kaynaklandığı tahmin edilmektedir. Megafonik görüntü logaritmik dönüşüm ile bir

miktar azaltılabilmişse de, tamamen ortadan kaldırılamamıştır.

Varsayımlar sağlandığından TL değerlerine ait ölçümlerin uyumunu değerlendirmek

için Bland-Altman yöntemi uygulanmıştır. Truga metodu ile elde edilen ölçümlere

ait uyum sınırlarının alt ve üst limitleri arasındaki fark, Bending metodu ile elde

edilen ölçümlere ait uyum sınırlarının alt ve üst limitleri arasındaki farka göre daha

dar olduğundan Truga metodu ile elde edilen ölçümlerin Bending metodu ile elde

edilen ölçümlere göre gerçek TL değerleri ile daha uyumlu sonuçlar verdiği

görülmüştür.

Sınıf-içi korelasyon katsayısı ve Concordance korelsyon katsayısı ile Bending ve

Truga metotları ile elde edilen MT değerleri ile gerçek Post-op MT değerleri

arasındaki uyum incelenmiştir. Bu iki metot arasındaki uyum, SKK (mutlak uyum)

ve CKK kullanılarak karşılaştırıldığında, bu iki değerin benzer sonuçlar verdiği

gözlenmiş ve MT değerlerini ölçmede Truga metodunun Bending metoduna göre

gerçek değerler ile daha uyumlu sonuçlar verdiği tespit edilmiştir. Ancak SKK

(mutlak uyum) değerine ait %95 güven aralıkları çok geniş bulunduğundan ölçümler

arasında matematiksel bir ilişkinin olabileceğinden şüphe duyularak, SKK

(tutarlılık) değerleri de incelenmiştir. Sonuç olarak, SKK (tutarlılık) değerlerine ait

%95 güven aralıklarının daraldığı gözlenmiştir. Bu durumda, Deming regresyon

yöntemi ile bulunacak denklemden yararlanılarak tahminler yapılabilir.

Deming regresyon ve Passing-Bablok regresyon yöntemleri ile de Bending ve Truga

metotları ile elde edilen ölçümlerden öncelikle PT daha sonra da MT değerleri

arasındaki uyum incelenmiştir. Ancak iki metot ile elde edilen PT ölçümleri

arasında sistematik veya orantısal bir yanlılık gözlenmediğinden metotlar arasındaki

uyumu karşılaştırmada Bland-Altman yönteminin kullanılması daha uygun

89

bulunmuştur. Bland-Altman analizi sonucunda, bu iki metotla elde edilen PT

değerlerinin birbirleri ile uyumlu sonuçlar verdiği gözlenmiştir. Bending ve Truga

metotları ile elde edilen MT değerleri Deming regresyon ve Passing-Bablok

regresyon yöntemleri ile incelendiğinde, iki metoda ait ölçümler arasında hem

sistematik hem de orantısal yanlılık gözlenmiştir. Bulunan regresyon doğruları

yardımıyla, Truga metodu ile elde edilen ölçüm değerleri kullanılarak referans

metot olan Bending metodu ile bulunacak MT değerleri tahmin edilebilir.

Tekrarlı ölçümlere ilişkin yöntemlerin incelendiği veri seti

Otuz dört denek üzerinden, kifoz deformasyonu ölçmek için kullanılan Metot-1,

Metot-2, Metot-3 ve Metot-4 ile elde edilen ölçümler arasındaki uyum incelenmiştir.

Çalışmada hangi metodun referans metot olduğu bilinmediğinden Metot-1 referans

metot olarak kabul edilmiştir.

Bland-Altman yöntemi sonucunda, Kifoz deformasyonu ölçmede Metot 1 ile elde

edilen ölçümlerin en çok Metot 2 ile elde ölçüm değerleri ile uyumlu olduğu; en az

da Metot 4 ile elde edilen ölçümler ile uyumlu olduğu gözlenmiştir.

Metotların tekrarlanabilirlikleri karşılaştırıldığında ise, Metot-1 ve Metot-2’nin

tekrarlanabilirliklerinin daha fazla olduğu bulunmuştur. Bu nedenle, bu iki metodun

diğerlerine göre daha güvenilir sonuçlar verdiği anlaşılmıştır.

Sınıf-içi korelasyon katsayısı kullanılarak metotlar arsındaki uyum incelendiğinde,

bu dört metot ile elde edilen ölçümler için elde edilen SKK (mutlak uyum) değeri

için bulunan %95 güven aralığı, SKK (tutarlılık) değerine ait %95 güven aralığına

göre daha dar bulunmuştur.

90

5. SONUÇ VE ÖNERİLER

Son yıllara kadar ölçüm metotları arasındaki uyumu değerlendirmek amacıyla

Pearson korelasyon katsayısı, regresyon analizi gibi klasik istatistik yöntemleri

kullanılmaktaydı. Ancak yapılan çalışmalar bu yöntemlerin uyumu ölçmede

kullanılmasının uygun olmadığını göstermiş ve bunlara alternatif yöntemler

önerilmiştir. Metot karşılaştırma çalışmalarında son yıllarda sıkça kullanılan bu

alternatif yöntemler, Bland-Altman yöntemi, Sınıf-içi korelasyon katsayısı (SKK),

Concordance korelasyon katsayısı (CKK), Deming regresyon ve Passing-Bablok

regresyon yöntemleridir.

Metot karşılaştırma çalışmaları için geliştirilen bu yöntemler, metotlar arasındaki

mutlak uyumun yanında ilişkisel uyumun da incelenmesine olanak sağlar. Bland-

Altman yöntemi ve CKK metotlar arasındaki mutlak uyumu; Deming ve Passing-

Bablok regresyon yöntemleri ise metotlar arasındaki ilişkisel uyumu değerlendirir.

SKK ise, hem mutlak hem de ilişkisel uyumu değerlendirmeye olanak tanır.

Bu tez çalışmasında, metot karşılaştırma çalışmalarında kullanılan bu yöntemler ve

bu yöntemler ile ilgili olan kavramlar ayrıntılarıyla anlatılmıştır. Daha sonra ise,

biri, her bir metot ile her bir denek üzerinden tek ölçüm değeri alınarak; diğeri ise,

her bir metot ile her bir denek üzerinden tekrarlı ölçüm değerleri alınarak elde

edilmiş iki ayrı veri seti üzerinde bu yöntemler uygulanmış ve metotların birbirleri

ile uyumu incelenmiştir.

91

ÖZET

Klinik Araştırmalarda Sürekli Sonuçlu Ölçüm Tekniklerinin Uyumunun

İncelenmesinde Kullanılan İstatistiksel Yöntemler

Metot karşılaştırma çalışmalarda, yeni bir ölçüm metodunun ile referans olarak kullanılan

ölçüm metodunun uyum düzeyi çeşitli istatistiksel yöntemler kullanılarak incelenir.

Genellikle ölçüm metotları arasındaki uyumu belirlemek için korelasyon ve regresyon

analizi kullanılır. Fakat korelasyon ve regresyon analizi uyumu ölçmede doğru yöntemler

değildir.

Bu çalışmada, bu yöntemlere alternatif olan grafiksel teknik ve basit hesaplamaları temel

alan Bland-Altman yöntemi; ölçümler sürekli olduğunda, metot-içi ve metotlar-arası

uyumun değerlendirilmesinde kullanılan Sınıf-İçi Korelasyon Katsayısı; doğruluk ve

kesinlik kavramlarını da değerlendiren Concordance Korelasyon Katsayısı; hataların normal

dağıldığı varsayımı altında her iki değişkendeki ölçüm hatasını dikkate alan Deming

Regresyon ve parametrik olmayan Passing-Bablok yöntemleri tanıtılmıştır.

Anahtar Kelimeler: Bland-Altman Yöntemi, Concordance Korelasyon Katsayısı, Deming

ve Passing-Bablok Regresyon Yöntemleri, Metot Karşılaştırma, Sınıf-İçi Korelasyon

Katsayısı

92

SUMMARY

Statistical Methods Used for Measuring Agreement Between Continuous Outcome

Measurement Methods In Clinical Researches

In some clinical researches, degree of agreement between a new measurement method and

an established one is assessed by using a variety of statistical analysis. In general,

correlation and regression analysis are commonly used for this purpose. However use of

these analyses lead to misleading.

In this study, some alternative approaches, “Bland-Altman method”, based on graphical

techniques; Intraclass Correlation Coefficient, used when the measurements are continuous

for evaluating inter-method and intra-method agreement; Concordance Correlation

Coefficient, used for evaluating both precision and accuracy as well; Deming Regression,

assuming errors distribute with normally, taken into account both method measurements’

errors and non-parametric Passing-Bablok Regression techniques are explained.

Key Words: Bland-Altman Technique, Concordance Correlation Coefficient, Deming and

Passing-Bablok Regression Techniques, Intraclass Correlation Coefficient, Method

Comparison

93

KAYNAKLAR

ALPAR, R. (2010). Spor Bilimlerinde Uygulamalı İstatistik. Nobel Yayın Dağıtım.

ALANAY, A., PEKMEZCİ, M., KARAEMİNOĞULLARI, O., ACAROĞLU, E., YAZICI,

M., ÇİL, A., BAS, P., GENÇ, Y., ÖNER, F. (2007). Radiographic measurement of

the sagittal plane deformity in patients with osteoporotic spinal fractures evaluation

of intrinsic error. Eur Spine J., 16: 2126-2132.

ATKINSON, G., NEVILL, A. (1997). Comment on the use of concordance correlation to

assess the agreement between two variables. Biometrics., 53(2): 775-777.

ATEŞ, C., ÖZTUNA, D., GENÇ, Y. (2009). Sağlık araştırmalarında sınıf içi korelasyon

katsayısının kullanımı. Türkiye Klinikleri J. Biostat., 1(2): 59-64.

BARNHART, H., HABER, B., LIN, L. (2007). An overview on assessing agreement with

continuous measurement. J. Biopharm. Stat., 17: 529-569.

BLAND, J., ALTMAN, D. (1999). Measuring agreement in method comparison studies.

Stat. Methods. Med. Res., 8: 135-160.

BLAND, J., ALTMAN, D. (1990). A note o n the use of the intraclass correlation

coefficient in the evaluation of agreement between two methods of measurement.

Comput. Biol.Med., 20(5): 337-340.

BLAND, M., ALTMAN, D. (2007). Agreement between methods of measurement with

multiple observations per individual. J. Biopharm. Stat., 17: 571-582.

BLAND, M., ALTMAN, D. (2010). Statistical methods for assessing agreement between

two methods of clinical measurement. NS., 6: 1-6.

BRUTON, A., CONWAY, J., HOLGATE, S. (2000). Reliability: What is it and how is it

measured. Physicotheraphy., 86(2): 94-99.

CARSTENSEN, B. (2010). Comparing Clinical Measurement Methods. John Wiley and

Sons. 1st Ed.

CHINCHILLI, V., MARTEL, J., KUMANYIKA, S., LLOYD, L. (1996). A weighted

concordance correlation coefficient for repeated measurement designs. Biometrics.

52: 341-353.

CHINN, S. (1990). The assessment of methods of measurement. Stat. Med., 9: 351-362.

94

CORNBLEET, J., GOCHMAN, N. (1979). Incorrect least-squares regression coefficients in

method-comparison analysis. Clin. Chem., 25: 432-438.

CORRASCO, J., Jover, J. (2003). The concordance correlation coefficient estimated

through variance components. Conferencia Espanola de Biometria. 9: 28-30.

ERCAN, İ., KAN, İ. (2004). Ölçeklerde güvenilirlik ve geçerlilik. Uludağ Üniversitesi Tıp

Fakültesi Dergisi. 30(3): 211-216.

GENÇ, Y., SERTKAYA, D., DEMİRTAŞ, S. (2003). Klinik araştırmalarda iki ölçüm

tekniğinin uyumunu incelemede kullanılan istatistiksel yöntemler. Ankara

Üniversitesi Tıp Fakültesi Mecmuası., 29(1): 1-6.

HABER, M., BARNHART, H. (2006). Coefficient of agreement for fixed observers. Stat.

Methods. Med. Res., 15: 255-271.

HOLLIS, S. (1997). Analysis of method comparison studies. JIFCC., 9(1): 8-12.

LIN, L. (1989). A concordance correlation coefficient to evaluate reproducibility.

Biometrics. 45: 255-268.

LINNET, K. (1993). Evaluation of regression procedures for methods comparison studies.

Clin. Chem., 39(3): 424-432.

MAGARİ, R. (2002). Statistics for laboratory method comparison studies. Biopharm., 38:

28-32.

MANTHA, S., ROIZEN, M., FLEISHER, L. (2000). Comparing methods of clinical

measurement: Reporting standards for Bland and Altman analysis. Anesth. Analg., 90:

593-602.

MCGRAW, K., WONG, S. (1996). Forming inferences about some intraclass correlation

coefficients. Psychol. Methods., 1(1): 30-46.

ÖZDAMAR, K. (2003). SPSS ile Biyoistatistik. Kaan Kitabevi. 5. Baskı.

POLLOCK, M., JEFFERSON, S., KANE, J., LORNAX, K., MACKINNON, G.,

WINNARD, C. (1992). Ann. Clin. Biochem., 29: 556-560.

SARAÇLI, S. (2008). Ölçüm Hatalı Modellerde Doğrusal Regresyon Tekniklerinin

Karşılaştırılması. Yayınlanmış doktora tezi.

SARAÇLI, S. (2009). Medikal metot karşılaştırma çalışmalarında deming regresyon

tekniği. Türkiye Klinikleri J. Biostat., 1(1): 9-15.

95

SARAÇLI, S. ve ÇELİK, E. (2011). Performance of ols-bisector regression in method

comparison studies. World Appl. Sci. J., 12(10): 1860-1865.

SHROUT, P., FLEISS, J. (1979). Intraclass correlations: Uses in assessing rater reliability.

Psychol. Bull., 86(2): 420-428.

WESTGRAD, J., HUNT, M. (1973). Use and interpretation of common statistical tests in

method-comparison studies. Clin. Chem., 19(1): 49-57.

96

ÖZGEÇMİŞ

I - Bireysel Bilgiler

Adı ve Soyadı : Gamze AKKOCA

Doğum Yeri ve Tarihi : Ankara, 13.05.1985

Uyruğu : T.C.

Medeni Durumu : Bekar

Adres : Fakülteler Mahallesi Yeni Acun Sokak 17/8 Cebeci - ANKARA

E-posta : [email protected]

Telefon : 0312-363-26-19

II - Eğitimi

Ankara Üniversitesi / Biyoistatistik Yüksek Lisans (2012)

Başkent Üniversitesi / İstatistik ve Bilgisayar Bilimleri (2008)

Cumhuriyet Lisesi (Yabancı Dil Ağırlıklı Lise) (2003)

Yabancı Dil: İngilizce

III – Bilimsel İlgi Alanları

İstatistik, Biyoistatistik, Bilgisayar

IV – Bilimsel Etkinlikleri

EMR–IBS Eastern Mediterranean Region of the Inernational Biometric Society

- Veri Madenciliği Katılım Belgesi

EMR–IBS Eastern Mediterranean Region of the Inernational Biometric Society

- Katılım Belgesi

V – Üye Olduğu Kuruluşlar

Başkent Üniversitesi Mezunlar Derneği

EMR–IBS Eastern Mediterranean Region of the Inernational Biometric Society