Upload
others
View
21
Download
0
Embed Size (px)
Citation preview
مروريمقاله
١١٥٣-١٣٩٣،١١٧٠، ١٣
ي هاي آنها در پژوهشگیراندازهي مختلف هاروایی و پایایی ابزارها و روشکاربردي در سالمت
3، محمد علی گل2، نرگس محمدصالحی1ابوالفضل محمدبیگی
6/12/93: پذیرش مقاله12/11/93:دریافت اصالحیه از نویسنده6/11/93:نده جهت اصالحارسال مقاله به نویس3/6/93:دریافت مقاله
چکیدهاز طریق هاامروزه با گسترش تحقیقات در علوم پزشکی و اجتماعی، پژوهش، آموزش و مدیریت، بسیاري از پدیده
سازي رفتار افراد میبه منظور کوي داوران هایابیي آموزشی و یا ارزهاو تستها، چک لیستهانامهپرسشابزارهایی چون ي و دستیابی به مقادیر واقعی گیراندازهي الزم جهت هاروایی و پایایی از شاخص. گیردمییا جامعه، مورد مطالعه قرار
ي مختلف هاشآگاهی و فهم کافی از روایی و پایایی از اصول متدولوژي در طراحی مطالعات و کاربرد سنج. باشدمیپیامدها هدف نوشتار حاضر آشنایی محققین و دانشگاهیان با مفاهیم . شودسفانه در بسیاري از موارد نادیده گرفته میاست که متأ
. ي آن استگیراندازهي مختلف هاپایایی، روایی و شیوه، آلفاي کرونباخ، تحلیل عاملیسنجیروایی، پایایی، روان:کلیديهايواژه
کی و استادیار اپیدمیولوژي، گروه اپیدمیولوژي و آمار زیستی، مرکز تحقیقات سیاستگذاري و ارتقاء سالمت، دانشکده بهداشت، دانشگاه علوم پزش-1ایرانقم،قم،خدمات بهداشتی درمانی
[email protected]: ، پست الکترونیکی025- 37842228: ، دورنگار025- 37842228: تلفن
مرکز تحقیقات سیاستگذاري و ارتقاء سالمت، دانشگاه علوم پزشکی و خدمات بهداشتی درمانی قم، قم، ایرانارشد اپیدمیلوژي،کارشناس-2دانشجوي دکتري آموزش بهداشت، دانشکده بهداشت، دانشگاه علوم پزشکی و خدمات بهداشتی درمانی شهید بهشتی، تهران، ایران-3
مقدمهبا گسترش تحقیقات در علوم پزشکی و امروزه
هااجتماعی، پژوهش، آموزش و مدیریت، بسیاري از پدیدهو ها، چک لیستهانامهپرسشاز طریق ابزارهایی چون
ي داوران مورد مطالعه هاي آموزشی و یا ارزیابیهاتستتا بتوانند رفتار افراد یا جامعه مورد ]1[گیردمیقرار
از آنجا که بسیاري از . ]2[زي نمایندسامیمطالعه را ک
، پایایی شودمیتحقیقات بر اساس ابزارهاي مذکور انجام )Reliability (و روایی(Validity) آنها امري اجتناب
- 2[ناپذیر است و مقدار آن باید در حد قابل قبولی باشدبر اساس مطالعات انجام شده بیشتر مطالعات در . ]4
ی با مشکل رو به رو هستند به نحوي گزارش روایی و پایایکه اطالعات کافی در مورد ابعاد روان سنجی ابزارها و یا در
بر اساس . ي روان سنجی وجود نداردهابه کار بردن تست
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1154
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
مروري گرچه در برخی مطالعات روایی ايهمطالعبیان شده است اما این روایی (Content Validity)محتوي
روایی ضابطه به . نجام شده استمتخصص ا5با کمتر از ي گیراندازهندرت گزارش شده است و یا خطاهایی در
. شودمیروایی سازه گزارش ن،همچنین. ضابطه وجود دارددر خصوص پایایی بیشتر با استفاده از آلفاي کرونباخ مقدار
شود میگزارش )Internal Consistency(سازگاري درونی کمتر مورد توجه قرار هامونآز) Stability(اما ثبات
لذا بررسی ابعاد مختلف روانسنجی ابزارها و . ]5[گیردمیي در علوم مختلف و گیراندازهیکی از ضروریات هامقیاس
لذا نوشتار حاضر با هدف آشنایی محققین و . پژوهش استپژوهشگران دانشگاهی با مفاهیم روایی و پایایی و
روایی به ،ایایی و همچنیني پگیراندازهي مختلف هاروشي مختلف تهیه هامنظور استفاده صحیح و به جا از روش
در این مقاله ابتدا تعریفی از روایی و پایایی ارائه . شده است. شده و به رابطه بین پایایی و روایی پرداخته شده است
ي آن و انواع گیراندازهي هاسپس به پایایی و روشتوافق درونی در پایایی سنجشي پایایی شامل هاسنجش
و پایایی دو نیمه آزمونبا استفاده از آلفاي کرونباخ ، سنجش ثبات در ،همچنینو پایایی کادر ریچاردسن
، ي یکسانهافرم، باز آزمون- آزمون پایایی با استفاده از . اشاره شدپایایی بین مشاهده کنندگانو ي متعادلهافرم
ي تعیین روایی هاواع روشدر نهایت به تعریف روایی، انشامل روایی صوري، روایی محتوي، روایی سازه و روایی
. ضابطه اشاره شدتعریف روایی و پایایی
از صحت نتایج مطالعه است و نشان ايهروایی درجچیزي را که قصد ايهدهد که مطالعه تا چه اندازمی
ي آن را داشته است به درستی سنجیده است؟ گیراندازه
از یکسان بودن نتایج در ايهپایایی درج. ]3-1، 5- 11[طول زمان معین و تحت شرایط مشابه و با روش کار
و ) Repeatability(باشد که با قابلیت تکرار میمشابه ي گیراندازهنتایج ) Reproducibility(قابلیت تکثیر
توان گفت که پایایی میبه عبارتی ]1-3، 5-11[شودمیکه به معنی کسب ثبات. متفاوت استشامل سه بخش
نتایج یکسان در افراد مشابه در صورت تکرار آزمون است؛ هنگامی به دست ) Equivalence(هم ارزي یا تعادل
آید که چنانچه آزمون توسط محققین مختلفی به کار میرود نتایج یکسانی را به دست آورد؛ و همگنی
)Homogeneity (ي آزمون اهشاخصی است که تمام بخشبنابراین براي . مورد استفاده داراي سازگاري درونی باشند
تعیین همگنی، تعدادي از تعاریف مختلف عملیاتی از مشابه با یک روش خاص در مفاهیم مشابه بر روي افراد
شود و نتایج به دست میآزمون هاآوري دادهشیوه جمع. ]12-13[آمده باید شدیداً به یکدیگر وابسته باشند
ي به کار رفته در علوم مختلف، در هادر ارزیابیي پزشکی و هاي آموزشی و پژوهشی، تشخیصهافعالیت
که محقق بخواهد هر کدام از اجزاي غیره، بر اساس آني گیراندازهپایایی شامل ثبات، هم ارزي و یا همگنی را
ي مختلف به سنجش پایایی هاتواند از روشمینماید نامهپرسش، جهت بررسی پایایی ابزارمنظور بدین . بپردازد
باز - روش آزمون توان از میو یا هر مقیاس سنجش دیگر ي مورد هاآزمون،همچنینو)Test-Retest(آزمون
، ضریب آلفاي کرونباخاستفاده در تعیین پایایی از جمله ي موازي هاروش دو نیمه کردن، کادر ریچارسون و یا فرم
.کنداستفاده ز گروه هدفاايهنمونبر روي
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
1155و همکارانابوالفضل محمدبیگی
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
رابطه بین پایایی و روایی، معیارهاي ضروري در تعیین هاروایی و پایایی سنجش
پایایی با خطاي تصادفی . باشندمیدقت و صحت سنجش در ارتباط است و روایی با خطاي منظم و بنابراین هرچقدر
تواند بر کاهش خطاي میکه تعداد حجم نمونه باال رود یابد میگذارد و بنابراین پایایی ابزار افزایش تأثیرتصادفی
اما باید توجه . استمؤثري گیراندازهو بنابراین بر دقت نمود که افزایش روایی مستلزم استفاده از ابزارهاي
به بیان دیگر روایی نشان . خواهد بودمؤثراستاندارد و ذکر این نکته . ]14-15[ي استگیراندازهدهنده صحت
به . م است که پایایی شرط الزم براي روایی استالزتواند میداراي پایایی نباشد نايهعبارتی چنانچه سنج
بنابراین در . مقدار درست و واقعی یک پدیده را نشان دهدید أیاعتبارسنجی ابزارها، سنجش روایی باید پس از ت
پایایی با خطاي تصادفی و روایی با . پایایی صورت گیردبنابراین افزایش ي، مرتبط استگیراندازهخطاي منظم
برد و میدقت با کاهش خطاي تصادفی، پایایی را باال افزایش صحت ناشی از کاهش خطاي منظم بوده که روایی
شرط الزم براي روایی یک ]. 13- 14، 16[بردمیرا باال براي اینکه وکافی نیست شرطآزمون پایایی آن است ولی
].1، 14، 17[باشد باید پایا باشد)وار(یک آزمون معتبراما به طور کلی اعتبار و پایایی از هم جدا نبوده و با
و ] 18-19[شودمیروایی آن هم افزوده ،افزایش پایاییگردد و میالبته پایین بودن پایایی نیز سبب کاهش روایی
از خطاهایی است که در ايهدهنده مجموعنشانگرچه برخی محققین رابطه . ]19[دهدمیي رخ گیراندازه
به ،اندو روایی را در ابزارها نشان دادهمعکوسی بین پایایی االت باز، پایایی کمی دارد حال ؤعنوان مثال مصاحبه با س
آنکه روایی باالیی دارد اما یک مصاحبه استاندارد شده
از منظر کالسیک و . ]20[نتیجه عکس خواهد داشتقابل توجهی در مفاهیم بنیادي روش شناختی نیز تفاوت
وجود دارد که در ) Certainty(و قطعیت) Truth(حقیقت .]20-21[مشخص شده است1شکل
روایی و پایایی نگاهی اجمالی به لغت شناسی مفاهیم پایه-1شکل ي کالسیک، مدرن و روش شناختیهااز دیدگاه
است و از بعد روش شناختی روایی با حقیقت در ارتباط عالوه بر این رابطه . باشدمیپایایی با قطعیت مرتبط
معکوس بین روایی و پایایی در روش متدولوژیک و رابطه معکوس بین حقیقت و قطعیت در دیدگاه ،همچنین
به این معنی که هر چه . کالسیک نشان داده شده است]20- 21[یابدمیپایایی کمتر باشد عدم قطعیت افزایش
ي آنگیراندازهي هاشپایایی و روباشد که صفر میضریب پایایی عددي بین صفر تا یک
صد را و یک پایایی صد دراستنشانگر عدم وجود پایاییبنابراین پایایی شاخصی براي . ]22[دهدمینشان
ي هااعم از آزمونهانامهپرسشو هاارزشیابی آزمونباشد میي تحقیقاتی هانامهپرسشغربالگري و تشخیصی و
اول آنکه :و به دو دلیل از اهمیت خاصی بر خوردار است
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1156
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
) Random Error(پایایی حاکی از وجود خطاي تصادفیفاکتورهاي دالیلي است که این خطا به گیراندازهدر
و آزمونفاکتورهاي مرتبط با ،مربوط به آزمون شوندهفاکتورهاي مرتبط با امتیاز،همچنینآن وشرایط برگزاري
اینگونه خطاها تصادفی بوده و اثر شوند که میی ایجاد دهبر این . بینی استآنها بر روي امتیاز آزمون غیر قابل پیش
ت سؤاالاساس چنانچه حجم نمونه افزایش یابد و یا تعداد پایایی دوم، . رودمیي ابزار افزایش یابد پایایی باال هایا آیتم
.]8،2- 9، 23- 24[روایی استپیشگوکننده ي پایاییهاانواع سنجش
مورد استفاده براي سنجش پایایی یک ابزار روشبه دلیل عملکرد و طبیعت ابزار و ) نامهپرسشآزمون یا (
متفاوت زمینه مورد استفادهچگونگی استفاده از آن در گاهی هدف تعیین ضریب پایایی به معناي تعیین . باشدمی
اي کرونباخ، کادر ي آلفهاتوافق درونی است که از روشاما . توان استفاده کردمیدو نیمه کردن ریچارسون و
چنانچه بخواهیم ثبات ابزار را مورد ارزیابی قرار دهیم ي هاتوان از روش آزمون بازآزمون و یا از روش فرممی
گاهی هدف از تعیین ،همچنین. ]25[موازي استفاده نمودا مصاحبه ان یگرب پایایی تعیین توافق بین مشاهدهضری
.باشدمیگان و یا ارزیابان کنندهسنجش توافق درونی در پایایی
) :Cronbach's Alpha(روش آلفاي کرونباخ-1در دانشگاه استنفورد روش 1951در سال کرونباخ
آماري ضریب آلفا را براي حل مشکل تعیین پایایی تریناین روش معمول.ی ابداع کردسؤالي چند هاآزمون
که در بیشتر مطالعات از ضریب پایایی ثبات داخلی است تناسبمیزانمعرفو]26-35[شودمیآن استفاده
مقدار . سنجندمیراسازهیککهستیی اهاآیتمازگروهی
سؤالو یا بیشتر باشد تا یک 7/0آلفا باید حداقل برابر با طه بتواند در یک ابزار باقی بماند و بسیاري از محققان نق
در ابزار ضروري سؤالرا براي باقی ماندن یک 8/0یا درصدي امتیازات 70، ثبات 7/0پایایی برابر با . دانندمی
،22[دهدمیبه دست آمده از یک ابزار را نشان نمرات و روشی براي محاسبه ثبات درونی بر اساس ] 37-36
و هنگامی که باشدمیت سؤاالمیانگین همبستگی درونی از نوع مقیاس لیکرت در ابزار اطالعات به کار رود مقیاسی
محاسبه مقدار ضریب آلفا جهت تعیین پایایی ثبات درونی مقدار عددي .]22، 36، 38-40[امري ضروري است
آلفاي کرونباخ برابر با متوسط مقدار ضریب پایایی است که ي ابزار، پس از آنکه به دو هاي ممکن آیتمهااز کل ترکیب
. ]22، 38، 41- 42[آیدمیقسیم شود به دست نیمه تي سنجش پایایی است هاروشیکی از آلفاي کرونباخروش
که فقط به انجام یک بار آزمون نیاز دارد تا برآوردي از درکل ضریب پایایی ]. 22- 23[پایایی آزمون را فراهم کند
ت یک ابزار به سؤاالآلفاي کرونباخ هنگامی مفید است که و جهت باشندغلط امتیاز بندي نشده –صورت صحیح
به کار در مقیاس لیکرت ت سؤاالسنجش ثبات درونی آلفاي مقدار2003در سال ].23، 36، 41، 43[رودمی
قابل را7/0-8/0،خوبرا8/0- 9/0،عالیرا9/0بیش از کمترو ضعیف را5/0-6/0، قابل بحثرا6/0- 7/0، قبول
. ]37، 44-45[عرفی کردندل مغیر قابل قبورا5/0از]16، 42[فرمول تعیین آلفاي کرونباخ به قرار زیر است
واریانس آیتم ي ابزار هاتعداد آیتمKدر این فرمول که از مجموع کل (واریانس کل ابزار یا تست و .]25، 42[باشدمی) به دست آمده هاآیتم
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
1157و همکارانابوالفضل محمدبیگی
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
) :Split half reliability(ایی دو نیمه آزمونپای-2در این روش یک آزمون به دو نیمه تقسیم شده و
. شودمیرابطه همبستگی بین دو نیمه آزمون سنجیده براي متغیرهاي دو حالتی که کد این آزمون معمول
ي صحیح هاي غلط و کد یک به پاسخهاصفر به پاسخین روش دو نیمه آزمون در ا. رودمیشود به کار میداده
ت باهم مشابه باشند و از سؤاالباید در محتوي و سختی ت ابزار به دو قسمت تقسیم شده سؤاالآنجا که تعداد
که به کار رودهمبستگیضریب بایست روش میاست شودمیبا استفاده از ضریب اسپیرمن و گاتمن محاسبه
ش فرمی از سنجضریب اسپیرمن براون. ]25، 41، 46[پایایی دو نیمه آزمون است که براي برآورد پایایی کل
همبستگی پیرسون بین دو نیمه . رودمیآزمون به کار کند میاز ابزار یا مقیاس را برآورد ايهآزمون، پایایی نیم
اما ضریب پیشگویی اسپیرمن، پایایی کل آزمون را بر مقدار این ضریب . کندمیي آن برآورد هااساس نیمه
است )X2وX1(ي آزمون هار از ضریب پایایی نیمهبیشتمساوي با دو برابر ضریب نیمه آزمون تقسیم و معموالً
بر مقدار یک به اضافه پایایی نیمه دیگر آزمون خواهد ضریب پایایی اسپرمن براون با فرمول زیر محاسبه .بود.]25[شودمی
ي پایایی دو نیمه آزمون، ضریب هادر بین سنجشترتیب و نحوه قرار تأثیرتحت یایی اسپیرمن شدیداًپا
ت ابزار مورد استفاده در هر یک از دو نیمه سؤاالگرفتن دقیقی، در این روش باید به شکل کامالً. باشدمیزمون آ
ت بین دو سؤاالتصادفی انجام شود و تخصیص تصادفی نیمه آزمون باید تساوي واریانس بین دو فرم را تأمین
. ما همیشه این امر باید توسط محقق چک شودا.نمایدشود و مقدار پایایی از میزیرا هیچگاه این امر تضمین ن
ي بعدي متفاوت خواهد بودگیراندازهي به گیراندازهیک کند که پایایی نیمه میفرض ضریب گاتمن]. 2-1، 47[
یکسان است و به تساوي ) دو نیمه فرم(اول و دوم بهترین .نیمه آزمون نیازي نداردي بین دو هاواریانس
تی را که سؤاالشود که هر نیمه مینیمه هنگامی ایجاد به عبارتی .بیشترین همبستگی درونی دارند، شامل شود
که شود به طوريانی که ابزاري به دو نیمه تقسیم زموابسته به همان گروه تی را که شدیداًسؤاالهر نیمه
و گروه ندارند را هستند و هیچگونه وابستگی بین دکمترین مقدار ممکن شامل شود، ضریب دو نیمه گاتمن
وابسته به ت شدیداًسؤاالکه را خواهد گرفت و زمانییکدیگر از هم جدا شده و در دو گروه متفاوت قرار
بشترین مقدار ممکن را گیرند ضریب دو نیمه گاتمن].1، 16، 41[خواهد گرفت
-Kuder(پایایی کادر ریچاردسن-3 Richardson
reliability coefficient:(این .باشدمیKR21و KR20این روش شامل دو آزمون
باشند می) تسؤاالثبات بین (ي همگنی ها، آزمونهاروشابزار یا سؤالي صحیح به غلط را در هر هاکه نسبت پاسخ
یی که پاسخ هادهند و براي آزمونمیآزمون مد نظر قرار در وباشد مفید استمیل صحیح و غلط آنها به شک
ي غلط و کد یک به هاکه کد صفر به پاسخکه صورتیاز ]. 47- 48[شود به کار رودمیي صحیح داده هاپاسخ
لحاظ ریاضی قابل اثبات است که ضریب پایایی کادر ي آزمون به هاریچاردسن برابر با میانگین ضرایب نیمه
در باشدمیک آزمون ي ممکن یهادست آمده از کل نیمه، برابر با آلفاي KR20مقدار ) دو حالتی(هااینگونه آزمون
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1158
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
هنگامی مفید است که KR21اما روش . شودمیکرونباخ از لحاظ سختی با نامهپرسشت سؤاالمطمئن باشیم کل
در این روش آزمون یا ابزار ]. 1، 16، 19، 23[هم برابرندایایی کادر هنگامی مورد پذیرش است که ضریب پ
ي هاباشد اما در آزمون64/0ریچاردسن حداقل برابر با ].18، 45[باالتر باشد80/0استاندارد این مقدار باید از
واریانس کل تست، Var، هاتعداد آیتمnدر این فرمول آیتم مجموع ضرب درصدي از افرادي است که به
هاز کل افرادي است کدر نسبتی ) p(اندپاسخ صحیح داده.]47- 48[باشدمی) q(اندبه آیتم پاسخ غلط داده
سنجش ثبات در پایایی:باز آزمون-پایایی آزمون - الف
ت آزمون درسؤاالدر این روش جهت سنجش پایایی، دو نوبت به یک گروه واحد، تحت شرایط مشابه داده
ایت در نه.شوندمیشود و نمرات حاصل با هم مقایسه میضریب همبستگی بین نمرات حاصل از اجراي دو بار آزمون برآورد شده تا چگونگی شباهت امتیازات مشخص
ترین معمول.رودمیگردد و به عنوان ضریب پایایی به کار روش براي یافتن همبستگی بین نمرات در این روش،
، 41[باشدمیمحاسبه ضریب همبستگی اسپیرمن براون کند که متغیرها یا میفرض بازآزمون -روش آزمون].25
خصوصیات آزمون ،و همچنیني گیراندازهمفاهیم مورد به و ]49[شوندگان در طول دوره تغییر نخواهند کرد
آشنایی آزمون شوندگان با از قبیل معایب آن برخی دلیل مناسب تعیین فاصله زمانی، مشکل در تسؤاالمحتوي
دم عالقه آزمون شوندگان عو براي اجراي دو نوبت آزمون ارزش توسط بسیاري از محققان بیبه اجراي نوبت دوم
محققین سه نوع اثر متفاوت .]41، 49[دانسته شده است
، اثر خستگی(Memory Effect)شامل اثر حافظه (Fatigue Effect) و اثرات ناشی از تغییرات واقعی
(Genuine Change Effect) در مقدار پایایی آزموناثر حافظه که به دلیل . ]23[خواهند بودمؤثربازآزمون ت در آزمون است سبب ایجاد نوعی خطاي سؤاالیادآوري
شده و باعث باال رفتن ) غیر تصادفی(همبستگی گردد که پایایی را میهمبستگی نمرات آزمون و بازآزمون
اثر خستگی نوعی خطاي تصادفی در بازآزمون . بردمیباال خطاي ناشی از . دهدمیر پایایی را کاهش شده و مقدا
گرددمیتغییرات واقعی نیز معموال سبب کاهش پایایی ]23[.
ي هافاصله زمانی بین آزمون و باز آزمون یکی از چالشاصلی در به کار بردن روش آزمون بازآزمون در تعیین
فاصله زمانی مناسب براي انجام دو . استهاپایایی سنجهت متغیرهایی که عامل تحت بررسی را تحت آزمون به ثبا
به عنوان مثال چنانچه .دهد بستگی داردمیقرار تأثیري فشار خون باشد زمان کوتاه گیراندازهمتغیر مورد نظر پدیده هت سنجش نگرش در مورد یک خواهد بود اما ج
اما . روانشناختی به فاصله زمانی طوالنی تري نیاز است، 23، 41، 50[باشدمیچند هفته فاصله زمانی متداول،
دوبینزمانیفاصلهروش،ایندرمهمنکتهبنابراین . ]5نکته مهمی در استفاده از این آزمون است و اعتقاد آزمون
حديتابایدآزموندوبینزمانیفاصلهبر آن است که ازوبیفتداتفاقابزارعباراتفراموشیطرفیازکهباشدندهدرخگیرياندازهموردپدیدهردتغییردیگرطرف
دو هفته تا یک ماه برخی معتقدند که این فاصله را بین.اندپیشنهاد کردهآزمون (ترین آزمون جهت تعیین ثبات قابل قبول
ايخوشهدرونهمبستگیشاخصآزمون) پایایی
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
1159و همکارانابوالفضل محمدبیگی
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
(Interclass Correlation Coefficient)اینچنانچه.است. ]51[استمطلوبثباتمیزانباشد 8/0ازباالترشاخص
یکسانو دقیقاً) یکسان(ي موازي هاپایایی فرم-ب(Parallel & strictly parallel forms reliability):
یی براي آزمون آماري تساوي هااین دو مدل، روشیکسان فرض روش دقیقاً. باشندمیهاو واریانسهامیانگین
درست میانگین و واریانس سؤالکند که امتیازات میکند که میکه مدل موازي فرض مشابهی دارند در حالی
آنها واریانس مشابهی دارند اما الزم نیست که میانگین برآورد پایایی در روش موازي . مشابهی داشته باشند
موازي بر باشد و در مدل دقیقاًمیمساوي با آلفاي کرونباخ ت سؤاالتفاضل میانگین اساس آلفاي کرونباخ بوده ولی از
.]25، 52[آیدمیبه دست Equivalent forms(ي متعادلهاپایایی فرم-ج
reliability(:، به دو فرم جداگانه در مورد یک موضوعدر این روش
ت سؤاالشود و هر فرم تعدادي از مییک گروه مشابه داده به عبارتی دو آزمون معادل در . شودمیآزمون را شامل
یک مفهوم یا متغیر به خصوص تهیه شده و در فاصله موردضریب همبستگی .شودمیکوتاهی به یک گروه واحد داده
ي هابین نمرات حاصل از این دو فرم برابر با پایایی فرماین روش به دلیل مشکل در طراحی و . باشدمیمتعادل
همسان و مساوي در مورد سؤالساخت دو فرم یا نمونه دم عالقه آزمون شوندگان براي پر کردن فرم یک مفهوم، ع
آن در تکمیل فرم تأثیردوم و یادگیري ناشی از فرم اول و ].25، 47[کاربرد زیادي ندارددوم Inter rater or(پایایی بین مشاهده کنندگان- د
observer reliability:(
این ضریب ثبات و همبستگی نمرات بین مشاهده مختلف یک موضوع را ارزیابانکنندگان یا داوران یا
که با ضریب شودمیسنجد و ضریب توافق هم نامیده میکه یک ابزار یا و زمانی] 19، 53[شودمیکاپا نشان داده
ت تشریحی، بر روي افراد مشابهی سؤاالبا نامهپرسشتوسط دو یا چند مصاحبه گر یا پرسشگر به کار رود و
رد ابزار دست یابیم به کار بخواهیم به یک توافق کلی در موضریب کاپا بین صفر تا یک متغیر ]. 16، 25، 54[رودمی
شود و بر اساس مقاالت میاست و به صورت درصد بیان 1موجود دسته بندي قدرت ضریب کاپا به قرار جدول
.]24[استین میزان توافق قدرت مقادیر مختلف ضریب کاپا در تعی- 1جدول
یا داورانانگبین مشاهده کننده
قدرت توافقمقدار آماره کاپا
ضعیفکمتر از صفر
کم2/0-0
پایین تر از متوسط4/0-21/0
متوسط41/0- 60/0
خوب80/0-61/0
عالی1-81/0
حداقل مقدار 1بر اساس مقادیر ارائه شده در جدول باشد و مقادیر باالتر می6/0قابل قبول ضریب کاپا بیش از
. باشدمیآل توافق دو داور یا ارزیاب ایدهدر8/0از تواند با یک میهمانطور که بیان شد ضریب پایایی
،آزمون و یا بیش از یک آزمون محاسبه شود و همچنیني مورد استفاده در یک زمان یا هاتواند آزمون یا آزمونمی
. بیش از یک زمان به کار روند
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1160
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
ي هادر زمانآزمون انجامرابطه بین تعداد دفعات-2جدول در زمان خاصي یک آزمونهاو تعداد فرممختلف
براي الزمدفعاتاجراي آزمون
جهت مورد نیازهايتعداد سنجهتعیین پایایی
آزموندوآزمونیک
یکبار دو نیمه کردنکادر ریچارسونآلفاي کرونباخ
ي موازيهافرم
----- مونزبازآ-آزموندو بار
بر اساس تعداد دفعات انجام یک آزمون و تعداد در کلي آزمون مورد نیاز براي سنجش پایایی یک ابزار به هافرم
دلیل عملکرد و طبیعت آن و چگونگی استفاده در طرح ي فوق را که در هاتحقیقاتی یا جامعه، باید یکی از روش
رابطه بین تعداد دفعات و تعداد و شکل شماره دو 2جدول دهد، مورد استفاده قرار مییک آزمون را نشان ي هافرم. داد
]2[انواع مختلف سنجش پایایی و ارتباط آنها با یکدیگر-2شکل بر اساس نمودار شماره دو نیز مشخص شده است که پایایی دو جزء متفاوت شامل ثبات و توافق درونی را شامل
د و سنجنمیبازآزمون -شود که ثبات زمانی را با آزمونمیي دو نیمه کردن، هاتوان با یکی از روشمیتوافق درونی را
توافق بین داوران با استفاده از ضریب کاپا و یا آلفاي .کرونباخ تعیین نمود
تعریف روایییی که اعتبار آنها هاي محقق ساخته و سنجههاسنجه
رسیده باشد تأییدي دیگر به هاو زبانهادر فرهنگیی با نسخ هادر سنجه. باشندمیی نیازمند اعتبار سنجتوسط دو فرد متبحرنامهپرسشابتدا التین یا زبان بیگانه،
. شودمیاز زبان اصلی به زبان فارسی ترجمه ) و یا بیشتر()يهامتن(بررسی دو متندر مرحله بعدي طی مقایسه و
از نظر کیفیت با یکدیگر مقایسه میشوند و ترجمه شده در مواردي مشاوره با . گیرندمیر مورد ارزیابی قرا
در گیرد و میو فردي انگلیسی زبان صورت ینمترجمبراي عبارات، ترجمهترین نهایت براي انتخاب مناسب
تا در مورد هي اولیه صورت گرفتهاتلفیق و ترکیب ترجمهبدین طریق یک نسخه فارسی مشترك توافق گردد و
سپس . دوشمیبه یک ترجمه واحد تبدیل نامهپرسشنسخه نهایی ترجمه شده، جهت برگرداندن از زبان فارسی
مترجم یکدر اختیار ) ترجمه معکوس(به زبان اصلی.گیردمیقرار دیگر که متن اولیه انگلیسی را ندیده بود،
هدف از این کار اطمینان بیشتر از صحت ترجمه بهترجمه شدههپس از مقایسه نسخ. استنامهپرسش
و مشاوره با مترجم نامهپرسشبا متن اصلی انگلیسی در بر (، یکسانی مفهومی و فرد انگلیسی زبانمربوطه
و ) نامهپرسشداشتن محتواي مفهومی نسخه اصلی سپس نسخه نهایی . گرددمیکیفیت کلی ترجمه بررسی
معکوس و با نظر نامهپرسشفارسی بر اساس ترجمه نهایی در نهایت جهت . ددگرمیمترجمان و متخصصین تهیه
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
1161و همکارانابوالفضل محمدبیگی
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
، روایی )Face Validity(تعیین روایی ابزار، روایی صوري Construct(و روایی سازه ) Content Validity(محتوي
Validity (اده باید بررسی و ابزار یا سنجه مورد استفساخته، پس از ي محقق هانامهپرسشدر . ارزیابی گرددنظر تیم موردنامهپرسشت و تهیه سؤاالتهیه بانک
بدین صورت . گیردمیپژوهش، نیز تعیین روایی صورت ي دیگر و چه در هاي برگردان از زبانهاچه در سنجه
ي محقق ساخته، پس از تهیه نسخه نهایی فارسی هاسنجهشود تا در می، در ابتدا روایی صوري بررسی نامهپرسش
نامهپرسشکل اعتبار نامهپرسشصورت نیاز به تغییر . وش تغییر نشوددستخ
قضاوت عینی در مورد ی صوريیروا: روایی صوريت سؤاالاز نگاه گروه هدف به این ساختار ابزار است و
صورت ظاهري ه آیا ابزار طراحی شده ب:دهد کهمیپاسخ با هدف مطالعه مرتبط است؟ آیا افرادي که قرار است به
افق بندي ابزار موزار پاسخ دهند، با عبارات و جملهاب)گروه هدف(هستند؟ آیا برداشت افراد غیر متخصص
اء و آیا اجزهمان برداشتی است که مورد نظر محقق است؟.]2[باشدمیدهندگانکلیت ابزار قابل پذیرش پاسخ
از دو روش توانمیابزار روایی صوريبراي تعیین در روش کیفی و .نموداستفاده کمی روایی صوريو کیفی
با کمک متخصین امر د تعیین روایی صوري، درآغاز فرآین، از نامهپرسشي مرتبط با زمینه تحقیقاتی و هادر رشته
متخصصین آمار و اپیدمیولوژي و بر حسب موضوع از براي . شودمیمتخصصین روانشناسی یا علوم دیگر استفاده
همبستگی آنها با نمره کل سؤالارزیابی ضریب تمیز هر فارسی به دو نامهپرسشمنظور بدین. شودمیسنجیده
ي هافرد هیأت علمی متبحر در زبان انگلیسی و واژهشود تا نسخه نهایی فارسی را از نظرمیتخصصی داده
ي هااستفاده از واژه(مطلوب بودن عبارات به لحاظ وضوح پرهیز از به (کاربرد زبان مشترك ،)ساده و قابل فهم
ورد بررسی قرار م) ي فنی و تخصصیهاکارگیري واژهتوان تغییراتی را در سنجه مورد میدر صورت لزوم . دهند
استفاده در جهت ساده تر کردن و قابلیت درك بیشتر براي دریافت نظرات گروه هدف، ،همچنین. انجام داد
در دشواري یافتناز آنها جهتايهبا نمونايهمصاحب،هاآیتمتناسب و ارتباط مطلوب ،کلماتودرك عبارات
ي نارسا از عبارات و یا هااحتمال وجود ابهام و برداشتشود و در صورت میانجام وجود نارسایی در معانی کلمات
نظرات آنان به صورت تغییراتی وجود مشکالت بایستی .دواعمال شنامهپرسشدر جزئی
به صورت کمی را با استفاده ازهاسنجهروایی صوري براي بدین منظور . کنندمیي رگیاندازهآیتم تأثیرروش
ی در نظر تقسم5طیف لیکرتی ، سنجهي هاهریک از آیتممهم است ،)5امتیاز (کامالً مهم است : دوشمیگرفته
اندکی ،)3امتیاز (طور متوسطی مهم است ه ب،)4امتیاز (سپس .)1امتیاز(و اصالً مهم نیست )2امتیاز (مهم است
گروه در اختیار وري صجهت تعیین روایی نامهپرسشتوسط هانامهپرسشپس از تکمیل گرفته وقرار هدف
آیتم، روایی تأثیرگروه هدف، با استفاده از فرمول روش .گرددمیصوري محاسبه
آیتم، فراوانی تکرار امتیاز توسط گروه تأثیردر فرمول . دهدمیهدف را نشان روایی محتوي
پاسخ یتسؤاالچنینی محتوي بطور معمول به یارومهم و اصلی جوانبآیا ابزار طراحی شده همه که دهدمی
ي ابزار هاي را در بردارد؟ آیا سازهگیراندازهمفهوم مورد
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1162
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
کند؟ آیا اجزاء و کلیت میهمان چیزي را که باید بررسی جهت تعیین باشد؟میابزار قابل پذیرش متخصصان ذیربط
کمی روایی و از دو روش کیفی توان میمحتواي رواییسنجش اعتبار کیفی در روش . ]55[کرداستفاده ا محتوتوان مصاحبه با متخصصین در پیامد مورد می، محتوامشاوره با متخصصین اپیدمیولوژي ،ي و همچنینگیراندازهدر ارزیابی کیفی روایی محتوا رعایت دستور . داشتو آمار
قرارگیري ، هااهمیت آیتماز کلمات مناسب، زبان، استفادهزمان تکمیل ابزار طراحی ها در جاي مناسب خود،آیتم
آوري ارزیابی پس از جمع. مورد توجه قرار میگیردشده مورد تغییرات ، با مشاوره با اعضاي تیم تحقیق،متخصصین
.]55- 56[یردمورد توجه قرار گبایستی میدر ابزار نیازتر مطالعات تنها به ذکر این نکته بسنده گرچه در بیش
شود که روایی محتوي توسط متخصصین و میاما باید توجه ]26، 28، 30- 32[صاحبنظران بررسی شد
داشت که این شیوه از نظر متدولوژي خالی از اشکال اساس نظرات بر روایی محتوي به صورت کمی نیز . نیست
ی محتواینسبت روادو شاخص متخصصین و با محاسبه Content Validity Ratio (CVR) ی محتوایشاخص رواوContent Validity Index (CVI) 60[شودمیمحاسبه-
ترین رین و صحیحمتجهت اطمینان از اینکه مه.]57نسبت انتخاب شده است از شاخص ) ت آیتمضرور(محتوا
ي ابزار به هاکه آیتمبراي اطمینان از اینی محتوا ویروااز اند ي محتوا طراحی شدهگیراندازهن نحو جهت بهتری
جهت تعیین نسبت . گرددمیی محتوا استفاده یشاخص روااز تعدادي از متخصصین و میروایی محتوي به صورت ک
شود تا در مورد هر کدام از میصاحبنظران استفاده به سه طیف آیتم ي ابزار یا سنجه مورد استفاده هاآیتم
مفید اما ضروري نیست و ضرورتی ضروري است، شامل
بهتر آن است که از تعداد ارزیابان . پاسخ دهند،نداردبر اساس CVR. استفاده شود) نفر10باالتر از (بیشتري
:شودمیمحاسبه نظز داوران به قرار ذیل
تعداد ارزیابانی است neدر فرمول نسبت روایی محتوي، Nدانند و میکه گویه مورد نظر را ضروري یا سودمند
نی است که یک گویه را بررسی تعداد کل ارزیابان یا داوراي یک هادر تستCVRحداقل مقادیر . ]57، 59[اندکرده
- 61[آمده است3در جدول Lawsheطرفه مورد نظر 59[.
ي یک طرفه مورد نظر هادر تستCVRحداقل مقادیر - 3جدول Lawsheجهت مناسب بودن روایی محتوي
داد ارزیابانتع حداقل مقدار نسبت روایی محتوي
5 99/06 99/07 99/08 75/09 78/010 62/015 49/020 42/025 37/030 33/035 31/040 29/0
را CVIتوان شاخص می، CVRو محاسبه پس از تعیین براي محاسبه این شاخص، ارزیابان . محاسبه نمود
سه در خصوص ، م ابزار مورد استفادهبایست به هر آیتمیسادگی و روان بودن و ،معیار مربوط یا اختصاصی بودن
قسمتی 4بر اساس طیف لیکرتی ،ا شفاف بودنوضوح ی
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
1163و همکارانابوالفضل محمدبیگی
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
بودنمربوطمعیارجهتثالًم. نمایندمیاظهار نظر ، و 2=استمربوطنسبتاً،1=نیستمربوط، يهاگزینهگرفتهکاربه، 4=استمربوطکامالًو 3=استمربوط
شاخص روایی CVIسپس با استفاده از فرمول شود و می].57، 59، 62- 64[گرددمیمحتوا محاسبه
اندداده4و 3نسبت تعداد ارزیابی که به آیتم نمره =Cv1 تعداد کل ارزیابان
مفهوم مرکبی است که مستلزم بررسی : روایی سازهکه شامل روایی چند مرحله است و با روایی ضابطه
همزمان، روایی پیشگویی کننده ، روایی تمایز و روایی .]2[شودمیهمگرایی است سنجیده
Criterion-related(روایی ضابطه Validity( :ايهدرجاز توافق بین یک تست با یک یا تعداد بیشتري تست
که بهتر است دقیق و ایده آل (معتبر دیگر در همان زمینه که معموالً با استفاده از ضریب همبستگی بین است ) باشد
. ]2[شودمیآنها سنجیده هنگامی : )Concurrent Validity(روایی همزمان- الفدر حال حاضر وجود ) استاندارد(شود که معیار میبرآورد
توان در یک بررسی از کارمندان میبه عنوان مثال . داردان یک ضابطه از میزان حقوق دریافتی را پرسید و به عنو
مدارك حسابداري به عنوان ضابطه استفاده نمود و همبستگی مقدار حقوق گزارش شده با مقدار واقعی آن بر
. اساس مدارك موجود را محاسبه کرد: )Predictive Validity(روایی پیشگویی کننده-ب
هنگامی کاربرد دارد که معیار در حال حاضر وجود ندارد و هدف آن است تا بدانیم یک . افتدمیاتفاق در زمان آینده
تواند پیامدي را در آینده میمقیاس یا ابزار تا چه اندازه به عنوان مثال بر اساس نمره میان ترم ،بینی کندپیش
رد شدن آنها را در پایان ترم دانشجویان قبولی و یا .]2[بینی کنیمپیشConvergent(روایی همگرایی-ج Validity( که
مربوط به سؤالقوي میان عبارتست از همبستگی نسبتاًبنابر توصیه سازمان اروپایی که یک حیطه با همان حیطه
تحقیقات و درمان سرطان ضریب همبستگی پیرسون باید بندي اصل در جهت گروه. ]2، 63[باشد4/0بزرگتر از
متغیرها نیز در یک حیطه خاص بر این منوال است که مبستگی جدول ماتریس همبستگی کمتر چنانچه ضریب ه
بیانگر مهم بودن متغیر ±4/0باشد حداقل بوده، ±3/0از حیطه مورد نظر بیانگر اهمیت اساسی متغیر در±5/0و
محاسبه ±3/0ضریب همبستگی کمتر از اما چنانچه . استشود محقق باید بررسی کند که آیا کاربرد تحلیل عاملی
براي ابزار مناسب ) شودمیداخته در ادامه مقاله به آن پر(.]58[بوده یا خیر؟
بر که Discriminant Validity)(روایی تمایز- دت مربوط به یک حیطه با سؤاالهمبستگی ضعیف بین
به عبارت دیگر ضریب . داللت داردهادیگر حیطهي دیگر باید کمتر از هابا حیطهسؤالهمبستگی یک
ي مربوط به خودش هاهبا حیطسؤالضریب همبستگی آن عالوه بر آنکه باید با ابزارهاي دیگر که موفقابزاریک. باشد
بابایدکند همگرا باشد میي گیراندازهسازه مشابه را بارانظریهیککهدیگريمفاهیميهاابزارهاي یا مقیاس
داشتهباالییهمبستگینیززندمیپیوندکانونیمفهومکافیامااستالزمهمگرااعتبارندهرچآنبرعالوه.باشد
زیرااستالزمهمگرااعتبارحددرتفکیکیاعتبارونیستغیرايپدیدهسنجشدرهاابزارحساسیتبررسیبه
رامفهومبودنگستردهیاابهاممیزانوپردازدمیمربوط
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1164
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
نشان دهنده انواع 3شکل . ]2، 58، 63[دهندمینشان.تي روایی اسهازیرشاخه
ي مختلف سنجش روایی سازه و ابعاد مختلف هاروش- 3شکل روایی ضابطه و ترجمه
و روایی روایی سازه منتج از روایی ترجمه بنابراین باشد که روایی ترجمه با تعیین روایی صوري و میضابطه
آید و روایی ضابطه شامل چهار میروایی محتوي به دست یی، روایی تمایز و روایی بعد روایی همزمان، روایی همگرا
.]2[باشدمیپیشگویی ابزار یک ي هاآیتم) Construct Validity(ساختار روایی
تحلیل عاملی . شودتعیینتواند بر اساس تحلیل عاملی میگیرد که شامل تحلیل عاملی میبه دو شکل کلی انجام
تحلیل عاملی اکتشافی در بیشتر. یدي استأیاکتشافی و تقابل اجرا SPSSرهاي آماري در دسترس از جمله افزانرم
قابل SPSSیدي با أیکه تحلیل عاملی تاست حال اینافزارها براي اجراي آن انجام نبوده و باید از سایر نرم
یدي هنگامی کاربرد دارد أیتحلیل عاملی ت. استفاده نمودمورد استفاده از روایی سازه مناسب نامهپرسشکه ابزار یا
کارهاي قبلی به کار تأییدار باشد و به منظور برخوردرود بنابراین امکان استخراج فاکتورهاي جدید در این می
عاملی اکتشافی تحلیل . نوع تحلیل عاملی وجود نداردPrinciple Component(اصلیيهالفهؤممعموال با روش
Analysis (PCA) ( میاندرونیارتباطگیرد و میانجاممتغیرهاازطبقاتیتا دهدمیقراربررسیوردمرامتغیرها
هستند را کشف نمایدیکدیگرباارتباطبیشتریندارايکههایی از ابزار که در هر به این صورت آیتم. ]11، 58، 65[
دهند میفاکتور بیشترین همبستگی را با یکدیگر نشان ي مورد استفاده در تبین هر فاکتور یا هاتوانند آیتممی
تطابق و میزانبررسیجهت. ه ابزار قرار گیرندلفؤماز چرخش واریماکس و یا امل استخراج شدهوعنامگذاري
. ]58- 59، 66-68[گرددمیپروماکس استفاده نمونهنکته مورد توجه در تحلیل عاملی پرداختن به
بارتلتکرویتآزمونو (KMO)الکینمایرکیسرگیري)BT (یا ارزش ویژه عطفطهنقو همچنین مقدار عددي
Egenvalueًدر نظر گرفته 1برابر بااست که معموالحفظبراينیازموردعاملیبارحداقلعنوانبهشود و مینظردرعاملیتحلیلازشدهاستخراجعواملدرعبارتهر
قابل ذکر است که در تحلیل عاملی، مقدار . شودمیگرفتهDeterminantر و مقدار کاي اسکوئبایست مخالف صفرمی
دار از نظر آماري باشد و آزمون بارتلت عددي بزرگ و معنیبه عدد یک نزدیک باشد تا KMOهمچنین معیار
گیري و حجم نمونه کافی براي دهنده کفایت نمونهنشاندر خصوص . اجراي تحلیل عاملی مدنظر قرار گرفته شود
ت حجم نمونه الزم جهت انجام تحلیل عاملی تناقضانمونه را 300حداقل Tabachnick. متفاوتی وجود دارد
و Hairداند اما میبراي انجام تحلیل عاملی ضروري کنند که حجم نمونه باید بیش از میبیان ]69[همکاران
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
1165و همکارانابوالفضل محمدبیگی
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
LeeوComreyباشد اما برخی منابع دیگر از جمله 100
را 200را ضعیف، 100اند که بندي انجام دادهطبقه]70[و 1000را خیلی خوب و 500را خوب، 300خوب، تاًنسب
.]58، 66- 68، 70[اند بیشتر را عالی معرفی کردهدر آخر ذکر این نکته ضروري است که روایی و پایایی از
ي و دستیابی به مقادیر گیراندازهي الزم جهت هاشاخصآگاهی و فهم کافی از آنها یکی از . باشدمیواقعی پیامدها
ي هاولوژي در طراحی مطالعات و سنجشاصول متدمختلف است که متاسفانه در بسیاري موارد نادیده گرفته
توان میبر اساس موارد ذکر شده در تعیین پایایی . شودمیت قبلی سؤاالت مشابه با سؤاالافزایش تعداد بیان کرد که متجانس و همگون کردن ، تر کردن آزمونبراي طوالنی
افزودن ، با ضریب دشواري متوسطتاالسؤافزودن ، تسؤاالگیري آزمون بر روي به کار، با ضریب تمیز باالتسؤاال
گروهی از افراد که از نظر توانایی پاسخگویی به آزمون گیري آزمون سرعت، به کار،و همچنیندارندمیتجانس ک
در مؤثرعوامل از یعنی اجراي آزمون در یک زمان محدود، 23، 47-48[باشندمیهاا یا سنجهابزارهافزایش پایایی
سنجش روایی نیز نیازمند آگاهی از علم آمار و ].1یابی به مقدار واقعی ي آماري است تا در دستهاروش
ریزي در جهت بنابراین برنامه. مفید واقع شودپیامدهاي گیراندازهطراحی و کاهش خطاهاي غیر تصادفی در
ار اضافه کرده و قدرت نتایج تواند به پایایی و روایی ابزمی
کم گزارش دهی و عدم گزارش . مطالعه را افزایش دهدروایی ممکن است به دالیلی از جمله کم بودن حجم
. ]5[نمونه، طراحی ضعیف مطالعه و یا کاهش منابع باشدین قاز آنجا که هدف نوشتار حاضر آشنایی محق،همچنین
ي مختلف هاو شیوهو دانشگاهیان با مفاهیم روایی و پایاییترین وجه ممکن ي آن است سعی شد تا به سادهگیراندازه
. مطالب مورد نیاز با یک روال منظم و منطقی بیان گرددي پیچیده واریانس ضرایب پایایی و یا هالذا از ذکر فرمول
. مفاهیم آماري مربوط به تحلیل عاملی صرف نظر شد
گیرينتیجهتایج طی زمان و قابلیت تکرار از ثبات نايهپایایی درج
باشد که سنجش پایایی عالوه بر روش معمول میآنها . ي استگیراندازهي دیگر نیز قابل هاآلفاي کرونباخ با روش
باشد و ابعاد میاز صحت نتایج ايهکه روایی درجدر حالیا توجه محققین و پژوهشگران و لذ. گوناگونی دارد
ه ارائه نتایج و آمار دقیق و اندرکاران نظام سالمت بدستي پایا و هاتواند در نتیجه استفاده از سنجشمیصحیح
یی که عالوه بر کم هاسنجش. قابل اعتماد به دست آیدخطاي منظم نیز بتواند دوري کردن خطاهاي تصادفی از
.کندتشکر و قدردانی
بدینوسیله از همکار محترم جناب آقاي دکتر شهرام ارسنگ .یمینمامیدس محسن مختاري تشکر و قدردانی جنگ و مهن
References
[1] Cook DA, Beckman TJ. Current concepts in validity
and reliability for psychometric instruments: theory
and application. The American j of Med 2006; 119(2):
166, 7-16.
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1166
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
[2] Drost EA. Validity and Reliability in Social Science
Research. Education Research & Perspectives 2011;
38(1):105-123
[3] Golafshani N. Understanding reliability and validity
in qualitative research. The qualitative report 2003;
8(4): 597-607.
[4] Streiner DL, Norman GR, Cairney J. Health
measurement scales: a practical guide to their
development and use: Oxford university press; 2014;
[5] DeVon HA, Block ME, Moyle Wright P, Ernst DM,
Hayden SJ, Lazzara DJ, et al. A psychometric
toolbox for testing validity and reliability. J Nursing
Scholarship 2007; 39(2): 155-64.
[6] Amiri P, Ardekani EM, Jalali-Farahani S,
Hosseinpanah F, Varni JW, Ghofranipour F, et al.
Reliability and validity of the Iranian version of the
Pediatric Quality of Life Inventory™ 4.0 Generic
Core Scales in adolescents. Quality of Life Research
2010; 19(10): 1501-8.
[7] Cuthbert SC, Goodheart GJ. On the reliability and
validity of manual muscle testing: a literature review.
Chiropractic & Manual Therapies 2007; 15(1): 4
doi:10.1186/1746-1340-15-4.
[8] Healy M, Perry C. Comprehensive criteria to judge
validity and reliability of qualitative research within
the realism paradigm. Qualit Mark Res: An int J
2000; 3(3): 118-26.
[9] Litwin MS. How to measure survey reliability and
validity. Sage; 1995;
[10] Pearson Executive Office . PCAT Reliability and
Validity 2015-2016 . San Antonio, Product Number
65685PCAT: 2012.
[11] Pintrich PR, Smith DA, García T, McKeachie WJ.
Reliability and predictive validity of the Motivated
Strategies for Learning Questionnaire (MSLQ).
Educational and psychological measurement 1993;
53(3): 801-13.
[12] Quinn TJ. Validity and Reliability of the Outdoor
Education Practicum Questionnaire [microform] /
Thomas James Quinn. [Washington, D.C.]:
Distributed by ERIC Clearinghouse; 1998.
[13] Holbert RL, Lee J, Esralew S, Walther WO,
Hmielowski JD, Landreville KD. Affinity for
political humor: An assessment of internal factor
structure, reliability, and validity. Humor.
2013;26(4):551-72
[14] Lang W, Wilkerson J. Accuracy vs. Validity,
Consistency vs. Reliability, and Fairness vs. Absence
of Bias: A Call for Quality. Annual Meeting of the
American Association of Colleges of Teacher
Education (AACTE); New Orleans, LA.2008.
[15] Mohammadbeigi A, Tabatabaee S,
Mohammadsalehi N, editors. Measurment of Tests's
Reliability 8th National Conference of Medical
Education, 2006; Kerman.
[16] . Wells CS, Wollack JA. An instructor’s guide to
understanding test reliability. Testing &
Evaluation Services publication, University of
Wisconsin Retrieved January. 2003;4:2006.
[17] Carmines EG, Zeller RA. Reliability and validity
assessment. Sage 1979.
[18] Seif AA. Evaluation and assessment of educational
progeression. Agah Publication, Tehran, 1992
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
1167و همکارانابوالفضل محمدبیگی
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
[19] Downing SM. Reliability: on the reproducibility of
assessment data. Medical Education 2004; 38(9):
1006-12.
[20] Lafaille R, Wildeboer H. Validity and Reliability of
Observation and Data Collection in Biographical
Research: International Institute for Advanced Health
Studies v.z.w. Antwerp 1995.
[21] Cuttance P, Ecob R. Structural modeling by
example: Applications in educational, sociological,
and behavioral research: Cambridge University Press,
New york. 2009
[22] Gliem JA, Gliem RR, editors. Calculating,
interpreting, and reporting Cronbach’s alpha
reliability coefficient for Likert-type scales2003:
Midwest Research-to-Practice Conference in Adult,
Continuing, and Community Education.2005..
[23] Sechrest L. Reliability and validity Research
Methods in Clinical Psychology 1984: 24-54.
[24] Gwet KL. Handbook of inter-rater reliability: The
definitive guide to measuring the extent of agreement
among raters. Advanced Analytics LLC 2014
[25] Webb NM, Shavelson RJ, Haertel EH. Reliability
coefficients and generalizability theory. Handbook of
Statistics 2006; 26: 81-124.
[26] Ghamari F, Mohammadbeigi A, Mohammadsalehi
N, Hashiani A. Internet addiction and modeling its
risk factors in medical students, Iran. Indian J
Psychol Med 2011 ;33:1562-68..
[27] Mohammadbeigi A, Mohammadsalehi N.
Prevalence of Internet Addiction and Related Risk
Factors in Students. J Guilan Univ Med Sci 2011;
20(78): 41-8.
[28] Abolfazl M, Hamidreza TS, Narges M, Maryam Y.
Gestational diabetes and its association with
unpleasant outcomes of pregnancy. Pak J Med Sci
2008; 24: 566-70.
[29] Ahmadi A, Ershad M, Givzadeh H, Mohammad-
Beigi A. General physicians' knowledge about
nutrition in Shiraz, Iran. Pakistan J of Biol Sci 2009;
12(13): 981-5.
[30] Bayati A, Beigi M, Salehi M. Depression prevalence
and related factors in Iranian students. Pak J Biol Sci
2009; 12(20): 1371-5.
[31] Beigi A. Musculoskeletal symptoms among workers
of metal structure manufacturing industry in Shiraz,
2005. Iran J Epidemio 2009; 5(3): 12-7.
[32] Beygi A, Salehi N, Bayati A. Prevalence of
unintended pregnancy and its related factors in Arak
2007. Koomesh 2009; 10(3): 201-6.
[33] Hassanzadeh J, Mohammadbeigi A, Eshrati B,
Rezaianzadeh A, Rajaeefard A. Determinants of
Inequity in Health Care Services Utilization in
Markazi Province of Iran. Iran Red Crescent Med J
2013; 15(5): 363.
[34] Mohammad BA, Tabatabaei S, Mohammad SN,
Yazdani M. Factors influencing cesarean delivery
method in Shiraz hospitals. Iran J Nursing (IJN)
2009; 21(56): 37-45.
[35] Tabatabaee HR, Mohammad-Beigi A, Yazdani M,
Zeighami B, Mohammad-Salehi N. Gestational
diabetes risk factors modeling in pregnant women. Int
J of Diab Develop Coun 2007; 27(1): 11-3.
[36] Helms JE, Henze KT, Sass TL, Mifsud VA. Treating
Cronbach’s alpha reliability coefficients as data in
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1168
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
counseling research. The Counseling Psychologist
2006; 34(5): 630-60.
[37] DeVellis RF. Scale development: Theory and
applications. Sage Publications 2011;
[38] Cronbach L, Meehl P. Construct validity in
psychological tests'. Personality: Critical Concepts
1998; 52: 135.
[39] Cronbach LJ, Meehl PE. Construct validity in
psychological tests. Psychological bulletin 1955;
52(4): 281.
[40] Ghasemi V. Cronbach Coefficient Alpha and some
of Its Specialties With Em phasis on Applications in
Social Research. Humanities 2005; 19(2): 155-74.
[41] Guttman L. A basis for analyzing test-retest
reliability. Psychometrika 1945; 10(4): 255-82.
[42] Cronbach LJ, Shavelson RJ. My current thoughts on
coefficient alpha and successor procedures.
Educational and Psychological Measurement 2004;
64(3): 391-418.
[43] Tavakol M, Dennick R. Making sense of Cronbach's
alpha. Int J Med Edu 2011; 2: 53.
[44] Sijtsma, K., On the use, the misuse, and the very
limited usefulness of Cronbach’s alpha.
Psychometrika 2009; 74(1): 107-20.
[45] George D, Mallery M .Using SPSS for Windows
step by step: a simple guide and reference. Boston,
MA: Allyn & Bacon 2003;
[46] North Carolina State University. Introduction to
Reliability. 2012. Available at http://www-
4.ncsu.edu/~jlnietfe/
EDP560_Notes_files/Reliabilty.pdf. Access date;
04/04/2014.
[47] Introduction to Reliability. http://www4.ncsu.-
edu/~jlnietfe/EDP560_Notes_files/Reliabilty.pdf.
Access date; 2014.04.04.
[48] Miller IW, Epstein NB, Bishop DS, Keitner GI. The
McMaster Family Assessment Device: Reliability
and Validity. J Marital and Family Therapy 1985;
11(4): 345-56.
[49] Trochim WM. An introduction to concept mapping
for planning and evaluation. Evaluation and Program
Planning 1989; 12(1): 1-16.
[50] Knapp TR, Brown JK. Ten measurement
commandments that often should be broken.
Research in Nursing & Health. 1995; 18(5): 465-9.
[51] Najafi F, Kheyri B. Investigating the Impact of
Country of Origin on Customer Behavior:
Investigation of the Moderating Roles of Product
Involvement and Product Familiarity on Product
Evaluation and Customer Behavioral Intentions. J
Marketing Manangment 2013; 17: 37-60.
[52] Kristof W. The statistical theory of stepped-up
reliability coefficients when a test has been divided
into several equivalent parts. Psychometrika 1963;
28(3):221 -38.
[53] Fleiss JL, Levin B, Paik MC. The measurement of
interrater agreement. Statistical methods for rates and
proportions. 1981; 2: 212-36.
[54] Kundel H, Polansky M. Measurement of observer
agreement. Radiology 2003; 228: 303-8.
[55] Polit DF, Beck CT. The content validity index: are
you sure you know what's being reported? Critique
and recommendations. Research in Nursing & Health
2006; 29(5): 489-97.
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
1169و همکارانابوالفضل محمدبیگی
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
[56] Yaghmale F. Content validity and its estimation. J
Med Edu 2009; 3(1): 25-7.
[57] Heravi-Karimooi M, Anoosheh M, Foroughan M,
Sheykhi MT, Hajizadeh E. Designing and
determining psychometric properties of the Domestic
Elder Abuse Questionnaire. Iran J Ageing 2010;
5(15): 7-21.
[58] Williams B, Brown T, Onsman A. Exploratory
factor analysis: A five-step guide for novices. J
Emergency Primary Health Care 2012; 8(3): 1.
[59] Lawshe CH. A Qualitative Approach to Content
Validity. Personnel Psychology 1975; 28(4): 563-75.
[60] Newman I, Lim J, Pineda F. Content Validity Using
a Mixed Methods Approach: Its Application and
Development Through the Use of a Table of
Specifications Methodology. J Mixed Methods
Research 2013.
[61] Hassanzadeh Rangi N, Allahyari T, Khosravi Y,
Zaeri F, Saremi M. Development of an Occupational
Cognitive Failure Questionnaire (OCFQ): Evaluation
validity and reliability. Iran Occupational Health
2012; 9(1): 29-40.
[62] Polit DF, Beck CT, Owen SV. Is the CVI an
acceptable indicator of content validity? Appraisal
and recommendations. Research in Nursing & Health
2007; 30(4): 459-67.
[63] Rubio DM, Berg-Weger M, Tebb SS, Lee ES, Rauch
S. Objectifying content validity: Conducting a
content validity study in social work research. Social
Work Research 2003; 27(2): 94-104.
[64] Wynd CA, Schmidt B, Schaefer MA. Two
quantitative approaches for estimating content
validity. West J Nurs Res 2003; 25(5): 508-18.
[65] Hayton JC, Allen DG, Scarpello V. Factor retention
decisions in exploratory factor analysis: A tutorial on
parallel analysis. Organizational Research Methods
2004; 7(2): 191-205.
[66] Tabachnick BG, Fidell L. Using Multivariate
Statistics: New York: Harper & Row.; 2012.
[67] Tabachnick BG, Fidell LS, Osterlind SJ. Using
multivariate statistics New York: Harper & Row
2001.
[68] Zare-Chahoki M. Multivariate Analysis Method In
SPSS Software 2010. Tehran: Tehran University;
Available at URL: http://utcan.ut.ac.ir/-
member/syllabus/ mazare/multivariate.pdf
[69] Hair JF. Multivariate data analysis. Upper Saddle
River, NJ Pearson Prentice Hall, New York; 2006.
[70] Comrey, Andrew L., and Howard B. Lee. A first
course in factor analysis. Academic Press, New York,
2013.
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020
...گیري آنها درهاي مختلف اندازها و روشروایی و پایایی ابزاره1170
1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان
Validity and Reliability of the Instruments and Types of MeasurmentS in
Health Applied Researches
A. Mohammadbeigi1 , N. Mohammadsalehi2, M. Aligol3
Received: 28/08/2014 Sent for Revision: 26/01/2015 Received Revised Manuscript: 01/02/2015 Accepted: 25/02/2015
Background and Objective: Nowadays, by extension of research in medical and social sciences, education and
managing most of outcomes measurers by cheklists,questionnaires, scales and educational tests or raters
evaluations to quantify the human behaviors. Reliability and validity are the most important indexes in
measurement to obtain true values. Enough knowledge and understanding the reliability and validity are
important principle of methodology in study designing. Unfortunately, psychometric aspects of measures have
not been applied in some situations and studies. The objective of current document is to show the concepts of
reliability, validity, psychometric aspects and their types of measurements for researchers .
Key words: Validity, Reliability, Psychometric , Cranach's Alpha, Kappa Coefficient, Factor Analysis
Funding: This study was funded by Qom University of Medical Sciences.
Ethical approval:The Ethics Committee of Qom University of Medical Sciences approved the study.
Conflict of interest: none declared.
How to cite this article. Mohammadbeigi A, Mohammadsalehi N, Aligol M. Validity and Reliability of the Instruments
and Types of Measurment in Health Applied Researches. J RafsanjanUniv Med Sci 2015; 13(10): 1153-70. [Farsi]
1- Assistant Prof., Dept. of Epidemiology and Biostatistics, Health Policy and Promotion Research Center, Qom University of MedicalSciences, Qom, Iran(Corresponding Author), Tel: (025)37842228, Fax: (025) 37842228, E-mail: [email protected]
2- MSC of Epidemiology, Health Policy and Promotion Research Center, Qom University of Medical Sciences, Qom, Iran3- PhD Student of Health Education and Promotion, Shahid Beheshti University of Medical Sciences, Tehran, Iran
Dow
nloa
ded
from
jour
nal.r
ums.
ac.ir
at 1
4:25
+03
30 o
n M
onda
y Ja
nuar
y 27
th 2
020