View
255
Download
6
Embed Size (px)
Citation preview
第六章
衡量
2
6.1 衡量的定義 「衡量」 (measurement ,測量 ) 是針對某一特定對象、人或組織,有關某種特徵或行為 ( 消費、所得、人格特質…… ) ,賦予其一個值,使其數值能代表 ( 或符合 ) 構念中所代表的概念或狀況。
3
6.1.1 數值系統可分四大類1. 名義尺度 (nominal scale) :係為了標示目的而
指定之任意數值,例如,身分證號碼、性別、運動員之背號及學生的學號等。此種數值彼此間並無大小、順序及比率的關係,也就是說以 1 表示男性, 2 表示女性時
2. 順序尺度 (ordinal scale) :不僅可表示類別,也可表示出事物間之等級或順序。例如第一、二、三名來表示參賽者之優劣。故順序變數可比大小及前後,但前後距離不一定相等。例如, 5 > 4 ,但 5-41 。例如,研究者常用 Likert 五點計分量表所得數據,可能是 1 ~ 5 分,亦可能是 -2~ +2 分,這種資料屬於順序變數。
4
3. 等距尺度 (interval scale) :又稱為區間尺度,不僅可表示名稱和順序或等級,還可表示不同等級間之距離。例如 , 5-4=1 ,但 4 2x2 。例如溫度、明暗或音強等皆屬於此類尺度。
4. 比率尺度 (ratio scale) :具有前三者的資料特性,且可以做倍數比較。也有距離和絕對的零點。例如, 4=2x2 。
5
「衡量」可用「同形」 (isomorphism) 觀念來衡量。所謂「同形」就是結構同形,大小比例沒有關係,只要同比例放大縮小即可。
6
6.2 數值指派的「規則」 牽涉到如何將衡量的結果,能推論到構念層次
( 以 A 表示 ) 。 有 4 種情況 ( 圖 6-1) ,其中,情況二,衡量變數
a 與構念 A 最「同形」,變數 a 這個 ECV 最能同比例代表構念 A 。
「情況 1 」是有信度,但效度低;「情況 3 」是信度低,且效度低;「情況 4 」是沒有信度,且沒有效度。
7
8
6.3 誤差與信度
信度值愈接近 1 ,表示信度愈高。 衡量誤差 ( 誤差分數 ) 的來源有 2 大類:
(1) 系統性誤差:它會對衡量結果產生一致性固定的影響。(2) 隨機性誤差:主要是來自受訪者身心狀況、情境因素,
及衡量試題的干擾影響。
9
6.3.1 系統性誤差 只要使用衡量工具,系統性誤差 (systemtic
errors) 就會產生。系統性誤差對個案間及研究間的影響方式都是「固定」不變的。
10
6.3.2 隨機性誤差 隨機性誤差:隨機性誤差 ( 又稱非系統性誤差 )
及系統性誤差之主要來源,可分成下列 6 種因素1. 受測者誤差:因受測者本身特質2. 情境因素:訪談時任何外力的影響。街頭 ( 機場 ) 訪
談比在家裡 ( 公司 ) 更易受情境因素的影響。3. 施測者誤差:訪談者的解釋、重述、語氣、態度和藹
可親、肢體動作、草率的資料處理……等等。4. 量表的使用方式5. 資料的分析處理之影響6. 系統性誤差: (1) 衡量工具內容:混淆 ( 區別效度不佳 ) 、語意不清 ( 信度不佳 ) (2) 衡量項目 (items) 不足 (3) 有沒有引導作答 (leading) 的嫌疑
11
6.4 量表的設計 「量表化」 (scaling) ,它是一種衡量的程序,旨在將衡量對象或欲衡量的特性指派某些數值,以便將衡量對象之特性數值化。
量表是用一個以上的指標 (indicant, item, manifested) 來衡量某個體∕事物的特性。
12
6.4.1 量表分類方法 量表建構的技術 (程序 ) :可分為:
(1) Likert 量表,採用「評分加總」之計分方式。(2) Thurstone 量表,又稱共識量表。(3) 語意差異法,是屬因素量表之一。(4) Guttman 量表,採用累計量表計分方式。(5) 配對比較量表。
13
6.5 「量表」設計的技術量表設計的技術,可分為下列 5 大類:1. Likert 量表
李克特量表 (Likert scale) 是屬「評分加總式量表」最常用的一種,顧名思義,屬同一「構念」的「這些項目」是用「加總」方式來計分,單獨或個別項目是無意義的。
14
15
16
2. Thurstone 量表 是由一群「專家」依據下列 3 個準則來篩選項目: (1)
與研究主題有關聯性。 (2) 題意是否模糊 ( 即專家對該題去留意見不一致者 ) 。 (3) 項目所表達之態度層次。
17
3. 語意差異量表 旨在瞭解受訪者對事物的認知 ( 形象、競爭優勢…
… ) 。
18
19
表 6-6 是一個典型語意差異量表
20
4. Guttman 量表 用來檢定具有不同強弱程度之一組項目是否都屬「單
一構面」
21
5. 配對比較量表 利用配對比較的方法來衡量人們態度的一種量表。例
如,某研究者想了解 ABCD 4 種物品 ( 或規劃的四種準則 ) 的重要性,樣本選取 100 名受訪者進行成對
由以上成對比對的結果,可知 B 物品 (準則 ) 最受歡迎。
22
6.6 效度 量表會有信度 (reliability) 、效度 (validity) 問題發生,主要是量表本身有「衡量誤差」存在。
兩者關係,可用數學式「若 P 則 Q 」或 (P → Q) 來表示,即「效度 → 信度」。(1) 有信度不一定有效度 (逆定理「 Q → P 」不一定成立 ) 。
(2) 無信度一定無效度 ( ~ Q → ~ P) 。(3) 有效度一定有信度 (P → Q) 。
常見的效度,有下列 3 種: 內容效度 效標關聯效度 建構效度
23
6.6.1 內容效度 是指量表「內容的適切性」,即量表內容是否涵蓋所要衡量的構念。
可分成取樣 (sampling) 效度及表面 (face) 效度兩種,兩者都沒有應用到統計方法來計算,都只仰賴專家主觀的評判。1. 取樣效度:量表所包含的項目是否能代表母體構念的項目∕題目 (item) 。
2. 表面效度:是指量表項目和形式上,給人的主觀印象,可適切地衡量其欲測得的特質或行為。故表面效度是請專家來看看該量表有沒有效度。
24
6.6.2 效標關聯效度 效標關聯效度並不涉及構念的問題。 是指使用中的衡量工具與「其他衡量工具」 (包括目前與未來之準則效標 ) ,比較兩者是否具有關聯性。1. 同時效標:是指衡量工具與效標同時出現。2. 預測效標:是指衡量工具出現在效標之前。
25
6.6.3 建構效度 「量表能衡量理論上某構念或特質的程度」 常見的建構效度有 2 類:
收歛 (convergent) 效度 區別 (discriminant) 效度
26
一、收歛效度 來自相同構念的這些項目,彼此之間相關要高。 收歛效度及區別效度常用的「統計檢定」有 3 種方法:
1. 以「相關分析」來計算某一構念之這些項目的值,並將 值的顯著性 ( 值 ) 排列成二維矩陣若每一個 r 值彼此都達到顯著水準之個數愈多,則表示該量表建構效度愈佳。
2. 以「因素分析」 (factor analysis) 求量表各項目之因素結構 (structure) 矩陣。同一構念中,若因素負荷量的值愈大項目」,否則刪除後再重新執行一次因素分析 ) ,表示收歛效度愈高。
3. 以「多特質多方法」 (muti-traits multi-methods, MTMM) 來檢定:用同一個「異質的特質」 (hetero-traits) 衡量工具,以不同的「方法」
27
28
29
6.6.4 MTMM 之統計分析
30
31
32
二、區別效度 不同的兩個構面,能區別的程度。
以因素分析角度來看,就是各項目只能在其屬的因素中「因素負荷量」大於 0.50 ( 要接近 1) ,反之,各項目在其非屬的因素中「因素負荷量」要愈小愈好 ( 接近0) 。
33
34
35
6.7 信度 一個衡量工具包含「變數誤差」 (variable errors) 的程度。即在任何一次衡量中,觀察值之間呈現之不一致,或是採用相同衡量工具,然而對特定單位施測,每次所得結果都不一樣
信度是指衡量資料的可靠性,受測者在相同條件下,重複測量是否得相同結果 (穩定性 ) ,或相同構念 ( 性質相同、目的相同 ) 以不同題目測量所得結果的「一致性」程度
36
6.7.1 信度種類及算法 信度意指一種衡量工具的精確性或是正確性,其
意義主要有二: (1) 穩定性 (stability) , (2) 一致性 (consistency) 。
常見信度可分為下列 3 大類:1. 等值性 (equivalence) :又稱「複本法」,專門為檢
定同一測驗中不同複本上分數的一致。1) 複本信度 (equicalent-forms) :同時設計兩份問卷,每份問卷使用不同問項 ( 稱為複本 ) ,並讓同一受訪者問答,而此同一測驗中之兩種複本的相關程度 ( 相關係數 )
2) 折半信度 (split-half) :將同一量表中「項目內容相似」,折成兩半 ( 一般分奇數題與偶數題 ) ,求這兩個「各半」測驗總分之相關。折半信度係數
37
2. 穩定性 (stability) :對同一批樣本,前後兩期測兩次3. 一致性 (consistency)
1) 折半法:折半信度2) Kuder-Richardson法
3) 一致性法:例如, Cronbach’s 係數 ) ,特別適合衡量人格特質、態度……等等 ( 即 Likert 量表。一般 0.7 α 0.8表可信,一般 0.8 α 1.0 表非常可信。
:
38
39
40
41
6.7.3 信度與效度的關係
「效度→信度」 ( 關係式若 p 則 q) 。換句話說,有效度一定有信度;但有信度不一定有效度;無信度一定無效度。