• Sonuç bulunamadı

10-01 如何利用變異數成份估計一致性相關係數

N/A
N/A
Protected

Academic year: 2021

Share "10-01 如何利用變異數成份估計一致性相關係數"

Copied!
9
0
0

Yükleniyor.... (view fulltext now)

Tam metin

(1)

如 何 利 用 變 異 數 成 份 估計一致性相關係數

蔡秒玉 彰化師範大學統計資訊所/副教授

一致性相關係數的定義

在生物醫學研究中,若有一個新的測量方法要與黃金標準或是早期慣用的測 量方法進行比較時,我們希望新的方法與黃金測量或是早期慣用的方法兩者之間 具有相當程度的一致性(agreement),這樣才能證明新的測量法具有一定的準確 性。若針對類別型資料(categorical data),最廣為大家接受的是 kappa 統計量,其 中Cohen’s kappa 及 weighted kappa 分別是使用在二元(binary data)及有序的判讀 資料(ordinal data)上(Cohen, 1960; 1968)。當判讀結果為連續型資料時,組內相關 係數(Intraclass correlation coefficient; ICC)則是常用來評估家庭或集群判讀資料 組內的相關性大小,亦即用來反映連續資料上的一致性(Bartko, 1966; Shrout and Fleiss, 1979);另一個針對連續型資料,可用來估計兩種判讀方法或儀器的一致 性指標為一致性相關係數(concordance correlation coefficient; CCC),其為測量任 兩對判讀資料相距於經原點的 45 度線的變異(variation of the linear relationship between each pair of data from the 45 line through the origin) (Lin, 1989)。此一致 性相關係數有兩方面的優點,其第一項優點為可以評估每一筆判讀資料離所配適 的迴歸線多遠,此即代表精確度(precision),另一項優點為評估所配適的迴歸線 離經原點的 45 度線多遠,此即代表準確度(accuracy) (King and Chinchilli, 2001)。 本文章主要是針對一致性相關係數的估計進行探討。 根據 Lin (1989)提出針對兩個連續型變數Y 和1 Y 的一致性相關係數定義如2 下: 2 1 2 2 1 2 1 2 [( ) ] 1

[( ) | and are uncorrelated]

c E Y Y E Y Y Y Y      2 2 12 2 1 2 1 2 2 ( )          , 其中1E Y( )1 ,2E Y( )2 , 2 1 Var Y( )1   , 2 2 Var Y( )2   ,12Cov Y Y( ,1 2)。由

(2)

此定義可知,c的值域落在-1 與 1 之間,若為-1 則表示兩儀器之間完全不一 致 (perfect disagreement);為 0 則表示彼此間互相獨立;為 1 則表示兩者之間完 全一致(perfect agreement)。當12與 2 2

1 2

  時,c則相當於皮爾森相關係數 (Pearson correlation coefficient) ;而一致 性 相關係數 的 95% 的信 賴區間可用

Fisher’s Z 變數變換得到(Fisher’s Z transformation),即 ˆ 1ln 1 ˆ ˆ 2 1 c c c Z         會近似常 態分配,其中 ˆc代表c的估計式,因此一致性相關係數的 95%的信賴區間可經 由Zˆc1.96 Var(Z )ˆc 轉換得到,其中 (Z )ˆ (ˆ2 2) ˆ (1 ) c c c Var Var     (Lin, 1989)。

利用變異數成份進行一致性相關係數的估計

Carrasco & Jover (2003)提出了在線性混合模式(linear mixed model; LMM) 下,利用變異數成份(variance components; VC)估計一致性相關係數,其模式假設 為

Yi j   i je , (1) i j 其中Y 代表第ij i個個體(subject)被第 j 個儀器(observer)所測量的觀測值;為總體

平 均 ;i 是 第 i 個 個 體 的 隨 機 效 應 (subject random effect) , 令 其 分 配 為

2

~ (0, )

i N

  ;j是第 j 個儀器的固定效應(observer fixed effect);eij是第i個個 體 被 第 j 個 儀 器 所 測 量 觀 測 值 的 隨 機 誤 差 (random error) , 令 其 分 配 為

2

~ (0, )

ij e

e N  ,i1, ,nj1, ,J。令隨機效應與隨機誤差項彼此之間皆互

相獨立,因此在這些前提假設下,Carrasco & Jover (2003)證明了組內相關係數與 一致性相關係數兩種一致性測度估計式相同,則此一致性相關係數可經由變異數 成份表示成 2 2 2 2 c e            , (2)

(3)

其中 2 2 1 1 1 J j j J      

利用變異數成份進行重複測量加權一致性相關係數的估計

針對長期追蹤重複測量資料,Carrasco et al. (2009)則將第(1)式的線性混合模 型中加入時間屬性的固定效應及其與個體及判讀方法效應的交互作用,如此可將 第(1)式的線性混合模型改寫為 Yi j t       i  j ti j i te j t, (3) i j t 其中Y 代表第ijt i個個體被第 j 個儀器所測量的第 t 次判讀觀測值;t是第 t 次時間 的固定效應

t 1, 2,...,p

;ij是第i個個體和第 j 個儀器間交互作用的隨機效應

(random subject-observer interaction effect),令其分配為 ~

0, 2

ij N 

  ;it

i個個體和第 t 次測量時間交互作用的隨機效應(random subject-time interaction

effect),令其分配為it~N

0,2

; jt是第 j 個儀器和第 t 次測量時間交互作

用的固定效應(fixed observer-time effect);e 是第 i 個個體第 j 個儀器第 t 次測量ijt

的隨機誤差項(random error)。同時假設所有隨機效應i、ij、it與隨機誤差 ijt e 皆互相獨立(mutually independent)。 除此之外,為了考慮在不同時間點觀測值之間的相關程度,Carrasco et al. (2009)依循 King et al. (2007)所提出的加權方法,在任一個時間點測量的觀測值給 予權重,其方法即為將一致性相關係數的估計式中加入一個權重矩陣D在重複的 觀測值上,若D為一個單位矩陣(identity matrix),則組內相關係數與一致性相關 係數的估計式相同,即在第(3)式的線性混合模型下的一致性相關係數估計式則 可由個體屬性、個體和儀器間交互作用與個體和測量時間交互作用的隨機效應、 儀器與測量時間交互作用固定效應以及隨機誤差項的變異數表示。如此,第(2) 式的一致性相關係數估計式則可改寫為

(4)

2 2 2 2 2 2 2 crm e                     , 其中

2 2 1 1 1 1 1 p J t j jt t p J            ,jt為第 j 個儀器在第 t 次時間點測量觀測值 的總平均,t為第 t 次時間點測量觀測值的總平均。若D為一個對角矩陣(diagonal matrix),則此長期追蹤資料之加權重複測量一致性相關係數則可表示成

2 2 1 2 2 2 2 2 1 1 1 1 1 1 p t tt crm p p J e t tt t j tt jt t d d d p J                            , 其中d 表示為加權矩陣ij D中第 i 列第 j 行的元素。

利用 R 程式執行一致性相關係數的估計

目前已有 R 軟體的 cccrm 套件可以進行一致性相關係數的估計(Carrasco et al., 2013),以下皆用 R 軟體內設的重複測量資料作為 R 程式估計一致性相關係 數的範例(在附錄中亦有 SAS 程式估計一致性相關係數的介紹)。在此將以 R 軟體提供血壓重複測量資料(bpres)作為分析資料,此資料共有 384 位個案(以 ID 變數標示),每位個案皆被兩種儀器(METHOD)進行舒張壓(DIA)的測量,每種儀 器各測量兩次,並記錄每位個案的年齡(AGE)與性別(SEX)兩變數,此資料型態 如下表:

ID AGE SEX DIA METHOD

1 70 2 84 1 1 70 2 92 1 1 70 2 83 2 1 70 2 98 2 2 29 1 70 1 2 29 1 70 1 2 29 1 76 2 2 29 1 76 2 … … … … …

(5)

針對第(1)式的線性混合模型,可利用 R 軟體的 cccvc 函數進行一致性相關係數 的估計,而此函數中需放入的參數如下: 1. dataset:資料名稱 2. ry:反應變數 3. rind:個案身份變數 4. rmet:儀器方法變數 5. covar:個案解釋變數 【cccvc 程式碼】 【結果】 CCC LL CI95% UL CI95% SE CCC Z SE Z 0.818829 0.791561 0.842843 0.013056 1.100336 0.039426 Variance Components:

Subject Observer Random Error 77.8245 0.0995 17.1197 此資料的分析結果為兩種血壓測量儀器的一致性程度為 0.8188,95%的信賴區間 為(0.7916, 0.8428),其估計結果顯示兩種血壓測量儀器有高度的一致性,其中個 體隨機效應變異數估計值高達 77.8245,代表個人異質性程度高,儀器效應變異 數估計值為 0.0995,隨機誤差變異數估計值為 17.1197。 此 cccrm 函數亦可以將個案相關的解釋變數加入模式中進行調整,將 bpres 資料中的年齡及性別兩變數加入模式後,其程式及分析結果如下: 【cccvc 程式碼】 【結果】

cccvc(dataset=bpres, ry="DIA", rind ="ID", rmet= "METHOD")

cccvc(dataset=bpres, ry="DIA", rind ="ID", rmet= "METHOD", covar=c("AGE","SEX"))

(6)

CCC LL CI95% UL CI95% SE CCC Z SE Z 0.800620 0.771111 0.826696 0.014154 1.153254 0.039622

Variance Components:

Subject Observer Random Error 69.1441 0.0995 17.1197 在調整了年齡及性別兩變數後,兩種血壓測量儀器的一致性程度仍高達 0.8006, 而個體隨機效應變異數估計值降低為 69.1441。 利用 R 統計軟體套件 cccrm 中的 ccclonw 函數可以進行長期追蹤資料之重複 測量加權一致性相關係數的估計。在此仍以 R 軟體內設的 bfat 資料來進行crm的 估計,bfat 資料為有 82 位個案(SUBJECT),每位個案皆被兩種儀器(METHOD) 分別進行了 3 次的重複測量(VISITNO),所測得的反應變數為體脂肪(bf),其中 設定的3 3× 加權矩陣D的對角線元素為(2,1,1),同時假設同一位個案的觀測值之 間的相關性結構為 compound symmetry,此資料型態如下表:

SUBJECT VISITNO bf METHOD

101 2 21.67627 1 101 3 23.18935 1 101 4 26.31943 1 101 2 17.46278 2 101 3 18.79371 2 101 4 19.91578 2 102 2 21.67627 1 102 3 20.84363 1 102 4 23.88159 1 102 2 15.60228 2 102 3 16.76827 2 102 4 18.25625 2 … … … … 針對第(3)式的線性混合模型,利用 R 軟體的 ccclonw 函數進行長期追蹤資料之 重複測量加權一致性相關係數的估計,此函數中需放入的參數如下:

(7)

1. dataset:資料名稱 2. ry:反應變數 3. rind:個案身份變數 4. rtime:重複測量時間變數 5. rmet:儀器方法變數 6. vecD:加權矩陣對角線向量 7. covar:個案解釋變數

8. rho:同一位個案觀測值之間的相關性結構;rho=0 代表 compound symmetry, rho=1 代表 autoregressive order one

【cccvc 程式碼】

【結果】

CCC LL CI95% UL CI95% SE CCC Z SE Z 0.565884 0.459258 0.656435 0.050317 0.641447 0.074020

Variance Components:

Subjects Subjects-Method Subjects-Time Method-Time Error 8.5920 2.1082 0.9204 17.6777 0.7698 此資料的分析結果為兩種體脂肪測量儀器的一致性程度為 0.5659,95%的信賴區 間為(0.4593, 0.6564),表示兩種體脂肪測量儀器有中等程度的一致性,其中個體 隨機效應變異數估計值為 8.5920,隨機誤差變異數估計值為 0.7698。此外,個案 與儀器及個案與測量時間交互作用隨機效應的變異數估計值分別為 2.1082 及 0.9204,儀器與測量時間交互作用效應變異數估計值為 17.6777。 附錄: 在線性混合模式下,利用變異數成份估計一致性相關係數亦可使用 SAS macro rm_ccc 來進行估計,而此 SAS macro rm_ccc 中需放入的參數如下: ccclonw(dataset=bfat,ry="bf", rind="SUBJECT",rtime="VISITNO", rmet="METHOD",vecD=c(2,1,1),rho=0)

(8)

1. DATA:資料名稱 2. Y:反應變數 3. METHOD:儀器方法變數 4.TIME:重複測量時間變數 5. SUBJECT:個案身份變數 6. NL:重複測量的資料型態;NL=0 代表長期追蹤資料(原始設定),NL=1 代表 非長期追蹤資料 7. TYPE:同一位個案觀測值之間的相關性結構;TYPE=0 代表沒有此相關性結 構(原始設定),TYPE=1 代表 autoregressive order one,TYPE=2 代表 compound symmetry 8. DIAG:加權矩陣對角線向量 針對第(1)式的線性混合模型,可利用 SAS macro rm_ccc 進行一致性相關係數估 計的程式碼如下: 【SAS macro rm_ccc 程式碼】 針對第(3)式的線性混合模型,可利用 SAS macro rm_ccc 進行長期追蹤資料之重 複測量加權一致性相關係數估計的程式碼如下: 【SAS macro rm_ccc 程式碼】 參考文獻:

Bartko, J.J., 1966. The intraclass correlation coefficient as a measure of reliability. Psychological Reports 19, 3–11.

%rm_ccc(DATA= bpres, Y=DIA, METHOD=METHOD, TIME= VISITNO, SUBJECT=ID, NL=1)

%rm_ccc(DATA= bfat, Y=bf, METHOD=METHOD, TIME= VISITNO, SUBJECT=SUBJECT, NL=0, TYPE=2, DIAG=(2,1,1))

(9)

Carrasco, J.L., Jover, L., 2003. Estimating the generalized concordance correlation coefficient through variance components. Biometrics 59, 849–858.

Carrasco, J.L., King, T.S., Chinchilli, V.M., 2009. The concordance coefficient for repeated measures estimated by variance components. Journal of Biopharmaceutical Statistics 19, 90–105.

Carrasco, J.L., Phillips, B.R., Puig-Martineza, J., King, T.S., Chinchilli, V.M., 2013. Estimation of the concordance correlation coefficient for repeated measures using SAS and R. Computer Methods and Programs in Biomedicine 109, 293–304. Cohen, J., 1960. A coefficient of agreement for nominal scales. Educational and

Psychological Measure 20, 37–46.

Cohen, J., 1968. Weighted kappa: nominal scale agreement with provision for scaled disagreement or partial credit. Psychological Bulletin 70, 213–220.

King, T.S., Chinchilli, V.M., 2001. A generalized concordance correlation coefficient for continuous and categorical data. Statistics in Medicine 20, 2131–2147.

King, T.S., Chinchilli, V.M., Wang, K.L., Carrasco, J.L., 2007. A class of repeated measures concordance correlation coefficients. Journal of Biopharmaceutical Statistics 17, 653–672.

Lin, L.I., 1989. A concordance correlation coefficient to evaluate reproducibility. Biometrics 45, 255–268.

Shrout, P.E., Fleiss J.L., 1979. Intraclass correlations: uses in assessing rater reliability. Psychological Bulletin 86, 420–428.

Referanslar

Benzer Belgeler

急性肺損傷為臨床上重症病人常見的併發症,死亡率很高。當肺受到感染時嗜中

麩醯胺於急性肺損傷模式中對嗜中性白血球趨化程度之影響 Effect of glutamine on neutrophil recruitment in a model of acute lung injury 中文摘要

This study aimed to understand the governance of nonprofit organization of major academic medical centers, and prevent manager engaged in law-breaking activities, also avoid

動氣在右,肺失治矣。下之則肺先虛,津液內竭,故咽燥鼻乾,頭眩

Typhimurium insertional library,利用酵母菌凝集方法篩選 失去第一型線毛在體 外環境線毛相變化能力的突變株。對於突變株將選殖 transposon insertion site

Typhimurium insertional library,利用酵母菌凝集方法篩選 失去第一型線毛在體 外環境線毛相變化能力的突變株。對於突變株將選殖 transposon insertion site

İkinci konut; başka bir yerde yaşamlarını sürdürüp çalışmaları şartıyla ikinci konutu kiralayan kişiler satın alma veya kiralama yoluyla yıllık periyotlarla

ğildir; Fransa Cumhuriyetinin (Ki vayete göre) Tunusu almak için kendisinin Abdülhamide verilmiş siyasi mülteci olması değildir; Ab- dülâzizin anasının