harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... ·...

87

Transcript of harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... ·...

Page 1: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik
Page 2: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik
Page 3: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik
Page 4: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

ANALISISANALISISANALISISANALISIS

SSSSURVIVALURVIVALURVIVALURVIVAL

Johan HarlanJohan HarlanJohan HarlanJohan Harlan

Page 5: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

AnalisisAnalisisAnalisisAnalisis SurvivalSurvivalSurvivalSurvival

Penulis : Johan Harlan

Cetakan Pertama, Desember 2017

Disain cover : Joko Slameto

Diterbitkan pertama kali oleh Gunadarma

Jl. Margonda Raya No. 100, Pondokcina, Depok 16424

Telp. +62-21-78881112, 7863819 Faks. +62-21-7872829

e-mail : [email protected]

Hak Cipta dilindungi undang-undang. Dilarang mengutip atau

memperbanyak dalam bentuk apapun sebagian atau seluruh isi

buku tanpa ijin tertulis dari penerbit.

Page 6: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

v

KATA PENGANTAR

Analisis survival, yang dikenal juga dengan nama Time-to-Event

Analysis atau Analysis of Failure Time Data, adalah studi tentang model dan

metode untuk menganalisis data tentang waktu kehidupan, waktu tunggu,

atau secara umum waktu sampai dengan terjadinya suatu peristiwa spesifik.

Data demikian yang disebut data survival, dapat bersumber dari berbagai

bidang ilmiah, terutama Kedokteran, Teknik, dan Demografi, namun dapat

pula berasal dari berbagai bidang ilmu lainnya.

Pembahasan dalam buku ini terutama ditekankan pada prinsip-prinsip

dasar serta pengertian tentang beberapa model dan metode terpenting dalam

analisis data survival. Sebagian besar metode analisis data survival harus

dikerjakan dengan bantuan program komputer. Program komputer yang

dipakai untuk pembahasan analisis data survival dalam buku ini adalah Stata

15.

Walaupun contoh-contoh yang dibahas di sini terutama menyangkut

kasus-kasus dari bidang Kedokteran, metode yang dibahas dapat saja

dimanfaatkan untuk menganalisis data survival dari berbagai bidang ilmu

pengetahuan lainnya.

Penulis sangat mengharapkan saran dan kritik tentang kekurangan

yang ada dalam buku ini.

Desember 2017

Johan Harlan

Page 7: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

vi

DAFTAR ISI

Kata Pengantar v

Daftar Isi vii

Bab 1 Fungsi Survival 1

Data Survival 1

Sensoring dan Trunkasi 4

Risiko dan Rate 6

Bab 2 Tabel Kehidupan 9

Nomenklatur Tabel Kehidupan 9

Estimasi Aktuaria 11

Estimasi Kaplan-Meier 13

Uji Log-Rank 14

Tabel Kehidupan dengan Stata 16

Bab 3 Model Regresi untuk Data Survival 23

Prinsip Dasar Model Hazard Proporsional 23

Interpretasi Hasil Analisis 25

Bab 4 Model Hazard Proporsional dengan Stata 27

Deklarasi Dataset menjadi Data Survival 27

Analisis Regresi untuk Model PH Cox 29

Grafik Kaplan-Meier untuk Model PH Cox 31

Uji Hipotesis untuk Fungsi Survival 34

Page 8: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

vii

Bab 5 Evaluasi Kesesuaian Model 39

Residual 39

Evaluasi Asumsi Hazard Proporsional 40

Bab 6 Model Hazard Proporsional Extended 47

Pengertian Variabel Time-Dependent 47

Model Extended Cox untuk Variabel Time-Dependent 47

Formula Rasio Hazard untuk Model Extended Cox 48

Bab 7 Model Survival Parametrik 53

Asumsi Hazard Proporsional dan Asumsi Accelerated

Failure Time

53

Model Regresi Eksponensial 54

Model Regresi Weibull 58

Model Regresi Log-Logistik 61

Bab 8 Power dan Ukuran Sampel 65

Power dan Ukuran Sampel Uji Log-Rank 65

Power dan Ukuran Sampel Model PH Cox 70

Kepustakaan 75

Page 9: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik
Page 10: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 1 Fungsi Survival

1

BAB 1

FUNGSI SURVIVAL

� Data Survival

Analisis survival (analisis kesintasan) adalah prosedur statistika

untuk menganalisis data dengan waktu sampai terjadinya suatu peristiwa

tertentu (time until an event occurs) sebagai variabel respons.

‘Peristiwa tertentu’ tersebut dalam analisis survival lazimnya disebut

sebagai ‘kegagalan’ (failure), yang dapat berupa:

� Kematian pada penderita penyakit fatal

� Eksaserbasi ulang pada penderita penyakit kronis dengan remisi-

eksasebasi yang semula ada dalam fase remisi

� Tindak kriminal ulang oleh eks-narapidana yang sedang menjalani

periode hukuman percobaan

� Kekambuhan pada eks-pecandu narkotika sehabis menjalani rehabilitasi

� Dan sebagainya

Misalkan T adalah variabel random non-negatif yang menyatakan

waktu sampai dengan terjadinya kegagalan, maka f (t) menyatakan fungsi

densitas probabilitasnya dan F (t) = P (T < t) menyatakan fungsi distribusi

kumulatifnya.

Komplemen fungsi distribusi kumulatif F (t) adalah fungsi survival

( )S t , yaitu probabilitas bahwa subjek survive lebih lama daripada waktu t

atau probabilitas bahwa variabel random T melebihi waktu t:

S (t) = 1 – F (t)

= P (T > t)

Fungsi densitas f (t) adalah turunan pertama F (t) terhadap t, yaitu:

f (t) = ( )dF t

dt

Page 11: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 1 Fungsi Survival

2

= ( ){ }1d

S tdt

− = −S’ (t)

Fungsi hazard ( )h t yang juga dikenal sebagai ‘laju kegagalan

bersyarat’ (conditional failure rate) atau ‘kekuatan mortalitas’ (force of

mortality), adalah probabilitas terjadinya kegagalan pada suatu interval

waktu, dengan syarat subjek tersebut survive sampai dengan awal interval,

dibagi lebar interval, yaitu:

h (t) = ( )

0limt

P t T t t T t

t∆ →

< < + ∆ >

= ( )

( )

f t

S t

Fungsi hazard bukan merupakan probabilitas, melainkan berupa rate

(kelajuan), sehingga fungsi hazard disebut juga sebagai rate hazard. Jika

kegagalan yang dipelajari adalah kematian, maka rate hazard sama dengan

rate mortalitas (mortality rate).

Fungsi hazard kumulatif H (t) adalah:

H (t) = ( )0

th u du∫

= ( )

( )0

t f udu

S u∫

= ( )

( )0

1t dS u du

S u du

= −ln {S (t)}

Interpretasi fungsi hazard kumulatif yaitu: (a) Ukuran risiko total

yang terakumulasi sampai dengan waktu t, dan (b) Risiko kumulatif dan

probabilitas survival berbanding terbalik.

Dengan demikian maka diperoleh:

S (t) = exp {−H (t)}

F (t) = 1 − exp {−H (t)}

Page 12: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 1 Fungsi Survival

3

f (t) = h (t) exp {−H (t)}

Dalam praktik, karena pengamatan tidak dilakukan sejak awitan

pajanan terhadap risiko, melainkan sejak dimulainya penelitian, maka

seluruh besaran di atas adalah besaran bersyarat, yaitu syarat bahwa subjek

survive sampai dengan dimulainya pengamatan:

h (t) = h (t 0T t> )

H (t) = H (t 0T t> )

F (t) = F (t 0T t> )

f (t) = f (t 0T t> )

S (t) = S (t 0T t> )

Karena syarat T > 0t bersifat lazim, untuk penyerhanaan selanjutnya

S (t 0T t> ) hanya akan dituliskan sebagai S (t 0t ), demikian pula besaran

lainnya. Pengecualian yaitu untuk ( )h t , karena rate (kelajuan sesaat) tidak

tergantung pada waktunya.

Karakteristik fungsi survival ( )S t antara lain adalah:

- Tak membesar: Fungsi survival ( )S t mengecil sejalan dengan

bertambahnya nilai t.

- Pada waktu t = 0, ( )S t = ( )0S = 1, yaitu pada awal studi belum ada

subjek yang mengalami kegagalan atau P (T > 0) = 1.

- Pada waktu t = ∞, ( )S t = ( )S ∞ = 0, yaitu jika secara teoretis periode

studi diperpanjang tanpa batas, suatu saat tidak ada lagi subjek yang

survive.

Grafik fungsi survival ( )S t terhadap waktu t secara teoretik

diperlihatkan pada gambar 1.1 berikut:

Page 13: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 1 Fungsi Survival

4

Gambar 1.1 Grafik fungsi survival teoretik

Dalam praktik, karena sifat data sampel dan cara pengumpulan data,

estimasi fungsi survival ( )S t merupakan fungsi bertingkat (gambar 1.2).

Gambar 1.2 Estimasi fungsi ( )S t dalam praktik

� Sensoring dan Trunkasi

Salah satu karakteristik data survival ialah kemungkinan adanya

sensoring (censoring) dan trunkasi (truncation). Sensoring adalah kegagalan

yang terjadi pada saat subjek tidak sedang diamati. Pada sensoring nilai data

tidak lengkap karena faktor yang bersifat acak untuk tiap subjek.

Bentuk yang paling sering ditemukan adalah data tersensor-kanan

(right-censored), yang mungkin terjadi pada salah satu keadaan berikut:

Page 14: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 1 Fungsi Survival

5

− Pada saat studi berakhir subjek belum mengalami kegagalan.

− Subjek mengundurkan diri dari penelitian dan tidak dapat diamati lebih

lanjut (lost to follow-up; withdrawal).

− Subjek mengalami kegagalan lain yang menyebabkan pengamatan tidak

dapat diteruskan (competing risk).

Subjek dikatakan tersensor-interval (interval-censored) jika

pengamatan tidak dilakukan secara kontinu, melainkan setiap akhir interval

tertentu. Kegagalan dapat terjadi di tengah suatu interval tanpa diketahui

secara tepat waktu survival-nya.

Subjek disebut tersensor-kiri (left-censored) jika kegagalan telah

terjadi sebelum subjek memasuki studi, tetapi tidak diketahui secara tepat

saat terjadinya.

Trunkasi (truncation) adalah keadaan bahwa hanya subjek yang

kegagalannya terjadi dalam suatu interval tertentu dimasukkan dalam

penelitian. Pada trunkasi nilai data tidak lengkap karena faktor seleksi yang

ada dalam desain studi.

Subjek dikatakan tertrunkasi-kiri (left-truncated) jika ia memasuki

studi setelah penelitian dimulai, sehingga trunkasi-kiri disebut juga sebagai

delayed entry.

Subjek dikatakan tertrunkasi-kanan (right-truncated) jika hanya

subjek yang mengalami kegagalan sebelum studi berakhir diikutsertakan

dalam penelitian (tidak ada yang tersensor-kanan).

Untuk selanjutnya, dalam pembahasan ini hanya akan diuraikan

mengenai sensoring-kanan, karena bentuk sensoring ini yang terbanyak

ditemukan dalam analisis survival.

Contoh 1.1:

Ketiga bentuk tersensor-kanan diperlihatkan pada gambar berikut,

yang menyajikan hasil pengamatan terhadap 12 subjek selama 6 tahun

penelitian:

Page 15: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 1 Fungsi Survival

Pada awal pengamatan terhadap tiap subjek, seluruh terbebas dari

penyakit X. Kegagalan adalah peristiwa timbulnya penyakit X, yang

dinyatakan dengan lambang . Sensoring

- Subjek nomor 5 dan 10 yang tidak mengalami kegagalan sampai studi

berakhir.

- Subjek nomor 3 dan 4 yang mengalami k

sehingga pengamatan tak dapat diteruskan

lambang .

- Subjek nomor 7, 8, 10, dan 12 hilang dari pengamatan (

atau mengundurkan diri dari penelitian (

� Risiko dan Rate

Secara teoretis, risiko dalam konteks data survival adalah:

Risk = P (t < T < t + ∆t | T

Bab 1 Fungsi Survival

6

Pada awal pengamatan terhadap tiap subjek, seluruh terbebas dari

penyakit X. Kegagalan adalah peristiwa timbulnya penyakit X, yang

Sensoring kanan terjadi pada:

Subjek nomor 5 dan 10 yang tidak mengalami kegagalan sampai studi

Subjek nomor 3 dan 4 yang mengalami kematian (competing risk),

pengamatan tak dapat diteruskan. Kematian dinyatakan dengan

dan 12 hilang dari pengamatan (lost to follow-up)

atau mengundurkan diri dari penelitian (withdrawal).

isiko dalam konteks data survival adalah:

T > t)

Page 16: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 1 Fungsi Survival

7

Risk merupakan probabilitas bersyarat, yaitu probabilitas subjek untuk

mengalami kegagalan dalam suatu interval waktu dengan syarat ia survive

sampai dengan awal interval tersebut. Estimasinya dari data sampel adalah:

Risk = Jumlah kegagalan dalam suatu interval waktu

Jumlah subjek survive pada awal interval tersebut

Rate secara teoretis dalam konteks data survival adalah:

Rate = ( )

0limt

P t T t t T t

t∆ →

< < + ∆ >

Estimasi rate dari data sampel adalah jumlah kegagalan dalam suatu interval

waktu dibagi jumlah waktu pengamatan terhadap seluruh subjek dalam

penelitian tersebut. Jumlah waktu pengamatan terhadap seluruh subjek ini

dinamakan sebagai ‘person-time’, sehingga estimasi rate adalah:

Rate = Jumlah kegagalan dalam suatu interval waktu

Jumlah person-time

Contoh 1.2:

Lihat kembali gambar pada contoh 1.1. Subjek nomor 1

menyumbangkan 2.5 tahun pengamatan, subjek nomor 2 menyumbangkan

3.5 tahun pengamatan, dan seterusnya.

Penderita nomor 3 dan 4 mengalami kematian sehingga pengamatan

terhadap mereka tak dapat diteruskan, walaupun demikian mereka tetap

menyumbangkan person-time sebelum kematian. Subjek nomor 7, 8, 10, dan

12 hilang dari pengamatan (lost to follow-up) atau mengundurkan diri dari

penelitian (withdrawal), tetapi mereka pun tetap menyumbangkan person-

time-nya.

Jumlah kegagalan (lambang ) adalah 5, sedangkan jumlah person-

time adalah:

PT = (2.5 + 3.5 + 1.5 + . . . + 1.5) orang-tahun = 26 orang-tahun

Rate adalah:

Page 17: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 1 Fungsi Survival

8

Rate = 15 tahun

26

− ≈ 0.19 1tahun−

Page 18: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 2 Tabel Kehidupan

9

BAB 2

TABEL KEHIDUPAN

� Nomenklatur Tabel Kehidupan

Tabel kehidupan (life table) adalah tabel yang digunakan untuk

melakukan perhitungan probabilitas survive dan risiko kematian pada tiap

interval waktu tertentu. Tabel kehidupan dapat dibuat untuk keseluruhan

himpunan subjek penelitian dan dapat dirinci lagi menjadi tabel kehidupan

untuk masing-masing subkelompoknya.

Bentuk umum tabel kehidupan untuk data survival diperlihatkan pada

tabel 2.1 berikut:

Tabel 2.1 Layout tabel kehidupan

i ∆t iPT id ˆiRate ˆ

iRisk ˆkum

Risk ( )ˆiS t ˆ

kumS

1 (0, 1) . . . . . . . . . . . .

2 (1, 2) . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . .

n (n-1, n) . . . . . . . . . . . .

Total (0, n) . . . . . . . . . . . .

i : Satuan waktu pengamatan ke-i; i = 1, 2, . . . , n

∆t : Interval waktu ke-i: (0

t ,1t ), (

1t ,

2t ), . . . , (

1nt −

, nt )

iPT : Person-time untuk interval waktu ke-i

id : Jumlah kegagalan pada interval waktu ke-i

ˆiRate : Estimasi rate pada interval waktu ke-i

ˆiRisk : Estimasi risiko pada interval waktu ke-i

ˆkum

Risk : Estimasi risiko kumulatif pada interval waktu (0

t , it )

( )ˆiS t : Estimasi fungsi survival untuk interval waktu ke-i

Page 19: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 2 Tabel Kehidupan

10

ˆkum

S : Estimasi fungsi survival kumulatif pada interval waktu (0

t , it )

Perhatikan bahwa walaupun salah satu hasil utama dari analisis

survival adalah rate, estimasi akhir tetap diperlukan untuk risiko kegagalan.

Pada contoh 1.2 telah diperlihatkan contoh perhitungan rate untuk interval

waktu 6 tahun. Dalam praktik rate dan risiko dapat berubah dari tahun ke

tahun, dan untuk perhitungan risiko pada akhir interval waktu 6 tahun ini

harus diperhitungkan perubahan dari tahun ke tahun.

Contoh 2.1:

Lihat kembali data pada contoh 1.1. Dari data tersebut dapat disusun

tabel kehidupan berikut.

i ∆t iPT id ˆiRate

1 (0, 1) 11 1 0.091

2 (1, 2) 8.5 1 0.118

3 (2, 3) 4.5 2 0.444

4 (3, 4) 1.5 1 0.667

5 (4, 5) 0.5 0 0.000

Total (0, n) 26 5 0.192

Walaupun penelitian berlangsung 6 tahun, tidak ada subjek yang

diamati lebih daripada 5 tahun, karena itu tabel dibuat hanya sampai tahun

ke-5. Subjek dengan waktu pengamatan terlama adalah subjek nomor 5, yang

waktu pengamatannya 4.5 tahun. Rate untuk tiap tahun dihitung sebagai

jumlah kegagalan dibagi person-time pada tahun itu.

Estimasi risiko dan fungsi survival dapat dilakukan dengan dua

metode, yaitu metode aktuaria dan metode Kaplan-Meier

Page 20: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 2 Tabel Kehidupan

11

� Estimasi Aktuaria

Dua karakteristik metode aktuaria yaitu:

- Lebar interval waktu biasanya sama.

- Jika tidak ada withdrawal, maka estimasi risiko adalah jumlah kegagalan

dibagi jumlah subjek survive pada awal interval:

ˆiRisk =

1i

id

N −

Jika ada withdrawal, maka pembagi harus dikoreksi dulu, yaitu menjadi

jumlah subjek pada awal interval dikurangi setengah jumlah withdrawal

pada interval itu:

ˆiRisk =

1 0.5 ii

id

N w− −

iw : Jumlah withdrawal pada interval ke-i

Contoh 2.2:

Lihat kembali data pada contoh 2.1. Tabel kehidupan dengan estimasi

aktuaria untuk risiko adalah sebagai berikut:

i 1iN −

1iN −′ iw

id ˆiRate ˆ

iRisk ˆkum

Risk

1 12 11.5 1 1 0.091 0.087 0.087

2 10 9 2 1 0.118 0.111 0.188

3 7 5.5 3 2 0.444 0.364 0.484

4 2 2 0 1 0.667 0.500 0.742

5 1 1 0 0 0.000 0.000 0.742

Total 12 9 6 5 0.192 0.556

Perhitungannya yaitu:

- Jumlah subjek terkoreksi:

Untuk i = 1 → 0N ′ = 12 – (0.5)(1) = 11.5

i = 2 1N ′ = 10 – (0.5)(2) = 9

dan seterusnya

Page 21: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 2 Tabel Kehidupan

12

- Risk kumulatif:

Untuk i =0-1 → 0 1ˆ

t tRisk − = 0.087

i =0-2 0 2ˆ

t tRisk − = 1 – (1 – 0.087)(1 – 0.111) = 0.188

i = 0-3 0 3ˆ

t tRisk − = 1 – (1 – 0.188)(1 – 0.364) = 0.484

dan seterusnya

Tampak bahwa jika tidak dilakukan penyesuaian per tahun diperoleh

ˆkum

Risk = 0.556 yang berbeda dengan hasil penyesuaian per tahun menjadi

ˆkum

Risk = 0.742.

Tabel kehidupan dengan estimasi aktuaria untuk fungsi survival

adalah sebagai berikut:

i 1iN −

1iN −′ iw

id ˆiRisk ( )ˆ

iS t ˆkum

S

1 12 11.5 1 1 0.087 0.913 0.913

2 10 9 2 1 0.111 0.889 0.812

3 7 5.5 3 2 0.364 0.636 0.516

4 2 2 0 1 0.500 0.500 0.258

5 1 1 0 0 0.000 1.000 0.258

Perhitungannya yaitu:

- Fungsi survival untuk interval waktu ke-i:

Untuk i = 1 → ( )1S t = 1 – 0.087 = 0.913

i = 2 ( )2S t = 1 – 0.111 = 0.889

dan seterusnya

- Fungsi survival kumulatif:

Untuk i = 0-1 → ( )0 1S t − = 0.913

i = 0-2 ( )0 2S t − = (0.913)(0.889) = 0.812

i = 0-3 ( )0 3S t − = (0.913)(0.889)(0.636) = 0.516

dan seterusnya

Page 22: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 2 Tabel Kehidupan

13

� Estimasi Kaplan-Meier

Estimasi Kaplan-Meier dikenal juga sebagai estimasi limit-produk

(product-limit). Karakteristik estimasi Kaplan-Meier yaitu:

- Interval waktu seringkali tidak sama, perhitungan dilakukan setiap ada

kegagalan.

- Fungsi survival untuk suatu interval waktu adalah proporsi jumlah subjek

survive pada awal interval dikurangi jumlah kegagalan dalam interval

tersebut:

( )ˆiS t = 1

1

i

i

iN d

N

Jumlah sensoring ataupun withdrawal tidak diperhitungkan dalam

estimasi Kaplan-Meier. Estimasi Kaplan-Meier lazimnya digunakan

untuk langsung mengestimasi fungsi survival.

Contoh 2.3:

Lihat kembali data pada contoh 2.1. Tabel kehidupan dengan estimasi

Kaplan-Meier untuk fungsi survival adalah:

i 1iN −

ic id ( )ˆ

iS t ˆkum

S

1 12 1 1 0.917 0.917

2 10 2 1 0.900 0.825

3 7 3 2 0.714 0.589

4 2 0 1 0.500 0.295

5 1 0 0 1.000 0.295

Perhitungannya yaitu:

- Fungsi survival untuk interval waktu ke-i:

Untuk i = 1 → ( )1S t = 12 1

12

− = 0.917

i = 2 ( )2S t = 10 1

10

− = 0.900

dan seterusnya

Page 23: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 2 Tabel Kehidupan

14

- Fungsi survival kumulatif:

Untuk i = 0-1 → ( )0 1S t − = 0.917

i = 0-2 ( )0 2S t − = (0.917)(0.900) = 0.825

i = 0-3 ( )0 3S t − = (0.917)(0.900)(0.714) = 0.589

dan seterusnya

� Uji Log-Rank

Uji log-rank adalah uji statistik untuk memperbandingkan dua atau

lebih fungsi survival, baik dalam tabel kehidupan ataupun grafik kurvanya.

Uji log-rank adalah uji khi-kuadrat untuk sampel besar, yang

memperbandingkan frekuensi sel observed dengan expected untuk seluruh

kategori interval waktu.

Hipotesis nol yang diuji adalah 0

H : Tidak ada perbedaan antar

fungsi survival. Statistik pengujinya adalah:

2χ = ( )

2#grupi i

i i

O E

E

−∑

yang berdistribusi khi-kuadrat dengan derajat bebas G – 1; G menyatakan

jumlah grup perbandingan.

Contoh 2.4:

Dimiliki data remisi leukemia (satuan waktu dalam minggu) sebagai

berikut:

Grup pengobatan: 6*, 6, 6, 6, 7, 9*, 10*, 10, 11*, 13, 16, 17*, 19*, 20*, 22,

23, 25*, 32*, 32*, 34*, 35*

Grup kontrol: 1, 1, 2, 2, 3, 4, 4, 5, 5, 8, 8, 8, 8, 11, 11, 12, 12, 15, 17, 22, 23

Tanda ‘*’ menyatakan sensoring.

Page 24: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 2 Tabel Kehidupan

15

Kegagalan Subjek Expected Obs − Exp

i 1id

2id

1in

2in

1ie

2ie

1 1i id e−

2 2i id e−

1 0 2 21 21 (21/42)×2 (21/42)×2 -1.00 1.00

2 0 2 21 19 (21/40)×2 (19/40)×2 -1.05 1.05

3 0 1 21 17 (21/38)×1 (17/38)×1 -0.55 0.55

4 0 2 21 16 (21/37)×2 (16/37)×2 -1.14 1.14

5 0 2 21 14 (21/35)×2 (14/35)×2 -1.20 1.20

6 3 0 21 12 (21/33)×3 (12/33)×3 1.09 -1.09

7 1 0 17 12 (17/29)×1 (12/29)×1 0.41 -0.41

8 0 4 16 12 (16/28)×4 (12/28)×4 -2.29 2.29

10 1 0 15 8 (15/23)×1 (8/23)×1 0.35 -0.35

11 0 2 13 8 (13/21)×2 (8/21)×2 -1.24 1.24

12 0 2 12 6 (12/18)×2 (6/18)×2 -1.33 1.33

13 1 0 12 4 (12/16)×1 (4/16)×1 0.25 -0.25

15 0 1 11 4 (11/15)×1 (4/15)×1 -0.73 0.73

16 1 0 11 3 (11/14)×1 (3/14)×1 0.21 -0.21

17 0 1 10 3 (10/13)×1 (3/13)×1 -0.77 0.77

22 1 1 7 2 (7/9)×2 (2/9)×2 -0.56 0.56

23 1 1 6 1 (6/7)×2 (1/7)×2 -0.71 0.71

9 21 19.26 10.74 -10.26 10.26

id. : Jumlah kegagalan observed pada minggu ke-i

in. : Jumlah subjek survive sampai dengan awal minggu ke-i

ie. : Jumlah kegagalan expected pada minggu ke-i

Pada awal minggu pertama, di kedua kelompok masing-masing ada

21 subjek. Minggu pertama, kelompok pengobatan tidak ada kegagalan,

kelompok kontrol ada 2 kegagalan, sehingga jumlah subjek pada awal

minggu kedua menjadi 21 dan 19 subjek, dan seterusnya.

Pada awal minggu keenam, di kedua kelompok masing-masing

terdapat 21 dan 12 subjek. Minggu keenam, kelompok pengobatan ada 3

kegagalan dan 1 sensoring, kelompok kontrol tidak ada kegagalan, sehingga

pada awal minggu ketujuh jumlah subjek kedua kelompok adalah 17 dan 12

subjek, dan seterusnya.

Page 25: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 2 Tabel Kehidupan

16

2χ = ( )

2#grupi i

i i

O E

E

−∑

= ( )

210.26

19.26

− +

( )2

10.26

10.74

= 15.276 (p = 0.000)

� Tabel Kehidupan dengan Stata

Perintah Stata untuk menampilkan tabel kehidupan adalah:

Sintaks:

ltable timevar failvar [if] [in] [, options]

timevar : Interval waktu sampai terjadinya kegagalan atau sensoring

failvar : Kegagalan

Beberapa opsi:

survival : menampilkan tabel survival dengan estimasi aktuaria (default)

hazard : menampilkan tabel hazard (rate)

noadjust : menampilkan estimasi Kaplan-Meier

Untuk menampilkan grafik survival Kaplan-Meier, perintahnya

adalah sts graph, tetapi sebelum menggunakan perintah sts, dataset harus

terlebih dahulu dideklarasikan sebagai data survival dengan perintah stset.

Sintaks:

stset timevar [if] [, failure(failvar)]

sts graph [if] [in] [, options]

Beberapa opsi:

survival : Menampilkan grafik fungsi survival Kaplan-Meier

failure : Menampilkan grafik fungsi kegagalan Kaplan-Meier

cumhaz : Menampilkan grafik fungsi hazard kumulatif Nelson-Aalen

Page 26: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 2 Tabel Kehidupan

17

Untuk melakukan uji log-rank:

Sintaks:

sts test varlist [if] [in] [, options]

Beberapa opsi:

logrank : Perintah untuk uji log-rank (default)

cox : Uji kesamaan Cox

wilcoxon : Uji kesamaan Wilcoxon-Breslow-Gehan

tware : Uji kesamaan Tarone-Ware

peto : Uji kesamaan Peto-Peto-Prentice

Contoh 2.5:

. use “D:\Analisis Survival\Data\data_hipotetis.dta”

Menampilkan tabel survival dengan estimasi aktuaria:

. ltable t fail, survival

Beg. Std.

Interval Total Deaths Lost Survival Error [95% Conf. Int.]

----------------------------------------------------------------------

0 1 12 1 1 0.9130 0.0831 0.5240 0.9873

1 2 10 1 2 0.8116 0.1208 0.4296 0.9497

2 3 7 2 3 0.5165 0.1834 0.1504 0.7942

3 4 2 1 0 0.2582 0.2043 0.0142 0.6501

4 5 1 0 1 0.2582 0.2043 0.0142 0.6501

----------------------------------------------------------------------

Menampilkan tabel kegagalan kumulatif:

. ltable t fail, failure

Beg. Cum. Std.

Interval Total Deaths Lost Failure Error [95% Conf. Int.]

----------------------------------------------------------------------

0 1 12 1 1 0.0870 0.0831 0.0127 0.4760

1 2 10 1 2 0.1884 0.1208 0.0503 0.5704

2 3 7 2 3 0.4835 0.1834 0.2058 0.8496

3 4 2 1 0 0.7418 0.2043 0.3499 0.9858

Page 27: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 2 Tabel Kehidupan

18

4 5 1 0 1 0.7418 0.2043 0.3499 0.9858

----------------------------------------------------------------------

Menampilkan tabel hazard (rate):

. ltable t fail, hazard

Beg. Cum. Std. Std.

Interval Total Failure Error Hazard Error [95% Conf. Int.]

-----------------------------------------------------------------------

0 1 12 0.0870 0.0831 0.0909 0.0908 0.0000 0.2689

1 2 10 0.1884 0.1208 0.1176 0.1174 0.0000 0.3478

2 3 7 0.4835 0.1834 0.4444 0.3064 0.0000 1.0450

3 4 2 0.7418 0.2043 0.6667 0.6285 0.0000 1.8986

4 5 1 0.7418 0.2043 0.0000 . . .

-----------------------------------------------------------------------

Menampilkan tabel survival dengan estimasi Kaplan-Meier:

. ltable t fail, survival noadjust

Beg. Std.

Interval Total Deaths Lost Survival Error [95% Conf. Int.]

----------------------------------------------------------------------

0 1 12 1 1 0.9167 0.0798 0.5390 0.9878

1 2 10 1 2 0.8250 0.1128 0.4609 0.9533

2 3 7 2 3 0.5893 0.1623 0.2305 0.8265

3 4 2 1 0 0.2946 0.2236 0.0161 0.6964

4 5 1 0 1 0.2946 0.2236 0.0161 0.6964

----------------------------------------------------------------------

Contoh 2.6:

. use “D:\Analisis Survival\Data\data_hipotetis.dta”, clear

. stset t, failure(fail)

failure event: fail != 0 & fail < .

obs. time interval: (0, t]

exit on or before: failure

Page 28: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 2 Tabel Kehidupan

19

--------------------------------------------------------------

12 total observations

0 exclusions

--------------------------------------------------------------

12 observations remaining, representing

5 failures in single-record/single-failure data

26 total analysis time at risk and under observation

at risk from t = 0

earliest observed entry t = 0

last observed exit t = 4.5

Menampilkan grafik fungsi survival Kaplan-Meier:

. sts graph, survival

failure _d: fail

analysis time _t: t

. sts graph, cumhaz

failure _d: fail

analysis time _t: t

0.00

0.25

0.50

0.75

1.00

Page 29: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 2 Tabel Kehidupan

20

Contoh 2.7:

. use “D:\Analisis Survival\Data\leukemia.dta”, clear

(Leukemia Remission Study)

. stset weeks, failure(relapse)

failure event: relapse != 0 & relapse < .

obs. time interval: (0, weeks]

exit on or before: failure

---------------------------------------------------------------

42 total observations

0 exclusions

---------------------------------------------------------------

42 observations remaining, representing

30 failures in single-record/single-failure data

541 total analysis time at risk and under observation

at risk from t = 0

earliest observed entry t = 0

last observed exit t = 35

0.00

0.20

0.40

0.60

0.80

1.00

Page 30: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 2 Tabel Kehidupan

21

. sts test treatment1, logrank

failure _d: relapse

analysis time _t: weeks

Log-rank test for equality of survivor functions

| Events Events

treatment1 | observed expected

-----------+-------------------------

Standard | 21 10.75

Drug A | 9 19.25

-----------+-------------------------

Total | 30 30.00

chi2(1) = 16.79

Pr>chi2 = 0.0000

. sts test treatment1, wilcoxon

failure _d: relapse

analysis time _t: weeks

Wilcoxon (Breslow) test for equality of survivor functions

| Events Events Sum of

treatment1 | observed expected ranks

-----------+--------------------------------------

Standard | 21 10.75 271

Drug A | 9 19.25 -271

-----------+--------------------------------------

Total | 30 30.00 0

chi2(1) = 13.46

Pr>chi2 = 0.0002

Page 31: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik
Page 32: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 3 Model Regresi untuk Data Survival

23

BAB 3

MODEL REGRESI

UNTUK DATA SURVIVAL

� Prinsip Dasar Model Hazard Proporsional

Pada bab 1, telah dijelaskan mengenai hazard h (t) sebagai nilai rate.

Untuk selanjutnya, hazard baseline akan dinyatakan sebagai ( ) 0h t . Sebagai

model regresi dengan kovariat X, hazard dapat dinyatakan sebagai:

( )h t X = ( ) 0h t ( ),r X β

Maka rasio hazard 1X terhadap

0X adalah:

HR (t, 1X ,

0X ) = ( )( )

1

0

h t X

h t X

= ( ) ( )( ) ( )

0 1

0 0

,

,

h t r X

h t r X

β

β

= ( )( )

1

0

,

,

r X

r X

β

β

Tampak bahwa rasio hazard sama sekali tidak tergantung pada fungsi ( ) 0h t ,

melainkan hanya tergantung pada fungsi ( ),r X β . Cox (1972) pertama kali

mengusulkan penggunaan fungsi eksponensial untuk ( ),r X β menjadi:

( ),r X β = exp (X β )

Penggunaan fungsi eksponensial ini pertama untuk meyakinkan bahwa rate

( ), ,h t X β akan selalu bernilai positif, dan kedua untuk menyederhanakan

pembagian pada rumus HR. Selanjutnya model:

Page 33: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 3 Model Regresi untuk Data Survival

24

( )h t X = ( ) 0h t exp

1

p

ii

β=∑ iX

ini dikenal sebagai model hazard proporsional Cox, atau model hazard

proporsional (model PH Cox) saja.

Ruas kanan model PH Cox terdiri atas 2 bagian. Bagian pertama

yaitu ( ) 0h t hanya memuat faktor t tanpa disertai faktor X, sedangkan bagian

kedua yaitu exp

1

p

ii

β=∑ iX hanya memuat faktor X tanpa memuat faktor t,

sehingga faktor X disebut juga sebagai variabel time-independent.

Dengan menggunakan fungsi eksponensial untuk ( ),r X β ini, maka

HR (t, 1X ,

0X ) menjadi:

HR (t, 1X ,

0X ) = ( )( )

1

0

,

,

r X

r X

β

β

= ( )( )

1

0

exp

exp

X

X

β

β

= ( )1 0exp X Xβ −

Jika kovariat X adalah variabel biner untuk perbandingan 2 grup

dengan 1X menyatakan X = 1 (grup pengobatan) dan

0X menyatakan X = 0

(grup kontrol), maka

HR (t, 1X ,

0X ) = ( )1 0exp X Xβ −

HR = exp β

atau: β = ln HR

Untuk model hazard proporsional ganda dengan kovariat lebih

daripada satu berlaku:

HR i =

exp iβ

Page 34: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 3 Model Regresi untuk Data Survival

25

atau: iβ = ln HR i

Karena hanya menyatakan fungsi exp

1

p

ii

β=∑ iX tanpa menspesifikasi

fungsi hazard baseline ( ) 0h t , model PH Cox dinyatakan sebagai model

semi-parametrik. Asumsi terpenting pada model PH Cox ini ialah bahwa

rasio hazard bersifat konstan untuk setiap nilai t.

� Interpretasi Hasil Analisis

Dari persamaan:

( )h t X = ( ) 0h t exp

1β X

diperoleh:

( )

( ) 0

h t X

h t = HR = exp

1β X

sehingga model PH Cox sederhana dapat dinyatakan sebagai:

ln HR = 1β X

Model PH Cox ganda adalah:

ln HR = 1β

1X + 2β

2X + . . . + pβ

pX

Perhatikan bahwa sebagai salah satu model regresi, pada model PH

Cox tidak didapatkan suku konstante 0β dan tidak ada suku residual,

walaupun dalam pembahasan lebih lanjut ada juga yang dinamakan residual

pada model PH Cox ini.

Untuk model PH Cox sederhana dan berlaku:

β = ln HR

dan untuk model PH Cox ganda berlaku:

iβ = ln HR i

Page 35: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 3 Model Regresi untuk Data Survival

26

Yang dimaksud dengan ‘rasio’ pada HR adalah rasio hazard untuk

suatu nilai kovariat X terhadap hazard baseline. Nilai rasio hazard berkisar

dari nol sampai dengan tak berhingga. Interpretasi nilai rasio hazard kurang

lebih adalah sama dengan interpretasi rasio odds, yaitu:

- HR < 1 mengindikasikan bahwa kovariat X merupakan faktor preventif

terhadap terjadinya kegagalan.

- HR = 1 mengindikasikan bahwa tidak ada asosiasi antara kovariat X

dengan kejadian kegagalan.

- HR > 1 mengindikasikan bahwa kovariat X merupakan faktor risiko

terhadap terjadinya kegagalan.

Estimasi untuk nilai-nilai iβ ini harus dilakukan dengan program

komputer statistik dan tidak dapat dikerjakan secara manual karena

memerlukan proses iteratif dalam perhitungannya.

Estimasi dikerjakan dengan metode maximum likelihood. Estimasi

parameter pada model PH Cox menggunakan metode partial likelihood,

karena hanya memperhitungkan probabilitas kegagalan dan tidak

memperhitungkan probabilitas sensoring.

Seperti pada berbagai model regresi lainnya, uji hipotesis 0H : iβ =

0 dikerjakan dengan uji Wald, yang hasilnya secara otomatis akan

ditampilkan dalam keluaran komputer pada analisis regresi untuk model PH

Cox.

Page 36: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 4 Model Hazard Proporsional dengan Stata

27

BAB 4

MODEL HAZARD PROPORSIONAL

DENGAN STATA

� Deklarasi Dataset menjadi Data Survival

Pada kebanyakan perintah Stata untuk analisis data survival, terlebih

dahulu dataset harus dideklarasikan sebagai data survival dengan perintah

stset. Pada perintah stset akan terjadi penambahan beberapa variabel pada

dataset yang akan berguna dalam berbagai pengerjaan perintah Stata untuk

data survival. Hasil deklarasi ini tidak bersifat permanen dan akan hilang

setelah file ditutup jika isi dataset yang telah terdeklarasi ini tidak disimpan

(di-saved).

Sintaks:

stset timevar [if] [, options]

timevar : Waktu sampai dengan terjadinya kegagalan

Opsi:

failure(failvar) : Variabel yang menyatakan kegagalan

Contoh 4.1:

. use “D:\Analisis Survival\Data\leukemia.dta”, clear

(Leukemia Remission Study)

. list in 1/10

+----------------------------------+

| no weeks relapse x1 x2 |

|----------------------------------|

1. | 1 6 1 1 2.31 |

2. | 2 6 1 1 4.06 |

3. | 3 6 1 1 3.28 |

Page 37: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 4 Model Hazard Proporsional dengan Stata

28

4. | 4 7 1 1 4.43 |

5. | 5 10 1 1 2.96 |

|----------------------------------|

6. | 6 13 1 1 2.88 |

7. | 7 16 1 1 3.6 |

8. | 8 22 1 1 2.32 |

9. | 9 23 1 1 2.57 |

10. | 10 6 0 1 3.2 |

+----------------------------------+

. stset weeks, failure(relapse)

failure event: relapse != 0 & relapse < .

obs. time interval: (0, weeks]

exit on or before: failure

-----------------------------------------------------------------

42 total observations

0 exclusions

-----------------------------------------------------------------

42 observations remaining, representing

30 failures in single-record/single-failure data

541 total analysis time at risk and under observation

at risk from t = 0

earliest observed entry t = 0

last observed exit t = 35

. list in 1/10

+--------------------------------------------------------+

| no weeks relapse x1 x2 _st _d _t _t0 |

|--------------------------------------------------------|

1. | 1 6 1 1 2.31 1 1 6 0 |

2. | 2 6 1 1 4.06 1 1 6 0 |

3. | 3 6 1 1 3.28 1 1 6 0 |

4. | 4 7 1 1 4.43 1 1 7 0 |

5. | 5 10 1 1 2.96 1 1 10 0 |

Page 38: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 4 Model Hazard Proporsional dengan Stata

29

|--------------------------------------------------------|

6. | 6 13 1 1 2.88 1 1 13 0 |

7. | 7 16 1 1 3.6 1 1 16 0 |

8. | 8 22 1 1 2.32 1 1 22 0 |

9. | 9 23 1 1 2.57 1 1 23 0 |

10. | 10 6 0 1 3.2 1 0 6 0 |

+--------------------------------------------------------+

Tampak adanya penambahan variabel _st, _d, _t, dan _t0.

� Analisis Regresi untuk Model PH Cox

Sintaks:

stcox [indepvars] [if] [in] [, options]

indepvars : Kovariat

Beberapa opsi:

estimate : Melakukan fit model tanpa kovariat

level(#) : Menentukan tingkat konfidensi, default-nya adalah level(95)

nohr : Tampilan HR diganti dengan koefisien regresi

Contoh 4.2:

. use “D:\Analisis Survival\Data\leukemia.dta”, clear

(Leukemia Remission Study)

. stcox x1 x2

failure _d: relapse

analysis time _t: weeks

Iteration 0: log likelihood = -93.98505

Iteration 1: log likelihood = -72.418226

Page 39: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 4 Model Hazard Proporsional dengan Stata

30

Iteration 2: log likelihood = -72.279588

Iteration 3: log likelihood = -72.27926

Refining estimates:

Iteration 0: log likelihood = -72.27926

Cox regression -- Breslow method for ties

No. of subjects = 42 Number of obs = 42

No. of failures = 30

Time at risk = 541

LR chi2(2) = 43.41

Log likelihood = -72.27926 Prob > chi2 = 0.0000

------------------------------------------------------------

_t | Haz. Ratio Std. Err. z P>|z| [95% Conf. Interval]

---+--------------------------------------------------------

x1 | .2741535 .1157213 -3.07 0.002 .1198666 .6270315

x2 | 4.974592 1.638274 4.87 0.000 2.608751 9.48598

------------------------------------------------------------

. stcox x1 x2, nohr

failure _d: relapse

analysis time _t: weeks

Iteration 0: log likelihood = -93.98505

Iteration 1: log likelihood = -72.418226

Iteration 2: log likelihood = -72.279588

Iteration 3: log likelihood = -72.27926

Refining estimates:

Iteration 0: log likelihood = -72.27926

Cox regression -- Breslow method for ties

No. of subjects = 42 Number of obs = 42

Page 40: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 4 Model Hazard Proporsional dengan Stata

31

No. of failures = 30

Time at risk = 541

LR chi2(2) = 43.41

Log likelihood = -72.27926 Prob > chi2 = 0.0000

-------------------------------------------------------------

_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]

---+---------------------------------------------------------

x1 | -1.294067 .422104 -3.07 0.002 -2.121376 -.4667586

x2 | 1.604343 .3293283 4.87 0.000 .9588716 2.249815

-------------------------------------------------------------

� Grafik Kaplan-Meier untuk Model PH Cox

Sintaks:

stcoxkm [if], by[varname] [options]

by[varname] : Laporkan kovariat nominal atau ordinal

Opsi:

separate : Gambarkan grafik observed dan predicted secara terpisah

Perintah stcoxkm menghasilkan grafik Kaplan-Meier observed dan

predicted sekaligus yang ditampilkan dalam 1 grafik.

sts graph [if] [in] [, options]

Opsi:

survival : Grafik fungsi survival Kaplan-Meier, default

failure : Grafik fungsi kegagalan Kaplan-Meier

cumhaz : Grafik fungsi hazard kumulatif Nelson-Aalen

hazard : Grafik estimasi hazard licin

by(varlist) : Estimasi dan grafik fungsi terpisah untuk tiap grup varlist

Page 41: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 4 Model Hazard Proporsional dengan Stata

32

Perintah sts graph menghasilkan grafik observed tanpa disertai

grafik predicted.

Contoh 4.3:

. use “D:\Analisis Survival\Data\leukemia.dta”, clear

(Leukemia Remission Study)

. stcoxkm, by(x1)

failure _d: relapse

analysis time _t: weeks

. stcoxkm, by(x1) separate

failure _d: relapse

analysis time _t: weeks

0.00

0.20

0.40

0.60

0.80

1.00

Survival Probability

Page 42: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 4 Model Hazard Proporsional dengan Stata

33

. sts graph, survival

failure _d: relapse

analysis time _t: weeks

0.00

0.50

1.00

Survival Probability

0.00

0.25

0.50

0.75

1.00

Page 43: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 4 Model Hazard Proporsional dengan Stata

34

. sts graph, survival by(x1)

failure _d: relapse

analysis time _t: weeks

� Uji Hipotesis untuk Fungsi Survival

Sintaks

sts test varlist [if] [in] [, options]

Opsi

logrank : Uji kesamaan log-rank; default

cox : Uji kesamaan Cox

wilcoxon : Uji kesamaan Wilcoxon-Breslow-Gehan

tware : Uji kesamaan Tarone-Ware

peto : Uji kesamaan Peto-Peto-Prentice

0.00

0.25

0.50

0.75

1.00

Page 44: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 4 Model Hazard Proporsional dengan Stata

35

Contoh 4.4:

. use “D:\Analisis Survival\Data\leukemia.dta”, clear

(Leukemia Remission Study)

. sts test weeks, logrank

failure _d: relapse

analysis time _t: weeks

Log-rank test for equality of survivor functions

| Events Events

weeks | observed expected

------+-------------------------

1 | 2 0.10

2 | 2 0.20

3 | 1 0.12

4 | 2 0.36

5 | 2 0.47

6 | 3 1.30

7 | 1 0.36

8 | 4 2.01

9 | 0 0.50

10 | 1 1.09

11 | 2 1.93

12 | 2 1.51

13 | 1 0.82

15 | 1 0.88

16 | 1 0.95

17 | 1 2.06

19 | 0 1.03

20 | 0 1.03

22 | 2 2.51

23 | 2 3.08

25 | 0 1.54

Page 45: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 4 Model Hazard Proporsional dengan Stata

36

32 | 0 3.08

34 | 0 1.54

35 | 0 1.54

------+-------------------------

Total | 30 30.00

chi2(23) = 115.62

Pr>chi2 = 0.0000

. sts test weeks, cox

failure _d: relapse

analysis time _t: weeks

Cox regression-based test for equality of survival

curves

| Events Events Relative

weeks | observed expected hazard

------+--------------------------------------

1 | 2 0.10 1.214e+29

2 | 2 0.20 1.294e+27

3 | 1 0.12 2.701e+25

4 | 2 0.36 2.848e+23

5 | 2 0.47 3.004e+21

6 | 3 1.30 1.589e+19

7 | 1 0.36 4.423e+17

8 | 4 2.01 2.345e+15

9 | 0 0.50 0.0001

10 | 1 1.09 2.447e+13

11 | 2 1.93 3.441e+11

12 | 2 1.51 5.443e+09

13 | 1 0.82 1.136e+08

15 | 1 0.88 2.371e+06

16 | 1 0.95 49488.8499

Page 46: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 4 Model Hazard Proporsional dengan Stata

37

17 | 1 2.06 516.4631

19 | 0 1.03 0.0000

20 | 0 1.03 0.0000

22 | 2 2.51 10.8978

23 | 2 3.08 0.1254

25 | 0 1.54 0.0000

32 | 0 3.08 0.0000

34 | 0 1.54 0.0000

35 | 0 1.54 0.0000

------+--------------------------------------

Total | 30 30.00 1.0000

LR chi2(21) = 141.50

Pr>chi2 = 0.0000

. sts test weeks, wilcoxon

failure _d: relapse

analysis time _t: weeks

Wilcoxon (Breslow) test for equality of survivor

functions

| Events Events Sum of

weeks | observed expected ranks

------+--------------------------------------

1 | 2 0.10 80

2 | 2 0.20 72

3 | 1 0.12 33

4 | 2 0.36 60

5 | 2 0.47 52

6 | 3 1.30 51

7 | 1 0.36 16

8 | 4 2.01 44

9 | 0 0.50 -17

10 | 1 1.09 -13

Page 47: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 4 Model Hazard Proporsional dengan Stata

38

11 | 2 1.93 -18

12 | 2 1.51 -8

13 | 1 0.82 -7

15 | 1 0.88 -9

16 | 1 0.95 -11

17 | 1 2.06 -39

19 | 0 1.03 -26

20 | 0 1.03 -26

22 | 2 2.51 -38

23 | 2 3.08 -46

25 | 0 1.54 -30

32 | 0 3.08 -60

34 | 0 1.54 -30

35 | 0 1.54 -30

------+--------------------------------------

Total | 30 30.00 0

chi2(23) = 98.52

Pr>chi2 = 0.0000

Page 48: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 5 Evaluasi Kesesuaian Model

39

BAB 5

EVALUASI KESESUAIAN MODEL

� Residual

Residual dalam model PH Cox tidak sama dengan residual dalam

model regresi lainnya. Dalam model regresi lain, residual adalah selisih

antara nilai respons observed dengan nilai respons predicted. Dalam data

survival, respons yaitu interval waktu sampai terjadinya kegagalan tidak

selalu diketahui, yaitu pada subjek tersensor.

Walaupun demikian, pada model PH Cox juga ada residual yang

dimanfaatkan antara lain untuk mengases asumsi hazard proporsional.

Dikenal berbagai residual pada model PH Cox, salah satu di antaranya yang

paling sering digunakan adalah residual Schoenfeld. Residual Schoenfeld

hanya memiliki nilai-nilai untuk subjek dengan kegagalan, dan bernilai nol

untuk subjek tersensor.

Dalam Stata, nilai residual diperoleh dengan perintah predict, yang

merupakan salah satu perintah dari stcox postestimation. Sebagai bagian

dari stcox postestimation, perintah predict hanya boleh diberikan

sesudah dan segera menyusul perintah pemodelan dengan stcox. Dengan

perintah predict juga dapat diprediksi nilai rasio hazard dan interval waktu

kegagalan. Sintaks-nya adalah

predict newvar [if] [in] [, options]

Opsi:

hr : rasio hazard predicted

xb : linear prediction jx β

mgale : residual martingale

csnell : residual Cox-Snell

deviance : residual deviance

Page 49: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 5 Evaluasi Kesesuaian Model

40

scores : residual efficient score

schoenfeld : residual Schoenfeld

scaledsch : residual Schoenfeld terskala

� Evaluasi asumsi hazard proporsional

Asumsi model hazard proporsional adalah:

Rasio hazard bersifat konstan dalam perjalanan waktu, atau hazard bagi

seorang individu bersifat proporsional terhadap hazard bagi individu lain,

dengan konstante proporsionalitas bersifat independen terhadap waktu.

Evaluasi asumsi hazard proporsional dapat dilakukan dengan

beberapa metode berikut:

1. Grafik hazard

2. Grafik survival log-log

3. Grafik survival Kaplan-Meier observed dan predicted

4. Uji kebaikan-suai waktu survival dan residual Schoenfeld

5. Kovariat time-dependent

Grafik hazard

Jika kedua grafik hazard (hazard baseline dan hazard dengan fungsi

eksponensial) berpotongan (gambar 5.1), maka asumsi hazard proporsional

tidak terpenuhi. Jika kedua grafik hazard tidak berpotongan, maka asumsi

hazard proporsional terpenuhi.

Page 50: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 5 Evaluasi Kesesuaian Model

Gambar 5.1 Kedua grafik hazard berpotongan

Grafik survival log-log

Grafik survival log-log adalah grafik

survival log-log sejajar, maka asumsi hazard proporsional terpenuhi. Jika

keduanya tidak sejajar, asumsi hazard proporsional tidak terpenuhi.

Dengan Stata, sintaks untuk memperoleh grafik survival log

adalah:

stphplot [if], by(varname

Misalnya, untuk file leukemia.dta perintahnya adalah:

. stphplot, by(x1)

Grafik yang diperoleh diperlihatkan pada gambar 5.2.

Bab 5 Evaluasi Kesesuaian Model

41

Gambar 5.1 Kedua grafik hazard berpotongan

log adalah grafik –ln (−ln ( )S t . Jika kedua grafik

sejajar, maka asumsi hazard proporsional terpenuhi. Jika

keduanya tidak sejajar, asumsi hazard proporsional tidak terpenuhi.

Dengan Stata, sintaks untuk memperoleh grafik survival log-log

varname)

dta perintahnya adalah:

yang diperoleh diperlihatkan pada gambar 5.2.

Page 51: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 5 Evaluasi Kesesuaian Model

42

Gambar 5.2 Grafik survival log-log

Grafik survival Kaplan-Meier observed dan predicted

Kedua grafik survival Kaplan-Meier observed dan expected untuk

tiap grup harus ‘berdekatan’ satu sama lain. Jika tiap pasangan ini

berdekatan, maka asumsi hazard proporsional terpenuhi. Jika tidak, maka

asumsi hazard proporsional tidak terpenuhi.

Untuk memudahkan evaluasi, biasanya kedua grafik observed dan

expected digambarkan bersama-sama dalam satu gambar. Sintaks Stata-nya

adalah:

stcoxkm [if], by(varname)

Untuk file leukemia.dta, perintahnya adalah:

. stcoxkm, by(x1)

Grafik yang diperoleh diperlihatkan pada gambar 5.3.

-10

12

3-ln[-

ln(S

urv

ival P

robabili

ty)]

Page 52: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 5 Evaluasi Kesesuaian Model

43

Gambar 5.3 Grafik survival Kaplan-Meier observed dan expected

Uji kebaikan-suai waktu survival dan residual Schoenfeld

Jika tidak ada asosiasi antara waktu survival dengan residual

Schoenfeld, asumsi hazard proporsional terpenuhi. Jika asosiasi ini ada,

asumsi hazard proporsional tidak terpenuhi.

Secara kasar, ada tidaknya asosiasi dapat dilihat pada grafik waktu

survival dan residual Schoenfeld. Dengan Stata, sintaks untuk memperoleh

grafik ini adalah:

estat phtest, plot(varname)

Misalnya, untuk file leukemia.dta perintahnya adalah:

. quitely stcoxkm, by(x1)

. estat phtest, plot(x1)

Grafik yang diperoleh diperlihatkan pada gambar 5.4.

0.0

00.2

00.4

00.6

00.8

01.0

0S

urv

ival P

robabili

ty

Page 53: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 5 Evaluasi Kesesuaian Model

44

Gambar 5.4 Grafik waktu survival dan residual Schoenfeld

Secara lebih eksak, dapat dilakukan uji hipotesis, yaitu uji kebaikan-

suai dengan perintah estat phtest.

Untuk file leukemia.dta, diperoleh:

. estat phtest

Test of proportional-hazards assumption

Time: Time

------------------------------------------

| chi2 df Prob>chi2

------------+-----------------------------

global test | 0.07 2 0.9661

------------------------------------------

Evaluasi asumsi PH dengan kovariat time-dependent

Pada evaluasi asumsi PH dengan kovariat time-dependent ini, model

Cox diperluas dengan menambahkan suku perkalian (yaitu interaksi) antara

variabel time-independent yang dievaluasi dengan suatu fungsi waktu g (t).

-6-4

-20

2S

cale

d S

choenfe

ld -

x1

Page 54: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 5 Evaluasi Kesesuaian Model

45

Fungsi waktu g (t) yang dapat digunakan antara lain yaitu t atau ln t.

Jika suku interaksi ini ternyata bermakna pada uji hipotesis, maka asumsi PH

dinyatakan tidak terpenuhi.

Misalkan pada file leukemia.dta, variabel x3 (sex) yang bersifat

time-independent akan dievaluasi. Ditambahkan suku x3*t dan dilakukan uji

hipotesis.

. stset weeks, failure(relapse)

. gen x3_prod = x3*weeks

. stcox x3 x3_prod

----------------------------------------------------------------

_t | Haz. Ratio Std. Err. z P>|z| [95% Conf. Interval]

--------+-------------------------------------------------------

x3 | 177.5658 166.7587 5.51 0.000 28.18148 1118.806

x3_prod | .6809985 .0554517 -4.72 0.000 .5805442 .7988348

----------------------------------------------------------------

Didapatkan suku sex*weeks bermakna secara statistik (p = 0.000),

sehingga disimpulkan bahwa variabel sex tidak memenuhi asumsi hazard

proporsional.

Page 55: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik
Page 56: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 6 Model Hazard Proporsional Extended

47

BAB 6

MODEL HAZARD PROPORSIONAL

EXTENDED

� Pengertian Variabel Time-Dependent

Variabel time-dependent (time-varying) adalah variabel yang nilai-

nilainya berbeda untuk subjek tertentu dalam perjalanan waktu t. Model PH

Cox adalah sebagai berikut:

( )h t X = ( ) 0h t exp

1

p

ii

β=∑ iX

Bagian pertama dari ruas kanan persamaan tersebut, yaitu ( ) 0h t adalah

hazard baseline yang memuat t tetapi tidak memuat X. Bagian kedua, yaitu

eksponensial exp

1

p

ii

β=∑ iX memuat X tetapi tidak memuat t, karena itu X di

sini disebut time-independent. Jika suku eksponensial ini memuat t, maka X-

nya akan menjadi variabel time-dependent. Dengan variabel X yang time-

dependent, model di atas masih berbentuk model Cox, tetapi tidak lagi

memenuhi asumsi PH sehingga disebut model Cox extended.

� Model Extended Cox untuk Variabel Time-

Dependent

Model Cox extended untuk variabel time-independent dan variabel

time-dependent yaitu:

( )( )h t tX = ( ) 0h t exp ( )

1 2

1 1

p p

i i j ji j

X X tβ δ= =

+

∑ ∑

Ruas kanan persamaan mencakup variabel:

Page 57: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 6 Model Hazard Proporsional Extended

48

( )tX = ( ) ( ) ( )( )

1 21 2 1 2, , . . . , , , , . . . ,p pX X X X t X t X t

( )

11 2, , . . . , pX X X adalah himpunan variabel time-independent, sedangkan

( ) ( ) ( )( )

21 2, , . . . , pX t X t X t adalah himpunan variabel time-dependent.

Pada bab V telah diperkenalkan variabel time-dependent yang

digunakan untuk menguji apakah suatu prediktor time-independent

memenuhi asumsi PH, yaitu sex×t. Secara umum bentuk variabel time-

dependent dinyatakan sebagai iE × ( )ig t , dengan ( )ig t disebut sebagai

pengali (multiplier) untuk variabel time-dependent. Salah satu contoh ( )ig t

yaitu ( )ig t = 0 jika t < 0t dan ( )ig t = 1 jika t > 0t . Fungsi ( )ig t pada

contoh terakhir ini disebut sebagai fungsi heaviside. Bentuk lain yang juga

sering dipakai yaitu ( )ig t = ln (t).

Inklusi variabel time-dependent ke dalam model HP Cox umumnya

tidak dianjurkan karena dapat menimbulkan berbagai masalah, dan inklusi

sebaiknya hanya dilakukan setelah melalui pengkajian model secara

mendalam dari segi substansi bidang ilmu bersangkutan.

� Formula Rasio Hazard untuk Model Extended

Cox

Jika dalam satu model terdapat variabel time-independent dan

variabel time-dependent sekaligus, maka dengan pemodelan HP Cox

extended akan diperoleh nilai rasio hazard untuk variabel time-independent,

tetapi untuk variabel time-dependent yang diperoleh adalah rerata nilai-nilai

rasio hazard dalam waktu t.

Fitting untuk model HP Cox extended ini dapat dilakukan dengan

Stata.

Sintaks

Sintaks untuk model HP Cox adalah:

Page 58: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 6 Model Hazard Proporsional Extended

49

stcox [indepvars] [if] [in] [, options]

Tanpa pembatasan if dan in, serta tanpa opsi akan diperoleh:

ln HP = 1β

1X + 2β

2X + . . . + pβ

pX

Untuk model HP Cox extended sintaks-nya adalah:

stcox main_var, tvc(time_dep_var) texp(mult_func)

time_dep_var : kovariat time-dependent

mult_func : pengali (multiplier) bagi kovariat time-dependent

Contoh 6.1:

File data yang akan dianalisis adalah hip4.dta, yang memuat data

penelitian tentang fraktur panggul. Beberapa variabelnya yaitu:

id : Nomor identitas pasien

time0 : Awal pengamatan

time1 : Akhir pengamatan

fracture : Kejadian fraktur (kegagalan)

protect : Penggunaan alat pelindung

age : Usia pada saat pendaftaran studi

calcium : Kadar kalsium darah

. use “D:\Analisis Survival\Data\hip4.dta”, clear

(hip fracture study)

. list id _t0 _t _d init_drug_level in 1/10

+-------------------------------+

| id _t0 _t _d init_d~l |

|-------------------------------|

1. | 1 0 1 1 50 |

2. | 2 0 1 1 50 |

3. | 3 0 2 1 50 |

4. | 4 0 3 1 50 |

5. | 5 0 4 1 100 |

Page 59: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 6 Model Hazard Proporsional Extended

50

|-------------------------------|

6. | 6 0 4 1 50 |

7. | 7 0 5 1 100 |

8. | 8 0 5 1 50 |

9. | 9 0 5 0 50 |

10. | 9 5 8 1 50 |

+-------------------------------+

Ada 2 macam dosis awal pemberian obat (init.drug_level), yaitu 50

dan 100. Kadar obat dalam darah akan mengalami peluruhan dengan laju

dengan skala eksponensial, sehingga kadar obat dalam darah pada waktu t

adalah init.drug_level × exp(−0.35t). Perintah Stata yaitu:

. stcox protect, tvc(init_drug_level) texp(exp(-0.35*_t))

failure _d: fracture

analysis time _t: time1

id: id

Iteration 0: log likelihood = -98.571254

Iteration 1: log likelihood = -83.895138

Iteration 2: log likelihood = -83.241951

Iteration 3: log likelihood = -83.214617

Iteration 4: log likelihood = -83.214437

Refining estimates:

Iteration 0: log likelihood = -83.214437

Cox regression -- Breslow method for ties

No. of subjects = 48 Number of obs = 106

No. of failures = 31

Time at risk = 714

LR chi2(2) = 30.71

Log likelihood = -83.214437 Prob > chi2 = 0.0000

Page 60: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 6 Model Hazard Proporsional Extended

51

----------------------------------------------------------------------

_t | Haz. Ratio Std. Err. z P>|z| [95% Conf. Interval]

----------------+-----------------------------------------------------

main |

protect | .1183196 .0518521 -4.87 0.000 .050122 .2793091

----------------+-----------------------------------------------------

tvc |

init_drug_level | .8848298 .0601786 -1.80 0.072 .7744052 1.011

----------------------------------------------------------------------

Note: Variables in tvc equation interacted with exp(-0.35*_t).

Rasio hazard untuk init.drug_level sebesar 0.8848 adalah nilai

rerata rasio hazard antara kadar awal obat 100 dengan kadar awal obat 50

untuk mengalami kegagalan (fraktur panggul).

Page 61: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik
Page 62: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 7 Model Survival Parametrik

53

BAB 7

MODEL SURVIVAL PARAMETRIK

� Asumsi Hazard Proporsional dan Asumsi

Accelerated Failure Time

Model survival parametrik adalah model dengan waktu survival

(respons) diasumsikan mengikuti suatu distribusi yang diketahui. Distribusi

yang sering digunakan untuk waktu survival adalah: Eksponensial, Weibull,

dan log-logistik.

Pada model survival parametrik didapatkan 2 tipe asumsi:

- Asumsi PH: Asumsi ini sama dengan asumsi PH pada model PH Cox.

Di sini efek kovariat bersifat multiplikatif terhadap hazard.

( )jh t X = ( ) 0h t exp ( )

1Xβ

Misalnya pada model eksponensial, ( ) 0h t diasumsikan sama dengan

exp ( ) 0β , sehingga:

( )jh t X = exp ( ) 0β × exp ( )

1Xβ

= exp ( )

0 1Xβ β+

- Asumsi AFT (accelerated failure time): Efek kovariat bersifat

multiplikatif terhadap waktu survival.

T = exp ( )

0 1Xα α ε+ +

= exp ( )

0α × exp ( )

1α × exp ( ) ε

Atau: ln (T) = 0α +

1α X + ε

Model AFT biasa dinyatakan dalam T atau ln (T).

Page 63: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 7 Model Survival Parametrik

54

Model survival parametrik hampir semua merupakan model survival

AFT. Pada beberapa model survival parametrik, antara lain model

eksponensial dan Weibull didapatkan asumsi PH dan asumsi AFT secara

bersamaan sekaligus.

Pada model survival parametrik PH, jika ( ) 1h t menyatakan hazard

pada grup 1, ( ) 2h t menyatakan hazard pada grup 2, maka rasio keduanya

yaitu rasio hazard ( ) ( ) 2 1h t h t menyatakan ukuran asosiasi hazard.

Pada model AFT, jika 1T menyatakan waktu survival pada grup 1,

2T menyatakan waktu survival pada grup 2, maka rasio keduanya yaitu γ =

2 1T T dinamakan faktor akselerasi. Faktor akselerasi menyatakan ukuran

asosiasi waktu survival.

Faktor akselerasi yang lebih daripada 1 mengindikasikan bahwa

kovariat bersifat menguntungkan bagi waktu survival, sedangkan rasio

hazard yang lebih besar daripada 1 mengindikasikan kovariat bersifat

merugikan bagi hazard, begitu pula sebaliknya. Faktor akselerasi sama

dengan satu memiliki pengertian sama dengan rasio hazard sama dengan

satu, yaitu kovariat tidak berpengaruh terhadap responsnya.

� Model Regresi Eksponensial

Fungsi hazard untuk model eksponensial adalah ( )h t = λ (hazard

bersifat konstan), sedangkan fungsi survivalnya adalah ( )S t = ( )exp tλ− .

Model regresi untuk data survival adalah:

( )h t X = ( ) 0h t exp ( )

1Xβ

Misalkan ( ) 0h t yang dinyatakan berdistribusi eksponensial asumsi hazard

proporsional, dan ( ) 0h t = λ = exp ( )

0β , maka :

( )h t X = exp ( ) 0β exp ( )

1Xβ

= exp ( ) 0 1Xβ β+

Page 64: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 7 Model Survival Parametrik

55

Model regresi dengan asumsi AFT untuk data survival adalah:

jτ = exp ( ) 1Xβ− jt

Pada model regresi eksponensial AFT diperoleh:

( )ln jt = 1Xβ + ( )ln jτ

= 1Xβ +

0β + ju

Fitting model regresi eksponensial dapat dilakukan dengan Stata.

Sintaks-nya untuk metrik hazard proporsional adalah:

. streg [indepvars] [if] [in], distribution(exponential)

Opsi:

nohr : Mengganti rasio hazard pada keluaran dengan koefisien regresi.

time : Fitting model dengan asumsi AFT

Perintah streg harus didahului dengan deklarasi data survival stset.

Contoh 7.1:

. use “D:\Analisis survival\Data\leukemia.dta”, clear

(Leukemia Remission Study)

. stset weeks, failure(relapse)

failure event: relapse != 0 & relapse < .

obs. time interval: (0, weeks]

exit on or before: failure

-----------------------------------------------------------------

42 total observations

0 exclusions

-----------------------------------------------------------------

42 observations remaining, representing

30 failures in single-record/single-failure data

541 total analysis time at risk and under observation

Page 65: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 7 Model Survival Parametrik

56

at risk from t = 0

earliest observed entry t = 0

last observed exit t = 35

. streg x1 x2, dist(exponential)

failure _d: relapse

analysis time _t: weeks

Iteration 0: log likelihood = -57.251267

Iteration 1: log likelihood = -51.741837

Iteration 2: log likelihood = -41.34362

Iteration 3: log likelihood = -41.258417

Iteration 4: log likelihood = -41.258247

Iteration 5: log likelihood = -41.258247

Exponential PH regression

No. of subjects = 42 Number of obs = 42

No. of failures = 30

Time at risk = 541

LR chi2(2) = 31.99

Log likelihood = -41.258247 Prob > chi2 = 0.0000

----------------------------------------------------------------

_t | Haz. Ratio Std. Err. z P>|z| [95% Conf. Interval]

------+---------------------------------------------------------

x1 | .3351846 .138513 -2.65 0.008 .149118 .7534214

x2 | 2.421518 .5224968 4.10 0.000 1.586433 3.696183

_cons | .0077134 .0058345 -6.43 0.000 .0017514 .0339708

----------------------------------------------------------------

Note: _cons estimates baseline hazard.

Page 66: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 7 Model Survival Parametrik

57

. streg x1 x2, dist(exponential) nohr

---------------------------------------------------------------

_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]

------+--------------------------------------------------------

x1 | -1.093074 .413244 -2.65 0.008 -1.903017 -.2831306

x2 | .8843946 .2157724 4.10 0.000 .4614884 1.307301

_cons | -4.864799 .756414 -6.43 0.000 -6.347344 -3.382255

---------------------------------------------------------------

. streg x1 x2, dist(exponential) time

failure _d: relapse

analysis time _t: weeks

Iteration 0: log likelihood = -57.251267

Iteration 1: log likelihood = -51.741837

Iteration 2: log likelihood = -41.34362

Iteration 3: log likelihood = -41.258417

Iteration 4: log likelihood = -41.258247

Iteration 5: log likelihood = -41.258247

Exponential AFT regression

No. of subjects = 42 Number of obs = 42

No. of failures = 30

Time at risk = 541

LR chi2(2) =

31.99r

Log likelihood = -41.258247 Prob > chi2 = 0.0000

---------------------------------------------------------------

_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]

------+--------------------------------------------------------

x1 | 1.093074 .413244 2.65 0.008 .2831306 1.903017

x2 | -.8843946 .2157724 -4.10 0.000 -1.307301 -.4614884

_cons | 4.864799 .756414 6.43 0.000 3.382255 6.347344

Page 67: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 7 Model Survival Parametrik

58

---------------------------------------------------------------

Tampak bahwa model PH dan model AFT eksponensial memiliki

nilai-nilai estimasi yang sama besar, hanya berlawanan tanda.

� Model Regresi Weibull

Fungsi hazard pada model Weibull adalah 1pptλ − , sedangkan fungsi

survivalnya adalah S (t) = ( )expp

tλ− . Model Weibull merupakan bentuk

khusus model eksponensial, yaitu jika p = 1, maka model ini menjadi

kembali model eksponensial.

λ = exp ( ) 0 1Xβ β+

Sintaks Stata untuk fitting model regresi Weibull yaitu:

. streg [indepvars] [if] [in], distribution(weibull)

Opsi:

nohr : Mengganti rasio hazard pada keluaran dengan koefisien regresi.

time : Fitting model dengan asumsi AFT

Contoh 7.2:

. use “D:\Analisis survival\Data\leukemia.dta”, clear

(Leukemia Remission Study)

. stset weeks, failure(relapse)

. streg x1 x2, dist(weibull)

failure _d: relapse

analysis time _t: weeks

Fitting constant-only model:

Iteration 0: log likelihood = -57.251267

Page 68: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 7 Model Survival Parametrik

59

Iteration 1: log likelihood = -56.890587

Iteration 2: log likelihood = -56.890017

Iteration 3: log likelihood = -56.890017

Fitting full model:

Iteration 0: log likelihood = -56.890017

Iteration 1: log likelihood = -45.271492

Iteration 2: log likelihood = -30.621074

Iteration 3: log likelihood = -30.548147

Iteration 4: log likelihood = -30.548066

Iteration 5: log likelihood = -30.548066

Weibull PH regression

No. of subjects = 42 Number of obs = 42

No. of failures = 30

Time at risk = 541

LR chi2(2) = 52.68

Log likelihood = -30.548066 Prob > chi2 = 0.0000

------------------------------------------------------------------

_t | Haz. Ratio Std. Err. z P>|z| [95% Conf. Interval]

------+-----------------------------------------------------------

x1 | .2330768 .0965324 -3.52 0.000 .1035048 .5248528

x2 | 5.953789 2.010414 5.28 0.000 3.071627 11.54033

_cons | .0000282 .0000482 -6.14 0.000 9.95e-07 .0008015

------+-----------------------------------------------------------

/ln_p | .7930337 .1422085 5.58 0.000 .5143103 1.071757

------+-----------------------------------------------------------

p | 2.210091 .3142937 1.672485 2.920507

1/p | .45247 .0643451 .3424063 .5979129

------------------------------------------------------------------

Note: Estimates are transformed only in the first equation.

Page 69: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 7 Model Survival Parametrik

60

Note: _cons estimates baseline hazard.

. streg x1 x2, dist(weibull) nohr

------------------------------------------------------------------------------

_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]

------+--------------------------------------------------------

x1 | -1.456387 .4141656 -3.52 0.000 -2.268137 -.6446374

x2 | 1.784028 .3376697 5.28 0.000 1.122207 2.445848

_cons | -10.47489 1.707129 -6.14 0.000 -13.8208 -7.128981

------+--------------------------------------------------------

/ln_p | .7930337 .1422085 5.58 0.000 .5143103 1.071757

------+--------------------------------------------------------

p | 2.210091 .3142937 1.672485 2.920507

1/p | .45247 .0643451 .3424063 .5979129

---------------------------------------------------------------

. streg x1 x2, dist(weibull) time

---------------------------------------------------------------

_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]

------+--------------------------------------------------------

x1 | .6589716 .189031 3.49 0.000 .2884777 1.029465

x2 | -.8072191 .1084224 -7.45 0.000 -1.019723 -.5947151

_cons | 4.739575 .3682582 12.87 0.000 4.017802 5.461348

------+--------------------------------------------------------

/ln_p | .7930337 .1422085 5.58 0.000 .5143103 1.071757

------+--------------------------------------------------------

p | 2.210091 .3142937 1.672485 2.920507

1/p | .45247 .0643451 .3424063 .5979129

---------------------------------------------------------------

Tampak estimasi p, 1/p, dan ln (p) bernilai sama untuk model PH dan

AFT. Untuk estimasi koefisien regresi jX berlaku jβ = jα− × p, misalnya

untuk 1X :

-1.456387 = (-.6589716)(2.210091)

Untuk model eksponensial, karena p = 1 didapatkan jβ = jα− .

Page 70: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 7 Model Survival Parametrik

61

� Model Regresi Log-Logistik

Fungsi hazard untuk model log-logistik adalah 1

1

p

p

pt

t

λ

λ

+, sedangkan

fungsi survival-nya adalah 1

1p

tλ+.

Model log-logistik merupakan model AFT, tetapi bukan model PH.

Model log-logistik merupakan model odds proporsional (model PO), yaitu

rasio odds diasumsikan konstan dalam perjalanan waktu. Odds di sini adalah

survival odds, yaitu ( )

( )( )1

S t

S t−.

Sintaks Stata untuk fitting model regresi log-logistik adalah:

. streg [indepvars] [if] [in], distribution(loglogistic)

Contoh 7.3:

. use “D:\Analisis survival\Data\leukemia.dta”, clear

(Leukemia Remission Study)

. stset weeks, failure(relapse)

failure event: relapse != 0 & relapse < .

obs. time interval: (0, weeks]

exit on or before: failure

-----------------------------------------------------------------

42 total observations

0 exclusions

-----------------------------------------------------------------

42 observations remaining, representing

30 failures in single-record/single-failure data

541 total analysis time at risk and under observation

at risk from t = 0

earliest observed entry t = 0

Page 71: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 7 Model Survival Parametrik

62

last observed exit t = 35

. streg x1 x2, dist(loglogistic)

failure _d: relapse

analysis time _t: weeks

Fitting constant-only model:

Iteration 0: log likelihood = -61.765573

Iteration 1: log likelihood = -56.424838

Iteration 2: log likelihood = -55.843837

Iteration 3: log likelihood = -55.835725

Iteration 4: log likelihood = -55.835723

Fitting full model:

Iteration 0: log likelihood = -55.835723 (not concave)

Iteration 1: log likelihood = -42.884032

Iteration 2: log likelihood = -33.571819

Iteration 3: log likelihood = -32.819326

Iteration 4: log likelihood = -32.816003

Iteration 5: log likelihood = -32.816002

Loglogistic AFT regression

No. of subjects = 42 Number of obs = 42

No. of failures = 30

Time at risk = 541

LR chi2(2) = 46.04

Log likelihood = -32.816002 Prob > chi2 = 0.0000

------------------------------------------------------------------

_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]

---------+--------------------------------------------------------

x1 | .7425474 .2098214 3.54 0.000 .331305 1.15379

Page 72: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 7 Model Survival Parametrik

63

x2 | -.7325418 .1075761 -6.81 0.000 -.943387 -.5216966

_cons | 4.26543 .3818616 11.17 0.000 3.516995 5.013865

---------+--------------------------------------------------------

/lngamma | -1.08906 .1509141 -7.22 0.000 -1.384846 -.7932738

---------+--------------------------------------------------------

gamma | .3365327 .0507875 .2503623 .4523614

------------------------------------------------------------------

. streg x1 x2, dist(loglogistic) time

---------------------------------------------------------

_t | Coef. Std. Err. z P>|z| [95% Conf. Interval]

---------+--------------------------------------------------------

x1 | .7425474 .2098214 3.54 0.000 .331305 1.15379

x2 | -.7325418 .1075761 -6.81 0.000 -.943387 -.5216966

_cons | 4.26543 .3818616 11.17 0.000 3.516995 5.013865

---------+--------------------------------------------------------

/lngamma | -1.08906 .1509141 -7.22 0.000 -1.384846 -.7932738

---------+--------------------------------------------------------

gamma | .3365327 .0507875 .2503623 .4523614

------------------------------------------------------------------

Tampak bahwa dengan dan tanpa opsi time, estimasi yang diperoleh

selalu adalah model AFT.

Page 73: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik
Page 74: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 8 Power dan Ukuran Sampel

65

BAB 8

POWER DAN UKURAN SAMPEL

Dalam bab ini akan dibahas beberapa perhitungan ukuran sampel, power,

dan ukuran efek (effect size) untuk analisis survival dengan menggunakan Stata.

� Power dan Ukuran Sampel Uji Log-Rank

Sintaks

Untuk menghitung ukuran sampel:

power logrank [surv1 [surv2]] [, power(numlist) options]

Untuk menghitung power:

power logrank [surv1 [surv2]], n(numlist) [options]

Untuk menghitung ukuran efek:

power logrank [surv1], n(numlist) power(numlist) [options]

surv1 : Probabilitas survival grup kontrol pada akhir studi t

surv2 : Probabilitas survival grup eksperimen pada akhir studi t

Opsi:

alpha(numlist) : Tingkat signifikansi; default-nya adalah alpha(0.05)

power(numlist) : Power; default-nya adalah power(0.8)

beta(numlist) : Probabilitas kesalahan tipe II, default-nya adalah beta(0.2)

n(numlist) : Ukuran sampel, dibutuhkan pada perhitungan power atau

ukuran efek

n1(numlist) : Ukuran sampel grup kontrol

n2(numlist) : Ukuran sampel grup eksperimental

nratio(numlist) : Rasio ukuran sampel, N2/N1; default-nya adalah nratio(1)

hratio(numlist) : Rasio hazard; default-nya adalah hratio(0.5)

lnhratio(numlist) : Log rasio hazard

Page 75: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 8 Power dan Ukuran Sampel

66

schoenfeld : Penggunaan formula berbasiskan log rasio hazard dalam

kalkulasi; default-nya adalah penggunaan formula

berbasiskan rasio hazard

effect(effect) : Spesifikasi tipe efek yang akan ditampilkan; default-nya

yaitu spesifik-metode

onesided : Uji satu sisi; default-nya adalah twosided

Contoh 8.1:

� Hitung ukuran sampel yang dibutuhkan untuk mendeteksi rasio hazard default

0.5 dengan menggunakan metode Freeman. Diasumsikan uji dua sisi dengan

tingkat signifikansi 5%, power 80% dan ukuran sampel kedua grup sama

besar (default).

. power logrank

Estimated sample sizes for two-sample comparison of

survivor functions

Log-rank test, Freedman method

Ho: HR = 1 versus Ha: HR != 1

Study parameters:

alpha = 0.0500

power = 0.8000

delta = 0.5000 (hazard ratio)

hratio = 0.5000

Censoring:

Pr_E = 1.0000

Estimated number of events and sample sizes:

E = 72

N = 72

N per group = 36

Page 76: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 8 Power dan Ukuran Sampel

67

Ukuran sampel minimum per grup adalah 36 dan ukuran sampel seluruhnya

72.

� Sama seperti di atas, tetapi menggunakan metode Schoenfeld.

. power logrank, schoenfeld

Estimated sample sizes for two-sample comparison of

survivor functions

Log-rank test, Schoenfeld method

Ho: ln(HR) = 0 versus Ha: ln(HR) != 0

Study parameters:

alpha = 0.0500

power = 0.8000

delta = -0.6931 (log hazard-ratio)

hratio = 0.5000

Censoring:

Pr_E = 1.0000

Estimated number of events and sample sizes:

E = 66

N = 66

N per group = 33

Ukuran sampel minimum per grup adalah 33 dan ukuran sampel seluruhnya

66.

� Hitung ukuran sampel yang dibutuhkan dengan adanya sensoring untuk

mendeteksi perubahan survival dari 50% menjadi 60%, dengan menggunakan

uji satu-sisi.

. power logrank 0.5 0.6, onesided

Estimated sample sizes for two-sample comparison of

survivor functions

Page 77: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 8 Power dan Ukuran Sampel

68

Log-rank test, Freedman method

Ho: HR = 1 versus Ha: HR < 1

Study parameters:

alpha = 0.0500

power = 0.8000

delta = 0.7370 (hazard ratio)

hratio = 0.7370

Censoring:

s1 = 0.5000

s2 = 0.6000

Pr_E = 0.4500

Estimated number of events and sample sizes:

E = 270

N = 600

N per group = 300

Ukuran sampel minimum per grup adalah 300 dan ukuran sampel seluruhnya

600.

� Hitung power pada studi dengan ukuran sampel grup kontrol 50 dan grup

eksperimental 100, probabilitas survival pada grup kontrol adalah 50% dan

rasio hazard 0.7370.

. power logrank 0.5, n(150) nratio(2) hratio(0.7370) onesided

Estimated power for two-sample comparison of

survivor functions

Log-rank test, Freedman method

Ho: HR = 1 versus Ha: HR < 1

Study parameters:

alpha = 0.0500

N = 150

Page 78: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 8 Power dan Ukuran Sampel

69

N1 = 50

N2 = 100

N2/N1 = 2.0000

delta = 0.7370 (hazard ratio)

hratio = 0.7370

Number of events and censoring:

E = 66

s1 = 0.5000

s2 = 0.6000

Pr_E = 0.4333

Estimated power:

power = 0.3326

Power pada studi ini adalah 33.26%.

� Sama seperti di atas, tentukan rasio hazard minimum yang dapat dideteksi

pada sampel berukuran 150 dengan power 90%, dan sesuai default rasio

hazard target diasumsikan kurang daripada satu.

. power logrank, power(0.9) n(150) nratio(2) onesided

Estimated power for two-sample comparison of

survivor functions

Log-rank test, Freedman method

Ho: HR = 1 versus Ha: HR < 1

Study parameters:

alpha = 0.0500

N = 150

N1 = 50

N2 = 100

N2/N1 = 2.0000

delta = 0.7370 (hazard ratio)

hratio = 0.7370

Page 79: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 8 Power dan Ukuran Sampel

70

Number of events and censoring:

E = 66

s1 = 0.5000

s2 = 0.6000

Pr_E = 0.4333

Estimated power:

power = 0.3326

Rasio hazard minimum yang dapat dideteksi adalah 0.7370.

� Power dan Ukuran Sampel Model PH Cox

Sintaks

Untuk menghitung ukuran sampel:

power cox [b1] [, power(numlist) options]

Untuk menghitung power:

power cox [b1], n(numlist) [options]

Untuk menghitung ukuran efek:

power cox [b1], n(numlist) power(numlist) [options]

b1 : Koefisien regresi hipotesis (ukuran efek) kovariat yang diminati pada

model PH Cox yang hendak dideteksi dengan uji yang powernya telah

dispesifikasikan

Opsi:

alpha(numlist) : Tingkat signifikansi; default-nya adalah alpha(0.05)

power(numlist) : Power; default-nya adalah power(0.8)

beta(numlist) : Probabilitas kesalahan tipe II, default-nya adalah beta(0.2)

Page 80: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 8 Power dan Ukuran Sampel

71

n(numlist) : Ukuran sampel, dibutuhkan pada perhitungan power

atau ukuran efek

hratio(numlist) : Rasio hazard; default-nya adalah hratio(0.5)

sd(numlist) : Standar deviasi kovariat yang diminati; default-nya

adalah sd(0.5)

r2(numlist) : Kuadrat koefisien korelasi ganda dengan kovariat lain;

default-nya adalah r2(0)

eventprob(numlist) : Probabilitas total kejadian (kegagalan) yang diminati;

default-nya adalah eventprob(1)

failprob(numlist) : Sinonim untuk eventprob()

wdprob(numlist) : Proporsi subjek yang diantisipasi akan mengundurkan

diri dari studi; default-nya adalah wdprob(0)

effect(effect) : Tipe efek yang akan ditampilkan; default-nya adalah

effect(coefficient)

onesided : Uji satu sisi; default-nya adalah twosided

Contoh 8.2:

� Hitung jumlah kegagalan yang diperlukan untuk mendeteksi penurunan 0.5

pada hazard kovariat biner yang diminati. Sesuai default, rasio hazard adalah

0.5 sehingga koefisien regresi ln (0.5) = −0.6931, SD kovariat adalah 0.5,

tingkat signifikansi 5%, dan power 80%. Akan digunakan uji dua-sisi.

. power cox

Estimated sample size for Cox PH regression

Wald test

Ho: beta1 = 0 versus Ha: beta1 != 0

Study parameters:

alpha = 0.0500

power = 0.8000

delta = -0.6931 (coefficient)

hratio = 0.5000

sd = 0.5000

Censoring:

Page 81: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 8 Power dan Ukuran Sampel

72

Pr_E = 1.0000

Estimated number of events and sample size:

E = 66

N = 66

Jumlah kegagalan yang dibutuhkan adalah 66.

� Hitung ukuran sampel yang dibutuhkan untuk mendeteksi koefisien regresi −1

untuk kovariat yang diminati dengan standar deviasi 0.3, dengan

menggunakan uji sat-sisi.

. power cox −1, sd(0.3) onesided

Estimated sample size for Cox PH regression

Wald test

Ho: beta1 = 0 versus Ha: beta1 < 0

Study parameters:

alpha = 0.0500

power = 0.8000

delta = -1.0000 (coefficient)

b1 = -1.0000

sd = 0.3000

Censoring:

Pr_E = 1.0000

Estimated number of events and sample size:

E = 69

N = 69

Ukuran sampel yang dibutuhkan adalah 69.

Page 82: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

Bab 8 Power dan Ukuran Sampel

73

� Hitung power pada studi dengan koefisien regresi kovariat yang diminati −1,

probabilitas total kegagalan 0.85, ukuran sampel 150 dengan standar deviasi

0.3. Korelasi kuadrat kovariat yang diminati dengan kovariat lain adalah R2 =

0.3. Akan dilakukan uji sat-sisi.

. power cox -1, n(150) sd(0.3) eventprob(0.85) r2(0.3) onesided

Estimated power for Cox PH regression

Wald test

Ho: beta1 = 0 versus Ha: beta1 < 0

Study parameters:

alpha = 0.0500

N = 150

delta = -1.0000 (coefficient)

b1 = -1.0000

sd = 0.3000

R2 = 0.3000

Number of events and censoring:

E = 128

Pr_E = 0.8500

Estimated power:

power = 0.8828

Power studi adalah 88.28%.

Page 83: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik
Page 84: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik

75

KEPUSTAKAAN

Cleves M, Gutierrez RG, Gould W, Marchenko YV. An Introduction to

Survival Analysis Using Stata, 3rd Ed. College Station, Texas: Stata

Press, 2010.

Hosmer DW, Lemeshow S, May S. Applied Survival Analysis: Regression

Modeling of Time-to-Event Data, 2nd Ed. Hoboken, New Jersey:

John Wiley & Sons, Inc, 2008.

Kleinbaum DG, Klein M. Survival Analysis: A Self-Learning Text, 2nd

Ed. New York: Springer, 2005.

Liu X. Survival Analysis: Models and Applications. Chichester, West

Sussex: John Wiley & Sons Ltd, 2012.

Nikulin M, Wu H-D I. The Cox Models and Its Applications. Berlin:

Springer Nature, 2016.

Selvin S. Survival Analysis for Epidemiologic and Medical Research: A

Practical Guide. Cambridge: Cambridge University Press, 2008.

StataCorp LLC. Survival Analysis Reference Manual: Release 15. College

Station, Texas: Stata Press, 2017.

van Houwelingen HC, Stijnen T. Cox Regression Model. In: JP Klein, HC

van Houwelingen, JG Ibrahim, TH, Scheike (eds). Handbook of

Survival Analysis. Boca Raton, FL: CRC Press, 2014, pp 5-25.

Page 85: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik
Page 86: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik
Page 87: harlan_johan.staff.gunadarma.ac.idharlan_johan.staff.gunadarma.ac.id/Publications/files/838/Buku... · Model Regresi Eksponensial 54 Model Regresi Weibull 58 Model Regresi Log-Logistik