Department of StatisticsFaculty of Math and Natural Sciences--------------------------------------------------Program :o Bachelor in Statistics and Data Scienceo Master in Statistics and Data Scienceo PhD in Statistics and Data Science
Small Area Estimation : Menduga Akurat dengan Lebih Hemat
Anang [email protected]
Department of StatisticsFaculty of Mathematics and Natural Sciences
1. Small Area Estimation
2. Aplikasi 1 : SDGs – Angka Kematian Balita
3. Aplikasi 2 : Produktivitas Padi
4. Tantangan dan Pengembangan
5. Penutup
Anang Kurnia: [email protected] 3
Outline
Small Area Estimation
• Kata kunci dalam pendugaan area kecil (small area estimation, SAE)− “small in sample” ukuran contoh yang kecil,
bukan “area = wilayah” yang kecil.− “area” tidak selalu identik dengan wilayah administratif/geografis, lebih
umum merupakan sub-domain/himpunan bagian yang tidak beririsan daripopulasi.
• Peubah penyerta (auxiliary variable) menambahkan informasi“upaya untuk meningkatkan efektifitas ukuran contoh”
Anang Kurnia: [email protected] 4
• Design-BasedMenggunakan model untuk menyusun penduga (motivasi, model assisted), tetapibias dan ragam penduga dievaluasi berdasarkan sebaran acak contoh.
• Model-BasedPendugaan dan inferensi berdasarkan pemodelan, dengan asumsi anggota contohterpilih yang sudah diketahui, melalui pendekatan frequenties atau Bayes (ataugabungan : empirical Bayes).
Anang Kurnia: [email protected] 5
Small Area Estimation
Anang Kurnia: [email protected] 6
Small Area Estimation
• Model Level Area o Fay dan Herriot (1979).o Peubah penyerta hanya tersedia pada level area.
Model :
• Model Level Unit = Nested error unit level modelo Battese, Harter and Fuller (1988).o Peubah penyerta tersedia pada level unit.
Model : 2 2; ~ 0, , ~ 0,T
ij ij i ij i ij ey x e N e N
Model Dasar:
EBLUP
• Model Level Unit = Nested error unit level modelo Battese, Harter and Fuller (1988).o Peubah penyerta tersedia pada level unit.
Model :
Penduga EBLUP bagi adalah :
2 2; ~ 0, , ~ 0,T
ij ij i ij i ij ey x e N e N
1
i i ij ijj s j ry N y y
1
1
12 2 2
ˆ ˆ
ˆ ˆˆ
ˆ ˆ ˆ ˆ /
EBLUP EBLUP
i i ij ijj s j r
T T
i ij ij i is isj s j r
i e i
y N y y
N y x y x
n
Anang Kurnia: [email protected] 7
Small Area Estimation
Tantangan Aplikasi dan Pengembangan :
1. Ketersediaan Datao Level Data : individu, rumah tangga, desa/kelurahan, kecamatan,
kabupaten/kota, provinsi.o Data : administrasi-sensus-survey.o Integrated Data
2. Otonomi Daeraho Politik dan kapasitas birokrasio Level pengukuran : kab/Kota, kecamatan, desa/Kelurahan
Anang Kurnia: [email protected] 8
Small Area Estimation
Tantangan Aplikasi dan Pengembangan :
3. Sustainable Development Goals
METODEAnang Kurnia: [email protected] 9
Small Area Estimation
Ilustrasi :
1. IPM (pengeluaran, pendidikan, kesehatan) kecamatan
2. Tingkat Kematian Balita kab/kota
3. Tingkat Kematian Bayi Kab/kota
4. Ukuran Kemiskinan (P0, P1, P2) kecamatan
5. Produktivitas Padi kecamatan
6. Tingkat Pengangguran kab/kota
7. dll.
Anang Kurnia: [email protected] 10
Aplikasi 1 : SDGs - Angka Kematian Balita
Menjamin kehidupan yang
sehat dan mendorong
kesejahteraan bagi semua
orang di segala usia
Menurunkan angka
kematian balita 25 per
1.000 kelahiran hidup
Sumber : Istiana et.al (2020)
Anang Kurnia: [email protected] 11
Aplikasi 1 : SDGs - Angka Kematian Balita
• Memperoleh AKBa
• Kabupaten/kota sampel: 113
SDKI 2017
• Memperoleh peubah penyerta level kabupaten/kota
• Total kabupaten/kota: 119
Profil Kesehatan Provinsi 2016
Anang Kurnia: [email protected] 12
Direct Estimator: Kab/Kota dengan AKBa bernilai nolsebanyak 44 (38.94%) dari 113 kab/kota “tersurvey” di Pulau Jawa
• Indikasi excess zero
• Overdispersi
• Ukuran contoh kecil SDKI tidak didesain untuklevel Kab/Kota
AKBa Kab/Kota di Pulau JawaAKBa Kab/Kota di Pulau Jawa
Aplikasi 1 : SDGs - Angka Kematian Balita
Anang Kurnia: [email protected] 13
Zero Inflated Poisson
𝑓 𝑦𝑖 = 𝑝𝑖 + (1 − 𝑝𝑖)𝑒−𝜇𝑖, untuk 𝑦𝑖 = 0
𝑓 𝑦𝑖 =(1−𝑝𝑖)𝑒
−𝜇𝑖𝜇𝑖𝑦𝑖
𝑦𝑖!, untuk 𝑦𝑖 > 0
Zero Inflated Generalized Poisson
𝑓 𝑦𝑖 = 𝑝𝑖 + (1 − 𝑝𝑖)𝜇𝑖
1+𝜔𝜇𝑖
𝑦𝑖 (1+𝜔𝑦𝑖)𝑦𝑖−1
𝑦𝑖!𝑒𝑥𝑝
−𝜇𝑖(1+𝜔𝑦𝑖)
1+𝜔𝜇𝑖, untuk 𝑦𝑖 = 0
𝑓 𝑦𝑖 = (1 − 𝑝𝑖)𝜇𝑖
1+𝜔𝜇𝑖
𝑦𝑖 (1+𝜔𝑦𝑖)𝑦𝑖−1
𝑦𝑖!𝑒𝑥𝑝
−𝜇𝑖(1+𝜔𝑦𝑖)
1+𝜔𝜇𝑖, untuk 𝑦𝑖 > 0
Aplikasi 1 : SDGs - Angka Kematian Balita
Link Function :
log( 𝜇𝑖) = 𝒙𝒊′𝜷 GLM Poisson
log( 𝜇𝑖) = 𝒙𝒊′𝜷 + 𝑣𝑖
• GLMM Poisson• GLMM quasi Poisson
log( 𝜇𝑖) = 𝒙𝒊′𝜷 + 𝑣𝑖; 𝑦𝑖 > 0
• GLMM ZIP• GLMM ZIGP
log(𝑝𝑖
1 − 𝑝𝑖) = 𝒛𝒊
′𝜹 + 𝑢𝑖; 𝑎𝑙𝑙 𝑦𝑖
Aplikasi 1 : SDGs - Angka Kematian Balita
Anang Kurnia: [email protected] 14
Aplikasi 1 : SDGs - Angka Kematian Balita
StatistikGLMM Poisson
GLMM Quasi Poisson
GLMM ZIPGLMM ZIGP
Min 0.12 12.12 6.61 4.44
Median 21.78 26.25 23.30 23.11
Rataan 27.82 27.86 26.14 26.00
Maks 144.53 98.80 83.26 85.21
Deskripsi Penduga Tidak Langsung AKBa
ModelMedian Rataan
RMSE RSE RMSE RSE
GLMM Poisson 1581.15 196.39 2973.37 2409.65
GLMM Quasi Poisson 11.79 0.45 12.82 0.46
GLMM ZIP 16.54 0.66 19.05 0.84
GLMM ZIGP 5.54 0.23 9.86 0.43
Anang Kurnia: [email protected] 15
Aplikasi 1 : SDGs - Angka Kematian Balita
Dugaan AKBa kabupaten/kota di Pulau Jawa *)
Kab/kota dengan nilai AKBa ≥ 50 per seribu kelahiran :- Kabupaten Pamekasan- Kabupaten Mojokerto- Kabupaten Bondowoso- Kota Batu- Kota Probolinggo- Kabupaten Wonosobo- Kota Salatiga- Kota Tegal- Kota Cirebon- Kota Sukabumi- Kabupaten Pandeglang
*) Termasuk 6 Kab/Kota nir-contoh dengan pendekatan informasi kluster
Anang Kurnia: [email protected] 16
• Produktivitas Padi di Kab. Seruyan tahun 2016 sumber : Ardiansyah, et.al. (2019)
Anang Kurnia: [email protected] 17
Kode KecamatanJumlah contoh
plot ubinan
Luas panen total (ha)
Produktivitas
padi (ku/ha),
BPS
010 Seruyan Hilir 14 1,090.4 -
011 Seruyan Hilir Timur 16 1,295.3 -
020 Danau Sembuluh 3 1,086.2 -
021 Seruyan Raya - 100.9 -
030 Hanau - 643.4 -
031 Danau Seluluk - 499.8 -
040 Seruyan Tengah 20 1,511.90 -
041 Batu Ampar 11 455.9 -
050 Seruyan Hulu 10 2,209.0 -
051 Suling Tambun 15 1,232.9 -
Total 89 10,125.7 26.68
Aplikasi 2 : Produktivitas Padi
• Produktivitas Padi di Kab. Seruyan tahun 2016
Anang Kurnia: [email protected] 18
Kode KecamatanJumlah contoh
plot ubinan
Luas panen total (ha)
Produktivitas
padi (ku/ha),
BPS
Produktivitas
padi Geoadditive
SAE (ku/ha)
010 Seruyan Hilir 14 1,090.4 - 31.32
011 Seruyan Hilir Timur 16 1,295.3 - 34.58
020 Danau Sembuluh 3 1,086.2 - 32.56
021 Seruyan Raya - 100.9 - 27.19
030 Hanau - 643.4 - 30.92
031 Danau Seluluk - 499.8 - 32.64
040 Seruyan Tengah 20 1,511.90 - 26.72
041 Batu Ampar 11 455.9 - 22.69
050 Seruyan Hulu 10 2,209.0 - 19.93
051 Suling Tambun 15 1,232.9 - 20.30
Total 89 10,125.7 26.68 26.97
Aplikasi 2 : Produktivitas Padi
Aplikasi 2 : Produktivitas Padi
• Produktivitas Padi di Kab. Seruyan tahun 2016
Model geoadditive SAE :𝒚 = X𝜷 + Z𝒗 + D𝒖+ 𝒆
Anang Kurnia: [email protected] 19
Anang Kurnia: [email protected] 20
Tantangan dan Pengembangan
o Asumsi sebaran data : Model transformasi
o Spatial SAE : SAR, GWR, GWLMM
o Robust SAE : Huber, M-quantile, Winsor
o Non-linear parameter - FGT Model
o Non-sample problem
o Panel Data SAE Rotating Survey
o Multivariate & SEMM SAE
o Measurement error
o Big Data: Data Sosial Media
o Zero Inflated / Overdispersion
o Integrated Data
o …………...
Penutup
Anang Kurnia: [email protected] 21
"All models are wrong but some are useful"George Box (1919 – 2013)
Preface Slide
Top Related