Regresi Campuran Nonparametrik Spline Linier Truncated ...Regresi Campuran Nonparametrik Spline...
Transcript of Regresi Campuran Nonparametrik Spline Linier Truncated ...Regresi Campuran Nonparametrik Spline...
1
AbstrakโModel regresi campuran nonparametrik
๐๐ = ๐(๐๐, ๏ฟฝฬ๏ฟฝ๐) + ๐บ๐, ๐ = ๐, ๐, โฆ , ๐, ๏ฟฝฬ๏ฟฝ๐ = (๐๐๐, ๐๐๐, โฆ , ๐๐๐)๐ป memiliki
kurva regresi bersifat aditif ๐(๐๐, ๏ฟฝฬ๏ฟฝ๐) = ๐(๐๐) + โ ๐๐(๐๐๐)๐๐=๐ .
Komponen ๐(๐๐) dihampiri dengan spline linier truncated,
sedangkan komponen ๐๐(๐๐๐) dihampiri dengan kernel Nadaraya-
Watson. Error random ๐บ๐ mengikuti distribusi normal ๐(๐, ๐๐).
Tujuan dari penelitian ini adalah melakukan kajian mengenai
estimator kurva regresi campuran nonparametrik spline dan
kernel ๐(๐๐, ๏ฟฝฬ๏ฟฝ๐) dan mengaplikasikannya pada data kemiskinan di
Provinsi Papua. Hasil kajian menunjukkan bahwa estimator
kurva regresi spline ๏ฟฝฬ๏ฟฝ(๐) adalah ๏ฟฝฬฬ๏ฟฝ๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐, ๏ฟฝฬ๏ฟฝ) = ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ dan
estimator kurva regresi kernel โ ๏ฟฝฬ๏ฟฝ๐(๐๐)๐๐=๐ adalah
โ ๏ฟฝฬฬ๏ฟฝ๐(๐๐)๐๐=๐ = ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ. Selanjutnya, estimator kurva regresi
campuran nonparametrik spline dan kernel ๏ฟฝฬ๏ฟฝ(๐, ๏ฟฝฬ๏ฟฝ) adalah
๏ฟฝฬฬ๏ฟฝ๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐, ๏ฟฝฬ๏ฟฝ) = ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ, dimana ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ) = ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ) + ๐(๏ฟฝฬ๏ฟฝ). Matriks
๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ), ๐(๏ฟฝฬ๏ฟฝ) dan ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ) tergantung pada lokasi titik-titik knot ๏ฟฝฬ๏ฟฝ
dan bandwidth ๏ฟฝฬ๏ฟฝ. Estimator-estimator tersebut adalah estimator
bias, namun masih kelas estimator linier. Model regresi campuran
nonparametrik terbaik adalah model yang menggunakan
banyaknya titik knot, lokasi titik-titik knot dan bandwidth
optimum yang diperoleh dengan meminimumkan fungsi
Generalized Cross Validation (๐๐๐). Pemilihan lokasi titik-titik
knot dan bandwidth dilakukan secara simultan. Model regresi
campuran nonparametrik spline dan kernel diterapkan pada data
kemiskinan di Provinsi Papua, dimana sebagai variabel responnya
adalah persentase penduduk miskin (๐), variabel prediktor yang
mengikuti kurva regresi spline adalah PDRB perkapita (๐), dan
variabel-variabel prediktor yang mengikuti kurva regresi kernel
adalah gini ratio (๐๐), rata-rata lama sekolah (๐๐), tingkat
pengangguran terbuka (๐๐) dan laju pertumbuhan ekonomi (๐๐).
Model terbaik diperoleh ketika model menggunakan 3 titik knot.
Estimasi model memberikan ๐๐ sebesar 92,02%. Model dapat
digunakan untuk skenario kebijakan
Kata Kunciโkernel nadaraya-watson, regresi campuran
nonparametrik, regresi nonparametrik aditif, spline linier
truncated.
I. PENDAHULUAN
NALISIS regresi adalah salah satu metode statistika yang
sering digunakan di berbagai bidang penelitian. Analisis
ini digunakan untuk mengetahui pola hubungan dua atau lebih
variabel dalam bentuk fungsional. Masing-masing variabel
tersebut dikelompokkan ke dalam variabel respon dan variabel
prediktor. Identifikasi awal adanya pola hubungan dapat
dilakukan dengan memanfaatkan pengalaman masa lalu atau
menggunakan diagram pencar (scatter plot). Jika bentuk pola
hubungan fungsionalnya diketahui, maka model regresi yang
digunakan adalah model regresi parametrik. Sebaliknya, jika
bentuk pola hubungan fungsionalnya tidak diketahui, maka
model regresi yang digunakan adalah model regresi
nonparametrik [1].
Model regresi nonparametrik sangat baik digunakan untuk
pola data yang tidak diketahui karena memiliki fleksibilitas
yang tinggi, dimana data diharapkan mencari sendiri bentuk
estimasi kurva regresinya tanpa dipengaruhi oleh subyektifitas
peneliti [1]. Ada banyak estimator kurva regresi nonparametrik
yang telah dikembangkan oleh para peneliti, diantaranya spline
[1] [2] [3] [4] [5] [6] [7] [8] dan kernel [1] [9] [10] [11] [12]
[13] [14] [15]. Kelebihan dari kurva regresi spline adalah
memiliki kemampuan yang sangat baik dalam menangani data
yang perilakunya berubah-ubah pada sub-sub interval tertentu
[8], sedangkan kelebihan dari estimator kernel adalah memiliki
kemampuan yang baik dalam memodelkan data yang tidak
mempunyai pola tertentu [11].
Menurut Budiantara, Ratnasari, Ratna, & Zain [16], model-
model regresi nonparametrik maupun semiparametrik yang
dikembangkan oleh para peneliti selama ini, jika ditelusuri lebih
mendalam, pada dasarnya terdapat asumsi yang sangat berat
dan mendasar pada modelnya. Masing-masing prediktor dalam
regresi nonparametrik multiprediktor dianggap memiliki pola
yang sama sehingga para peneliti memaksakan penggunaan
hanya satu bentuk estimator model untuk semua variabel
prediktornya. Oleh karena itu, menggunakan hanya satu bentuk
estimator saja dalam berbagai bentuk pola hubungan data yang
berbeda-beda tentu akan mengakibatkan estimator yang
dihasilkan kurang cocok dengan pola data. Akibatnya estimasi
model regresi menjadi kurang baik dan menghasilkan error
yang besar. Oleh karena itu, untuk mengatasi masalah tersebut
beberapa peneliti telah mengembangkan estimator kurva regresi
campuran nonparametrik dimana masing-masing pola data
dalam model regresi nonparametrik dihampiri dengan estimator
kurva yang sesuai.
Tujuan dari penelitian ini adalah melakukan kajian mengenai
estimator kurva regresi campuran nonparametrik spline dan
kernel dalam model regresi campuran nonparametrik
Regresi Campuran Nonparametrik Spline Linier
Truncated dan Fungsi Kernel untuk Pemodelan
Data Kemiskinan di Provinsi Papua
Rory, I Nyoman Budiantara, dan Wahyu Wibowo
Jurusan Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam
Institut Teknologi Sepuluh Nopember (ITS)
Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia
e-mail: [email protected], [email protected], [email protected]
A
2
multiprediktor aditif dan mengaplikasikannya pada data
kemiskinan di Provinsi Papua. Provinsi Papua merupakan
provinsi yang persentase penduduk miskinnya tertinggi di
Indonesia tahun 2013 yaitu sebesar 31,52 persen.
II. KAJIAN PUSTAKA
A. Regresi Nonparametrik Spline Truncated
Diberikan data berpasangan (๐ข๐, ๐ฆ๐), ๐ = 1,2, โฆ , ๐, dimana
pola hubungannya dapat dinyatakan dalam model regresi
๐ฆ๐ = ๐(๐ข๐) + ๐๐ . Kurva regresi ๐(๐ข๐) dihampiri dengan kurva regresi spline
truncated, sehingga
๐(๐ข๐) = โ ๐ฝ๐๐ข๐๐
๐
๐=0
+ โ ๐๐(๐ข๐ โ ๐๐)+๐
๐
๐=1
dimana
(๐ข๐ โ ๐๐)+๐
= {(๐ข๐ โ ๐๐)
๐ , ๐ข๐ โฅ ๐๐
0 , ๐ข๐ < ๐๐ .
Kurva regresi ๐(๐ข๐) merupakan kurva regresi nonparametrik
spline truncated derajat ๐ dengan banyaknya titik-titik knot
adalah ๐. Derajat ๐ merupakan derajat pada persamaan
polinomial. Kurva regresi polinomial derajat 1 disebut dengan
kurva regresi linier, kurva regresi polinomial derajat 2 disebut
dengan kurva regresi kuadratik, sedangkan kurva regresi
polinomial derajat 3 disebut dengan kurva regresi kubik. Titik-
titik knot ๐1, ๐2, โฆ , ๐๐ adalah titik-titik yang menunjukkan pola
perilaku dari kurva pada sub-sub interval yang berbeda, dimana
๐1 < ๐2 < โฏ < ๐๐.
B. Regresi Nonparametrik Kernel
Diberikan pasangan pengamatan independen (๐ฃ๐ , ๐ฆ๐), ๐ =1,2, โฆ , ๐ yang hubungannya dimodelkan secara fungsional
dalam bentuk
๐ฆ๐ = โ(๐ฃ๐) + ๐๐ , dimana kurva regresi โ(๐ฃ๐) merupakan kurva yang tidak
diketahui bentuknya. Kurva โ(๐ฃ๐) dapat diestimasi
menggunakan estimator kernel Nadaraya-Watson. Estimator
kernel Nadaraya-Watson adalah
โฬ๐(๐ฃ๐) = ๐โ1 โ ๐๐๐(๐ฃ)๐ฆ๐
๐
๐=1
.
Fungsi ๐๐๐๐(๐ฃ๐) merupakan fungsi pembobot
๐๐๐(๐ฃ) =๐พ๐(๐ฃ๐ โ ๐ฃ)
๐โ1 โ ๐พ๐(๐ฃ๐ โ ๐ฃ)๐๐=1
,
dimana ๐พ๐๐(๐ฃ๐ โ ๐ฃ๐๐) adalah fungsi kernel
๐พ๐(๐ฃ๐ โ ๐ฃ) =1
๐๐พ (
๐ฃ๐ โ ๐ฃ
๐) .
Fungsi kernel ๐พ adalah fungsi yang bernilai riil, kontinu,
terbatas dan simetris dengan integralnya sama dengan satu atau
โซ๐พ(๐ง)๐๐ง = 1. Fungsi kernel ๐พ dapat berupa kernel uniform,
kernel segitiga, kernel epanechnikov, kernel kuadrat, kernel
triweight, kernel kosinus atau kernel gaussian [17]. Kernel
gaussian cukup sering digunakan, dimana fungsi ini lebih
smooth dibandingkan dengan fungsi kernel yang lain. Bentuk
fungsi kernel gaussian adalah
๐พ(๐ง) =1
โ2๐exp (โ
1
2๐ง2) , โโ < ๐ง < โ. (1)
C. Tinjauan Kemiskinan
Kemiskinan diartikan sebagai kekurangan sumber daya yang
dapat digunakan untuk meningkatkan kesejahteraan
sekelompok orang, baik secara finansial maupun semua jenis
kekayaan yang dapat meningkatkan kesejahteraan masyarakat.
Dikategorikan miskin bilamana seseorang atau keluarga tidak
dapat memenuhi kebutuhan pokok minimumnya sandang,
pangan, papan, kesehatan, dan pendidikan. Dimensi ekonomi
dapat diukur dengan nilai rupiah meskipun harganya selalu
berubah-ubah setiap tahunnya tergantung pada tingkat inflasi
[18]. Untuk mengukur kemiskinan, BPS menggunakan konsep
kemampuan memenuhi kebutuhan dasar (basic needs
approach), dimana kemiskinan dipandang sebagai
ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan
dasar makanan dan bukan makanan yang diukur dari sisi
pengeluaran.
Sejumlah variabel dapat dipakai untuk melacak persoalan
kemiskinan. Dari variabel-variabel tersebut dapat dihasilkan
serangkaian strategi dan kebijakan penanggulangan kemiskinan
yang tepat sasaran dan berkesinambungan. Variabel-variabel
yang mempengaruhi kemiskinan diantaranya adalah
ketimpangan pendapatan [19], pendidikan [20] [21],
pengangguran [22] [23], pertumbuhan ekonomi [19] [24] [25]
dan PDRB perkapita [24] [25].
III. METODE PENELITIAN
A. Data dan Variabel
Penelitian ini menggunakan data sekunder tahun 2013 yang
diperoleh dari publikasi terbitan Badan Pusat Statistik (BPS).
Unit observasi yang digunakan adalah seluruh kabupaten/kota
yang ada di Provinsi Papua, yaitu sebanyak 29 kabupaten/kota.
Jenis variabel terdiri dari variabel respon dan variabel prediktor.
Sebagai variabel respon adalah persentase penduduk miskin,
sedangkan sebagai variabel prediktor adalah rata-rata lama
sekolah, tingkat pengangguran terbuka (TPT), gini ratio, laju
pertumbuhan ekonomi dan PDRB perkapita.
B. Tahapan Penelitian
Tahapan penelitian dimulai dengan pengenalan bentuk model
regresi campuran nonparametrik spline dan kernel, yang
dilanjutkan dengan kajian estimasi kurva regresinya, sifat
estimator kurva regresi, pemilihan banyak titik knot, lokasi titik
knot dan bandwidth optimum. Terakhir adalah mengaplikasikan
model pada data kemiskinan.
IV. HASIL PENELITIAN DAN PEMBAHASAN
A. Model Regresi Campuran Nonparametrik Spline dan
Kernel
Diberikan data berpasangan (๐ข๐, ๐ฃ1๐ , ๐ฃ2๐ , โฆ , ๐ฃ๐๐ , ๐ฆ๐), ๐ =1,2, โฆ , ๐ yang memiliki hubungan diasumsikan mengikuti
model regresi nonparametrik
3
๐ฆ๐ = ๐(๐ข๐ , ๏ฟฝฬ๏ฟฝ๐) + ๐๐ , (2)
dimana ๏ฟฝฬ๏ฟฝ๐ = (๐ฃ1๐ , ๐ฃ2๐ , โฆ , ๐ฃ๐๐)๐. Bentuk kurva regresi ๐(๐ข๐ , ๏ฟฝฬ๏ฟฝ๐)
diasumsikan tidak diketahui dan hanya diketahui bahwa kurva
tersebut smooth dalam arti kontinu dan differensiabel. Error
random ๐๐ berdistribusi normal dengan E[๐๐] = 0 dan Var[๐๐] =
๐2. Selain itu, kurva regresi ๐(๐ข๐ , ๏ฟฝฬ๏ฟฝ๐) diasumsikan bersifat
aditif, sehingga dapat ditulis dalam bentuk
๐(๐ข๐ , ๏ฟฝฬ๏ฟฝ๐) = ๐(๐ข๐) + โโ๐(๐ฃ๐๐)
๐
๐=1
. (3)
Bentuk pola hubungan variabel respon ๐ฆ๐ dengan variabel
prediktor ๐ข๐ diasumsikan berubah-ubah pada sub-sub interval
tertentu, sedangkan bentuk pola hubungan variabel respon ๐ฆ๐
dengan variabel prediktor ๐ฃ๐๐ diasumsikan tidak diketahui atau
tidak memiliki pola tertentu. Secara teoritis, kurva regresi ๐(๐ข๐)
dapat dihampiri dengan kurva regresi spline, sedangkan kurva
regresi โ๐(๐ฃ๐๐) dapat dihampiri dengan kurva regresi kernel.
Dengan demikian, kurva regresi ๐(๐ข๐, ๏ฟฝฬ๏ฟฝ๐) disebut dengan kurva
regresi campuran nonparametrik yang dikelompokkan menjadi
dua komponen yaitu komponen kurva regresi spline dan
komponen kurva regresi kernel. Komponen ๐(๐ข๐) merupakan
komponen kurva regresi spline, sedangkan komponen
โ โ๐(๐ฃ๐๐)๐๐=1 merupakan komponen kurva regresi kernel.
Komponen kurva regresi spline ๐(๐ข๐) pada persamaan (3)
didefinisikan oleh kurva regresi spline linier truncated
๐(๐ข๐) = ๐ฝ0 + ๐ฝ1๐ข๐ + โ๐๐(๐ข๐ โ ๐๐)+
๐
๐=1
(4)
dimana
(๐ข๐ โ ๐๐)+ = {(๐ข๐ โ ๐๐) , ๐ข๐ โฅ ๐๐
0 , ๐ข๐ < ๐๐ .
Selanjutnya, komponen kurva regresi kernel โ๐(๐ฃ๐๐) pada
persamaan (3) didefinisikan oleh estimator kurva regresi kernel
Nadaraya-Watson
โฬ๐๐๐(๐ฃ๐๐) = ๐โ1 โ ๐๐๐๐
(๐ฃ๐)๐ฆ๐
๐
๐=1
. (5)
dimana
๐๐๐๐(๐ฃ๐) =
๐พ๐๐(๐ฃ๐ โ ๐ฃ๐๐)
๐โ1 โ ๐พ๐๐(๐ฃ๐ โ ๐ฃ๐๐)
๐๐=1
,
๐พ๐๐(๐ฃ๐ โ ๐ฃ๐๐) =
1
๐๐
๐พ (๐ฃ๐ โ ๐ฃ๐๐
๐๐
) .
B. Estimasi Kurva Regresi
Jika kurva regresi spline linier truncated (4) berlaku untuk
๐ = 1 sampai dengan ๐ = ๐, maka kumpulan persamaan-
persamaan ๐(๐ข1), ๐(๐ข2), โฆ , ๐(๐ข๐) akan membentuk suatu
persamaan vektor dan matriks
๏ฟฝฬ๏ฟฝ(๐ข) = ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ , (6)
dimana
๏ฟฝฬ๏ฟฝ(๐ข) = [
๐(๐ข1)
๐(๐ข2)โฎ
๐(๐ข๐)
] , ๏ฟฝฬ๏ฟฝ =
[ ๐ฝ0
๐ฝ1
๐1
๐2
โฎ๐๐]
,
๐(๏ฟฝฬ๏ฟฝ) =
[ 1 ๐ข1 (๐ข1 โ ๐1)+ โฏ (๐ข1 โ ๐๐)+
1 ๐ข2 (๐ข2 โ ๐1)+ โฏ (๐ข2 โ ๐๐)+
โฎ โฎ โฎ โฑ โฎ1 ๐ข๐ (๐ข๐ โ ๐1)+ โฏ (๐ข๐ โ ๐๐)+]
.
Vektor ๏ฟฝฬ๏ฟฝ(๐ข) berukuran ๐ ร 1, vektor ๏ฟฝฬ๏ฟฝ berukuran (๐ + 2) ร 1,
dan matriks ๐(๏ฟฝฬ๏ฟฝ) berukuran ๐ ร (๐ + 2).
Selanjutnya, komponen kurva regresi kernel โ๐(๐ฃ๐๐) pada
persamaan (3) diestimasi menggunakan estimator kernel
Nadaraya-Watson (5). Persamaan (5) tersebut berlaku untuk ๐ =1 sampai dengan ๐ = ๐, sehingga kumpulan persamaan-
persamaan โฬ๐๐๐(๐ฃ๐1), โฬ๐๐๐
(๐ฃ๐2), โฆ , โฬ๐๐๐(๐ฃ๐๐) membentuk
sebuah persamaan vektor dan matriks
โฬฬ๐๐๐(๐ฃ๐) = ๐๐(๐๐)๏ฟฝฬ๏ฟฝ , (7)
dimana
โฬฬ๐๐๐(๐ฃ๐) =
[ โฬ๐๐๐
(๐ฃ๐1)
โฬ๐๐๐(๐ฃ๐2)
โฎโฬ๐๐๐
(๐ฃ๐๐)]
, ๏ฟฝฬ๏ฟฝ = [
๐ฆ1
๐ฆ2
โฎ๐ฆ๐
] ,
๐๐(๐๐) =
[ ๐โ1๐๐๐1
(๐ฃ๐1) ๐โ1๐๐๐2(๐ฃ๐1) โฏ ๐โ1๐๐๐๐
(๐ฃ๐1)
๐โ1๐๐๐1(๐ฃ๐2) ๐โ1๐๐๐2
(๐ฃ๐2) โฆ ๐โ1๐๐๐๐(๐ฃ๐2)
โฎ โฎ โฑ โฎ๐โ1๐๐๐1
(๐ฃ๐๐) ๐โ1๐๐๐2(๐ฃ๐๐) โฆ ๐โ1๐๐๐๐
(๐ฃ๐๐)]
.
Vektor โฬฬ๐๐๐(๐ฃ๐) berukuran ๐ ร 1, vektor ๏ฟฝฬ๏ฟฝ berukuran ๐ ร 1,
dan matriks ๐๐(๐๐) berukuran ๐ ร ๐. Berdasarkan persamaan
(7), maka estimator untuk komponen kurva regresi kernel
โ โ๐(๐ฃ๐๐)๐๐=1 pada persamaan (3) akan menjadi
โโฬฬ๐๐๐(๐ฃ๐)
๐
๐=1
= โ ๐๐(๐๐)๏ฟฝฬ๏ฟฝ
๐
๐=1
= ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ (8)
dimana
๐(๏ฟฝฬ๏ฟฝ) = โ๐๐(๐๐) = ๐๐(๐๐) + ๐๐(๐๐) + โฏ+ ๐๐(๐๐)
๐
๐=1
๐(๏ฟฝฬ๏ฟฝ) =
[ ๐โ1 โ๐๐๐1(๐ฃ๐1)
๐
๐=1
๐โ1 โ๐๐๐2(๐ฃ๐1)
๐
๐=1
โฏ ๐โ1 โ๐๐๐๐(๐ฃ๐1)
๐
๐=1
๐โ1 โ๐๐๐1(๐ฃ๐2)
๐
๐=1
๐โ1 โ๐๐๐2(๐ฃ๐2)
๐
๐=1
โฆ ๐โ1 โ๐๐๐๐(๐ฃ๐2)
๐
๐=1
โฎ โฎ โฑ โฎ
๐โ1 โ๐๐๐1(๐ฃ๐๐)
๐
๐=1
๐โ1 โ๐๐๐2(๐ฃ๐๐)
๐
๐=1
โฆ ๐โ1 โ๐๐๐๐(๐ฃ๐๐)
๐
๐=1 ]
.
Matriks ๐(๏ฟฝฬ๏ฟฝ) berukuran ๐ ร ๐.
Jika kurva regresi spline linier truncated ๏ฟฝฬ๏ฟฝ(๐ข) diberikan oleh
persamaan (6) dan estimator untuk komponen kurva regresi
kernel โ โ๐(๐ฃ๐๐)๐๐=1 diberikan oleh persamaan (8), maka model
regresi campuran nonparametrik spline dan kernel (2) dapat
4
disajikan dalam bentuk vektor dan matriks
๏ฟฝฬ๏ฟฝ = ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ + ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ + ๐ฬ , (9)
Dimana vektor ๐ฬ = (๐1, ๐2, โฆ , ๐๐)๐ merupakan vektor error
berukuran ๐ ร 1. Berdasarkan persamaan (9), diperoleh
๐ฬ = (๐ โ ๐(๏ฟฝฬ๏ฟฝ)) ๏ฟฝฬ๏ฟฝ โ ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ .
Selanjutnya, jumlah kuadrat error adalah
โ๐ฬโ2 = โ(๐ โ ๐(๏ฟฝฬ๏ฟฝ)) ๏ฟฝฬ๏ฟฝ โ ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝโ2
(10)
Matriks I merupakan matriks identitas berukuran ๐ ร ๐.
Error random ๐ฬ berdistribusi multivariat normal dengan
E[๐ฬ] = 0 dan E[๐ฬ๐ฬ๐] = ๐2๐, sehingga fungsi likelihood
๐ฟ(๏ฟฝฬ๏ฟฝ, ๐2|๏ฟฝฬ๏ฟฝ, ๐) diberikan oleh
๐ฟ(๏ฟฝฬ๏ฟฝ, ๐2|๏ฟฝฬ๏ฟฝ, ๐) = โ1
โ2๐๐2exp (โ
1
2๐2๐๐
2)
๐
๐=1
๐ฟ(๏ฟฝฬ๏ฟฝ, ๐2|๏ฟฝฬ๏ฟฝ, ๐) = (2๐๐2)โ๐2 exp (โ
1
2๐2โ๐ฬโ2)
Jika jumlah kuadrat error diberikan oleh persamaan (10), maka
๐ฟ(๐, ๐2|๏ฟฝฬ๏ฟฝ, ๐) = (2๐๐2)โ๐2 exp (โ
1
2๐2 โ(๐ โ ๐(๏ฟฝฬ๏ฟฝ)) ๏ฟฝฬ๏ฟฝ โ ๐(๏ฟฝฬ๏ฟฝ)๐โ2).
Berdasarkan metode MLE, estimator untuk parameter ๏ฟฝฬ๏ฟฝ
diperoleh dari optimasi Max๏ฟฝฬ๏ฟฝโ๐ ๐+2
{๐ฟ(๏ฟฝฬ๏ฟฝ, ๐2|๏ฟฝฬ๏ฟฝ, ๐)}, sehingga
Max๏ฟฝฬ๏ฟฝโ๐ ๐+2
{(2๐๐2)โ๐2 exp (โ
1
2๐2โ(๐ โ ๐(๏ฟฝฬ๏ฟฝ)) ๏ฟฝฬ๏ฟฝ โ ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝโ
2
)} .
Jika fungsi likelihood ๐ฟ(๏ฟฝฬ๏ฟฝ, ๐2|๏ฟฝฬ๏ฟฝ, ๐) ditransformasi ke bentuk
logaritma natural
๐(๏ฟฝฬ๏ฟฝ, ๐2|๏ฟฝฬ๏ฟฝ, ๐) = ln ๐ฟ(๏ฟฝฬ๏ฟฝ, ๐2|๏ฟฝฬ๏ฟฝ, ๐) ,
maka optimasi tersebut akan menjadi
Max๏ฟฝฬ๏ฟฝโ๐ ๐+2
{๐ฟ(๏ฟฝฬ๏ฟฝ, ๐2|๏ฟฝฬ๏ฟฝ, ๐)} = Max๏ฟฝฬ๏ฟฝโ๐ ๐+2
{๐(๏ฟฝฬ๏ฟฝ, ๐2|๏ฟฝฬ๏ฟฝ, ๐)} ,
sehingga
Max๏ฟฝฬ๏ฟฝโ๐ ๐+2
{โ๐
2ln(2๐๐2) โ
1
2๐2โ(๐ โ ๐(๏ฟฝฬ๏ฟฝ)) ๏ฟฝฬ๏ฟฝ โ ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝโ
2
} .
Optimasi akan maksimum ketika komponen
๐(๏ฟฝฬ๏ฟฝ, ๐2|๏ฟฝฬ๏ฟฝ, ๐) = โ(๐ โ ๐(๏ฟฝฬ๏ฟฝ)) ๏ฟฝฬ๏ฟฝ โ ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝโ2
mempunyai nilai yang minimum, sehingga
Max๏ฟฝฬ๏ฟฝโ๐ ๐+2
{๐ฟ(๏ฟฝฬ๏ฟฝ, ๐2|๏ฟฝฬ๏ฟฝ, ๐)} = Min๏ฟฝฬ๏ฟฝโ๐ ๐+2
{โ(๐ โ ๐(๏ฟฝฬ๏ฟฝ)) ๏ฟฝฬ๏ฟฝ โ ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝโ2
}.
Untuk mendapatkan estimator dari ๏ฟฝฬ๏ฟฝ, maka perlu dilakukan
derivatif parsial terhadap ๐(๏ฟฝฬ๏ฟฝ, ๐2|๏ฟฝฬ๏ฟฝ, ๐). Selanjutnya, derivatif
parsial tersebut disamakan dengan 0,
๐
๐๏ฟฝฬ๏ฟฝ[๐(๏ฟฝฬ๏ฟฝ, ๐2|๏ฟฝฬ๏ฟฝ, ๐)] = 0 .
Derivatif parsial akan menghasilkan persamaan normal
(๐(๏ฟฝฬ๏ฟฝ))๐
๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ = (๐(๏ฟฝฬ๏ฟฝ))๐
(๐ โ ๐(๏ฟฝฬ๏ฟฝ)) ๏ฟฝฬ๏ฟฝ .
Sehingga estimasi untuk ๏ฟฝฬ๏ฟฝ diberikan oleh
๏ฟฝฬฬ๏ฟฝ(๐, ๏ฟฝฬ๏ฟฝ) = [(๐(๏ฟฝฬ๏ฟฝ))๐
๐(๏ฟฝฬ๏ฟฝ)]โ1
(๐(๏ฟฝฬ๏ฟฝ))๐
(๐ โ ๐(๏ฟฝฬ๏ฟฝ)) ๏ฟฝฬ๏ฟฝ
๏ฟฝฬฬ๏ฟฝ(๐, ๏ฟฝฬ๏ฟฝ) = ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ , (11)
dimana
๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ) = [(๐(๏ฟฝฬ๏ฟฝ))๐
๐(๏ฟฝฬ๏ฟฝ)]โ1
(๐(๏ฟฝฬ๏ฟฝ))๐
(๐ โ ๐(๏ฟฝฬ๏ฟฝ)) ,
๏ฟฝฬฬ๏ฟฝ(๐, ๏ฟฝฬ๏ฟฝ) = (๏ฟฝฬ๏ฟฝ0, ๏ฟฝฬ๏ฟฝ1, ๏ฟฝฬ๏ฟฝ1, ๏ฟฝฬ๏ฟฝ2, โฆ , ๏ฟฝฬ๏ฟฝ๐)๐ .
Matriks ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ) berukuran ๐ ร ๐ dan vektor ๏ฟฝฬฬ๏ฟฝ(๐, ๏ฟฝฬ๏ฟฝ)
berukuran (๐ + 2) ร 1. Mengingat persamaan (11) dan sifat
invariant dari MLE, maka estimator dari kurva regresi spline
linier truncated (6) adalah
๏ฟฝฬฬ๏ฟฝ๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ) = ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬฬ๏ฟฝ(๐, ๏ฟฝฬ๏ฟฝ)
๏ฟฝฬฬ๏ฟฝ๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ) = ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ , (12)
dimana
๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ) = ๐(๏ฟฝฬ๏ฟฝ) [(๐(๏ฟฝฬ๏ฟฝ))๐
๐(๏ฟฝฬ๏ฟฝ)]โ1
(๐(๏ฟฝฬ๏ฟฝ))๐
(๐ โ ๐(๐)) .
Matriks ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ) berukuran ๐ ร ๐.
Berdasarkan estimator kurva regresi spline linier truncated
(12) dan estimator kurva regresi kernel Nadaraya-Watson (8),
maka estimator dari kurva regresi campuran nonparametrik
spline dan kernel (3) adalah
๐๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ) = ๏ฟฝฬฬ๏ฟฝ๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ) + โ โฬฬ๐๐๐(๐ฃ๐)
๐
๐=1
๐๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ) = ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ + ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ
๐๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ) = ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ ,
dimana
๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ) = ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ) + ๐(๏ฟฝฬ๏ฟฝ) .
Matriks ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ) berukuran ๐ ร ๐.
C. Sifat Estimator Kurva Regresi
Estimator-estimator ๏ฟฝฬฬ๏ฟฝ(๐, ๏ฟฝฬ๏ฟฝ), ๏ฟฝฬฬ๏ฟฝ๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ), โ โฬฬ๐๐๐(๐ฃ๐)
๐๐=1 dan
๐๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ) seperti pada umumnya estimator kurva regresi
nonparametrik yang lain, bersifat bias.
E [๏ฟฝฬฬ๏ฟฝ(๐, ๏ฟฝฬ๏ฟฝ)] โ ๏ฟฝฬ๏ฟฝ ,
E[๏ฟฝฬฬ๏ฟฝ๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ)] โ ๏ฟฝฬ๏ฟฝ(๐ข)
E [โ โฬฬ๐๐๐(๐ฃ๐)
๐
๐=1
] โ โ โฬ๐๐๐(๐ฃ๐)
๐
๐=1
,
E [๐๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ)] โ ๐๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ)
Walaupun demikian estimator-estimator tersebut masih
merupakan kelas estimator linier dalam observasi. Hal ini dapat
diketahui dari pembahasan sebelumnya yang menghasilkan
๏ฟฝฬฬ๏ฟฝ(๐, ๏ฟฝฬ๏ฟฝ) = ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ , ๏ฟฝฬฬ๏ฟฝ๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ) = ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ ,
โโฬฬ๐๐๐(๐ฃ๐)
๐
๐=1
= ๐(๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ , ๐๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ) = ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ)๏ฟฝฬ๏ฟฝ .
Terlihat bahwa estimator-estimator ๏ฟฝฬฬ๏ฟฝ(๐, ๏ฟฝฬ๏ฟฝ), ๏ฟฝฬฬ๏ฟฝ๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ),
โ โฬฬ๐๐๐(๐ฃ๐)
๐๐=1 , dan ๐๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ) merupakan kelas estimator linier
dalam observasi ๏ฟฝฬ๏ฟฝ.
D. Pemilihan Titik-titik Knot dan Bandwidth Optimum
Estimator kurva regresi campuran nonparametrik spline dan
kernel ๐๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข, ๏ฟฝฬ๏ฟฝ) sangat tergantung pada banyak titik knot,
lokasi titik-titik knot dan bandwidth optimum. Salah satu
metode yang digunakan untuk melakukan pemilihan banyak
titik knot, lokasi titik-titik knot dan bandwidth optimum adalah
metode Generalized Cross Validation atau GCV [4].
5
GCV(๐, ๏ฟฝฬ๏ฟฝ) =
MSE(๐, ๏ฟฝฬ๏ฟฝ)
(๐โ1trace (๐ โ ๐(๏ฟฝฬ๏ฟฝ, ๏ฟฝฬ๏ฟฝ)))2 , (13)
dimana
MSE(๐, ๏ฟฝฬ๏ฟฝ) = ๐โ1 โ(๐ฆ๐ โ ๐๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข๐ , ๏ฟฝฬ๏ฟฝ๐))2
๐
๐=1
.
Banyaknya titik knot optimum dan lokasi titik-titik knot
optimum ๐(opt) = (๐1(opt), ๐2(opt), โฆ , ๐๐(opt))๐
serta bandwidth
optimum ๏ฟฝฬ๏ฟฝ(opt) = (๐1(opt), ๐2(opt), โฆ , ๐๐(opt))๐
diperoleh
dari optimasi
GCV(๐(opt), ๏ฟฝฬ๏ฟฝ(opt)) = Min๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ
{GCV(๐, ๏ฟฝฬ๏ฟฝ)} .
E. Aplikasi pada Data Kemiskinan
Gambar 1. merupakan diagram pencar antara variabel respon
dengan masing-masing variabel prediktor. Pada diagram
tersebut terlihat bahwa secara umum bentuk pola hubungan
antara variabel respon dan variabel prediktor tidak diketahui
atau tidak mengikuti pola tertentu. Namun jika diperhatikan
dengan lebih seksama, pada diagram pencar antara persentase
penduduk miskin dengan PDRB perkapita, terlihat bahwa pola
perilaku datanya berubah-ubah pada sub-sub interval tertentu.
Dengan demikian, bentuk pola hubungan antara persentase
penduduk miskin dengan PDRB perkapita tersebut didekati
dengan kurva regresi spline, sedangkan bentuk pola hubungan
antara persentase penduduk miskin dengan empat variabel
lainnya (gini ratio, rata-rata lama sekolah, tingkat pengangguran
terbuka dan laju pertumbuhan ekonomi) masing-masing
didekati dengan kurva regresi kernel.
Selanjutnya, jika bentuk pola hubungan variabel respon dan
variabel-variabel prediktor tersebut didekati dengan model
regresi campuran nonparametrik spline dan kernel, maka
variabel-variabel yang digunakan tersebut dapat dinotasikan
menjadi ๐ฆ = persentase penduduk miskin, ๐ข = PDRB perkapita,
๐ฃ1 = gini ratio, ๐ฃ2 = rata-rata lama sekolah, ๐ฃ3 = tingkat
pengangguran terbuka, ๐ฃ4 = laju pertumbuhan ekonomi.
Dengan demikian, berdasarkan pasangan data yang diberikan
(๐ข๐, ๐ฃ1๐ , ๐ฃ2๐ , ๐ฃ3๐ , ๐ฃ4๐ , ๐ฆ๐), ๐ = 1,2, โฆ ,29, maka model regresi
campuran nonparametrik spline dan kernelnya adalah
๐ฆ๐ = ๐ฝ0 + ๐ฝ1๐ข๐ + ๐1(๐ข๐ โ ๐1)+๐
+ โฏ + ๐๐(๐ข๐ โ ๐๐)+
๐
๐ฆ๐ = +โ
1๐1
๐พ (๐ฃ1 โ ๐ฃ1๐
๐1)
โ1๐1
๐พ (๐ฃ1 โ ๐ฃ1๐
๐1)29
๐=1
๐ฆ๐
29
๐=1
+ โ
1๐2
๐พ (๐ฃ2 โ ๐ฃ2๐
๐2)
โ1๐2
๐พ (๐ฃ2 โ ๐ฃ2๐
๐2)29
๐=1
๐ฆ๐
29
๐=1
๐ฆ๐ = +โ
1๐3
๐พ (๐ฃ3 โ ๐ฃ3๐
๐3)
โ1๐3
๐พ (๐ฃ3 โ ๐ฃ3๐
๐3)29
๐=1
๐ฆ๐
29
๐=1
+ โ
1๐4
๐พ (๐ฃ4 โ ๐ฃ4๐
๐4)
โ1๐4
๐พ (๐ฃ4 โ ๐ฃ4๐
๐4)29
๐=1
๐ฆ๐
29
๐=1
+ ๐๐ .
Dalam model regresi tersebut, terdapat sebanyak ๐ titik knot
(๐1, ๐2, โฆ , ๐๐) dan ๐ = 4 bandwidth (๐1, ๐2, ๐3, ๐4). Dalam
penelitian ini banyaknya titik knot dibatasi hingga ๐ = 3 titik
knot (๐1, ๐2, ๐3).
Fungsi kernel yang digunakan dalam penelitian ini adalah
fungsi kernel gaussian (1), sedangkan pemilihan banyak titik
knot, lokasi titik-titik knot dan bandwidth optimum dilakukan
dengan menggunakan metode GCV (13). Jika model regresi
campuran nonparametrik spline dan kernel memiliki banyaknya
titik knot yang dibatasi sampai dengan tiga titik knot, maka
terdapat tiga kemungkinan model yang bisa dibentuk, yaitu
model dengan satu titik knot, model dengan dua titik knot, dan
model dengan tiga titik knot. Berikut hasil pemilihan GCV
minimum ketiga bentuk model tersebut.
Berdasarkan pemilihan GCV minimum ketiga model tersebut,
maka model terbaik diperoleh ketika kurva regresi memiliki tiga
titik knot. Lokasi titik knot tersebut adalah ๐1 = 26,4956,
๐2 = 29,3591, ๐3 = 35,0863 dan bandwidth ๐1 = 0,1411,
๐2 = 0,0676, ๐3 = 0,0344, ๐4 = 0,0207.
Hasil estimasi parameter berdasarkan lokasi titik-titik knot
dan bandwidth optimum adalah ๏ฟฝฬ๏ฟฝ0 = 3,6965, ๏ฟฝฬ๏ฟฝ1 = โ0,2832,
๏ฟฝฬ๏ฟฝ1 = 3,6986, ๏ฟฝฬ๏ฟฝ2 = โ5,5289 dan ๏ฟฝฬ๏ฟฝ3 = 2,3139. Dengan
demikian estimasi kurva regresi model menjadi
๏ฟฝฬ๏ฟฝ๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข๐ , ๏ฟฝฬ๏ฟฝ๐) = 3,6965 โ 0,2832๐ข๐ + 3,6986(๐ข๐ โ 26,4956 )+
๏ฟฝฬ๏ฟฝ๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข๐ , ๏ฟฝฬ๏ฟฝ๐) = โ5,5289(๐ข๐ โ 29,3591)+ + 2,3139(๐ข๐ โ 35,0863)+
๏ฟฝฬ๏ฟฝ๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข๐ , ๏ฟฝฬ๏ฟฝ๐) = +โ
10,1411
๐พ (๐ฃ1 โ ๐ฃ1๐
0,1411)
โ1
0,1411๐พ (
๐ฃ1 โ ๐ฃ1๐
0,1411)29
๐=1
๐ฆ๐
29
๐=1
+ โ
10,0676
๐พ (๐ฃ2 โ ๐ฃ2๐
0,0676)
โ1
0,0676 ๐พ (
๐ฃ2 โ ๐ฃ2๐
0,0676 )29
๐=1
๐ฆ๐
29
๐=1
๏ฟฝฬ๏ฟฝ๏ฟฝฬ๏ฟฝ,๏ฟฝฬ๏ฟฝ(๐ข๐ , ๏ฟฝฬ๏ฟฝ๐) = +โ
10,0344
๐พ (๐ฃ3 โ ๐ฃ3๐
0,0344)
โ1
0,0344๐พ (
๐ฃ3 โ ๐ฃ3๐
0,0344)29
๐=1
๐ฆ๐
29
๐=1
+ โ
10,0207
๐พ (๐ฃ4 โ ๐ฃ4๐
0,0207)
โ1
0,0207๐พ (
๐ฃ4 โ ๐ฃ4๐
0,0207)29
๐=1
๐ฆ๐
29
๐=1
Dari hasil pengolahan diperoleh nilai R2 sebesar 0,9202.
Nilai R2 ini menunjukkan bahwa variabel yang digunakan dapat
menjelaskan model sebesar 92,02%.
Selanjutnya adalah melakukan pengujian asumsi kenormalan
residual. Dengan menggunakan uji Kolmogorov-Smirnov
didapatkan plot pada Gambar 2. Pengujian normalitas pada
residual menghasilkan ๐-๐ฃ๐๐๐ข๐ > 0,150, lebih besar dari
๐ผ (0,05) sehingga disimpulkan bahwa residual model
berdistribusi normal.
0.40.30.2 1284 1050
50
40
30
20
10
1284
50
40
30
20
10
40200
Gini Ratio
Per
sen
tase
Kem
iski
nan
Rata-rata Lama Sekolah Tingkat Pengangguran Terbuka
Laju Pertumbuhan Ekonomi PDRB Perkapita
Gambar 1. Diagram Pencar Variabel Respon dengan Masing Varial Prediktor.
Tabel 1.
Perbandingan nilai GCV Minimum
No Model GCV
1 1 Titik Knot 4 Bandwidth 21,2932
2 2 Titik Knot 4 Bandwidth 17,1844
3 3 Titik Knot 4 Bandwidth 13,4836
6
Model regresi campuran nonparametrik spline dan kernel ini
dapat digunakan untuk skenario kebijakan. Misalkan suatu
kabupaten ingin menetapkan target PDRB perkapita 9,39 juta
rupiah, gini ratio sebesar 0,37 rata-rata lama sekolah 9,21,
tingkat penganguuran terbuka 5,31 dan laju pertumbuhan
ekonomi 6,83, maka melalui penghitungan menggunakan
model regresi campuran nonparametrik spline dan kernel
diperoleh persentase penduduk miskin sebesar 26,02 persen.
Jika target-target yang akan ditetapkan tersebut dianggap tidak
menekan persentase penduduk miskin secara signifikan, maka
bisa dilakukan simulasi perubahan target dan selanjutnya
diprediksi kembali persentase penduduk miskinnya
V. KESIMPULAN
Kurva regresi campuran nonparametrik spline dan kernel
merupakan suatu kurva regresi yang mengombinasikan dua
jenis kurva regresi, yaitu spline dan kernel. Kurva ini
diharapkan dapat mendekati pola data dengan baik karena
masing-masing pola data telah didekati oleh kurva yang sesuai.
Kurva regresi spline yang digunakan dalam penelitian ini
adalah kurva regresi spline linier truncated, sedangkan kurva
regresi kernel yang digunakan adalah kurva regresi kernel
Nadaraya-Watson. Untuk saran penelitian selanjutnya, dapat
dilakukan kajian mengenai model regresi campuran
nonparametrik spline dan kernel dimana kurva regresi spline
yang digunakan adalah spline kuadratik atau kubik, sedangkan
kurva regresi kernel yang digunakan adalah linier konstan.
UCAPAN TERIMA KASIH
Penulis R mengucapkan terima kasih kepada Badan Pusat
Statistik (BPS) Republik Indonesia yang telah memberikan
dukungan finansial melalui beasiswa tahun 2014-2016.
DAFTAR PUSTAKA
[1] R. L. Eubank, Nonparametric Regression and Spline Smoothing, New
York: Marcel Dekker, Inc, 1999.
[2] C. H. Reinsch, โSmoothing by Spline Functionsโ, Numerische
Mathematik, Vol. 10, hal. 77-183, 1967.
[3] B. W. Silverman, โSome Aspects of The Spline Smoothing Approach to Non-parametric Regression Curve Fittingโ, Journal of the Royal
Statistical Society. Series B (Methodological), Vol. 47, No. 1, hal. 1-52,
1985.
[4] G. Wahba, Spline Models for Observational Data, Philadelphia: Society
for Industrial and Applied Mathematics, 1990.
[5] H. Liang, โEstimation in Partially Linear Models and Numerical Comparisonsโ, Computational Statistics & Data Analysis, Vol. 50, No
.3, hal. 675-687, 2006.
[6] Y. Lin and H. H. Zhang, โComponent Selection and Smoothing in Multivariate Nonparametric Regressionโ, The Annals of Statistics, Vol.
34, No. 5, hal. 2272-2297, 2006.
[7] A. Islamiyati and I. N. Budiantara, โModel Spline dengan Titik-titik Knots dalam Regresi Nonparametrikโ, Jurnal INFERENSI, Vol. 3, hal.
11-21, 2007.
[8] I. N. Budiantara, Spline dalam Regresi Nonparametrik dan
Semiparametrik: Sebuah Pemodelan Statistika Masa Kini dan Masa
Mendatang, Surabaya: ITS Press, 2009.
[9] E. A. Nadaraya, Nonparametric Estimation of Probability Densities and
Regression Curves, Kluwcer Academic Publishers, 1989.
[10] T. Gasser and H.-G. Muller, Kernel Estimation of Regression Functions,
Springer Berlin Heidelberg, 1979.
[11] W. Hardle, Applied Nonparametric Regression, Berlin: Humboldt-
Universitรคt zu Berlin, 1994.
[12] M. P. Wand and M. C. Jones, Kernel Smoothing, London: Chapman &
Hall, 1995.
[13] J. You and G. Chen, โSemiparametric Generalized Least Squares Estimation in Partially Linear Regression Models with Correlated
Errorsโ, Journal of Statistical Planning and Inference, Vol. 137, No. 1,
hal. 117-132, 2007.
[14] M. Kayri and Zirhhoglu, โKernel Smoothing Function and Choosing
Bandwidth for Nonparametric Regression Methodsโ, Ozean Journal of
Applied Sciences, 2(1), 49-54, 2009.
[15] J. Klemela, Multivariate Nonparametric Regression and Visualization:
with R and Applications to Finance, New Jersey: John Wiley & Sons,
Inc, 2014.
[16] I. N. Budiantara, M. Ratna, I. Zain and W. Wibowo, โModeling the
Percentage of Poor People in Indonesia Using Spline Nonparametric
Regression Approachโ, International Journal of Basic & Applied Sciences IJBAS-IJENS, Vol. 12 No. 06, hal. 119-124, 2012.
[17] W. Hardle, M. Muller, S. Sperlich and A. Werwatz, Nonparametric and
Semiparametric Models, Springer-Verlag Berlin Heidelberg, 2004.
[18] S. Ellies, The Dimension of Poverty, Kumarian Press, 1994.
[19] S. Fan, โPublic Investment and Poverty Reduction Case Studies from
Asia and Implications for Latin Americaโ, in Seminario Internacional: Tendencias Y Desafion Del Gato Publiko Para El Desarollo Agricola Y
Rural En America Latina Y El Caribe, Santo Domingo, 2003.
[20] J. B. G. Tilak, Post-Elementary Education, Poverty and Development in India, New Delhi: Working Paper Series - No. 6, Centre of African Studies, University of Edinburgh, 2005.
[21] A. H. Naja, โPendidikan Berkualitas dan Pembangunan Sumber Daya
Manusia: Solusi Utama Masalah Pengangguran dan Kemiskinan di Indonesiaโ, Jurnal Bisnis dan Ekonomi Politik, Vol. 7 No. 1, hal. 67-79,
2006.
[22] P. R. Agenor, Unemployment-Poverty Trade-Offs, Washington DC: The World Bank, 2004.
[23] J. P. Formby, G. A. Hoover and K. Hoseong, Economic Growth and
Poverty in the United States: Comparisons of Estimates Based Upon Official Poverty Statistics and Sen's Index of Poverty, Working Paper No.
00-11-01, Univ. of Alabama, Department of Economics, Finance, and
Legal Studies, 2000.
[24] G. Iradian, Inequality, Poverty, and Growth: Cross-Country Evidence,
IMF Working Paper, 1-39, 2005.
[25] P. Agrawal, โEconomic Growth and Poverty Reduction: Evidence from Kazakhstanโ, Asian Development Review, Vol. 24, No. 2, hal. 90-115,
2008.
43210-1-2-3
99
95
90
80
70
60
50
40
30
20
10
5
1
Residual
Per
cent
Mean 3.448275E-10
StDev 1.299
N 29
KS 0.127
P-Value >0.150
Gambar 2 Probability Plot Residual.