Univariate Time Series dan NN
-
Upload
farisca-susiani -
Category
Documents
-
view
230 -
download
0
description
Transcript of Univariate Time Series dan NN
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 1/24
Data Analysis
The Third Project
Peramalan Jumlah Wisatawan Mancanegara Melalui PintuKedatangan Bandara Soekarno Hatta, Juanda dan Adi
Sumarmo dengan Metode Univariate Time Series dan FFNN
Sulistya Ummiea,, Farisca Susiani
a,*
a Institut Teknologi Sepuluh Nopember, Kampus ITS Sukolilo, Jalan Raya ITS Surabaya 60111, Indonesia
Abstract
The air traffic numbers in passengers have experienced large growth rates the past decade. The eco-
nomic growth in Indonesia is one of the main aspects contributing to this, supported by various aspects on
the supply side; increase of regional attractiveness, improved connectivity and route development, and by
aspect on the demand side. The high increase in air traffic can largely be related to the increase in com-
mon wealth of the Indonesians and the country becoming an evermore-popular destination for foreign
tourists. Forecasting the amount of foreign tourist really needed for business tourism. In this study, we
used univariate time series and Feed forward Neural Network (FFNN) method to forecast foreign tourist
that came to Indonesia from Soekarno-Hatta, Juanda, and Adi Sumarmo. We limited our study to analysis
from January 2006 until August 2015 to avoid an external intervention. All the method will evaluate with
Root Mean Square Error (RMSE) criteria. The method who have a small RMSE will be chosen to forecastthe amount of foreign tourist in Indonesia.
Keywords :Foreign Tourist, Soekarno-Hatta, Juanda, Adi Sumarmo, Univariate Time Series, FFNN;
1. Pendahuluan
Sebagai negara kepulauan yang memiliki lebih dari 17.000 pulau, Indonesia sangat bergantung dengan
alat tranportasi air dan udara. Dengan lebih dari 600 bandara yang beroperasi di Indonesia, Pesawat me-
rupakan salah satu sarana transportasi yang populer di negeri ini. Pesawat tidak hanya dapat mengangkut
manusia tetapi dapat juga mengangkut barang atau produk berkapasitas tertentu (kargo). Seiring dengan
pertumbuhan ekonomian dan perkembangan global membuat permintaan terhadap jasa angkutan atau
transportasi udara semakin meningkat, terlihat dari angka lalu lintas udara yang mengalami tingkat per-
tumbuhan yang besar dalam dekade terakhir. Hal ini mendorong sektor bandara di Indonesia untuk men-
jadi salah satu yang terbesar di wilayahnya. Namun, ini juga menuntut banyaknya perkembangan yang
harus dilaksanakan di sektor ini untuk bersaing, seiring dengan meningkatnya permintaan masyarakat.
* Corresponding Author. Tel.: +6285-231-872-323.
E-mail address: [email protected].
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 2/24
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 3/24
Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project 3
(Surakarta). Data dibagi menjadi data training dan data testing. Terdapat dua skenario data testing yang
digunakan, yaitu 12 bulan terakhir (September 2014 sampai Agustus 2015) dan 24 bulan terakhir (Sep-
tember 2013 sampai Agustus 2015).
2.2. Metode Analisis Data
Metode analisis pada tugas ini dibagi dalam beberapa tahapan, meliputi deskripsi dan eksplorasi data,
penyusunan model peramalan dengan metode univariate time series dan FFNN. Terakhir adalah pemili-han model terbaik.
1. Deskripsi dan Eksplorasi data: Dilakukan melalui plot deret waktu, plot ACF dan PACF, Boxplot
dan Box-Cox dengan tujuan mengidentifikasi pola dan mengamati ada tidaknya outlier data. Tak ket-
inggalan pula dilakukan analisis statistika deskriptif untuk mengetahui deskripsi dari jumlah wisata-
wan mancanegara melalui pintu masuk bandara Soekarno-Hatta, Juanda, dan Adi Sumarmo.2. Model Peramalan: Beberapa model peramalan yang digunakan adalah univariate time series yang
mencakup Naive model, metode ARIMA, metode Exponential smoothing, Time series regression,
dan metode Decomposition. Serta metode FFNN sebagai perbandingan yang tidak dibatasi oleh
asumsi-asumsi. Dalam proses penyusunan model dibagi menjadi 2 bagian, yaitu data training dandata testing. Data training digunakan untuk menyusun model peramalan, sementara data testing
digunakan untuk validasi model dengan dua skenario data testing yang digunakan, yaitu 12 bulan te-
rakhir (September 2014 sampai Agustus 2015) sebagai skenario 1 dan 24 bulan terakhir (September
2013 sampai Agustus 2015) sebagai skenario 2.
3. Pemilihan Model: Kriteria pemilihan model yang digunakan adalah nilai Root Mean Square Error
(RMSE). Model peramalan dikatakan baik jika mempunyai nilai RMSE terkecil.
Selanjutnya lebih jelasnya mengenai tahapan dalam penyusunan model peramalan dengan beberapa me-
tode yang digunakan akan diuraikan secara ringkas dan jelas sebagai berikut.
2.3.1
Naïve Model
Naïve model adalah metode peramalan yang paling sederhana dibandingkan lainnya dan mengasumsi-
kan bahwa data saat ini berkontribusi pada peramalan periode selanjutnya. Peramalan pada periode ke-t
sama dengan nilai observasi pada periode sebelumnya (t-1). Naïve model yang paling sederhana untuk
data yang stationer adalah [3].
t t Z Z =+1
(1)
dan naïve model untuk data tren mengikuti persamaan
( )
=−+=
−+−+
1111
t
t t t t t t t Z
Z Z Z atau Z Z Z Z
(2)
Sementara itu naïve model untuk data seasonal dan tren sesuai dengan persamaan.
( )
=−+=
−+
−+−++−+−+−++st
st st t st st st t Z Z Z Z atau Z Z Z Z
21
11121111
(3)
2.3.2 Autoregressive Integrated Moving Average (ARIMA) Box Jenkins
Model ARIMA dikembangkan pada 1970-an oleh George Box dan Jenkins Gwilym sebagai upaya un-
tuk menggambarkan perubahan pada data time series menggunakan pendekatan matematika, model
ARIMA telah menjadi salah satu pendekatan yang paling populer untuk peramalan. Peramalan dalam
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 4/24
4 Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project
model ARIMA merupakan kombinasi linear dari nilai-nilai masa lalu dan kesalahan masa lalu. Secara
umum, model ARIMA non-seasonal yang dinotasikan dengan ARIMA (p,d,q) mengikuti persamaan.
( ) t qqt
p p
d a B B B Z B B B B θ θ θ φ φ φ −−−−=−−−−− ...1)...1()1( 2
212
21
(4)
dimana
qd p ,, = orde Autoregressive (AR), Differencing non-seasonal, dan Moving Average (MA)
d B)1( − = orde differencing non-musiman
t Z = µ −t Z
Demikian pula dengan model ARIMA seasonal yang diwakili oleh ARIMA (p,d,q)(P,D,Q) yang mengi-
kuti persamaan
( )( ) t qsq
ssqq
t ps
pss p
p Dsd
a B B B B B B
Z B B B B B B B B
Θ Θ Θ θ θ θ
Φ Φ Φ φ φ φ
−−−−−−−−
=−−−−−−−−−−
...1...1
)...1)(...1()1()1(
221
221
221
221
(5)
dimana
qd p ,, = orde Autoregressive (AR), Differencing non-seasonal, dan Moving Average (MA)
Q DP ,, = orde Autoregressive (AR), Differencing seasonal, dan Moving Average (MA)
d B)1( − = orde differencing non-musiman
Ds B )1( − = orde differencing musiman
t Z = µ −t Z
Metode ARIMA merupakan metode yang tidak melibatkan variabel prediktor. Metode ini sangat ketat
terhadap asumsi (data dan residual white noise) dan digunakan untuk data ang berpola linear. Pada dasar-
nya, metode ini memiliki tiga tahap: identifikasi model, estimasi parameter dan pemeriksaan diagnostik.
Model ARIMA pada dasarnya adalah pendekatan berorientasi data yang diadaptasi dari struktur data itu
sendiri.
a. Identifikasi model, meliputi (1) pembuatan time series plot yang digunakan untuk mengetahui pola
data. Jika pola data cenderung membentuk pola tertentu atau tidak berfluktuasi di sekitar garis makadata tidak stationer; (2) kemudian membuat box-cox yang digunakan untuk mengetahui kestationeran
data dalam varians; (3) membuat plot Auto-correlation Function (ACF) dan Partial Auto-correlation
Function (PACF) yang digunakan untuk mengetahi kestationeran data dalam means serta menentu-
kan model ARIMA; jika data tidak stationer baik dalam means maupun varians maka (c) memilih
transformasi yang sesuai.
b. Estimasi Parameter. Setelah mengidentifikasi model tahap selanjutnya adalah menentukan metode
estimasi yang digunakan. Metode Least square adalah metode yang sering digunakan. Estimasi Least
square dilakukan dengan cara mencari nilai parameter yang meminimumkan jumlah kuadrat error.
c. Pemeriksaa diagnostik meliputi uji asumsi residual berdistribusi normal dan white noise. Untuk uji
kenormalan dilakukan pengujian dengan Kolmogorov-Smirnov. Sementara itu asumsi white noise
merupakan asumsi dimana residual saling bebas. Uji ini menggunakan uji Ljung dan Box [3].
2.3.3 Exponential Smoothing
Metode exponential smoothing merupakan metode peramalan yang cukup baik untuk peramalan jang-
ka panjang dan jangka menengah, terutama pada tingkat operasional. Metode ini dikembangkan oleh Lin-
coln. Exponential smoothing menggunakan rata-rata tertimbang (weighted average) dari nilai masa lalu
sebagai peramalan. Metode ini merupakan pengembangan dari metode moving average. Persamaan expo-
nential smoothing mengikuti persamaan [4]
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 5/24
Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project 5
( ) t t t Z Z Z α α −+=+ 11 (6)
dimana:
1+t Z = peramalan baru dari deret waktu untuk periode t+1
t Z = nilai aktual dari deret waktu di periode t
t Z
= peramalan dari deret waktu untuk periode tα = konstanta penghalusan ( )10 ≤≤ α
Metode exponential smoothing terbagi menjadi 3, yaitu single exponential smoothing, double expo-
nential smoothing, dan Holt Winter. Apabila data yang dianalisa bersifat stationer maka single exponen-
tial smoothing cukup tepat digunakan, namun apabila datanya menunjukkan suatu trend linear, maka
model yang baik untuk digunakan adalah double exponential smoothing atau holt winter.
2.3.4 Time Series Regression
Regresi time series mirip dengan jenis lain dari regresi dengan dua perbedaan penting. Pertama, varia-
bel waktu sendiri: tren dari waktu ke waktu, musim, dan siklus bisnis, sering berguna dalam menjelaskan
dan / atau memprediksi perilaku deret waktu. Kedua, urutan data penting karena, tidak seperti data cross-sectional, data time series memerlukan urutan yang sesuai di mana data dikumpulkan. Untuk mengesti-
masi regresi time series digunakan persamaan [4].
t bb Z t 10 += (7)
dimana
t Z = nilai peramalan pada periode ke-t
0b = intercept dari garis regresi time series
1b = slope dari garis regresi time series
t = periode waktu (t = 1, 2,…, n)
Rumus untuk menghitung koefisien regresi pada persamaan (7) adalah
( )( )
( )
t b Z
t t
Z Z t t b
n
t
nt t
10
1
2
11
−=
∑ −
∑ −−=
=
=
β
(8)
Jika pola data seasonal maka persamaan (7) dapat ditulis menjadi.
sst t t S bS bS bb Z ,1,22,110 ...++++= (9)
dimana st t S S S ,1,2,1 ,...,, adalah variabel dummy untuk komponen musiman. Prosedur peramalan meng-
gunakan regresi time series adalah (a) menentukan variabel yang menyatakan pola musiman dan tren, (b)
estimasi model, (c) melakukan diagnostic check pada residual, jika belum white noise maka lag yang sig-
nifikan berdasarkan plot ACF dan PACF ditambahkan sebagai variabel independen, dan (d) melakukan
estimasi ulang model yang signifikan.
2.3.5 Decomposition Method
Time series decomposition dapat digunakan untuk memisahkan atau mengurai data deret waktu keda-
lam pola musiman, tren, dan komponen yang tidak teratur. Metode ini dapat digunakan untuk peramalan,
penerapan utamanya adalah untuk mendapatkan pemodelan yang lebih baik dari data time series.Metode
Time series decomposition mengasumsikan bahwa Z t, nilai aktual dari deret waktu pada periode t adalah
fungsi dari 4 komponen, yaitu komponen tren, musiman, silus dan komponen irregular atau error. Bagai-
mana empat komponen ini digabungkan untuk menghasilkan nilai-nilai yang diamati dari time series ter-
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 6/24
6 Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project
gantung pada apakah kita menganggap hubungan ini mengikuti pola model aditif atau model multiplika-
tif. Model additive decomposition mengikuti persamaan [4].
t t t t t eC S T Z +++= (10)
dimana
t T = Komponen tren pada periode waktu ke-t
t S = Komponen musiman pada periode waktu ke-tt C = Komponen siklus pada periode waktu ke-t
t e = KOmponen eror pada periode waktu ke-t
Komponen tren merupakan kecenderungan gerak naik atau turun pada data yang terjadi dalam jangka
panjang. Variasi musiman adalah gerak naik dan turun yang terjadi secara periodik (berulang dalam se-
lang waktu yang sama). Sementara itu komponen siklus adalah perubahan gelombang pasang surut yang
berulang kembali dalam waktu yang cukup lama. Model aditif sesuai dalam situasi di mana fluktuasi mu-
siman tidak tergantung pada tingkat deret waktu. Namun, jika fluktuasi musiman yang berubah dari waktu
ke waktu, tumbuh lebih besar dengan meningkatnya volume data karena tren linear jangka panjang, maka
model multiplikatif harus digunakan. Model multiplicative decomposition mengikuti persamaan.
t t t t t eC S T Z ×××= (11)
2.3.6 Feed Forward Neural Network (FFNN)
Neural Network pertama kali diperkenalkan pada tahun 1943 oleh neurophysiologist Waren McCul-
loch dan logician Walter Pits, dalam uraiannya mereka memperagakan neural network yang sederhana
dengan menggunakan rangkaian listrik, namun teknologi yang tersedia pada saat itu belum memungkin-
kan mereka berbuat lebih jauh. Pada beberapa tahun terakhir Jaringan Syaraf Tiruan (JST) telah berkem-
bang secara pesat. Menurut Fausett [5] Neural Network adalah suatu sistem pemroses informasi yang
mempunyai karakter tampilan tersendiri yang hampir sama dengan jaringan syaraf pada biologi. Jaringan
saraf tiruan telah dikembangkan sebagai generalisasai model matematika dari jaringan saraf biologi, ber-
dasarkan asumsi (1) Pemrosesan informasi terjadi pada elemen sederhana yang disebut neuron, (2) Sinyal
dilewatkan antarneuron melalui link penghubung, (3) Setiap link penghubung mempunyai sebuah bobotdimana pada jaringan saraf tertentu bobot digandakan oleh sinyal yang dipancarkan, dan (4) Setiap neu-
ron menggunakan fungsi aktivasi (biasanya nonlinear) pada jaringan inputnya (penjumlahan bobot sinyal
input) untuk menentukan sinyal output.
Dari sekian banyak metode neural network yang paling populer adalah metode backpropagation atau
bisa disebut dengan Feed Forward Neural Network (FFNN) ataupun Multi Layer Perceptron (MLP). Se-
cara umum arsitektur FFNN terdiri dari input, hidden layer dan output, seperti terlihat pada Gambar 1.
Metode FFNN ini juga paling banyak digunakan untuk melakukan peramalan menggunakan data time
series. Tahapan-tahapan dalam penyusunan FFNN adalah.
a. Menentukan input. Jumlah input yang digunakan tergantung pada plot ACF dan PACF.
b. Mendefinisikan fungsi aktivasi. Fungsi aktivasi yang digunakan adalah fungsi sigmoid biner pada
hidden layer dan fungsi linear pada output layer. Penentuan jumlah hidden layer dibatasi untuk satu
hidden layer, sedangkan jumlah neuron pada hidden layer ditentukan secara trial and error sampai di-capai error minimum (pada tugas ini ditentukan 0,001) dengan learning rate sebesar 20%.
c. Menentukan hidden layer, dalam penelitian ini hanya digunakan 1 hidden layer dengan pemilihan
jumlah neuron pada hidden layer dilakukan dengan cara trial and error, dimulai dari jumlah neuron
terkecil yaitu 1 neuron sampai dengan 20 neuron.
d. Menormalisasi data input. Normalisasi data input bertujuan untuk menyesuaikan nilai range data
dengan log sigmoid threshold function dalam sistem backpropagation. Ini berarti nilai kudrat input
harus berada pada range 0 sampai 1. Sehingga range input yang memenuhi syarat adalah nilai data
input dari 0 sampai 1 atau dari –1 sampai 1. Oleh karena itu output yang dihasilkan pun akan berada
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 7/24
Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project 7
pada range 0 sampai 1, untuk mendapatkan niali sebenarnya dari output perlu dilakukan proses de-
normalisasi.
e. Memilih jaringan dengan error paling minimum, dapat dilihat dari ukuran kebaikan model, yaitu nilai
RMSE.
Gambar 1. Arsitektur Feed Forward Neural Network
3. Hasil dan Pembahasan
3.1. Deskripsi dan Eksplorasi Data Jumlah Wisatawan Mancanegara Melalui Pintu Kedatangan
Bandara Soekarno-Hatta, Juanda, dan Adi Sumarmo
Rata-rata jumlah wisatawan mancanegara ke Indonesia mulai bulan Januari 2006 sampai Agustus 2015
di pintu kedatangan Soekarno Hatta sebesar 146070 jiwa dengan variasi sebesar 1533627147. Jumlah
kedatangan wisatawan mancanegara melalui Soekarno Hatta paling sedikit terjadi pada bulan Oktober
2006 sebesar 68470 jiwa, sedangkan yang paling banyak terjadi pada bulan Agustus 2015. Jumlah
Wisatawan mancanegara berubah-ubah setiap bulannya. Rata-rata jumlah wisatawan mancanegaramelalui pintu kedatangan Juanda sebesar 14336 jiwa dengan variansi sebesar 14045355. Kedatangan
wisatawan mancanegara paling minimum terjadi pada bulan Oktober 2006 sebesar 4762 jiwa dan paling
banyak terjadi pada bulan November 2013. Sementara itu rata-rata jumlah wisatwan mancanegara ke
Indonesia melalui pintu kedatangan Adi Sumarmo di Surakarta tercatat sebesar 1478 jiwa dengan variansi
302965. Pada pintu masuk ini jumlah wisatawan mancanegara paling kecil terjadi pada bulan Oktober
2006 dan tertinggi terjadi pada bulan Mei 2012. Terlihat bahwa variansi yang dihasilkan masih relatif
besar terutama pada pintu kedatangan Soekarno Hatta di Jakarta yang menunjukkan adanya kesenjangan
jumlah wisatawan setiap bulannya.
Tabel 1. Deskripsi Jumlah Wisatawan Mancanegara Melalui Pintu Kedatangan
Rata-rata Variansi Minimum Maksimum
Soekarno-Hatta 146070 1533627147 68470 252914
Juanda 14336 14045355 4762 22986
Adi Sumarmo 1477,3 302964,2 502 3325
Boxplot jumlah wisatawan ke Indonesia melalui 3 pintu kedatangan menunjukkan bahwa untuk pintu
kedangan Soekarno Hatta dan Juanda pada bulan Desember jumlah wisatawan yang datang mempunyai
variabilitas paling kecil artinya jumlah kedatangan wisatawan ke Indonesia melalui pintu Soekarno Hatta
dan Juanda pada bulan Juli cenderung lebih homogen atau hampir sama setiap tahunnya. Sementara itu
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 8/24
8 Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project
untuk pintu kedatangan Adi Sumarmo variabilitas paling kecil terjadi pada bulan Agustus yang berarti
jumlah kedatangan wisatawan ke Indonesia melalui pintu Adi Sumarmo pada bulan Juli cenderung lebih
homogen atau hampir sama setiap tahunnya. Pada box plot pintu kedatangan Juanda terlihat bahwa terda-
pat data outlier pada bulan Juli dan Agustus. Data outlier ini nantinya dapat berdampak pada hasil pera-
malan. Namun pada tugas ini outlier tidak diatas dan tetap dilanjutkan untuk peramalan. Plot deret waktu
menunjukkan bahwa Jumlah kedatangan wisatawan mancanegara mulai bulan Januari 2006 sampai den-gan Agustus 2015 mengalami fluktuasi (Lihat Gambar 2.). Secara visual fluktuasi ini tidak berada di seki-
tar nilai rata-rata sehingga dapat dikatakan bahwa data cenderung tidak stationer dalam mean. Terlihat
adanya pola musiman dan tren pada Gambar 2.(a-2) dan (b-2) dan pola musiman pada Gambar 2 (c-2).
Gambar 2. Box plot (a.1) Soekarno-Hatta; (b-1) Juanda; (c-1) Adi Sumarmo; dan Time Series Plot plot (a-2) Soekarno-Hatta; (b-2)
Juanda; (c-2) Adi Sumarmo
DesNovOktSep AgsJulJunMei AprMarFebJan
3500
3000
2500
2000
1500
1000
500
month
A d i_ S u m a r m o
DesNovOktSep AgsJulJunMei AprMarFebJan
250000
200000
150000
100000
50000
month
S o e k a r n o_
H a t t a
DesNovOktSep AgsJulJunMei AprMarFebJan
25000
20000
15000
10000
5000
month
J u a n d a
Year
Month
2015201420132012201120102009200820072006
JanJanJanJanJanJanJanJanJanJan
3500
3000
2500
2000
1500
1000
500
A d i_ S u m a r m o
Year
Month
2015201420132012201120102009200820072006
JanJanJanJanJanJanJanJanJanJan
25000
20000
15000
10000
5000
J u a n d a
Year
Month
2015201420132012201120102009200820072006
JanJanJanJanJanJanJanJanJanJan
250000
200000
150000
100000
50000
S o e k a r n o_
H a t t a
(a-2)
(b-2)
(c-2)
(a-1)
(b-1)
(c-1)
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 9/24
Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project 9
3.2. Peramalan dengan Naïve Model
Naïve model merupakan metode yanng paling sederhana dalam peramalan, menganggap bahwa pera-
malan periode berikutnya sama dengan nilai aktual periode sebelumnya. Dalam tugas ini, metode naïve
digunakan untuk meramalkan jumlah wisatawan mancanegara ke Indonesia melalui 3 pintu, Soekarno-
Hatta, Juanda, dan Adi Sumarmo pada 12 periode ke depan (skenaro 1) dan 24 periode ke depan (skenario2), hasilnya terlihat pada Tabel 2. Model persamaan yang digunakan merujuk pada persamaan (1).
Tabel 2. Performance Hasil Peramalan Jumlah Kedatangan Wisatawan Mancanegara dengan Naïve Model
Skenario 1 Skenario 2
Training Testing Training Testing
Soekarno-Hatta 22378,97084 31306,28282 22501,67796 28079,78873
Juanda 2070,6224 1803,39314 2043,742 2038,322
Adi Sumarmo 467,7331 134,986 481,2699 269,6998
Kriteria pemilihan model terbaik didasarkan pada nilai RMSE pada tiap-tiap model. Pada Tabel 2 ter-
lihat pula bahwa RMSE data testing lebih kecil daripada data training maka dapat disimpulkan bahwamodel yang dihasilkan tepat dan cukup bagus. Kecuali untuk model pada data jumlah wisatawan yang
datang melalui pintu Soekarno Hatta yang memiliki nilai RMSE data testing lebih besar dari data training
sehingga model yang dihasilkan belum tepat dan tidak bagus.
3.3. Peramalan dengan Model ARIMA
3.3.1 Skenario 1
Pada bagian ini akan dilakukan peramalan jumlah wisatawan mancanegara ke Indonesia melalui pintu
kedatangan Soekarno-Hatta, Juanda, dan Adi Sumarmo dengan menggunakan data training dari bulan
Januari 2006 sampai Agustus 2014 dan data testing dari bulan September 2014 sampai Agustus 2015.
Model dengan performance terbaik adalah model yang akan dipilih sebagai model terbaik. Model ARI-
MA terikat dengan asumsi stationeritas data, baik stationeritas dalam varians yang dapat dilihat dari nilai
box-cox plot dan stationeritas dalam means yang dilihat melalui plot ACF dan PACF.
Box-cox plot pada data training jumlah kedatangan wisatawan mancanegara ke Indonesia melalui pin-
tu kedatangan Soekarno-Hatta, Juanda, dan Adi Sumarmo masing-masing memiliki nilai rounded value
1,00; 0,50; dan 0,50. Batas atas atau batas bawah lambda yang dihasilkan sudah melewati nilai satu se-
hingga data telah memenuhi asumsi stationeritas dalam varians dan tidak perlu dilakukan transformasi.
Data jumlah wisatawan mancanegara merupakan data runtun waktu bulanan yang memiliki korelasi antar
waktu pengamatan. Data ini membentuk pola musiman dengan periode tahunan atau 12 bulan.
Identifikasi stationeritas means dengan melihat plot ACF dan PACF. Hasil menunjukkan bahwa plot
ACF terindikasi turun lambat yang berarti data belum stationer dan memerlukan differencing secara mu-
siman dengan D=1 dan S=12 untuk pintu kedatangan Soekarno Hatta dan Juanda serta D=1 dan S=6 un-tuk pintu kedatangan Adi Sumarmo. Setelah dilakukan differencing secara musiman, terlihat pada Gam-
bar 3 plot ACF telah turun secara tepat mendekati nol sehingga data telah stationer dalam means. Penen-
tuan model juga menggunakan ACF dan PACF plot. Hasil model peramalan wisatawan mancanegara
melalui pintu kedatangan Soekarno Hatta, Juanda, dan Adi Sumarmo tersajikan pada Tabel 3.
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 10/24
10 Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project
Tabel 3. Model Peramalan ARIMA Jumlah Wisatawan Mancanegara periode 12 bulan ke depan
White Noise Normality
Lag Chi-Sq df P-value. K-S Sig
Soekarno-Hatta 6 2,49 2 0,2883 >0,15
ARIMA([1,2,15],0,0)(1,1,0)
12
12 4,79 8 0,7799RMSE 18 11,35 14 0,6584
31321,98298 24 19,53 20 0,4877
Juanda 6 5,86 3 0,1186 >0,15
ARIMA([1,13],0,0)(1,1,0)12 12 10,97 9 0,2777
RMSE 18 12,69 15 0,6264
3382,482 24 24,41 21 0,2738
Adi Sumarmo 6 4,41 4 0,3540 >0,15
ARIMA(1,0,0)(1,1,0)6 12 8,98 10 0,5345
RMSE 18 12,24 16 0,7276
500,703 24 14,81 22 0,8705
Setelah dilakukan estimasi parameter, selanjutnya dilakukan cek diagnosa model melalui error karena
odel ARIMA terikat dengan asumsi lainnya selain stationer, yaitu residual tidak saling berkorelasi dan
berdistribusi normal. Pada Tabel 3. terlihat bahwa error tidak berkorelasi dengan yang lain atau biasa
disebut white noise karena nilai P-value > 0,05. Selain itu error juga telah mengikuti distribusi normal
yang diuji menggunakan statistik uji Kolmogorov Smirnor.
7065605550454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
A u t o c o r r e l a t i o n
72717069
6867
6665
646362
6160
59
58
5756
555453525150
49484746
45
44
4342
4140
39383736
35
34333231
30
29
2827
26252423
22
2120
19
1817
1615
14
1312
11
10987
6
543
21
(a)
7065605550454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
A u t o c o r r e l a t i o n
727170696867666564
63626160
59585756
5554
535251
504948
4746454443
4241
4039
383736
35
3433323130
2928
272625
2423
2221
201918
17
1615
1413
12
1110
98
765
432
1
(b)
7065605550454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
P a r t i a l A u t o c o r r e l a t i o n
72717069
68676665
646362
6160
5958
57
56
5554
535251
50
49
484746
4544
43
424140
39
3837
36
3534
3332
313029
282726
25
24
23
22
2120
1918
1716
15
14
13
12
11
109
87
6
5
4
3
2
1
(b)
7065605550454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
P a r t i a l A u t o c o r r e l a t i o n
727170
69
68
6766
6564
63626160
59
585756
5554
5352
51
50494847464544
43
42414039
3837
36
35
343332
3130
292827
26
25
24
23
22
2120
1918
1716
15
1413
12
11
109
876
543
2
1
(a)
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 11/24
Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project 11
Gambar 3. ACF dan PACF Plot Skenario 1 (a) Soekarno Hatta; (b) Juanda; (c) Adi Sumarmo
Pada Tabel 3, jika model ARIMA pada setiap pintu kedatangan maka akan mengikuti persamaan.
Soekarno Hattat t aY B B B B B =+−−−− )32864,01)(30278,040377,025286,01)(1( 1215212
Juanda
t t aY B B B B =+−−− )52595,01)(19884,072303,01)(1( 121312
Adi Sumarmo
t t aY B B B =+−− )82099,01)(66959,01)(1( 66
3.3.2 Skenario 2
Pada bagian ini akan dilakukan peramalan jumlah wisatawan mancanegara ke Indonesia melalui pintu
kedatangan Soekarno-Hatta, Juanda, dan Adi Sumarmo dengan menggunakan data training dari bulan
Januari 2006 sampai Agustus 2013 dan data testing dari bulan September 2013 sampai Agustus 2015.
Model dengan performance terbaik adalah model yang akan dipilih sebagai model terbaik. Model ARI-
MA terikat dengan asumsi stationeritas data, baik stationeritas dalam varians yang dapat dilihat dari nilai
box-cox plot dan stationeritas dalam means yang dilihat melalui plot ACF dan PACF. Sama halnya den-
gan skenario 1, hasil pengujian stationeritas dalam varians dengan box cox plot menunjukkan data wisa-
tawan melalui Soekarno-Hatta, Juanda, dan Adi Sumarmo masing-masing memiliki nilai rounded value
1,00; 0,50; dan 0,50. Batas atas atau batas bawah lambda yang dihasilkan sudah melewati nilai satu se-
hingga data telah memenuhi asumsi stationeritas dalam varians dan tidak perlu dilakukan transformasi.
Begitu pula dengan identifikasi stationeritas dalam means (terpenuhi) serta model peramalan yang di-
hasilkan sama dengan skenario 1 yang membedakan adalah nilai pada saat uji residual serta hasil estimasi
parameter.
Tabel 4. Model Peramalan ARIMA Jumlah Wisatawan Mancanegara periode 24 bulan ke depan
ModelWhite Noise Normality
Lag Chi-Sq df P-value. K-S Sig
Soekarno-Hatta 6 1,40 2 0,4967 >0,15
ARIMA([1,2,15],0,0)(1,1,0)12 12 3,50 8 0,8994
7065605550454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
P a r t i a l A u t o
c o r r e l a t i o n
727170
6968
67
666564
636261
6059
5857
56555453
52
515049
48
47
4645
44
43424140
39
38
37
36
353433
3231
30
292827
2625
2423
22
2120
19
18
17
1615
14
13
12
11
10
9
8
7
6
54
3
2
1
(c)
7065605550454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
A u t o c o r
r e l a t i o n
72
717069
686766
6564
63626160
5958
57565554
535251
504948
4746
4544
4342
4140
39
3837
36
3534
3332
31
30
2928
27
2625
24
2322
21
2019
18
1716
15
1413
12
1110
9
87
6
54
3
2
1
(c)
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 12/24
12 Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project
RMSE 18 10,28 14 0,7415
26882,52376 24 20,01 20 0,4572
Juanda 6 5,80 3 0,1186 >0,15
ARIMA([1,13],0,0)(1,1,0)12 12 11,80 9 0,2777
RMSE 18 15,03 15 0,62642620,739 24 25,17 21 0,2738
Adi Sumarmo 6 4,83 4 0,3056 >0,15
ARIMA(1,0,0)(1,1,0)6 12 7,83 10 0,6454
RMSE 18 12,12 16 0,7355
544,7708 24 13,29 22 0,9247
Pada Tabel 4. terlihat bahwa error tidak berkorelasi dengan yang lain atau biasa disebut white noise
karena nilai P-value > 0,05. Selain itu error juga telah mengikuti distribusi normal yang diuji mengguna-
kan Kolmogorov-Smirnov. Jika model diuraikan akan mengikuti persamaan.
Soekarno Hattat t aY B B B B B =+−−−− )37342,01)(30920,039521,027760,01)(1( 1215212
Juanda
t t aY B B B B =+−−− )50858,01)(19951,072724,01)(1( 121312
Adi Sumarmo
t t aY B B B =+−− )83677,01)(67311,01)(1( 66
7065605550454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
A u t o c o r r e l a t i o n
7271
706968676665646362
6160
59
58
57
56
555453
525150
49484746
45
44
4342
4140
393837
36
35
34333231
30
29
2827
2625242322
2120
19
1817
1615
1413
12
11
10987
6
543
21
(a)
7065605550454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
A u t o c o r r e l a t i o n
727170696867666564636261605958575655
54535251504948
4746454443
424140
39383736
35
3433323130
2928
272625
2423
2221
201918
17
161514
13
12
1110
98
765
4
32
1
(b)
7065605550454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
P a r t i a l A u t o c o r r e l a t
i o n
727170
69686766
6564
63626160
5958
5756
55545352
51
50494847
46
45
44
43
424140
393837
36
35
3433
32
313029
2827
26
2524
23
22
2120
1918
1716
15
1413
12
11
1098
76
543
2
1
(a)
7065605550454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
P a r t i a l A u t o c o r r e l a t i o n
727170
6968
676665
64
6362
6160595857
56
55
5453
525150
49
48
474645
44
43
4241
4039
3837
36
3534
3332
31
3029
282726
25
24
23
22
212019
18
1716
15
14
13
12
11
10
98
76
5
4
3
2
1
(b)
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 13/24
Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project 13
Gambar 4. ACF dan PACF Plot Skenario 2 (a) Soekarno Hatta; (b) Juanda; (b) Adi Sumarmo
Secara visual plot hasil ramalan jumlah kedatangan wisatawan ke Indonesia melalui 3 pintu kedatangan
dengan data aktual menggunakan model ARIMA baik untuk skenario 1 maupun skenario 2 adalah
Gambar 5. Plot Ramalan dan Data Testing Skenario 1 model ARIMA (a-1) Soekarno-Hatta; (b-1) Juanda; (c-1) Adi Sumarmo; serta
Plot Ramalan dan Data Testing Skenario 2 model ARIMA (a-2) Soekarno-Hatta; (b-2) Juanda; (c-2) Adi Sumarmo
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
250000
225000
200000
175000
150000
D a t a
Aktual
Ramalan
Variable
(a-1)
Year
Month
201520142013
MayJanSepMayJanSep
250000
225000
200000
175000
150000
D a t a
Aktual
Ramalan
Variable
(a-2)
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
23000
22000
21000
20000
19000
18000
17000
16000
15000
14000
D a t a
Aktual
Ramalan
Variable
b-1
Year
Month
201520142013
MayJanSepMayJanSep
23000
22000
21000
20000
19000
18000
17000
16000
15000
14000
D a t a
Aktual
Ramalan
Variable
b-2
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
1750
1500
1250
1000
750
500
D a t a
Ak tual
Ramalan
Variable
c-1
Year
Month
201520142013
MayJanSepMayJanSep
2000
1750
1500
1250
1000
750
500
D a t a
Ak tual
Ramalan
Variable
(c-2)
7065605550454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
A u t o c o r
r e l a t i o n
72717069
6867
66
65646362
6160
595857
565554
535251
504948
474645
444342
4140
39
3837
36
3534
33
3231
30
2928
27
2625
24
2322
21
2019
18
1716
1514
13
12
1110
987
6
54
3
2
1
(c)
7065605550454035302520151051
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
Lag
P a r t i a l A u t o
c o r r e l a t i o n
72
71
70
69
686766
65
64
63
62
61
60
595857
5655
54
535251
504948
47
46
45
4443
424140
39
38
37
363534
3332
31
302928
27
26
25
242322
21
2019
181716
1514
13
12
11
10
9
8
7
6
54
3
2
1
(c)
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 14/24
14 Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project
3.4. Exponential Smoothing (ES)
Berdasarkan time series plot (Gambar 2. (a-2)) dapat dilihat bahwa pola data jumlah wisatawan man-
canegara melalui pintu Soekarno-Hatta menunjukkan pola data trend seasonal, begitu pula dengan pintu
kedatangan Juanda (Gambar 2. (b-2)) yang juga menunjukkan pola data trend seasonal. Sehingga untuk
analisis dapat menggunakan double exponential smoothing. Sementara itu untuk peramalan jumlah wisa-tawan mancanegara melalui pintu Adi Sumarmo menggunakan single exponential smoothing dikarenakan
pada time series plot (Gambar 2. (c-2)) menunjukkan pola data random atau acak.
Gambar 6. Plot Ramalan Data Training dan Testing Skenario 1 ES (a) Soekarno-Hatta; (b) Juanda; (c) Adi Sumarmo;
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
1300
1200
1100
1000
900
800
700
600
500
D a t a
Ak tual
Ramalan
Variable
10896847260483624121
500000
400000
300000
200000
100000
0
Index
Alpha (level) 0.829415
Gamma (trend) 0.030983
Smoothing Constants
MAPE 12
MA D 16097
MSD 440541989
Acc uracy M easures
Actual
Fits
Forecasts
95.0% PI
Variable
(a)
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
250000
225000
200000
175000
150000
D a t a
Ak tual
Ramalan
Variable
(a)
10896847260483624121
60000
50000
40000
30000
20000
10000
0
-10000
-20000
Index
Alpha (level) 1.06862
Gamma (trend) 0.02018
Smoothing Constants
MAPE 13
MA D 1665
MSD 4461989
Accu racy M easures
Actual
Fits
Forecasts
95.0% PI
Variable
(b)
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
19000
18000
17000
16000
15000
14000
D a t a
Ak tual
Ramalan
Variable
(b)
117104917865523926131
3500
3000
2500
2000
1500
1000
500
Index
Alpha 0.551512
Smoothing Constant
MAPE 25
MAD 335
MSD 186943
Acc uracy M easures
Actual
Fits
Forecasts
95.0% PI
Variable
(c)
(c)
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
1300
1200
1100
1000
900
800
700
600
500
D a t a
Ak tual
Ramalan
Variable
(c)
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 15/24
Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project 15
Kriteria pemilihan model terbaik didasarkan pada nilai RMSE pada tiap-tiap model. Pada Tabel 5 ter-
lihat pula bahwa RMSE data testing lebih besar daripada data training maka dapat disimpulkan bahwa
model yang dihasilkan belum tepat dan kurang bagus untuk peramalan jumlah wisatawan mancanegara
yang datang melalui pintu Soekarno Hatta, Juanda, dan Adi Sumarmo. Secara visual plot hasil ramalan
jumlah kedatangan wisatawan ke Indonesia melalui 3 pintu kedatangan dengan data aktual menggunakanmodel Exponential Smoothing baik untuk skenario 1 (Gambar 6) maupun skenario 2 (Gambar 7). Skena-
rio 1 menunjukkan peramalan 12 periode ke depan dan skenario 2 menunjukkan peramalan 24 periode ke
depan.
Tabel 5. Performance Hasil Peramalan Jumlah Kedatangan Wisatawan Mancanegara dengan Exponential Smoothing
Skenario 1 Skenario 2
Training Testing Training Testing
Soekarno-Hatta 20989,09215 42985,267 21140,54037 27606,721
Juanda 2112,3421 2502,892 2081,1637 4331,048
Adi Sumarmo 432,3694 592,892 441,1016 801,110
10896847260483624121
700000
600000
500000
400000
300000
200000
100000
0
-100000
-200000
Index
Alpha (level) 0.819951
Gamma (trend) 0.033697
Smoothing Constants
MAPE 13
MA D 16216
MSD 446922447
Acc uracy M easures
Actual
Fits
Forecasts
95.0% PI
Variable
(a)
Year
Month
201520142013
MayJanSepMayJanSep
250000
225000
200000
175000
150000
D a t a
Ak tual
Ramalan
Variable
(a)
10896847260483624121
100000
75000
50000
25000
0
-25000
-50000
Index
Alpha (level) 1.05659
Gamma (trend) 0.02266
Smoothing Constants
MAPE 13
MA D 1609
MSD 4331242
Accu racy Measures
Actual
Fits
Forecasts
95.0% PI
Variable
(b)
Year
Month
201520142013
MayJanSepMayJanSep
23000
22000
21000
20000
19000
18000
17000
16000
15000
14000
D a t a
Ak tual
Ramalan
Variable
(b)
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 16/24
16 Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project
Gambar 7. Plot Ramalan Data Training dan Testing Skenario 2 ES (a) Soekarno-Hatta; (b) Juanda; (c) Adi Sumarmo;
3.5. Time Series Regression
Salah satu komponen yang mempengaruhi data time series adalah komponen musiman. Gerakan mu-
siman merupakan gerakan yang teratur, yang berarti naik turun terjadi pada waktu yang sama. Jika datatime series dipengaruhi oleh variasi musiman, maka diperlukan metode peramalan yang memperhatikan
keterlibatan variasi musiman di dalam data.
Berdasarkan time series plot (Gambar 2. (a-2)) dapat dilihat bahwa pola data jumlah wisatawan man-
canegara melalui pintu Soekarno-Hatta menunjukkan fluktuasi musiman yang berubah dari waktu ke
waktu, tumbuh lebih besar dengan meningkatnya volume data karena tren linear jangka panjang, begitu
pula dengan pintu kedatangan Juanda (Gambar 2. (b-2)) Sementara itu untuk jumlah wisatawan mancane-
gara melalui pintu Adi Sumarmo (Gambar 2. (c-2)) hanya memiliki efek musiman pada pola datanya.
Sehingga pada pintu kedatangan Soekarno-Hatta dan Juanda akan dimodelkan menggunakan regresi time
series dengan pola gabungan tren dan seasonal, sementara itu untuk pintu kedatangan Adi Sumarmo akan
dimodelkan dengan regresi time series pola musiman menggunakan variabel dummy. Sama halnya den-
gan metode lain, pada metode ini terdapat 2 skenario yang berbeda, skenario 1 merupakan peramalan 12 periode ke depan dan skenario 2 merupakan peramalan 24 periode ke depan. Model peramalan jumlah
wisatawan pada setiap pintu kedatangan untuk 12 periode ke depan mengikuti persamaan.
Soekarno-Hatta_12
t t t t t t t t
t t t t t t t t
S S S S S S S S
S S S S Y Y Y t Y
,12,11,10,9,8,7,6,5
,4,3,2,1136*
2
134282133769124547117316128779144009140487132054
128044134692111451122365347,0306,0210,01697
++++++++
++++−−+= −−−
Ket *) Signifikan pada α: 10%
Juanda_12
t t t t t t t t
t t t t t t t t
S S S S S S S S
S S S S Y Y Y t Y
,12,11,10,9,8,7,6,5
,4,3,2,12191
1260214165112451173214376118281274313559
11942135631102010326228,0235,0305,0110
++++++++
++++−−+= −−−
Adi Sumarmo_12
t t t t t t
t t t t t t t t t
S S S S S S
S S S S S S Y Y Y
,12**
,11,10**
,9,8,7
**,6,5,4,3,2
**,1
**21
648260485173571583
24696341586041187042,0651,0
++++++
+++++++= −−
Ket: **) tidak signifikan pada α: 5% dan α: 10%
Pada model akhir yang didapatkan, residual data telah memenuhi asumsi White Noise, hal itu
terlihat dari lag pada plot ACF yang tidak keluar dari batas dan telah memenuhi asumsi berdistribusi
Normal. Namun residual pada model jumlah wisatawan yang masuk melalui pintu Juanda tidak memenu-
10896847260483624121
3500
3000
2500
2000
1500
1000
500
Index
Alpha 0.527454
Smoothing Constant
MAPE 25
MAD 341
MSD 194571
Accu racy Measures
Actual
Fits
Forecasts
95.0% PI
Variable
(c)
Year
Month
201520142013
MayJanSepMayJanSep
2000
1750
1500
1250
1000
750
500
D
a t a
Ak tual
Ramalan
Variable
(c)
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 17/24
Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project 17
hi asumsi normalitas. Sementara itu model akhir peramalan jumlah wisatawan melalui pintu kedatangan
Soekarno Hatta, Juanda, dan Adi Sumarmo untuk 24 periode ke depan adalah.
Soekarno-Hatta_24
t t t t t t t t
t t t t t t t t
S S S S S S S S
S S S S Y Y Y t Y
,12,11,10,9,8,7,6,5
,4,3,2,1136**
2
127764127147118994110416120646144049134156129660
122900129721107201115515290,0263,0161,01685
++++++++
++++−−+= −−−
Ket: **) tidak signifikan pada α: 5% dan α: 10%
Juanda_24
t t t t t t t t
t t t t t t t t
S S S S S S S S
S S S S Y Y Y t Y
,12,11,10,9,8,7,6,5
,4,3,2,1219*1
1360614836118881300115579133421408814514
12966144481197911524187,0269,023,0113
++++++++
++++−−+= −−−
Ket: *) signifikan pada α: 10%
Adi Sumarmo_24
t t t t t t
t t t t t t t t t
S S S S S S
S S S S S S Y Y Y
,12**
,11,10**
,9,8,7
**,6,5,4,3,2
**,1
**21
765299499134597629
335986474922442120064,0612,0
++++++
+++++++= −−
Ket: **) tidak signifikan pada α: 5% dan α: 10%Pada model akhir yang didapatkan untuk skenario 2, residual data telah memenuhi asumsi White
Noise, hal itu terlihat dari lag pada plot ACF yang tidak keluar dari batas dan telah memenuhi asumsi
berdistribusi Normal.
Gambar 8. Peramalan Skenario 1 dan 2; (a) Soekarno-Hatta; (b) Juanda; (c) Adi Sumarmo
Kriteria pemilihan model terbaik didasarkan pada nilai RMSE pada tiap-tiap model. Pada Tabel 6 ter-
lihat pula bahwa RMSE data testing lebih besar daripada data training maka dapat disimpulkan bahwa
model yang dihasilkan belum tepat dan kurang bagus untuk peramalan jumlah wisatawan mancanegara
yang datang melalui pintu Soekarno Hatta, Juanda, dan Adi Sumarmo.
Tabel 6. Performance Hasil Peramalan Jumlah Kedatangan Wisatawan Mancanegara dengan Regresi Time Series
Year
Month
201520142013
MayJanSepMayJanSep
250000
225000
200000
175000
150000
Aktual
Ramalan
Variable
(a)
Year
Month
201520142013
MayJanSepMayJanSep
23000
22000
21000
20000
19000
18000
17000
16000
15000
14000
Aktual
Ramalan
Variable
(b)
Year
Month
201520142013
MayJanSepMayJanSep
2000
1750
1500
1250
1000
750
500
Aktual
Ramalan
Variable
(c)
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
250000
225000
200000
175000
150000
Aktual
Ramalan
Variable
(a)
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
22000
21000
20000
19000
18000
17000
16000
15000
14000
Aktual
Ramalan
Variable
(b)
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
1400
1300
1200
1100
1000
900
800
700
600
500
Aktual
Ramalan
Variable
(c)
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 18/24
18 Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project
Skenario 1 Skenario 2
Training Testing Training Testing
Soekarno-Hatta 13139,355 117839,788 12834,611 29081,5496
Juanda 1184,22 2542,405 1116,18 2147,786
Adi Sumarmo 328,921 379,184 330,923 455,904
3.6. Decomposition Method
Prinsip dasar dari metode dekomposisi adalah memecah data deret waktu menjadi beberapa pola dan
mengidentifikasi masing-masing komponen tersebut secara terpisah. Pemisahan ini dilakukan untuk
membantu meningkatkan ketepatan peramalan dan membantu pemahaman atas perilaku deret waktu seca-
ra lebih baik. Berdasarkan time series plot (Gambar 2. (a-2)) dapat dilihat bahwa pola data jumlah wisa-
tawan mancanegara melalui pintu Soekarno-Hatta menunjukkan fluktuasi musiman yang berubah dari
waktu ke waktu, tumbuh lebih besar dengan meningkatnya volume data karena tren linear jangka panjang,
begitu pula dengan pintu kedatangan Juanda (Gambar 2. (b-2)) dan Adi Sumarmo (Gambar 2. (c-2)) yang
juga menunjukkan pola data trend seasonal. Sehingga untuk analisis dapat menggunakan metode decom-
posisi yang multiplikatif. Dalam tugas ini terdapat dua skenario yang digunakan, skenario 1 merupakan peramalan 12 periode ke depan dan skenario 2 merupakan peramalan 24 periode ke depan.
10896847260483624121
250000
200000
150000
100000
50000
Index
MAPE 8
MA D 11056
MSD 248189456
Acc uracy M easures
Actual
Fits
Trend
Forecasts
Variable
(a)
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
250000
225000
200000
175000
150000
D a t a
Ak tual
Ramalan
Variable
(a)
10896847260483624121
25000
20000
15000
10000
5000
Index
MAPE 10
MA D 1136
MSD 2711978
Accu racy Measures
Actual
Fits
Trend
Forecasts
Variable
(b)
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
23000
22000
21000
20000
19000
18000
17000
16000
15000
14000
D a t a
Ak tual
Ramalan
Variable
(b)
10896847260483624121
3500
3000
2500
2000
1500
1000
500
Index
MAPE 31
MAD 413
MSD 253939
Acc uracy M easures
Actual
Fits
Trend
Forecasts
Variable
(c)
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
1750
1500
1250
1000
750
500
D a t a
Ak tual
Ramalan
Variable
(c)
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 19/24
Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project 19
Gambar 9. Plot Ramalan Data Testing dan Training Skenario 1 Dekomposisi (a) Soekarno-Hatta; (b) Juanda; (c) Adi Sumarmo;
Kriteria pemilihan model terbaik didasarkan pada nilai RMSE pada tiap-tiap model. Pada Tabel 5 terlihat pula bahwa RMSE data testing lebih besar daripada data training maka dapat disimpulkan bahwa modelyang dihasilkan belum tepat dan kurang bagus. Secara visual plot hasil ramalan jumlah kedatangan wisa-tawan ke Indonesia melalui 3 pintu kedatangan dengan data aktual menggunakan metode dekomposisi
baik untuk skenario 1 (Gambar 9) maupun skenario 2 (Gambar 10) adalah.
Tabel 7. Performance Hasil Peramalan Jumlah Kedatangan Wisatawan Mancanegara dengan Decomposition
Skenario 1 Skenario 2
Training Testing Training Testing
Soekarno-Hatta 15754,02984 36191,75791 14579,05482 31858,21322
Juanda 1646,8083 3931,626 1612,8469 3289,114
Adi Sumarmo 503,9237 855,6492 507,9073 727,3729
Gambar 7. Plot Ramalan Data Testing dan Training Skenario 2 Dekomposisi (a) Soekarno-Hatta; (b) Juanda; (c) Adi Sumarmo;
10896847260483624121
250000
200000
150000
100000
50000
Index
MAPE 9
MA D 10855
MSD 212548839
Accur acy Measures
Actual
Fits
TrendForecasts
Variable
(a)
Year
Month
201520142013
MayJanSepMayJanSep
250000
225000
200000
175000
150000
D a t a
Aktual
Ramalan
Variable
(a)
10896847260483624121
25000
20000
15000
10000
5000
Index
MAPE 10MA D 1105
MSD 2601275
Accurac y Measures
Actual
Fits
Trend
Forecasts
Variable
(b)
Year
Month
201520142013
MayJanSepMayJanSep
23000
22000
21000
20000
19000
18000
17000
16000
15000
14000
D a t a
Aktual
Ramalan
Variable
(b)
10896847260483624121
3500
3000
2500
2000
1500
1000
500
Index
MAPE 31
MA D 413
MSD 257970
Accur acy Measures
Actual
Fits
Trend
Forecasts
Variable
(c)
Year
Month
201520142013
MayJanSepMayJanSep
2000
1750
1500
1250
1000
750
500
D a t a
Aktual
Ramalan
Variable
(c)
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 20/24
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 21/24
Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project 21
[ ]
[ ]1521
1521
3127,04703,09543,07794,0
3127,04703,09543,07794,0
)(31
1
−−−
−−−
−+−−−
−+−−−
+
−=
t t t
t t t
Y Y Y
Y Y Y ht
e
ea ,
[ ]
[ ]1521
1521
8569,05438,05044,03307,2
8569,05438,05044,03307,2
)(41
1
−−−
−−−
+−−−−
+−−−−
+
−=
t t t
t t t
Y Y Y
Y Y Y ht
e
ea
Juanda-12
eaaa y h
t ht
ht t +−−−=
)(3)(2)(1)( 6462,01761,02080,00421,0ˆ
dimana:[ ]
[ ]131
131
6895,07380,06344,2
6895,07380,06344,2
)(11
1
−−
−−
+−−
+−−
+
−=
t t
t t
Y Y
Y Y ht
e
ea ,
[ ]
[ ]131
131
2623,08549,00232,0
2623,08549,00232,0
)(21
1
−−
−−
−−−
−−−
+
−=
t t
t t
Y Y
Y Y ht
e
ea ,
[ ]
[ ]131
131
0906,18734,0067,2
0906,18734,0067,2
)(31
1
−−
−−
−−−−
−−−−
+
−=
t t
t t
Y Y
Y Y ht
e
ea ,
Adi Sumarmo-12
eaa y h
t ht t +−−−=
)(2)(1)( 0179,12964,00026,0ˆ
dimana:[ ]
[ ]61
61
5984,04828,07215,2
5984,04828,07215,2
)(11
1
−−
−−
−−−
−−−
+
−=
t t
t t
Y Y
Y Y ht
e
ea ,
[ ]
[ ]61
61
2193,02365,1693,0
2193,02365,1693,0
)(21
1
−−
−−
+−−−
+−−−
+
−=
t t
t t
Y Y
Y Y ht
e
ea
Sementara itu model peramalan jumlah wisatawan pada setiap pintu kedatangan untuk 24 periode ke de-
pan mengikuti persamaan.
Soekarno Hatta-24
ea y h
t t ++−=
)(1)( 1073,10578,0ˆ
dimana:[ ]
[ ]1521
1521
2713,06465,07230,00106,0
2713,06465,07230,00106,0
)(11
1
−−−
−−−
+++−
+++−
+
−=
t t t
t t t
Y Y Y
Y Y Y ht
e
ea ,
Juanda-24
ea y h
t t +−=)(1)( 1881,1078,0ˆ
dimana:[ ]
[ ]131
131
4088,08364,0074,0
4088,08364,0074,0
)(11
1
−−
−−
−−−
−−−
+
−=
t t
t t
Y Y
Y Y ht
e
ea
Adi Sumarmo-24
eaaaa y h
t ht
ht
ht t +−+++−=
)(4)(3)(2)(1)( 2126,07300,05556,01212,02268,0ˆ
dimana:[ ]
[ ]61
61
8394,06658,06816,2
8394,06658,06816,2
)(11
1
−−
−−
−+−−
−+−−
+
−=
t t
t t
Y Y
Y Y ht
e
ea ,
[ ]
[ ]61
61
1573,00689,16758,1
1573,00689,16758,1
)(21
1
−−
−−
−+−−
−+−−
+
−=
t t
t t
Y Y
Y Y ht
e
ea
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 22/24
22 Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project
[ ]
[ ]61
61
9494,05481,0133,1
9494,05481,0133,1
)(31
1
−−
−−
−+−
−+−
+
−=
t t
t t
Y Y
Y Y ht
e
ea ,
[ ]
[ ]61
61
8630,06879,06367,1
8630,06879,06367,1
)(41
1
−−
−−
−−−−
−−−−
+
−=
t t
t t
Y Y
Y Y ht
e
ea
Secara visual plot hasil ramalan jumlah kedatangan wisatawan ke Indonesia melalui 3 pintu kedatangan
dengan data aktual menggunakan model FFNN baik untuk skenario 1 maupun skenario 2 adalah
Gambar 2. Plot Ramalan dan Data Testing Skenario 1 model FFNN (a-1) Soekarno-Hatta; (b-1) Juanda; (c-1) Adi Sumarmo; serta
Plot Ramalan dan Data Testing Skenario 2 model FFNN (a-2) Soekarno-Hatta; (b-2) Juanda; (c-2) Adi Sumarmo
4. Kesimpulan dan rekomendasi
Pada kasus peramalan jumlah wisatawan mancanegara yang datang ke Indonesia melalui pintu Soe-
karno-Hatta dan Juanda, metode FFNN menghasilkan peramalan yang lebih baik daripada metode univa-
riat time series yang harus mengasumsikan stationer. Hasil ini ditunjukkan oleh nilai RMSE lebih kecil
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
250000
225000
200000
175000
150000
D a t a
Ak tual
Ramalan
Variable
(a-1)
Year
Month
201520142013
MayJanSepMayJanSep
250000
225000
200000
175000
150000
D a t a
Ak tual
Ramalan
Variable
(a-2)
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
19000
18000
17000
16000
15000
14000
D a t a
Ak tual
Ramalan
Variable
(b-1)
Year
Month
20152014
AugJulJunMay AprMarFebJanDecNovOctSep
1750
1500
1250
1000
750
500
D a t a
Ak tual
Ramalan
Variable
(c-1)
Year
Month
201520142013
MayJanSepMayJanSep
23000
22000
21000
20000
19000
18000
17000
16000
15000
14000
D a t a
Ak tual
Ramalan
Variable
(b-2)
Year
Month
201520142013
MayJanSepMayJanSep
2000
1750
1500
1250
1000
750
500
D a t a
Ak tual
Ramalan
Variable
(c-2)
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 23/24
Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project 23
dibandingkan metode lainnya baik digunakan pada peramalan 12 periode ke depan maupun 24 periode ke
depan. Namun pada pintu Soekarno Hatta nilai RMSE data testing masih lebih besar daripada data testing
mengindikasikan model yang dihasilkan masih belum sesuai. Model peramalan dengan metode FFNN
arsitektur MLP (3-4-1) pada Soekarno Hatta dengan menggunakan testing 12 serta MLP (3-1-1) dengan
menggunakan testing 24. Sedangkan model peramalan dengan metode FFNN arsitektur MLP (2-3-1) pada
Juanda dengan menggunakan testing 12 serta MLP (2-1-1) dengan menggunakan testing 24 sebagai beri-kut.
Soekarno Hatta-12
eaaaa y h
t ht
ht
ht t ++−−−−=
)(4)(3)(2)(1)( 5681,03163,07643,00802,14584,0ˆ
dimana:[ ]
[ ]1521
1521
1179,03339,00345,11841,2
1179,03339,00345,11841,2
)(11
1
−−−
−−−
−−+−−
−−+−−
+
−=
t t t
t t t
Y Y Y
Y Y Y ht
e
ea ,
[ ]
[ ]1521
1521
5716,06150,07834,05408,0
5716,06150,07834,05408,0
)(21
1
−−−
−−−
−−−−
−−−−
+
−=
t t t
t t t
Y Y Y
Y Y Y ht
e
ea ,
[ ]
[ ]1521
1521
3127,04703,09543,07794,0
3127,04703,09543,07794,0
)(31
1
−−−
−−−
−+−−−
−+−−−
+
−=
t t t
t t t
Y Y Y
Y Y Y ht
e
ea ,
[ ]
[ ]1521
1521
8569,05438,05044,03307,2
8569,05438,05044,03307,2
)(41
1
−−−
−−−
+−−−−
+−−−−
+
−=
t t t
t t t
Y Y Y
Y Y Y ht
e
ea
Juanda-12
eaaa y h
t ht
ht t +−−−=
)(3)(2)(1)( 6462,01761,02080,00421,0ˆ
dimana:[ ]
[ ]131
131
6895,07380,06344,2
6895,07380,06344,2
)(1 1
1
−−
−−
+−−
+−−
+
−
= t t
t t
Y Y
Y Y h
t e
e
a ,
[ ]
[ ]131
131
2623,08549,00232,0
2623,08549,00232,0
)(2 1
1
−−
−−
−−−
−−−
+
−
= t t
t t
Y Y
Y Y h
t e
e
a ,
[ ]
[ ]131
131
0906,18734,0067,2
0906,18734,0067,2
)(31
1
−−
−−
−−−−
−−−−
+
−=
t t
t t
Y Y
Y Y ht
e
ea ,
Soekarno Hatta-24
ea y h
t t ++−=)(1)( 1073,10578,0ˆ
dimana:[ ]
[ ]1521
1521
2713,06465,07230,00106,0
2713,06465,07230,00106,0
)(11
1
−−−
−−−
+++−
+++−
+
−=
t t t
t t t
Y Y Y
Y Y Y ht
e
ea ,
Juanda-24
ea y h
t t +−=)(1)( 1881,1078,0ˆ
dimana:[ ]
[ ]131
131
4088,08364,0074,0
4088,08364,0074,0
)(11
1
−−
−−
−−−
−−−
+
−=
t t
t t
Y Y
Y Y ht
e
ea
7/21/2019 Univariate Time Series dan NN
http://slidepdf.com/reader/full/univariate-time-series-dan-nn 24/24
24 Sulistya Ummie & Farisca Susiani / Data Analysis – 3rd Project
Sementara itu untuk peramalan jumlah wisatawan mancanegara yang datang ke Indonesia melalui pin-
tu Adi Sumarmo, naïve model menghasilkan peramalan yang lebih baik. Hal ini menunjukkan bahwa
metode kompleks tidak selalu menghasilkan peramalan yang lebih baik dibandingkan dengan metode
yang jauh lebih sederhana. Untuk selanjutnya diharapkan dapat dilakukan penanganan terhadap data out-
lier seperti pada pintu Juanda dan jika terdapat data yang tidak memenuhi asumsi white noise dan norma-litas residual agar pembandingan yang dilakukan lebih akurat. Serta tidak lupa untuk meramal dengan
menggunakan jumlah data yang lebih banyak.
Pernyataan
Penulis berterimakasih kepada Pak Suhartono dan Pak Dedy selaku dosen mata kuliah Analisis Data
yang senantiasa memberikan pengajaran dan bimbingan serta materi kepada kami hingga terselesaikannya
tugas ini. Tidak lupa kami juga mengucapkan terimakasih kepada Badan Pusat Statistika yang telah me-
nyediakan data jumlah wisatawan mancanegara yang datang ke Indonesia melalui pintu Soekarno-Hatta,
Juanda, dan Adi Sumamrmo.
References
[1] Association FME-CWM. Market Analysis Airport Sector Indonesia July 2012 2 nd Publicatiob.Neetherland: FME_CWM TM ;
2012.
[2] Badan Pusat Statistika. Jumlah Wisatawan Mancanegara. Diakses tanggal 19 Desember dari URL: https://www.bps.go.id;
2015.
[3] Wei, WWS. Time Series Analysis Univariate and Multivariate Methods, SecondEdition. Pearson Education, Inc. United
States of America: 2006.
[4] Cengage Learning. Time Series Analysis and Forecasting Ch 15 . Cengage LearningTM; 2012.
[5] Fausett, L. Fundamentals of Neural Network, Architecture, Algoritm and Aplication, Printice-Hall, Inc, London; 1994.