MODUL KULIAH
COMPUTER FOR STATISTIC SYSTEMS
- Statistic for Computer 1 (2 SKS)
- Statistic for Computer 2 (Probability) (2 SKS)
Oleh:
GICI BUSINESS SCHOOL BATAM
GICI Business SchoolComp.Batu Batam MasBlock. D & E No. 1, 2, & 3Batu Batam – Batam Island (29421)Telp. 0778-431 318Fax. 0778-431 290
GICI Business School – Sukses BersamaComp. Batu Aji Centre Park(Simpang Base Camp)Block. G RT.08/RW.01. Kel. SagulungBatu Aji – Batam Island (29432)Telp. 0778-391 333Fax. 0778-394 641
Computer for Statistic Systems
DAFTAR ISI
BAB I.......................................................................................................1PENDAHULUAN.......................................................................................11.1 Peranan Statistika Dalam Ilmu Ekonomi.......................................11.2 Definisi dan Klasifikasi Statistika..................................................3BAB II......................................................................................................8PENGORGANISASIAN DATA....................................................................82.1 Data..............................................................................................82.2 Penyajian Data............................................................................152.3 Ukuran Pemusatan......................................................................232.4 Ukuran Variasi............................................................................28BAB III...................................................................................................37PELUANG..............................................................................................373.1 Perumusan Peluang....................................................................373.2 Variabel Acak dan Nilai Harapan.................................................43BAB IV..................................................................................................59ANGKA INDEKS.....................................................................................594.1 Angka Indeks Relatif...................................................................594.2 Angka Indeks Agregatif...............................................................604.3 Indeks Agregat Berbobot............................................................614.4 Indeks Berantai...........................................................................644.5 Upah Nyata.................................................................................654.6 Indeks Produktifitas....................................................................66BAB V..................................................................................................68ANALISA REGRESI – KORELASI..............................................................685.1 Hubungan Garis Lurus dua Variabel...........................................685.2 Diagram Pencar..........................................................................685.3 Model Regresi Linier Sederhana.................................................695.4 Analisis Keeratan Hubungan.......................................................71DAFTAR PUSTAKA.................................................................................74
- ii -
Computer for Statistic Systems
BAB I.
PENDAHULUAN
1.1 Peranan Statistika Dalam Ilmu Ekonomi
Untuk mengetahui alasan dibutuhkannya statistika di bidang ekonomi, kami akan
memberikan gambaran yang berkaitan dengan pertanyaan, dapatkah statistika
menjawab berbagai persoalan yang menyangkut fungsi manajemen seperti :
1. Soal memproduksi sejumlah produk tertentu sesuai dengan rencana bidang
pemasaran sebagai langkah awal untuk mengenalkannya di pasar.
2. Bila jumlah dana untuk produksi terbatas, produk mana yang akan diproduksi
terlebih dahulu seandainya ada 2 atau 3 macam produk yang sama
pentingnya.
3. Mengambil keputusan dalam system kerja yang akan memberi hasil lebih
efisien.
4. Mengetahui berbagai variable yang terkait dengan kuantitas permintaan
suatu produk.
Dari situ akan ditunjukkan pentingnya peran statistika, yaitu :
Pertanyaan Pertama berkaitan dengan departemen pemasaran suatu perusahaan.
Agar suatu produk berhasil di pasar, perusahaan pada umumnya akan menerapkan
strategi yang berorientasi pada konsumen. Karena itu perlu dilakukan survey pasar
untuk mengetahui selera konsumen dan besarnya kebutuhan pasar. Informasi yang
diharapkan dapat diperoleh dalam bentuk data kualitatif maupun kuantitatif. Untuk
mengetahui selera pasar secara lengkap, seharusnya digali informasi dari populasi
sasaran (bila diperlukan dapat dilakukan segmentasi kalau tujuan perusahaan hanya
pada segmen pasar tertentu).
Penggalian informasi dari populasi sasaran membawa konsekuensi pada biaya,
waktu, dan tenaga yang tersedia. Mengingat waktu, biaya dan tenaga departemen
departemen pemasaran terbatas, maka perlu dipertimbangkan sample yang
representative. Dengan demikian pengambilan sebagian anggota populasi
bersangkutan sudah memberikan informasi yang mewakili keseluruhan anggota
- 1 -
Computer for Statistic Systems
populasi sasaran. Kebutuhan tersebut dapat dijawab oleh statistika karena tersedia
cara pengumpulan data dengan menggunakan metode pengambilan sample.
Untuk menjawab pertanyaan kedua tentang prioritas pembuatan produk, dapat
diperhitungkan analisis untung rugi dari produk-produk tersebut (setelah
memeprtimbangkan kendala factor produksi, harga jual produk, biaya pembuatan,
dan lain-lain), kemudian dilakukan analisa ragam ANOVA secara statistika. Dari sini
dapat ditentukan produk mana yang dapat diproduksi dan mana yang tidak.
Untuk menjawab pertanyaan ketiga, dapat dilakukan percobaan pendahuluan. Dari
hasil yang diperoleh, dilakukan pengujian rata-rata nilai dua populasi (bila digunakan
dua system kerja) atau analisis ragam (bila ingin diketahui efisiensi kerja beberapa
system kerja sekaligus).
Analisis regresi berganda dapat dimanfaatkan untuk menjawab pertanyaan keempat.
Berdasarkan bentuk hubungan yang diperoleh, dapat diketahui variable apa saja
yang berpengaruh nyata terhadap kuantitas permintaan akan suatu produk.
Disamping itu dapat juga diperkirakan besarnya pengaruh varibel tertentu sepanjang
asumsi yang disyaratkan dapat dipenuhi.
Selain menjawab kebutuhan di atas, statistika juga akan sangat membantu bidang
ekonomi dan bisnis dalam berbagai hal seperti :
Di bidang produksi untuk penetapan standar kualitas, pengawasan terhadap
efisiensi kerja, uji metode/produk baru dan lain-lain
Di bidang akuntansi untuk penyesuaian yang berhubungan dengan harga,
hubungan antara biaya dan volume produksi, dan lain-lain.
Di bidang pemasaran untuk penyelidikan terhadap preferensi konsumen,
penaksiran potensi pasar bagi produk baru, penetapan harga, penetapan
efektivitas iklan, mengetahui efektivitas segmentasi, menaksir permintaan
pasar terhadap produk yang dihasilkan perusahaan pada waktu tertentu dan
lain-lain.
Bagi manajemen dalam merumuskan kebijakan perusahaan, membantu
menentukan hubungan sebab akibat antara berbagai hal, dan mempermudah
pemahaman terhadap masalah yang dihadapi.
1.2 Definisi dan Klasifikasi Statistika
- 2 -
Computer for Statistic Systems
1.2.1 Definisi Statistika
Walaupun terdapat banyak interpretasi terhadap statistika, secara umum
statistika adalah suatu metode yang digunakan dalam pengumpulan dan analisis
data sehingga dapat diperoleh informasi yang berguna. Statistika menyediakan
prinsip dan metodologi untuk merancang proses pengumpulan data, meringkas dan
menyajikan data yang diperoleh, melakukan interpretasi serta menganalisis dan
mengambil kesimpulan atau generalisasi. Meskipun lingkup pemakaiannya sangat
luas, pada dasarnya kebutuhan akan statistika berawal dari adanya variasi data yang
diperoleh dari hasil observasi. Pada umumnya, data hasil pengamatan bervariasi
karena di alam tidak ada dua individu yang 100% homogen (persis sama) dan karena
adanya kesalahan pengukuran. Selama kedua hal tersebut masih ada, metode
statistika diperlukan sebagai alat bantu untuk mengatasi ketidakpastian dalam
pengambilan keputusan. Di samping itu satatistika seringkali dikaitkan dengan
keterbatasan biaya, waktu dan tenaga yang tersedia. Mengamati seluruh objek yang
terkait sering tidak mungkin, sehingga perlu dilakukan pendugaan karakteristiknya
atas sebagian objek tersebut. Dalam rangka pendugaan inilah timbul masalah yang
pemecahannya memerlukan statistika.
1.2.2. Klasifikasi Statistika
Statistika biasanya dipelajari dari sudut teori dan metodenya. Landasan
teoritis yang mendasari ilmunya dipelajari pada teori statistika, sedangkan prosedur
yang sistematis dalam penggunaannya disebut.
Berdasarkan aktivitas yang dilakukan, dikenal adanya statistika deskriptif dan
statistika inferensia, sedangkan berdasarkan metodenya dikenal statistika
parametric dan statistika non parametric.
A. Statistika Deskriptif
Statistika Deskriptif membahas cara-cara pengumpulan data, penyederhanaan
angka-angka pengamatan yang diperoleh (meringkas dan menyajikan), serta
melakukan pengukuran pemusatan dan penyebaran untuk memperoleh informasi
yang lebih menarik, berguna, dan lebih mudah dipahami.
Dengan statistika deskriptif, kumpulan data yang diperoleh akan tersaji dengan
ringkas dan rapi serta dapat memberikan informasi inti dari kumpulan data yang ada.
Informasi yang diperoleh dengan statistika deskriptif ini antara lain pemusatan data,
penyebaran data, serta kecenderungan suatu gugus data.
- 3 -
Computer for Statistic Systems
Penyajian data pada statistika deskriptif biasanya dilakukan dengan membuat
tabulasi penyajian dalam bentuk grafik, diagram, atau dengan menyajikan
karakteristik-karakteristik dari ukuran pemusatan dan keragamannya.
Contoh Aplikasi : Permintaan produk susu “LEZAT” pada tahun 1997 sebesar 50.000
ton, pada tahun 1998 sebesar 70.000 ton dan pada tahun 1999 sebesar 80.000 ton.
Data tersebut akan lebih informatif bila disajikan dalam bentuk tabel dan grafik
seperti tampak dibawah ini. Cara ini memudahkan kita dalam memahami perilaku
data, misalnya adanya kecenderungan kenaikan produksi dari tahun ke tahun.
Tabel : Permintaan susu “LEZAT” tahun 1997 - 1999
Tahun
Jumlah
Produk
si (ribu
ton)
1997 50
1998 70
1999 80
Grafik : Perkembangan Permintaan susu “LEZAT” tahun 1997 - 1999
0
10
20
30
40
50
60
70
80
90
1997 1998 1999
Tahun
Pro
du
ksi (
rib
u t
on
)
B. Statistika Inferensia
- 4 -
Computer for Statistic Systems
Statsitika Inferensia membahas cara menganalisis data serta mengambil
kesimpulan (yang pada dasarnya berkaitan dengan estimasi parameter dan
pengujian hipotesis). Metode statistika inferensia adalah metode yang berkaitan
dengan analisis sebagian data sampai ke peramalan atau penarikan kesimpulan
mengenai keseluruhan data. Sebagian data yang terkait dengan suatu variable
dikenal sebagai sample, sedangkan keseluruhan datanya adalah populasi.
Dalam statistika inferensia diadakan pendugaan parameter, membuat hipotesis,
serta menguji hipotesis tersebut sampai pada pembuatan kesimpulan yang berlaku
umum. Metode ini sering disebut juga statistika induktif, karena kesimpulan yang
ditarik didasarkan pada informasi dari sebagian data saja. Untuk keperluan yang
lebih luas tentu ada kemungkinan terjadinya kesalahan.
C. Statistika Parametrik
Statistika paramterik merupakan bagian statistika inferensia yang
mempertimbangkan nilai dari satu atau lebih parameter populasi. Sehubungan
dengan kebutuhan inferensianya, pada umumnya statistika parametric
membutuhkan data yang berskala pengukuran minimal interval. Selain itu,
penurunan prosedur dan penetapan teorinya berpijak pada asumsi spesifik mengenai
bentuk distribusi populasi yang biasanya diasumsikan normal.
D. Statistika Nonparametrik
Statistika Nonparametrik merupakan bagian dari statistika inferensia yang tidak
memperhatikan nilai dari satu atau lebih parameter populasi. Pada umumnya
validitas pada model peluang yang spesifik di populasi. Statistika non parametric
menyediakan metode statistika untuk menganalisa data yang distribusinya tidak
dapat diasumsikan normal. Dalam statistika nonparametric, data yang dibutuhkan
lebih banyak berskala ukur nominal atau ordinal.
1.2.3. Populasi dan Sampel
Dalam percakapan sehari-hari, kata populasi dapat diartikan sebagai
kelompok orang atau penduduk yang menempati suatu wilayah tertentu, misalnya
populasi Jakarta. Namun dalam statistika, kata populasi merujuk pada sekumpulan
individu dengan karakteristik khas yang menjadi perhatian dalam suatu penelitian
(pengamatan). Dengan demikian kata populasi dalam statistika mempunyai arti yang
lebih luas, yaitu tidak terbatas pada sekelompok orang tetapi juga binatang dan
benda apa saja yang menjadi perhatian kita. Sebagai gambaran dari populasi adalah
- 5 -
Computer for Statistic Systems
populasi bank swasta di Indonesia. Masing-masing individu dalam populasi seperti
orang, tanaman, rumah, bank, dan sebagainya disebut elemen populasi.
Elemen paling dasar dalam penelitian adalah sebuah data tunggal (datum), yaitu
observasi. Observasi bisa memberikan hasil berupa ukuran fisik (lebar dan luas),
jawaban pertanyaan (ya atau tidak), atau klasifikasi (cacat atau tidak). Himpunan
yang mewakili semua kemungkinan pengukuran yang perlu diperhatikan dalam
observasi itulah yang disebut Populasi. Banyaknya pengamatan atau anggota suatu
populasi disebut ukuran populasi. Ukuran populasi ini dapat dibedakan antara
populasi terbatas dan tidak terbatas. Contoh populasi terbatas adalah populasi
Mahasiswa GICI, sedangkan contoh populasi yang tidak terbatas adalah populasi
tanaman penganggu di seluruh dunia.
Informasi tentang populasi ini sangat diperlukan untuk menarik kesimpulan. Bila kita
bisa mengobservasi keseluruhan individu anggota populasi, kita akan mendapatkan
besaran yang menyatakan karakteristik populasi yang sebenarnya; dalam statistika
disebut parameter. Dengan demikian parameter adalah suatu nilai yang
menggambarkan ciri/karakteristik populasi. Parameter merupakan suatu nilai yang
stabil karena diperoleh dari observasi terhadap seluruh anggota populasi, dan
biasanya dilambangkan dengan huruf-huruf Yunani. Sebagai contoh, rata-rata
populasi biasa dilambangkan dengan µ (myu). Jika kita mengamati semua unsur
populasi, berarti kta melakukan sensus.
Dalam situasi tertentu, kita sering mengalami kesulitan untuk memperoleh informasi
dari seluruh elemen populasi karena keterbatasan biaya, waktu, dan tenaga. Sebagai
contoh, dalam usaha menentukan rata-rata daya tahan lampu pijar jenis tertentu
yang dihasilkan suatu perusahaan, adalah tidak mungkin untuk mencoba terlebih
dulu semua lampu pijar yang akan dipasarkan. Dengan demikian, terpaksa hanya
diambil sebagian dari populasi lampu pijar yang dihasilkan untuk membantu menarik
kesimpulan tentang daya tahannya. Sebagian anggota populasi yang diambil
menurut prosedur tertentu sehingga dapat mewakili populasinya itulah disebut
sampel. Penggunaan prosedur tertentu dalam pengambilan sampel didasarkan atas
pertimbangan :
Untuk memperoleh data yang relevan dengan tujuan observasi
Sejumlah variasi tidak terhindarkan meskipun observasi dilakukan pada
kondisi yang mirip ataupun sama. Variasi yang timbul ini disebabkan
perbedaan besarnya nilai karakteristik individu yang diukur itu, juga karena
adanya kesalahan dalam melakukan pengukuran. Selain itu perlu diketahui
- 6 -
Computer for Statistic Systems
bahwa umumnya data hasil pengamatan bervariasi karena di alam tidak ada
dua individu yang 100% homogen.
Banyaknya anggota suatu sampel disebut ukuran sampel, sedangkan suatu nilai
yang menggambarkan ciri sampel disebut statistik (bedakan dengan statistika).
Karena statistik diperoleh dari sampel, maka nilai yang diperoleh dapat berubah.
Dengan demikian, variasi atau perubahan adalah ciri statistic. Meskipun demikian,
bila prosedur pengambilan sample yang digunakan benar, statistic diharapkan bisa
menjadi penduga parameter yang baik. Sebagai penduga parameter, ada dua
kemungkinan dalam nilai statistic yang diperoleh, yaitu persis sama dengan nilai
parameternya atau tidak sama (lebih besar atau lebih kecil). Sehubungan dengan itu,
statistika juga dikenal sebagai ilmu yang antara lain mempelajari cara-cara
menentukan suatu penduga (statistic) bagi suatu parameter, serta kemudian
bertugas mengambil kesimpulan mengenai nilai parameter tersebut berdasarkan
nilai penduga yang didapat.
Dari ulasan ringkas diatas, populasi adalah keseluruhan unit atau individu dalam
ruang lingkup yang ingin diteliti. Populasi dibedakan atas populasi sasaran (target
population) dan populasi sample (sampling population). Populasi sasaran adalah
keseluruhan individu dalam areal/wilayah/lokasi yang sesuai dengan tujuan
penelitian. Populasi sample adalah keseluruhan individu yang akan menjadi unit
analisis dan merupakan populasi yang layak serta sesuai dengan kerangka
sampelnya untuk dijadikan atau ditarik sebagai sample penelitian. Adapun kerangka
sample adalah seluruh daftar individu yang ada dalam populasi dan akan diambil
samplenya untuk menjadi unit analisis.
Contoh aplikasi :
Suatu penelitian bertujuan untuk menduga tingkat pendapatan pengusaha tembakau
di DKI Jakarta. Populasi sasarannya adalah semua pengusaha di DKI Jakarta. Jika ia
bukan pengusaha, meskipun tinggal di DKI Jakarta, ataupun seorang pengusaha yang
tinggal di DKI Jakarta tetapi bukan menangani komoditas tembakau, maka ia tidak
termasuk sebagai anggota populasi sasaran. Sehingga hanya pengusaha tembakau
saja yang menjadi populasi sampelnya. Daftar dari semua pengusaha di DKI yang
menangani tembakau itulah yang disebut kerangka sample.
- 7 -
Computer for Statistic Systems
BAB II.
PENGORGANISASIAN DATA
2.1 Data
Data merupakan sejumlah informasi yang dapat memberikan informasi
gambaran tentang suatu keadaan. Pada umumnya informasi ini diperoleh melalui
observasi (pengamatan) yang dilakukan terhadap sekumpulan individu (orang,
barang, jasa, dan sebagainya). Informasi yang diperoleh memberikan keterangan,
gambaran, atau fakta mengenai suatu persoalan dalam bentuk kategori, huruf, atau
bilangan. Fakta menjadikan suatu penelitian memberikan hasil yang sesuai harapan
bila ditunjang dengan data yang refresentatif. Data sangant berguna sebagai dasar
pembuatan keputusan, terutama pada kondisi ketidakpastian. Pada umumnya
kualitas keputusan yang dibuat bergantung pada kualitas data sebagai input maupun
proses pengolahan datanya untuk mendukung keputusan.
Data merupakan bentuk jamak dari datum yang merupakan informasi yang diperoleh
dari satu satuan amatan. Dengan demikian, bila kita bicara mengenai tinggi badan
Agnes adalah 165 cm, berarti kita berhadapan dengan datum. Sedangkan informasi
tinggi badan para staf personalia PT. YOGI, menghadapkan kita pada data. Data yang
diperoleh dapat memberikan informasi yang berguna bila diproses secara sistematis.
Dari data yang diperoleh, selain informasi yang diharapkan, juga dimungkinkan untuk
menghasilkan informasi yang saling terkait dengan melakukan konversi tertentu.
Sebagai ilustrasi, dari data jumlah jam kerja karyawan dapat diperoleh tentang
informasi tentang biaya tenaga kerja per jam. Bila data biaya tenaga kerja per jam ini
dijumlahkan, akan diperoleh informasi tentang total biaya karyawan harian, dan
seterusnya. Rangkaian informasi tersebut tentu saja merupakan masukan yang
sangat berharga bagi manajemen, misalnya untuk melihat kontribusi biaya yang
dikeluarkan untuk tenaga kerja harian terhadap keseluruhan biaya operasional
perusahaan.
2.1.1 VARIABEL
Dalam melakukan observasi, perlu ditentukan karakter yang akan diobservasi
dari unit amatan yang disebut variabel. Variabel dalam penelitian merupakan atribut
dari sekelompok objek yang diteliti dengan variasi dari masing-masing objeknya.
- 8 -
Computer for Statistic Systems
Sebagai contoh, tinggi dan berat badan merupakan atribut seseorang yang
merupakan objek penelitian. Berat dan tinggi badan orang tentu bervariasi. Bisa jadi
dua orang atau lebih memiliki tinggi badan yang sama, tetapi berat badannya
berbeda dan sebaliknya.
Contoh variabel :
Pada perusahaan : upah pegawai, lama bekerja, dan lain-lain
Pada tanaman : tinggi tanaman, panjang daun, dan lain-lain
Berdasarkan bulat atau tidaknya niali yang diperoleh, variable dapat dibedakan
menjadi variable kontinu dan variable diskret. Variabel kontinu adalah variable yang
besarnya dapat menempati semua nilai yang ada diantara dua titik. Pada umunya
variable kontinu diperoleh dari hasil pengukuran. Sebagai contoh akumulasi bunga
tabungan Kuniawan di bank BCA tahun 1998 adalah Rp. 5.000.025,45, keuntungan
perusahaan Gidion tahun 1997 Rp. 25.300.765,85 dan sebagainya. Pada variable
kontinu dapat dijumpai nilai-nilai pecahan ataupun nilai-nilai bulat. Sedangkan
variable diskret merupakan variable yang besarannya tidak menempati semua nilai.
Nilai variable diskret selalu berupa bilangan bulat. Pada umumnya variable diskret
diperoleh melalui pencacahan. Sebagai contoh dari variable diskret adalah jumlah
bank yang ada di kota Jakarta tahun 1997, jumlah tanaman cengkeh yang terkena
serangan penyakit di Bogor pada suatu waktu dan sebagainya.
Dalam melakukan observasi, pengamatan terhadap variable-variabel dibedakan
menjadi pengamatan utama dan pengamatan selintas. Pengamatan utama dilakukan
pada variabel yang datanya tidak dimaksudkan untuk dianalisis, sedangkan
pengamatan selintas dilakukan pada variabel yang datanya tidak untuk dianalisis.
Berikut akan diberikan contoh mengenai peranan dari pengamatan utama dan
pengamatan selintas.
Terhadap para pengusaha kecil yang kekurangan modal diberikan kredit produksi.
Sebagai pengamatan utama ingin dicatat peningkatan produksi dibanding sebelum
mendapatkan kredit. Sebagai pengamatan selintas dicatat perubahan pola konsumsi
keluarga mereka. Dari hasil observasi dan analisis diketahui bahwa kredit yang
diberikan tidak berpengaruh nyata terhadap peningkatan produksi. Dan dari hasil
pengamatan terhadap pola perubahan konsumsi dapat diketahui bahwa ternyata
terjadi peningkatan konsumsi keluarga. Dari sini kemungkinan dapat dijelaskan
bahwa tidak nyatanya pengaruh pemebrian kredit adalah karena tidak difungsikan
sebagaimana mestinya sebagai tambahan modal, melainkan sebagian juga dipakai
untuk keperluan konsumsi.
- 9 -
Computer for Statistic Systems
Dalam hubungan antar variabel, dikenal adanya bermacam-macam variabel sebagai
berikut :
Variabel independen, yaitu varibel yang menjadi sebab terjadinya
(terpengaruhnya) varibel dependen
Variabel dependen, yaitu variable yang nilainya dipengaruhi oleh varibel
dependen
Variabel moderator, yaitu varibel yang memperkuat atau memperlemah
hubungan antara varibel dependen dan independent
Variabel intervening, seprti varibel moderator, tetapi nilainya tidak dapat
diukur secara pasti, seperti kecewa, gembira, sakit hati, dan sebagainya.
Contoh Aplikasi :
Pimpinan suatu perusahaan ingi merekrut seorang manajer madya yang handal
dibidangnya. Untuk keperluan tersebut, yang bersangkutan mencoba mengumpulkan
informasi pendapatan manajer madya dengan kualifikasi yang diinginkan di DKI
Jakarta dalam rangka memperoleh gambaran tentang rata-rata gaji yang berlaku
dewasa ini. Dari informasi yang diperoleh pimpinan perusahaan ingin membuat
perkiraan tingkat gaji yang akan ditawarkan kepada calon yang direkrut. Hasil
observasinya terhadap 20 manajer madya di DKI Jakarta pada tahun 1998 terteral di
table. Variabel yang menjadi perhatian adalah pendapatan per bulan dari manajer
madya di Jakarta.
Tabel : Data Pendapatan 20 Manajer Madya di DKI Jakarta tahun 1998 (dalam $)
No Nama Pendapata
n
No Nama Pendapata
n
1
2
3
4
5
6
7
8
9
10
Siagian
Husein
Ellen
Christin
Huse
Yani
Nunung
Gidion
Endang
Fuad
4300
3120
5530
4000
2010
1600
3190
8230
1020
4280
11
12
13
14
15
16
17
18
19
20
Deny
Sutrisno
Lina
Budi
Rudolf
Fongna
Inge
Yosafat
Suyanto
Mega
3490
4390
3490
3950
1390
8990
1270
9560
5240
4580
Data merupakan komponen utama dalam statistika. Akurasi dan presisi suatu data
akan sangat menentukan dalam menghasilkan ketapatan pengambilan keputusan.
- 10 -
Computer for Statistic Systems
Untuk itu data harus sesuai dengan kenyataan yang sebenarnya (akurasi tinggi),
harus bisa mewakili parameter yang diukur dengan variasi yang kecil (presisinya
tinggi), harus relevan untuk menjawab suatu persoalan yang menjadi pokok bahasan
dan harus tepat waktu.
2.1.2. Metode Pengumpulan Data
Metode pengumpulan data menunjukkan cara-cara yang dapat ditempuh
untuk memperoleh data yang dibutuhkan. Dikenal metode pengumpulan data primer
dan metode pengumpulan data sekunder.
Data Primer merupakan data yang didapat dari sumber pertama, dari individu
seperti hasil wawancara atau hasil pengisian kuesioner yang biasa dilakukan peneliti.
Misalnya produsen suatu produk kosmetik ingin mengetahui perilaku konsumen
terhadap produk yang dihasilkannya. Diadakanlah wawancara terhadap para
konsumen untuk mengumpulkan informasi yang diharapkan. Dalam metode
pengumpulan data primer, peneliti/observer melakukan sendiri observasi di lapangan
maupun di laboratorium. Pelaksanaannya dapat berupa survai atau percobaan
(experiment). Cara survai dilakukan bila data yang dicari sebenarnya sudah ada
dilapangan atau di sasaran penelitian lainnya. Misalnya jenis kelamin, umur, tingkat
pendidikan, dan jenis pekerjaan seseorang. Tugas observer adalah menentukan
bentuk data yang akan diukur, karakteristik yang akan diteliti, dan melakukan
pengukuran serta pengumpulan data yang bisa dilakukan misalnya dengan
wawancara terhadap responden, mengirimkan daftar pertanyaan (kuesioner) melalui
pos, menggunakan telepon (pooling), ataupun observasi langsung. Cara percobaan
(experiment) dilakukan jika data yang ingin diperoleh belum tersedia sehingga
variable yang akan diukur harus dibangkitkan datanya melalui percobaan. Misal data
respon berat badan terhadap peningkatan produktivitas kerja. Observasi terhadap
data baru bisa dijalankan setelah dilakukan percobaan tersebut.
Data Sekunder merupakan data primer yang diperoleh oleh pihak lain atau data
primer yang telah diolah lebih lanjut dan disajikan oleh pengumpulan data primer
atau oleh pihak lain, pada umumnya disajikan dalam bentuk table atau diagram.
Data sekunder biasanya digunakan peneliti untuk memberikan gambaran tambahan,
gambaran pelengkap, ataupun untuk diproses lebih lanjut. Sebagai contoh, banyak
informasi tentang manajer poetnsial yang diperoleh suatu perusahaan dari terbitan
yang dikeluarkan oleh suatu badan riset swasta. Dalam metode pengumpulan data
sekunder, observer tidak meneliti langsung. Datanya didapatkan dari hasil penelitian
observer lain atau dari beberapa sumber seperti BPS, mass media, lembaga
pemerintah atau swasta dan lain sebagainya. Yang harus menjadi perhatian dalam
- 11 -
Computer for Statistic Systems
penggunaan data sekunder adalah sumber data, batasan konsep yang digunakan,
serta tingkat ketelitian dalam pengumpulan data. Dengan begitu, bila diperoleh hasil
yang janggal akan dapat diketahui penyebabnya dan bila memungkinkan dapat
dilakukan pengecekan terhadap data tersebut.
2.1.3 Jenis Data
Disamping pembedaan atas dasar cara perolehannya, data dapat diklasifikasikan
menurut jenisnya berdasarkan kriteria berikut :
Data Kualitatif dan Kuantitatif
Data kualitatif adalah data yang sifatnya hanya menggolongkan saja. Termasuk
dalam klasifikasi ini adalah data yang berskala ukur nominal dan ordinal. Sebagai
contoh data kualitatif adalah jenis pekerjaan seseorang (supir, bisnismen, guru, dan
lain-lain), motivasi karyawan (bagus, jelek, sedang) dan jabatan di perusahaan
(supervisor, manajer pemasaran, dan lain-lain).
Data kuantitatif adalah data yang berskala ukur interval dan rasio. Sebagai contoh
dari data kuantitatif adalah keuntungan perusahaan Golden pada tahun 1997 (Rp. 5
Milyar), kenaikan penjualan perusahaan GM (35%) dan sebagainya.
Data Internal dan Eksternal
Data internal merupakan data yang didapat dari dalam perusahaan atau organisasi
yang melakukan riset. Data ini menggambarkan keadaan dalam organisasi tersebut.
Sebagai contoh penelitian tentang produktivitas karyawan bagian penjualan produk
sabun Lifebouy, mengambil data dari PT. Unilever sebagai produsennya.
Data eksternal adalah data tentang keadaan di luar organisasi. Data eksternal
biasanya didapat dari pihak lain dan digunakan sebagai pembanding.
Data Time Series dan Cross Section
Data time series atau deret waktu merupakan data yang dikumpulkan dari beberapa
tahapan waktu secara kronologis. Pada umumnya data deret waktu merupakan
kumpulan data dari fenomena tertentu yang didapat dalam beberapa interval waktu
tertentu, misalnya mingguan, bulanan, tahunan. Sebagai contoh data deret waktu
adalah data ekspor baju hangat PT. SUGITEX ke Perancis dari tahun 1975~1997.
Data Cross Section adalah data yang dikumpulkan pada waktu dan tempat tertentu
saja. Pada umumnya mencerminkan suatu fenomena dalam satu kurun waktu saja,
misalnya data hasil pengisian kuesioner tentang perilaku pembelian suatu produk
kosmetik oleh sekelompok responden pada bulan januari 1998.
2.1.4 Skala Pengukuran
- 12 -
Computer for Statistic Systems
Secara umumdapat dikatakan bahwa tujuan diadakannya suatu observasi adalah
memperoleh keterangan tentang bagaimana kondisi suatu objek pada berbagai
keadaan yang ingin diperhatikan. Diantara bermacam-macam pengukuran untuk
respon-respon yang diamati terhadap objek-objek , yang sering dipergunakan ialah
ukuran ukuran cacah, peringkat, panjang, volume, waktu, bobot, maupun
pengukuran fisika-kimia. Sesuai dengan kemampuan kita dalam menilai atau
mengukur suatu obyek amatan, dalam statistika dibedakan empat macam skala
pengukuran yang mungkin dihasilkan yaitu :
1. Skala Nominal
2. Skala Ordinal
3. Skala interval atau selang, dan
4. Skala Nisbah atau rasio
Sebelum melakukan observasi terhadap variable yang akan diukur, terlebih dahulu
ditentukan skala pengukurannya, karena akan mempengaruhi metode statistika yang
akan digunakan dan tentu saja akan memberikan dampak pada kualitas
informasinya.
Dua skala pengukuran yang pertama kadang-kadang disebut pula skala pengukuran
kualitatif karena tidak numeric (seperti jenis kelamin, status pekerjaan, status
perkawinan, dan lain-lain), sedangkan dua lainnya dinamakan skala pengukuran
kuantitatif karena dapat diekspresikan secara numeric (seprti tinggi, berat, biaya,
pendapatan, dan lain-lain).
2.1.4.1 Skala Nominal
Nominal berasal dari kata ‘name’. Skala nominal merupakan pengukuran yang
paling sederhana. Skala ini mengklasifikasikan (menggolongkan) objek-objek atau
kejadian-kejadian ke dalam berbagai kelompok (kategori) untuk menunjukkan
kesamaan atau perbedaan cirri-ciri objek. Kategori/kelompok didefinisikan
sebelumnya dan dilambangkan dengan kata-kata, huruf symbol, atau angka. Dengan
skala nominal, hasil pengukurannya bisa dibedakan tetapi tidak bisa diurutkan mana
yang lebih tinggi, mana yang lebih rendah, mana yang lebih utama dan mana yang
bisa dikesampingkan. Hal ini karena fungsi angka, symbol, maupun huruf yang
diberikan hanya sebagai lambang yang menunjukkan dalam kelompok mana suatu
hasil pegamatan harus dimasukkan. Dengan skala pengukuran nominal, setiap
observasi harus dimasukkan pada satu kategori saja, tidak boleh lebih. Dengan kata
lain antara kategori yang satu dengan yang lainharus saling bebas. Kategori atau
kelompok harus dibuat lengkap sehingga dapat menampung semua kemungkinan
- 13 -
Computer for Statistic Systems
yang relevan bagi obyek-obyek atau kejadian-kejadian yang mungkin. Sebagai
contoh, sekumpulan bunga diklasifikasikan menjadi bunga merah, putih atau kuning.
Disini hanya dapat ditentukan sama atau tidak, tetapi tidak diketahui apakah individu
yang satu lebih besar atau lebih kecil dibandiingkan yang lain. Contoh-contoh aplikasi
di bidang pemasaran antara lain adalah merek dagang, jenis took, wilayah penjualan,
dan lain-lain.
2.1.4.2 Skala Ordinal
Dengan menggunakan skala ordinal, obyek-obyek juga dapat digolongkan
dalam kategori tertentu. Angka atau huruf yang diberikan disini mengandung
tingkatan, sehingga dari kelompok yang terbentuk dapat dibuat peringkat yang
menyatakan hubungan lebih dari atau kurang dari menurut aturan penataan
tertentu. Ukuran pada skala ordinal tidak memberikan nilai absolute pada obyek,
tetapi hanya urutan (ranking) relative saja. Jarak antara golongan satu dan golongan
dua tidak perlu sama dengan jarak antara golongan dua dan tiga. Dalam skala
ordinal, peringkat yang ada tidak mempunyai satuan ukur.
Contoh aplikasi dalam bidang ekonomi antara lain tingkat preferensi, jabatan
manajemen, jenajng karir, kelas social dan lain-lain.
2.1.4.3 Skala Interval
Skala interval memberikan ciri angka kepada kelompok obyek yang
mempunyai skala nominal dan ordinal, ditambah dengan jarak yang sama pada
urutan obyeknya. Data skala interval diberikan apabila kategori yang digunakan bisa
dibedakan, diurutkan, mempunyai jarak tertentu, tetapi tidak bisa dibandigkan. Data
skala interval diperoleh sebagai hasil pengukuran dan biasanya mempunyai satuan
pengukuran. Nilai-nilai obyek dapat diperingkatkan dan diukur jarak antaranya
dengan kecermatan tertentu. Ciri penting dari skala interval adalah datanya bisa
ditambahkan, dikurangi, digandakan, dan dibagi tanpa mempengaruhi skor-skornya.
Contoh aplikasi, dalam penilaian kinerja karyawan (dengan skala 0 – 100), bila
Mayam mendapat penilaian kinerja 80 dan Tuti mendapat nilai 40, walaupun nilai
Mayam dua kalinya nilai Tuti tidak berarti kemampuan Mayam dua kalinya Tuti. Hal
ini terjadi karena skala penilaian 0-100 dibuat berdasarkan consensus.
2.1.4.4 Skala Rasio (Nisbah)
Skala rasio mempunyai semua sifat skala interval ditambah satu sifat lain,
yaitu memberikan keterangan tentang nilai absolute dari obyek yang diukur. Skala
- 14 -
Computer for Statistic Systems
rasio merupakan skala pengukuran yang ditujukan pada hasil pengukuran yang bisa
dibedakan, diurutkan, mempunyai jarak tertentu, dan bisa dibandingkan.
Contoh aplikasi skala pengukuran rasio dalam bidang ekonomi adalah umur, biaya,
hasil penjualan, jumlah pelanggan, dan lain-lain.
2.2 Penyajian Data
Selesai pelaksanaan suatu observasi, data yang terkumpul perlu disajikan
dalam bentuk yang mudah dibaca dan dipahami oleh pihak-pihak yang
berkepentingan. Bila kuantitas data yang terkumpul hanya sedikit memang tidak
banyak dijumpai kesulitan dalam membaca dan memahaminya. Namun, bila data
yang terkumpul banyak, sering timbul kesulitan dalam pemahamannya. Disamping
itu, informasi yang dikandung oleh data hasil pengamatan menjadi sulit diperoleh.
Untuk itu sebaiknya data disusun secara sistematis.
2.2.1 Tabel Distribusi frekuensi
Dari bermacam-macam table yang umum dipakai, tabel distribusi frekuensi
merupakan alternatif yang banyak digunakan. Tabel distribusi frekuensi adalah
susunan data dalam suatu tabel yang telah diklasifikasikan menurut kelas-kelas atau
kategori-kategori tertentu.
Dikenal dua bentuk distribusi frekuensi menurut pembagian kelasnya, yaitu distribusi
frekuensi kualitatif (kategori) dasn distribusi frekuansi kuantitatif (bilangan). Pada
distribusi frekuensi kualitatif pembagian kelasnya didasarkan pada kategori tertentu
dan banyak digunakan untuk data berskala ukur nominal. Berikut contoh tabel
distribusi frekuensi kualitatif.
Berikut contoh tabel distribusi frekuensi kualitatif :
Tabel : Penjualan mobil (tahunan) dari Beberapa Perusahaan
Perusahaan Penjualan tahunan (unit)
General Motor
Ford
Chrysler
379.159
193.000
156.078
- 15 -
Computer for Statistic Systems
Honda
Toyota
Hyundai
Volkswagen
Lain-lain
72.976
68.753
50.648
41.470
187.648
Pembagian kelas distribusi kuantitatif pada umumnya dinyatakan dalam angka.
Dikenal table distribusi frekuensi kuantitatif tunggal dan bergolong. Pada table
distribusi frekuensi kuantitatif tunggal, besaran pada lajur pertamanya hanya terdiri
dari satu nilai. Berikut contoh tabel distribusi frekuensi kauntitatif tunggal.
Tabel : Distribusi Pendapatan Karyawan PT. “GEMBIRA” bulan January tahun 1999
(dalam $)
Pendapatan ($) Banyaknya
Karyawan
1000
1250
1500
1750
2000
3000
11
9
8
5
4
3
40
Pada table distribusi frekuensi kuantitatif yang bergolong, besaran pada lajur
pertamanya merupakan interval diantara dua nilai.
Tahapan penyusunan tabel distribusi frekuensi kuantitatif bergolong adalah :
Contoh : Data Pendapatan 20 Manajer Madya di DKI Jakarta tahun 1998 (dalam $)
No Nama Pendapata
n
No Nama Pendapata
n
1
2
3
Siagian
Husein
Ellen
4300
3120
5530
11
12
13
Deny
Sutrisno
Lina
3490
4390
3490
- 16 -
Computer for Statistic Systems
4
5
6
7
8
9
10
Christin
Huse
Yani
Nunung
Gidion
Endang
Fuad
4000
2010
1600
3190
8230
1020
4280
14
15
16
17
18
19
20
Budi
Rudolf
Fongna
Inge
Yosafat
Suyanto
Mega
3950
1390
8990
1270
9560
5240
4580
a. Hitung besarnya jangkauan data (range)
Range = nilai observasi terbesar – nilai observasi terkecil
Untu tabel diatas diketahui nilai terkecilnya $1.020 dan nilai terbesarnya $9.560,
maka range pendapatan manajer madya di DKI Jakarta tersebut adalah :
Range = $9.560 - $1.020 = $8.540
b. Menentukan banyaknya kelas (K), menggunakan kaidah Sturgess.
K = 1 + (10/3) log n (n = banyaknya data)
= 1 + (10/3) log 20
= 1 + (10/3) (1,3) = 5,33 dibulatkan menjadi 5 Kelas
c. Menentukan perkiraan interval kelas (I) = R/K = 8.540/5 = 1.708
Nilai interval kelas yang diperoleh biasanya disesuaikan ke bilangan yang mudah
dalam pengoperasiannya, untuk memudahkan penysusunan tabel distribusi
frekuensi. Misalnya 0,4 dibulatkan menjadi 0,5 ; 0,88 dibulatkan menjadi 1,00 dan
seterusnya. Dalam contoh kita 1.708 akan dibulatkan menjadi 1.710.
d. Menentukan batas kelas
Batas kelas adalah nilai-nilai yang membatasi suatu kelas dengan kelas lainnya.
Dikenal batas kelas bawah dan batas kelas atas. Juga batas kelas semu dan batas
kelas nyata. Pada batas kelas semu terlihat loncatan nilai antara suatu kelas dengan
kelas berikutnya, karena batas ini bukan batas sebenarnya antara dua kelas.
Sedangkan pada batas kelas nyata tidak dijumpai loncatan karena merupakan batas
yang sebenarnya antara dua kelas. Dalam menentukan batas kelas, perhatian
diberikan pada penentuan nilai batas kelas nyata, terutama nilai batas kelas bawah
yang terkecil (dalam hal ini harus ≤ 1.020, supaya nilai terkecil pengamatan dapat
tertampung) dan nilai batas kelas atas yang terbesar (dalam hal ini harus ≥ 9.560,
agar nilai pengamatan terbesar dapat tertampung. Dalam contoh kita, nilai batas
kelas nyata untuk kelas terkecil ditetapkan 1.015 (lebih kecil 1.020) dan kelas
- 17 -
Computer for Statistic Systems
tertinggi 9.565 (lebih besar dari 9.560). Dengan penentuan ini, pembulatan yang
dilakukan menjadi tepat karena :
(9.565 – 1.015)/5 = 8.550/5 = 1.710
Dari informasi tersebut dapat diperoleh data dengan batas nyata sebagai berikut :
Tabel : Distribusi pendapatan Manajer Madya Madya di DKI Jakarta tahun 1998 ($)
Pendapatan Turus Frekuensi
1.015 - 2.725
2.725 - 4.435
4.435 - 6.145
6.145 - 7.855
7.855 - 9.565
IIII
IIII IIII
III
-
III
5
9
3
0
3
Total 20
Tabel diatas merupakan tampilan tabel distribusi frekuensi bergolong dengan batas
nyata (karena dua kelas yang berurutan tidak dijumpai adanya loncatan nilai).
Dengan tampilan tersebut, interval kelasnya adalah 1.710 (catatan : Interval kelas
merupakan selisih batas atas nyata dengan batas bawah nyata).
Tabel : Distribusi pendapatan Manajer Madya di DKI Jakarta Tahun 1998 (dalam $)
PendapatanNilai Tengah
Kelas
Frekuensi
Mutlak
Frekuensi
Kumulatif
Frekuensi
Kumulatif
(%)
1.015 - 2.725
2.725 - 4.435
4.435 - 6.145
6.145 - 7.855
7.855 - 9.565
1.870
3.580
5.290
7.000
8.710
5
9
3
0
3
5
14
17
17
20
25
45
15
0
15
Total 20 100
Catatan : Nilai tengah kelas merupakan nilai yang terletak di tengah-tengah kelas
(diperoleh dari (batas bawah kelas + batas atas kelas) / 2)
Seringkali tabel distribusi frekuensi bergolong, ditampilkan dalam batas kelas semu.
Dengan menggunakan batas kelas semu, batas antara kelas yang satu dengan kelas
yang lain tidak lagi tumpang tindih (seperti yang telah disebutkan sebelumnya), pada
batas kelas semu terlihat adanya loncatan nilai antara kelas yang satu dengan
berikutnya). Batas kelas semu dapat diperoleh dari batas kelas nyata melalui
hubungan berikut :
Batas atas semu = Batas atas nyata – 0,5 unit pengukuran terkecil
- 18 -
Computer for Statistic Systems
Batas bawah semu = Batas bawah nyata + 0,5 unit prngukuran terkecil
Untuk data tabel diatas, unit pengukuran terkecil adalah 1 dollar, sehingga 0,5 unit
pengukuran terkecilnya adalah 0,5 dollar. Untuk batas kelas semu, distribusi
frekuensi bergolongnya dapat ditampilkan pada tabel berikut :
Tabel : Distribusi Pendapatan manajer madya di DKI Jakarta tahun 1998 (dalam $)
Pendapatan
Nilai
Tengah
Kelas
Frekuensi
Mutlak
Frekuensi
Kumulatif
Frekuensi
Kumulatif
(%)
1.015,5 - 2.724,5
2.725,5 - 4.434,5
4.435,5 - 6.144,5
6.145,5 - 7.854,5
7.855,5 - 9.564,5
1.870
3.580
5.290
7.000
8.710
5
9
3
0
3
5
14
17
17
20
25
45
15
0
15
Total 20 100
Sumber : data hipotesis
Berdasarkan ilustrasi diatas, penyajian data dalam bentuk tabel terlihat lebih
sistematis dan memberikan informasi lebih padat. Untuk mendapatkan kelengkapan
informasi, dalam membuat tabel perlu diperhatikan :
Sebuah tabel hendaknya mempunyai judul untuk mempermudah dalam
membedakan satu tabel dengan tabel lainnya
Unit pengukuran angka-angka yang terdapat dalam baris dan kolom tabel
hendaknya dijelaskan secara eksplisit
Kategori kelas dalam tabel harus tegas, jangan sampai terjadi tumpang tindih
antara kelas yang satu dengan kelas lain.
Sumber data dan keterangan perlu dicantumkan guna mempermudah
pengecekan kembali pada sumbernya bila data meragukan
Keterangan yang diberikan pada tabel sebaiknya dibuat jelas agar tidak
membingungkan pembaca.
2.2.2 GRAFIK
Data dari suatu observasi, selain dapat disajikan dalam bentuk tabel, juga dapat
disajikan dalam bentuk grafik. Penyajian data dalam bentuk grafik pada umumnya
lebih menarik karena tampilan visualnya, terutama jika ingin memperoleh informasi
tambahan yang berkaitan dengan bentuk distribusi data. Grafik dapat ditampilkan
dalam bentuk histogram, polygon, ogive, , maupun diagram lingkaran (pie chart).
- 19 -
Computer for Statistic Systems
1. Histogram
Histogram adalah grafik dari distribusi frekuensi suatu variable. Tampilan histogram
berupa petak-petak empat persegi panjang . Grafik ini terdiri dari dua sumbu utama
dengan sudut 90 derajat. Sebagai sumbu horizontal (absis, sumbu X) adalah kelas-
kelas atau nilai-nilai variable yang diobservasi, sedang sumbu vertical (ordinat,
sumbu Y) menunjukkan frekuensi. Untuk histogram dari distribusi frekuensi
bergolong, sebagai absisnya dapat digunakan batas nyata atau batas semu, atau
nilai tengah kelas. Petak segi empat didirikan di atas setiap kelas. Tinggi setiap petak
sesuai dengan besarnya frekuensi. Setiap kelas sebanding dengan frekuensi masing-
masing dan luasnya sama dengan besarnya frekuensi dikalikan interval kelas.
Histogram Pendapatan manajer Madya Jakarta Tahun 1998 ($) dengan menggunakan
Nilai Tengah Kelas
0
1
2
3
4
5
6
7
8
9
10
1870 3580 5290 7000 8710
Pendapatan ($)
2. POLIGON
Poligon adalah grafik dari distribusi frekuensi bergolong suatu variable. Tampilan
Poligon berupa garis-garis patah yang diperoleh dengan cara menghubungkan
puncak dari masing-masing nilai tengah kelas. Poligon sangat baik bila digunakan
untuk membandingkan bentuk dari dua distribusi. Bila hanya satu distribusi, lebih
jelas menggunakan histogram. Agar garis patah pada polygon tidak menggantung,
sebaiknya pada masing-masing ujung ditambah satu kelas.
Poligon Pendapatan Manajer Madya di DKI
Jakarta Tahun 1998 ($)
- 20 -
Computer for Statistic Systems
0
1
2
3
4
5
6
7
8
9
10
1060 1870 3580 5290 7000 8710 10420
Pendapatan ($)
3. OGIVE
Ogive adalah gambar dari distribusi frekuensi kumulatif suatu variable. Dalam ogive,
yang digunakan sebagai absis adalah batas nyata kelas, sedangkan sebagai sumbu
vertical adalah frekuensi kumulatif. Untuk suatu tabel distribusi frekuensi, dapat
dibuat ogive frekuensi kumulatif positif dan ogive frekuensi kumulatif negative.
Distribusi Frekuensi Kumulatif (Ogive)
0
5
10
15
20
25
1015 2725 4435 6145 7855 9565
Batas Nyata Kelas
Fre
kuen
si K
um
ula
tif
4. GRAFIK LINGKARAN (PIE CHART)
Penyajian data dalam bentuk diagram lingkaran didasarkan pada sebuah lingkaran
yang dibagi menjadi bebrapa bagian sesuai dengan banyaknya kelas penyusunnya.
Penggunaan skala yang tepat untuk masing-masing bagian ditentukan secara
proporsional sesuai dengan frekuensi masing-masing kelas, dengan
- 21 -
Computer for Statistic Systems
memperhitungkan bahwa sudut lingkaran penuh adalah 360 derajat. Sebagai contoh
dapat dilihat ilustrasi berikut :
Tabel : Komposisi usia karyawan PT. Future, Jakarta 1997
Usia Karyawan Jumlah Karyawan Derajat
20 tahun
21 tahun
22 tahun
8
48
8
(8/64) 3600 = 450
(48/64) 3600 = 2700
(8/64) 3600 = 450
64 3600
Pie Chart Komposisi Usia Karyawan PT. Future, Jakarta 1997
13%
74%
13%
20 tahun 21 tahun 22 tahun
2.3 Ukuran Pemusatan
Agar Penyajian kumpulan data lebih mudah dipahami, statistika menyediakan
metode penyusunan data dalam bentuk distribusi frekuensi. Tapi distribusi frekuensi
yang terbentuk masih mengandung banyak elemen. Suatu kumpulan data biasanya
mempunyai kecenderungan untuk memusat pada nilai tertentu yang disebut nilai
pusat. Nilai tersebut berupa nilai tunggal yang cukup representative bagi
keseluruhan nilai yang terdapat dalam data bersangkutan. Dalam statistika dikenal
bebrapa macam ukuran nilai pusat. Yang paling banyak digunakan adalah rata-rata
hitung (arithmetic mean), median, modus, rata-rata tertimbang, rata-rata ukur, dan
lain-lain.
1. Rata-rata Hitung
Rata-rata hitung mungkin merupakan ukuran nilai pusat yang paling dikenal dan
paling banyak dipergunakan. Rata-rata hitung dari suatu gugus data adalah jumlah
- 22 -
Computer for Statistic Systems
nilai-nilai data dibagi oleh banyaknya observasi. Mengingat gugus data yang
diperoleh bisa dari populasi ataupun dari sample. Maka dibedakan adanya rata-rata
hitung populasi dan rata-rata hitung sample. Rata-rata hitung populasi dilambangkan
dengan µ (miyu) sedangkan rata-rata hitung sample dilambangkan dengan X (x bar).
Terkadang nilai rata-rata hitung ditulis dengan nilai rata-rata saja.
Untuk mempermudah ulasan berikutnya, keduanya dilambangkan dengan X.
banyaknya observasi digunakan apakah n atau N untuk mengenali rata-rata hitung
populasi atau sample.
Contoh aplikasi : dari data pendapatan manajer madya di DKI Jakarta, dapat
diperoleh rata-rata hitung pendapatan sebagai berikut :
Pada data yang telah dikelompokan sifat aslinya tidak tampak dan yang nampak
adalah sifat kelompoknya. Pencarian rata-rata hitung untuk data yang
dikelompokkan adalah :
Bila data tersebut digolongkan terlebih dahulu ke dalam tabel distribusi frekuensi,
maka perhitungannya :
- 23 -
83.630
Computer for Statistic Systems
Bila kedua cara penghitungan tersebut diperhatikan, ternyata rata-rata hitung yang
diperoleh dari data tergolong sedikit berbeda dengan rata-rata hitung yang diperoleh
dari data asli. Hal ini dikarenakan karakteristik asli dari tiap datum tidak nampak
(hilang) setelah data tersebut dibuat bergolong. Nilai tengah kelas juga telah
diasumsikan sebagai rat-rata hitung dari masing-masing kelas.
2. MEDIAN
Median adalah nilai tengah dari nilai-nilai pengamatan yang disusun secara teratur
menurut besarnya data. Median merupakan ukuran nilai pusat yang dapat
digunakan untuk data yang dikelompokkan maupun data yang tidak dikelompokkan.
Untuk data yang tidak dikelompokkan, median adalah nilai yang terletak pada posisi :
(N+1)/2
Dengan N menunjukkan jumlah observasi secara keseluruhan. Untuk keperluan
tersebut, nilai-nilai pengamatan terlebih dahulu diurutkan dari kecil ke besar dan
sebaliknya.
Contoh Aplikasi :
Atas dasar tabel sebelumnya, median pandapatan manajer madya di DKI Jakarta
dapat dicari dengan cara dan tahapan sebagai berikut :
a. Mengurutkan data amatan :
1020 1270 1390 1600 2010 3120 3190 3490 3490 3950 4000
4280 4300 4390 4580 5240 5530 8230 8990 9560
b. Menentukan posisi median
Posisi median = (n+1)/2 = (20 + 1)/2 = 10,5
(berarti median adalah antara datum ke-10 dan ke-11)
c. Mencari nilai median
Nilai median = (3950 + 4000)/2 = 7950/2 = 3975
Sehingga diperoleh median pendapatan manajer menengah $3975
Untuk data yang telah dikelompokkan, pertama kali ditentukan letak median pada
suatu kelas yaitu : (n+1)/2, setelah itu median ditentukan dengan pendekatan
berikut :
Median = B1 + ((N/2)- cfb / fm) x i
B1 = batas bawah nyata dari kelas yang mengandung median
- 24 -
Computer for Statistic Systems
N = banyaknya data observasi
cfb = frekuensi kumulatif di bawah kelas yang berisi median
fm = frekuensi dari kelas yang mengandung median
i = interval kelas dari batas nyata
Tabel : Distribusi Pendapatan manajer madya di DKI Jakarta tahun 1998 (dalam $)
Pendapatan
Nilai
Tengah
Kelas
Frekuensi
Mutlak
Frekuensi
Kumulatif
Frekuensi
Kumulatif
(%)
1.015,5 - 2.724,5
2.725,5 - 4.434,5
4.435,5 - 6.144,5
6.145,5 - 7.854,5
7.855,5 - 9.564,5
1.870
3.580
5.290
7.000
8.710
5
9
3
0
3
5
14
17
17
20
25
45
15
0
15
Total 20 100
Dari data tabel diatas, yang mengandung median adalah kelas ke-2 (karena posisi
median pada data yang ke 10,5 dan untuk kelas ke-1 baru ada 5, sedangkan pada
kelas ke-3 sudah ada 17 data). Setelah kelas yang mengandung median diketahui,
selanjutnya dapat diperoleh informasi sebagai berikut :
B1 = 2.725
N = 20
cfb = 5
fm = 9
i = 1.710
Dengan demikian mediannya adalah :
Median = B1 + ((N/2)- cfb / fm) x i
= 2.725 + ((20/2) – 5)/9 x 1.710 = $3.675
3. MODUS
Modus adalah nilai yang mempunyai frekuensi terbesar dalam suatu kumpulan data.
Modus berguna untuk mengetahui tingkat seringnya terjadi suatu peristiwa.
Pada data yang tidak dikelompokkan, modus dapat diperoleh dengan menghitung
frekuensi dari nilai-nilai pengamatan dan menentukan nilai pengamatan denga
- 25 -
Computer for Statistic Systems
frekuensi terbesar. Pada data yang telah dikelompokkan dalam suatu distribusi
frekuensi, modus terletak pada kelas yang mempunyai frekuensi paling tinggi. Untuk
tabel distribusi frekuensi bergolong, modus dapat diperoleh dengan pendekatan
berikut :
Modus = B1 + d1/(d1+d2) x i
B1 = Batas bawah nyata dari kelas yang mengandung modus
d1 = selisih frekuensi antara kelas yang mengandung modus dengan frekuensi kelas
sebelumnya
d2 = selisih frekuensi antara kelas yang mengandung modus dengan frekuensi kelas
sesudahnya
i = interval kelas dari batas nyata
Contoh aplikasi :
Dari data sebelumnya ternyata nilai yang paling sering muncul adalah 3490 (muncul
kali, sedangkan nilai lainnya muncul satu kali). Berarti modus pendapatan manajer
madya di DKI adalah $3490
Jika data pada tabel tersebut dibuat bergolong, maka pencarian modusnya dilakukan
sebagai berikut :
Kelas dengan frekuensi tertinggi adalah kelas 2.725 – 4.435, dengan frekuensi 9.
Maka nilai B1 = 2,725 nilai d1 = 4 dan d2 = 6 dengan i = 1710 maka :
Modus = B1 + d1/(d1+d2) x i
= 2.725 + 4/(4+6) x 1.710 = $3.409
4. Rata-rata Ukur (Geometric Mean)
Rata-rata ukur pada umumnya digunakan untuk mengukur tingkat perubahan atau
rata-rata rasio. Rata-rata ukur ini terutama digunakan untuk merata-ratakan data
yang rasio di suku-sukunya yang berurutan kira-kira tetap, misalnya laju perubahan,
rasio, atau indeks ekonomi. Rumus dari rata-rata ukur adalah :
G = rata-rata ukur
Xi = nilai rasio
n = banyaknya rasio yang dikalikan
Jika n besar, maka untuk menghitung rata-rata ukur secara langsung seperti diatas
menjadi sulit. Untuk mempermudah perhitungan digunakan logaritma.
- 26 -
Computer for Statistic Systems
G = antilog (1/n (log X1 + log X2 + … + log Xn)
Nilai rata-rata geometric selalu lebih kecil dari rat-rata hitung, kecuali jika semua
datanya bernilai sama sehingga nilai rata-rata hitung akan sama dengan nilai rata-
rata geometric.
Contoh Aplikasi :
Dalam rangka meningkatkan motivasi kerja karyawan, pimpinan suatu perusahaan
berencana menaikkan gaji mereka. Untuk keperluan tersebut ia ingin memperoleh
informasi tentang persentasi kenaikan rata-rata gaji mereka tahun sebelumnya atas
dasar informasi rasio gaji seorang karyawan antara tahun berjalan dengan tahun
sebelumnya. Data yang diperoleh adalah : 1,072 1,086 1,069 1,098 , nilai rata-
rata ukur keempat rasio tersebut adalah :
G = 4√(1,072)(1,086)(1,069)(1,098)
= 1,0812
Atau dengan logaritma :
G = antilog (1/4 (log 1,072 + log 1,086 + log 1,069 + log 1,098)
= antilog (1/4 (0,1356)) = antilog 0,03390 = 1,0812
Kenaikan rata-rata gaji karyawan tersebut adalah 1,082 – 1 = 0,0812.
Persen kenaikan rat-ratanya adalah 0,0812 x 100% = 8,12%
Bila yang digunakan bukan data ratio, tetapi kita ingin mencari rata-rata
pertumbuhannya, tersedia dua cara untuk menghitung rat-rata geometriknya. Cara
pertama adalah menghitung masing-masing rasio, kemudian menghitung seperti
biasa nilai rata-rata geometriknya. Cara kedua adalah dengan menggunakan rumus
berikut :
Xn = data ke-n
X1 = data ke-1
G = rata-rata geometric
2.4 Ukuran Variasi
Ukuran pemusatan dapat digunakan untuk menampilkan ringkasan data dalam
suatu nilai tunggal yang menunjukkan rata-rata distribusi.
1. Range (Rentang) atau Jangkauan
Range adalah selisih antara nilai maksimum dengan nilai minimum dalam suatu
gugus data. Range merupakan ukuran variasi yang paling sederhana dan pada
umumnya memberikan ukuran variasi yang rendah kecermatannya.
- 27 -
Computer for Statistic Systems
Contoh aplikasi : dari data tabel pendapatan manajer madya di DKI diketahui nilai
minimumnya $1020 dan nilai maksimumnya $9560, maka Range/rentang = $9560 -
$1020 = $8540
2. Simpangan Absolut Rata-rata (Mean Absolut Deviation)/MAD
Simpangan absolute rata-rata adalah jumlah mutlak penyimpangan setiap nilai
pengamatan terhadap rata-rata, dibagi dengan banyaknya pengamatan. Simpangan
absolute rata-rata mencerminkan rata-rata selisih mutlak nilai data terhadap nilai rat-
rata.
Untuk data yang tidak dikelompokkan, simpangan absolute rata-rata (MAD) dihitung
dari :
Untuk data dari tabel sebelumnya, maka MAD nya adalah :
Untuk data yang digolongkan, deviasi rata-rata hitung diperoleh dari :
- 28 -
Computer for Statistic Systems
3. Ragam (Variance) dan Standar Deviasi
Ragam (Variance) adalah jumlah kuadrat dari selisih nilai observasi dengan rata-rata
hitung dibagi banyaknya observasi. Sedangkan standar deviasi adalah akar dari
ragam tersebut.
Untuk populasi, ragam populasi dihitung dengan formula :
Standar deviasi populasi = √2 dan standar deviasi sample S = √S2
Dari data pendapatan manajer madya di DKI yang tertera pada tabel dapat diperoleh
:
Untuk data yang dikelompokkan/distribusi frekeunsi (data bergolong) ragam dihitung dengan pendekatan berikut :
fi = frekuensi kelas ke-iXi = nilai tengah kelas ke-iN = banyaknya observasi populasin = banyaknya sampel
Dengan contoh yang sama, ragam dapat ditentukan, karena :
- 29 -
Computer for Statistic Systems
= 5009445 sehingga S = √S2 = √5009445 = $2.238,18
4. Koefisien Variasi
Koefisien variasi (KV) merupakan ukuran variasi relative yang bertujuan
membandingkan variasi dari beberapa gugus data yang mempunyai satuan berbeda.
Koefisien variasi diperoleh dengan formula berikut :
KV = /µ x 100% untuk populasi dan
KV = S/X x 100% untuk sample
Dengan rumus tersebut, dari data pendapatan manajer madya dapat diketahui :
KV = 2432,26/4181,5 x 100% = 58,17%
5. KUARTIL (Q)
Kuartil berarti perempatan. Kuartil merupakan nilai-nilai yang membagi data yang
telah diurutkan menjadi empat bagian yang sama, sehingga dalam suatu gugus data
didapati 3 kuartil (kuartil 1, kuartil 2 atau median, dan kuartil 3).
Rumus untuk data bergolong adalah :
Qk = B1 + ((kN/4)-cfb)/fq x i
Qk = kuartil ke k
B1 = batas bawah nyata kelas yang mengandung Qk
cfb = frekuensi kumulatif di bawah kelas yang berisi Qk
i = interval kelas
k = 1,2,3
N = banyaknya observasi
Tabel : Distribusi Pendapatan manajer madya di DKI Jakarta tahun 1998 (dalam $)
Pendapatan
Nilai
Tengah
Kelas
Frekuensi
Mutlak
Frekuensi
Kumulatif
Frekuensi
Kumulatif
(%)
1.015 - 2.725
2.725 - 4.435
4.435 - 6.145
6.145 - 7.855
7.855 - 9.565
1.870
3.580
5.290
7.000
8.710
5
9
3
0
3
5
14
17
17
20
25
45
15
0
15
Total 20 100
Dari data table diatas untuk mencari kuartil pertama (Q1) diketahui :
- 30 -
Computer for Statistic Systems
B1 = 2.725
k = 1
N = 20
nfb = 5
fq = 9
i = 1.710
Maka : Q1 = 2.725 + ((1x20)/4) – 5 / 9 x 1.710 = $2725
6. Persentil (Pk)
Pada umumnya persentil digunakan untuk membagi data bergolong menjadi 100
bagian yang sama. Karakter persentil mirip dengan kuartil, pembedanya pada per
seratusan data yang telah diurutkan. Rumus persentil untuk data bergolong adalah :
Pk = B1 + ((kN/100) – cfb)/fp x i
Pk = Persentil ke k
cfb = frekuensi bawah nyata kelas yang mengandung persentil ke-k
i = interval kelas
fp = frekuensi kelas yang mengandung Pk
k = 1,2,3,4….,99 dan N = banyaknya observasi
APLIKASI PRAKTIS UKURAN PEMUSATAN DAN UKURAN VARIASI
1. Bentuk Distribusi Data
Atas dasar informasi yang diperoleh dari distribusi frekuensi maupun grafik
histogram dan polygon, dapat diperoleh gambaran kasar mengenai bentuk distribusi
data yang terkait. Secara garis besarnya dari tampilan yang diperoleh distribusi data
dapat dibedakan menjadi distribusi simetris dan distribusi tidak simetris.
Distribusi data dikatakan simetris bila banyaknya data yang lebih kecil dari nilai
median atau nilai rata-rata, sama atau hampir sama dengan banyaknya data di atas
nilai median atau nilai rata-ratanya. Pada distribusi data yang simetris, nilai rata-rata,
median dan modus sama. Bila distribusi simetris ini dinyatakan dalam bentuk kurva,
diperoleh tampilan berikut :
Salah satu dari distribusi data simetris yang banyak digunakan dalam statistika
adalah distribusi normal. Suatu distribusi data dikatakan berdistribusi normal jika
data berdistribusi simetris dan unimodal (memiliki satu modus).
- 31 -
Computer for Statistic Systems
Bentuk distribusi data yang tidak memiliki kriteria di atas dikenal dengan distribusi
yang tidak simetris.
2. Penggunaan Koefisien Pearson
Selain secara visual, tingkat kemencengan suatu distribusi diketahui melalui
koefisien Pearson dengan formula sebagai berikut :
Sk = 3 (X – Me)/ S
Sk = Koefisien Pearson
X = rata-rata
Me = Median
S = Standar deviasi
Jika Sk ≈ 0 distribusi data simetris
Jika Sk > 0 distribusi data menceng ke kanan
Jika Sk < 0 distribusi data menceng ke kiri
Contoh Aplikasi :
Perhatikan distribusi frekuensi berikut :
Batas KelasNilai Tengah
Kelas (x)Frekuensi (f)
Frekuensi relatif
(fr)
4,0 – 4,9
5,0 – 5,9
6,0 – 6,9
7,0 – 7,9
8,0 – 8,9
9,0 – 9,9
4,45
5,45
6,45
7,45
8,45
9,45
3
11
17
16
8
5
0,05
0,18
0,28
0,27
0,13
0,08
Atas dasar informasi yang diperoleh dari tabel tersebut diketahui tingkat
kemencengan dari suatu distribusi data, baik secara visual maupun dengan
menggunakan koefisien Pearson.
Penyelesaian secara visual dilakukan dengan pertolongan histogram.
- 32 -0
5
10
15
20
4,45 5,45 6,45 7,45 8,45 9,45
Nilai tengah kelas
Fre
kuen
si
Computer for Statistic Systems
Dengan menggunakan koefisien Pearson yang diperoleh atas dasar informasi :
X = 6,95
Me = 6,89
S = 1,31
Sk = (3(6,95 – 6,89))/1,31 = 0,14
Karena Nilai Sk ≈ 0, maka dapat dikatakan distribusi data simetris.
3. Dalil Chebyechev
Menurut dalil Chebychev, untuk sembarang distribusi data berlaku sekurang-
kurangnya [1-(1/k2)] bagian data terletak pada selang (X ± k.s) untuk k > 1. Dengan
demikian variasi nilai k akan menentukan keadaan seperti terlihat pada table
berikut :
k Jumlah data minimal selang
2
3
dst
1-(1/4) = 0,75 = 75%
1-(1/9) = 0,89 = 89%
dst
X ± 2s
X ± 3S
dst
Contoh aplikasi :
Dari pemeriksaan peti-peti kemas yang berisikan barang-barang elektronik, diketahui
rata-rata yang rusak adalah 5 unit per peti dengan standar deviasi 1 unit per peti.
Jika perusahaan tersebut memproduksi 100 peti setiap hari, kira-kira berapa petikah
yang kerusakannya antara 3 sampai 7 unit setiap harinya ?
Penyelesaian :
Karena dalam hal ini tidak tersedia informasi mengenai distribusi datanya, untuk itu
diperkirakan jumlah minimal peti yang kerusakannya antara 3 sampai 7 unit menurut
dalil chebychev sebagai berikut :
Minimal 1-1/k2 bagian yang kerusakannya antara 3 sampai 7
berarti X – ks = 3 dan X + ks = 7
5 – k(1) = 3, k= 2
- 33 -
Computer for Statistic Systems
Dengan demikian jumlah data minimal sama dengan 1 – ½2 = 0,75
Karena perusahaan memproduksi 100 peti setiap harinya, maka jumlah peti minimal
dengan kerusakan 3 sampai 7 unit ada 75 peti.
4. Kaidah Empiris
Dalil Chebychev menyatakan batas-batas nilai pengamatan bagi data yang
berdistribusi sebarang. Bagi data yang distribusinya mengikuti distribusi normal,
berlaku kaidah empiris sebagai berikut :
68% pengamatan terletak dalam batas X±S
95% pengamatan terletak dalam batas X±2S
99,7% pengamatan terletak dalam batas X±3S
Contoh aplikasi :
Hasil penelitian yang dilakukan terhadap 2000 pengunjung supermarker
menunjukkan pengeluaran konsumen perbulan yang menyebar menurut distribusi
Normal dengan rata-rata $300 dan standar deviasi $12. Atas dasar penelitian
tersebut maka,
68% pengeluaran konsumen terletak di antara batas $288 - $312
95% pengeluaran konsumen terletak di antara batas $276 - $324
99,7% pengeluaran konsumen terletak di antara batas $264 - $336
5. SKOR BAKU
Skor Baku merupakan suatu ukuran relatif yang menyatakan penyimpangan data
dari nilai rata-ratanya yang diukur berdasarkan nilai standar deviasinya. Formula
untuk skor baku adalah :
Z = (X – Χ¯/S
Karena nilai S (standar deviasi) tidak mungkin negative, maka bila skor baku (Z)
bernilai negative berarti nilai X dibawah nilai rata-ratanya dan bila Z positif berarti
nilai X di atas nilai rat-ratanya. Skor baku sering digunakan untuk membandingkan
data pengamatan dari dua atau lebih populasi yang berbeda dalam rangka
menentukan tingkatan atau ranking relatifnya.
Contoh aplikasi :
Seorang wiraniaga mampu menjual produk sebanyak 86 unit ketika yang
bersangkutan ditempatkan di wilayah tangerang. Adapun rata-rata dan standar
deviasi penjualan seluruh wiraniaga di tangerang alah 78 unit dan 10 unit. Wiraniaga
yang sama mampu menjual 92 unit produk dalam interval waktu yang sama ketika
yang bersangkutan ditugaskan di bogor. Rata-rata dan standar deviasi penjualan
seluruh wiraniaga di bogor adalah 84 unit dan 18 unit. Ditanyakan di kota manakah
wiraniaga tersebut secara relatif lebih berhasil ?
- 34 -
Computer for Statistic Systems
Penyelesaian :
Karena untuk kedua daerah penjualan tersebut, nilai rat-rata dan standar deviasi
penjualan produknya berbeda, maka untuk melihat relativitas kemampuan wiraniaga
tersebut dapat dibandingkan skor bakunya :
Z (tangerang) = (86-78)/10 = 0,8
Z (bogor) = (92-84)/18 = 0,44
Hasil yang diperoleh menunjukkan Z (tangerang) lebih besar dari Z (bogor) dengan
demikian prestasi wiraniaga tersebut lebih baik ketika ditempatkan di Tangerang.
- 35 -
Computer for Statistic Systems
BAB III.
PELUANG
3.1 Perumusan Peluang
Kata peluang bisa berarti kemungkinan atau kans. Hitung peluang menunjukkan
tingkat kemungkinan dalam bentuk angka, sedangkan teori peluang memberikan
metode-metode yang berhubungan dengan ketidakpastian. Kondisi ketidakpastian ini
merupakan bagian yang tak terhindarkan dari proses pengambilan keputusan dalam
kegiatan bisnis, ekonomi, maupun dalam kegiatan sehari-hari. Agar memudahkan
pemahaman, berikut ini diperkenalkan beberapa terminology yang berkaitan dengan
peluang.
1. Percobaan dan Kejadian (Experiment and Event)
Percobaan berkaitan dengan hal yang direncanakan untuk dikerjakan, hasil dari
percobaan disebut kejadian (event). Sebagai contoh kita melempar sekeping mata
uang logam dan mengamati sisi uang yang muncul. Dalam hal ini percobaan kita
adalah tindakan melempar uang sedangkan kejadiannya adalah munculnya sisi muka
atau sisi belakang uang yang merupakan hasil pelemparan.
2. Perumusan peluang
Perumusan besarnya peluang suatu kejadian dapat dilakukan dengan cara klasik,
cara frekuensi relative (obyektif), ataupun dengan cara subjective.
a. Perumusan Klasik
Pada perumusan peluang dengan cara klasik diberlakukan anggapan bahwa semua
kejadian dalam suatu percobaan mempunyai kesempatan yang sama untuk muncul,
dengan demikian :
P(E) = m/n
P(E) = peluang kejadian E
m = banyaknya kejadian E
n = banyaknya kejadian yang mungkin
Sebagai contoh, bilamana dilakukan pelemparan mata uang maka peluang
mendapatkan sisi muka adalah :
P(E) = m/n = ½
- 36 -
Computer for Statistic Systems
Dalam hal ini banyaknya kejadian sisi muka muncul (m) dalam satu kali pelemparan
uamg adalah satu sisi, sedangkan banyaknya kejadian yang mungkin muncul adalah
tampilnya sisi muka atau sisi belakang, sehingga n = 2.
b. Pendekatan Obyektif (Frekuensi Relatif)
Dalam pendekatan obyektif tidak diberlakukan anggapan bahwa semua kejadian
mempunyai kesempatan muncul yang sama. Peluang suatu kejadian ditentukan
dengan melakukan percobaan berulang kali, kemudian dicatat besarnya frekuensi
relative masing-masing kejadian. Atas dasar nilai frekuensi relative kejadian tertentu,
dapat diketahui besarnya peluang kejadian tersebut. Misalkan N adalah banyaknya
ulangan yang dilakukan pada suatu percobaan dan E adalah frekuensi munculnya
kejadian X dalam N ulangan tersebut, maka :
P(X) = f(X)/N = E/N
Contoh Aplikasi :
Dari 150 orang responden yang diminta pendapatnya tentang pendirian sebuah
pabrik kimia di kawasan Desa Windujanten, 50 orang diantaranya menyatakan
setuju. Jika dipilih satu orang secara acak dari kawasan tersebut, berapakah peluang
tidak setuju ?
Penyelesaian :
Misalkan E = f(X) = frekuensi responden yang tidak setuju
N = frekuensi keseluruhan, maka :
P(X) = E/N = 100/150 = 0,67
c. Pendekatan Subyektif
Dalam pendekatan subyektif, besarnya peluang suatu kejadian ditentukan atas dasar
intuisi, keyakinan diri, maupun informasi tidak langsung lainnya. Sebagai contoh,
dalam pertandingan tenis antara Steffi Graf dengan Yayuk Basuki, peluang Steffi Graf
memenangkan pertandingan adalah 0,85 sedangkan yayuk 0,15. Nilai-nilai peluang
tersebut ditentukan menurut subyektifitas penulis berdasarkan peringkat yang
dikeluarkan badan tenis dunia (peringkat steffi graff lebih tinggi daripada Yayuk
basuki). Tentu saja orang lain mungkinakan memberikan nilai peluang yang berbeda
karena bedanya intuisi maupun sumber-sumber penilaian yang digunakan.
3. Kejadian Dasar Dan Ruang Sampel
Dalam menghitung peluang suatu kejadian perlu dilakukan identifikasi secara detail
terhadap kejadian yang relevan dari suatu percobaan. Kejadian paling sederhana
yang merupakan hasil suatu percobaan disebut kejadian dasar. Kumpulan dari
semua kejadian dasar disebut ruang sample, sedangkan banyaknya kejadian dasar
yang mungkin disebut ukuran ruang sample. Dalam tindakan melempar sebuah mata
dadu berisi enam dan melakukan pengamatan atas hasil yang diperoleh, kejadian
- 37 -
Computer for Statistic Systems
dasar dari percobaan ini adalah munculnya salah satu sisi mata dadu. Sebagai ruang
samplenya adalah semua sisi mata dadu, sedangkan ukuran sampelnya adalah
banyaknya sisi dadu, yaitu 6.
4. Penghitungan Ukuran Ruang Sampel
Bila ukuran ruang sample yang dihadapi kecil, penghitungannya tidak sulit. Dengan
meningkatnya ukuran ruang sample ataupun kompleksitasnya, penghitungan makin
sukar. Tersedia beberapa cara untuk menghitung ukuran ruang sample yaitu cara
perkalian, permutasi, dan kombinasi.
a. Metode Perkalian
Misalkan ada k kejadian, kejadian 1 menghasilkan n1 cara, kejadian 2 menghasilkan
n2 cara, dan seterusnya kejadian k menghasilkan nk cara, maka banyaknya
keseluruhan cara adalah n1,n2,..nk
Contoh Aplikasi :
Manajer pembelian PT. Funtex merencanakan untuk membeli satu mesin spinning,
satu AC, dan satu mesin blowing. Bila tersedia 3 merk mesin spinning, 4 merk AC,
dan 2 merk mesin blowing, dalam berapa cara manajer tersebut akan menyusun
program?
Penyelesaian :
Dalam kasus ini k = 3 dan n1=3, n2=4, dan n3=2. Dengan demikian banyaknya
keseluruhan cara yang mungkin adalah 3x4x2 = 24 cara
b. Permutasi
Dalam permutasi, perbedaan letak susunan obyek akan membedakanarti dari
susunan tersebut. Dalam hal ini ABC harus dibedakan dengan BCA. Banyaknya
permutasi dari n obyek yang berbeda adalah n! (n factorial).
Contoh Aplikasi :
Bila ada 5 orang yang antri untuk membeli tiket suatu pertunjukkan, dalam berapa
carakah antrian tersebut dapat disusun ?
Penyelesaian :
Banyaknya cara 5 orang antri untuk membeli tiket suatu pertunjukkan adalah 5! =
5x4x3x2x1= 120 cara
Berkaitan dengan permutasi, banyaknya permutasi pada pengambilan r obyek dari n
obyek yang tersedia adalah :
nPr = n!/(n-r)!
Contoh aplikasi :
- 38 -
Computer for Statistic Systems
Dari 3 orang kandidat, dipilih hanya 2 orang yang akan ditempatkan sebagai
direktur dan wakil direktur. Berapakah kemungkinan cara yang dapat ditempuh?
Penyelesaian :
Banyaknya cara adalah = 3P2 = 3!/(3-2)! = 6 cara
Masih berkaitan dengan permutasi, banyaknya permutasi dari n obyek, dimana n1
berjenis 1, n2 berjenis 2,…, nk berjenis k, dimana n1+n2+…+nk = n adalah :
n!/(n1!xn2!x..xnk!)
Contoh aplikasi :
Bila dalam suatu showroom terdapat 10 buah mobil yang terdiri dari 3 mobil kijang, 3
mobil sedan, dan 4 pick up, dalam berapa carakah mobil-mobil tersebut dapat
disusun?
Penyelesaian :
Dalam hal ini n = 10, n1=3, n2=3, n3=4
Banyaknya cara penyusunan mobil dalam shoowroom tersebut adalah :
10!/(3!x3!x4!) = 4200 cara
c. Kombinasi (nCr)
Kombinasi adalah banyaknya kemungkinan yang dapat terjadi pada saat seseorang
melakukan pengambilan r obyek dari n obyek yang tersedia tanpa memperhatikan
susunannya. Dengan demikian, ABC sama saja dengan BCA.
nCr = n!/(r!(n-r)!)
Contoh aplikasi :
Bila dari 4 orang salesman akan dipilih 3 orang untuk ditempatkan di daerah Jakarta
Utara, berapakah cara yang mungkin ?
Penyelesaian :
Dalam hal ini n =4 dan r = 3. Banyaknya cara adalah :
4C3 = 4!/(3!(4-3)!) = 4 cara
5. Sifat Peluang
Misalkan A adalah kejadian, maka :
1. Nilai peluang A ada pada batas 0 sampai 1 (0≤P(A)≤1). Bila peluang A
mendekati 0, berarti kejadian A tersebut kecil kemungkinan terjadinya,
sebaliknya bila peluang A mendekati 1, maka kemungkinan A terjadi semakin
pasti
2. Nilai peluang komplemen dari suatu kejadian adalah satu dikurangi kejadian
tersebut (P(¯A)=1-P(A)
- 39 -
Computer for Statistic Systems
3. P(AuB) = P(A) + P(B) – P(A∩B)
Contoh aplikasi :
Peluang seorang staf pemasaran PT. Delima makan pagi adalah 0,8 dan peluang
seorang staf pemasaran PT. Delima minum susu adalah 0,7. peluang seorang staf
pemasaran PT. Delima yang sarapan pagi juga minum susu adalah 0,56. Atas dasar
informasi tersebut berapakah :
a. Peluang seorang staf pemasaran PT. Delima tidak minum susu?
b. Peluang seorang staf pemasaran PT. Delima sarapan pagi atau minum susu ?
Penyelesaian :
Misalkan A = kejadian seorang staf pemasaran PT. Delima makan pagi
B = Kejadian seorang staf pemasaran PT. Delima minum susu.
a. Peluang seorang staf pemasaran PT. Delima tidak minum susu adalah
P(¯B)= 1- 0,7 = 0,3
c. Peluang seorang staf pemasaran PT. Delima sarapan pagi atau minum susu
adalah :
P(AuB) = 0,8 + 0,7 – 0,56 = 0,94
6. Peluang Berbagai Kejadian
Dalam teori peluang, kejadian-kejadian yang mungkin muncul dibedakan menjadi
kejadian terpisah (mutually Exclusive event), Kejadian bebas (Independent event)
dan kejadian tak bebas (dependent event)
a. Kejadian terpisah
Dua kejadian A dan B disebut saling terpisah bila keduanya tidak mungkin terjadi
secara bersamaan sehingga P(A∩B)= 0
b. Kejadian bebas
Dua kejadian A dan B disebut bebas secara statistika bila nilai peluang kejadian A
tidak tergantung pada muncul atau tidaknya kejadian B.
Jika A dan B merupakan kejadian yang bebas secara statistika, maka :
P(A∩B)=P(A)xP(B)
Contoh aplikasi
Sebuah pabrik memiliki satu mesin potong dan satu mesin penghalus. Peluang mesin
potong dapat dipergunakan setiap saat diperlukan adalah 0,95 dan peluang mesin
penghalus tersedia pada waktu diperlukan adalah 0,90. Dalam hal terjadi produksi,
- 40 -
Computer for Statistic Systems
hitunglah peluang mesin potong dan mesin penghalus sama-sama bak dan siap
digunakan!
Misalkan A = kejadian mesin potong bisa digunakan
B = kejadian mesin penghalus bisa digunakan
Maka P(A) = 0,95 dan P(B) = 0,90. Karena A dan B keduanya bebas secara statistika
maka P(A∩B) = P(A) x P(B) = 0,95 x 0,90 = 0,855
c. Kejadian Tak Bebas
Dua kejadian A dan B disebut tak bebas bila kejadian yang satu dipengaruhi oleh
kejadian yang lainnya. Jika A dan B merupakan dua kejadian yang tidak bebas,
maka :
P(A\B)= P(A∩B)/P(B) disebut juga peluang bersyarat
Dalam hal ini P(A\B) merupakan peluang A setelah B terjadi. Sedangkan peluang B
setelah A terjadi adalah :
P(B\A) = P(A∩B)/P(A)
Dari kedua rumus diatas dapat dicari nilai peluang bersama A dan B yaitu :
P(A∩B) = P(B) ∙ P(A\B)
P(A∩B) = P(A) ∙ P(B\A)
Contoh aplikasi :
Peluang pesawat reguler berangkat tepat waktu adalah 0,83. Peluang penerbangan
mendarat tepat pada waktunya adalah 0,92 dan peluang penerbangan berangkat
dan mendarat tepat waktunya adalah 0,78. Hitunglah peluang suatu penerbangan :
a. Mendarat tepat waktu bila diketahui pesawat berangkat tepat waktu
b. Berangkat tepat waktu bila diketahui pesawat mendarat tepat waktu
Penyelesaian :
Misalkan A = kejadian pesawat berangkat tepat waktu, P(A)=0,83
B = kejadian pesawat mendarat tepat waktu, P(B)=0,92
P(A∩B) = 0,78
a. P(B\A) = P(A∩B)/P(A) = 0,78/0,83 = 0,94
b. P(A\B) = P(A∩B)/P(B) = 0,78/0,92 = 0,85
Teorema Bayes
Penggunaan kejadian tak bebas ini banyak dijumpai pada terapan teorema Bayes.
Untuk memahami teorema bayes diberikan contoh berikut :
Peluang terjadinya kelalaian memasang jaringan kabel pada suatu bangunan besar
adalah 0,05. Peluang terjadinya kebakaran kabel bila diketahaui terjadi kelalaian
- 41 -
Computer for Statistic Systems
pemasangan jaringan adalah 0,2, sedang peluang terjadinya kebakaran kabel tetapi
bukan karena kelalaian pemasangan jaringan adalah 0,01. terhadap suatu kebakaran
pada gedung besar yang diakibatkan oleh kebakaran kabel, ingin diteliti berapa
peluang kebakaran tersebut akibat kelalaian pada pemasngan jaringan. Penyelesaian
permasalahan tersebut dapat dilakukan dengan memanfaatkan teorema bayes.
Misalkan :
A = terjadi kelalaian pemasangan jaringan
B = terjadi kebakaran kabel
P(A) = 0,05 P(Ã) = 0,95
P(BIA) = 0,2 P(BI Ã) = 0,01
P(A) dan P(Ã) disebut peluang awal (prior probability). Yang menjadi pertanyaan
adalah P (AIB) yang disebut peluang posterior (posterior probability) karena dalam
hal ini sudah ada informasi tambahan yaitu sudah diketahui terjadinya kebakaran
disebabkan karena kebakran kabel.
Untuk mengetahui peluang posterior digunakan teorema bayes dengan formula
sebagai berikut :
P (A|B) = [P(A) P(B |A)] / [P(A) P(B|A) + P(Ã) P(B| Ã)
= 0,05 (0,02)/0,05 (0,02) + 0,95 (0,01) = 0,01/0,095 = 0,513
Catatan : bila kejadian à meliputi lebih dari satu kejadian, maka secara umum
teorema Bayes bisa dituliskan sebagai berikut :
P(Aj|B) = P(Aj) P(B|Aj) / P(A1) P(B|A1) + … + P(An) P(B|An)
3.2 Variabel Acak dan Nilai Harapan1. Variabel Acak
Variabel acak adalah variable berupa bilangan nyata yang variasi nilainya ditentukan
oleh suatu percobaan acak, sebagai contoh dalam dua kali pelemparan sekeping
mata uang, jika X = jumlah sisi muka yang muncul, maka X disebut variable acak
karena nilainya bisa berlainan sesuai dengan hasil pelemparan. Dalam hal ini
X={0,1,2}. Variabel acak kita bedakan menjadi :
variable acak deskret adalah variable yang dapat memiliki sejumlah nilai yang
dapat dihitung, misalnya himpunan {0,1,2,…,20}
variable acak kontinu adalah variable acak yang dapat memiliki nilai tak
terhingga, berkaitan dengan titik-titik dalam suatu interval.
Contoh variable acak deskret : jumlah mobil yang terjual setiap bulan, jumlah
kecelakaan di pabrik Luki setiap minggu, jumlah pelanggan took swalayan yang antri
- 42 -
Computer for Statistic Systems
diloket, dan sebagainya. Sedangkan contoh variable acak kontinu adalah lamanya
waktu perakitan di pabrik ENTRY, banyaknya minyak yang dipompa setiap jam,
banyaknya energi yang dihasilkan PLN setiap hari, dan lain-lain.
2. Nilai Harapan
Nilai harapan adalah ukuran pemusatan (rata-rata tertimbang) dari variable acak
yang telah didefinsikan sebelumnya. Karena variable acak terdiri deskret adan
kontinu, maka nilai harapan juga bisa berupa deskret dan kontinu.
Misalkan X adalah variable acak dan P(X) adalah peluang terjadinya variable acak X,
maka nilai harapan X adalah :
E(X) = ∑ X . P(X)
Keterangan :
E(X) = nilai harapan X
X = variable acak X
P(X) = Peluang variable acak X
Contoh aplikasi :
Seorang dealer mobil, setiap harinya menawarkan 5 buah mobil. Menurut catatan
penjualan mobil setiap harinya, peluang mobil yang terjual perharinya adalah :
Jumlah mobil perhari yang
terjual (X)P(X) X.P(X)
0
1
2
3
4
5
0,05
0,15
0,35
0,25
0,12
0,08
0,00
0,15
0,70
0,75
0,48
0,40
Berdasarlkan informasi yang diperoleh dari tabel di atas, dapat diperoleh nilai
harapan jumlah mobil yang terjual sebagai berikut :
E(X) = ∑ (X.P(X)) = 0(0,05) + 1(0,15)+2(0,35)+3(0,25)+4(0,12)+5(0,08)=2,48
Dengan demikian, nilai harapan jumlah mobil yang terjual adalah 2,48 mobil/hari ≈ 3
mobil dalam suatu hari tertentu.
Contoh Aplikasi
Pada kunjungan pertamanya ke sebuah pameran, seorang pelanggan akan membeli
sebanyak 2 atau 1 atau 0 buah produk masing-masing dengan peluang 0,3; 0,3; dan
0,4. Kunjungan kedua berlangsung bila pelanggan bersangkutan membeli 0 atau 1
buah produk pada kunjungan pertamanya. Jika ia membeli 1 buah produk pada
kunjungan pertama, maka ia akan membeli 1 atau 0 buah produk pada kunjungan
keduanya dengan peluang masing-masing 0,3 dan 0,7. Pelanggan yang membeli 0
- 43 -
Computer for Statistic Systems
buah produk pada kunjungan pertama akan membeli 2 atau 1 atau 0 buah produk
pada kunjungan keduanya dengan peluang 0,1, 0,3, dan 0,6. Bila diketahui tidak ada
kunjungan selanjutnya, tentukan nilai harapan jumlah produk yang dibeli setiap
pelanggan.
Penyelesaian :
Dalam permasalahan berangkai seperti ini, penggunaan diagram pohon untuk
menentukan nilai harapan akan memudahkan penyelesaian. Misalkan X=jumlah
produk yang dibeli seorang pelanggan, maka berdasarkan informasi yang ada dapat
disusun diagram pohon sebagai berikut :
X P(X) X P(X) X (PX) X.P(X)
2 0,3 2 0,3 0,60
1 0,3 1 0,3 2 0,09 0,18
0 0,7 1 0,21 0,21
2 0,1 2 0,04 0,08
0 0,4 1 0,3 1 0,12 0,12
0 0,6 0 0,24 0,00
Jumlah 1,19
Kunjungan I Kunjungan II Keseluruhan
Dari diagram pohon di atas diperoleh nilai harapan jumlah produk yang dibeli setiap
pelanggan adalah 1,19.
3. NILAI MONETER HARAPAN (EXPECTED MONETERY VALUE = EMV)
Nilai moneter harapan merupakan bentuk khusus dari nilai harapan bilamana
variable acaknya berupa nilai moneter.
Contoh aplikasi :
Seorang kontraktor memperoleh proyek pengerjaan gedung bertingkat tahun depan.
Dengan prakiraan bahwa keadaan ekonomi tahun depan tidak menentu, yang
bersangkutan membuat prakiraan biaya serta peluangnya sebagaimana tertera di
table berikut :
Keadaan Ekonomi Biaya (X) P(X)
Ekonomi Stabil
Ekonomi Tidak Stabil
$100.000
$150.000
0,7
0,3
Atas dasar prakiraan kontraktor tersebut, berapakah EMV biaya proyek tersebut.
Penyelesaian :
- 44 -
Computer for Statistic Systems
Untuk mendapatkan EMV, kita perlukan jumlah hasil kali biaya dengan peluangnya.
Bila table di atas diperluas, maka EMV = $115.000,-
Keadaan Ekonomi Biaya (X) P(X) X.P(X)
Ekonomi Stabil
Ekonomi Tidak Stabil
$100.000
$150.000
0,7
0,3
$70.000
$45.000
UKURAN PENYIMPANGAN VARIABEL ACAK
Berikut akan dibahas tentang ukuran penyimpangan variable acak dalam kaitannya
dengan nilai harapan suatu variable acak. Ulasan dilakukan terhadap ukuran
penyimpangan variable acak yang sering digunakan dalam aplikasi, yaitu Standar
Deviasi dan koefisien Variasi Variabel Acak (KV).
1. Standar Deviasi
Konsep standar deviasi yang digunakan di sini tidak berbeda dengan konsep yang
telah dibahas sebelumnya, hanya saja tinjauan di sini dilihat dalam kaitannya dengan
nilai harapan :
σ=√E(X2) – (E(X))2
σ= standar deviasi
E(X) = nilai harapan X
E(X2) = nilai harapan X2
E(X2) = ∑(X2.P(X)
2. Koefisien Variasi variabel Acak
Nilai koefisien variasi variabel acak diperoleh melalui rumus :
KV = σ/(E(X)) x 100%
Contoh aplikasi
Untuk contoh aplikasi sebelumnya dapat dicari nilai ukuran penyimpangannya
sebagai berikut. Untuk mudahnya, tabel sebelumnya disajikan kembali dalam format
yang diperluas :
Keadaan Ekonomi Biaya (X) P(X) X.P(X) X2.P(X)
Ekonomi Stabil
Ekonomi Tidak Stabil
Jumlah
$100.000
$150.000
0,7
0,3
$70.000
$45.000
$115.000
$7000 juta
$6.750 juta
$13.750 juta
Standar deviasi = σ = √ (13.750 juta – 115.0002) = $22.912,88
Koefisien Varias = KV = 22.912,88/115.000 x 100% = 19,92%
- 45 -
Computer for Statistic Systems
4. KRITERIA KEPUTUSAN DENGAN NILAI HARAPAN
Konsekuensi-konsekuensi yang mungkin timbul dari suatu kejadian disebut Payoff.
Dalam pengambilan keputusan di bidang bisnis, payoff sering dibuat dalam satuan
mata uang, baik untuk laba, biaya, maupun hal-hal lainnya. Sebagai ilustrai :
Misalkan seorang pengecer berada pada kondisi apakah ia akan membeli stok yang
banyak atau sedikit saja untuk menghadapi musim kemarau panjang mendatang.
Pengecer tersebut memperkirakan dua kemungkinan di musim kemarau mendatang,
yaitu permintaan tinggi atau permintaan rendah dengan kemungkinan laba masing-
masing seperti terlihat pada table berikut :
Membeli banyak (A) Membeli Sedikit (B)
Permintaan Tinggi
Permintaan Rendah
$20.000
-$6.000
$10.000
$5.000
Informasi yang diperoleh dari table tersebut menunjukkan bahwa tingkat laba sangat
ditentukan oleh kemungkinan permintaan. Selain itu, atas dasar pengalaman para
ahli ekonomi, diketahui bahwa peluang permintaan tinggi adalah 0,6 dan peluang
permintaan rendah adalah 0,4. Untuk memilih kegiatan yang akan dilakukan
pengecer tersebut, dapat dicari nilai EMV dari masing-masing kegiatan dan
membandingkannya.
Nilai EMV(A) = $9.600 dan EMV (B) = $8.000. Karena EMV(A)>EMV(B), maka bagi
pengecer tersebut akan lebih menguntungkan apabila ia membeli banyak.
Selain dengan cara diatas, cara lain yang dapat dipergunakan adalah menggunakan
diagram pohon seperti berikut :
Kegiatan Kemungkinan Peluang Payoff EMV
Membeli
banyak
Permintaan
Tinggi
0,6 $20.000 $12.000
Permintaan
Rendah
0,4 -$6.000 -$2.400
$9.600
Membeli
sedikit
Permintaan
Tinggi
0,6 $10.000 $6.000
Permintaan
Rendah
0,4 $5.000 $2.000
$8.000
3. DISTRIBUSI PELUANG
- 46 -
Computer for Statistic Systems
Hubungan antara nilai variable acak dan peluangnya dicerminkan oleh distribusi
peluang yang dalam hal ini dapat dianalogkan dengan frekuensi relative acak. Secara
umum distribusi peluang dibedakan menjadi distribusi peluang deskret yaitu
distribusi peluang untuk variabel acak diskret dan distribusi peluang kontinu adalah
distribusi peluang untuk variable acak kontinu.
a. Distribusi Peluang Binomial
Berikut adalah cirri-ciri distribusi peluang Binomial :
1. Percobaan terdiri dari n ulangan dan setiap ulangan hanya menghasilkan
satu dari dua kategori, yaitu sukses atau gagal. Hasil seperti ini sering
disebut proses Bernoulli. Jika p merupakan peluang sukses, maka peluang
gagalnya (q) adalah 1-p.
2. Setiap ulangan merupakan kejadian yang bebas secara statistika, sehingga
peluang sukses setiap ulangannya konstan.
Jika x menyebar menurut distribusi Binomial, maka :
p(x) = n!/x! (n-x)! . px qn-x
n = banyaknya ulangan
p= peluang sukses
q = peluang gagal
x = variabel acak (1,2,....)
Contoh aplikasi :
Pada perusahaan ASTER, 20 persen karyawannya dikategorikan sebagai pekerja
yang baik, jika dipilih 15 karyawan secara acak, berapakah peluangnya :
a. 4 orang karyawan berkategori baik?
b. Paling sedikit 2 orang berkategori baik?
c. Tidak lebih dari 1 orang berkategori baik?
Penyelesaian :
Karena karyawan perusahaan ASTER dalam hal ini digolongkan menjadi baik dan
tidak baik, maka distribusi peluang dari karyawan perusahaan ASTER dapat
dikategorikan sebagai distribusi peluang Binomial, dimana n = 15, p=0,2 (peluang
karyawan berkategori baik) dan q=0,8 (peluang karyawan berkategori tidak baik).
a. Bila x mewakili banyaknya karyawan berkategori baik, maka x=4
P(x=4) = 15!/ (4!.11!) (0,2)4(0,8)11 = 0,19
b. Dalam kaitannya dengan pertanyaan b, maka x ≥ 2.
P(x ≥ 2) = 1 – P(x<2) = 1-[P(x=0) + P(x=1)]
P(x=0) = 15!/0! . 15! (0,2)0(0,8)15 = 0,035
P(x=1) = 15!/1! . 14! (0,2)1(0,8)14 = 0,132
- 47 -
Computer for Statistic Systems
Maka P(x≥2) = 1 – (0,035 + 0,132) = 0,833
c. Untuk kasus c, dalam hal ini x≤1.
P(x≤1) = P(x=0) + P(x=1) = 0,035 + 0,132 = 0,167
b. Distribusi Peluang Poisson
Distribusi Poisson memiliki karakteristik :
1. Terdiri dari n ulangan
2. Parameter penentu hanya satu yaitu nilai rata-rata (µ)
3. Variabel terkait pada umumnya berkaitan dengan selang waktu kedatangan
atau daerah tertentu
4. Setiap ulangan harus bebas satu sama lain.
Misalkan x menyebar mengikuti distribusi peluang Poisson, maka peluang tepat x
yang akan terjadi adalah :
P(x) = µx ∙ e-µ / x!
Dalam hal ini :
µ = rata-rata waktu kedatangan (selang waktu tertentu)
x = variabel acak
e = bilangan natural = 2,718
Contoh Aplikasi :
Dalam dua bulan, rata-rata karyawan tidak masuk kerja adalah 4 hari. Jika
diasumsikan jumlah hari tidak masuk kerja mengikuti distribusi Poisson, hitunglah :
a. Peluang seorang karyawan tidak masuk kerja 3 hari dalam dua bulan!
b. Peluang seorang karyawan tidak masuk kerja 3 hari dalam sebulan!
Penyelesaian :
a. P(x=3) = 43 ∙ e-4 / 3! = 0,195
b. P(x=3) = 23 ∙ e-2 / 3! = 0,18
c. PENDEKATAN DISTRIBUSI POISSON PADA DISTRIBUSI BINOMIAL
Distribusi Poisson dapat digunakan untuk mendekati distribusi Binomial pada kondisi
tertentu, yaitu bila n besar (rule of thumb, n>20) dan p terlalu kecil (p<0,05) atau
bahkan terlalu besar (p>0,95). Bila distribusi Poisson digunakan untuk mendekati
distribusi Binomial, maka µ = np.
Contoh Aplikasi :
Dalam satu partai produk (terisi 2000 buah produk), dijumpai 20 buah produk cacat.
Bila dari partai produk tersebut diambil 100 buah produk secara acak, berapa
peluang tidak dijumpai peroduk cacat?
- 48 -
Computer for Statistic Systems
Penyelesaian :
Distribusi yang dihadapi adalah distribusi Binomial, karena produk bersangkutan
hanya dapat diklasifikasikan dalam dua kategori, yaitu cacat atau tidak. Dalam hal ini
n = 100 dan p = 20/2000 = 0,01. Kaena dalam kasus ini n besar dan p kecil, maka
penyelesaian dapat dilakukan dengan pendekatan distribusi Poisson.
Dalam hal ini µ = np = 100(0,01) = 1
Maka P(x=0) = 10 ∙ e-1/0! = 0,37
d. DISTRIBUSI PELUANG NORMAL
Dua distribusi yang dibahas terdahulu merupakan bagian dari distribusi peluang
diskret. Berikut akan diulas distribusi peluang Normal yang merupakan bagian dari
distribusi peluang kontinu. Distribusi Peluang Normal dikembangkan oleh Karl Gauss,
sehingga sering disebut Peluang Gauss.
Berikut adalah karakteristik dari distribusi peluang Normal :
a) Kurva distribusi Normal hanya mempunyai satu puncak (unimodal)
b) Nilai rata-rata tepat berada pada pusat (tengah) kurva
c) Kurva distribusi Normal bersifat simetris sehingga nilai rata-rata = median =
modus
d) Kurva distribusi normal asmptot terhadap sumbu mendatar (hampir
menyentuh tetapi tidak pernah menyentuh)
Kurva distribusi Peluang Normal
Bentuk dan ketinggian kurva distribusi peluang Normal ditentukan oleh besarnya
standar deviasi distribusi data. Semakin besar standar deviasinya semakin mendatar
bentuk kurvanya dan semakin melebar kurvanya, sebaliknya semakin kecil nilai
standar deviasinya semakin tinggi puncak kurvanya dan semakin sempit kurvanya.
- 49 -
MeanMedianModus
Computer for Statistic Systems
Perbedaan nilai rata-rata akan menyebabkan perbedaan nilai tengah kurva yang
berpengaruh ke pergeseran kurva tanpa mengubah bentuk ketinggian kurva
tersebut.
e. PENENTUAN NILAI PELUANG
Sebagaimana telah disinggung sebelumnya, bagi data yang berdistribusi Normal,
dengan menggunakan kaidah empiris diperoleh kondisi berikut :
Sebanyak 68% data berada pada batas x ± S
Sebanyak 95% data berada pada batas x ± 2S
Sebanyak 99,7% data berada pada batas x ± 3S
Dengan kaidah empiris, nilai-nilai peluang yang diberikan hanya untuk satu, dua, dan
tiga kali standar deviasi di sekitar nilai rata-ratanya. Nilai peluang lain yang berada di
luar konteks kaidah empiris, dapat dicari dengan rumus distribusi peluang Normal
atau dengan tabel distribusi peluang Normal Baku. Tahapan penggunaan tabel
distribusi peluang Normal baku akan dibahas melalui contoh berikut :
Misalkan, suatu data sampel menyebar mengikuti distribusi normal dengan nilai rata-
rata 50 dan standar deviasi 25. Atas dasar informasi tersebut, carilah :
a. P(50 ≤ x ≤ 62)
b. P(x ≥ 55)
c. P(x < 40)
d. P(45 ≤ x ≤ 60)
e. Berapakah x merupakan data terkecil dari 10 persen data terbesar?
Penyelesaian :
a. Transformasi data semula ke skor baku
Z50 = (x - x‾)/S = (50 – 50)/25 = 0
Z62 = (x - x‾)/S = (62 – 50)/25 = 0,48
Sehingga P(50 ≤ x ≤ 62) = P(0 ≤ Z ≤ 0,48)
Tampilan dalam grafik distribusi Normal
- 50 -
0 0,48
Computer for Statistic Systems
Perhatikan tabel Normal baku (Z). Nilai-nilai dalam table tersebut adalah luas daerah
Z=0 hingga suatu nilai tertentu.
Z 0,00 0,01 … 0,08 0,09
0,00,10,20,30,4 0,18440,5dst
Maka P(50 ≤ x ≤ 62) = P(0 ≤ Z ≤ 0,48) = 0,1844
b. Untukl menyelesaikan masalah ini kita ubah permasalahan ke bentuk baku
P(x ≥ 55)
Z55 = (55-50)/25 = 0,2
P(x ≥ 55) = P(Z ≥ 0,2)
Tampilan dalam grafik distribusi normal
Perhatikan bahwa P(Z ≥ 0,2) = 0,5 – P(0 ≤ Z ≤ 0,2) = 0,5 – 0,0793 = 0,4207
c. P(x ≤ 40)
Z40 = (x-50)/25 = -0,4
Maka P(x ≤ 40) = P (Z ≤ -,04) = P(Z > 0,4)
= 0,5 – P(0 ≤ Z ≤ 0,4)
= 0,5 – 0,1554 = 0,3446
- 51 -
0 0,2
Computer for Statistic Systems
Tampilan dalam grafik Normal baku
d. P(45 ≤ x ≤ 60)
Z45 = -0,2 dan Z60 = 0,4
Maka P(45 ≤ x ≤ 60) = P (-0,2 ≤ Z ≤ 0,4)
= P (-0,2 ≤ Z ≤ 0) + P (0 ≤ Z ≤ 0,4)
= P (0 ≤ Z ≤ 0,2) + P (0 ≤ Z ≤ 0,4
= 0,0793+0,1554 = 0,2347
e. P(x ≥ ?) = 0,1 (perhatikan bahwa kasus ini merupakan kebalikan dari yang
terdahulu)
P(Z ≥ ?) = 0,1 atau P (0 ≤ Z ≤ ?) = 0,5 – 0,1 = 0,4
Dari tabel Z = 1,29
1,29 = (x-50)/25 x = 82,25
f. PENDEKATAN DISTRIBUSI PELUANG NORMAL PADA DISTRIBUSI
BINOMIAL
Distribusi peluang Normal merupakan distribusi peluang kontinu, namun dapat
digunakan sebagai pendekatan bagi distribusi peluang Binomial yang merupakan
distribusi peluang diskret. Agar pendekatan berjalan baik, n harus besar dan p
mendekati 0,5. Perlu pula melibatkan koreksi kekontinuan dengan cara
menambahkan 0,5 untuk tiap batas kiri dan batas kanan selang atau titik yang akan
dicari. Koreksi kekontinuan ini diperlukan untuk penyesuaian dari distribusi. Dengan
menggunakan distribusi peluang Normal sebagai pendekatan untuk distribusi
peluang Binomial, diperoleh hubungan parameter kedua distribusi peluang sebagai
berikut :
μ = np
= √npq
Contoh Aplikasi :
- 52 -
00,4
Computer for Statistic Systems
Peluang seorang wiraniaga berhasil melakukan transaksi adalah 0,6. Bila 100
wiraniaga mengunjungi pelanggan, hitunglah peluang
a. lebih setengahnya berhasil melakukan transaksi
b. 70 orang melakukan transaksi
Penyelesaian :
Hasil terjadinya suatu transaksi mengikuti distribusi peluang Binomial. Dalam hal ini
n = 100 dan p = 0,6 (n besar dan p mendekati 0,5). Penyelesaian keadaan ini dapat
didekati dengan distribusi peluang Normal dengan :
μ = np = 100(0,6) = 60
= √npq = √100x0,6x0,4 = 4,9
a. P(x > 50)
Dengan menerapkan koreksi kekontinuan menjadi P(x > 50,5)
Z50,5 = (50,5-60)/4,9 = -1,94
P(x > 50,5) = P(Z > -1,94) = 0,5 + P(0 ≤ Z ≤ 1,94)
= 0,5 + 0,4738 = 0,9738
b. P(x=70) menjadi P(69,5 ≤ x ≤ 70,5)
Z69,5 = 1,94 dan Z70,5 = 2,04
c. Maka P(69,5 ≤ x ≤ 70,5) = P(1,94 ≤ Z ≤ 2,04
= P(0 ≤ Z ≤ 2,04) - P(0 ≤ Z ≤ 1,94)
= 0,4793 – 0,4738 = 0,0055
g. DISTRIBUSI NORMAL DARI SAMPEL
Bila dari suatu populasi diambil sample berulang-ulang, maka pada tiap sample
dapat dihitung nilai meannya (x1,x2,…dst). Menurut teori limit pusat, sejumlah mean
sample ini akan mengikuti distribusi Normal, bila banyaknya individu sample cukup
besar. Besar mean-mean sample ini juga akan bervariasi, dan variabilitasnya disebut
standar error dengan symbol x untuk populasi dan Sx untuk sample. Mean sample ini
dapat juga diubah menjadi nilai Z melalui konversi berikut :
Z = (x – μ)/x
Besarnya standard error dari mean adalah :
Untuk populasi x = √ 2/n = /√n
Untuk sample Sx = √ S2 / n = S/√n
Dengan menggunakan sample satu kali dapat diduga besarnya standard error.
Dengan menafaatkan tabel Z, dapat pula diketahui besarnya peluang nilai mean
akan melebihi nilai tertentu.
4. DISTRIBUSI t SUDENT
- 53 -
Computer for Statistic Systems
Gosset menemukan bahwa penggunaan standar deviasi sample (S) untuk menduga
besarnya standar deviasi populasi () dalam menghitung nilai Z untuk tabel distribusi
Normal Baku, tidak berlaku untuk sample yang sedikit, sehingga saat menghadapi
keadaan demikian diperlukan tabel lain. Hal ini karena untuk individu sample yang
kurang dari 30, nilai S sangat bervariasi dari sample yang satu sample ke sample
lain. Bila ukuran individu sample 30 atau lebih, nilai S yang dihitung boleh dikatakan
stabil. Gosset telah membuat tabel yang berisikan nilai-nilai t untuk pelbagai ukuran
individu sample dengan pelbagai nilai peluang. Jadi bila ukuran individu sample
kurang dari 30, maka nilai Z diubah menjadi nilai t karena tidak mengikuti distribusi
Normal, melainkan mengikuti distribusi t Student. Rumus yang dipakai adalah :
t = (x – μ )/Sx = (x – μ)/ (S / √n
Distribusi t Student untuk berbagai derajat bebas
Dari grafik diatas terlihat bahwa bentuk kurva t itu simetris. Tapi, bentuknya lebih
mendatar (puncaknya lebih rendah) dan ekornya lebih lebar daripada kurva normal.
Bila Ukuran individu sample bertambah besar, distribusi t mendekati distribusi
Normal. Kenyataan ini dapat dilihat pada tabel t dengan derajat bebas, nilai t sama
dengan nilai Z. Sifat penting dari distribusi t untuk sample yang diambil dari populasi
yang mengikuti distribusi Normal adalah tidak terdapatnya hubungan anatar S dan x
(hubungan ini hanya terdapat pada distribusi yang tidak normal). Tabel distribusi t
banyak digunakan untuk menduga parameter μ, dan pengujian nilai tengah
perlakuan. Penggunaan tabel t berbeda dengan tabel Z. Pada tabel Z, nilai Z
ditempatkan pada sisi tabel. Sebaliknya, pada tabel t, nilai t ditempatkan pada
bagian dalam dan peluangnya pada sisi atas. Sisi kiri tabel t merupakan derajat
bebas. Nilai derajat bebas ini tergantung pada besarnya ukuran sample.
Misalnya, pada suatu penelitian yang ingin menduga nilai rata-rata, diambil sample
sebanyak 15. Berapakah nilai t agar P(T>t)=0,05? (derajat bebas dalam hal ini
- 54 -
0 t
v = 120
v = 120 normal
v = 5
Computer for Statistic Systems
dilambangkan dengan v=n-1). Dalam permasalahan ini, dapat dilihat tabel t untuk
v=15-1=14, dan luas area ekor=0,05. Terlihat nilai perpotongannya adalah 1,761
adalah 0,05.
5. Distribusi Khi Kuadrat (2)
Distribusi Khi Kuadrat adalah distribusi untuk variable kontinu 2 yang besarnya sama
dengan jumlah kuadrat dari sejumlah nilai Z untuk X yang menyebar Normal.
2 = Z2 = (x-μ)/]2 atau
2 = (n-1)S2/2
Nilai Khi Kuadrat berawal dari nol sampai tak terhingga. Jadi agak berbeda dengan
distribusi t. Bentuk kurvanya bermacam-macam, tergantung pada derajat bebasnya.
Distribusi Khi Kuadrat
Semakin besar derajat bebasnya, semakin simetri bentuk kurvanya. Tabel distribusi
Khi Kuadrat diperlukan untuk menduga besarnya ragam populasi atas dasar sample
yang terambil secara acak. Selain itu juga banyak digunakan pada statistika non
parametric, terutama untuk data yang berskala ukur nominal.
6. Distribusi Rasio Ragam F (Distribusi F)
Distribusi F adalah distribusi variable kontinu, dengan F merupakan rasio dari ragam
sample yang diambil secara acak dari populasi Normal. Penemu distribusi F adalah
R.A Fisher. Bentuk distribusi F tidak hanya satu macam, melainkan berubah-ubah
tergantung pada derajat bebas kedua ragamnya.
- 55 -
Computer for Statistic Systems
Distribusi F
Rumus F adalah : F = S12/ S2
2
Tabel distribusi F banyak digunakan untuk pengujian rata-rata lebih dari dua
perlakuan, terutama pada Analysis Of Variance dan analisis regresi. Selain itu
distribusi F juga digunakan untuk menguji kesamaan dua ragam. Penggunaan tabel F
hampir sama dengan tabel t dan tabek khi kuadrat. Bedanya, Tabel F mempunyai
dua derajat bebas.
- 56 -
Computer for Statistic Systems
BAB IV.
ANGKA INDEKS
Angka Indeks merupakan nilai perbandingan perubahan relative yang dinyatakan
dalam bentuk persentase terhadap yang lain. Angka indeks ini digunakan untuk
membandingkan suatu perubahan dari periode ke periode. Periode yang digunakan
dapat berupa tahun, bulan, atau satuan pengukuran lain. Dalam ilmu ekonomi,
indeks harga, indeks kuantitas, dan indeks nilai seringkali digunakan. Dalam indeks
harga dicermati perubahan harga antarperiode. Dalam indeks kuantitas dicermati
perubahan kuantitas dari suatu period eke periode lain, misalnya perkembangan
kuantitas penjualan, kuantitas produksi, dan sebagainya.
4.1 Angka Indeks Relatif
Angka indeks relative digunakan bila kita ingin melihat perubahan kondisi suatu
komoditi dari berbagai periode. Dalam hal ini pusat perhatian kita hanya pada satu
komoditi. Misalnya untuk perhitungan indeks harga, perubahan harga yang dimaksud
adalah perubahan harga untuk komoditi bersangkutan, dan tidak mencerminkan
perubahan harga secara umum.
Rumus Indeks Relatif Harga : I = Pn/P0 . 100
Dengan :
I = Indeks relative Harga
Pn = harga periode berjalan
Po = Harga periode dasar
Contoh Aplikasi :
Berikut ini data harga kopi bubuk perkilogram dari tahun 1990 sampai 1996.
Tentukan indeks relative harga komoditi tersebut, dengan tahun 1990 sebagai tahun
dasar.
Tahun Harga per kg($) Relatif ke th 1990 Indeks Relatif
- 57 -
Computer for Statistic Systems
1990
1991
1992
1993
1994
1995
1996
0,94
0,90
0,82
0,78
0,74
0,76
0,80
1,00
0,96
0,87
0,83
0,79
0,81
0,85
100
96
87
83
79
81
85
Catatan : Bila lebih dari satu komoditi bisa juga dicari rata-rata indeks relatifnya
sebagai berikut :
I = Pn/P0/k k = banyaknya komoditi
4.2 Angka Indeks Agregatif
Indeks sederhana biasanya digunakan bila semua komoditi dapat dianggap sama
pentingnya (bobotnya). Dalam angka indeks agregatif sederhana penekanan ulasan
ulasan diberikan pada nilai harga ataupun kuantitas sehingga dikenal indeks harga
agregatif sederhana dan indeks kunatitas agregatif sederhana.
a. Indeks Harga Agregatif Sederhana (Ip)
Indeks harga agregatif sederhana diperoleh melalui rumus :
Ip = Pn/P0 . 100
Keterangan :
Ip = indeks harga pada period eke-n
Pn = Harga pada periode berjalan
P0 = harga pada periode dasar
Meskipun angka indeks itu sendiri ditulis dalam persen atau tidak, interpretasi angka
indeks adalah peningkatan atau penurunan persentase.
Contoh Aplikasi :
Berikut angka tabel harga dan volume penjualan 5 jenis barang pada tahun 1996 dan
1997.
Jenis
Barang
Harga ($) Volume (ton)
1996 1997 1996 1997
A 100 120 60 55
- 58 -
Computer for Statistic Systems
B
C
D
E
300
250
260
150
301
225
263
160
70
90
100
90
69
85
105
80
Jumlah 1060 1069 410 394
Besar indeks harga ke lima barang adalah :
Ip = Pn/P0 . 100 = [1069/1060] . 100 = 100,85
Dalam hal ini dijumpai adanya kenaikan harga kelima barang sebesar 0,85% dari
tahun 1996 ke tahun 1997.
b. Indeks Kuantitas Agregatif Sederhana (Iq)
Indeks Kuantitas agregatif sederhana diperoleh melalui rumus :
Iq = Qn/Q0 . 100
Keterangan :
Iq = Indeks kuantitas pada period eke-n
Qn = kuantitas pada periode berjalan
Q0 = kunatitas pada periode dasar
Contoh Aplikasi :
Atas dasar tabel diatas, besarnya indeks volume penjualan adalah :
Iq = Qn/Q0 . 100 = [394/410] . 100 = 96,10.
Dari tahun 1996 ke tahun 1997 terjadi penurunan volume penjualan sebesar 3,9%.
4.3 Indeks Agregat Berbobot
Angka Indeks berbobot merupakan angka indeks yang paling banyak digunakan
karena dalam kenyataannya tidak semua komoditi dapat dianggap sama penting.
Tingkat (nilai) kepentingan dari komoditi tersebut dapat tercermin dari kuantitas
untuk indeks harga atau harga untuk indeks kuantitas, atau dapat juga tercermin
dari criteria lainnya. Nilai penting inilah yang digunakan sebagai pebobot.
Rumus Umum :
a. Indeks harga agregat berbobot I = ∑ Pn W / ∑ Po W x 100;
W = pembobot
b. Indeks harga rata-rata relative berbobot I = ∑ Pn/Po x W / ∑ W x 100
- 59 -
Computer for Statistic Systems
4.3.1 ANGKA INDEKS LASPEYERS
Angka indeks Laspeyers adalah indeks harga yang diboboti kuantitas tahun dasarnya
atau indeks kuantitas yang diboboti harga tahun dasarnya. Karena pembobotnya
harga atau kuantitas barang pada tahun dasarnya, maka nilai indeks ini cenderung
lebih besar (over-estimate) karena harga dan kuantitas barang cenderung naik dari
waktu ke waktu.
a. Indeks Harga Laspeyers (LP)
Indeks harga Laspeyers diperoleh melalui rumus :
LP = ∑ Pn Qo / ∑ Po Qo x 100
Keterangan :
LP = indeks harga Laspeyers
Pn = Harga pada tahun berjalan
Po = Harga pada tahun dasar
Qo = Kuantitas pada tahun dasar
b. Indeks Kuantitas Laspeyers (LQ)
Indeks kuantitas Laspeyers diperoleh melalui rumus :
LQ = ∑ Po Qn / ∑ Po Qo x 100
Keterangan :
LQ = indeks kuantitas Laspeyers
4.3.2 ANGKA INDEKS PAASCHE
Angka indeks Paasche adalah angka indeks harga yang diboboti kuantitas tahun
berjalan atau angka indeks kuantitas yang diboboti harga tahun berjalan. Nilai yang
diperoleh cenderung lebih rendah karena naiknya harga cenderung menurunkan
permintaan akan barang.
a. Indeks Harga Paasche (PP)
Indeks harga Paasche diperoleh melalui rumus :
PP = ∑ Pn Qn / ∑ Po Qn x 100
Keterangan :
PP = indeks harga Paasche
Pn = Harga pada tahun berjalan
Po = Harga pada tahun dasar
Qo = Kuantitas pada tahun dasar
- 60 -
Computer for Statistic Systems
b. Indeks Kuantitas Paasche (PQ)
Indeks kuantitas Paasche diperoleh melalui rumus :
PQ = ∑ Pn Qn / ∑ Pn Qo x 100
Keterangan :
PQ = indeks Kuantitas Paasche
Contoh Aplikasi :
Pada data yang tertera di tabel sebelumnya, dapat dicari indeks harga dan kuantitas
menurut Laspeyers dan Menurut Paasche. Tabel tersebut ditampilkan kembali dalam
bentuk yang diperluas untuk memudahkan penghitungan.
Jenis
Barang
Harga ($) Volume (ton)
PoQo PoQn PnQo PnQn1996
(Po)
1997
(P1)
1996
(Qo)
1997
(Q1)
A
B
C
D
E
100
300
250
260
150
120
301
225
263
160
60
70
90
100
90
55
69
85
105
80
6000
21000
22500
26000
13500
5500
20700
21250
27300
12000
7200
21070
20250
26300
14400
6600
20769
19125
27615
12800
Jumlah 1060 1069 410 394 89000 86750 89220 86909
Indeks Harga Laspeyers (LP)
LP = ∑ Pn Qo / ∑ Po Qo x 100
= (89220/89000) x 100 = 100,25
Indeks Kuantitas Laspeyers (LQ)
LQ = ∑ Po Qn / ∑ Po Qo x 100
= ( 86750/89000) x 100 = 97,47
Indeks Harga Paasche (PP)
PP = ∑ Pn Qn / ∑ Po Qn x 100
= (86909/86750) x 100 = 100,18
Indeks Kuantitas Paasche (PQ)
- 61 -
Computer for Statistic Systems
PQ = ∑ Pn Qn / ∑ Pn Qo x 100
= (86909/89220) x 100 = 97,41
4.4 Indeks Berantai
Angka Indeks yang disusun secara berantai dari tahun ke tahun disebut indeks
rantai. Penyusunan Indeks Rantai bisa dilihat dalam contoh aplikasi berikut :
Berikut ini data harga per kilogram (P) dan kuantitas dalam ton (Q) untuk tiga komoditi
pangan dari tahun 1990 sampai 1993.
Komoditas
1990 1991 1992 1993
Harga
($)Kuantitas
Harga
($)Kuantitas
Harga
($)Kuantitas
Harga
($)Kuantitas
Beras
Tepung
Jagung
0,20
0,12
0,06
800
750
455
0,25
0,13
0,06
807
755
455
0,24
0,14
0,06
905
755
470
0,40
0,30
0,10
910
780
500
Penghitungan Indeks Rantai diawali dengan membuat tabel untuk tahun berpasangan dari
tahun ke tahun sebagai berikut :
Harga x Kuantitas
Agregat
IA =
PnQ0/P0Q0
x 100%
Indeks
Rantai (IR)Beras Tepung Jagung
1990
1991
1991
1992
1992
1993
160
200
201,75
193,68
217,20
362,00
90
97,5
98,15
105,70
105,70
226,5
27,3
27,3
27,3
27,3
28,2
47
277,30
324,80
327,20
326,68
351,10
635,50
100
117,1
100
99,8
100
181
100
117,1
116,9
211,6
Keterangan :
a) Untuk setiap pasang tahun dihitung :
1. PoQo untuk tahun pertama
2. PnQo untuk tahun kedua
Perhitungan ini dilakukan untuk masing-masing komoditi
b) Kolom agregat adalah penjumlahan semua komoditi untuk tiap tahun
c) Kolom Berikutnya IA = Pn Q0/P0 Q0 x 100% adalah untuk menghitung indeks
tiap pasang tahun
d) Indeks Rantai dihitung dengan rumus :
IRn = Indeks Rantai waktu ke-t
IRn = Indeks pada waktu ke-t
- 62 -
Computer for Statistic Systems
IRn-1 = Indeks Rantai pada waktu ke –(t-1)
Untuk data diatas nilai indeks rantai diperoleh sebagai berikut :
100 x (117,1/100) = 117,1
117,1 x (99,8/100) = 116,9
116,9 x (181/100) = 211,6
4.5 Upah Nyata
Sering terjadi keluhan karyawan yang mengatakan, walaupun gajinya naik dari tahun
ke tahun tetapi dia merasakan daya belinya tetap atau bahkan menurun.
Mungkinkah itu terjadi? Mungkin saja bila kenaikan gajinya tidak sebanding dengan
kenaikan indeks biaya hidup di daerah domisilinya.
Pendeflasian indeks biaya hidup pada upah dalam bentuk uang inilah yang disebut
upah nyata. Jadi, walaupun gaji naik dari tahun ke tahun, bisa saja upah nyatanya
malahan turun, yang berakibat daya belinya menurun.
Contoh Aplikasi :
Berikut ini upah rata-rata/tahun/orang dan indeks biaya hidup disuatu daerah :
Tahun Upah/tahun/orang Indeks Biaya Hidup Upah Nyata
I
II
III
600.000
670.000
700.000
100
150
155
600.000
446.667
580.645
Keterangan :
Bila dilihat dari tahun ke I ke tahun II, walaupun gajinya naik tetapi upah
nyatanya menurun karena kenaikan indeks biaya hidup melebihi kenaikan gaji
sehingga daya belinya menurun.
Dari tahun II ke III, ternyata kenaikan upah uang sebesar :
(700.000-670.000)/670.000 x 100% = 4,47% lebih besar dari kenaikan Indeks
biaya hidup sehingga daya belinya naik.
Kenaikan indeks biaya hidup :
(155-150)/150 x 100% = 3,33%, nilai ini bisa digunakan sebagai ukuran inflasi
dari tahun II ke III
- 63 -
Computer for Statistic Systems
4.6 Indeks Produktifitas
Dalam bisnis dan ekonomi pengertian produksi adalah jumlah atau banyaknya output
yang dihasilkan suatu proses produksi sedangkan produktivitas adalah rasio antara
output dengan input. Sebagai contoh, bila 20 pekerja menghasilkan 320 kursi dalam
800 jam (40 jam untuk tiap pekerja), maka produksinya adalah 320 kursi, tetapi
produktivitasnya adalah 0,4 kursi perjam tenaga kerja (diperoleh dari 320 kursi/800
jam kerja).
Untuk perhitungan diatas, sebagai inputnya adalah jam tenaga kerja sehingga hasil
yang diperoleh disebut sebagai produktiviats tenaga kerja. Dalam kenyatannya,
tenaga kerja hanyalah salah satu bentuk input. Faktor input yang lain dapat berupa
uang, tanah, keahlian manajemen dan lain-lain.
Misalkan 800 jam tenaga kerja menyelesaikan 400 buah kursi pada periode berjalan,
maka
Produktivitas periode berjalan = 400 kursi/800 jam = 0,5 kursi perjam tenaga kerja.
Kemudian, misalkan 1000 jam kerja menghasilkan output yang sama (yaitu 400 buah
kursi pada periode dasar), maka
Produktivitas periode dasar = 400 kursi/1000 jam = 0,4 kursi perjam tenaga kerja.
Dari kedua perhitungan di atas dapat dihitung indeks produktivitasnya :
I = (Produktivitas periode berjalan)/(Produktivitas priode dasar) x 100
= 0,5/0,4 x 100 = 125.
Dari hasil yang diperoleh terlihat adanya kenaikan produktivitas antara periode
berjalan terhadap priode dasar sebesar 25%.
Contoh lain : Out put yang dihasilkan lebih dari satu.
Pada tahun 1994, yang merupakan periode dasar, UD CANTIK FURNITURE
membutuhkan 2 jam tenaga kerja untuk tiap kursi yang dihasilkannya, 4 jam tenaga
kerja untuk sebuah meja dan 3 jam tenaga kerja untuk sebuah tas. Pada tahun 1997
mereka membutuhkan 50.000 jam tenaga kerja untuk menghasilkan 21.000 kursi,
3.000 meja dan 2.000 tas. Bila tahun 1994 digunakan sebagai tahun dasar, hitunglah
indeks produktivitasnya :
Penyelesaian :
Agar jumlah produksi pada tahun 1994 sama dengan tahun 1997, maka jumlah jam
tenaga kerja yang dibutuhkan pada tahun 1994 untuk tiap jenis produk adalah :
Kursi : (21.000 kursi) x (2 jam tenaga kerja perkursi) = 420.000 jam tenaga kerja
Meja : (3.000 meja) x (4 jam tenaga kerja perkursi) = 12.000 jam tenaga kerja
Tas : (2.000 tas) x (3 jam tenaga kerja pertas) = 6.000 jam tenaga kerja
- 64 -
Computer for Statistic Systems
Jumlah jam tenaga kerja yang dibutuhkan pada tahun dasar agar sama dengan tahun
1997 adalah 42.000 + 12.000 + 6.000 = 60.000 jam tenaga kerja.
Maka indeks produktivitas nya adalah : I = 60.000/50.000 x 100 = 120
Dengan demikian dijumpai adanya kenaikan produktivitas antara tahun 1994 sampai
1997, sebesar 20%.
- 65 -
Computer for Statistic Systems
BAB V.
ANALISA REGRESI – KORELASI
5.1 Hubungan Garis Lurus dua Variabel
Dari satu titik dapat dibuat banyak garis lurus, akan tetapi dari dua titik hanya dapat
dibuat satu garis lurus. Dengan perktaan lain, satu garis lurus dapat dibuat minimal
jika ada dua titik.
Garis Lurus, jika digambarkan dalam peta sumbu x dan y, mempunyai persamaan :
Y = aX + b (Y fungsi X)
a = Bilangan konstan (misalnya 1,12, 240, -15..dsb) yang akan mempengaruhi arah
regresi linier atau disebut intercept
b = bilangan konstan
Y fungsi X, artinya bahwa nilai Y akan bergantung pada atau ditentukan oleh nilai X.
Regresi linier sederhana bertujuan mempelajari hubungan linier antara dua variable.
Dua variable ini dibedakan menjadi variable bebas (X) dan variable tak bebas (Y).
5.2 Diagram Pencar
Untuk memberikan gambaran bentuk hubungan dua variable, sebelum memutuskan
apakah berhubungan linier atau tidak, sebaiknya dilakukan plotting (tebaran titik)
terhadap pasangan nilai-nilai X dan Y. Hasil Plot ini disebut diagram pencar (scatter
diagram).
Perhatikan perbedaan tiga diagram pencar berikut :
- 66 -
Computer for Statistic Systems
5.3 Model Regresi Linier Sederhana
Model populasi regresi linier sederhana dinyatakan dalam persamaan :
Yi = + X + j
i = 1,2, … n
Dalam hal ini
X1, X2, X3,.. Xn adalah variable control
j = adalah komponen sisaan yang tidak diketahui nilainya (acak)
dan adalah parameter yang nilainya tidak diketahui sehingga diduga
menggunakan statistic sample.
Dalam persamaan regresi diatas, komponen sisaan (j = galat) merupakan komponen
yang dapat menunjukkan :
1. Pengaruh dari berbagai variable yang tidak dimasukkan dalam persamaan
regresi karena berbagai pertimbangan
2. Penetapan persamaan matematika yang tidak sempurna
3. Kesalahan pengukuran dalam pengumpulan dan pemprosesan data observasi.
Model populasi linier ini diduga dengan metode kuadrat terkecil (Least square
Method). Prinsip metode kuadrat terkecil ini adalah meminimumkan selisih kuadrat
antara Y observasi dan Y dugaan. Model Sample untuk regresi linier sederhananya :
Yi = a + bXi , dalam hal ini :
Y = variable tak bebas
X = variable bebas
a = penduga bagi intersep ()
b = penduga bagi koefisien regresi ()
Dengan menggunakan metode kuadrat terkecil di dapat :
- 67 -
Computer for Statistic Systems
b = n(XY) – (X) (Y) / n(X2) – (X)2
a = Y – b(X) / n
Contoh aplikasi :
Dari hasil pencatatan biaya iklan dan volume penjualan sebuah perusahaan jasa eceran
produk Laser Diode, diperoleh informasi seperti tertera dalam tabel berikut :
Biaya Iklan (Jutaan Rupiah) (X) Volume Penjualan (ribuan unit) (Y)
3
4
5
6
7
8
9
12
11
13
12
13
14
16
Untuk memperoleh gambaran awal tentang pola hubungan antara biaya iklan
dengan volume penjualan, akan dilakukan plot terhadap pasangan nilai tiap biaya
iklan dengan volume penjualannya.
0
1
2
3
4
5
6
7
8
9
10
0 5 10 15 20
Biaya Iklan (X)
Vo
lum
e P
enju
alan
(Y
)
Diagram Pencar Pasangan nilai biaya iklan dengan volume penjualan yang terkait
Penyelesaian :
X Y X2 Y2 XY3456789
12111312131416
9162536496481
144121169144169196256
3644657291
112144
Jumlah 42 91 280 1199 564
Penerapan metode OLS menghasilkan :
b = 7(564)-42(91) / 7(280) – (42)2 = 0,6429
a = 91 – 0,6429(42) / 7 = 9,1426
- 68 -
Computer for Statistic Systems
maka persamaan regresi antara biaya iklan dan volume penjualan adalah : Ŷ =
9,1426 + 0,6429 X
Persamaan yang diperoleh memberikan arti : setiap penambahan biaya iklan
sejumlah satu juta rupiah, akan menambah volume penjualan 0,6429 ribu unit. Untuk
peramalan, dicoba pula seandainya dikeluarkan biaya iklan 7 juta rupiah, maka
volume penjualannya adalah :
Ŷ = 9,1426 + 0,6429 X = 9,1426 + 0,6429(7) = 13,64 ribu unit.
5.4 Analisis Keeratan Hubungan
Melalui analisis regresi yang telah diulas sebelumnya, dapat diketahui hubungan dua
variable atau lebih dalam bentuk persamaan. Dalam hal keeratan hubungan ini,
analisis korelasi paling sering digunakan dalam statistika.
a. Koefisien Korelasi Pearson
Koefisien korelasi Pearson digunakan untuk mengetahui tingkat (derajat) keeratan
hubungan linier antara dua atau lebih variable yang minimal berskala ukur interval.
Nilai koefisien korelasi bagi populasi dilambangkan , sedangkan samplenya
dilambangkan r.
Secara garis besar koefisien korelasi pearson (r ) memiliki sifat-sifat berikut :
1. Nilainya berkisar dari -1 sampai 1 (-1≤ r ≤ 1). Bila r = 0 atau mendekati nol,
berarti antara dua variable yang diobservasi (missal X dan Y) tidak terdapat
hubungan linier atau hubungan liniernya sangat lemah. Bila r mendekati -1,
hubungan linier X dan Y sangat kuat dengan sifat hubungan yang negative
(berlawanan arah) Artinya bila nilai X semakin besar maka nilai Y semakin
kecil. Bila r mendekati 1 berarti hubungan X dan Y sangat Kuat, bila nilai X
membesar maka nilai Y membesar juga.
2. Koefisien korelasi Pearson hanya mencerminkan keeratan hubungan linier
antara X dan Y, serta tidak berlaku untuk menerangkan hubungan yang tidak
linier.
- 69 -
Computer for Statistic Systems
Grafik : Berbagai nilai koefisien Korelasi
b. Koefisien Korelasi Sederhana
Sebagaimana telah dijelaskan, koefisien korelasi sederhana mengukur keeratan
hubungan dua variable, misalnya X dan Y. Koefisien korelasi Pearson sederhana
diperoleh dengan rumus :
r = nXY - XY / √ (nX2 – (X)2) . (nY2 – (Y)2)
Nilai Korelasi Berkisar antara -1 dan 1, dengan criteria :
r = 0, maka kedua variable tidak berkorelasi linier
r = -1, maka variable berhubungan negative sempurna
r = 1, kedua variable berhubungan positif sempurna
Dibawah ini dapat digunakan sebagai pedoman umum :
Nilai I r I Kriteria Hubungan
0
0-0,5
0,5-0,8
0,8-1
1
Tidak ada korelasi
Korelasi lemah
Korelasi sedang
Korelasi kuat
Korelasi sempurna
Contoh Aplikasi :
Data berikut menggambarkan pendapatan keluarga (X) dan pengeluaran (Y)
Pendapatan
(Ribu dollar/tahun (X)
Pengeluaran
(ribu dollar/tahun (Y)
10
20
30
40
50
60
7
21
23
34
36
53
Dari sini kita dapat menghitung korelasi antara pendapatan dan pengeluaran
keluarga tersebut melalui tahapan berikut :
Bisa dihitung nilai-nilai :
- 70 -
Computer for Statistic Systems
Xi = 210; Yi = 174; Xi .Yi = 7520 ; Xi2 = 9100 dan Yi
2 = 6280
Maka :
r = 6(7250)-(210)(174)/ √6(9100)-(210)2 ) √6(6280) – (174)2) = 0,973
Atas dasar perhitungan itu dapat disimpulkan bahwa hubungan antara pendapatan
dan pengeluaran keluarga tersebut sangat erat dan cenderung sempurna.
- 71 -
Computer for Statistic Systems
DAFTAR PUSTAKA
1. ....
2. ...
- 72 -
Top Related