cbir (indo).pdf
-
Upload
taxmi-andre -
Category
Documents
-
view
100 -
download
10
Transcript of cbir (indo).pdf
-
CBIR Based on Colour Fiture Extraction with Java
Agus Sumarna
Undergraduate Program, Faculty of Industrial Engineering, 2010
Gunadarma University
http://www.gunadarma.ac.id
Keywords: CBIR, Global Color Histogram, Local Color Histogram, Euclidean.
ABSTRACT
Text-based image retrieval techniques that exist today can not be used to represent the
image that we seek in an image database, which is often obtained by the image search results
that are not desirable, because we must know the right keywords in accordance with the
image file name to obtain the image we want. To overcome the problem of image retrieval,
one solution is to use CBIR.
Content-Based Image Retrieval (CBIR) or image retrieval is an image retrieval
method by doing a comparison between the query image features with image features that
exist in the database (Query by Example). CBIR method is often used similarity search based
on color features, shape, and texture. As for calculating the similarity of color features using
Euclidean distance.
On this basis the author are encouraged to conduct research and manufacture of image
search application based on color feature extraction using 2 types of histograms of the Global
Color Histogram (GCHs), and Local Color Histogram (LCHs). So that it can be seen
comparing the search results using the method GCHs with the search results using the method
LCHs or use both types of these histograms. So get a color-based image search results more
accurate.
-
ABSTRAKSI
Teknik pencarian citra berbasis teks yang ada saat ini belum dapat digunakan untuk
merepresentasikan citra yang kita cari didalam sebuah database citra, sehingga seringkali
diperoleh hasil pencarian citra yang tidak sesuai dengan yang diinginkan karena kita harus
mengetahui kata kunci yang tepat sesuai dengan nama file citra untuk memperoleh citra yang
kita inginkan. Untuk mengatasi masalah pencarian citra tersebut, salah satu solusinya adalah
dengan menggunakan CBIR.
Content-Based Image Retrieval (CBIR) atau temu kembali citra yaitu suatu metode
pencarian citra dengan melakukan perbandingan antara fitur citra queri dengan fitur citra
yang ada di database (Query by Example). Metode CBIR yang sering digunakan adalah
pencarian berdasarkan kemiripan fitur warna, bentuk, dan tekstur. Sedangkan untuk
menghitung kemiripan fitur warna tersebut menggunakan metode Euclidean distance.
Atas dasar itulah penulis terdorong untuk melakukan penelitian dan pembuatan
aplikasi pencarian citra berdasarkan ekstraksi fitur warna dengan menggunakan 2 tipe
histogram yaitu Global Color Histogram(GCHs), dan Local Color Histogram(LCHs).
Sehingga bisa dilihat perbandingan hasil pencarian menggunakan metode GCHs dengan hasil
pencarian menggunakan metode LCHs ataupun menggunakan kedua tipe histogram tersebut.
Sehingga mendapatkan hasil pencarian citra berbasis warna yang lebih akurat.
Kata kunci : CBIR, Global Color Histogram, Local Color Histogram, Euclidean.
PENDAHULUAN
Kebutuhan informasi dalam bentuk citra sangat berkembang pesat seiring dengan
bertambahnya koleksi citra yang ada didalam database citra berskala besar. Informasi citra
tersebut banyak dibutuhkan diberbagai bidang. Seperti bidang perdagangan untuk katalog
barang, kepolisian untuk pelacakan tindak kriminalitas melalui citra wajah atau sidik jari,
kedokteran untuk citra hasil rongent, dan masih banyak lagi pemanfaatan informasi dalam
bentuk citra di bidang yang lainnya.
Teknik pencarian citra berbasis teks yang ada saat ini belum dapat digunakan untuk
merepresentasikan citra yang kita cari didalam sebuah database citra, sehingga seringkali
diperoleh hasil pencarian citra yang tidak sesuai dengan yang diinginkan karena kita harus
mengetahui kata kunci yang tepat sesuai dengan nama file citra untuk memperoleh citra yang
kita inginkan.
Untuk mengatasi masalah pencarian citra tersebut, salah satu solusinya adalah dengan
menggunakan Content-Based Image Retrieval (CBIR) atau temu kembali citra yaitu suatu
metode pencarian citra dengan melakukan perbandingan antara fitur citra kueri dengan fitur
-
citra yang ada di database (Query by Example). Metode CBIR yang sering digunakan adalah
pencarian berdasarkan kemiripan fitur warna, bentuk, dan tekstur [4].
Dalam CBIR terdapat banyak metode pencarian citra. Salah satu metode yang dipakai
adalah pencarian citra berdasarkan ekstraksi fitur warna. Dalam CBIR berbasis warna yang
dilihat bukan kemiripan dari citra, melainkan kemiripan dari sebaran warna pada citra yang
diperbandingkan. Secara umum untuk CBIR berbasis warna dikenal metode histogram warna.
Histogram warna memiliki 2 tipe yaitu Global Color Histograms (GCHs) dan Local Color
Histograms (LCHs) [5].
Saat ini penelitian mengenai CBIR berbasis warna dengan metode histogram warna
masih terbuka luas. Atas dasar itulah penulis terdorong untuk melakukan penelitian dan
pembuatan aplikasi pencarian citra berdasarkan ekstraksi fitur warna dengan menggunakan 2
tipe histogram. Sehingga bisa dilihat perbandingan hasil pencarian menggunakan metode
GCHs dengan hasil pencarian menggunakan metode LCHs ataupun menggunakan kedua tipe
histogram tersebut. Sehingga mendapatkan hasil pencarian citra berbasis warna yang lebih
akurat.
METODE PENELITIAN
Metode penelitian yang dilakukan terdiri dari beberapa tahap:
Analisa dan Studi Literatur
Mengindentifikasi masalah, mengumpulkan dan menganalisis informasi-informasi
baik dari artikel situs web, Jurnal, dan buku-buku yang berhubungan dengan teori-
teori dasar tentang Content-Based Image Retrieval, histogram warna,
pemrograman Java, Netbeans, database Derby, dan tutorial JfreeChart untuk
menampilkan histogram.
Perancangan
Pada tahap ini dirancang sistem retrival citra dengan menggunakan bahasa
pemrograman Java, dan editor Netbeans. Tahap ini juga meliputi coding,
perancangan user interface, dan merancang database yang digunakan.
Implementasi dan Evaluasi
Pada tahap ini dilakukan pengujian pada program untuk melihat hasil dari
pencarian citra. Semua hasil yang diperoleh pada tahap pengujian akan dievaluasi.
-
Hasil evaluasi ini akan diambil kesimpulan yang merupakan jawaban atas
permasalahan CBIR.
TINJAUAN PUSTAKA
Content-Base Image Retrieval.
Content-Based Image Retrieval (CBIR) atau temu kembali citra adalah metode yang
digunakan untuk melakukan pencarian citra digital pada suatu database citra. Yang dimaksud
dengan "Content-Based" di sini adalah : objek yang dianalisa dalam proses pencarian itu
adalah actual contents (kandungan aktual) sebuah citra. Istilah konten pada konteks ini
merujuk pada warna, bentuk, tekstur, atau informasi lain yang didapatkan dari citra tersebut.
Proses umum dari CBIR adalah pada citra yang menjadi query dilakukan proses
ekstraksi fitur (image contents), begitu halnya dengan citra yang ada pada basis data citra
juga dilakukan proses seperti pada citra query. Parameter fitur citra yang dapat digunakan
untuk retrieval pada system ini dapat berupa histogram, susunan warna, teksture, dan shape,
tipe spesifik dari objek, tipe event tertentu, nama individu, lokasi, emosi [4].
Awalnya teknik yang dipakai bukan mencari fitur citra melainkan berdasarkan
penambahan deskripsi mengenai citra dalam bentuk teks. Dengan kata lain pertama citra
diberi teks berdasarkan citra tersebut kemudian dilakukan pencarian berdasarkan teks (text
based) mengunakan sistem database manajemen tradisional. Namun karena pembangkitan
teks secara otomatis, mengenai deskripsi spektrum citra, secara detail sulit untuk dilakukan
kebanyakan aplikasi text-based image retrieval saat itu melakukan pemberian teks deskripsi
citra secara manual.
Penelitian dan pengembangan image retrieval dimulai pada sekitar 1970-an. Pada
tahun 1979, sebuah konferensi mengenai Database Tehcniques for Pictorial Application
diadakan di Florida. Sejak itu aplikasi dalam melakukan manajemen database citra menarik
perhatian para peneliti.
-
Gambar 1. Diagram Arsitektur CBIR (Torres, 2006).
Dalam diagram diatas. Dapat dilihat bahwa CBIR dibagi menjadi 3 bagian yaitu :
bagian interface, bagian Query Processing Module, dan bagian Image Database. Untuk
penjelasanya adalah sebagai berikut :
1. Bagian pertama adalah interface yang merupakan bagian untuk interaksi antara
pengguna dengan sistem CBIR melalui aplikasi GUI (Graphical User Interface).
Sedangkan didalamnya terdapat sub bagian :
Data Insertion yang digunakan user untuk memasukan citra yang akan di
ekstraksi.
Query Specification untuk menentukan citra yang akan dijadikan citra
query serta menentukan metode ekstraksi fitur. Dalam penelitian ini,
penulis menggunakan metode ekstraksi local color histogram dan global
color histogram.
Visualization untuk menampilkan citra query dan citra hasil pencarian.
2. Bagian kedua adalah Query-processing module. Sedangkan didalamnya terdapat
sub bagian :
feature vector extraction yang digunakan untuk mengekstraksi baik citra
yang ada didatabase citra maupun citra query.
Similarity Computation digunakan untuk menghitung kesamaan fitur citra.
Ranking digunakan untuk mengurutkan citra yang memiliki tingkat
kemiripan dengan citra query.
3. Bagian ketiga adalah Image Database. Sedangkan didalamnya terdapat sub bagian
-
Feature Vectors yang digunakan untuk menyimpan hasil ekstraksi fitur
citra. Dan disimpan didalam database derby.
Images merupakan database citra yang secara fisik berupa folder yang
didalamnya terdapat kumpulan citra.
Tipe Histogram Citra
Histogram warna terdiri dari dua tipe, Global Color Histograms (GCHs) dan Local
Color Histograms (LCHs). Pada penggunaan GCH, distribusi warna global suatu citra
diambil dan digunakan sebagai metada. Jika pengguna mencari citra dengan yang dalam
sistem databasenya hanya memperhatikan distribusi warna global suatu citra, memang, GCH
adalah pilihan terbaik. Walaupun demikian, karena GCH hanya mengambil distribusi warna
global suatu citra sebagai pertimbangan untuk membandingkan citra, ini bisa mengembalikan
hasil yang tidak sesuai dengan persepsi visual.
Misalkan ada tiga citra yang telah dikuantisasi menjadi tiga warna: hitam, abu-abu,
dan putih (citra 4.3). Misalkan citra A adalah query image, sedangkan citra B dan C adalah
citra-citra dalam database.
Citra A Citra B Citra C
Gambar 2. Tiga citra yang terkuantisasi menjadi 3 warna
Dibawah ini adalah tabel rincian Global Color Histogram dari 3 citra diatas yaitu
image A, image B, dan Image C :
Tabel 1. GCHs Citra A, B, dan C
Citra Hitam Abu-abu Putih
A 37.5% 37.5% 25%
B 31.25% 37.5% 31.25%
-
Sedangkan Distribusi warna (GCH) tiga citra diatas adalah seperti pada
tabel. Maka, jarak antara citra A dengan citra B dan C adalah :
d(A,B) = |0.375 - 0.3125| + |0.375 - 0.375| + |0.25-0.3125| = 0.125
d(A,C) = |0.375 - 0.375| + |0.375 - 0.375| + |0.25 - 0.25| = 0
Dari hasil pembandingan, citra C ternyata ditemukan lebih mirip daripada citra B
(karena jarak C lebih kecil). Padahal, sesuai dengan persepsi, yang lebih mirip dengan citra A
sebenarnya adalah citra B. Global Color Histogram merepresentasikan keseluruhan bagian
citra dengan satu histogram. Sedangkan Local Color Histogram membagi citra menjadi
beberapa bagian dan kemudian mengambil histogram warna tiap bagian tadi. LCH memang
berisi lebih banyak informasi tentang citra, namun metode ini membutuhkan lebih banyak
proses komputasi [6].
PEMBAHASAN
Data Citra
Dalam penelitian ini menggunakan citra sebagai objek penelitian. Berikut adalah rincian citra
yang penulis gunakan :
1. Menggunakan citra berwarna RGB.
2. Format citra yang digunakan adalah format JPEG, JPG, PNG, dan GIF.
3. Dimensi citra berbeda-beda, namun citra disesuaikan ukuran dimensinya (sekitar
200 x 180) agar lebih cepat dalam pemrosesan citra.
4. Jumlah citra 30 citra yang dibagi menjadi 3 kategori.
Pengelompokan Citra
Dalam penelitian ini, penulis mengelompokan citra kedalam 3 (tiga) yaitu :
C 37.5% 37.5% 25%
-
1. Kategori citra binatang : 10 buah.
2. Kategori citra bunga mawar : 10 buah.
3. Kategori citra mobil bus : 10 buah.
Gambar 3. Kategori Binatang
Gambar 4. Kategori Bunga Mawar
Gambar 5. Kategori Mobil Bus
Implementasi Rancangan Aplikasi Desktop
Berikut penulis akan menjelaskan mengenai tampilan yang terdapat pada aplikasi
desktop dan fungsi dari menu-menu yang terdapat pada aplikasi.
Tampilan Menu Utama
-
Gambar 6. Menu Utama Aplikasi
Hasil Uji Coba
Hasil Pencarian Pada Kategori Citra Binatang
Gambar 12 Hasil Query LCHs Pada Kategori Binatang
-
Gambar 13 Hasil Query GCHs Pada Kategori Binatang
Gambar 14 Hasil Query GCHs+LCHs Pada Kategori Binatang
Tabel 2. Hasil Pencarian Pada Kategori Binatang
No Nama Metode Jumlah
Citra
Waktu Pencarian
(Detik)
1 Local Color Histogram (LCHs) 6 0
2 Global Color Histogram (GCHs) 4 0
3 LCHs + GCHs 4 1
Sedangkan tabel 3 dibawah ini merupakan rincian dari hasil pencarian citra menggunakan
metode Local Color Histogram (LCHs) dengan menggunakan citra bus pada kategori binatang. Pada
tabel dibawah terdapat data citra query, jarak Euclidean, dan histogram dari masing-masing citra.
Jarak Euclidean dan susunan citra sudah terurut berdasarkan nilai jarak Euclidean.
-
Hasil Pencarian Pada Kategori Citra Mawar
Gambar 15 Hasil Query LCHs Pada Kategori Bunga Mawar
Gambar 16 Hasil Query GCHs Pada Kategori Bunga Mawar
Gambar 17 Hasil Query GCHs+LCHs Pada Kategori Bunga Mawar
Tabel 4 Hasil Pencarian Pada Kategori Bunga Mawar
No Nama Metode Jumlah Waktu Pencarian
-
Citra (Detik)
1 Local Color Histogram (LCHs) 9 0
2 Global Color Histogram (GCHs) 5 0
3 LCHs + GCHs 5 0
Hasil Pencarian Pada Kategori Citra Bus
Gambar 18. Hasil Query LCHs Pada Kategori Bus
Gambar 19. Hasil Query GCHs Pada Kategori Bus
-
Gambar 20. Hasil Query GCHs Pada Kategori Bus
Tabel 5 Hasil Pencarian Pada Kategori Binatang
No Nama Metode Jumlah
Citra
Waktu Pencarian
(Detik)
1 Local Color Histogram (LCHs) 6 0
2 Global Color Histogram (GCHs) 9 3
3 LCHs + GCHs 6 0
Hasil Pencarian Pada Semua Kategori
Gambar 21. Hasil Query LCHs Pada Semua Kategori
-
Gambar 22. Hasil Query GCHs Pada Semua Kategori
Gambar 23. Hasil Query GCHs+LCHs Pada Semua Kategori
Tabel 6. Hasil Pencarian Pada Semua Kategori
No Nama Metode Jumlah
Citra
Waktu Pencarian
(Detik)
1 Local Color Histogram (LCHs) 21 1
2 Global Color Histogram (GCHs) 18 0
3 LCHs + GCHs 15 1
PENUTUP
Kesimpulan
-
Setelah melalui serangkaian ujicoba dan analisis, dapat ditarik beberapa kesimpulan
dari proses CBIR berdasarkan ekstraksi fitur warna yaitu metode Local Color Histogram,
menghasilkan citra hasil pencarian yang jumlahnya banyak secara kuantitas, dan hasil
pencariannya terpegaruh oleh citra geometri misalnya citra yang dirotasi. Sehingga tidak
efektif secara kualitas. karena ada citra yang penyebaran warnanya jauh namun tetap
ditampilkan sebagai hasil pencarian.
Sedangkan metode Global Color Histogram, menghasilkan citra hasil pencarian yang
lebih sedikit secara kuantitatif dibandingkan dengan hasil pencarian Local Color Histogram,
dan hasil pencariannya tidak terpengaruhi oleh citra geometri. Sehingga lebih efektif karena
hanya menampilkan citra yang mempunyai penyebaran warna yang mirip dengan citra query
nya.
Saran
Aplikasi CBIR ini masih terdapat kekurangan, terutama saat melakukan query citra.
Karena jika query citra yang ada didatabase citra ukuranya atau dimensinya terlalu besar,
maka aplikasi CBIR akan berhenti melakukan query atau terjadi error. Oleh karena itu untuk
pengembangan kedepannya harus diadakan proses resize atau perubahan ukuran citra
database, agar proses query bisa berjalan lebih cepat.
DAFTAR PUSTAKA
[1] Ariesto H.S, Fajar Masya, Pemrograman Berorientasi Objek dengan Java, Graha
Ilmu : Jakarta, 2004.
[2] Herry Suharto, dkk, Pemrograman GUI Swing Java dengan Netbeans 5, Penerbit
Andi : Yogyakarta, 2006.
[3] Rafael C.Gonzales, Paul Wintz, Second Edition : Digital Image Processing, Addison-
Wesley Publishing Company, 1987.
[4] Sagarmay Deb, Multimedia Systems and Content-Base Image Retrieval, Idea Group
Publishing, 2004.
[5] Shengjiu Wang, A Robust CBIR Approach Using Local Color Histograms,
Department of Computer Science, University of Alberta, Edmonton, Alberta, Canada,
Tech. Rep. TR 01-13, October 2001.
-
[6] YanuWidodo,http://ilmukomputer.org/wp-content/uploads/2009/10/yanuwid-cbir.pdf,
Penggunaan Color Histogram Dalam Image Retrieval, 12 Juni 2010.
[7] ______, http://www.java2s.com/Tutorial/Java/0340_Database/Connectto
Derbydatabase.htm, Connect to Derby database, 27 Juli 2010
[8] _______, http://www.the-crankshaft.info/2010/07/content-based-image-retrieval-
query.html, Content-Based Image Retrieval Query Paradigms , 30 Juli 2010