BAB
8 KLASIFIKASI
MULTISPEKTRAL
Klasifikasi multispectral adalah
salah satu bagian dari pengolahan citra pengindraan jauh yang paling sering
dibahas, digunakan, dan dalam praktik dipandang mapan. Lebih dari itu, hasil
utama klasifikasi multispectral adalah peta tematik (yang pada umumnya
merupakan peta penutup atau penggunaan lahan), yang kemudian biasanya dijadikan
masukan dalam pemodelan spasial dalam lingkungan system informasi gegrafis
(SIG). Meksipun demikian, metode klasifikasi ini masih menggandung kelemahan yang
disebabkan oleh asumsi – asumsi awalnya, khususnya apabila diterapkan untuk
pemetaan penggunaan lahan dilingkungan Indonesia dan Negara tropis basah
lainnya. Seperti halnya klasifikasi manual yang menggunakan foto udara,
klasifikasi multispectral merupan suatu metode yang dirancang untuk menurunkan
informasi tematik dengan cara mengelompokkan fenomena berdasarkan kriteria
tertent.
Pada
klasifikasi manual berbagai kriteria digunakan, antara lain kesamaan rona atau
warna, tekstur, bentuk, pola, relief, dan sebagainya yang digunakan secara
serentak. Pada bagian besar metode klasifikasi multispectral hanya ada satu
krikteria yang digunakan, yaitu nilai spectral ( atau nilai kecerahan) pada
beberapa saluran sekaligus. Perkembangan mutakhir menunjukkan bahwa klasifikasi
multispectral juga dapat dilakukan dengan melibatkan unsur interpretasi lain
disamping warna atau nilai spectral,
seperti tekstur dan bentuk, misalnya dengan segmentasi citra berbasis objek (object-based image segmentation) (Baatz
dan Schappe,2000; Danoedoro ea al.,
2008), serta melibatkan sumber data lain yang bersifat nir-spektral, misalnya
melalui metode jaringan saraf tiruan (artificial
neural network) (samudera, 2007). Meksipun demikian, klasifikasi manual dan
multispectral mempunyai kesamaan mendasar, yaitu membutuhkan informasi bantu
(termasuk data lapangan) supaya dapat menghasilkan peta tematik yang siap
pakai.
Dengan
berkembanganya metode pencitraan hiperspektral (lihat Bab 3), para peneliti dan
praktisi merasa bahwa metode klasifikasi baku yang tersedia saat ini dirasa
kurang mamou memenuhi kebutuhan, khususnya apabila data multispectral yang
harus ditangani berdimensi sangat besar. Bidang spektroskopi merupakan bidang
kajian fisika (dan kimia) yang berkonsentrasi pada upaya pengenalan dan
penjelajahan sifat – sifat komposisi material tertentu secara spectral, dalam
kaitannya dengan suatu panjang gelombang yang sangat spesifik.
8.I
DASAR PEMIKIRAN DAN ASUMSI
Asumsi paling awal dalam
klasifikasi multispectral ialah bahwa tiap objek dapat dibedakan dari yang lain
berdasarkan nilai spektralnya. Disamping itu, Phinn (2002) menyebutkan bahwa
klasifikasi multispectral mengasumsikan: (a) resolusi spasial tinggi, dimana
setiap piksel merupakan piksel murni yang tersusun atas satu macam objek penutup
lahan, (b) piksel – piksel yang menyusun satu jenis penutup lahan mempunyai
kesamaan spectral, (c) setiap penutup lahan yang berbeda juga mempunyai
perbedaan spectral yang signifikan.
Fakta
yang diperoleh melalui penelitian eksperimental (lihat Gambar 3.1 pada Bab 3)
menunjukkan bahwa tiap objek cenderung memberikan pola respons spectral yang
spesifik. Semakin banyak informasi
statistic yang dibutuhkan, semakin rumit algoritmanya, dan semakin lama proses
eksekusi klasifikasinya. Dalam beberapa hal, algoritma yang lebih rumit akan
memberikan hasil yang lebih teliti.
Untuk
mempermudah pemahaman konsep mengenai klasifikasi multispectral, contoh berikut
diberikan. Misalkan ada suatu kelompok yang terdiri atas 26 mahasiswa dalam
kelas, di mana masing – masing mahasiswa bernama A, B, C, D, …, Z. kelompok
masiswa ini dapat dikelomokkan lagi menjadi grup – grup yang lebih kecil
berdasarkan krikteria tertentu. Apabila beberapa macam krikteria diterapkan
sekaligus maka pengelompokan akhir dihasilkan, di mana setiap grup terdiri atas
anggota yang benar – benar sejenis ditinjau dari beberapa krikteria itu.
Contoh
diatas dapat diterapkan pada system multispectral, di suatu wilayah terekam
pada system multispectral, dimana suatu wilayah terekam pada beberapa saluran
spectral sekaligus. Apabila masing – masing saluran dievaluasi histogramnya
maka setiap histogram bersifat multimodal, yang merupakan gabungan dari
berbagai objek pada wilayah tersebut dan masing – masing objek membentuk kurva
normal. Dalam hal ini, nilai piksel pada berbagai saluran ini menngantikan
kriteria umur, berat bada, dan kriteria lainnya pada contoh dia atas.
Sebagai
ilustrasi, Gambar8.1 berikut ini menyajikan kurva bimodal. Telah diulas pada
ban sebelumnya bahwa tiap objek homogeny cenderung membentuk satu kurva normal.
Gambar tersebut menyajikan dua objek yang mempunyai pertampalan (overlap) nilai spectral. Pada gambar
juga terlihat bahwa ada bagian kurva yang murni milik objek A, murni milik
objek B, dan bagian pertampalan, yaitu A yang diinterpretasikan sebagai B, atau
justru sebaliknya.
Melalui
teknik pemilahan tingkat kecerahan, A dan B dapat dipilih (dan diberi warna
yang berbeda) dengan cara tepat membagi kedua kurva pada perpotongan keduannya.
Dapat pula hal ini dilakukan dengan mengambil wilayah yang murni A ataupun yang
murni B dan ‘menyerahkan’ sisanya kepada kelas yang lain (kelas ‘peralihan’,
missalnya). Masalah-masalah seprti ini yang umum di jumpai pada klasifikasi
multispectral. Pada kenyataannya, kurfa histogram objek tidaklah bimodal,
melainkan multimodal. Begitu banyak objek dengan nilai spekral yang
bermacan-macam. Satu sam lai saling bertampalan, bahkan kadang-kadang berimpit.
Hanya saja, susunan bertampalan dan perimpitan mereka berbeda satu sama lain
(lihat gambar 8.2).
Gambar
8.1 model
kurfa bimodal yang menggambarkan dua objek dengan nilai spectral yang
bertampalan (sumber. Swain dan Darwis, 1978)
Cara kerja algoritma klasifikasi
multispekral pada prinsipnya adalah menandai tiap jenis objek hingga terlihat
berbeda dari satu yang lain, berdasarkan ciri-ciri nilai spectral sekaligus
pada beberapa saluran. Melalui feature space (yang telah dibahas pada bab 5),
pengelompokan objek ini dapat dilihat secara visual. Cara kerja algoritma
klasifikasi adalah menerjemakan kenampakan visual tersebut menjadi
parameter-parameter statistic yang dimengerti oleh computer, dan kemudian
dieksekusi
Gambar
8.2 prinsip
klasifikasi multispectral. Histogram tiap saluran penunjukan kecenderungan yang
berbeda dalam merepresentasika pertampalan nilai piksel-pikselnya. Satu kufa
yang seharusya mewakili satu objek bias merupakan perwujudan dua objek atau
lebih karena kesamaan responsspektral. Penggunaan seluruh saluran dalam
koordinat kartesius (e, y, z) mempermudah perbedaan gugus-gugus piksel objek.
Secara ringkas, algoritma
klasifikasi sederhana memuat langkah-langkah sebagai berikut.
1.
Menentukan
nilai spekral representative tiap objek dengan cara sampling. Nilai rerata tiap
sampel akan dijadikan pegangan untuk pengenalan objek;
2.
Menempatkan
nilai representative objek(sampel) pada diagram multidimensional;
3.
Menentukan
batas toleransi berupa jarak spekrtral dari nilai representative. Artinya,
vector piksel yang terhitung pada posisi diluar jarak ini akan dikelaskan
sebagai bukan objek yang termaksud;
4.
Pengambilan
keputusan berupa penghitungan seluruh nilai piksel dan memasukkan ke kelas yang
tersedia, selama mereka lebih pendek atau sama dengan jarak toleransi
masing-masing objek, dan menjelaskan sebagai’tak terklasifikasi’ selama mereka
tidak masuk elas mana pun. Piksel yang bersangkutan akan di tandai sebagai
kelas A, bila jarak spectral piksel tersebuat adalah yang terdekat dibandingkan
jarak spectral ke kelas lain.
Pemeliharaan
tingkat kecerahan (Density slicing)
Pemeliharaan nilai
kecerahan (sering juga disebut sebagai density
slicing atau level slising)
merupakan teknik operasi yang dekat dengan LOOK-UP TABLE. Metode ini pada
dasarnya juga merupakan suatu metode paling sederhana dalam mengelompokan atau
mengklasifikasi objek secara spectral, khususnya untuk citra saluran tunggal.
Bepijak pada asumsi bahwa tiap objek saluran tertentu mempunyai julat nilai
kecerahan tertentu maka julat nilai kecerahan 0 – 225 dapat dilipat menjadi
beberapa interfal yang menggambarkan kenampakan ibjek secara umum. Gambar 8.2
menunjukan ilustrasi pemilihan tingkat kecerahan pada tiga saluran sekaligus.
Tiap interfal dapat diberi warna unik, terpisah dari interfal yang lain,
sehingga tiap objek digambarkan dengan warna hijau, dan seterusnya. Selain
dengan warna tiap interfal ini dapt pula ditandai dengan derajat keabuan yang
berbeda.
Syarat utama dalm
teknik operasi pemilihan tingat kecerahan ini ialah adanya informasi tentang
julat nilai tiap objekk. Melesetnya informasi ini akan menghasilkan kekeliruan
dalam color mapping yang ingin dihasilkan. Teknik ini juga kurang bermanfaat
dalam pemilihan nilai kecerahan objek yang saling bertampalan. Secara praktis
teknik ini dapat diterapkan setelah melihat listogram tiap saliran. Dari sudut
pandang statistic, tiap objek homogeny akan memberikan variasi nilai piksel
yang berbentuk kurfa normal (Swain dan Davis, 1978). Kumpilan objek homogeny
pada satu liputan citra akan menghasilkan sekumpulan kurfa normal sehingga pada
umumnya histogram citra saluran tunggal merupakan kurva multimodel. Pemilihan
nilai kwcerahan dapat dilakukan dengan ‘mengiris’ kurva besar tersebut hingga
dihasilkan kurva-kurva kecil. Pemotongan ini juga berarti bahwa seluruh julat
nilai kecerahan dipilah menjadi beberapa interval, masing-masing mewakili objek
tertentu. Perlu dicatat bahwa dalam operasi ini tidak ada pengubahan nilai
kecerahan. Seluruh nilai masih tetap seperti semula, namun representasi
warnanya berbeda sehingga teknik ini sebenarnya lebih dekat ke operasi
LUT(look-up table).
8.2
METODE KLASIFIKASI; TERSELIA DAN TAK-TERSELIA
Proses klasifikasi
multispectral dengan bantuan computer masi dapat dibedakan menjadi dua jenis
berdasarkan tingkat otomasinya. Keduanya ialah klasifikasi terselia (supervised
classification atau klasifikasi terawasi, atau klasifikasi terkontrol) dan
klasifikasi tak-terselia (unsupervised classification, atau klasifikasi
tak-terawasi, atau klasifikasi tak-terkontrol). Pembahasan singkat keduanya
diuraikan pada pembahasan berikut ini, dengan referensi utama Mulder dan Kostwinder
(1987), Sherestha (1991), Richards (1994), Gonzales dan Woods (2000), Mather
(2004), Jensen (2005), dan Gao (2010).
8.2.I
klasifikasi terselia
Klasifikasi terselia
meliputi sekumpulan algoritma yang didasarkan pemasukan contoh objek(berupa
nilai spektal) oleh operator. Contoh ini disebut sampel, dan lokasi geografis
kelompok piksel sampel ini disebut sebagai daerah contoh (training area).
Sebelum sampel diambil, operator, analisis atau pengguna harus mempersiapkan
system skasifikasi yang akan diterapkan, seperti halnya klasifikasi manual. Dua
hal penting yang haus dipertimbangkan dalam klasifikasi ialah system
skasifikasi dan kriteria sampel. Di samping itu, algoritma klasifikasi juga
sangat menentukan. Pengambilan sampel secara digital oleh analisis pada
dasarnya merupakan cara ‘melatih’ computer untuk mengenali objek berdasarkan
kecenderungan spekrtalnya. Gambar 8.3 membantu pemahaman ini.
Secara kuantitatif, Fitzpatrick (1981) serta Congalton dan Green (2010) menggunakan kriteria statistik berikut untuk menggunakan jumlah sampel minimal untuk seluruh daerah penelitian N adalah sebagai berikut :
Dimana Z= 2, yang merupakan standard normal deviate untuk derajat kepercayaan sebesar 95% adalah tingkat akurasi yang diharapkan dan q= (100-p); sementara E = tingkat kesalahan yang diperbolehkan. Contoh berdasarkan rumus ini adalah sebagai berikut. Misalnya, jika akurasi 85% diharapkan, dan kesalahan yang diizinkan adalah 5% (derajat kepercayaan 95%), maka :
Pada evaluasi tingkat separabilitas, analis memperoleh masukkan mengenai kategori atau kelas apa saja yang nantinya perlu untuk digabung, baik pada saat pengambilan sampel (yang berarti mengulang proses pengambilan sampel) maupun pada saat pemrosesan pasca klasifikasi (postclassification).
Gambar
8.3
Diagram alir proses klasifikasi secara tersedia (supervised classification)
(Modifikasi dari Gao, 2010)
Perlu pula dipahami disini bahwa
sebenarnya terdapat kesenjangan persepsi mengenai sampel diantara analis dan
komputer (perangkat lunak pengolahan citra). Ketika analis melihat kelompok
piksel pada citra yang ditampilkan pada layar monitor maka analis mengenalinya
sebagai objek – objek yang sudah diakrabiny, misalnya sungai, lautr,
permukiman, lapangan sepak bola, dan kompleks perumahan. Akan tetapi, perangkat
lunak tidak dapat mengenalinya secara demikian karena analis mampu mengenali
objek tersebut dengan bantuan pengalaman empiris termasuk pengetahuan lokal
mengenai wilayah yang terekam pada citra. Disisi lain, perangkat lunak hanya
dapat dipelajari untuk mengenalinya sebagai kesimpulan piksel dengan julat
nilai tertentu, kemudian melakukan komputasi statistik seperti misalnya rerata,
simpangan baku, variansi, probablitas, dan sebagainya. Oleh karena itu
diperlukan, kemampuan untuk menerjemahkan “persepsi” yang dimiliki oleh
perangkat lunak, yaitu sekadar nilai piksel. Disinilah arti penting pemahaman
konseptual dalam melakukan pengambilan sampel.
1.
Sistem
atau skema Klasifikasi
Klasifikasi
multispektral secara langsung hanya dapat diterapkan untuk pemetaan penutup
lahan (land cover), dan bukan
penggunaan lahan. Aspek penggunaan lahan secara deduktif dapat diturunkan dari
informasi penutup lahannya, atau dengan cara lain melalui pemasukan informasi
bantu atau ancillary data (rotasi
tanaman, citra multitemporal, faktor bentuk lahan, dan sebagainya). Oleh karena
itu, skema klasifikasi yang disiapkan harus beriisi kelas – kelas penutup lahan
(misalnya, padi, jagung, hutan campuran, semak, padang rumput, lahan terbuka,
dan sebagainya); bukan penggunaan lahan (sawah, tegalan, hutan lindung) karena
aspek fungsi ini tidak dapat dipresentasikan secara langsung melalui nilai
piksel, kecuali untuk kasus – kasus khusus.
Saat
ini telah tersedia berbagai macam sistem klasifikasi penggunaan lahan. Di
Amerika Serikat, badan yang menangani survei pemetaan adalah USGS (United States Geological Survey) dan
lembaga ini sudah mempunyai suatu sistem klasifikasi penutup/penggunaan lahan
yang bersifat baku (Anderson et al.
1976), yang diacu oleh berbagai peneliti dan praktisi diseluruh Amerika Serikat
dan bahkan beberapa negara lain. Sistem klasifikasi ini dirancang untuk dapat
digunakan dengan menggunakan foto udara dan proses Interpretasi fotografik,
serta dirinci dalam bentuk multitingkat, dari I hingga IV (lihat tabel 8.1 yang
hanya menyajikan hingga tingkat II). Tingkat I bersifat sangat umum, sementara
tingkat IV bersifat sangat spesifik. Semakin rinci tingkatnya, semakin besar
skala dan resolusi spasial citra yang diperlukan untuk memetakannya.
Tabel
8.1 Sistem
klasifikasi penutup/penggunaan lahan menurut USGS dan versi NOAA (2006, kiri)
dan Anderson et al (1976, kanan)
Sistem klasifikasi menurut NOAA dan
USGS ini mencampurkan konsep penutup dan penggunaan lahan karena berangkat dari
asumsi bahwa penutup lahan lebih dapat diindera langsung melalui citra, dan
aspek – aspek penggunaan lahan dalam beberapa hal dapat dideduksi dari penutup
lahannya. Apabila proses pemetaannya menggunakan pendekatan interpretasi
fotografik maka praktis tidak ada masalah yang muncul dari padanya. Akan
tetapi, ketika metode klasifikasi ini maka banyak masalah akan muncul,
mengingat fungsi penggunaan seringkali tidak diekspresikan oleh kenampakan
fisik penutup lahannya; misalnya industri, perdagangan, dan permukiman yang
kadang kala sama – sama berupa bangunan dengan penutup atas asbes.
Di Indonesia, Bakosurtanal (Badan
Koordinasi Survei dan Pemetaan Nasional) juga mempunyai sistem klasifikasi
penutup dan penggunaan lahan yang secara konseptual tercampur. Begitu pula
hanya klasifikasi yang dikembangkan oleh Malingreau dan Christiani (1982),
Kementrian Kehutanan, dan berbagai Bappeda tingkat Provinsi. Badan Pertahanan
Nasional (BPN) juga telah mengembakan sistem klasifikasi yang sudah lebih jelas
mengarah ke penggunaan lahan dibandingkan Lembaga – lembaga lain. Meskipun
demikian, sistem klasifikasi ini belum secara tegas mengaitkan metode penginderaan
jauh (apalagi klasifikasi digital) dengan rincian kategori yang dispesifikkan.
Danoedoro (2006) mengembangkan
sistem klasifikasi multiguna (versatile)
yang memuat aspek – aspek penutup dan pengguanaan lahan sekaligus serta
dikembangkan dengan menggunakan citra penginderaan jauh sebagai sumber data
utama. Gambar 8.4 menunjukan bahwa secara konseptual penutup/penggunaann lahan
mempunyai enam dimensi, yaitu dimensi spektral, spasial, temporal, ekologis,
fungsi sosial-ekonomi dan politis/legal. Dari keenam dimensi tersebut, Hanya
lima dimensi pertama yang dapat diekstrak melalui citra penginderaan jauh,
dengan tingkat komplek-sitas dan kebutuhan data bantu nir-penginderaan jauh
yang berbeda – beda. Secara ideal, setiap dimensi disajikan sebagai salah satu lapis
(layer) informasi yang berdiri
sendiri sehingga suatu peta penggunaan lahan multidimen-sional atau multiguna
setidaknya terdiri dari lima lapis informasi yang berturut – turut memuat aspek
spektral, spasial, temporal, ekologis, dan fungsi sosial-ekonomi.
Pada gambar 8.4 klasifikasi
multispektral dijalankan untuk secara langsung menghasilkan peta dengan
kandungan isi menurut skema klasifikasi dimensi penutup lahan secara spektral (spectral-related cover dimension).
Proses selain klasifikasi yang diperlukan untuk mencapai kategorisasi ini
hanyalah penggabungan kelas (class
merging), untuk dimensi spasial, proses yang disarankan adalah interpretasi
visual dan atau segmentasi dan klasifikasi bebasis objek. Untuk tiga dimensi
yang lain diperlukan pengolahan citra digital lanjut yang melibatkan kombinasi
yang lebih kompleks, termasuk didalamnya penggunaan data spasial bantu
(misalnya dengan peta satuan medan hasil interpretasi visual) serta analisis
spasial dilingkungan sistem informasi geografis berbasis raster.
Pada gambar 8.4 tersebut secara
eksplisit dijelaskan bahwa setiap tingkat (aras) kategorisasi memerlukan citra
dengan resolusi spasial tertentu. Pada aras terendah diperlukan resolusi
spasial 100 meter atau rendah sementara untuk aras tertinggi (paling rinci)
diprlukan resolusi spasial 5 meter atau lebih tinggi. Skema ini sejauh mungkin
sudah mempertimbangkan keselarasan antara resolusi spasial dan resolusi
kategoris, meskipun penggunaan resolusi temporal yang lebih tinggi (misalnya
citra 3 tanggal perekam) bisa meningkatkan kandungan informasi ke aras
kerincian yang lebbih tinggi tanpa meningkatkan resolusi spasial.
Gambar
8.4 skema
klasifikasi penggunaan lahan multiguna yang dikembangkan Danoedoro (2006,
2008), yang membedakan kategori penggunaan lahan dalam kelima dimensi, yang
masing – masing dapat diekstrak dengan metode yang berbeda serta disajikan
sebagai peta tematik terpisah.
Bila skema klasifikasi yang tersedia
ternyata hanya penggunaan lahan maka skema ini perlu diterjemahkan dulu menjadi
klasifikasi penutup lahan. Untuk konversi semacam ini, pengetahuan analis atau
operator mengenai karakteristik penggunaan lahan sangatlah penting. Disamping
itu pengetahuan mengenai kodisi daerah yang diamati (local knowledge) juga sangat menunjang (Bronsveld et al., 1994). Skema klasifikasi yang
secara langsung mengacu pada kategori – kategori penggunaan lahan, atau yang
mencampur adukkan aspek penutup lahan dengan penggunaan lahan sebaiknya tidak
digunakan pada klasifikasi awal, mengingat bahwa fungsi penggunaan lahan tidak
secara langsung diinterpretasikan oleh nilai piksel (Danoedoro, 1994).
Gambar
8.5 Hubungan
antara penutup lahan dan penggunaan lahan untuk beberapa kategori atau kelas.
2.
Kriteria
Sampel
Sama
dengan metode penelitian ataupun surveiyang lain, sampel haruslah homogen.
Homogenitas sampel dalam klasifikasi digital ditunjukkan oleh homogenitas nilai
piksel pada tiap kelompok piksel yang dipilih. Artinya, nilai simpangan baku
kelompok piksel tiap sampel haruslah rendah untuk tiap saluran. Cara termudah
untuk mengambil sampel yang memnuhi kriteria ini adalah dengan mengambil piksel
– piksel murni (pure pixel, lihat BAB
2). Pada luasan yang homogen,
pengambilan piksel murni dapat secara mudah dilakukan dengan memilih piksel
dibagian tengah ketrampilan objek. Melalui penampilan citra komposit warna yang
baik, homogenitas objek dicerminkan oleh warna yang seragam. Ada alternatif
lain dalam mengambil sampel yang tidak homogen, yang akan dibahas dalam klasifikasi
lunak.
Disamping
itu, kriteria statistik pun diperlukan untuk menilai sampel – sampel yang baik
tentunya mempunayi homogenitas nilai piksel yang tinggi, yang ditunjukkan oleh
kecilnya simpangan baku, bentuk histogramnya, dan tentu saj bentuk gugusnya
yang mengelompok pada feature space, Campbell (2002) menyebutkan
bahwa ada beberapa karakteristik kunci untuk sampel, yng dalam tulisan ini
dapat disebut sebagai kriteria sampel yang baik. Jumlah piksel sampel minimum
menurut Campbell, adalah 100 piksel untuk setiap kategori. Masing – masing
kategori ini ada kemungkinan merupakan hasil pengambilan sampel atau training area pada beberapa lokasi yang
berbeda, persyaratan jumlah ini sebenarnya juga berbeda. Disamping itu, Joyce
(1978 dalam Campbell, 2002) mensyaratkan bahwa setiap daerah contoh yang
berbeda setidaknya harus memuat luasan area 10 hektar, dan sebaiknya mencapai
16 hektar, untuk citra landsat MSS. Apabila persyaratan ini diterjemahkan dalam
ukuran piksel maka nilai itu setara dengan 10 – 40 piksel per daerah contoh.
Selanjutnya,
Campbell mensyaratkan lokasi, jumlah daerah contoh per kategori sampel,
penempatan, serta keseragaman (uniformity),
lokasi daerah contoh sebaiknya menyebar secara merata pada seluruh liputan
citra, dengan harapan variabilitas spektral objek diseluruh citra dapat
terwakili dengan baik. Jumlah daerah contoh per kategori disarankan antara 5-10
buah, yang masing – masing (mengacu pada
syarat jumlah piksel per daerah contoh) memuat 10 – 40 piksel. Phinn (2002) dan
perangkat lunak ERDAS Imagine merekomendasikan jumlah minimum 100 piksel supaya
perhitungan statistik setiap sampel memberikan hasil yang optimal.
Keseragaman
piksel yang disyaratkan Campbell (2002) sebenarnya paralel dengan homogenitas
piksel yang telah dikemukakkan sebelumnya karena keseragaman ini dapat dicapai
pada awalnya dengan memilih objek yang berwarna sama pada citra komposit warna yang ditampilkan (tentu saja dengan
asumsi bahwa pembuatan citra kompositnya cukup representatif), kemudian dapat
diuji homogenitasnya dengan melihat kekompakkan gugus piksel pada feature space maupun histogram sampelnya
yang harus unimodal.
Gambar
8.6 cara
pengambilan sampel yang menggunakan dua tampilan citra untuk cek silang, yaitu citra Quickbird multispektral (2,4
m resolusi spasial, komposit warna semu saluran – saluran 4-2-1 dengan urutan
pewarnaan merah-hijau-biru) disebelah kiri, dan citra komposit Quickbird
multispektral (pan-sharpened dengan
transfomasi Brovey, mendekati warna asli) disebelah kanan, pada gambar kiri,
area yang diberi kotak telah diperbesar (kiri bawah) untuk diambil sampelnya
dalam bentuk ROI, area ini tampak jauh lebih besar pada citra komposit
multiresolusi sehingga secara langsung daoat dicek tingkat homogenitasnya,
dengan menggunakan kombinasi saluran yang berbeda. (sumber, Danoedoro, 2004).
Secara kuantitatif, Fitzpatrick (1981) serta Congalton dan Green (2010) menggunakan kriteria statistik berikut untuk menggunakan jumlah sampel minimal untuk seluruh daerah penelitian N adalah sebagai berikut :
Dimana Z= 2, yang merupakan standard normal deviate untuk derajat kepercayaan sebesar 95% adalah tingkat akurasi yang diharapkan dan q= (100-p); sementara E = tingkat kesalahan yang diperbolehkan. Contoh berdasarkan rumus ini adalah sebagai berikut. Misalnya, jika akurasi 85% diharapkan, dan kesalahan yang diizinkan adalah 5% (derajat kepercayaan 95%), maka :
Tetapi
nilai N ini akan berubah drastis jika kesalahan yang diperbolehkan berubah,
contohnya, kalau kesalahan yang diperbolehkan turun jadi 2% maka nilai N
menjadi 1.275, jauh diatas jumlah sampel pada contoh sebelumnya, yang hanya
204.
Pertanyaannya
yang muncul adalah : dimana saja sampel sebanyak itu akan diambil? McCoy (2005)
mengkritik bahwa metode ini tidak memperhatikan luas dan kompleksitas wilayah.
Hal ini bertentangan dengan prinsip geografi bahwa variabilitas fenomena dalam
ruang menjadi salah satu kunci penentu dalam melakukan kajian, dan tentu saja
termasuk dalam pengambilan sampel.
Pengambilan
sampel pada citra bisa dibantu dengan tampilan citra lebih dari satu, yang
memanfaatkan komposit warna yang berbeda-beda. Danoedoro (2004)
mendemonstrasikan hal ini dengan menampilkan citra pada lebih dari satu jendela
(window), dengan bantuan perangkat
lunak pengolahan citra berbasis windows, yaitu ENVI (lihat gambar 8.6). pada
satu jendela tersaji citra komposit warna semu standar Quickbird multispektral,
sementara dijendela yang lain tersaji citra wilayah yang sama dalam komposisi
yang dipertajam oleh citra pankromatik.
Separabilitas
Antarsampel
Campbell
(2002) melaporkan temuan beberapa penelitian lain yang pernah menyimpulkan
bahwa pemilihan sampel lebih berpengaruh terhadap akurasi hasil klasifikasi
daripada pemilihan algoritma klasifikasi itu sendiri. Oleh karena itu, strategi
pengambilan sampel yang dilakukan secara cermat dan hati-hati mutlak
diperlukan, untuk evaluasi tingkat separabilitas antarsampel, beberapa metode
pengukuran dikenal, misalnya divergence
(D), transformed divergence (TD) dan
jarak Jeffries-Matusita (JM) (Richards, 1993; Jansen, 2005; Lillesand et., al 2008), indeks divergensi D dan transformed divergence TD dihitung
berdasarkan rumus berikut ini (Tso dan Mather, 2009) :
Pada evaluasi tingkat separabilitas, analis memperoleh masukkan mengenai kategori atau kelas apa saja yang nantinya perlu untuk digabung, baik pada saat pengambilan sampel (yang berarti mengulang proses pengambilan sampel) maupun pada saat pemrosesan pasca klasifikasi (postclassification).
3.
Bebrapa
Algoritma Klasifikasi Tersedia
a. Jarak
minimum terhadap Rerata (Minimum Distance
to Mean Algorithm)
Bayangkanlah suatu Feature space n dimensi, yang
menggambarkan saluran 1,2,3,......,n dalam suatu sistem multispektral. Melalui
sistem ini tiap objek yang sama akan mempunyai nilai ganda; pada saluran
1,2,3,..., dan n. Setiap piksel dapat
diplot pada ruang spektral, dan diukur jarak spektralnya terhadap suatu piksel
sampel acuan (yang telah diketahui pasti jenisnya), dengan menggunakan
persamaan berikut ini :
Dimana
BVijk dan BVijl adalah posisi koordinat piksel yang
tidak diketahui pada saluran k dan saluran l, sementara µck dan µcl
adalah nilai rerata vektor piksel kelas c disaluran k dan l. Apabila lebih dari
dua saluran digunakan sebagai masukkan maka rumusnya menjadi :
Dimana
BVijk adalah vektor piksel pada saluran k dan µck adalah
nilai Rerata vektor piksel kelas c disaluran k.
c. Alogaritma Kemungkinan Maksimum (Maximum Likelihood Algoritm)
Untuk memutuskan klasifikasi, dibutuhkan informasi statistik berupa rerata dan simpangan baku tiap sampel, serta variansi (ragam) dan kovariansi. Rerata dan simpangan baku tiap sampel secara otomatis tersimpan pada waktu melakukan pengambilan sampel. Nilai vektor rerata menentukan posisi elipsoida sampel pada feature space multisaluran. Ukuran elipsoida ditentukan oleh nilai variansi pada tiap saluran, sedangkan bentuk dan orientasi elipsoida tersebut ditentukan oleh kovariansinya (Sharestha, 1991).
Berdasarkan rerata, variansi, dan kovariansi ini, probabilitas tiap piksel untuk dikatakan sebagai ‘milik’ suatu kelas tertentu dapat dihitung. Fungsi kerapatan probabilitas yang didefenisikan oleh alogaritma kemungkinan maksimum. Nilai probabilitas dinyatakan pada sumbu z, namum bila digambarkan dalam ruang dua dimensi, distribusi sampel dalam ‘cara pandang’ kemungkinan maksimum dinyatakan sebagai garis-garis kontur ekuiprobabilitas.
Pertimbangan Probabilitas untuk Maximum Likelihood
Hasil klasifikasi ini adalah kelompok-kelompok spectral yang siap untuk diklasifikasi secara tersedia (menggunakan algoritma-algoritma pada butir 8.1.2.3).
Metode perhitungan yang dipakai biasanya adalah jarak minimum terhadap rerata. Melalui metode ini, pemecahan dan penggabungan kelas dilakukan secara iterative, dan juga penghapusan apabila perlu, yang kesemuanya dilandasi oleh nilai ambang yang ditentukan sebelumnya. Seluruh piksel diklasifikasikan ke kelas terdekat, kecuali ada nilai simpangan baku dan nilai ambang jarak yang ditentukan sebelumnya. Artinya, bisa saja ada piksel yang kemudian tidak terklasifikasi apabila tidak memenuhi nilai ambang yang ditentukan. Proses iterasi baru berhenti ketika jumlah maksimum iterasi dan atau nilai ambang yang ditentukan telah tercapai.
Secara prakti, analisis memasukan jumlah dan nama saluran spectral yang akan diklaasifikasi, dan berdasarkan data tersebut akan dihasilkan suatu histogram yang mempresentasikan gugus-gugus yang menyatakan frekuensi keberadaan gugus tersebut di seluruh saluran spectral yang digunakan. Analis perlu mengevaluasi grafik ini, khususnya perubahan mendadak (breaks) pada kurva yang diasumsikan mewakili setiap gugus. Setelah itu, analis menentukan jumlah gugus yang akan dihasilkan, berdasarkan perubahan-perubahan kurva utama pada histogram. Kemampuan setiap perangkat lunak untuk melibatkan jumlah saluran spectral bisa berbeda-beda. Begitu pula jumlah gugus yang dapat dihasilkan.
Apabila jarak spektral
JS ini dihitung untuk seluruh kelas c yang tersedia maka suatu jarak terpendek
untuk kelas tertentu akan diperoleh, dan piksel yang dihitung akan diberi label
kelas itu. Pada alogaritma ini hanya dibutuhkan suatu nilai ambang (threshold value) sehingga bila semua
jarak yang dihitung ternyata tidak ada yang memenuhinya, piksel yang
bersangkutan akan dianggap tak terklasifikasi.
Keuntungan dari
penggunaan alogaritma klasifikasi ini ialah kecepatannya (kecuali bila
dibandingkan dengan alogaritma parallelepiped).
Kelemahannya, cara ini tidak mempertimbangkan variabilitas kelas. Sebagai
contoh, lahan terbuka berbatuan gamping di sana-sini tersusun oleh banyak
piksel dengan variansi yang tinggi, yang berarti mempunyai piksel dengan jarak
spektral yang jauh dari nilai reratanya. Piksel-piksel semacam ini akan dapat
salah terklasifikasi. Sebaliknya, objek yang variansi nilai pikselnya kecil,
seperti air jernih akan menghasilkan piksel-piksel yang terlalu banyak
terklasifikasi masuk ke kelas air.
b.
Alogaritma Parallelepiped (Box Classification Alogarithm)
klasifikasi dengan
alogaritma ini dapat dijelaskan dengan langkah-langkah sebagai berikut.
Pertama, operator memasukan sampel berupa nilai kelompok piksel beserta dengan
nama (label)nya. Nilai kelompok piksel ini hanya akan dicatat sebagai nilai
rerata beserta dengan simpangan bakunya (sd).
Kedua, sampel-sampel yang telah tercatat
nilai rerata dan labelnya ini kemudian akan ditempatkan pada ruang spektral n dimensi, dimana n adalah jumlah saluran spektral yang dijadikan masukan. Ketiga,
operator diminta memasukan suatu koefisien pengalih p. Nilai p ini nantinya
akan dikalikan dengan sd pada
tiap saluran. Nilai p × sd ini digunakan sebagai
nilai panjang tiap sisi yang dibangun pada nilai rerata sebagai pusat kotak
(lihat Gambar 8.5).
Setelah semua sampel
selesai dicatat oleh komputer, dan si pengguna telah memasukan nilai koefisien
pengalih p, maka program pun segera
memutuskan klasifikasi. Proses ini dimulai dari piksel baris 1 kolom 1, sampai
baris terakhir kolom terakhir. Apabila ternyata vek-tor piksel yang
bersangkutan masuk ke salah satu kotak (box)
sampel maka ini dikalsifikasikan sebagai kelas yang menandai kotak tersebut.
Itulah sebabnya, klasifikasi parallelepiped
ini sering juga disebut sebagai klasifikasi box.
Namun disamping itu,
bisa jadi suatu vektor piksel ternyata tidak masuk kotak mana pun. Piksel ini
dinyatakan sebagai ‘tak terklasifikasi’. Besarnya nilai faktor pengalih p sangat menentukan banyaknya piksel
yang tak terklasifikasi. Semakin besar nilai p, semakin besar ukuran tiap kotak, dan semakin kecil risiko suatu
vektor piksel untuk tidak masuk kotak mana pun (unclassified). Akan tetapi, semakin besar kotak berarti pula
semakin kurang teliti hasil klasifikasinya (banyak yang misclassified), karena tingkat generalisasinya pun menjadi semakin
besar.
c. Alogaritma Kemungkinan Maksimum (Maximum Likelihood Algoritm)
Alogaritma kemungkinan
maksimum merupakan alogaritma yang secara statistik paling mapan. Kalau
alogaritma lain didasari oleh pengukuran jarak antara koordinat gugus sampel
dengan koordinat piksel kandidat (yang akan dikelaskan atau diberi label) maka
alogaritma kemungkinan maksimum menggunakan dasar perhitungan probabilitas.
Asumsi dari alogaritma ini ialah bahwa objek homogen selalu menampilkan
histogram yang terdistribusi normal (Bayesian).
Pada alogaritma ini, piksel dikelaskan sebagai objek tertentu bukan karena
jarak euklidiannya, melainkan oleh bentuk, ukuran dan orientasi sampel pada feature space (yang berupa elipsoida)
(Shresta, 1991).
Aturan Umum
Jensen (2005)
menjelaskan bahwa alogaritma kemungkinan maksimum bekerja dengan cara berikut.
Pertama, program secara ringkas menandai setiap piksel yang mempunyai hasil
pengukuran pola atau kenampakan X ke
dalam i yang satuannya paling mungkin
dikelompokan sebagai vektor X. Dengan
kata lain, probabilitas suatu untuk menjadi milik sejumlah kelas yang sudah
didefinisikan dalam proses pengambilan sampel dihitung, kemudian piksel ini
ditandai sebagai salah satu kelas yang nilai probabilitas piksel tersebut untuk
menjadi anggotanya merupakan nilai yang tertinggi. Alogaritma kemungkinan
maksimum mengasumsikan bahwa statistik setiap sampel bersifat Gaussian (terdistribusi normal). Dengan
kata lain, sampel yang membentuk histogram bimodal atau multimodal dalam suatu
saluran tunggal tidaklah ideal.
Untuk memutuskan klasifikasi, dibutuhkan informasi statistik berupa rerata dan simpangan baku tiap sampel, serta variansi (ragam) dan kovariansi. Rerata dan simpangan baku tiap sampel secara otomatis tersimpan pada waktu melakukan pengambilan sampel. Nilai vektor rerata menentukan posisi elipsoida sampel pada feature space multisaluran. Ukuran elipsoida ditentukan oleh nilai variansi pada tiap saluran, sedangkan bentuk dan orientasi elipsoida tersebut ditentukan oleh kovariansinya (Sharestha, 1991).
Berdasarkan rerata, variansi, dan kovariansi ini, probabilitas tiap piksel untuk dikatakan sebagai ‘milik’ suatu kelas tertentu dapat dihitung. Fungsi kerapatan probabilitas yang didefenisikan oleh alogaritma kemungkinan maksimum. Nilai probabilitas dinyatakan pada sumbu z, namum bila digambarkan dalam ruang dua dimensi, distribusi sampel dalam ‘cara pandang’ kemungkinan maksimum dinyatakan sebagai garis-garis kontur ekuiprobabilitas.
Cara memperoleh
informasi probabilitas yang diperlukan dari sampel yang sudah dikumpulkan ialah
dengan menggunakan fungsi kerapatan probabilitas (probability density function). Sebagai contoh, kalau ada satu
sampel hutan yang diambil dari suatu saluran tunggal maka sampel tersebut dapat
dihitung histogramnya dan kemudian berdasarkan histogram ini dapat dihitung
perkiraan distribusinya melalui suatu fungsi kerapatan probabilitas normal.
Pada alogaritma
klasifikasi kemungkinan maksimum ini diasumsikan bahwa probabilitas untuk semua
kelas dipandang sama. Pada kenyataanya, tidak semua kelas dapat diperlakukan
dengan probabilitas sama untuk dipresentasikan pada citra. Suatu gugus sampel
yang jauh lebih kecil untuk muncul sehingga perlu adanya faktor pembobot untuk
masing-masing kelas yang ada. Gugus sampel yang kecil ini secara logis dapat
diberi bobot yang lebih rendah dibandingkan gugus yang lain (Curran, 1985).
Strhler (1980) menamakannya prior
probability.
Pertimbangan Probabilitas untuk Maximum Likelihood
Melengkapi uraian
tersebut di atas, Gao (20100 menjelaskan landasan berpikir alogaritma maximum likelihood sebagai berikut. Alogaritma ini menggunakan nilai
probabilitas suatu piksel X untuk
menjadi anggota dari suatu kelas informasi atau label tertentu. Metode yang
melandasi alogaritma ini adalah statistik orde dua (second order statistics) mengenai model fungsi kerapatan
probabilitas gaussian untuk setiap
kelas.
di mana max[p(Ci/X),
p(C2/X), .....p(Cm/X)] merupakan fungsi yang
memberikan nilai probabilitas terbesar diantara nilai-nilai yang ada di dalam
tanda kurung. Misalnya, max[0.25,
0.34, 0.21, 0.62, 0.39] adalah 0.62. Adapun p(Ci/X)
menunjukan probabilitas kondisional piksel X untuk menjadi anggota kelas Ci.
Pemecahannya menggunakan teorema Bayes;
di mana p(Ci/X) mewakili probabilitas
kondisonal untuk menemukan piksel X
dalam kelas Ci. Sementara
p(Ci) juga sering disebut
dengan probabilitas a priori (mendahului
fakta), yang merupakan probabilitas keberadaan kelas Ci dalam citra
masukan; p(X) menunjukan probabilitas
piksel X pada citra masukan. Ini
semua diperoleh dari sampel-sampel, dengan cara menjumlahkan semua probabilitas
yang ada pada setiap kelas dikalikan dengan proporsi pada setiap kelas tersebut,
atau:
seperti batas persamaan
(8.8) dann (8.9) bertolak belakang
karena probabilitas untuk menemukan kelas informasi spesifik p(Ci) harus diketahui lebih
dahulu. Tanpa hasil klasifikasi, berapa besar setiap kelas penutup lahan pada
citra masukan tidak mungkin diketahui. Untuk mengatasi kontradiksi ini, ada dua
pendekatan (Gao, 2010):
-
Pertama, presentase setiap penutup lahan
yang dapat diturunkan dari klasifikasi yang lain, seperti misalnya melalui
klasifikasi tak terselia, minimum
distance to mean, atau berdasarkan
maximum likelihood yang telah dijalankan sebelumnya.
-
Kedua, probabilitas dapat diasumsikan
sama untuk seluruh kelas penutup lahan.
Asumsi-asumsi tersebut
tidaklah rasional, tetapi tampaknya tidak berpengaruh terhadap hasil
klasifikasi karena klasifikasinya sendiri bersifat robust. Dalam pelaksanaanya, analis dengan maximum likelihood diberi kesempatan untuk memberikan nilai
probabilitas untuk setiap kelas. Lepas dari itu, metode apa pun yang akan
dipilih untuk memecahkan masalah p(Ci)
tidak ada pengaruh dalam penentuan p(Ci/X)
setelah persamaan (8.8) dimasukan ke persamaan (8.9), atau menjadi:
Dengan demikian,
kalkulasi p(Ci/X) direduksi
menjadi penentuan p(X/Ci). Kalkulasi
probabilitas kondisional semacam ini didsari oleh model probabilitas distribusi
normal menurut asumsi distribusi normal untuk semua sampel. Dalam kasus satu
dimensi, maka:
di mana µi adalah
rerata untuk kelas Ci dan i adalah
simpangan baku untuk kelas Ci. Baik Ci maupun i diturunkan dari sampel.
Komputasi p(X/Ci) menjadi semakin rumit
dalam domain multispektral, seperti yang biasa dijumpai dalam citra satelit,
yaitu:
di mana µi
dan Ei berturut-turut adalah vektor rerata dan matriks kovariansi
kelas Ci. Keduanya diestimasi dari sampel melalui estimasi tak-bias
berdasarkan persamaan berikut;
Mengacu pada aturan
gtersebut, piksel X adalah anggota
dari kelas informasi Ci,
jika dan hanya jika probabilitas piksel ini untuk menjadi milik anggota kelas i
lebih besar dari pada probabilitas untuk menjadi milik kelas informasi yang
lain. Untuk setiap piksel pada citra masukan, nilai probabilitasnya untuk
muncul disetiap kelas informasi harus dikomputasi dengan persamaan (8.12).
Intensitas komputasi meningkat dengan pesat sejalan dengan penambahan ukuran
citra . jika nilai probabilitas tertinggi muncul untuk menjadi anggota dua
kelas informasi yang berbeda, tentunya tidak bisa diputuskan begitu saja untuk
menjadi milik salah satu tanpa suatu bukti yang lengkap. Kadang kala dibuat
aturan tambahan untuk menjadi milik salah satu kelas informasi tanpa suatu
pedoman statistik yang jelas (bersifat arbitrary),
dengan resiko bahwa hal ini menimbulkan kesalahan. Cara lain adalah membiarkan
piksel semacam itu ke dalam kelas ‘tak terklasifikasi’.
Probabilitas suatu
kelas untuk muncul selalu terdapat pada bagian pusat gugus. Probabilitas ini
menurun selaras dengan menjauhnya jarak dari titik pusat gugus. Pada gambar
8.10 disajikan gradasi penurunan probabilitas dalam bentuk kontur
ekuiprobabilitas. Seperti dijelaskan sebelumnya, piksel yang ‘jatuh’ diarea
pertampalan dua kontur ekuiprobabilitas yang sama tak dapat dikelskan dengan
kepastian 100%. Ada pertimbangan lain, misalnya kurva probabilitas dua penutup
lahan yang terlihat dievaluasi terlebih dahulu.
Berdasarkan Gambar 8.10
terlihat bahwa kurva probabilitas dua kelas A(air) dan V (vegetasi) tersaji
pada satu saluran spektral. Dua kurva distribusi probabilitas kondisional
bertampalan satu dengan yang lain pada nilai piksel (BV) = 102. Piksel-piksel
yang berada dibawah area bertampalan tentu sja tidak bisa begitu saja
diklasifikasi ke salah satu kelas. Diperlukan kalkulasi probabilitas
kondisional untuk kelas A dan V. Misalnya, probabilitas BV=102 untuk menjadi
anggota kelas A dalah p(A/102), dan
probabilitas BV=102 untuk menjadi anggota kelas V adalah p(V/102). Penentuan kedua probabilitas ini memerlukan nilai
probabilitas untuk p(A) dan p(V), yang diasumsikan berturut-turut 0,4 dan 0,6.
Selanjutnya diasumsikan bahwa probabilitas kondisional untuk menjumpai nilai
102 pada sampel-sampel A dan V adalah p(102/A)=
0,7 dan p(102/V)= 0,3, sehingga:
Dengan demikian, semua
piksel dengan nilai 102 pada saluran ini akan diklasifikasikan sebagai A (air).
Pada contoh ini, jumlah saluran yang digunakan adalah satu. Dalam kenyataan,
jumlah saluran bisa lebih banyak, dan kalkulasi probabilitas kondisional harus
mengacu pada persamaan (8.12).
Klasifikasi dengan
Menggunakan Jarak Ambang
Pengambilan keputusan
yang memperhatikan maximum likelihood
(kemungkinan maksimum) dilakukan berdasarkan persamaan berikut (Jensen, 2005).
di mana:
D =
jarak yang diberi bobot
c =
suatu kelas tertentu
X =
vektor piksel yang diklasifikasikan
Mc = vektor rerata sampel
kelas c
ac = presentase
probabilitas sembarang piksel untuk dapat menjadi anggota kelas c, di mana nilai default (yang ditawarkan komputer) adalah 1,0 yang berasal dari
pengetahuan/informasi a priori
Covc = matriks kovariansi
piksel-piksel pada sampel kelas c,
*Covc* = determinan Covc (aljabar matriks)
Covc-1 = inversi Covc (aljabar matriks)
Ln = fungsi logaritma natural
T = fungsi transpose
(aljabar matriks)
Malalui persamaan ini,
suatu piksel akan dimasukan sebagai kelas c,
apabila nilai D untuk kelas c adalah
yang terendah. Secara teoretis, alogaritma kemungkinan maksimum ini akan
berfungsi dengan baik, apabila bentuk histogram saluran-saluran yang dilibatkan
dalam proses klasifikasi menyajikan bentuk distribusi normal karena alogaritma
ini mempertimbangkan paling banyak variabel statistik dibanding yang lain.
Dalam praktek, selain faktor bentuk histogramnya, bentuk gugugs-gugus sampel
yang cenderung elipsoid juga akan lebih akurat apabila diklasifikasikan dengan
alogaritma ini. Perlu diperhatikan bahwa sofistikasi alogaritma ini masih
mengandalkan diri pada asumsu bahwa berbagai objek dapat dibedakan semata-mata
berdasarkan kecenderungan spektralnya. Kenyataan menunjukan bahwa objek terlalu
kompleks untuk dapat diklasifikasikan dengan asumsi ini.
Selanjutnya Gao (2010)
menyatakan bahwa seperti halnya klasifikasi parametik lainnya, alogaritma
klasifikasi maximum likelihood
dibatasi oleh hal-hal berikut. Pertama, kalkulasi p(X/Ci) memerlukan sampel semua kelas penutup lahan yang
akan dipetakan dalam bentuk distribusi normal, yang sulit dipenuhi dalam
praktek. Meskipun demikian, alogaritma ini dapat menoleransi sampel yang tidak
terdistribusi normal pada tingkat tertentu. Kedua, masukan nilai piksel X biasanya dikuantifikasi dalam bentuk
koding 8-bit atau 256 tingkat kecerahan, dan bersifat integer. Inkompatibilitas
format data muncul ketika alogaritma ini digunakan untuk memasukan data non
penginderaan jauh, misalnya model elivasi digital. Ketiga, untuk mengalkulasi p(X/Ci), matriks kovariansi
setiap kelas harus non-singular atau dapat diinversi. Untuk mengklasifikasi
citra multispektral dengan jumlah saluran yang sangat banyak, misalnya citra
hiperspektral, hal ini bisa menjadi masalah (Benediktsson et al,. 1993).
d.
Alogaritma Tetangga Terdekat (K-Nearest Neighbour Algorithm)
Alogaritma klasifikasi
tetangga terdekat ini dipandang sebagai salah satu variasi dari prinsip
kemungkinan maksimum (maximum likelihood)
non-parametrik (Mulder dan Kostwinder, 1987). Keputusan bahwa satu nilai vektor
masuk pada salah satu kelas ditentukan oleh sejumlah k sampel terdekat pada feature
space-nya. Biasanya k ini bernilai 3 atau 5. Oleh karena itu, alogaritma
ini sering pula dipandang sebagai cara pengambilan keputusan yang ‘demokratis’.
Di samping itu, alogaritma tetangga terdekat juga menggunakan suatu pendekatan
nilai ambang jarak spektral pada feature
space, untuk mencari sampel-sampel tetangga yang dijadikan rujukan. Nilai
ambang ini disebut radius pelacakan (searching
radius). Radius pelacakan ini juga menentukan fungsi penghalusan
histogramnya (histogram smoothing).
8.2.2
Klasifikasi Tak-tersedia
Berbeda halnya dengan klasifikasi tersedia,
klasifikasi tak tersedia secara otomatis diputuskan oleh computer, tanpa campur
tangan operator (kalaupun ada, proses interaksi ini sangat terbatas). Proses
ini sendiri adalah suatu proses iterasi,
samapai menghasilkan pengelompokan akhir gugus-gugus spectral. Campur tangan
operator terutama setelah gugus-gugus spectral terbentuk, yaitu dengan menandai
tiap gugus sebagai objek tertentu. Oleh karena itu, teknik klasifikasi semacam
ini disebut klasifikasi a-posteriori
(setelah fakta), sebagai lawan dari klasifikasi a-riori (mendahului fakta)
(Robinove,1981, dalam Jensen,2005). Shrestha (1991) menyebutkan adanya tiga
algoritma klasifikasi tak tersedia, yaitu jarak minimum ke pusat gugus,
penggusan statistic, dan algoritma campuran. Berikut ini uraian singkat
masing-masing algoritma.
- Jarak Minimum ke Pusat Gugus (Minumum Distance to Cluster Center)
Algoritma
ini kadang kala disebut sebagai k-means algorithm, dan mengikuti tahap-tahap
sebagai berikut. Pertama, secara bebas (arbitrarily) sioperator memasukan
jumlah maksimum kelas atau gugus. Kedua, berdasarkan masukan ini, secara acak
(random) computer akan menempatkan vector rerata sebagai titik-titik pusat
gugus (gugus-gugusnya sendiri belum terbentuk). Ketiga, berdasarkan distribusi
titik-titik pusat ini, seluruh titik piksel dihitung dan ditandai sesuai dengan
nama atau urutan gugus yang terdekat jaraknya.
Sekali gugus-gugus ini terbentuk maka terlihat
bahwa titik-titik pusat (centroids)
yang ditentukan secara acak tadi tidaklah tepat posisinya; sehingga computer
segera menentukan titik-titik pusat baru. Begitu titik-titik pusat baru
terbentuk, pembentukan gugus-gugus baru pun dimulai lagi. Begitu seterusnya,
sampai akhirnya terbentuk titik-titik pusat dengan posisi akhir, dan
pengelompokan akhir. Di sinilah letak proses iterasinya. Melalui proses ini,
jumlah akhir gugus dapat tidak sama dengan jumlah yang diberikan oleh si
operator (secara bebas) karena terjadi proses pengelompokan kembali dan
sekaligus pemecahan gugus. Bila didapati suatu gugus yang hanya terdiri atas
sedikit piksel maka gugus ini dapat dihilangkan dengan masukan nilai ambang
tertentu.
Untuk meningkatkan efisiensi proses
klasifikasi, masuka utama dari operator yang dibutuhkan ialah: (a) jumlah
maksimum kelas/gugus, (b) jarak antara 2 pusat gugus, (c) jejari (radius)
gugus, dan (d) jumlah piksel minimum sebagai nilai ambang factor penghilangan
gugus.
- Penggugusan Statistik (Statistical Clustering)
Algoritma
ini menggunakan parameter statistic berupa nilai variasi (ragam) untuk
menentukan homogenitas kelas atau gugus. Dengan menggunakan jendela matriks (moving window), yang biasanya berukuran
3x3, seluruh nilai piksel di bawah jendela ini diperhintungkan sampai beberapa
kali jendela bergerak. Nilai ambang variasi dan berapa kali jendela bergerak di
berika oleh operator. Bila nilai rerata piksel-piksel dibawah jendela ini lebih
rendah daripada nilai variasinya maka nilai rerata ini menjadi pusat kelas atau
gugus. Setelah semua gugus terbentuk maka penggabungan gugus berdasarkan jarak
antara gugus dilakukan. Dengan demikian, algoritma ini membutuhkan masukan
berupa :
a.
Jumlah gugus/kelas
maksimum
b.
Nilai ambang variasi
c.
Jumlah gerakan jendela
untuk setiap kali perhitungan variasi dan rerata, dan
d.
Nilai ambang jarak
antara gugus.
Hasil klasifikasi ini adalah kelompok-kelompok spectral yang siap untuk diklasifikasi secara tersedia (menggunakan algoritma-algoritma pada butir 8.1.2.3).
- Isodata
Pada
contoh-contoh terdahulu diasumsikan bahwa jumlah gugus (klaster) telah
diketahui sebelumnya. ISODATA (Iterative Self-Organizing Data Analysis
Technique) menggunakan formula minimal untuk pengelompokkan piksel pada citra
multispectral untuk menghasilkan gugus-gugus yang relative homogen. Komputer
melakukan kalkulasi nilai-nilai rerata kelas dengan mempertimbangkan distribusi
nilai yang merata (evenly distributed),
kemudian melakukan iterasi pembentukan gugus dengan memperhatikan nilai rerata
yang baru.
Metode perhitungan yang dipakai biasanya adalah jarak minimum terhadap rerata. Melalui metode ini, pemecahan dan penggabungan kelas dilakukan secara iterative, dan juga penghapusan apabila perlu, yang kesemuanya dilandasi oleh nilai ambang yang ditentukan sebelumnya. Seluruh piksel diklasifikasikan ke kelas terdekat, kecuali ada nilai simpangan baku dan nilai ambang jarak yang ditentukan sebelumnya. Artinya, bisa saja ada piksel yang kemudian tidak terklasifikasi apabila tidak memenuhi nilai ambang yang ditentukan. Proses iterasi baru berhenti ketika jumlah maksimum iterasi dan atau nilai ambang yang ditentukan telah tercapai.
Secara prakti, analisis memasukan jumlah dan nama saluran spectral yang akan diklaasifikasi, dan berdasarkan data tersebut akan dihasilkan suatu histogram yang mempresentasikan gugus-gugus yang menyatakan frekuensi keberadaan gugus tersebut di seluruh saluran spectral yang digunakan. Analis perlu mengevaluasi grafik ini, khususnya perubahan mendadak (breaks) pada kurva yang diasumsikan mewakili setiap gugus. Setelah itu, analis menentukan jumlah gugus yang akan dihasilkan, berdasarkan perubahan-perubahan kurva utama pada histogram. Kemampuan setiap perangkat lunak untuk melibatkan jumlah saluran spectral bisa berbeda-beda. Begitu pula jumlah gugus yang dapat dihasilkan.
- Algoritma Campuran (Hybrid Algorithm)
Penghitungan
seluruh nilai piksel pada seluruh citra tentu saja sangat menghabiskan waktu
dan biaya. Oleh karena itu, algoritma campuran dikembangkan, yang hanya
mempertimbangkan daerah sampel yang secara spekral, cukup mewakili daerah
keseluruhan pada citra. Nantinya hasil pengelompkan spectral ini diekstra
menjadi file tersendiri, dan
dijadikan masukan dalam ekstrapolasi pengelompokan untuk seluruh citra. Karena
di sini ada proses pengambilan bagian citra (subset) sebagai sampel maka istilah campuran (hybrid) pun lebih tepat diberikan, mengingat proses pengambilan
sampel sendiri lebing sering digunakan pada algorritma klasifikasi tersedia.
8.2.3
Sentuhan Akhir dalam Klasifkasi
1.
Dari Kelas Spektral ke Kelas Internasional
Perlu
pula diperhatikan bahwa hasil langsung klasifikasi multispectral ialah
kelas-kelas spectral yang berhubungan dengan penutup lahan. Jumlah kelas ini
biasanya cukup banyak (sering kali mencapai 30 kelas atau lebih), sesuai dengan
variabilitasi spectral di daerah penelitian, dan kurang operasional untuk
disajikan sebagai peta penutup lahan. Untuk menyederhanakannya, diperlukan
operasi pengelompokan kembali kelas-kelas tersebut menjadi kelas generic dengan
nilai piksel yang baru.
Strategi
yang sangat direkomendasikan dalam pengambilan sampel atau spectral training area adalah memilih kelompok piksel yang berbeda secara spektral. Hal ini bisa indisikasikan oleh bentuk
klaster atau gugusnya dalam feature space
yang mengelompokkan padat, nilai simpangan baku yang relatif kecil, warna yang
homogen dalam tampilan citra komposit, serta nilai keterpisahan (separability index) dengan sampel lain
yang juga besar apabila perangkat lunak yang digunakan mempunyai fasilitas
untuk melakukan komputasi parameter ini. Dengan demikian, hasil eksekusi
klasifikasi multispektral bisa merupakan peta kelas-kelas spektral yang
labelnya kadang-kadang kurang bermakna secara praktis.misalnya ̋air_ 1”,
air_2”,dan tanah lembab_1”, vegetasi mangrove , dan seterusnya. Nama-nama ini diberikan
sesuai dengan banyaknya variasi spektral kenampakan objek pada citra, meskipun
secara umum analis masih mengelompokkannya kedalam kategori umum yang sama.
Hasil klasifikasi secara langsung ini kemudian masih
perlu diproses lebih lanjut melalui penggabungan kelas (class merging atau
class regrouping). Proses penggabungan ini tidak bisa dilakukan pada saat
pengambilan sampel karena akan mengakibatkan perubahan signifikan terhadap
parameter statistik citra. Misalnya, piksel-piksel yang mewakili vegetasi
kerapatan rendah perlu disampel dan dikelaskan menjadi tiga kelompok, yaitu vegetasi_jarang_2, dan vegetasi_jarang_3
karena ketiganya tumbuh pada latar belakang tanahn yang berbeda misalnya
berturut-turut tanah lembap berwarna merah cokelat, tanah kering berwarna
hitam, dan tanah kering berwarna kelabu cerah. Ketiga sampel ini bisa mempunyai
nilai rerata dan simpangan baku yang jauh berbeda pada beberapa saluran
sehingga penggabungan sampel menjadi satu nama baru vegetasi jarang akan
berakibat pada perubahan nilai rerata dan simpangan baku secara signifikan, dan
bisa mengakibatkan kemunculan parameter statistik baru yang tidak mewakili
ketiga sampel asli.
2. Generalisasi Hasil Klasifikasi melalui Pemfilteran
Mayoritas
Hasil klarifikasi multispektral, baik secara tersedia
maupun tidak menyatakan distribusi spasial objek pada daerah penelitian. Tiap
objek diwakili oleh suatu nilai dan ditampilkan sebagai warna tertentu, nilai
disini sudah bukan lagi ekspresi respon spektral objek melainkan urutan
pemberian tanda pada waktu pengambilan samapel. Dengan kata lain, nilai
1,2,3,... tidak dapat lagi dipandang sebagai data rasio ataupun interval,
melainkan sebagai data nominal atau label. Beberapa perangkat lunak sudah
justru menggunakan label nama kelas, dan bukan nilai piksel untuk berkomunikasi
dengan pengguna perangkat lunaknya , meskipun sebenarnya basis tautan antara
piksel dengan atribut nama kelas tetaplah nilai piksel.
Disisi lain, hasil klasifikasi multispektral sering
menghasilkan piksel-piksel terasing
(satu atau dua piksel) di tengah piksel-piksel homogen, misalnya piksel
berlabel hutan ditengah piksel-piksel berlabel air laut. Cara menghilangkan
piksel-piksel terasing ini ialah dengan filter mayoritas (lihat bab 6). Melalui
jendela matrix 3x3,5x5, atau 7x7 piksel-piksel yang ada dibawah jendela ini
diperhitungkan dan lihat modusnya. Untuk jendela 3x3, sejumlah 6 piksel dengan
nilai sama sudah dapat dipandang sebagai modus (nilai yang paling sering muncul
dijadikan masukan dalam ekstrapolasi pengelompokan untuk seluruh citra. Karena
disini ada proses pengambilan bagian citra (subset)
sebagai sampel maka istilah campuran (hybrid)
pun lebih tepat diberikan, mengingat proses pengambilan sampel sendiri lebih
sering digunakan pada algoritma klasifikasi tersedia.
8.2.3 sentuhan
akhir dalam klasifikasi
1. dari kelas
spektral ke kelas informasional
Perlu pula diperhatikan bahwa hasil langsung klasifikasi
multispketral ialah kelas-kelas spektral yang berhubungan dengan penutup lahan.
Jumlah kelas ini biasanya cukup banyak (seringkali mencapai 30 kelas atau
lebih), sesuai dengan variabilitas spektral di daerah penelitian, dan kurang
operasional untuk disajikan sebagai peta penutup lahan. Untuk
menyederhanakannya, diperlukan operasi pengelompokan kembali kelas-kelas
tersebut menjadi kelas generik dnegan nilai piksel yang baru.
Strategi yang sangat direkomendasikan dalam pengambilan
sampel atau spectral training area adalah
memilih kelompok piksel yang berbeda secara spektral. Hal ini bisa
diindikasikan oleh bentuk klaster atau gugusnya dalam feature
space yang mengelompok padat, nilai simpangan baku yang relatif kecil,
warna yang homogen dalam tampilan citra komposit, serta nilai keterpisahan (separability indeks) dengan sampel lain yang juga besar apabila perangkat lunak
yang digunakan mempunyai fasilitas untuk melakukan komputasi parameter ini.
Dengan demikian, hasil eksekusi klasifikasi multispektral bisa merupakan peta
kelas-kelas spektral yang labelnya kadang-kadang kurang bermakna secara
praktis, misalnya “air_1”, “air_2”, “tanah_lembab_1”, “vegetasi_mangrove_2”,
dan seterusnya. Nama-nama ini diberikan sesuai dengan banyaknya variasi
spektral kenampakan objek pada citra, meskipun secara umum analis masih
mengelompokannya kedalam kategori umum yang sama.
Hasil klasifikasi secara langsung dan masih diproses
lebih lanjut melalui penggabungan yang tidak bisa dilakukan pada saat proses
penggabungan yang akan mengakibatkan perubahan signifikan terhadap parameter
statistik citra.
8.3 penilaian akurasi hasil klasifikasi
Telah dikemukakan dalam bab 5 bahwa data spasial dapat
diukur kualitas dan hal ini telah menjadi salah satu kebutuhan utama dalam
operasiionalisasi sistem informasi geografi kebutuhan akan kualitas data
spasial beserta kriteria penentuan desertasi dan standar smakin terasa ketika
permodelan masukan dari berbagai sumber.
DAFTAR PUSTAKA
Danoedoro,Projo. Penagantar Penginderaan Jauh
Digital .-Ed.1.-Yogyakarta: ANDI.2012