Komponen
data mining pada proses KDD seringkali merupakan aplikasi iterative yang
berulang dari metodologi data mining tertentu. Pada pembahasan ini digunakan
istilah pola dan model. Pola data diartikan sebagai instansiasi dari model. Sebagai contoh f(x)= 3x+ x adalah pola
dari model f(x)= ax+ x.
Data mining melakukan pencocokan
model atau menentukan pola dari atau ke
data yang diobservasi.
Dalam perkembangan teknologi data mining,
terdapat model yang digunakan untuk melakukan proses penggaloan informasi
terhadap data-data yang ada. Menurut IBM, model data mining dapat dibagi
menjadi 2 bagian yaitu:
1. Verification model
Model ini menggunakan perkiraan (hypothesis) dari
pengguna, dan melakukan test terhadap perkiraan yang diambil sebelumnya dengan
menggunakan data-data yang ada. Penekanan terhadap model ini adalah terletak
pada user yang bertanggung jawab terhadap penyusunan perkiraan (hypothesis) dan
permasalahan pada data untuk meniadakan atau menegaskan hasil perkiraan
(hypothesis) yang diambil.
Sebagai contoh misalnya dalam bidang pemasaran, sebelum
sebuah perusahaan mengeluarkan suatu produk baru kepasaran, perusahaan tersebut
harus memiliki informasi tentang kecenderungan pelanggan untuk membeli produk
yang akan di keluarkan. Perkiraan (hypothesis) dapat disusun untuk
mengidentifikasikan pelanggan yang potensial dan karakteristik dari pelanggan
yang ada. Data-data tentang pembelian pelanggan sebelumnya dan data tentang
keadaan pelanggan, dapat digunakan untuk melakukan perbandingan antara
pembelian dan karakteristik pelanggan untuk menetapkan dan menguji target yang
telah diperkirakan sebelumnya. Dari keseluruhan operasi yang ada selanjutnya
dapat dilakukan penyaringan dengan cermat sehingga jumlah perkiraan
(hypothesys) yang sebelumnya banyak akan menjadi semakin berkurang sesuai
dengan keadaan yang sebenarnya.Permasalahan utama dengan model ini adalah tidak
ada informasi bare yang dapat dibuat, melainkan hanya pembuktian atau melemahkan
perkiraan (hypothesys) dengan data-data yang ada sebelumnya. Datadata yang ada
pada model ini hanya digunakan untuk membuktikan mendukung perkiraan (hypothesis)
yang telah diambil sebelumnya. Jadi model ini sepenuhnya tergantung pada kemampuan
user untuk melakukan analisa terhadap permasalahan yang ingin digali dan diperoleh
informasinya.
2. Discovery model.
Model ini berbeda dengan verification model, dimana pada
model ini system secara langsung menemukan informasi-informasi penting yang
tersembunyi dalam suatu data yang besar. Data-data yang ada kemudian
dipilah-pilah-untuk-menemukan suatu pola, trend yang ada, dan keadaaan umum
pada saat itu tanpa adanya campur tangan dan tuntunan dari pengguna. Hasil
temuan ini menyatakan fakta-fakta yang ada dalam datadata yang ditemukan dalam
waktu yang sesingkat rnungkin.
Sebagai contoh, misalkan sebuah bank ingin menemukan
kelompok-kelompok pelanggan yang dapat dijadikan target suatu produk yang akan
di keluaran. Pada data-data yang ada selanjutnya diadakan proses pencarian tanpa
adanya proses perkiraan (hypothesis) sebelumnya. Sampai akhirnya semua pelanggan
dikelompokan berdasarkan karakteristik yang
sama.
0 komentar:
Posting Komentar