Pengertian Data Mining Adalah dan Urutan Prosesnya

Data mining adalah tindakan penggalian data untuk mengumpulkan berbagai macam data sebanyak-banyaknya sebagai upaya untuk memenuhi suatu kebutuhan sistem. Definisi ini merupakan hasil analisis dari kosa kata yang ada, mining, salah satu kata dalam Bahasa Inggris yang berarti galian atau tambang. Jika data mining adalah suatu proses, maka bentuk data yang terkumpul adalah "data galian".

Proses kehadiran data mining adalah dipelopori oleh adanya  masalah dalam suatu organisasi yang selama bertahun-tahun telah mengumpulkan sekian banyak data, seperti data pembelian, data penjualan, data transaksi, data nasabah, dan berbagai database yang lain yang jumlahnya barangkali ribuan, bahkan jutaan jenis data, kemudia data-data tersebut mengalami suatu ledakan ledakan (explosion).


Sehingga menyebabkan database-database tersebut tersebar tak beraturan, bahkan hilang.
Dalam kasus ini, data mining adalah sebuah solusi untuk melakukan penggalian kembali terhadap berbagai data yang telah berceceran tersebut. Dalam pengertian yang lebih profesional menurut sebagian besar ahli, disebutkan bahwa data mining adalah ekstraksi pola-pola menarik (tidak sepele, implisit atau memiliki kandungan atau isi, sebelumnya tidak diketahui, dan memiliki kegunaan) dari sekumpulan data. Proses ekstraksi perlu dilakukan ketika terdapat terlalu banyak data, namun tidak diketahui pola-polanya.

Urutan Proses Data Mining

Proses data mining adalah proses pencarian pola-pola menarik dari berbagai data yang telah dikumpulkan. Berikut ini adalah urutan proses data mining:
  1. Membersihkan data dengan cara menghapus segala macam data pengganggu serta mengisi data yang hilang.
  2. Kemudian melakukan integrasi data dengan menggabungkan berbagai data yang ditemukan dari beberapa sumber.
  3. Memilih data-data yang relevan sesuai kebutuhan sistem.
  4. Melakukan transformasi data ke dalam bentuk format supaya dapat diproses dalam data mining.
  5. Melakukan tahap penggalian data, di sini dilakukan penerapan seluruh metode ekstraksi pola untuk menemukan pola-pola menarik.
  6. Mengevaluasi pola, sebagai upaya untuk menyeleksi pola-pola yang menarik.
Setelah ditemukan pola-pola yang menarik, berarti proses data mining telah selesai, kemudian perlu dilakukan pelaporan atas hasil temuan pola-pola tersebut dalam bentuk visualisasi kepada pengguna.
Demikian proses untuk melakukan data mining, di mana pengertian data mining adalah sama dengan proses pencarian pola.
Facebook Twitter Google+