Data Mining (#1 Dari 2)
Data Mining merupakan suatu proses pencarian atau ekstraksi teladan yang menarik dari data dalam jumlah yang relatif besar . Suatu teladan dikatakan menarik apabila teladan tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah gampang dimengerti, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan yang niscaya baru.
Data Mining memang salah satu cabang ilmu komputer yang relatif baru. Dan hingga kini orang masih memperdebatkan untuk menempatkan data mining di bidang ilmu mana, sebab data mining menyangkut database, kecerdasan buatan (artificial intelligence), statistik, dsb.
Beberapa pihak memberikan bahwa data mining tidak lebih dari machine learning atau analisa statistik yang berjalan di atas database. Tapi hal ini dibantah oleh pihak lain yang memiliki anutan bahwa database berperanan penting di data mining sebab data mining mengakses data yang ukurannya besar (bisa hingga terabyte) dan disini terlihat tugas penting database terutama dalam optimisasi query-nya.
Data mining sering pula disebut Knowledge Discovery in Database. Adapula yang menyebutkan sebagai analisis teladan atau arkeologi data. Bahkan ada yang menyebutnya sebagai intelegensia bisnis. Data Mining, atau dalam bahasa Indonesia kita sebut sebagai penggalian data, diharapkan dikala data yang tersedia sangat / terlalu banyak (misalnya data yang diperoleh dari sistem basis data perusahaan, e-commerce, data saham, dan data bioinformatika), tetapi tidak tahu teladan apa yang sanggup didapatkan.
Data mining tidak hanya melaksanakan mining terhadap data transaksi saja. Penelitian di bidang data mining dikala ini sudah merambah ke sistem database lanjut menyerupai object oriented database, image/spatial database, time-series data/temporal database, teks (dikenal dengan nama text mining), web (dikenal dengan nama web mining) dan multimedia database.
Penggalian data yakni salah satu serpihan dari proses pencarian pola. Berikut ini urutan proses pencarian teladan :
- Pembersihan Data: yaitu menghapus data pengganggu (noise) dan mengisi data yang hilang.
- Integrasi Data: yaitu menggabungkan aneka macam sumber data.
- Pemilihan Data: yaitu menentukan data yang relevan.
- Transformasi Data: yaitu mentransformasi data ke dalam format untuk diproses dalam penggalian data.
- Penggalian Data: yaitu menerapkan metode cerdas untuk ekstraksi pola.
- Evaluasi pola: yaitu mengenali pola-pola yang menarik saja.
- Penyajian pola: yaitu memvisualisasi teladan ke pengguna.
Sumber :
https://id.wikipedia.org/wiki/Penggalian_data
www.ilmukomputer.com (Data Mining by Yudho)