Minggu, 14 Oktober 2012

Data Mining


Data Mining (Penggalian Data) adalah ekstraksi pola yang menarik dari data dalam jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru. Penggalian data memiliki beberapa nama alternatif, meskipun definisi sebenarnya berbeda, seperti KDD (knowledge discovery in database), analisis pola, arkeologi data, pemanenan informasi, dan intelegensia bisnis. Penggalian data diperlukan saat data yang tersedia terlalu banyak (misalnya data yang diperoleh dari sistem basis data perusahaan, e-commerce, data saham, dan data bioinformatika), tapi tidak tahu pola apa yang bisa didapatkan.


Penggalian data adalah salah satu bagian dari proses pencarian pola. Berikut ini urutan proses pencarian pola:

1. Pembersihan Data: yaitu menghapus data pengganggu (noise) dan mengisi data yang hilang.

2. Integrasi Data: yaitu menggabungkan berbagai sumber data.

3. Pemilihan Data: yaitu memilih data yang relevan.

4. Transformasi Data: yaitu mentransformasi data ke dalam format untuk diproses dalam penggalian data.

5. Penggalian Data: yaitu menerapkan metode cerdas untuk ekstraksi pola.

6. Evaluasi pola: yaitu mengenali pola-pola yang menarik saja.

7. Penyajian pola: yaitu memvisualisasi pola ke pengguna.


Perkembangan yang pesat di bidang pengumpulan data dan teknologi penyimpanan di berbagai bidang, menghasilkan basis data yang terlampau besar. Namun, data yang dikumpulkan jarang dilihat lagi, karena terlalu panjang, membosankan, dan tidak menarik. Seringkali, keputusan yang katanya berdasarkan data dibuat tidak lagi berdasarkan data, melainkan dari intuisi para pembuat keputusan. Sehingga, lahirlah cabang ilmu penggalian data ini.
Analisis data tanpa menggunakan otomasi dari penggalian data adalah tidak memungkinkan lagi, kalau 1) data terlalu banyak, 2) dimensionalitas data terlalu besar, 3) data terlalu kompleks untuk dianalisis manual (misalnya: data time series, data spatiotemporal, data multimedia, data stream).

Pada dasarnya penggalian data dibedakan menjadi dua fungsionalitas, yaitu deskripsi dan prediksi. Berikut ini beberapa fungsionalitas penggalian data yang sering digunakan:

1. Karakterisasi dan Diskriminasi: yaitu menggeneralisasi, merangkum, dan mengkontraskan karakteristik data.

2. Penggalian pola berulang: yaitu pencarian pola asosiasi (association rule) atau pola intra-transaksi, atau pola pembelian yang terjadi dalam satu kali transaksi.

3. Klasifikasi: yaitu membangun suatu model yang bisa mengklasifikasikan suatu objek berdasar atribut-atributnya. Kelas target sudah tersedia dalam data sebelumnya, sehingga fokusnya adalah bagaimana mempelajari data yang ada agar klasifikator bisa mengklasifikasikan sendiri.

4. Prediksi: yaitu memprediksi nilai yang tidak diketahui atau nilai yang hilang, menggunakan model dari klasifikasi.

5. Penggugusan/Cluster analysis: yaitu mengelompokkan sekumpulan objek data berdasarkan kemiripannya. Kelas target tidak tersedia dalam data sebelumnya, sehingga fokusnya adalah memaksimalkan kemiripan intrakelas dan meminimalkan kemiripan antarkelas.

6. Analisis outlier: yaitu proses pengenalan data yang tidak sesuai dengan  perilaku  umum dari  data  lainnya. Contoh: mengenali noise dan pengecualian dalam data.

7. Analisis trend dan evolusi: meliputi analisis regresi, penggalian pola sekuensial, analisis periodisitas, dan analisis berbasis kemiripan.



Compiere

Compiere (atau KOM-pyeh-Reh, yang berarti "untuk mencapai, menyelesaikan, memenuhi" dalam bahasa Italia) merupakan open source ERP dan CRM sebagai solusi bisnis untuk Usaha Kecil dan Menengah (UKM) dalam distribusi, ritel, jasa dan manufaktur. Compiere didistribusikan oleh Consona Corporation bersama Partner Network, sekumpulan mitra bisnis resmi yang terlatih.

Compiere didirikan pada tahun 1999 oleh Jorg Janke dan merupakan 10 peringkat teratas proyek di Sourceforge dari tahun 2002 selama 4 tahun mencapai satu juta download dan 100 mitra pada tahun 2006.

Pada tahun 2006, Compiere, Inc. menaikkan modal ventura dari New Enterprise Associates dengan tujuan mengubah open source proyek ERP yang sukses menjadi sumber bisnis berkembang dan open source bisnis komersial berkelanjutan. Pada tahun 2007, perusahaan menambahkan eksekutif baru, merubah perencanaan dan proses dukungan, dan memperluas penjualan dan saluran layanan.  Jajaran produk Compiere diperluas untuk mencakup Profesional, Enterprise dan Edisi Cloud sementara perusahaan terus mempertahankan landasan open source sebagai Community Edition. 

Seperti usaha komersial yang dibangun di sekitar proyek open source, ada tingkat pertentangan antara manajemen perusahaan (yang berusaha untuk menguangkan investasi dalam R & D, Services and Support) dan suara-suara dari komunitas Adempiere (yang menginginkan source code Compiere dan proses bisnis tetap bebas dan terbuka). Pada tanggal 16 Juni 2010, Consona mengakuisisi Compiere, Inc syarat dari kesepakatan itu tidak diungkapkan. 

Aplikasi dan kode sumber yang disediakan pada dasar GNU General Public License versi 2, ini terdiri dari Community Edition. Juga tersedia untuk aplikasi berbayar adalah Professional Edition dengan lebih banyak fitur, lisensi, dokumentasi dan dukungan komersial kontrak.