Data Mining

Definisi

Data mining dapat didefenisikan sebagai sekumpulan mekanisme dan teknik yang direalisasikan dalam perangkat lunak untuk mengekstrak informasi tersembunyi dari kumpulan data.

 

Sejarah

Asal usul data mining dapat dilihat kembali ke akhir tahun 1980-an pada saat istilah tersebut mulai digunakan, paling tidak dalam kalangan komunitas riset. Pada awalnya terdapat sedikit perdebatan tentang makna dan cakupan dari istilah tersebut dan sampai saat ini pertentangan tersebut masih terjadi. Dalam arti luas data mining dapat didefenisikan sebagai sekumpulan mekanisme dan teknik yang direalisasikan dalam perangkat lunak untuk mengekstrak informasi tersembunyi dari kumpulan data. Pengertian tersembunyi dalam defenisi di atas sangat penting; query yang dilakukan dalam SQL meskipun sangat rumit bukanlah data mining. Juga istilah informasi harus diinterpretasikan dalam arti luas. Sebelum tahun 1990-an data mining umumnya dikenal sebagai sub proses dalam lingkup lebih besar yang disebut Knowledge Discovery in Databases (KDD). Meskipun dalam konteks modern dari data mining KDD akan lebih sesuai, karena sumber pengetahuan bukan lagi terbatas pada database. Defenisi yang lebih umum dari KDD adalah apa yang dikemukakan oleh Fayyad et al. yakni: “the nontrivial process of identifying valid, novel, potentially useful, ultimately understandable patterns in data” [6, 7]. Dengan anggapan sebagai sub proses dalam cakupan KDD, data mining terkait dengan penemuan akan “informasi tersembunyi”. Sub proses lainnya yang juga merupakan bagian dari KDD di antaranya persiapan data (warehousing, data cleaning, pre-process, dan lain-lain) dan analisis serta visualisasi dari hasil. Untuk beberapa tujuan praktis KDD dan data mining sering dianggap sinonim, tetapi secara teknis ternyata yang satu merupakan sub proses dari yang lain [7, 31]. Data yang digunakan dalam proses data mining pada awalnya hanya untuk data dalam bentuk tabel (relasional) mengingat keterbatasan kemampuan komputasi saat itu. Dengan peningkatan kemampuan komputasi, maka waktu komputasi (meskipun tetap menjadi isu penting) tidak lagi menjadi persoalan utama dan digantikan dengan tujuan lain yakni akurasi dan keinginan untuk menambang data yang jauh lebih besar. Saat ini, dalam konteks data bentuk tabel telah diperlakukan secara khusus dengan teknik yang tersendiri. Hal ini dapat dilihat dari banyaknya sistem seperti SPSS yang melakukan penambangan data dari dalam tabel. Akan tetapi, jenis data yang tersedia secara digital semakin banyak dan berasal dari berbagai sumber berbeda. Jenis data saat ini sangat beragam seperti gambar, teks, video, multimedia, graf dan jaringan. Hal ini membuat kajian data mining terus berkembang dan terus menghadirkan tantangan baru [31]. Popularitas data mining terus meningkat secara signifikan pada tahun 1990-an, terutama dengan pelaksanaan sejumlah konferensi yang dikhususkan pada kajian tersebut, seperti: ACM SIGKDD annual conference tahun 1995, European PKDD and Pacific/Asia (PAKDD) pada tahun 1997. IEEE ICDM mulai diadakan pada tahun 2001 sebagai konferensi SIAM yang pertama [8, 20]. Hal ini meningkatkan popularitas data mining yang secara bersamaan didukung oleh kemajuan teknologi, kemampuan CPU dan media yang menyimpan data dalam jumlah besar dan mengolahnya dalam waktu yang lebih cepat. Menjadi hal biasa untuk perusahaan komersial untuk memelihara data dalam berbagai bentuk yang dapat dibaca komputer, dan dalam kebanyakan kasus digunakan untuk mendukung aktivitas bisnis dan pemikiran bahwa data tersebut dapat “ditambang” sering masih dianggap sebagai prioritas kedua. Era tahun 1990-an juga ditandai dengan penggunaan kartu kesetiaan pelanggan yang memungkinkan perusahaan untuk mencatat belanjaan dari setiap pelanggan. Data yang tersimpan dalam volume besar tersebut dapat “ditambang” untuk mengetahui pola/perilaku pembelian oleh masing-masing pelanggan. Popularitas data mining terus berkembang sampai hari ini terlebih dengan kemungkinan menambang data dari data yang tidak standar (non tabular) [21, 31].

 

Aplikasi Data Mining

  1. Text Mining

Aplikasi ini membangun sebuah classifier untuk mengelompokkan kumpulan dokumen yang banyak (seperti kumpulan artikel, berita atau laman web

 

  1. Image Mining

image mining berkenan dengan representasi citra (2D atau 3D) sedemikian hingga teknik penambangan dapat diterapkan.

 

  1. Graph Mining

Graph mining secara prinsip merupakan perluasan dari frequent pattern mining, misalnya apa yang menarik dalam subgraf yang sering muncul.

 

Manfaat

Data mining memiliki banyak kebermanfaatan bagi kehidupan manusia, diantaranya adalah sebagai berikut:

  1. Dapat mengetahui hilangnya pelanggan karena pesaing
  2. Dapat mengetahui item produk atau konsumen yang memiliki kesamaan karakteristik
  3. Dapat mengidentifikasi produk-produk yang terjual bersamaan dengan produk lain
  4. Dapat memprediski tingkat penjualan
  5. Dapat menilai tingkat resiko dalam menentukan jumlah produksi suatu item.
  6. Dapat memprediksi prilaku bisnis di masa yang akan datang

Selain itu data mining dapat digunakan untuk mengcapture, menganlisis serta menyimpan data yang bersifat real-time dan sangat besar, misal :

  1. Remote sensor yang ditempatkan pada suatu satelit.
  2. Teleskop yang digunakan untuk memindai langit.
  3. Simulasi saintifik yang membangkitkan data dalam ukuran terabytes.

 

Rancangan Aplikasi Data Mining

  1. Latar belakang masalah

Indonesia merupakan negara dengan tingkat perdagangan yang tinggi. Karena tingkat perdangangan yang tinggi maka banyak orang yang bersaing. Di zaman sekarang ini, banyak sekali kecurangan yang terjadi di sekitar kita. Banyak orang yang ingin meraup keuntungan lebih dengan cara yang tidak halal dan merugikan masyarakat khususnya konsumen. Misalnya produsen makanan yang mencampurkan makanan yang diproduksi dengan bahan kimia yang berbahaya bagi kesehatan dalam jangka waktu yang lama. Di ambil dari www.kompasiana.com  “Berdasarkan dari penelitian yang dilakukan oleh tim reportase investigasi yang mana dilengkapi dengan uji laboratorium yang dilakukan di laboratorium  teknologi pangan UNPAS, akhirnya ditemukan sejumlah fakta sebagai berikut :

– 8 dari 10 sampel nata de coco yang di pilih secara acak  di pasaran [pasar tradisional, warung, dan supermarket] terbukti mengandung Hidrogen Peroksida [H2O2], yakni cairan bening, agak lebih kental daripada air,yang merupakan oksidator kuat. Hidrogen Peroksida dimanfaatkan sebagai pemutih [bleach] sehingga nata de coco yang dicampurkan dengan zat ini akan mengubah warna nata de coco yang semulanya putih kekuningan [broken white] menjadi berwarna putih bersih dan lebih menarik. Faktanya, penggunaan hidrogen peroksida dalam makanan justru tidak dibenarkan karena zat ini mudah bereaksi [oksidan kuat] dan korosif. Bahkan dari 10 sampel yang digunakan dalam penelitian tersebut ternyata terdapat pula merk yang sudah terkenal dan produknya tersusun rapi di rak-rak supermarket dan mall.” Maka dari itu kami mempunyai ide untuk membuat sebuah perangkat yang dapat mendeteksi kandungan bahan kimia yang tidak baik untuk kesehatan tubuh manusia.

 

  1. Solusi yang dirancang

Membuat suatu aplikasi berbasis android yang mendeteksi kandungan bahan kimia yang berbahaya pada makanan.

 

  1. Deskripsi detil dari solusi yang dirancang

Perangkat mengeluarkan sensor yang diarahkan ke makanan secara menyeluruh sehingga dapat mendeteksi kandungan-kandungan kimia yang tidak baik bagi tubuh manusia. Keluaran dari perangkat ini adalah data-data kandungan bahan kimia yang berbahaya bagi tubuh manusia lengkap dengan nama zat serta dampak buruk zat tersebut bila dikonsumsi manusia.

 

 

Sumber :

  1. http://www.mikroskil.ac.id/ejurnal/index.php/jsm/article/view/44/34
  2. http://adit.ilearning.me/data-mining/

You may also like...

Leave a Reply

Your email address will not be published. Required fields are marked *