Langsung ke konten utama

PERTEMUAN 1: CRISP-DM (Cross-Industry Standard Process for Data Mining)

 



Gambar CRISP-DM
(sumber gambar  Almir Gouvea)

    

    CRISP-DM (Cross-Industry Standard Process for Data Mining) adalah model proses terbuka yang digunakan oleh para ahli data mining. Model ini menggambarkan pendekatan umum yang sering digunakan dalam proyek data mining dan analisis. Berikut adalah enam fase dalam model CRISP-DM:

  1. Business Understanding:
    • Memahami tujuan bisnis dan kebutuhan proyek.
    • Menentukan kriteria kesuksesan dari perspektif bisnis.
    • Membuat rencana proyek secara keseluruhan.
  2. Data Understanding:
    • Mengumpulkan data awal.
    • Menganalisis data dan menggali informasi tentang format, jumlah rekaman, dan hubungan antar variabel.
    • Memeriksa kualitas data.
  3. Data Preparation:
    • Persiapan data, termasuk pembersihan, transformasi, dan pemilihan fitur.
    • Membuat dataset yang siap untuk pemodelan.
  4. Modeling:
    • Memilih teknik pemodelan yang sesuai.
    • Melatih model menggunakan data yang telah dipersiapkan.
    • Mengevaluasi performa model.
  5. Evaluation:
    • Mengukur performa model berdasarkan kriteria bisnis.
    • Memilih model terbaik yang memenuhi tujuan proyek.
  6. Deployment:
    • Mengimplementasikan hasil model ke dalam lingkungan produksi.
    • Membuat model dapat diakses oleh pemangku kepentingan.

 

Komentar

Postingan populer dari blog ini

PERTEMUAN 2 : Data visualization

          Data visualization     adalah proses mengubah informasi dan data menjadi format visual seperti grafik, peta, dan diagram, untuk memudahkan pemahaman, analisis, dan pengambilan keputusan. Tujuannya adalah untuk menyajikan data kompleks secara intuitif, memungkinkan penonton untuk melihat tren, pola, dan korelasi yang mungkin tidak langsung terlihat dalam format data mentah. Dengan menggunakan elemen visual seperti warna, ukuran, dan bentuk, data visualization membantu dalam menyampaikan cerita di balik data, menjadikannya alat yang sangat berharga dalam berbagai bidang seperti bisnis, sains, pendidikan, dan teknologi.      Visualisasi data berperan penting dalam era informasi saat ini, sebagai alat untuk menginterpretasi dan memahami volume data besar dan kompleks dengan cepat dan efektif. Dalam dunia pengolahan data besar dan kompleks, kemampuan untuk menyajikan data tersebut dalam format yang mudah dicerna merupakan sebuah kebutuhan. Dengan visualisasi data, perusahaan dapat