Gambar CRISP-DM
(sumber gambar Almir Gouvea)
CRISP-DM (Cross-Industry
Standard Process for Data Mining) adalah model proses terbuka yang digunakan
oleh para ahli data mining. Model ini menggambarkan pendekatan umum yang sering
digunakan dalam proyek data mining dan analisis. Berikut adalah enam fase dalam
model CRISP-DM:
- Business Understanding:
- Memahami tujuan bisnis dan kebutuhan
proyek.
- Menentukan kriteria kesuksesan dari
perspektif bisnis.
- Membuat rencana proyek secara
keseluruhan.
- Data Understanding:
- Mengumpulkan data awal.
- Menganalisis data dan menggali informasi
tentang format, jumlah rekaman, dan hubungan antar variabel.
- Memeriksa kualitas data.
- Data Preparation:
- Persiapan data, termasuk pembersihan,
transformasi, dan pemilihan fitur.
- Membuat dataset yang siap untuk
pemodelan.
- Modeling:
- Memilih teknik pemodelan yang sesuai.
- Melatih model menggunakan data yang
telah dipersiapkan.
- Mengevaluasi performa model.
- Evaluation:
- Mengukur performa model berdasarkan
kriteria bisnis.
- Memilih model terbaik yang memenuhi
tujuan proyek.
- Deployment:
- Mengimplementasikan hasil model ke dalam
lingkungan produksi.
- Membuat model dapat diakses oleh
pemangku kepentingan.
Komentar
Posting Komentar