Langsung ke konten utama

PERTEMUAN 1: CRISP-DM (Cross-Industry Standard Process for Data Mining)

 



Gambar CRISP-DM
(sumber gambar  Almir Gouvea)

    

    CRISP-DM (Cross-Industry Standard Process for Data Mining) adalah model proses terbuka yang digunakan oleh para ahli data mining. Model ini menggambarkan pendekatan umum yang sering digunakan dalam proyek data mining dan analisis. Berikut adalah enam fase dalam model CRISP-DM:

  1. Business Understanding:
    • Memahami tujuan bisnis dan kebutuhan proyek.
    • Menentukan kriteria kesuksesan dari perspektif bisnis.
    • Membuat rencana proyek secara keseluruhan.
  2. Data Understanding:
    • Mengumpulkan data awal.
    • Menganalisis data dan menggali informasi tentang format, jumlah rekaman, dan hubungan antar variabel.
    • Memeriksa kualitas data.
  3. Data Preparation:
    • Persiapan data, termasuk pembersihan, transformasi, dan pemilihan fitur.
    • Membuat dataset yang siap untuk pemodelan.
  4. Modeling:
    • Memilih teknik pemodelan yang sesuai.
    • Melatih model menggunakan data yang telah dipersiapkan.
    • Mengevaluasi performa model.
  5. Evaluation:
    • Mengukur performa model berdasarkan kriteria bisnis.
    • Memilih model terbaik yang memenuhi tujuan proyek.
  6. Deployment:
    • Mengimplementasikan hasil model ke dalam lingkungan produksi.
    • Membuat model dapat diakses oleh pemangku kepentingan.

 

Komentar

Postingan populer dari blog ini

Pertemuan 4 : Cleaning, Data Transformation, Data Reduction

Blog dengan Video YouTube TUGAS KELOMPOK FP Data Cleaning, Data Transformation, Data Reduction:

Apa itu ERD

       Entity Relationship Diagram , juga dikenal sebagai ERD, ER Diagram atau er model, adalah jenis diagram struktural untuk digunakan dalam desain database. ERD berisi simbol dan konektor berbeda yang memvisualisasikan dua informasi penting: Entitas utama dalam lingkup sistem, dan hubungan antar di antara entitas-entitas ini.      Sebagian besar ERD telah berevolusi dari desain database fisik. Jangan khawatir tentang kompleksitasnya, Anda dapat dengan mudah mempelajari bidang ini dengan memeriksa tiga elemen ERD dasar berikut: Entitas      Entitas biasanya dibagi menjadi lima kategori: konsep, lokasi, peran, acara, dan hal-hal (orang, tempat, acara, penjualan, pelanggan, departemen perusahaan, siswa, atau produk, dll.). Entitas ditampilkan dalam tabel database dalam sistem data, dan setiap baris tabel mewakili instans entitas. Misalnya, entitas Nama dalam tabel di bawah ini bisa berupa Jack, Alice, dan sebagainya. Atribut   ...

Apa itu Conseptual Database

  secara konsep basis data atau database merupakan kumpulan dari data-data yang membentuk suatu file yang saling berhubungan (relation) dengan metode tertentu untuk membentuk data baru atau informasi. Dapat dikatakan pula bahwa basis data merupakan kumpulan dari data yang saling berhubungan antara satu dengan lainnya yang diorgansasikan berdasarkan skema atau struktur tertentu. Relasi data biasanya diberikan kunci (key) dari tiap file yang ada.