Data Mining - Pertemuan 1

PROSES / TAHAPAN DATA MINING, CRISP-DM, SEMMA, CCC

Proses data mining melibatkan pemahaman bisnis untuk menetapkan tujuan proyek, pemahaman data untuk mengidentifikasi dan mengeksplorasi data, persiapan data untuk membersihkan dan mengintegrasikan data, pemodelan untuk membangun dan menguji model, evaluasi untuk memastikan model memenuhi tujuan bisnis, dan penerapan untuk mengimplementasikan model dalam proses bisnis guna menghasilkan pengetahuan yang berguna.

CRISP-DM (Cross-Industry Standard Process for Data Mining)

Dalam CRISP-DM, langkah pertama yang kita lakukan adalah memahami tujuan bisnis dan persyaratan proyek secara mendalam. Kemudian, kita mengumpulkan dan menganalisis data awal untuk mendapatkan wawasan awal yang berharga. Selanjutnya, kita membersihkan dan mempersiapkan data untuk analisis lebih lanjut agar data tersebut siap digunakan. Setelah itu, kita memilih dan menerapkan teknik pemodelan yang sesuai untuk data yang telah disiapkan. Tahap berikutnya adalah mengevaluasi model untuk memastikan kesesuaiannya dengan tujuan bisnis yang telah ditetapkan. Akhirnya, kita mengimplementasikan model ini ke dalam proses bisnis untuk menghasilkan nilai yang nyata bagi perusahaan.

SEMMA (Sample, Explore, Modify, Model, Assess)

Pada metodologi SEMMA, kita memulai dengan mengambil sampel data yang representatif dari dataset yang lebih besar untuk memastikan bahwa data yang kita gunakan adalah representatif. Setelah itu, kita mengeksplorasi data untuk menemukan pola dan anomali penting yang mungkin ada. Selanjutnya, kita memodifikasi data dengan berbagai transformasi dan rekayasa fitur untuk mempersiapkan data tersebut untuk pemodelan. Kemudian, kita membangun model prediktif menggunakan teknik yang paling tepat untuk data yang telah dipersiapkan. Akhirnya, kita mengevaluasi model tersebut untuk mengukur kinerja dan validitasnya, memastikan model tersebut memenuhi kebutuhan analisis kita.

CCC (Computational, Cognitive, and Communication)

Dalam metodologi CCC, kita mulai dengan aspek komputasional, di mana kita menggunakan algoritma dan teknik komputasi untuk mengolah data yang kita miliki. Setelah itu, kita beralih ke aspek kognitif, yaitu memahami dan menginterpretasi hasil analisis tersebut untuk mendukung pengambilan keputusan yang lebih baik. Terakhir, kita fokus pada aspek komunikasi, yaitu mengomunikasikan hasil analisis tersebut kepada pemangku kepentingan dengan cara yang jelas dan mudah dipahami, sehingga hasil tersebut dapat diimplementasikan dengan efektif dalam organisasi.

Komentar

Postingan populer dari blog ini

DATA MINING

Data Mining - Pertemuan 2

Data Mining - Pertemuan 10