Postingan

Data Mining - Pertemuan 10

Gambar
 Supervise Learning Pengertian Supervised Learning Supervised learning adalah jenis pembelajaran mesin di mana model dilatih menggunakan data yang telah diberi label. Dalam supervised learning, tujuan utamanya adalah untuk memprediksi hasil atau output berdasarkan input yang telah diketahui. Data yang digunakan dalam pelatihan memiliki pasangan input-output yang dikenal, dan model belajar untuk memetakan input ke output yang benar. Proses Supervised Learning Proses dalam supervised learning biasanya melibatkan langkah-langkah berikut: Pengumpulan Data: Mengumpulkan data yang relevan dengan pasangan input-output. Praproses Data: Membersihkan dan menyiapkan data untuk pelatihan model. Pembagian Data: Membagi data menjadi set pelatihan (training set) dan set pengujian (test set). Pelatihan Model: Menggunakan data pelatihan untuk membangun model. Evaluasi Model: Menggunakan data pengujian untuk mengevaluasi kinerja model. Tuning Hyperparameter: Menyesuaikan parameter model untuk meningkatk

Data Mining - Pertemuan 3

Gambar
PRE-PROCESSING Pre-processing adalah tahap awal dalam pengolahan data yang melibatkan persiapan dan pembersihan data untuk memastikan kualitas dan konsistensinya sebelum analisis. Data Cleaning adalah proses mengidentifikasi dan memperbaiki atau menghapus data yang tidak akurat, tidak lengkap, atau tidak konsisten dalam dataset. Data Collection adalah tahap pengumpulan data dari berbagai sumber yang relevan untuk digunakan dalam analisis atau penelitian. Data Transform adalah proses mengubah data dari format atau struktur yang satu ke format atau struktur yang lain untuk mempermudah analisis. Data Reduction adalah teknik untuk mengurangi volume data dengan menghilangkan redundansi dan mengurangi kompleksitas sambil mempertahankan informasi yang penting.  Contoh pada Goggle Collab : 

Data Mining - Pertemuan 2

Gambar
  DATA PREPARATION & DATA VISUALIZATION Data Preparation Data Preparation adalah proses awal dalam analisis data yang melibatkan pembersihan data untuk menghapus data yang tidak valid dan mengatasi nilai yang hilang, transformasi data untuk mengubah format, melakukan normalisasi, atau menggabungkan data dari berbagai sumber, feature engineering untuk menciptakan fitur baru dari data yang ada, serta data integration untuk menggabungkan data dari berbagai sumber guna memastikan data siap untuk analisis yang lebih mendalam dan komprehensif. Contoh Data Preparation :  Data Visualization Data Visualization adalah teknik untuk merepresentasikan data secara grafis guna memudahkan pemahaman, interpretasi, dan analisis dengan tujuan menemukan pola, tren, atau hubungan dalam data, melalui berbagai jenis visualisasi seperti histogram untuk distribusi data, scatter plot untuk hubungan antar variabel, line chart untuk tren data sepanjang waktu, dan bar chart untuk membandingkan nilai antar kate

Data Mining - Pertemuan 1

PROSES / TAHAPAN DATA MINING, CRISP-DM, SEMMA, CCC Proses data mining melibatkan pemahaman bisnis untuk menetapkan tujuan proyek, pemahaman data untuk mengidentifikasi dan mengeksplorasi data, persiapan data untuk membersihkan dan mengintegrasikan data, pemodelan untuk membangun dan menguji model, evaluasi untuk memastikan model memenuhi tujuan bisnis, dan penerapan untuk mengimplementasikan model dalam proses bisnis guna menghasilkan pengetahuan yang berguna. CRISP-DM  (Cross-Industry Standard Process for Data Mining) Dalam CRISP-DM, langkah pertama yang kita lakukan adalah memahami tujuan bisnis dan persyaratan proyek secara mendalam. Kemudian, kita mengumpulkan dan menganalisis data awal untuk mendapatkan wawasan awal yang berharga. Selanjutnya, kita membersihkan dan mempersiapkan data untuk analisis lebih lanjut agar data tersebut siap digunakan. Setelah itu, kita memilih dan menerapkan teknik pemodelan yang sesuai untuk data yang telah disiapkan. Tahap berikutnya adalah mengevalua

DATA MINING

Quiz Pertemuan 5 Link Google Collab :  https://colab.research.google.com/drive/1UbJAOYy6B0dElCj5DJaW77qEcf7Sb6r3?usp=sharing Link PDF :  https://drive.google.com/file/d/1e3zr-tEcnARMhLzQjyi5SqECCV8_JLyb/view?usp=sharing 1. Pendahuluan     Dalam laporan ini, kami akan mengeksplorasi beberapa aspek melalui analisis data transkrip nilai mahasiswa. Aspek yang akan kami tinjau mencakup Indeks Prestasi Semester (IPS) per semester per mahasiswa, hubungan antara IPS dan keberhasilan lulus tepat waktu, korelasi antara capaian kelulusan "Pujian" dengan lulus tepat waktu, relasi antara durasi studi dan capaian kelulusan, serta perbandingan prestasi akademik berdasarkan jenis kelamin.       2. IPS per Semester per Mahasiswa     Proses perhitungan IPS per semester per mahasiswa dilakukan dengan menggabungkan nilai total dari setiap mata kuliah pada semester tersebut, kemudian hasilnya dibagi dengan jumlah SKS yang diambil. Hal ini bertujuan untuk memberikan gambaran mengenai ki

TENTUKAN KARDINALITAS DAN OPSIONALITAS

Gambar