Sabtu, 13 November 2021

Rapid Miner


pengantar

RapidMiner adalah salah satu alat terbaik untuk membangun model pembelajaran mesin, termasuk model pembelajaran mendalam. Menurut jajak pendapat KDnuggets 2018 , RapidMiner berada di posisi kedua, mengalahkan R, Excel, dan banyak paket perangkat lunak terkenal lainnya dalam frekuensi penggunaan dalam proyek nyata.

Dalam panduan ini, Anda akan mempelajari cara membangun model regresi dan klasifikasi pertama Anda menggunakan RapidMiner.

Menyiapkan Data

Untuk memulai, unduh dataset training  House Prices: Advanced Regression Techniques dari Kaggle. Dataset memiliki 81 atribut dan 1460 record. Untuk fokus pada machine learning dan bukan data cleaning, buat dataset yang hanya terdiri dari lima atribut: OverallQual , LotArea , Street , GarageArea , dan SalePriceKelima atribut ini akan digunakan dalam membangun model regresi dan klasifikasi.

Mengimpor Data di RapidMiner

Unduh RapidMiner Studio, instal di perangkat Anda, dan daftarkan diri Anda. Setelah Anda terdaftar, buka aplikasi, yang akan memberi Anda kotak dialog berikut:

Model Otomatis

Pilih Auto Model , yang akan membawa Anda ke layar berikut:

jendela data

Klik tombol IMPORT NEW DATA, yang akan membuka kotak dialog baru. Pilih lokasi dataset, dan klik Next beberapa kali tanpa mengubah data. Sebagai langkah terakhir, pilih folder data saat ini atau buat folder baru untuk mengunggah data ke RapidMiner. Ini akan membawa Anda ke langkah pertama dalam membangun model pembelajaran mesin:

Pilih Tugas

Membangun Model Regresi Pertama Anda

Untuk membangun model regresi, mulailah dengan mengklik tombol Predict, yang akan meminta Anda untuk memilih kolom target dengan menampilkan pop-up berikut:

Kolom Target

Pilih kolom SalePrice sebagai kolom target dan klik Next . Ini akan membawa Anda ke halaman berikutnya, Prepare Target:

Siapkan Target

Halaman ini memberi Anda histogram kolom target. Klik Next dan Anda akan mendarat di halaman Select InputHalaman ini memberikan informasi penting tentang setiap fitur independen dari dataset.

Pilih Masukan

Pada gambar di atas, perhatikan bahwa RapidMiner telah membuang atribut Street dan diberi respon positif untuk atribut LotArea dan GarageArea dan respon netral untuk atribut OverQual. Anda juga dapat membuang atribut yang disorot dengan titik kuning. Dalam hal ini, ketiga atribut (ditandai dengan titik hijau dan kuning) dianggap sebagai input. Klik Next untuk sampai pada halaman berikutnya, Model Types.

Model regresi

Jika Anda mengetahui algoritma machine learning lainnya, Anda mungkin memperhatikan pada gambar di atas betapa nyamannya RapidMiner membuat model machine learning dengan menyediakan opsi untuk membangun semua model sekaligus. Yang perlu Anda lakukan adalah memilih yang diperlukan untuk proyek Anda. Dalam latihan kali ini, semua model dipilih.

Selain itu, pada halaman yang sama, Anda memiliki beberapa opsi terkait dengan persiapan data. Anda dapat menerapkan fungsi-fungsi tersebut sesuai kebutuhan. Setelah semuanya diatur, klik RunSetelah semua model dibuat, Anda akan melihat halaman yang mirip dengan ini:

Keluaran Model

Halaman ini memberikan ikhtisar metrik yang dipilih (metrik yang tersedia adalah root mean squared error, absolute error, relative error, squared error, dan correlation), waktu proses dalam milidetik, dan menunjukkan model mana yang memiliki kinerja terbaik (lencana oranye), total tercepat waktu (gambar lari berwarna biru), dan waktu penilaian tercepat (gambar lari berwarna ungu).

Untuk dataset ini, model deep learning memberikan performa terbaik. Anda dapat meninjau detail model lengkap, prediksi data, dan banyak lagi di bawah menu drop-down deep learning yang tersedia di sisi kiri overview pageKedua angka ini menunjukkan atribut penting dan bagan prediksi untuk dataset ini:

Faktor Penting

Bagan Prediksi

Terakhir, Anda dapat menerapkan model deep learning dan mengekspornya untuk digunakan di masa mendatang.

Membangun Model Klasifikasi Pertama Anda

Untuk membangun model klasifikasi, sebagian besar langkahnya akan mirip dengan membangun model regresi. Untuk memulainya, pilih kumpulan data yang sama dengan lima atribut dan klik NextKlik Predict dan pilih atribut OverallQual sebagai atribut target Anda.

Pada halaman Siapkan Target, Anda akan melihat bahwa atribut OverQual hanya memiliki 10 kelas yang tersebar di bilangan bulat 1 hingga 10. Secara default, RapidMiner membuat model regresi. Untuk beralih ke sisi klasifikasi, alihkan tombol di bawah histogram Turn into Classification dan ubah Number of Classes dari 2 menjadi 10.

Memilih kelas

Setelah semua perubahan di atas selesai, klik NextPada halaman Select Inputs, Anda memiliki tiga atribut yang mendukung dan hanya satu atribut yang tidak mendukung.

Masukan

Klik Next untuk tiba di halaman Model TypesKarena Anda sedang membangun model klasifikasi, Anda akan menerima daftar model baru seperti yang ditunjukkan di bawah ini:

Model klasifikasi

Anda dapat memilih sejumlah model dari daftar ini. Untuk saat ini, semua model dipilih. Anda juga memiliki kolom persiapan data, mirip dengan skenario regresi. Klik Run, dan setelah semua model dibuat, Anda akan melihat halaman ikhtisar ini:

Hasil model klasifikasi

Untuk kumpulan data ini, model deep learning sekali lagi adalah yang berkinerja terbaik dan juga memberikan keuntungan terbaik (ikon tanda dolar oranye). Bobot yang terkait dengan setiap atribut ditunjukkan di bawah ini:

Bobot

Anda dapat lebih mengoptimalkan model ini atau model lainnya sesuai kebutuhan dan mengekspornya untuk penggunaan di masa mendatang.

Kesimpulan

RapidMiner membantu Anda membangun beberapa model prediktif hanya dengan beberapa klik dan dengan demikian memiliki keunggulan dibandingkan bahasa pembelajaran mesin lainnya seperti Python dan R. Anda dapat menggunakan RapidMiner untuk menguji model yang umum dikenal dengan cepat pada kumpulan data Anda dan kemudian menyesuaikan model dengan kinerja terbaik. 





Tidak ada komentar:

Posting Komentar

Implementasi Praktis dari Algoritma Faster R-CNN untuk Deteksi Objek (Bagian 2 – dengan kode Python)

  Pengantar Tujuan di balik seri tulisan ini adalah untuk menunjukkan betapa bermanfaatnya berbagai jenis algoritma R-CNN.  Dalam artikel in...