Bagian-Bagian Diagram Pohon Pada Algoritma Decision Tree
Salah satu keunggulan dari algoritma Decision Tree adalah, model ini dapat dengan mudah dintepretasikan dalam sebuah diagram pohon. Jadi kita dapat dengan sangat mudah untuk memahami bagaimana algoritma ini bekerja dan bagaimana alur keputusan yang diambil. Pada artikel ini, kita akan membahasnya dengan lebih detail.
Pada artikel kali ini, kita akan menggunakan visualisasi diagram pohon dari Kelas Deep Dive Into Decision Tree. Jika kalian ingin mempelajari kelasnya, kalian bisa mengunjunginya dibawah ini:
Pelajari: Deep Dive Into Decision Tree disini
Bentuk diagram pohon yang terbentuk dari model pada kelas tersebut adalah seperti berikut:
Bagian-bagiannya:
Bagian | Keterangan |
Nodes | Setiap kotak-kotak pada diagram pohon diatas disebut sebuah node. Node berisi logika dan threshold. Node adalah tempat dimana data atribut user diperiksa oleh logika (aturan) dari diagram pohon tersebut. Jika nilainya True, maka user akan dibawa ke bagian sebelah kiri. Dan jika nilainya False, maka user akan dibawa ke bagian sebelah kanan node berikutnya. |
Base Node / Main Node | Base Node atau terkadang juga disebut sebagai Main Node adalah node utama yang membagi data secara dikotomis. Biasanya node ini berisi fitur yang paling penting (important feature). Kita akan membahasnya pada modul-modul berikutnya. |
Depth | Depth adalah kedalam pohon yang terbentuk. Depth berfungsi untuk menganalisis sejauh mana sebuah logika terhenti dan keputusan diambil. Pada dasarnya, jumlah depth tidak ditentukan, kecuali kamu memasukan parameter 'max_depth' pada model decision tree kamu. |
Max Depth | Max depth merujuk pada kedalaman maksimum dari sebuah model. Atau jika ia adalah sebuah paraneter, maka merujuk pada kedalaman yang dibatasi selama masa training. |
Leaves | Leave atau daun adalah node-node terakhir dari sebuah alur logika. |
Max Leaves Node | Max leaves node adalah jumlah leave atau jumlah daun yang terbentuk dari model. Dari gambar diatas, jumlahnya ada 11 leaves. Sebagai sebuah parameter, nilai ini juga memberikan batasan berapakah jumlah daun yang terbentuk selama masa training. |
Dengan memahami bagian-bagian pada decision tree dengan bauk, diharapkan kita bisa menganalisis dan mengevaluasinya, serta memberikan Hyperparameter yang tepat untuk memperbaiki performa model.