Cara Kerja Algoritma Decission Tree ID3 Data Mining



Langkah-langkah:

1. Hitung Entropi Total

dengan rumus








dengan M adalah jumlah kategori

dengan P adalah jumlah data dalam 1 kategori per jumlah semua data

2. Hitung Entropi Tiap-Tiap Nilainya




3. Hitung Gain Per Atribut

dengan rumus





4. Pilih Atribut dengan Gain Terbesar untuk dijadikan node akar


5. Pilih Atribut Lain yang Memiliki Frekwensi Tidak Bernilai 0 di Setiap Kategorinya, Kemudian jadikan node di bawah node akar.



6. Hitung kembali Entropi di atribut yang kita pilih di tahap 5


7. Hitung kembali Gain di atribut yang kita pilih di tahap 5 dengan nilai entropo dar tahap 6 (dan seterusnya)




Contoh kasus:


NIM
Asal Sekolah
Bhs
Mtk
B Ing
IPK
1
MA
Istimewa
Sangat Baik( 7,3)
Baik (5,2)
3,8
2
SMA
Baik
Cukup (3,1)
Kurang (0,8)
3,4
3
SMK
cukup
Kurang (1,7)
Cukup (3,1)
2,5
4
MA
Baik
Baik (4,3)
Cukup (3,5)
3,3
5
SMA
cukup
Baik (5,2)
Sangat baik (6,2)
3,6
6
SMK
kurang
Cukup (2,8)
Kurang (1,1)
1,9
7
SMA
baik
Istimewa (9,3)
Sangat baik (7,5)
3,2
8
SMK
baik
Cukup (2,5)
Baik (4,6)
2,6
9
MA
cukup
Baik (4,4)
Cukup (2,3)
2,8
10
SMA
baik
Sangat baik (6,8)
Baik (4,3)
3,3


Keterangan:


Istimewa : 8-10
sangat baik : 6-8
baik : 4-6
cukup :2-4
kurang : 0-2
Memuaskan : 3-4
Mengecewakan: 0

Misalnya kita ingin mengkategorikan IPK mahasiswa menjadi 2 kategori, yaitu 
IPK >= 3 --> memuaskan
IPK < 3 --> mengecewakan

Maka, tabelnya akan menjadi seperti ini:

NIM
Asal Sekolah
Bhs
Mtk
BIng
IPK
Kategori
1
MA
Istimewa
Sangat Baik
Baik
3,8
Memuaskan
2
SMA
Baik
Cukup
Kurang
3,4
Memuaskan
3
SMK
cukup
Kurang
Cukup
2,5
Mengecewakan
4
MA
Baik
Baik
Cukup
3,3
Memuaskan
5
SMA
cukup
Baik
Sangatbaik
3,6
Memuaskan
6
SMK
kurang
Cukup
Kurang
1,9
Mengecewakan
7
SMA
baik
Istimewa
Sangatbaik
3,2
Memuaskan
8
SMK
baik
Cukup
Baik
2,6
Mengecewakan
9
MA
cukup
Baik
Cukup
2,8
Mengecewakan
10
SMA
baik
Sangat Baik
Baik
3,3
Memuaskan
Memuaskan
6
Mengecewakan
4
Total
10


1. Hitung entropi


Entropi = 0,970950594


2.

Tidak ada komentar untuk "Cara Kerja Algoritma Decission Tree ID3 Data Mining"