Abstract


ÖĞRENCİLERİN BAŞARILARINI SINIFLANDIRMADA ÖZELLİK SEÇİM YÖNTEMLERİNİN PERFORMANSLARININ İNCELENMESİ

Bu çalışma, özellik seçme algoritmalarından yararlanarak Eğitimsel Veri Madenciliği (EDM) bağlamında makine öğrenimi modellerinin optimize edilmesine odaklanmaktadır. Özellik seçim yöntemleri, makine öğrenme algoritmalarının hızını ve tahminleme performansını arttırmaya, verinin anlaşılmasına ve maliyetinin de azaltılmasına olanak sağlamaktadırlar Bu çalışmada; özellik seçim yöntemlerinden Information Gain, Gain Ratio, Symmetric Uncertainty Coefficient, Relief-F, Correlation Based Feature Selection Method ve One R measure kullanılarak, üniversite öğrencilerinin başarılarını etkileyen faktörleri belirlemek amaçlanmaktadır. Özellik seçim yöntemlerinin etkisini karşılaştırmak amacıyla Naïve Bayes yöntemi uygulanmıştır. Bu amaçla, UCI Machine Learning Repository veri tabanında yer alan “Higher Education Students Performance Evaluation dataset” kullanılmıştır. Veri seti, 33 değişken ve 145 örnekten oluşmaktadır. Çalışmada; 30 değişken kullanılmıştır. Analiz sonuçlarına göre; %57.24 ile Information Gain ve Relief-F ölçüsü en iyi özellik seçim yöntemi olarak belirlenmiştir. Correlation Based Feature Selection Method hariç diğer tüm yöntemlerde öğrenci başarısını etkileyen en önemli faktör, öğrencinin son yarıyıl genel not ortalaması olarak tespit edilmiştir. Diğer taraftan; One R yöntemi hariç kullanılan özellik seçim yöntemlerinin Naïve Bayes yönteminin performasını artırdığı görülmektedir. Özellik seçim yöntemlerinin veri madenciliği yöntemlerin verimliliğini artırmak amacıyla kullanılması önerilmektedir.



Keywords

Özellik seçimi, Eğitsel Veri Madenciliği, Naive Bayes, Yüksek Öğrenim





References