Abstract:
Bu araştırma ile eğitim alanında büyük veri çalışmalarına temel oluşturmak için makine öğrenmesi algoritmalarından hangilerinin alanda kullanılabileceği tespit edilmeye çalışılmıştır. Bu doğrultuda çalışmada, Türkiye Öğrenci Değerlendirmesi gerçek veri seti ile öğretim elemanı kalitesinin araştırılması için öğretim elemanlarının performanslarının belirlenmesi ile ilişkisi olduğu düşünülen derse özel 28 soru ve 5 özellikten oluşan faktörler; Karar Ağacı, Rastgele Orman ve Yapay Sinir Ağları algoritmaları çerçevesinde incelenmiştir. Bahsi geçen bu üç algoritmanın sınıflandırma performansları doğruluk, duyarlılık, özgüllük, kesinlik ve F ölçütü ile araştırılmıştır. Çalışmanın verileri Kaliforniya Üniversitesi Makine Öğrenmesi Veri Havuzu'ndan hazır olarak alınmıştır. Veri seti, üç farklı öğretim elemanının 5820 Gazi Üniversitesi öğrencisi tarafından likert tipi ölçek ile değerlendirilmesinden oluşmaktadır. Verilerin analizi için R yazılımı ve R Studio ortamı kullanılmıştır. Araştırma sonucunda doğru sınıflama oranı %98.57 olan Karar Ağaçları algoritması, Rastgele Orman ve Yapay Sinir Ağlarına göre daha başarılı bulunmuştur. %98.03 ile karar ağacına çok yakın değere sahip olan Rastgele Orman algoritması ikinci en iyi performans gösteren algoritma olarak belirlenmiştir. %81.55 ile Yapay Sinir Ağları kabul edilebilir düzeyde performans göstermiş olsa da diğer algoritmalar ile karşılaştırıldığında düşük performanslı olarak kabul edilmektedir. Algoritmalar özgüllük oranı, duyarlılık oranı, kesinlik oranı ve F ölçütü çerçevesinde incelendiğinde yine Karar Ağaçları algoritması, Rastgele Orman ve Yapay Sinir Ağlarına göre daha başarılı bulunmuştur. Araştırmanın alt problemi olarak üç algoritmanın en önemli yordayıcısı ve manidarlık düzeylerinin karşılaştırılması araştırılmıştır. Sonuç olarak, üç algoritma için en önemli yordayıcı sınıf değişkeni olarak bulunmuş ve manidarlık düzeyi açısından üç algoritma arasında herhangi bir farklılığa rastlanılmamıştır.