Abstract:
Dünyada artan hareketlilik havayolu ulaşımına olan talebi artırmıştır. Yolcu taşımacılığının yanı sıra yükte hafif pahada ağır olarak tanımlanabilecek malzeme ve ürünlerin taşımacılığı konusunda da havayolu taşımacılığının payı günden güne artmaktadır. Yıllar içerisinde hem yolcu hem de yük taşımacılığı konusunda artan talep nedeniyle uçuş gecikmeleri artmış ve bu durum paydaşlar üzerinde olumsuz etkisi yaratmıştır. Gecikmelerin son ana kadar öngörülememesi havaalanlarında yığılma, bazı yolcular için uzun süreli bekleme veya aktarmalı uçuşları kaçırma gibi birçok problemi beraberinde getirmektedir. Havayolu ulaşımına olan talebin artmasının yanı sıra, teknolojik imkanların da artması bu alanda oluşan verilerin daha kolay depolanmasına ve oluşan bu büyük veri ile faydalı analizler yapılmasına imkan tanımaktadır. Bu analizlerin yapılabilmesi için kullanılan makine öğrenmesi yöntemleri son yıllarda önemli bir ivme kazanmıştır. Bu çalışmada, uçak gecikmelerinin sebep olduğu problemleri azaltabilmek adına makine öğrenmesi yöntemleri ile detaylı uçuş ve hava durumu verileri birlikte değerlendirilerek uçak gecikmelerinin tahmin edilmesi amaçlanmıştır. Bu doğrultuda, sektörde faaliyet gösteren uluslararası bir havayolu şirketiyle irtibata geçilerek çalışmada kullanılacak olan uçuş verileri temin edilmiştir. Uçuş bilgileri kapsamında uçakların planlanan kalkış ve varış zamanları, uçakların piste çıkış/varış zamanları, hangi havalimanları arasında seyahat gerçekleştirdiği, seyahatlerin tam tarih bilgileri gibi konularda üç yıllık (2016-2017-2018) veriler toplanmıştır. Bu veriye ek olarak hava durumuna ilişkin veriler ise çevrimiçi kaynaklardan elde edilmiştir. Hava durumu için ise, kalkış ve varış havalimanlarının planlanan kalkış/varış saatlerindeki hava durumu verileri (sıcaklık, basınç, bulutluluk durumu, görüş mesafesi, olağanüstü hava durumları vb.) dikkate alınmıştır. Havayolu firmasının üç yıllık uçuş verileri ile uçak kalkış ve varış zamanındaki hava durumu eşleştirilerek uçuşların durumunu tahmin etmek üzere veri seti oluşturulmuştur. Oluşturulan veri seti, makine öğrenme yöntemleri içerisinde yer alan Yapay Sinir Ağları, Rastgele Ormanlar, XGBoost, LightGBM ve CatBoost ile incelenmiş ve analiz edilmiştir. Bu modellerin performansı ise hata matrisi temelli çeşitli birçok performans metriklerine göre değerlendirilmiş ve elde edilen bulgular birbirleri ile karşılaştırılarak yorumlanmıştır.