Abstract:
Dünyadaki verilerin yaklaşık olarak %90'ı yapılandırılmamış formatta bulunmaktadır. Bu tip veriler üzerinde işlem yapılması, verilerin yönetilmesi veya bu verilere erişim zordur. Bu yüzden 1960'lı yıllardan itibaren veriyi yapılandırıp makine tarafından işlenebilir hale dönüştürme amacıyla sistemler geliştirilmeye başlanmıştır. Metin madenciliği, özellikle 2000'li yıllarda daha fazla ilgi gören, serbest formatta bulunan metinler içerisindeki daha önceden bilmediğimiz bilgileri ortaya çıkarmamızı sağlayan işlemler bütünüdür.Metin madenciliği tekniklerinin tıpta kullanımı son birkaç yılda büyük oranda artmıştır. Yapılan klinik çalışmalar, araştırma raporları, hastane kayıtları, doktor notları, prosedürler ve faturalar gibi serbest formatta bulunan metinler tıptaki en önemli veri kaynaklarıdır. Fakat yapılandırılmamış formatta bulunan bu geniş veri yığınlarını insan gücüyle analiz etmek ve istenilen bilgiye ulaşmak hem zordur hem de zaman kaybına yol açmaktadır. Hastayla ilgili karar verme süresinin, doğru verilere erişmenin ve bu verileri kullanarak istenilen bilgilere ulaşmanın zorluğu göz önünde bulundurulduğunda bu tür sistemlerin önemi ön plana çıkmaktadır.Bu çalışmada, Akdeniz Üniversitesi Hastanesi Kulak Burun Boğaz Hastalıkları Anabilim Dalı'ndan alınan ameliyat geçiren hastalara ait 600 adet hasta bilgi formunu yapılandırılmış formata dönüştürmek, hekimlerin hasta ile ilgili ihtiyaç duydukları bilgilere erişimini kolaylaştırmak, hasta bilgi formlarından klinik verileri çıkartmak ve bu verileri analiz etmek amacıyla bir yazılım geliştirilmiştir. Önce Microsoft Office Word belge formatında bulunan hasta bilgi formlarındaki veri alanları ön işlemden geçirilerek veri tablosu haline dönüştürülmüştür. Veri tablosundaki veriler, Microsoft Office Excel'e gönderilebilmekte veya XML olarak veritabanına kaydedilebilmektedir. Hazırlanan metin sorgu formuyla birlikte hekimlerin hasta bilgi formlarında aradıkları özellikteki hastalara erişimlerinde kolaylık sağlanmaktadır. Ayrıca her alana özgü oluşturulan anahtar kelime listeleriyle metin içerikleri kodlanabilmekte ve bu veriler üzerinde veri madenciliği teknikleri uygulanabilmektedir. Bu çalışmada, varlıklar/ kavramlar arasındaki ilişkilerin tanımlanabilmesi için veri madenciliğinde kullanılan ilk tekniklerden biri olan Birliktelik Kuralı yöntemi uygulanmıştır. İlerleyen zamanlarda kazanılan deneyimlerle diğer anabilim dallarında da kullanılabilecek daha kapsamlı ve profesyonel bir yazılım geliştirilmesi planlanmaktadır.