Konuşma Tanıma Sistemiyle Sözlü Dilden Yazılı Dile

Boğaziçi Üniversitesi’nde geliştirilen ‘’Türkçe Konuşmaların Otomatik Olarak Yazıya Çevrilmesi’’ projesi sayesinde hem çeviriler daha doğru bir Türkçe kullanılarak yapılacak hem de işitme engelliler konuşulanları daha kolay anlayabilecek

Boğaziçi Üniversitesi akademisyenleri, geliştirdikleri modelle konuşmaları otomatik olarak yazıya çeviren teknolojiyi Türkçe diline uyarlayarak daha etkin bir hale getirdiler. Türkçe dilinin özelliklerini dikkate alacak şekilde üretilen model, konuşma tanıma sisteminin çevirileri daha doğru bir Türkçe ile yapmasını sağlayacak. 

Bu modelle, bir konuşmanın anlaşılarak yazıya mümkün olduğunca doğru olarak çevrilmesinin amaçlandığını belirten Boğaziçi Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölümü’nden proje yürütücüsü Prof. Dr. Tunga Güngör ve Elektrik-Elektronik Mühendisliği Bölümü’nden proje araştırmacısı Doç. Dr. Murat Saraçlar, ilk kez Türkçe dil yapısına uygun olarak geliştirilen bu sistemin işitme engellilerinin konuşulanları anlamalarına da yardımcı olduğunu ifade ettiler.

Türkçe’ye özel olarak hazırlandı

Konuşma tanıma sisteminin benzerlerinden farklı olduğunu belirten proje ekibi, “Projemiz zengin bir ek yapısına sahip olan Türkçe’ye özel olarak hazırlandı. Dilimizin kendine ait özelliklerini kaybetmeden, dil kurallarına uygun bir şekilde konuşmadan yazıya çevrilecek olması bir yenilik. Türkçe’de kelime yapısı karmaşık olduğu için o yapıya özel bir metot hazırlandı. Türkçe’nin yapısına uygun bir şekilde kelimeleri düzenleyerek daha başarılı bir model ürettik. Bu yeni model çeviride dilin yapısını ve özelliklerini muhafaza ediyor. Bu, okullarda öğretilen kelimelerin ‘ek’ ve ‘kök’ olarak çözümlenmesi işlemine benzetilebilir. Modelimiz önce kelimenin analizini yapıyor ve uygun kökü ve ekleri bularak cümleyi tamamlıyor. Böylece en mükemmel çeviriye ulaşmış oluyoruz.”

İngilizce gibi eklemeli olmayan dillerde konuşma tanıma sistemlerinin başarıyla geliştirilmesinin daha kolay olduğunu söyleyen Dr. Güngör ve Dr. Saraçlar, “Türkçe gibi eklemeli dillerde sınırsız sayıda kelime üretilebildiği için iyi bir dil modelinin eksikliği, konuşma tanıma sistemlerinin başarısını olumsuz yönde etkiliyordu. Proje kapsamında, Türkçe dili için yüksek başarımlı bir konuşma tanıma sistemi geliştirildi. Ayrıca, dil modelinin oluşturulmasına yönelik çalışmalar sırasında, biçimbilimsel çözümleyici, biçimbilimsel muğlaklık giderici ve web derlemi kaynakları elde edildi. Web derlemi çözümleyici ile analiz edilip muğlaklık giderici ile doğru analizler seçilerek, kelimelerdeki morfemler üzerine istatistiksel bir dil modeli geliştirildi. Sonlu durum makineleri tabanlı arama ağları üzerinde gerçek zamanlı konuşma tanıma yapabilen bir kod çözücü yazılım hazırlandı. Bu da bize diğer diller kadar etkin bir çeviri yapmamızı sağlayan modeli oluşturdu” dedi.