Osmanlı'nın yazın dünyası yapay zekayla gün yüzüne çıkıyor
Girişimci Abdullah Tarık Ömeroğlu ve arkadaşlarının geliştirdikleri yapay zeka destekli program, Latin alfabesine çevirdiği Osmanlıca milyonlarca sayfa belge ve kitaba erişimi kolaylaştırarak Osmanlı Türkçesini okunur kılıyor.
İstanbul
Osmanlı İmparatorluğu döneminde kullanılan Osmanlı Türkçesi, tarih, edebiyat ve Türkoloji gibi bölümler ile bazı özel kurslarda öğretiliyor.
Osmanlı Türkçesinin zengin mirasını koruma ve anlama amacıyla hareket eden bir grup genç girişimci, Osmanlıca yazılan orijinal metinleri yapay zeka yoluyla traskript eden program geliştirdi. Geçmişin izlerini sürmek, tarihi belgeleri anlamak, Osmanlıcanın derinliklerine inmek isteyenler için transliterasyon ve kelime arama özellikleri bulunan program, milyonlarca sayfadan oluşan zengin bir koleksiyon içerisinde veri analizi yapma imkanı sağlıyor.
Hazırladıkları programı "vesiqari" isimli internet sitesi üzerinden araştırmacı ve öğrencilerin kullanımına sunan girişimci Ömeroğlu, AA muhabirine yaptığı açıklamada, Arap alfabesinin çok geniş bir coğrafyadaki İslam alemi tarafından kullanıldığını belirtti.
Araf alfabesiyle yazılan Türkçeye Osmanlı Türkçesi denildiğini aktaran Ömeroğlu, dilin içerisinde Türkçenin yanı sıra Arapça ve Farsça kelimelerin de yer aldığını anlattı.
Proje fikri öğrenci evinde ortaya çıktı
Projenin 2020'de Boğaziçi Üniversitesinde öğrenci olduğu dönemde bir yayınevine Osmanlı Türkçesi ve farklı dillerden kitap hazırladığı dönemde ortaya çıktığını belirten Ömeroğlu, "Yazılımcı olan ev arkadaşım 'Bunu bir yapay zeka projesi haline dönüştürebilir miyiz? Ben İTÜ'de bitirme ödevimi bununla yapayım, sen de bana Osmanlıca kısmında yardımcı ol.' dedi ve öyle başladık. Kaderin tevafuku, o günün akşamında üniversite mailime TÜBİTAK BİGG'den (Bireysel Genç Girişim) bir teşvik maili geldi. Maille birlikte fikrimizi projelendirip bunu TÜBİTAK'a yazabiliriz diye düşündüm. Endüstri mühendisi olan diğer arkadaşım da işi projelendirip takvimlendirme çalışmasını üstlendi. TÜBİTAK teşvikinin geçmesiyle birlikte İTÜ Teknopark'ta şirketimizi kurduk." ifadelerini kullandı.
Proje üzerinde üç buçuk yıl çalıştıklarını anlatan Ömeroğlu, birçok farklı aşamadan oluşan yapay zeka modellerini kullanarak projeyi kullanılabilir hale getirdiklerini aktardı.
Sistemi bireysel kullanıcılar ve kütüphaneler olarak ikiye ayırdıklarını dile getiren Ömeroğlu, şöyle konuştu:
"Kütüphaneleri de kendi içerisine ikiye ayırdık. Bazı kütüphaneler eserlerini pek paylaşmak istemiyor. Onlar için bir havuz sistemi oluşturduk. Eğer kendi eserlerini paylaşmak isterse başka kütüphanelerin havuzlarından da yararlanıp o kaynakların tamamı tek bir havuz haline geliyor. Böylelikle o kütüphanenin kullanıcısı sisteme girdiği zaman, 7 milyon sayfa arasında istediği herhangi bir belgeyi arayabiliyor. Bir belgenin çevrilmesi 1 dakikadan az sürede tamamlanıyor ve başarı oranı oldukça yüksek. Hem metinde hem de 7 milyonluk bütün bir veri havuzunda kullanıcılar kelime araması yapabiliyor."
İkinci aşamada metinlerin Türkçe sadeleştirilmiş hali yer alacak
Projenin bir sonraki aşamasında kullanıcıların metinlerin Türkçe sadeleştirilmiş halini de elde edebileceklerini belirten Ömeroğlu, ayrıca birtakım chatbotlar ve özetleme sistemleriyle birlikte metinlerin özetini ve metinlerle konuşabilme imkanını da kullanıcılara sunacaklarını söyledi.
Kullanıcıların metnin kim tarafından ne zaman yazıldığı, ana teması, nelerden bahsettiği gibi soruların cevabını alabileceklerini aktaran Ömeroğlu, ikinci aşama için TÜBİTAK'a yaptıkları başvurunun sonuçlanmasını beklediklerini kaydetti.
Ömeroğlu, amaçlarının bireysel kullanıcılardan para kazanmak olmadığını, bu yüzden cüzi miktarda ücretlendirme yaptıklarını dile getirdi.
Projelerinin benzerlerine göre daha ileride bir sistem olduğuna işaret eden Ömeroğlu, "Bizim diğerlerinden temel farkımız bütün hizmetleri bir arada sunuyor olmamız. Bazı programlarda sadece kelime araması yapabiliyorsunuz. Ama ona dair bir transliterasyon hizmeti alamıyorsunuz ya da tek bir sayfayı koyup transliterasyonunu alabiliyorsunuz. Büyük bir veri havuzunda arama imkanı, onun içerisinde transliterasyon yapma imkanını sunuyoruz. Ayrıca bu veri havuzu sürekli olarak yeni metinlerle genişliyor." değerlendirmesinde bulundu.
Osmanlı Türkçesindeki matbu kitap ve süreli yayınları toplama noktasında koleksiyoner Hakkı Tarık Us ve Seyfettin Özege'nin ciddi çaba sarf ettiğini anlatan Ömeroğlu, bu iki ismin belgelerinin yanı sıra çeşitli kütüphaneler, arşivler ve koleksiyonerlerle görüşerek veri havuzunu genişlettiklerini kaydetti.
Anadolu Ajansı web sitesinde, AA Haber Akış Sistemi (HAS) üzerinden abonelere sunulan haberler, özetlenerek yayımlanmaktadır. Abonelik için lütfen iletişime geçiniz.