Makine [Türkçe] Düşünebilir mi ve Nasıl Düşünebilir?

mm
642 Görüntüleme
6 Dk Okuma Süresi

Bir bilgisayar bilimci olan Mariusz Flasiński, Introduction to Artificial Intelligence adlı kitabının girişinde teknik konulara geçmeden önce yapay zekâ üzerine kısa bir tarihçe kaleme almıştır. O tarihçede yapay zekâ için şöyle der: 

Birçok temel metodolojik meselesi antik çağlardan beri felsefede büyük önem taşımaktadır. Aristoteles, Aziz Thomas Aquinas, Ockhamlı William, René Descartes, Thomas Hobbes ve Gottfried W. Leibniz gibi filozoflar şu soruları sormuşlardır: “Temel bilişsel faaliyetler nelerdir?”, “Bir (biçimsel) dilin dünyayı kesin ve açık bir şekilde tanımlamak için yeterli bir araç olması için hangi gerekli koşulları yerine getirmesi gerekir?”, “Akıl yürütme otomatikleştirilebilir mi?” 

Bütün bu sayılan ve sayılmayan felsefi sorulardan bu yazı için önemli olanı “biçimsel bir dilin hangi koşullar altında dünyayı tanımlayabileceği” gibi görünüyor. Doğal dil, biçimsel dil, doğal dil işleme (biçimsel bir dil kullanarak), yapay dil derken dil meselesi ile bilgisayar bilimleri iyice dolanık ve katmanlı bir hal aldı. Birbirinden uzak [gibi görünen] iki bilimsel alan olan bilgisayar bilimleri ve dilbilim hızla yakınsarken şu sıralar yeni bir gelişme daha yaşandı ve Türkçe dil modeli Kumru duyuruldu. 

Peki bir doğal dilin amacı veya rolü dünyayı tanımlamak mıdır? Yoksa dil dünyayı inşa etmenin yollarından biri midir? Ya da dil, uğruna mücadele edilmesi, korunması gereken bir miras mıdır? Hatta daha ileri gidersek dil denilen şey bilincimizi yaratan bir şey mi yoksa bilincimizin bir ürünü mü? Hatta her ikisi birden mi? Wittgenstein, “Dilimin sınırları dünyamın sınırlardır” demiş. Biz de sınırlarımızı bilerek bu sorulara verilebilecek yanıtları felsefecilere ve dilbilimcilere bırakalım. Ya da bir dil modeline; söz gelimi ChatGPT’ye, DeepSeek’e veya Kumru’ya sorabiliriz!

Öte yandan herhalde şu kadarını söyleyebiliriz, eğer dil insanın düşünme biçimi üzerinde etkiliyse, biçimsel diller ile haşır neşir olan bilgisayar bilimcilerin düşünme biçimlerinde bir farklılık olması beklenebilir. Tıpkı dünyalarının sınır biçimlerinde bir farklılık olması beklendiği gibi. Ya da şöyle bir soru formüle edebiliriz. Biçimsel dillerin ideolojik bir yanı var mıdır? Biçimsel dillerde kolonyal izler sürmek olanaklı olur mu? Bu sorular da üzerine düşünülmesi gereken yönler içeriyor. 

Bugün karşı karşıya kaldığımız dil modellerinin yani çok basitçe söylersek biçimsel dillerle inşa edilmiş doğal dil üreteçlerinin -bu durumun ilginçliğine dikkat çekmek isterim- ideolojik bir yanı olduğu ise kaçınılmaz bir gerçek. Kolonyal izleri sürmenize gerek bile kalmadan her gün yeni bir örnekle karşımıza çıkıyor. Ya da cinsiyetçi izler… Daha da çeşitlendirmek mümkün. Tabii bu asimetrinin artık hepimizin bildiği, kolay ve kanıksanmış bir yanıtı var. Aslında bu tespit edilen ve edilmeyen ayrımcılıklar zaten dilde var olan ve sosyal yapıda gömülü hale gelmiş ayrımcılıkların yeniden üretilmesinden başka bir şey değildir. Zira bu sistemler, var olan bilgilerden öğrenmektedirler. Hatta yapay zekâ tarafından kullanılan veri setlerinde bu ayrımcı unsurları ayıklayan bir ön katman geliştirmek olanaklıdır. 

Ancak asıl dikkate sunulması gereken şey ise eşitsizliklerde bile eşit olamadığımız gerçeğini unutmamaktır. Zira bu zamana kadar dijitalleştirilmiş olan verinin İngilizce ağırlıklı olması ve bu veriye dayalı modellerin Batı dillerini merkeze alan bir yapısal anlayış ile geliştirilmesi söz konusudur. Bu durum da, eşitsizlik temsillerinin bile o dillere gömülü hale gelmiş olan hallerinin kapsanması anlamına gelmektedir. Yani sözgelimi ChatGPT aslında İngilizce düşünmektedir1. Konuşabildiği diller arasında bir hiyerarşi söz konusudur. 

Kumru: Türkçe Büyük Dil Modeli

İşte tam da bu noktada, dilin bir mücadele alanı olduğu gerçeğini yakından bilen ülkemizde, bir gelişme yaşandı. Kumru2 adlı dil modeli geliştirildi. Her ne kadar genel bir kategorinin bilinenleri olarak bu yazıda da ChatGPT ve DeepSeek gibi örnekler ile birlikte anılsa da Kumru, son kullanıcı için değil. Belki ileride bu yönde de bir hedefi olabilir. Belki de başka Türkçe dil modelleri bu boşluğu dolduracaktır. Ancak Kumru, tam anlamıyla söylersek anadili Türkçe olan bir dil modeli. 

Bu Türkçe dil modeli Kumru, kendisinden edindiğimiz bilgilere göre, VNGRS adlı şirket tarafından geliştirilmiş. Bazı küçük istisnalar dışında tamamen Türkçe veri setiyle eğitilmiş. Bu eğitim sırasında 500GB hacminde 120 milyar birimden (token) oluşan bir veri seti kullanılmış. Türkçeye özel birimleştirmeye (tokenization) sahip olacak şekilde eğitildiği için Türkçenin ekleme yapısına göre optimize edilmiş bir modelden bahsedebiliyoruz. Küresel büyük dil modelleri belirttiğimiz gibi genellikle İngilizce merkezli, Batı kaynaklı verilerle eğitiliyor. Bu durum, Türkçe gibi dillerin özel yapısal ihtiyaçlarının göz ardı edilmesine yol açabiliyor. Kumru, bu anlamda “yerel dilin teknoloji içinde var olma hakkı” açısından özel bir vaka haline geliyor. 

Sonuç: Dilin ve Düşünmenin Coğrafyası

Kumru’nun geliştirilmiş olması bize yalnızca bir teknolojik gelişmeyi değil, aynı zamanda dilin kendi coğrafyasını anımsatıyor. Her dil, dünyayı farklı bir biçimde kurar; dolayısıyla her dil modeli de o dünyanın biçimini yeniden üretir. Türkçenin kendi biçiminde düşünebilen bir makine, yalnızca teknik bir yenilik değil, aynı zamanda düşünmenin coğrafyasını yerinden etmeye yönelik bir girişimdir.

Bu nedenle mesele, bir yapay zekâ modelinin “Türkçe konuşabilmesi” değil; Türkçenin dünyayı nasıl kurduğunu, hangi olanak ve sınırlara sahip olduğunu kavrayabilen bir sistem geliştirebilmektir. Yani “makine Türkçe düşünebilir mi?” sorusu aslında “Türkçenin düşünme biçimi teknolojiye nasıl tercüme edilir?” sorusuyla iç içedir.

Eğer dil, bilincin yalnızca bir aracı değil, onun biçimlerinden biriyse, o hâlde Türkçede düşünebilen bir yapay zekâ, yalnızca yerel bir girişim değil; dilin kolonyal hiyerarşilerine karşı sessiz bir direniştir. Belki bu ve takip eden çalışmalar sayesinde öncelikle eşitsizlik biçimlerinde eşitleniriz. Sonra bu eşitsizlikleri aşmaya hep birlikte düşünme olanakları elde ederiz. 

Kumru, belki de tam bu yüzden yalnızca bir modelin adı değildir: bir anımsatmadır: Dilin, hâlâ düşünmenin en güçlü biçimi olduğunu anımsatır.

  1. Yapay zekâ temelli sistemler elbette öğrenme, düşünme, konuşma gibi eylemler yapamazlar. Yaptıkları matematiksel işlemler dilsel bir kolaylık olsun diye böyle nitelendirilmektedir. Dolayısıyla bu durum da bu yazıda işaret edildiği gibi dilin olanı mı anlattığı yoksa olanın inşasında rol mü oynadığı sorusuna dair bize bir fikir verebilir. ↩︎
  2. https://kumru.ai/ ↩︎

Bu Makaleyi Paylaşın