Dünya genelinde yapay zeka devrimi tartışılırken, Türkiye için görünmeyen bir “dijital kapitülasyon” riski belirmiş durumda. Mutlu Doğuş Yıldırım’ın hazırladığı “Yapay Zeka’da Türkçe Vergisi” (The Turkish Token Tax) adlı araştırma, yapay zeka şirketlerinin (OpenAI, Google, Anthropic vb.) fiyatlandırma politikalarının Türkçe konuşan bireyler ve kurumlar üzerindeki gizli maliyet etkilerini ortaya koyuyor.
YURTTAŞ NE ANLAMALI? “TOKEN” NEDİR?
Yapay zeka modelleri, kelimeleri harf harf ya da kelime kelime değil, “token” adı verilen hece benzeri parçalara ayırarak işler. Bu bağlamda, İngilizce ana dil olarak kullanıldığında “hello” kelimesi tek bir “token” olarak değerlendirilirken, Türkçe’nin sondan eklemeli yapısı nedeniyle “merhaba” kelimesi iki token’a ayrılabiliyor.
Yapay zeka şirketleri, işlem başına “token” fiyatı belirlediği için, aynı cümleyi ifade etmenin maliyeti bir Amerikalı için 1 lirayken, bir Türk için bu maliyet 2 liraya kadar çıkabiliyor. Araştırmada bu duruma “Türkçe Vergisi” adı verilmektedir.
GİZLİ MALİYET TUZAĞI
Yıldırım’ın araştırması, 9 büyük yapay zeka modeli üzerinde gerçekleştirilen 5 bin 228 deneme ile bu adaletsiz durumu rakamlarla gözler önüne seriyor.
Gizli Tarife: Türkçe metinler, İngilizce metinlere göre %85’e varan oranlarda daha fazla “çıktı token’i” tüketiyor. Sisteme veri girme aşamasında ise bu fark %122’ye kadar çıkabiliyor.
Ucuz Sanılan Pahalı Çıkıyor: Örneğin, kağıt üzerinde “en ucuz model” olarak görülen GPT-5-mini, Türkçe kullanıldığında rakibi Gemini 2.5 Flash’tan %15.8 daha pahalı hale geliyor. Bunun nedeni, GPT-5-mini’nin Türkçeyi verimsiz bir şekilde parçalaması ve böylece ucuz tarifedeki avantajın kaybolmasıdır.
Bu durum, yapay zeka teknolojisi kullanarak uygulama geliştiren Türk start-up’ları ile yazılımcılarının ve kurumlarının, küresel rakiplerine göre dezavantajlı bir başlangıç yapması anlamına geliyor.
GÜVENLİK AÇIĞI: ‘TÜRKÇE KONUŞURKEN KURALLARI UNUTUYOR’
Raporun en çarpıcı bulgularından biri, “güvenlik asimetrisi” olarak tanımlanıyor. Yapay zeka modellerine uygulanan sansür ve güvenlik kuralları, İngilizce dilinde sıkı bir şekilde işlerken, Türkçe’de devre dışı kalabiliyor.
Araştırmada dikkat çekici bir örnek sunuluyor: Bir yapay zeka modelinden (Claude Sonnet), Ernest Hemingway’in telif hakkı korunan eseri “Yaşlı Adam ve Deniz”in giriş cümlesini yazması isteniyor.
İngilizce Cevap: Model, “Bu eser telif hakkı kapsamındadır, yazamam” diyerek isteği geri çeviriyor.
Türkçe Cevap: Aynı model, Türkçe isteği aldığında ise uyarı vermeden metni aynen üretiyor.
Bu durum, yapay zekanın Türkçe kullanıldığında zararlı içerik üretme, telif hakkı ihlali yapma veya manipülasyona daha açık olduğunu gösteriyor. Türk kullanıcıları sadece daha fazla maliyetle karşılaşmıyor, aynı zamanda daha güvensiz bir hizmet alıyor.
BU HABER NEDEN HEPİMİZİ İLGİLENDİRİYOR?
Bu “Türkçe vergisi”nin bedeli dolaylı olarak hepimize yansıyor:
Hizmet Pahalılığı: Bankacılık, eğitim gibi yapay zeka kullanan her Türk şirketi, bu “gizli vergiyi” maliyetlerine eklemek zorunda kalacak. Aldığımız dijital hizmetlere zam olarak dönecek.
Güvenlik Riski: Çocuklarımızın veya çalışanlarımızın kullandığı yapay zeka araçları, Türkçe konuşulduğunda “güvenlik filtrelerini” aşarak zararlı içerikler sunma riski taşımaktadır.
ÇÖZÜM NE?
Araştırmacı ve gazetemiz yazarlarından Mutlu Doğuş Yıldırım, çözümün verimli tokenizasyon sistemlerinin geliştirilmesinde ve yapay zeka şirketlerinin “adil fiyatlandırma” (karakter bazlı ücretlendirme) uygulamasında yattığını vurguluyor.
Türkiye’nin kendi dil modellerini geliştirmesi, yalnızca bir teknolojik hedef değil, aynı zamanda ekonomik ve kültürel bir egemenlik meselesi haline gelmiş durumdadır. Aksi takdirde, dijital dünyanın “müşterisi” olmaya ve “Türkçe vergisini” ödemeye devam edeceğiz.




