DeepSeek’in gelişen yapay zeka stratejileri, ABD ve Çin arasındaki rekabeti nasıl etkileyebilir?

20 Ocak’ta DeepSeek-R1’in piyasaya çıkışı sonrası çip üreticisi Nvidia’nın paylarında ve birçok teknoloji şirketinin pahasında keskin düşüş görüldü.
Yaşananlar bazılarınca Çin ile Amerika ortasındaki yapay zeka yarışının “Sputnik anı” ilan edildi Bu türlü bir uyanış Amerikan yapay zeka dalı için iyi sayılabilir. Fakat son gelişmeler kimi önemli sorular da getirdi.
Oksijen’den Daron Acemoğlu “Yapay zeka için uyanma vaktı: DeepSeek” başlıklı yazı kaleme aldı.
Acemoğlu’nun yazısının tamamı şu biçimde:
ABD teknoloji dalı yapay zekaya devasa yatırımlar yaptı ve yapıyor. Goldman Sachs’ın kestirimine nazaran, “Önümüzdeki yıllarda mega teknoloji firmaları, kurumsal şirketler ve kamu hizmeti veren kuruluşların yapay zekayı güçlendirmek üzere 1 trilyon doları civarı sermaye harcaması yapması bekleniyor.” Fakat ben de dahil birçok gözlemci ABD’deki yapay zeka yatırımlarının ve geliştirme çalışmalarının rotasını çoktandır sorguluyor.
Kısmen açık kaynaklı modeliyle biraz ayrışan Meta bir yana, bütün şirketlerin birebir usullerle ilerlediği bölüm bütün yumurtaları tıpkı sepete koymuş görünüyor. Amerikalı teknoloji şirketleri istisnasız biçimde büyüklüğe kafayı takmış durumda. Şimdi ne olduğu muhakkak olmayan “büyütme yasalarına” atıfta bulunarak daha fazla kabiliyete giden tek yolun mevcut modellere daha da fazla data ve bilişim gücü sağlamaktan geçtiğini savunuyorlar. “Tek gereksiniminiz olan şey büyüme” tezinde bulunanlar bile var.
20 Ocak öncesinde Amerikalı şirketler dizilerdeki bir sonraki sözcüğü öngörmek üzere devasa data kümeleri üzerinden eğitilmiş temel modellerin alternatiflerini dikkate almakta isteksizdi. Öncelikleri sebebiyle neredeyse büsbütün insan yahut insan gibisi misyonları yerine getirmeye yönelik difüzyon modelleri ve sohbet robotlarına odaklanıyorlardı. DeepSeek de genel olarak tıpkı yaklaşımı benimsemesine karşın destekli öğrenme, daha küçük ve tesirli modellerden oluşan uzmanların karışımı (MoE) prosedürü, bilgi distilasyonu ve rafine fikir dizisine dayalı akıl yürütmeye daha fazla tartı vermiş görünüyor.
Söylenenlere bakılırsa bu strateji DeepSeek’in çok daha az maliyetle rekabetçi bir model üretmesini sağladı.
Yaşananlar ABD yapay zeka dalı içindeki “tek fikirliliği” ortaya döktü. Dalın alternatif, daha ucuz ve daha çok şey vaat eden yaklaşımları görmezden gelmesi ve süregelen abartılar, Simon Johnson ile üretken yapay zeka çağının çabucak öncesinde yazdığımız “İktidar ve Teknoloji” kitabında öngördüğümüz yaklaşımı yansıtıyor. Şu anki temel problem Amerikan yapay zeka kesiminin öteki ve daha da tehlikeli kör noktaları bulunup bulunmadığı. Örneğin Amerika’nın önde gelen teknoloji şirketleri, modellerini daha “insan yanlısı” hale getirme fırsatını kaçırıyor olabilir mi? Bu türlü olduğu istikametinde önemli kuşkularım.
TEPEDEN İNME ATAK İNOVASYONU BALTALAR
Bir de Çin’in ABD’yi geride bırakması problemi var. Nitekim böyleyse mevcut durum James A. Robinson ile “dışlayıcı kurumlar” olarak tanımladığımız otoriter ve zirveden inme yapıların inovasyonu destekleme konusunda tabandan doruğa ilerleyen sistemlerle baş edebileceği, hatta onları geride bırakabileceği manasına mı geliyor?
Robinson ile “Ulusların Düşüşü” kitabında zirveden inmeci denetimin inovasyonu baltaladığını yazmıştık. Tıpkı fikirdeyim. DeepSeek’in başarısı bu iddiayı yalanlıyor üzere görünse de dışlayıcı kurumlar idaresindeki inovasyonun kapsayıcı kurumlardakiler kadar güçlü ve sağlam olabileceği tarafında kesin ispat olmaktan uzak. DeepSeek ABD’nin ve kısmen Avrupa’nın yıllardır kaydettiği gelişmeler üzerinden hareket ediyor. Kullandığı temel yolların öncüleri ABD’den. Uzmanların karışımı (MoE) modelleri ve destekli öğrenme on yıllar evvel akademik araştırma kurumlarında geliştirilmişti. Dönüştürücü modelleri, niyet zinciri olarak bilinen akıl yürütmeyi ve distilasyonu birinci kere hizmete koyan da Big Tech olarak bildiğimiz Amerikalı büyük teknoloji şirketleriydi.
DeepSeek’in başarısı mühendislik alanında oldu ve ismi geçen yolları Amerikalı şirketlerden daha verimli biçimde birleştirmeyi başardı. Çinli firmaların ve araştırma kurumlarının bir sonraki adımı atıp kendi özgün çığır açıcı teknikleri, eserleri ve yaklaşımlarıyla sahneye çıkıp çıkmayacakları şimdi meçhul.
Dahası, DeepSeek birden fazla Çinli yapay zeka firmasından da farklı. Çinli şirketler çoklukla teknolojileri ya hükümet için ya da hükümet finansmanıyla üretiyor. DeepSeek bugüne kadar nitekim de göze çarpmadan faaliyet göstermişse çok ilgiden sonra yaratıcılığını ve dinamizmini sürdürmesi mümkün olacak mı? Tek şirketin başarısı Çin’in inovasyon alanında açık toplumları yenebileceğine dair kesin delil olarak okunamaz.
İşin bir de jeopolitik boyutu var. DeepSeek olayı ABD’nin Çin’deki yapay zeka araştırmalarını dizginlemeye yönelik ihracat denetimlerinin ve öbür önlemlerinin başarısız olduğu manasına mı geliyor? Burada da yanıt net değil. DeepSeek son modelleri olan V3 ile R1’i eski ve daha zayıf çipler üzerinden eğitmiş olsa da ilerleyişini sürdürmek ve büyümek için hala en güçlü çiplere gereksinim duyabilir.
Ne var ki Amerika’nın sürdürdüğü ve kimsenin kazanmadığı oyunun uygulanamaz ve yanlış değerlendirilmiş olduğu aşikar. Bu türlü bir stratejinin manalı olabilmesi için her bilişsel vazifede beşerlerle tıpkı seviyeye gelebilecek yapay genel zekaya hakikat ilerlediğimize ve bunu birinci elde edenin muazzam bir jeopolitik avantajı eline geçireceğine inanmak gerekiyor. Ancak hiçbir garantisi bulunmayan bu varsayımlara tutunarak Çin’le birçok alanda verimli olabilecek işbirliğinin önünü kesiyoruz. Örneğin iki ülkeden biri insanların randımanını artıran modeller üretir ve bu model yaygın biçimde kullanılmaya başlarsa bu türlü bir inovasyon iki ülkeye de fayda getirir.
Amerikalı kuzenleri üzere DeepSeek de yapay genel zeka geliştirme niyetinde ve eğitilmesi çok daha ucuza gelen bir model kurmak çok şey değiştirebilir. Fakat geliştirme maliyetlerini bilindik formüllerle aşağı çekmek mucize yaratıp birkaç yıl içinde yapay genel zekaya ulaşmamızı sağlamayacak. Yapay genel zekanın kısa vadede erişilebilir olup olmadığı sorusu ortada. Bunun dilek edilecek bir şey olup olmadığı üzere daha büyük bir soru da var.
DeepSeek’in modellerini nasıl geliştirdiğine ve görünürdeki muvaffakiyetinin yapay zeka dalının geleceği için ne mana tabir ettiğine tam olarak hakim olmasak da bir gerçek kesin görünüyor: Sonradan ortaya çıkan Çinli bir firma teknoloji bölümündeki büyüklük takıntısını boşa çıkardı. Bölümü kapıldığı rehavetten uyandırması bile mümkün.
patronlardunaysi.com