Her şey bize anlatıldığı gibi pırıltılı olabilir mi? Çin'in yapay zekâ sırrı deşifre oldu
Henüz iki sene önce kurulan Çin merkezli DeepSeek’in yeni yapay zeka modeli R1, performans testlerinde ABD’nin OpenAI’ın en gelişmiş o1 modeli ile başabaş sonuçlar aldı. Sohbet uygulamasını kotasız ve ücretsiz sunan, yazılımcılara 100 kat daha ucuza erişim veren, açık kaynaklı olan ve tüm eğitimini OpenAI’dan 100 kat daha ucuza yaptığını iddia eden DeepSeek, ortalığı bir güzel karıştırdı. Borsada bir gecede 600 milyar dolarlık düşüşün ardından önce ABD’den tebrik mesajları, sonra da hırsızlıklık suçlaması geldi. İtalya ve Avustralya’da yasaklanan DeepSeek, yapay zekada yeni bir döneme girdiğimizi kesinleştirdi. Ancak her şey bize anlatıldığı kadar parıltılı olabilir mi?
Gelin biraz da herkesin yapay zekasını ve OpenAI’ı nasıl ‘madara ettiğini’ konuştuğu DeepSeek’in kim olduğunu konuşalım. Eski hedge fonu yöneticisi Liang Wenfeng tarafından 2023’te kurulan ve yapay zeka tabanlı kantitatif alım satım stratejileri ile 14 milyar dolarlık yatırım portföyünü yöneten High Flyer’ın desteğini alan şirketin en önemli başarısı, yapay zekayla ilgilenenlerin ağzını açık bırakan yeni modelden daha çok ABD’nin Çin’e yönelik teknolojini ambargosunu kırabilmesi olabilir.
AMBARGOYU NASIL KIRDI?
Liang’ın stratejik öngörüsü bu konuda önemli bir rol oynadı, zira ABD Çin’e yönelik ithalat ambargosu uygulanmaya başlamadan önce, High Flyer, Nvidia’nın A100 grafik işlemcilerini bünyesinde toplamaya başladı. Grafik işlemciler, yapay zeka sunucularının kurularak büyük dil modellerinin, yani ChatGPT’nin arka planda kullandığı altyapının oluşturulmasını sağlıyor. Zaten Nvidia’nın tüm ABD borsasını sırtında taşıyacak kadar büyük bir şahlanış yaratabilmesinin arkasında da grafik işlemci odağını oyunlar kadar yapay zekaya taşıması yatıyor. İşte bu altyapı, DeepSeek’in sofistike yapay zeka modellerini çalıştıracak gücü sağlıyor.
Şirket daha 2020 yılında 1100 grafik işlemciyle ilk süper bilgisayar kümesini kurmuş, 2021’de ikinci kümeyle toplam grafik işlemci sayısını 10 binin üzerine çıkarmıştı. Endüstri analisti SemiAnalysis şirketine göre, bugün High Flyer’ın yaklaşık 50 bin adet grafik işlemcisi olduğu biliniyor. Üstelik bunlar sadece A100 ile sınırlı değil, daha gelişmiş 10 bin adet H800 ve 10 bin adet H100 de şirketin portföyünde yer alıyor.
REKORLAR VE MİLYON DOLARLIK EĞİTİM BALONU
DeepSeek’in performansı kadar etkileyici olan söylemlerinin başında, R1 modelinin eğitimini 5,6 milyon dolara getirdiği geliyor. Ancak, High Flyer’ın sunuculara olan yatırımı 1,6 milyar doları, bu sunucuları işletmenin maliyeti ise yaklaşık 944 milyon doları buluyor. Yani bu anlamda OpenAI’dan farklı bir yanı kalmıyor.
Diğer yandan yapay zeka performans ölçümlemede kullanılan birçok teste göre, DeepSeek R1, matematiksel mantık, genel bilgi ve soru yanıtlama görevlerinde OpenAI o1 ile başabaş performans alıyor. Uygulama 26 Ocak’ta ABD’deki ücretsiz uygulamalar sıralamasında ilk sırayı alırken, uygulama istatistikleri konusunda en güvenilir kaynaklardan olan Sensor Tower’a göre, 18 günde 16 milyon kez indirildi. Aynı sürede ChatGPT uygulaması sadece 9 milyon kez indirilmişti.
BEŞ SENEDE YAPAY ZEKANIN LİDERİ OLABİLİR Mİ?
Çin’in 2030 yılına kadar küresel anlamda yapay zekada liderlik koltuğuna oturma hedefi de düşünülünce, DeepSeek’in ardındaki güçlü ekosistemi görmezden gelmek mümkün değil. Bir yanda ABD’nin kurumsal yatırım ekosisteminin trilyon dolarlık Silikon Vadisi duruyor, bir yanda şimdiye dek ciddi bir atılım gösterememiş olan Avrupa (bu hafta 56 milyon dolarlık bir Avrupa yapay zekası fonu açıkladılar ama bu parayla güçlü bir model eğitmek bile mümkün olmayabilir), diğer yanda ise Çin’in bu ay açıkladığı 13,79 milyar dolarlık yapay zeka yatırım fonu duruyor.
Çin, tüm dünyaya ürün gönderen e-ticaret devi Alibaba’nın, TikTok’un yaratıcısı olarak tanınan, ancak ciddi bir teknoloji ve oyun portföyünün servetiyle geleceğe adım atmak isteyen Bytedance gibi şirketlerin yapay zekalarıyla bu alanda kalıcı ve güçlü bir oyuncu olacağı izlenimi veriyor. Örneğin Bytedance’in Doubao 1.5 Pro modeli OpenAI’ın bir önceki modeli 4o’yu kodlama, mantk ve Çince dil işleme konularında geride bırakıyor. Moonshot AI şirketinin Kimi k1.5 modeli o1 modelini matematik, kodlama ve görsel algılamada yakalıyor. Alibaba’nın bu hafta başında tanıttığı Qwen2.5-VL modeli ise multimodal olarak adlandırılan ve metnin yanı sıra, ses, video gibi dosyalarla da çalışabilmesiyle dikkat çekiyor. Tüm bunlar, ABD’nin yüksek teknoloji ambargosunun o kadar da etkili olmadığını gösteriyor. Zira Huawei, yeni tanıtacağı Ascend 910C adlı yapay zeka çipiyle Nvidia’nın güçlü H100 işlemcisine yakın bir performans elde edeceğini iddia ediyor.
BİR YANDA SANSÜR, DİĞER YANDA HIRSIZLIK İDDİALARI
Diğer yandan, Çin merkezli modellerle ilgili bir sansür iddiası da internette yaygın şekilde konuşuluyor. Bu yazıdaki gelişmelerle ilgili yorumlarını sorduğumda, DeepSeek konuyu değiştirdi ve cevap vermek istemedi. Yapay zeka kullanıcıları Çin merkezli yapay zeka modelleriyle bugüne kadarki tecrübelerinde, özellikle Tiananmen Meydanı Protestolarından bahsetmediklerini fark etmişti. Ancak, DeepSeek bu konuda kapsamı biraz daha geniş tutmuş gibi görünüyor.
OpenAI CEO’su Sam Altman ve Nvidia CEO’su Jensen Huang, DeepSeek’i tebrik etmekte gecikmediler. Ancak bu tebriklerin birkaç gün ardından OpenAI, DeepSeek’in distilasyon adlı bir yöntemle eğitim verilerini çaldığını iddia etti. Distilasyon, yapay zeka modellerinin eğitiminde daha büyük verilere sahip modellerden veri çekerek gerçekleştirilen genel bir eğitim yöntemi. Ellerinde kanıt bulunduğunu söyleyen OpenAI’ın sonraki adımı ne olur bilinmez ama Çin’in var olan ambargo koşullarına karşın yüksek teknolojiye olan iştahının bu kadar büyük olması şaşırtıcı değil.
Ekonomim'den Aytun Çelebi'e göre, kim ne derse desin, sessiz bir şekilde herkesin odağı haline gelebilen bu modellerin içindeki açık kaynaklı seçenekler, artık verilerin kimsenin eline geçmeden yapay zekaya erişim sağlaması açısından büyük bir önem taşıyor. Bir diğer güzel yanı ise; bizim gibi henüz bu işin başındakiler için daha düşük maliyetle büyük modeller geliştirme fırsatının önünü açması…
Kaynak:BBN
Türkçe karakter kullanılmayan ve büyük harflerle yazılmış yorumlar onaylanmamaktadır.