Çin merkezli yapay zeka laboratuvarı DeepSeek, son günlerde hızla popülerleşerek hem Apple App Store hem de Google Play’de en çok indirilen uygulamalar arasına girdi. DeepSeek’in geliştirdiği yapay zeka modelleri, düşük maliyetli ve verimli hesaplama yöntemleri kullanılarak eğitildi. Bu durum, Wall Street analistleri ve teknoloji uzmanlarını ABD’nin yapay zeka yarışındaki liderliğini koruyup koruyamayacağı konusunda düşündürüyor.
Peki, DeepSeek nereden çıktı ve bu kadar kısa sürede nasıl küresel bir fenomene dönüştü?
DeepSeek’in Kökenleri: Finans Dünyasından Yapay Zekaya
DeepSeek, Çinli niceliksel hedge fonu High-Flyer Capital Management tarafından destekleniyor. High-Flyer’ın kurucusu ve yapay zeka tutkunu Liang Wenfeng, 2015 yılında Zhejiang Üniversitesi’nde öğrenciyken ticarete ilgi duymaya başladı. 2019’da High-Flyer Capital Management’ı kurarak finansal işlemlerde yapay zekadan faydalanan bir hedge fonu oluşturdu.
2023 yılında High-Flyer, finansal faaliyetlerinden bağımsız bir AI araştırma laboratuvarı olarak DeepSeek’i kurdu. Şirket, en başından itibaren kendi veri merkezi kümelerini oluşturarak yapay zeka modellerini eğitti. Ancak, ABD’nin donanım ihracat yasakları nedeniyle, DeepSeek en güçlü donanımları kullanmakta zorlanıyor. Örneğin, şirket son modelini eğitmek için ABD’deki şirketlere sunulan güçlü Nvidia H100 yerine daha düşük güçlü H800 çiplerini kullanmak zorunda kaldı.
DeepSeek’in Teknolojik Gücü
DeepSeek, Kasım 2023’te ilk modellerini tanıttı: DeepSeek Coder, DeepSeek LLM ve DeepSeek Chat. Ancak asıl dikkatleri üzerine çekmesi, 2024 ilkbaharında piyasaya sürdüğü DeepSeek-V2 serisi ile oldu. Bu model, hem metin hem de görselleri analiz edebilen genel amaçlı bir yapay zeka sistemiydi ve hem güçlü performansı hem de düşük maliyetli çalıştırılabilirliği ile sektörde ses getirdi. DeepSeek’in başarısı, Çin’in dev teknoloji şirketleri olan ByteDance ve Alibaba’yı, kendi modellerinin kullanım fiyatlarını düşürmeye veya ücretsiz hale getirmeye zorladı.
Aralık 2024’te çıkan DeepSeek-V3, şirketin adını daha da yukarı taşıdı. Şirketin iç testlerine göre DeepSeek-V3, Meta’nın Llama gibi açık kaynaklı modellerini ve OpenAI’nin GPT-4o gibi kapalı modellerini geride bıraktı.
Ocak 2025’te ise DeepSeek, “reasoning” (mantık yürütme) odaklı R1 modelini piyasaya sürdü. DeepSeek, R1’in OpenAI’nin o1 modeli kadar başarılı olduğunu iddia ediyor. R1, klasik modellerin hataya düştüğü birçok noktayı kendi kendini denetleyerek aşabiliyor. Bu nedenle özellikle fizik, bilim ve matematik gibi alanlarda daha güvenilir sonuçlar verebiliyor.
Ancak DeepSeek’in modellerinin bir dezavantajı var: Çin’de geliştirildiği için hükümetin internet düzenlemelerine tabi tutuluyor. Bu nedenle DeepSeek’in chatbot uygulaması, Tiananmen Meydanı veya Tayvan’ın bağımsızlığı gibi hassas konulara yanıt vermiyor.
DeepSeek’in İş Modeli ve Geleceği
DeepSeek’in iş modeli net değil. Şirket, ürün ve hizmetlerini piyasa değerinin çok altında fiyatlandırıyor veya tamamen ücretsiz sunuyor. DeepSeek, bu maliyet avantajını verimlilikteki yeniliklere bağlasa da bazı uzmanlar şirketin sunduğu rakamların gerçekçiliğini sorguluyor.
Buna rağmen DeepSeek’in modelleri geliştiriciler arasında büyük ilgi görüyor. Şirketin modelleri tam anlamıyla açık kaynak olmasa da ticari kullanım için izin veren esnek lisanslarla sunuluyor. Hugging Face CEO’su Clem Delangue’a göre, DeepSeek’in R1 modelinin türevleri 500’den fazla varyant ile 2,5 milyon indirmeye ulaştı.
DeepSeek’in yükselişi, yapay zeka endüstrisinde sarsıntılara yol açtı. Ocak ayında Nvidia’nın hisse fiyatında %18’lik bir düşüş yaşanmasında DeepSeek’in etkili olduğu düşünülüyor. OpenAI CEO’su Sam Altman da DeepSeek’in yükselişiyle ilgili açıklamalarda bulundu.
Microsoft, DeepSeek’i kurumsal müşteriler için geliştirdiği Azure AI Foundry hizmetine ekledi. Meta CEO’su Mark Zuckerberg ise DeepSeek’in etkisine rağmen AI altyapısına yatırım yapmanın Meta için stratejik bir avantaj olmaya devam edeceğini belirtti.
Ancak DeepSeek, bazı ülkelerde yasaklanmaya başladı. Güney Kore, DeepSeek’i tamamen yasakladı. New York eyaleti de hükümet cihazlarında DeepSeek’in kullanımını engelledi.
DeepSeek’in geleceği belirsiz olsa da daha gelişmiş modellerin çıkacağı kesin. Ancak ABD hükümeti, Çin’in yapay zeka alanındaki yükselişini dikkatle izliyor ve bu durum, şirketin küresel çapta daha fazla engellemeyle karşılaşabileceğini gösteriyor.