DeepSeek, tek GPU destekli yeni yapay zeka modelini açıkladı

DeepSeek, tek GPU destekli yeni yapay zeka modelini açıkladı

Çinli DeepSeek, az donanım gereksinimiyle öne çıkan yeni yapay zeka modelini duyurdu. Model, akademik ve ticari amaçlarla kullanılabiliyor ve MIT lisansı altında sunuluyor.

Çinli yapay zeka laboratuvarı DeepSeek, daha az kaynak kullanarak yüksek performans sunan yeni modeli DeepSeek-R1-0528-Qwen3-8B’yi tanıttı. Tek bir GPU üzerinde çalışabilen bu model, rakiplerine kıyasla önemli avantajlar sağlıyor.

Model, Alibaba’nın Mayıs 2025’te tanıttığı Qwen3-8B üzerine inşa edildi ve DeepSeek, büyük R1 modelinden elde edilen verilerle küçük versiyonu eğitti. Bu sayede DeepSeek-R1-0528-Qwen3-8B, Google’ın Gemini 2.5 Flash modelini zorlu AIME 2025 matematik sınavında geride bırakırken, Microsoft’un Phi 4 Reasoning Plus modeline HMMT sınavında oldukça yaklaştı.

Genellikle küçük yapay zeka modelleri sınırlı yeteneklere sahip olurken, bu model düşük donanım ihtiyacıyla öne çıkıyor. NodeShift verilerine göre, DeepSeek’in yeni modeli yalnızca 40-80 GB RAM’e sahip tek bir Nvidia H100 GPU ile çalışabiliyor. Oysa tam boyutlu R1 modeli ortalama 12 adet 80 GB GPU gerektiriyor.

MIT lisansıyla sunulan model, ticari kullanıma açık olup Hugging Face ve LM Studio gibi platformlardan erişilebiliyor. Hem akademik hem de endüstriyel amaçlar için tasarlanan bu yapay zeka, kaynak verimliliğiyle dikkat çekiyor.

ac6605ba-642e-4582-8094-173ef2590c39.jpg

"DeepSeek, tek GPU destekli yeni yapay zeka modelini açıkladı" haberi, 29 Mayıs 2025 tarihinde yazılmıştır. 29 Mayıs 2025 tarihinde de güncellenmiştir.

YORUM YAZ

UYARI: Küfür, hakaret, rencide edici cümleler veya imalar, inançlara saldırı içeren, imla kuralları ile yazılmamış,
Türkçe karakter kullanılmayan ve büyük harflerle yazılmış yorumlar onaylanmamaktadır.