DeepSeek, tek GPU ile çalışabilen yeni modelini tanıttı

DeepSeek, Yeni Yapay Zeka Modeli DeepSeek-R1-0528-Qwen3-8B’yi Tanıttı

Çinli yapay zeka laboratuvarı DeepSeek, daha az kaynak kullanarak yüksek performans sağlayan yeni modeli DeepSeek-R1-0528-Qwen3-8B’yi duyurdu. Bu model, sadece tek bir GPU üzerinde çalışabiliyor ve diğer modellere kıyasla önemli avantajlar sunuyor.

DeepSeek’in yeni modeli, temelini Alibaba’nın Mayıs 2025’te tanıttığı Qwen3-8B modelinden almıştır. Laboratuvar, büyük R1 modelinden elde ettiği verilerle bu küçük versiyonu eğitmeyi başardı. Bu yöntemle geliştirilen model, Google’ın Gemini 2.5 Flash modelini içeren zorlu matematik testlerinden biri olan AIME 2025’te başarılı oldu. Ayrıca Microsoft’un Phi 4 Reasoning Plus modeline, HMMT sınavında da oldukça yakın bir performans sergiledi.

Küçük yapay zeka modelleri genellikle sınırlı becerilere sahip olsa da, DeepSeek-R1-0528-Qwen3-8B’nin dikkat çekici yanı düşük donanım gereksinimidir. NodeShift’in verilerine göre, bu model 40 ila 80 GB RAM’e sahip tek bir Nvidia H100 GPU ile çalışabiliyor. Oysa tam boyutlu R1 modeli, yaklaşık 12 adet 80 GB’lık GPU gerektiriyor.

Model, MIT lisansı ile ticari kullanıma sunulmuştur ve Hugging Face ve LM Studio gibi platformlardan erişilebilir durumdadır. Bu yapay zeka modeli, akademik ve endüstriyel alanda kullanım için tasarlanmıştır.

Related Posts

WhatsApp’a unutkanları sevindirecek özellik geldi

Dünya üzerinde 2 milyardan fazla kullanıcı ile en popüler mesajlaşma uygulaması olan WhatsApp, kullanıcı deneyimini iyileştirmeye yönelik bir yenilik üzerinde daha çalışıyor… Çok yakında herkese sunulması beklenen özellik, ‘unutkan’ kullanıcıları oldukça sevindirecek…

ChatGPT’ye yeni özellikler getirildi

ChatGPT için bazı yeni özellikler getirildi. Bu özellikler daha çok kurumsal müşteriler için oluyor.

Toyota’da geri çağırma alarmı: Binlerce araçta fren ve vites sistemlerinde ciddi risk

Dünyaca ünlü otomotiv devi Toyota, son günlerde araçlarındaki teknik arızalar nedeniyle geri çağırma işlemleriyle gündeme geliyor. Japon markası, bu kez iki amiral gemisi modelini güvenlik sorunları nedeniyle geri çağırma kararı aldı.

Beyin-bilgisayar arayüzü teknolojisi ilk kez bir insana yerleştirildi

Nöroteknoloji geliştikçe şirketlerin sunduğu teknolojiler de çeşitleniyor. Paradromics tarafından geliştirilen beyin-bilgisayar arayüzü teknolojisi ilk kez bir insana başarıyla yerleştirildi.

NASA’nın keşfettiği cisim şaşkınlık yarattı

NASA bilim insanları, Samanyolu galaksisinde Dünya’dan 15 bin ışık yılı uzaklıkta tanımlanamayan bir gök cismi keşfetti. Cismin doğası hâlâ gizemini koruyor.

Bilim insanları duyurdu: D vitamini yaşlanmayı yavaşlattı

Yeni bir araştırma, D vitamini takviyesinin kromozom uçlarındaki telomerleri koruyarak biyolojik yaşlanmayı yavaşlatabileceğini ortaya koydu. 5 yıl süren çalışmada, D3 vitamini alan katılımcılarda telomer kısalmasının plaseboya göre yüzde 30 daha az olduğu ve bunun yaklaşık 3 yıllık yaşlanma gecikmesine denk geldiği belirlendi.