Google, geliştiricilere yönelik yapay zeka modelleri serisi Gemma’nın en yeni üyesi Gemma 3’ü duyurdu. Şirket, bu modelin tek bir GPU yahut TPU üzerinde çalıştırılabilecek en güçlü yapay zeka modeli olduğunu argüman ediyor. Gemma 3, sadece metin değil, birebir vakitte imgeleri ve kısa görüntüleri da tahlil edebilme yeteneğiyle öne çıkıyor.
Gemma 3 ile daha geniş kullanım alanı
Gemma serisi, Google’ın Gemini AI teknolojisi temel alınarak geliştirildi. Şirketin blog paylaşımına nazaran, Gemma 3’ün en büyük avantajlarından biri, geniş bir donanım yelpazesinde çalışabilmesi. Akıllı telefonlardan iş istasyonlarına kadar farklı platformlarda kullanılabilen model, 35’ten fazla lisanı destekliyor ve çok taraflı tahlil yetenekleri sunuyor.
Google, yeni modelin Facebook’un Llama’sı, DeepSeek ve OpenAI üzere rakiplerinden daha düzgün performans gösterdiğini belirtiyor. Bilhassa tek bir hızlandırıcı (GPU) üzerinde çalıştırıldığında, Gemma 3’ün rakiplerine kıyasla daha yüksek randıman sunduğu söz ediliyor. Nvidia’nın GPU’ları ve özel AI donanımları için optimize edilen model, geliştiricilere maliyet ve donanım açısından daha erişilebilir bir tahlil sunmayı hedefliyor.
Gemma 3’ün evvelki sürümlerine kıyasla en kıymetli güncellemelerinden biri, gelişmiş görsel yorumlama yeteneği. Yüksek çözünürlüklü ve farklı oranlardaki imgeleri işleyebilen yeni bir görsel kodlayıcıya sahip olan model, yapay zekanın çok modlu bilgi sürece yeteneklerini bir adım daha ileriye taşıyor. Bir öbür değerli avantaj ise Gemma’nın 140’tan fazla lisanı desteklemesi ve bunların 35’inin evvelden eğitilmiş bir paketin modülü olması.
Çok taraflı ve kullanıma hazır
Öte yandan Gemma 3, Gemini 2.0 modellerine güç veren birebir araştırma ve teknolojiden üretildi ve 1B, 4B, 12B ve 27B boyutlarında mevcut. 128k-token’lık bir bağlam penceresi içeriyor ve karmaşık vazifeler için işlev çağırmayı destekliyor. Bu da yaklaşık 30 yüksek çözünürlüklü manzara, yaklaşık 200 sayfalık bir kitap yahut bir saat yahut daha fazla görüntüyü işleyebileceği manasına geliyor; yani GPT-4o ile benzeri bağlam uzunlu var. Bununla birlikte, Google güvenlik konusunda da değerli adımlar atmış durumda. Yeni ShieldGemma 2 görsel güvenlik sınıflandırıcısı, modelin girdi ve çıktılarını tahlil ederek cinsel içerikli, tehlikeli yahut şiddet içeren görselleri filtreleyebiliyor.
Google’a nazaran Gemma serisi “açık” AI modelleri olarak tanımlasa da, tam manasıyla açık kaynak olup olmadığı hâlâ tartışmalı bir mevzu. Şirketin lisans şartları, kullanıcıların modeli hangi gayelerle kullanabileceğine dair kısıtlamalar içeriyor. Gemma 3 ile birlikte bu lisans siyasetlerinde rastgele bir değişiklik yapılmadığı belirtiliyor.
Gemma 3 modellerini halihazırda Google AI Studio ile direkt tarayıcınızda kullanıp deneyebilir, API’ye erişebilir, Hugging Face, Ollama yahut Kaggle’dan indirebilirsiniz.
Bir yanıt bırakın