Google'ın yeni yapay zeka aracı Gemini 1.5'te hangi yenilikler var?

1 Tem 2024

3 dk okuma süresi

Geniş veri setleri üzerinde eğitilerek insan benzeri metinler üretebilen geniş dil modelleri (LLM), yapay zekâdan destek alarak dilin karmaşıklığını ve bağlamını anlamak için milyarlarca kelime içeren metinleri analiz ediyor ve öğreniyor. Bu sayede doğal dil işleme (NLP) yetenekleriyle metin tamamlama, çeviri, soru yanıtlama gibi çeşitli görevleri başarıyla yerine getirebiliyorlar.

Büyük dil modelleri, üretken yapay zekânın temelini oluşturuyor. ChatGPT’nin geliştiricisi OpenAI, GPT serisiyle modern LLM döneminin başlamasına neden oldu. Çok modlu yapay zekâ çözümü olan GPT-4o, metin, resim ve ses içeriklerini anlayabiliyor ve bu formatlarda yanıt üretebiliyor. Üstelik tüm bunları önceki sürümlerden daha az maliyetle ve daha yüksek performansla gerçekleştiriyor.

Yapay zekâ dünyasında ChatGPT’nin başarısıyla beraber ciddi bir rekabet ortamı oluşmaya başladı. Google Aralık 2023'te Gemini çok modlu yapay zekâ ailesini duyurdu ve o tarihten bu yana bu aileyi yeniliyor. İlk olarak Şubat 2024'te duyurulan Gemini 1.5 Pro modeli, Mayıs 2024'teki Google I/O konferansında tanıtıldı.

Gemini 1.5 Pro nedir?

Google'ın Ultra, Pro ve Nano modellerinden oluşan Gemini 1.0'ın Aralık 2023'teki ilk çıkışının devamı niteliğinde olan Gemini 1.5 Pro'nun ilk önizlemesi Şubat 2024'te yapıldı. Tüm 1.0 modellerine göre daha iyi performans ve daha fazla veriye ulaşabilme becerisine sahip olan Gemini 1.5 Pro, selefinden farklı olarak metin, resim, ses ve video işleyebiliyor. Bu sayede Gemini 1.5 Pro kullanıcıları, metin oluşturmak, soruları yanıtlamak ve çeşitli içerik biçimlerini analiz etmek amacıyla farklı yöntemler kullanabiliyor. Örneğin Gemini 1.5 Pro bir görsel paylaşarak resimdeki objelerin neler olduğunu öğrenmek mümkün.

Gemini 1.5 Pro güncellemesi neler getiriyor?

Google, Gemini 1.5 Pro güncellemesiyle popüler yapay zekâ modelinde bir dizi iyileştirme yaptı. Bunların başında ise çeviri, kodlama ve muhakeme gibi yeteneklerde yaşanan performans artışı geliyor. Artık Gemini, bir önceki modele nazaran daha fazla bağlama sahip olmasına karşın daha yüksek performans vadediyor.

Gemini 1.5 Pro’nun çok modlu yetenekleri, yapay zekânın dikkat çeken bir diğer özelliği olarak ön plana çıkıyor. Önceki modellere göre gelişmiş görüntü ve video anlama kabiliyetine sahip olan Gemini 1.5 Pro, ses girişlerini doğrudan işleyebiliyor. Harici kaynaklardan gelen videoları da analiz edebilen Gemini 1.5 Pro, böylece daha geniş ve pratik bir kullanım süreci vadediyor.

Gemini 1.5 Pro, resim veya metin gibi yapılandırılmamış verilerden yapılandırılmış çıktı olarak JSON (JavaScript Object Notation) nesneleri üretebiliyor. Bu özellik programlamayla uğraşan kullanıcılar için büyük önem taşıyor.

Kullanıcıların Google’ın en yetenekli yapay zekâ modellerine ve özelliklerine ulaşmasını sağlayan Gemini Advanced de Gemini 1.5 Pro ile beraber güncellendi. Artık Gemini Advanced ile kullanıcılar, veri analizi ve görselleştirmeler için dosyaları doğrudan Google Drive'dan yükleyebiliyor. Bu da süreçlerin daha pratik bir hale gelmesini sağlıyor. Gemini 1.5 Pro ayrıca kullanıcıların Gemini AI'ın belirli görevlere ve kişisel tercihlere göre özelleştirilmiş sürümlerini oluşturmasına olanak tanıyan Gems adlı özelliği de sunuyor. Böylece kullanıcılar Gemini 1.5 Pro’yu kendi özel ihtiyaçlarına göre kişiselleştirerek yapay zekâdan en yüksek faydayı elde edebiliyor. Gems’e ek olarak tanıtılan Gemini Live da temelde doğal bir mobil konuşma deneyimi vadediyor. Gemini Live, soruları yarıda kesmeyi ve yeni konuşma başlatmayı mümkün kılıyor. Gemini’yi daha sezgisel bir seviyeye taşıyan Gemini Live, Gemini Advanced abonelerine özel olarak önümüzdeki aylarda yayınlanacak.

Ücretlendirme ve diğer Gemini modelleri

Google’ın yeni çok modlu yapay zekâ çözümü hem ücretsiz hem de ücretli bir seçenekle kullanıcıların beğenisine sunulacak. Ücretsiz versiyonda dakikada 2 istek oluşturulabilecek ve gün boyu toplamda 50 istek sınırı bulunacak. Ücretlide ise boyutu 128K'ya kadar olan istemler için fiyat 1 milyon token başına 3,50 dolar olurken 128K'dan uzun istemler için 1 milyon token başına 7 dolara kadar çıkıyor.

Gemini 1.5'in daha uygun fiyatlı bir versiyonu olan Gemini 1.5 Flash, daha az optimize edilmiş ve daha az yetenekli bir sürüm olarak tasarlanıyor. Gemini 1.5 Flash’da 128K’ya kadar istemlerin maliyeti 1 milyon token başına 0,35 dolar ve daha büyük istemlerin maliyeti ise 1 milyon token başına 0,70 dolar olarak belirtiliyor.

İlgili Postlar