OpenAI, 12 gün süren shipmas etkinliğinin son gününde en çarpıcı duyurusunu yaptı. Şirket, yılın başlarında piyasaya sürdüğü o1 “akıl yürütme” modelinin halefi olan o3 modelini tanıttı. Daha spesifik olarak, o3 bir model ailesini temsil ediyor. o3 ve belirli görevler için ince ayar yapılmış daha küçük bir model olan o3-mini bu aileye dahil. Peki OpenAI o3 özellikleri ile neler sunuyor?
OpenAI o3 özellikleri
OpenAI, o3 modelinin belirli koşullar altında Genel Yapay Zeka’ya (AGI) yaklaştığını iddia ediyor. o3, kendini etkili bir şekilde “gerçek kontrolünden” geçiriyor ve diğer modellerin sıkça düştüğü tuzaklardan kaçınmaya çalışıyor. Ancak bu süreç bir miktar gecikmeye yol açıyor. o3, tipik bir akıl yürütme içermeyen modele kıyasla çözümlere genellikle saniyelerden dakikalara kadar daha uzun bir sürede ulaşıyor. Buna karşın, fizik, bilim ve matematik gibi alanlarda daha güvenilir sonuçlar sunuyor.
o3, yanıt vermeden önce “düşünmesi” için eğitildi. OpenAI, bu süreci “özel düşünce zinciri” olarak adlandırıyor. Model, bir görevi akıl yürütme yoluyla çözebiliyor ve çözüm bulmasına yardımcı olan bir dizi eylemi önceden planlayabiliyor. Yeni gelen bir özellik ise modelin “akıl yürütme zamanını” ayarlama yeteneği. Düşük, orta veya yüksek hesaplama olarak ayarlanabilen bu süreç, daha yüksek hesaplama ayarlarında modelin daha iyi performans göstermesini sağlıyor.
OpenAI, yeni modelleriyle AGI’ye yaklaştığını iddia etti. Yapay zeka sistemlerinin yeni beceriler edinmesini değerlendiren ARC-AGI testinde, o3 modelinin yüksek hesaplama ayarında yüzde 87,5 başarı oranı elde ettiği bildirildi. Ancak bu oranın yüksek maliyetler getirdiği de not edildi.
o3, OpenAI’nin iç değerlendirmelerine göre programlama, matematik ve bilimsel alanlardaki çeşitli benchmark’larda selefi o1”en önemli ölçüte daha başarılı sonuçlar elde etti. Ancak, bu sonuçların bağımsız testlerle doğrulanması gerekiyor.
Neden o2 değil de o3?
OpenAI’nin yeni modeline neden o2 yerine o3 adını vermesi de dikkat çekiyor. The Information’a göre OpenAI, Britanya merkezli telekom sağlayıcısı O2 ile ticari marka çatışmasından kaçınmak için o2’yi atladı. CEO Sam Altman, bu sabah yaptığı canlı yayında bunu kısmen doğruladı.
Henüz o3 veya o3-mini genış çapta kullanıma sunulmadı. Ancak, güvenlik araştırmacıları bugün itibarıyla o3-mini için önizleme başvurusunda bulunabiliyor. OpenAI, o3 modelinin önizleme sürecinin daha sonra başlayacağını ve o3-mini’nin ocak ayı sonlarında piyasaya sürülmesinin, o3’ün ise onu takip etmesinin planlandığını duyurdu.
Ancak bu durum, Altman’ın son açıklamalarıyla çelişiyor.
Altman, OpenAI’nin yeni akıl yürütme modellerini piyasaya sürmeden önce federal bir test çerçevesi oluşturulmasının, bu modellerin risklerini izleme ve hafifletme konusunda rehberlik edebileceğini belirtmişti.
Akıl yürütme benimseniyor
OpenAI’nin o1 modelinin piyasaya sürülmesinin ardından, rakip yapay zeka şirketlerinden akıl yürütme modelleri dalgası geldi. Google’dan DeepSeek ve Alibaba’nın Qwen ekibi de bu alanda yeni modeller duyurdu. Ancak bu modellerin pahalı oluşu ve sürekli ilerleme sağlayıp sağlayamayacağı tartışma konusu olmaya devam ediyor.
İlginizi çekebilir: Google’ın ilk akıl yürüten yapay zeka modeli