OpenAI Operator: Yapay zeka artık tarayıcıda geziyor

OpenAI, Operator isimli yeni aracını tanıttı. Bu araç, tarayıcıda gezinme ve çeşitli görevleri gerçekleştirme yeteneğine sahip. Şirket yayınladığı bir blog yazısında, bu yazılımın “Bilgisayar Kullanıcı Ajanı” (Computer-Using Agent – CUA) adı verilen bir sistemle çalıştığını belirtti. Bu yenilikçi teknoloji, grafiksel kullanıcı arayüzleri (GUI) ile etkileşim kurma konusunda insanlara benzer bir yetenek sunuyor.

OpenAI, CUA hakkında şu açıklamayı yaptı:

“CUA, insanların ekranda gördüğü butonlar, menüler ve metin alanları gibi grafiksel kullanıcı arayüzleriyle insanlarla aynı şekilde etkileşim kurmak üzere eğitildi. Bu da ona, işletim sistemi veya web’e özgü API’leri kullanmadan dijital görevleri yerine getirme esnekliği sağlıyor.”

OpenAI Operator ile neler sunuyor?

Operator’ün mevcut sürümü, OpenAI’nin GPT-4o modeline dayanıyor. Bu yeni sürüm, görsel tanıma yeteneklerini “gelişmiş muhakeme” ile birleştiriyor. Muhakeme yeteneği, pekiştirmeli öğrenme yöntemleriyle eğitilerek güçlendirilmiş durumda. Operator, görevleri “çok adımlı planlara bölme” ve karşılaşılan zorluklara “kendini adaptif olarak düzeltme” yeteneğine sahip.

OpenAI, bu özelliklerin yapay zekanın gelişiminde önemli bir dönüm noktası olduğunu savunuyor. Şirketin açıklamasına göre, Operator, dijital görevleri daha etkin bir şekilde yerine getirerek kullanıcı deneyimini yeniden tanımlamayı hedefliyor.

Her ne kadar Operator büyük bir potansiyel taşısa da OpenAI, bu aracın henüz erken aşamada olduğunu ve bazı sınırlamaları bulunduğunu açıkça belirtiyor. Şirket, Operator’ün “hala erken aşamada olduğunu ve bazı senaryolarda güvenilir performans göstermediğini” ifade ediyor. Özellikle karmaşık görevlerde ve arayüzlerde, kullanıcının daha ayrıntılı komutlar yazması, aracın performansını artırabiliyor.

The Verge’ün haberine göre, Operator bir görevde takılı kalırsa kontrolü kullanıcıya devrediyor. Ayrıca, bir web sitesi oturum açma bilgileri gibi hassas bilgiler talep ettiğinde de kontrolü kullanıcıya bırakıyor. OpenAI, bu aracı “zararlı istekleri reddetmek ve yasaklanmış içeriği engellemek” için özel olarak tasarladığını vurguluyor.

Kimler kullanabilecek?

OpenAI, Operator’ü öncelikle aylık 200 dolar fiyatla sunulan ChatGPT Pro aboneliği kullanıcılarına açıyor. Bununla birlikte, şirket, aracı Instacart gibi platformlara entegre etmek için çeşitli iş birlikleri yapıyor. Ancak bu platformlarda bile aracı test edebilmek için bir ChatGPT Pro aboneliği gerekiyor.

Operator, bir tarayıcıda veya işletim sisteminde gezinme yeteneğine sahip yapay zeka ajanlarının giderek büyüyen listesine katılıyor. Anthropic, Ekim ayında Claude 3.5 Sonnet modeliyle bu yeteneği sunan ilk şirket olmuştu. Daha sonra Google, Gemini 2.0 modeli ve Project Mariner ile bu yarışa katıldı.

İlginizi çekebilir: WhatsApp çöküşten döndü

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Total
0
Paylaş