OpenAI, insan benzeri yapay zekaya doğru önemli bir adım daha attı ve akıl yürütme yetenekleriyle öne çıkan yeni modeli OpenAI o1’i duyurdu. Bu model, karmaşık soruları hızla yanıtlamak üzere eğitildi ve şirketin planladığı bir dizi akıl yürütme modelinin ilki olma özelliğini taşıyor. O1, daha küçük ve daha ekonomik bir versiyon olan o1-mini ile birlikte piyasaya sürülüyor. Model, yapay zeka dünyasında “Strawberry” olarak bilinen ve bir süredir konuşulan sistemin gerçeğe dönüşmüş hali olarak karşımıza çıkıyor.
İçindekiler
OpenAI o1 özellikleri neler?
OpenAI için o1, insan benzeri yapay zeka geliştirme yolunda atılan bir başka büyük adım. Bu model, özellikle kod yazma ve çok adımlı problem çözme konusunda önceki GPT modellerine göre daha başarılı sonuçlar sunuyor. Ancak daha gelişmiş akıl yürütme yeteneklerine rağmen o1, GPT-4o’ya kıyasla daha pahalı ve kullanımı daha yavaş bir model olarak öne çıkıyor. Bu yüzden OpenAI, o1’i henüz “önizleme” aşamasında olduğunu vurgulayarak piyasaya sürüyor.
İlginizi Çekebilir: Türkiye yapay zeka devrimi yaptı! Hukukçu yapay zeka tanıtıldı!
ChatGPT Plus ve Team kullanıcıları, o1-preview ve o1-mini’ye bugünden itibaren erişebilirken, Enterprise ve Edu kullanıcıları ise bu modellere önümüzdeki hafta başında erişim sağlayabilecekler. OpenAI, gelecekte ChatGPT’nin tüm ücretsiz kullanıcılarına da o1-mini erişimi sunmayı planladığını, ancak henüz kesin bir tarih belirlemediğini açıkladı.
Geliştiriciler için o1’in API erişimi oldukça maliyetli; o1-preview modeli, 1 milyon girdi belirteci başına 15 dolar ve 1 milyon çıktı belirteci başına 60 dolar maliyetle sunuluyor. Karşılaştırma yapmak gerekirse, GPT-4o’nun aynı işlem maliyeti sırasıyla 5 dolar ve 15 dolar.
Önceki GPT modellerinde, sistemlerin eğitim verilerindeki kalıpları taklit etmeleri sağlanmıştı. O1 ile ise, OpenAI yeni bir yaklaşım deniyor: takviyeli öğrenme. Bu teknik, modeli ödüller ve cezalar yoluyla eğiterek, sorunları kendi başına çözebilmesini sağlıyor. Model, gelen soruları işlerken insanların sorunları adım adım inceleme biçimini andıran bir “düşünce zinciri” kullanıyor. Bu sayede, o1 karmaşık problemleri daha iyi analiz edip çözebiliyor ve çözüm sürecini kullanıcıya açıklayabiliyor.
OpenAI’ye göre, o1’in GPT-4o’dan en büyük farkı kodlama, matematik ve benzeri karmaşık problemleri daha etkili çözebilmesi ve bu süreçte mantığını açıklayabilmesi. OpenAI’nin baş araştırma görevlisi Bob McGrew, modelin AP matematik testlerinde kendisinden daha iyi performans gösterdiğini ve üniversitede matematik bölümünden mezun olduğunu belirterek, modelin başarısını vurguladı. O1, Uluslararası Matematik Olimpiyatı eleme sınavında test edildiğinde, GPT-4o problemlerin sadece %13’ünü doğru çözerken, o1 %83 başarı oranı yakaladı.
O1, programlama becerilerini test eden çevrimiçi yarışmalar olan Codeforces yarışmalarında katılımcıların 89. yüzdelik dilimine ulaşarak büyük bir başarıya imza attı. OpenAI, modelin bir sonraki güncellemesiyle fizik, kimya ve biyoloji gibi zorlu bilimsel görevlerde doktora öğrencilerine benzer performans göstereceğini iddia ediyor.
Ancak, o1’in henüz GPT-4o kadar başarılı olamadığı alanlar da var. Örneğin, dünya hakkında gerçek bilgiler konusunda o kadar yetkin değil ve şu anda web’de gezinme, dosya işleme veya görüntüleri analiz etme gibi özelliklere sahip değil. Buna rağmen, OpenAI bu modelin tamamen yeni bir yetenek sınıfını temsil ettiğine inanıyor ve adını “sayacı 1’e geri döndürmek” anlamında o1 olarak belirlemiş.
OpenAI, şu sıralar 150 milyar dolarlık bir değerleme ile daha fazla fon toplamayı hedeflerken, o1’in başarısının şirketin araştırma atılımlarına hız kazandırabileceği düşünülüyor. Şirket, yapay zeka modellerine muhakeme yetenekleri kazandırarak gelecekte otonom sistemler veya aracılar geliştirmeyi planlıyor; bu sistemler kullanıcılar adına kararlar alabilecek ve eylemlerde bulunabilecek.
Yapay zeka araştırmacıları, akıl yürütmenin kırılması halinde yapay zekanın insan seviyesinde zekaya bir adım daha yaklaşacağını ve bu tür bir gelişmenin tıp, mühendislik gibi birçok alanda devrim yaratabileceğini öngörüyor. Ancak, o1’in akıl yürütme yetenekleri şimdilik yavaş, ajan benzeri özelliklerden uzak ve geliştiriciler için oldukça maliyetli. Bu nedenle, teknoloji topluluğu yeni modelin daha ileri sürümlerini beklerken, o1’in nasıl evrileceği merak konusu.