Meta’nın kurucusu ve CEO’su Mark Zuckerberg liderliğinde, dünyanın en büyük ve en yetenekli açık kaynaklı yapay zeka modeli olan Meta Llama 3.1 405B tanıtıldı. Meta, Llama modellerinin 300 milyondan fazla indirilmesiyle, inovasyon ve gelişim hedeflerini sürdürmeye devam ediyor.
İçindekiler
Meta Llama 3.1 özellikleri
Meta Llama 3.1 405B, genel bilgi, yönlendirilebilirlik, matematik, araç kullanımı ve çok dilli çeviri gibi alanlarda en iyi yapay zeka modelleriyle eşleşen ilk sınır seviyesindeki açık kaynaklı yapay zeka modeli olaraka karşımıza çıkıyor. Bu model, 128K bağlam uzunluğu ve güçlü muhakeme yetenekleri ile öne çıkan 8B ve 70B modellerinin yükseltilmiş versiyonlarını içermektedir. Ayrıca, uzun biçimli metin özetlemeyi, çok dilli konuşma aracılarını ve kodlama yardımcılarını destekleyen kullanım örnekleri sunuyor.
Meta Llama 3.1 405B’yi 150’den fazla kıyaslama veri kümesi ve kapsamlı insan değerlendirmeleri aracılığıyla test etti. Bu model, GPT-4 ve Claude 3.5 Sonnet gibi önde gelen yapay zeka modelleriyle rekabet edebilir düzeydedir. 405B, 16.000 H100 GPU kullanılarak 15 trilyondan fazla token üzerinde eğitilmiş ve bu da model eğitiminde büyük bir başarıyı işaret ediyor.
İlginizi Çekebilir: İlber Ortaylı ChatGPT hakkında konuştu, yapay zeka cahil kaldı!
Modelin mimarisi, stabilite için standart bir kod çözücülü transformatör modeli ve gözetimli ince ayar ile doğrudan tercih optimizasyonu içeren iteratif bir eğitim sonrası süreciyle dikkat çekiyor. Ayrıca, gelişmiş ön işleme ve kalite güvence yöntemleriyle artırılmış veri kalitesi sunuyor. Hesaplama gereksinimlerini azaltmak ve büyük ölçekli çıkarımları desteklemek amacıyla 16 bitten 8 bite kantizasyon yapılmış.
Meta, Llama modellerini daha geniş bir sistemin parçası olarak görmekte ve Llama Guard 3 ile Prompt Guard gibi bileşenlerle destekleniyor. GitHub’da araç zinciri bileşenleri ve aracı uygulamaları oluşturmak için standartlaştırılmış arayüzler seti olan “Llama Stack”i yayınlayan Meta, topluluktan geri bildirim talep ediyor.
Geliştiriciler, gerçek zamanlı ve toplu çıkarım, ince ayar ve sentetik veri üretimi gibi çeşitli görevler için 405B modelinden yararlanabiliyor. Meta, bulut çözümleri ve Groq ile Dell gibi şirketlerle optimize edilmiş çıkarım için AWS, NVIDIA ve Databricks ile ortaklık kurmuş.
Meta, kapalı modellerin aksine, Llama model ağırlıklarının indirilebilir olduğunu ve geliştiricilerin bu modelleri belirli uygulamalar için tamamen özelleştirmesine olanak tanıdığını vurgulanıyor. Llama modelleri, düşük maliyetli tokenlar sunarak yapay zekaya geniş erişim sağlıyor. Meta, kırmızı takım ve güvenlik ince ayarı gibi önlemlerle modellerinin güvenli kullanımını sağlamakta ve topluluğu, yeni güvenlik araçları ile Meta Llama 3.1’in çok dilliliğini ve genişletilmiş bağlam uzunluğunu kullanarak yeni deneyimler oluşturmaya teşvik ediyor.
Meta Llama 3.1’in tanıtımı ile birlikte Meta, Meta AI’nın yeteneklerini ve kullanılabilirliğini artıran çeşitli güncellemeler duyurdu. Meta AI artık Arjantin, Şili, Kolombiya, Ekvador, Meksika, Peru ve Kamerun dahil olmak üzere 22 ülkede erişime açık olup, Fransızca, Almanca, Hintçe, Hintçe-Romanize Yazı, İtalyanca, Portekizce ve İspanyolca dillerinde etkileşimleri desteklemekte ve daha fazla dil eklenmesi planlanıyor.
Meta AI, kullanıcıların kendilerini farklı senaryolarda görselleştirmelerine olanak tanıyan “Beni hayal et” komutları sunuyor. Bu özellik, ABD’de beta aşamasında olup, kullanıcıların fotoğraflarına ve istemlerine dayalı görseller üretebiliyor. Kullanıcılar, “Yapay Zeka ile Düzenle” düğmesiyle bu görselleri daha da özelleştirebilirler. Meta AI tarafından oluşturulan görseller artık doğrudan Facebook gönderilerinde, hikayelerinde, yorumlarında ve mesajlarında oluşturulabilir ve paylaşılabilir.
Ayrıca, Meta AI, Ray-Ban Meta akıllı gözlüklerde ve Meta Quest’te kullanıma sunulacak olup, bu cihazlarla entegre çalışarak kulaklığın eller serbest kontrolünü, gerçek zamanlı bilgi güncellemelerini ve fiziksel çevreyle etkileşimi mümkün kılacak.