Google I/O 2023 konferansında en yeni büyük dil modeli (LLM) olan Med-PaLM 2 ile karşımıza çıktı. PaLM 2, şirketin OpenAI’nin ChatGPT’sine rakibi olan Google’ın güncellenmiş Bard sohbet aracını güçlendirecek ve şirketin bugün duyurduğu yeni AI özelliklerinin çoğu için temel model işlevi görecek.
OpenAI’ye benzer şekilde Google, parametre sayıları da dahil olmak üzere bu yeni nesil modeli nasıl eğittiğine ilişkin pek çok teknik ayrıntı açıklamadı. Google’ın burada sağladığı tek teknik ayrıntı, PaLM 2’nin Google’ın en son JAX ve TPU v4 altyapısı üzerine inşa edilmiş olması. Bunun yerine şirket yeteneklerine odaklanmaya karar verdi. Google, yeni modelin sağduyu, matematik ve mantıkta daha iyi olduğunu söylüyor.
İlginizi Çekebilir: Google Nearby Share Tüm Kullanıcılara Sunuldu
Deepmind’den Ghahramani’nin de belirttiği gibi, şirket modeli çok sayıda matematik ve bilim metninin yanı sıra matematiksel ifadeler üzerinde eğitti. Dile odaklanan büyük dil modellerinin, üçüncü taraf eklentilere başvurmadan matematik sorularını ele almakta zorlandığı bir sır değil. Ancak Google, PaLM 2’nin matematik bulmacalarını kolayca çözebileceğini, problemler üzerinden akıl yürütebileceğini ve hatta diyagramlar sağlayabileceğini savunuyor.
PaLM 2 ayrıca artık kod yazmak ve hata ayıklamak için geliştirilmiş desteğe sahip. Model, JavaScript ve Python gibi popüler dillerin yanı sıra Prolog, Verilog ve Fortran gibi 20 programlama dilinde eğitildi. PaLM 2, Google’ın diğer şeylerin yanı sıra kod tamamlama ve oluşturma hizmetinin bir parçası olarak bugün de piyasaya sürdüğü, kodlama ve hata ayıklamaya yönelik özel modeli Codey’nin temelini oluşturuyor.
Google bugün ayrıca, PaLM 2’nin 100’den fazla dil içeren bir yapı üzerinde eğitildiğinin altını çizerek, Google’ın deyimiyle, önceki modellere göre daha incelikli ifadeler de dahil olmak üzere çok dilli görevlerde mükemmel hale getirdi.
Google, PaLM’den Codey’nin beğenilerini ve aynı zamanda şirketin tıbbi bilgiye odaklanan modeli Med-PaLM 2’yi içeren bir model ailesi olarak bahsediyor. Ayrıca, güvenlik kullanım durumlarına odaklanan bir sürüm ve akıllı telefonlarda çalışabilen daha küçük bir PaLM 2 modeli olan Sec-PaLM de va. Google, bu modelin saniyede 20 token’ı işleyebileceğini söylüyor, bu çok hızlı değil, ancak bazı kullanım durumları için kabul edilebilir.
Google’ın bu yapay zeka özelliklerini kullanıma sunma konusunda çok bilinçli bir yaklaşım benimsediği bir sır değil. Şirket aslında bunu kabul ediyor. Ancak aynı zamanda, Google temsilcilerinin bu konudaki standart sözü, şirketin bu araçları sorumlu bir şekilde ve güvenliği göz önünde bulundurarak oluşturmak istediği yönünde.