Meta, Llama 3 ile açık yapay zeka gelişimini teşvik etmeyi amaçlıyor ve rakiplerinin kapalı metodolojileriyle karşılaştırıyor.
Salı günü, Meta yöneticileri, Londra’daki önde gelen bir yapay zeka etkinliğinde, organizasyonunun açık kaynaklı büyük dil modeli olan Llama 3’ün merakla beklenen bir sürümüne ilişkin ilk resmi onayı ve ek bilgileri açıkladılar.
TechCrunch’un bildirdiğine göre, Meta AI Günü Londra’da, Meta’nın küresel işler başkanı Nick Clegg, “Yeni nesil temel modellerimiz olan Llama 3’ü, bir sonraki ay içinde veya ideal olarak çok kısa bir sürede dağıtmaya başlamayı bekliyoruz,” dedi.
Clegg’e göre, Llama 3’ün yayımlanması bu yıl başlayacak ve “farklı işlevlere ve uyumluluğa sahip çeşitli modelleri” içerecek.
Llama 3’ün çıkışı, Meta’nın gelişimine önemli yatırımlar yapması nedeniyle, çıkışından itibaren mevcut en sofistike açık kaynaklı model olması bekleniyor.
Meta, modelin eğitiminde 140 milyar parametre kullandığını belirtiyor, bu da Llama 2’nin kapasitesinin iki katı. Ocak ayında, Meta CEO’su Mark Zuckerburg, belirli teknik yönler hakkında ipuçları verdi.
Zuckerberg, “Gelecek yol haritamızı desteklemek için geniş bir hesaplama altyapısı oluşturuyoruz, bunlar arasında bu yıl sonuna kadar 350.000 H100 ve diğer GPU’ları içeriyorsa neredeyse 600.000 H100 eşdeğeri hesaplama bulunuyor,” dedi.
Bu hesaplama gücü miktarı, iddiaya göre, 25.000 GPU’nun 90 ila 100 gün boyunca kullanıldığı GPT-4’ü eğitmek için OpenAI’nin kullandığından çok daha fazla.
Ayrıca, Zuckerberg, yapay zeka asistanı Meta AI’ın Llama 3 tarafından etkinleştirileceğini açıkladı. Baş Ürün Sorumlusu Chris Cox, Llama 3’ün Meta’nın genelinde entegre edileceğini belirtti.
“Cox, “Llama 3’ün, uygulama ailemiz boyunca çeşitli ürünleri ve deneyimleri beslemesi için tasarlandığını” açıkladı.
Llama 3’ün piyasaya sürülmesinin sonuçları, Meta’nın kılavuz ilkesinin, rakiplerinin ChatGPT gibi kapalı ve mülkiyet odaklı metodolojilerine keskin bir şekilde karşı olduğu bir açık kaynak prototip olarak inşa edilmesi nedeniyle Meta’nın ötesine geçmektedir.
Meta’nın Açık Yapay Zeka Gelişimine Olan Bağlılığı
Platformun açık kaynak dil modelleri ile hedefi, açık yapay zeka gelişimine uygun bir ortamın sağlanması ve Llama ailesinin, harici araştırmacılar ve geliştiriciler tarafından geliştirilen geniş bir uygulama ve araç yelpazesinin temeli olarak kurulmasıdır.
Meta’nın yapay zeka araştırmalarından sorumlu başkanı Yann LeCun, geçen ay şunları tweetledi: “Yeniliklerin, önceki katkıların üzerine inşa edildiğini ve bunların doğası gereği oldukça benzer olabileceğini kabul etmek kritiktir. Herkes için disiplinin ilerlemesini hızlandırdığı için açık araştırma bu nedenle önemlidir.”
Bu kapsayıcı felsefe şimdiden Llama’yı desteklemek için bir araya gelen dinamik bir topluluk oluşturdu.
Şu anda, Mistral, Falcon ve Beluga, en sofistike açık kaynak dil modelleri arasındadır; bunlar, Llama 2 temel modelinin geliştirilmesiyle oluşturulmuştur.
Belirli ölçütlerde, bu topluluk modellerinin bir kısmı, GPT-3.5’in performansını eşdeğer veya aşan bir performans elde etmiştir.
Llama-3’ün yayımlanması, muhtemelen AI verimliliği ve kalitesi için standartları daha da yükseltecek yeni bir LLM kuşağının yolunu açmaktadır.