ChatGPT, yapay zekâ destekli sohbet botlarının günümüzde ulaşabileceği en yüksek seviyeyi son kullanıcıya sunmuştu. ChatGPT’yi besleyen dil modeline rakip olan dil modelleri de diğer teknoloji şirketlerinin yoğunlaştığı bir alan olmaya başlamıştı.
Bir yanda Google, kendi dil modeli LaMDA’yı geliştirmeye devam ederken geçtiğimiz hafta Meta’dan da büyük haber gelmişti. Meta, bilim dünyasına katkı sağlamayı hedefleyen dil modeli LLaMA’yı tanıtmıştı. Yalnızca bilimsel çalışmalara açık olan dil modeli, ilk haftasında sızdırıldı.
LLaMA, şimdiden isteyen herkes tarafından kullanılabilir oldu:
‘llamanon’ adlı 4chan kullanıcısı, LLaMA’nın 7 milyar ve 65 milyar parametreye sahip versiyonlarını torrent yoluyla sızdırdı. Halkın kullanımına açık olmayan dil modeli, GitHub’da yayımlanan bir kütüphane aracılığıyla erişilebilir oldu.
Kısa bir süre sonra ise GitHub’da ‘shawwn’ adlı bir kullanıcı tarafından, LLaMA’nın tüm sürümlerinin edinimi ve kullanımına dair bir kütüphane açıldı. LLaMA’nın tüm sürümleri, toplam 219 GB’lık boyuta sahip.
Tabii dil modelini verimli bir şekilde çalıştırmak için fazlasıyla yüksek işlem gücüne, dolayısıyla fazlasıyla tuzlu fiyat etiketine sahip ekran kartı donanımlarına sahip olmanız gerekiyor.
Meta, sızıntıyı internetten kaldırmak için henüz bir aksiyon almadı.
LLaMA, OpenAI’ın dil modellerine rakip olabilir mi?
LLaMA’nın sızdırılan sürümlerini indirerek testler gerçekleştiren bazı kullanıcılar, dil modelinin en az ‘davinci’ modeli kadar gelişmiş olduğunu ifade etti. OpenAI’ın davinci modeli, geçtiğimiz haftaya kadar herkesin erişebildiği ve kendi sohbet botlarını oluşturabildiği bir dil modeliydi.
Dil modelinin tam olarak ne kadar gelişmiş olduğunu henüz bilemiyoruz. Fakat öyle görünüyor ki OpenAI, bugünün ChatGPT’sini oluşturan ‘gpt-3.5-turbo’ dil modeli ise zirvede yer almaya devam ediyor.
Meta, bu dil modelini neden herkese açmadı?
ChatGPT’nin verdiği yanıtlar, dil modelinin bir şekilde kötüye kullanılabileceğinin (hatta kullanılmaya başladığının) da bir işaretiydi. Meta da devasa bir şirket olduğundan ve ismini karalamak istemediğinden aslında bu kötüye kullanımı dolaylı olarak desteklemek istemedi.
Şirket, bu nedenle dil modelini yalnızca yapay zekâ alanında çalışan bilim insanlarının kullanımına açtı. Dil modelinin amacı, daha gelişmiş gelecekte daha gelişmiş dil modellerinin geliştirilmesini sağlamak için bir temel olmak idi.
KAYNAK : Webtekno