Meta’nın ChatGPT Rakibi Teknolojisi LLaMA, İnternete Sızdı

8 Mart 2023

18

ChatGPT, yapay zekâ destekli sohbet botlarının günümüzde ulaşabileceği en yüksek seviyeyi son kullanıcıya sunmuştu. ChatGPT’yi besleyen dil modeline rakip olan dil modelleri de diğer teknoloji şirketlerinin yoğunlaştığı bir alan olmaya başlamıştı.

Bir yanda Google, kendi dil modeli LaMDA’yı geliştirmeye devam ederken geçtiğimiz hafta Meta’dan da büyük haber gelmişti. Meta, bilim dünyasına katkı sağlamayı hedefleyen dil modeli LLaMA’yı tanıtmıştı. Yalnızca bilimsel çalışmalara açık olan dil modeli, ilk haftasında sızdırıldı.

LLaMA, şimdiden isteyen herkes tarafından kullanılabilir oldu:

‘llamanon’ adlı 4chan kullanıcısı, LLaMA’nın 7 milyar ve 65 milyar parametreye sahip versiyonlarını torrent yoluyla sızdırdı. Halkın kullanımına açık olmayan dil modeli, GitHub’da yayımlanan bir kütüphane aracılığıyla erişilebilir oldu.

Kısa bir süre sonra ise GitHub’da ‘shawwn’ adlı bir kullanıcı tarafından, LLaMA’nın tüm sürümlerinin edinimi ve kullanımına dair bir kütüphane açıldı. LLaMA’nın tüm sürümleri, toplam 219 GB’lık boyuta sahip.

Tabii dil modelini verimli bir şekilde çalıştırmak için fazlasıyla yüksek işlem gücüne, dolayısıyla fazlasıyla tuzlu fiyat etiketine sahip ekran kartı donanımlarına sahip olmanız gerekiyor.

Meta, sızıntıyı internetten kaldırmak için henüz bir aksiyon almadı.

LLaMA, OpenAI’ın dil modellerine rakip olabilir mi?

LLaMA’nın sızdırılan sürümlerini indirerek testler gerçekleştiren bazı kullanıcılar, dil modelinin en az ‘davinci’ modeli kadar gelişmiş olduğunu ifade etti. OpenAI’ın davinci modeli, geçtiğimiz haftaya kadar herkesin erişebildiği ve kendi sohbet botlarını oluşturabildiği bir dil modeliydi.

Dil modelinin tam olarak ne kadar gelişmiş olduğunu henüz bilemiyoruz. Fakat öyle görünüyor ki OpenAI, bugünün ChatGPT’sini oluşturan ‘gpt-3.5-turbo’ dil modeli ise zirvede yer almaya devam ediyor.

Meta, bu dil modelini neden herkese açmadı?

ChatGPT’nin verdiği yanıtlar, dil modelinin bir şekilde kötüye kullanılabileceğinin (hatta kullanılmaya başladığının) da bir işaretiydi. Meta da devasa bir şirket olduğundan ve ismini karalamak istemediğinden aslında bu kötüye kullanımı dolaylı olarak desteklemek istemedi.

Şirket, bu nedenle dil modelini yalnızca yapay zekâ alanında çalışan bilim insanlarının kullanımına açtı. Dil modelinin amacı, daha gelişmiş gelecekte daha gelişmiş dil modellerinin geliştirilmesini sağlamak için bir temel olmak idi.

KAYNAK : Webtekno

Tags
Meta

Önceki İçerik

ChatGPT’ye Rakipler Gelecek: Meta, LLaMA Modelini Duyurdu

Sonraki İçerik

Tarihi Değiştiren Marka Nokia Neden Battı? Tutunamayanlar #1

Buy now

Meta’nın ChatGPT Rakibi Teknolojisi LLaMA, İnternete Sızdı

Related Articles

How to Think and Act in the Plummeting Stock Market

The Real Economy Has Never Been Tested by a Pandemic

More and More People Stay Home as Coronavirus Spreads

CEVAP VER

Latest Articles

How to Think and Act in the Plummeting Stock Market

The Real Economy Has Never Been Tested by a Pandemic

More and More People Stay Home as Coronavirus Spreads

Witnessing the Birth of the New Coronavirus Economy

Companies Are Putting Profits Ahead of Public Health

Buy now

Meta’nın ChatGPT Rakibi Teknolojisi LLaMA, İnternete Sızdı

Related Articles

CEVAP VER

Stay Connected

Latest Articles