Metanın ChatGPT Rakibi Botlar Getirecek Teknolojisi LLaMA, 1 Haftada İnternete Sızdırıldı

ChatGPT, yapay zekâ destekli sohbet botlarının günümüzde ulaşabileceği en yüksek seviyeyi son kullanıcıya sunmuştu. ChatGPT’yi besleyen dil modeline rakip olan dil modelleri de diğer teknoloji şirketlerinin yoğunlaştığı bir alan olmaya başlamıştı.

8.03.2023 23:00:24 tarihinde yayınlandı.

ChatGPT, yapay zekâ destekli sohbet botlarının günümüzde ulaşabileceği en yüksek seviyeyi son kullanıcıya sunmuştu. ChatGPT’yi besleyen dil modeline rakip olan dil modelleri de diğer teknoloji şirketlerinin yoğunlaştığı bir alan olmaya başlamıştı.

Bir yanda Google, kendi dil modeli LaMDA’yı geliştirmeye devam ederken geçtiğimiz hafta Meta’dan da büyük haber gelmişti. Meta, bilim dünyasına katkı sağlamayı hedefleyen dil modeli LLaMA’yı tanıtmıştı. Yalnızca bilimsel çalışmalara açık olan dil modeli, ilk haftasında sızdırıldı.

‘llamanon’ adlı 4chan kullanıcısı, LLaMA’nın 7 milyar ve 65 milyar parametreye sahip versiyonlarını torrent yoluyla sızdırdı. Halkın kullanımına açık olmayan dil modeli, GitHub’da yayımlanan bir kütüphane aracılığıyla erişilebilir oldu.

Kısa bir süre sonra ise GitHub’da ‘shawwn’ adlı bir kullanıcı tarafından, LLaMA’nın tüm sürümlerinin edinimi ve kullanımına dair bir kütüphane açıldı. LLaMA’nın tüm sürümleri, toplam 219 GB’lık boyuta sahip.

Tabii dil modelini verimli bir şekilde çalıştırmak için fazlasıyla yüksek işlem gücüne, dolayısıyla fazlasıyla tuzlu fiyat etiketine sahip ekran kartı donanımlarına sahip olmanız gerekiyor.

Meta, sızıntıyı internetten kaldırmak için henüz bir aksiyon almadı.

LLaMA’nın sızdırılan sürümlerini indirerek testler gerçekleştiren bazı kullanıcılar, dil modelinin en az ‘davinci’ modeli kadar gelişmiş olduğunu ifade etti. OpenAI’ın davinci modeli, geçtiğimiz haftaya kadar herkesin erişebildiği ve kendi sohbet botlarını oluşturabildiği bir dil modeliydi.

Dil modelinin tam olarak ne kadar gelişmiş olduğunu henüz bilemiyoruz. Fakat öyle görünüyor ki OpenAI, bugünün ChatGPT’sini oluşturan ‘gpt-3.5-turbo’ dil modeli ise zirvede yer almaya devam ediyor.

ChatGPT’nin verdiği yanıtlar, dil modelinin bir şekilde kötüye kullanılabileceğinin (hatta kullanılmaya başladığının) da bir işaretiydi. Meta da devasa bir şirket olduğundan ve ismini karalamak istemediğinden aslında bu kötüye kullanımı dolaylı olarak desteklemek istemedi.

Şirket, bu nedenle dil modelini yalnızca yapay zekâ alanında çalışan bilim insanlarının kullanımına açtı. Dil modelinin amacı, daha gelişmiş gelecekte daha gelişmiş dil modellerinin geliştirilmesini sağlamak için bir temel olmak idi.


Kaynak webtekno.com

 

Bilgisayardan Cep Telefonuna Kadar Pek Çok Cihazda Gördümüz Java Aslında Nedir, Ne İşe Yarar?

Bir yazılımcı ya da uygulama geliştiricisi olmasanız bile mutlaka Java nedir duymuşsunuzdur. Çünkü neredeyse kullandığımız tüm dijital cihazlarda, internete bağlı olsun ya da olmasın Java ile hazırlanmış uygulamalarla karşılaşıyoruz. Eğer bir yazılımcı ya da uygulama geliştiricisiyseniz zaten Java’ya hakim olmanız gerekiyor çünkü uzun zamandır uygulama geliştirmenin yolu Java’dan geçiyor.

Uçuşa Geçen Bitcoin, 2022deki En Yüksek Değerine Ulaştı! Peki Diğer Kripto Paralarda Durum Ne?

Bir süredir devam eden "bir ileri iki geri" hareketleriyle yatırımcıyı yoran kripto para piyasaları, yeni haftaya sert bir yükseliş dalgasıyla başladı. Uzunca bir süredir 40-45 bin dolar bandında akümüle olan Bitcoin, gece saatlerinde kendini 47 bin doların üzerine attı. Bu durum, piyasadaki neredeyse her altcoini doğrudan etkiledi. Hal böyle olunca da kripto para piyasaları, yeni haftaya yemyeşil grafiklerle başladı.