Microsoft, Saniyeler İçerisinde Herhangi Bir İnsanın Sesini Taklit Edebilen Yapay Zekâsı VALL-Eyi Tanıttı

Son zamanlarda yapay zekânın ciddi oranda geliştiğini ve popülerlik kazandığını biliyoruz. Midjourney, DALL-E gibi metinlerden görsel oluşturan sistemler ve ne sorarsak soralım yanıt veren ChatGPT gibi modeller tüm dünyada ses getirmişti. Şimdi ise Microsoft’tan yepyeni bir yapay zekâ hamlesi geldi.

12.01.2023 08:45:22 tarihinde yayınlandı.

Son zamanlarda yapay zekânın ciddi oranda geliştiğini ve popülerlik kazandığını biliyoruz. Midjourney, DALL-E gibi metinlerden görsel oluşturan sistemler ve ne sorarsak soralım yanıt veren ChatGPT gibi modeller tüm dünyada ses getirmişti. Şimdi ise Microsoft’tan yepyeni bir yapay zekâ hamlesi geldi.

ABD’li teknoloji devi, metinden ses oluşturabilen yapay zekâ modeli ‘VALL-E’yi tanıttı. Yapay zekâ konusunda çığır açabilecek sistemin, insan seslerini oldukça kolay bir şekilde taklit edebildiği ifade edildi.  Tabii bu tarz bir teknoloji bazı endişeleri de beraberinde getirdi.

Ars Technica’nın bildirdiğine  göre VALL-E, yalnızca üç saniyelik bir ses örneğini kulanarak bir insanın sesini taklit edebiliyor. Hatta yapabildiklerinin bununla sınırlı kalmadığı, yapay zekânın konuşmacının duygusuna göre çıkan ses tonuyla eşleşen sonuçları bile çıkarabildiği söyleniyor.

Microsoft, bir dil modeli olan VALL-E’nin Meta’nın Ekim 2022’de tanıttığı ‘EnCodec’ ismi verilen teknolojiden yararlandığını aktarıyor. Model, normalde gördüğümüz benzer sistemlerin aksine metinden ve seslerden faydalanarak sonuçlar çıkarıyor. Temel olarak, bir kişinin nasıl ses çıkardığını analiz ediyor, EnCodec sayesinde bu bilgiyi ayrı bileşenlere bölüyor ve eğitim verilerini eşleştiriyor. Bunun sonucunda da örnekteki ses taklit edilerek farklı cümleler ortaya çıkarılıyor.

Yapay zekâya ilişkin paylaşılan bir makale de araştırmacıların VALL-E’yi, 7.000’den fazla konuşmacıdan 60.000 saatlik İngilizce dilindeki ses kayıtları ile eğittiğini aktarıyor. Sistemin iyi bir sonuç çıkarması için de örneklerdeki sesin, eğitim verilerindeki bir sese yakın olması gerektiği söyleniyor.

İLGİLİ HABER Binlerce Yıllık Mumyalar, Yapay Zeka ile Canlandırıldı

Microsoft, VALL-E’den çıkan bazı örnekleri GitHub üzerinden yayınlandı. Örnekler incelendiğinde, yapay zekânın bazı yerlerde robot sesiyle karşımıza çıktığı görülse de bazılarında ise şaşırtıcı derecede gerçekçi olduğu görülüyor. Ayrıca örneklerde VALL-E’nin konuşmacının tonunu koruduğu; hatta ortama göre sonuç çıkardığı da görülebiliyor. Örneğin, asıl konuşmacı yankı yapan bir yerden konuşuyorsa, sistem de buna göre ses üretiyor.

Tabii ki bu tarz bir teknoloji biraz endişe verici. Kötü amaçlı kişiler, bir insanın söylemediği bir şeyi söylemiş gibi göstermesini sağlayabilir, onların kimliğine bürünebilir ve dolandırıcılık gibi olayların artmasına neden olabilir. Son zamanlarda iyice popülerleşen deepfake’in barındırdığı riskler gibi düşünebilirsiniz. Microsoft, risklerden dolayı kodu açık kaynaklı yapmamayı seçse de benzer teknolojilerin bu riskleri beraberinde getirebileceğini söyleyebiliriz.

İLGİLİ HABER Yapay Zekâ ChatGPT, Öğrencilerin Eğitimine Zarar Verdiği Gerekçesiyle Okullarda Yasaklanmaya Başladı


Kaynak webtekno.com

 

Apex Legends Mobile Yayınlandı! Grafik Kalitesi, PC Sürümünü Aratmıyor

2019 yılında çıkış yapan ve battle royale dünyasına damgasını vuran Apex Legends, devamlı gelen yeni içerikleriyle milyonlarca oyuncuya hitap etmeye devam ediyor. Fakat oyun, bugüne kadar mobil dünyada kendisini hiçbir şekilde göstermemişti. Geçtiğimiz hafta ise uzun süredir merakla beklenen mobil oyununun çıkış tarihi açıklanmıştı.

GTA 5 Hileleri: Oyunda Tüm Dengeleri Bozan 22 Şahane GTA 5 Şifresi

Rockstar Games’in uzun süredir güncellemeler ile hayatta tuttuğu GTA 5, hız kesmeden oyuncuların gözdesi olmayı sürdürüyor. Twitch platformunda GTA 5 izleyicilerinin sayısı bir hayli yüksek. Tabii bu izleyiciler genel olarak GTA 5 Online ve FiveM gibi yayınları izleseler de bazı oyuncular tek kişi GTA 5 oynamayı sevebiliyor.

Son Dakika: Discordda Yüksek Gecikme Sorunları Yaşanıyor

Arkadaşlarla oyun oynarken en çok kullanılan platform olan Discord'da şu sıralar erişim sorunları yaşanıyor. Yaşanan soruna baktığımızda platforma giriş yapılabildiği ancak API ve yüksek gecikme sorunları yer aldığı görülüyor. 

Google Translatei Daha Verimli Kullanmanızı Sağlayacak 6 Tüyo

Google Translate 100’den fazla farklı dile ücretsiz çeviri sağlayan bir çeviri hizmeti. Aynı zamanda çevrimiçi olarak kullanılan en popüler dil çeviri hizmetlerinden biri. İnternete bağlı olan herhangi bir cihazdan bağlanabileceğiniz bu sitenin hem Android hem de iOS için uygulamaları da bulunuyor.