Facebook’un ana şirketi Meta, geçtiğimiz hafta yayınladığı bir blog yazısıyla Voicebox’ı duyurdu. Meta’ya nazaran Voicebox “konuşma üretimi için en çok istikametli yapay zeka”. Yazılım, ses düzenleme, örnekleme, tarz oluşturma ve erişilebilirlik bahislerinde yardımcı olmak hedefiyle geliştirildi.
SESİ TAKLİT ETMESİ İÇİN İKİ SANİYE DİNLEMESİ YETİYOR
Meta tarafından geliştirilen Voicebox, bir kişinin sesini duyar duymaz tıpkı sesi taklit edebiliyor. Örneğin Voicebox’a sesinizi dinlettiğinizde, uygulama kısa müddette sesinizi tahlil edip taklit edebiliyor ve hangi metin olursa olsun o metni problemsiz olarak sizin taklit edilen sesinizle okuyabiliyor.
Şirket geliştirilen yapay zekanın güvenlik riskleri nedeniyle yayınlanmayacağını duyurdu.
Geliştirilen yapay zeka,; ChatGPT metin için, DALL-E sanat için neyse, Voicebox da ses için o manaya geliyor.
BİR KİŞİNİN SESİNİ ÜRETEBİLMESİ İÇİN DİNLEMESİ YETİYOR
Meta yeni yazılımı tanımlarken “Voicebox yüksek kaliteli ses klipleri üretebilir ve evvelden kaydedilmiş sesleri düzenleyebilir (araba kornalarını ya da köpek havlamasını kaldırmak gibi); tüm bunları yaparken sesin içeriğini ve tarzını korur” diye yazdı. “Model birebir vakitte çok lisanlı ve altı lisanda konuşma üretebiliyor.”
Model, İngilizce, Fransızca, İspanyolca, Almanca, Lehçe ve Portekizce lisanlarında 50.000 saatin üzerinde filtrelenmemiş ses kullanılarak eğitildi.
Meta’ya nazaran Voicebox %1’lik bir kusur oranı düşüşüne sahiptir.
KULLANICILAR GELEN METİN BİLDİRİLERİNİ GÖNDERENİN SESİYLE DUYABİLECEK
Meta, yazıda Voicebox’ın çeşitli misyonları yerine getirmeye yardımcı olabileceğini söylüyor, fakat en önemli kullanım durumlarını vurguluyor: bağlamsal metinden konuşmaya sentez, konuşma düzenleme ve gürültü azaltma, lisanlar ortası tarz transferi ve çeşitli konuşma örneklemesi.
Meta’nın yazısında Voicebox’ın “üretken yapay zeka araştırmamızda ileriye yanlışsız atılmış kıymetli bir adım” olduğunu belirttiği göz önüne alındığında, Voicebox’ın erişilebilirlikle ilgili çıkarımları karşısında heyecanlanmamak elde değil. Meta, duyurularının başında Voicebox’ın “görme engelli bireylerin arkadaşlarından gelen yazılı bildirileri kendi sesleriyle duymalarını sağlayabileceğini” yazarak bunu kabul ediyor.
DERİN GEÇERSİZ İÇERİKLERİN ARTMASINDAN KORKULUYOR
Forbes mecmuasının internet sitesinde yayınlanan makaleye nazaran uzmanlar yapay zeka’nin giderek artan ehemmiyeti ve kapasitesi, şuurlu bilgisayarlar tarafından köleleştirilmeye mahkum olduğumuz manasına gelmediğini belirtiyor.
Digital Trends’ten Fionna Agomuoh’un geçen hafta yayınladığı bir rapora nazaran, Meta’nın şu anda Voicebox’ı ya da kaynak kodunu halka açma üzere bir planı yok. Agomuoh’un da belirttiği üzere, FBI “derin geçersiz içerik” konusunda giderek daha fazla telaş duymaya başladı. Kolluk kuvvetleri, Agomuoh’un kıssasında yazdığı üzere, “gasp, şantaj ve taciz” içeren kabahatler konusunda vakit içinde ihtarlarda bulundu.
Meta, Voicebox’ın kamuya açılmasını engelleme kararının kısmen, yapay zeka tabanlı teknolojiler geliştirirken “açıklık ile sorumluluk ortasında hakikat dengeyi kurmanın gerekli” olmasından kaynaklandığını söyledi.