Microsoft’un yapay zeka aracı, fotoğrafları konuşan ve şarkı söyleyen insanların gerçekçi videolarına dönüştürebiliyor

Ancak geliştiricilerin kendileri de bunun kötüye kullanılma potansiyeline sahip olduğunu kabul ediyor.

Microsoft Research Asia, bir kişinin hareketsiz görüntüsünü – ya da çizimini – ve mevcut bir ses dosyasını alarak bunlardan gerçek zamanlı olarak gerçekçi bir konuşan yüz yaratabilen VASA-1 adlı yeni bir deneysel yapay zeka aracını tanıttı. Mevcut bir hareketsiz görüntü için yüz ifadeleri ve baş hareketleri ve bir konuşma veya şarkıya uyacak uygun dudak hareketleri üretme yeteneğine sahiptir. Araştırmacılar proje sayfasına bir sürü örnek yüklediler ve sonuçlar insanları gerçek olduklarına inandırabilecek kadar iyi görünüyor.

Örneklerdeki dudak ve baş hareketleri daha yakından incelendiğinde hala biraz robotik ve senkronizasyon dışı görünse de, teknolojinin gerçek insanların deepfake videolarını kolayca ve hızlı bir şekilde oluşturmak için kötüye kullanılabileceği açıktır. Araştırmacıların kendileri de bu potansiyelin farkında ve teknolojilerinin “sorumlu bir şekilde ve uygun düzenlemelere uygun olarak kullanılacağından” emin olana kadar “çevrimiçi bir demo, API, ürün, ek uygulama ayrıntıları veya ilgili teklifleri” yayınlamamaya karar verdiler. Bununla birlikte, kötü aktörlerin bunları deepfake porno veya yanlış bilgilendirme kampanyaları oluşturmak gibi hain amaçlarla kullanmasını önlemek için belirli önlemler almayı planlayıp planlamadıklarını söylemediler.

Araştırmacılar, kötüye kullanım potansiyeline rağmen teknolojilerinin bir ton faydası olduğuna inanıyor. Bu teknolojinin eğitimde eşitliği artırmanın yanı sıra, iletişim güçlüğü çekenlerin kendileri için iletişim kurabilecek bir avatara erişimlerini sağlayarak erişilebilirliği artırmak için de kullanılabileceğini söylediler. Ayrıca, VASA-1’in insanların konuşabileceği yapay zeka karakterlerine erişim sunan programlarda kullanılabileceğini ima ederek, ihtiyaç duyanlar için arkadaşlık ve terapötik destek sağlayabileceğini söylediler.

Duyuru ile birlikte yayınlanan makaleye göre VASA-1, YouTube videolarından çıkarılan “6.112 ünlü için 1 milyondan fazla ifade” içeren VoxCeleb2 Veri Kümesi üzerinde eğitildi. Araç gerçek yüzler üzerinde eğitilmiş olsa da, araştırmacıların Anne Hathaway’in Lil Wayne’in Paparazzi şarkısının viral yorumunun ses dosyasıyla eğlenceli bir şekilde birleştirdiği Mona Lisa gibi sanatsal fotoğraflar üzerinde de çalışıyor. O kadar keyifli ki, böyle bir teknolojinin ne kadar iyi olabileceğinden şüphe duysanız bile izlemeye değer.

Related Posts

NASA, uzay istasyonunda mahsur kalan astronotların önümüzdeki Şubat ayında geri döneceğini duyurdu
  • CylxCylx
  • Ağustos 30, 2024

NASA, Uluslararası Uzay İstasyonu’nda (ISS) mahsur kalan iki astronotun Şubat 2025’te SpaceX ile Dünya’ya döneceğini açıkladı. Pilot Sunita “Suni” Williams ve Komutan Barry “Butch” Wilmore 5 Haziran’da Boeing’in yeni uzay…

Okumaya Devam Et
Sosyal medya platformu X kısa süreli kesintinin ardından tekrar hayata döndü
  • CylxCylx
  • Ağustos 30, 2024

Kesinti takip sitesi Downdetector.com’a göre sosyal medya platformu X, bir saatten kısa süren bir kesintinin ardından yeniden faaliyete geçti. Kullanıcılar da dahil olmak üzere çeşitli kaynaklardan gelen durum raporlarını harmanlayarak…

Okumaya Devam Et

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Bunları Kaçırmayın

NASA, uzay istasyonunda mahsur kalan astronotların önümüzdeki Şubat ayında geri döneceğini duyurdu

  • By Cylx
  • Ağustos 30, 2024
  • 1 views
NASA, uzay istasyonunda mahsur kalan astronotların önümüzdeki Şubat ayında geri döneceğini duyurdu

Call of Duty: Black Ops 6″nın beta sürecindeki heyecan verici yeni modunu kaçırmayın!

  • By Cylx
  • Ağustos 30, 2024
  • 1 views
Call of Duty: Black Ops 6″nın beta sürecindeki heyecan verici yeni modunu kaçırmayın!

Control ve Alan Wake yeni anlaşmayla film ve TV uyarlamalarına kavuşacak

  • By Cylx
  • Ağustos 30, 2024
  • 0 views
Control ve Alan Wake yeni anlaşmayla film ve TV uyarlamalarına kavuşacak

Microsoft’un yapay zeka aracı, fotoğrafları konuşan ve şarkı söyleyen insanların gerçekçi videolarına dönüştürebiliyor

  • By Cylx
  • Ağustos 30, 2024
  • 2 views
Microsoft’un yapay zeka aracı, fotoğrafları konuşan ve şarkı söyleyen insanların gerçekçi videolarına dönüştürebiliyor

Sosyal medya platformu X kısa süreli kesintinin ardından tekrar hayata döndü

  • By Cylx
  • Ağustos 30, 2024
  • 1 views
Sosyal medya platformu X kısa süreli kesintinin ardından tekrar hayata döndü

Telegram CEO’su Pavel Durov, Fransa’dan çıkış yasağı ve 5 milyon euro kefalet şartıyla serbest bırakıldı

  • By Cylx
  • Ağustos 30, 2024
  • 1 views
Telegram CEO’su Pavel Durov, Fransa’dan çıkış yasağı ve 5 milyon euro kefalet şartıyla serbest bırakıldı