Alibaba, yapay zekâ alanındaki yatırımlarına bir yenisini ekleyerek Wan2.2-S2V adlı yeni modelini tanıttı. Tam 14 milyar parametreye sahip bu model, tek bir görsel veya ses kaydından yüksek kaliteli, sinematik videolar üretebiliyor. Üstelik GitHub üzerinden açık kaynak kodlu olarak erişime sunulmuş durumda.
Çok Yönlü Video Üretim Yeteneği
Wan2.2-S2V; portre, büst ve tam perspektif gibi farklı çerçeveleme seçenekleri sunarak gerçekçi karakter animasyonları oluşturabiliyor. Kullanıcıların verdiği komutlara göre hem karakter hareketleri hem de çevresel faktörler dinamik olarak şekillendirilebiliyor. Bu sayede yapay zekâ, daha doğal ve sinematik sahneler üretme kapasitesine kavuşuyor.
Çözünürlük ve Performans
Model, oluşturulan videoları 480p veya 720p çözünürlükte sunabiliyor. Ayrıca ses tabanlı yönlendirme ile metin kontrollü hareketleri birleştirerek, daha gerçekçi yüz ifadeleri ve hareketler oluşturuyor.
Alibaba, Wan2.2-S2V’nin en dikkat çekici yeniliklerinden birinin kare işleme tekniği olduğunu vurguluyor. Bu yöntem sayesinde rastgele uzunluktaki kareler tek bir kompakt forma sıkıştırılıyor ve böylece işlem gücü ihtiyacı önemli ölçüde azalıyor.
Gelecek Vaat Eden Teknoloji
Modelin oluşturabileceği videoların süresine ilişkin net bir bilgi paylaşılmamış olsa da, uzmanlar Wan2.2-S2V’nin özellikle yaratıcı endüstrilerde, animasyon ve kısa video üretiminde devrim yaratabileceğini düşünüyor.
#Alibaba #YapayZeka #AI #VideoProduction #CinematicAI #Wan22S2V #TechNews #ArtificialIntelligence #VideoAI #Animasyon #AçıkKaynak