Google, Sesli Video Üretebilen Yeni Yapay Zeka Modeli Veo 3’ü Tanıttı

Murat Altundağ - 20 Mayıs 2025 - 6 dk okuma süresi

165 0

Google, I/O 2025 etkinliğinde sesli video oluşturabilen ilk yapay zeka modeli olan Veo 3’ü tanıttı. Yeni model, dudak senkronizasyonu ve fiziksel gerçeklik konularında da dikkat çekiyor.

Yapay zekâ alanındaki ilerlemeler her geçen gün daha da etkileyici hâle gelirken, Google bu yıl düzenlenen I/O 2025 geliştirici konferansında medya üretiminde devrim niteliğinde bir adım attı. Şirketin tanıttığı yeni Veo 3 yapay zekâ modeli, metinden sesli video oluşturabilen ilk sistem olarak teknoloji dünyasında büyük yankı uyandırdı.

Veo 3, yalnızca görsel içerikler değil aynı zamanda doğal ses ortamlarını da entegre ederek çok daha gerçekçi videolar üretmeyi başarıyor. Örneğin; bir ormanda geçen sahnede kuş cıvıltıları, şehirde geçen bir sahnede ise trafik sesleri duyulabiliyor. Google, bu modelin özellikle dudak senkronizasyonu ve fiziksel dünya gerçekliği konularında önceki sürümlere göre oldukça ileri seviyede olduğunu belirtiyor.

Veo 3: Görsel-Sesli İçerik Üretiminde Yeni Dönem

Veo 3, önceki sürümlere kıyasla önemli iyileştirmelerle geliyor. Artık kullanıcılar yalnızca bir sahneyi metinle tanımlamakla kalmıyor, aynı zamanda ortam sesleri de otomatik olarak oluşturulabiliyor. Bu sayede yapay zekâ tarafından oluşturulan videolar, sinema düzeyinde bir deneyim sunabiliyor.

Model şu anda yalnızca ABD’deki Gemini Ultra abonelerine yönelik olarak Gemini uygulamasında ve Vertex AI platformunda erişime açılmış durumda. Google, ilerleyen dönemde bu teknolojiyi daha fazla ülke ve kullanıcıya ulaştırmayı hedefliyor.

Flow: Yapay Zekâ ile Sinematik Sahne Tasarımı

Veo 3’ün kullanıldığı en dikkat çekici uygulamalardan biri de Google’ın yeni film yapım aracı olan Flow platformu. Flow, Veo, Imagen ve Gemini modellerini bir araya getirerek sinema kalitesinde sahneler ve klipler üretme imkânı sunuyor. Kullanıcılar yalnızca basit bir cümleyle bir sahneyi tarif ederek, o sahneye uygun videolar oluşturabiliyorlar.

Flow ayrıca yaratıcı süreçte kullanıcıya daha fazla kontrol sunuyor. Kamera açısını değiştirme, belirli nesnelere yakınlaştırma, sahne yönünü döndürme gibi gelişmiş düzenleme araçları da sistemin bir parçası. Videoların dikeyden yatay formata çevrilebilmesi, nesne ekleme veya çıkarma gibi işlemlerin desteklenmesi de içerik üretimini oldukça esnek kılıyor.

Google, bu aracı şimdilik yalnızca ABD’deki AI Pro ve Ultra kullanıcılarına açmış durumda. Ancak yakın gelecekte Flow’un daha geniş kullanıcı kitlesine sunulması bekleniyor.

Veo 2 Hâlâ Kullanımda

Google, Veo 3’ü tanıtmış olsa da, bir önceki sürüm olan Veo 2 modelini tamamen rafa kaldırmış değil. Veo 2 hâlâ referans görsel girişleri (insan, nesne, sahne, stil gibi) üzerinden Flow ile entegre çalışarak kullanıcıların video içeriklerine yön vermesine olanak sağlıyor. Bu durum, Google’ın yapay zekâ video üretiminde kademeli gelişimi ve çok katmanlı kullanım senaryolarını destekleme vizyonunu ortaya koyuyor.

Imagen 4: Görsel Kalitede Yeni Standart

Google’ın I/O 2025’te tanıttığı bir diğer önemli yenilik ise Imagen 4 oldu. Yeni nesil görsel üretim modeli olan Imagen 4, özellikle karmaşık detayların oluşturulmasında büyük bir gelişim sağlıyor. Kumaş dokuları, hayvan tüyleri gibi ince ayrıntılar fotogerçekçi netlikle modellenebiliyor.

Imagen 4 ayrıca tipografi oluşturma konusunda da önceki sürüme göre büyük bir iyileştirme sunuyor. Model, farklı en-boy oranlarında ve 2K çözünürlüğe kadar yüksek kaliteli görseller üretebiliyor. Imagen 4 şu anda Gemini uygulaması, Vertex AI ve Google Workspace uygulamaları (Docs, Slides) üzerinden kullanılabiliyor. Google ayrıca Imagen 4’ün, Imagen 3’e kıyasla 10 kat daha hızlı çalışan özel bir sürümünü de kısa süre içinde kullanıcılara sunacağını açıkladı.

Yapay Zekâ İçerik Üretiminde Yeni Dönem Başlıyor

Google’ın I/O 2025 etkinliğinde tanıttığı Veo 3, Flow ve Imagen 4 gibi yenilikler, içerik üretiminde yapay zekânın geldiği noktayı gözler önüne seriyor. Artık yalnızca metinle değil, sesle, görüntüyle ve gelişmiş kamera kontrolleriyle entegre çalışan sistemler sayesinde kullanıcılar tam anlamıyla sinematik içerikler oluşturabiliyor. Özellikle video prodüksiyon, dijital pazarlama ve medya sektörlerinde bu gelişmelerin çok kısa sürede büyük değişimler yaratması bekleniyor.

Google, bu yenilikleri önce profesyonel ve kurumsal kullanıcılarla buluşturmayı planlasa da, yakın gelecekte daha geniş kitlelerin bu gelişmiş yapay zekâ araçlarına erişmesi kaçınılmaz görünüyor.

Daha fazla güncel haberler için Sinetech.tr’yi takip etmeye devam edin.

Murat Altundağ

27 yaşında, yıllardır özgün içerik hazırlayıp piyasaya yönveren iyi kalpli bir adamım. Sinetech'i bir marka değeri yapmak için sonuna kadar çabalayacağım.