Şirket, kullanıcıların tek bir görüntüden video oluşturmasına olanak tanıyan Stable Video Diffusion adlı yeni bir ürünü araştırma ön izlemesinde yayınladı. Şirket, “Bu son teknoloji ürünü üretken yapay zeka video modeli, her türden herkese yönelik modeller oluşturmaya yönelik yolculuğumuzda önemli bir adımı temsil ediyor” diye yazdı.
Yeni araç, her biri 576 × 1024 çözünürlükte saniyede 3 ila 30 kare arasındaki hızlarda 14 ila 25 kare uzunluğunda üretebilen iki görüntüden videoya model biçiminde piyasaya sürüldü. Çoklu görüntü veri kümelerinde ince ayar yaparak tek bir kareden çoklu görüntü sentezi yapma kapasitesine sahip.
Stabil Video Difüzyonu bu noktada yalnızca araştırma amaçlı olarak mevcut ve gerçek dünya veya ticari uygulamalar için mevcut değil. Stabilite AI, potansiyel kullanıcıların “metinden videoya arayüz içeren yaklaşan web deneyimine” erişim için bir bekleme listesine kaydolmak üzere kaydolabileceğini yazdı. Araç, reklamcılık, eğitim, eğlence ve daha fazlasını içeren sektörlerdeki potansiyel uygulamaları sergileyecek.
Yapay zeka sanata da yön verecek
Yukarıdaki videoda gösterilen örnekler, rakip üretim sistemleriyle eşleşen nispeten yüksek kalitede görünüyor. Ancak şirket, bazı sınırlamaları olduğunu yazdı: nispeten kısa video üretiyor (4 saniyeden az), mükemmel fotogerçekçilikten yoksun, yavaş kaydırmalar dışında kamera hareketi yapamıyor, metin kontrolü yok, okunaklı metin oluşturamıyor ve insanları ve yüzleri düzgün şekilde oluşturamıyor.
Araç, milyonlarca videodan oluşan bir veri kümesi üzerinde eğitildi ve daha sonra daha küçük bir küme üzerinde ince ayarlar yapıldı; Stability AI yalnızca araştırma amacıyla kamuya açık videoları kullandığını söyledi. Stabilite AI’nın yakın zamanda Getty Images tarafından görüntü arşivlerini kazıdığı için dava edildiği göz önüne alındığında, veri setinin kaynağı önemli.