[閒聊] 挑戰Sora!陸發表首款國產影片生成AI

看板Marginalman作者 (逍遙山水憶秋年)時間2周前 (2024/04/30 13:51), 編輯推噓1(101)
留言2則, 2人參與, 2周前最新討論串1/1
挑戰Sora!陸發表首款國產影片生成AI 記者蔡紹堅/綜合報導 中國大陸生數科技聯合清華大學研發的影片生成AI大模型Vidu近日在北京發表,它支援一 鍵生成長達16秒,分辦率高達1080P的高畫質影片內容,是大陸第一款國產的影片生成AI 大模型,。 從現場示範的影片中可以看到,Vidu能夠模擬真實的物理世界,產生細節複雜且符合真實 物理規律的場景,諸如合理的光影效果,細膩的人物表情等。 Vidu也能夠產生複雜的動態鏡頭,不只限於簡單的推,拉,移等鏡頭,而是能夠圍繞統一 主體在一段畫面裡實現遠景,近景,中景,特寫等不同鏡頭的切換,直接生成長鏡頭,追 焦,轉場等效果也不在話下,為影片注入豐富的鏡頭語言。 ▼Vidu的示範影片。(圖/翻攝微博) ▲▼陸發表國產影片生成AI Vidu。(圖/翻攝微博) 短片中的片段都是從頭到尾的連續生成,沒有明顯的插幀現象,透過這種「一鏡到底」的 表現能夠推測出,Vidu採用的是「一步到位」的生成方式,從文字到影片的轉換是直接且 連續的,在底層演算法實現上是基於單一模型完全端到端生成,不涉及中間的插幀和其他 多步驟的處理。 清華大學AI 研究院副院長,生數科技首席科學家朱軍表示,「在今年2月,文生影片大模 型Sora發布後,我們發現其剛好和我們的技術路線是高度一致的,這也讓我們堅定地進一 步推進了自己的研究」。 ▲▼陸發表國產影片生成AI Vidu。(圖/翻攝微博) 根據陸媒報導,Sora發布推出後,Vidu團隊基於對U-ViT架構的深入理解以及長期積累的 工程與數據經驗,在短短兩個月進一步突破長視頻表示與處理關鍵技術,研發推出Vidu視 頻大模型,顯著提升影片的連貫性與動態性。 研發團隊也特別強調,Vidu能夠深刻理解並展現中國元素,特別注重文化適應性,能夠生 成具有中國特色的元素,諸如貓熊、龍等等。 https://www.ettoday.net/news/20240430/2729566.htm -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.176.190.76 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1714456271.A.035.html

04/30 13:53, 2周前 , 1F
SAYO
04/30 13:53, 1F

04/30 14:09, 2周前 , 2F
中國產廢片
04/30 14:09, 2F
文章代碼(AID): #1cC8RF0r (Marginalman)