[閒聊] 挑戰Sora！陸發表首款國產影片生成AI

看板Marginalman作者zkow (逍遙山水憶秋年)時間2周前 (2024/04/30 13:51)推噓1(1推 0噓 1→)

留言2則, 2人參與討論串1/1

挑戰Sora！陸發表首款國產影片生成AI 記者蔡紹堅／綜合報導中國大陸生數科技聯合清華大學研發的影片生成AI大模型Vidu近日在北京發表，它支援一鍵生成長達16秒，分辦率高達1080P的高畫質影片內容，是大陸第一款國產的影片生成AI 大模型，。從現場示範的影片中可以看到，Vidu能夠模擬真實的物理世界，產生細節複雜且符合真實物理規律的場景，諸如合理的光影效果，細膩的人物表情等。 Vidu也能夠產生複雜的動態鏡頭，不只限於簡單的推，拉，移等鏡頭，而是能夠圍繞統一主體在一段畫面裡實現遠景，近景，中景，特寫等不同鏡頭的切換，直接生成長鏡頭，追焦，轉場等效果也不在話下，為影片注入豐富的鏡頭語言。 ▼Vidu的示範影片。（圖／翻攝微博） ▲▼陸發表國產影片生成AI Vidu。（圖／翻攝微博）短片中的片段都是從頭到尾的連續生成，沒有明顯的插幀現象，透過這種「一鏡到底」的表現能夠推測出，Vidu採用的是「一步到位」的生成方式，從文字到影片的轉換是直接且連續的，在底層演算法實現上是基於單一模型完全端到端生成，不涉及中間的插幀和其他多步驟的處理。清華大學AI 研究院副院長，生數科技首席科學家朱軍表示，「在今年2月，文生影片大模型Sora發布後，我們發現其剛好和我們的技術路線是高度一致的，這也讓我們堅定地進一步推進了自己的研究」。 ▲▼陸發表國產影片生成AI Vidu。（圖／翻攝微博）根據陸媒報導，Sora發布推出後，Vidu團隊基於對U-ViT架構的深入理解以及長期積累的工程與數據經驗，在短短兩個月進一步突破長視頻表示與處理關鍵技術，研發推出Vidu視頻大模型，顯著提升影片的連貫性與動態性。研發團隊也特別強調，Vidu能夠深刻理解並展現中國元素，特別注重文化適應性，能夠生成具有中國特色的元素，諸如貓熊、龍等等。 https://www.ettoday.net/news/20240430/2729566.htm -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.176.190.76 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Marginalman/M.1714456271.A.035.html

推

oz5566

04/30 13:53, 2周前 , 1^F

04/30 13:53, 1^F

→

HGK

04/30 14:09, 2周前 , 2^F

04/30 14:09, 2^F

‣ 返回看板[ Marginalman ] 心情

‣ 更多 zkow 的文章

文章代碼(AID): #1cC8RF0r (Marginalman)