香港即時新聞網
內地成功開發影片大模型可生成真實世界不存在虛構畫面 可理解中國特有元素
來源 : TVB
更新 : 2024-04-27 20:01
內地宣布成功開發可以將文字指令生成為逼真影片,類似美國Sora的影片大模型。除了模擬真實的物理世界,亦能夠在影片中生成大熊貓、龍等中國元素。美國早前發布可以將文字指令,快速生成為逼真影片的Sora,引起業界關注。在中關村年會論壇周六舉行的未來人工智能(AI)先鋒論壇上,清華大學就公布,與內地人工智能技術研發商成功開發類似的影片大模型Vidu,最長可生成16秒高解像度的影片。清華大學教授朱軍說:「自主創新的一個最新成果,它(Vidu)在多個維度實現技術突破,包括它可以模擬真實的物理世界、可以具有想像力、可以理解多鏡頭的語言,不再是簡單鏡頭推拉。」研發團隊表示,Vidu可以生成真實世界不存在的虛構畫面,亦可以理解中國特有元素,例如大熊貓、龍等。會上團隊又與市場上現有三個文字生成影片大模型作對比,稱在影片長度、文字理解上,Vidu都有明顯優勢。對於由Sora發表到現時Vidu面世不過短短兩個月,團隊解釋是長期積累的成果。朱軍指:「為甚麼我們在Sora發布短短兩個月內,我們能夠實現這個突破,是不是Sora比較簡單、還是因為我們做了一個便宜的『山寨貨』,事實上都不是。Sora出來之後,我們剛好發現和我們的技術路線是高度一致的,所以我們堅定地進一步推進了自己的研究。」團隊同步推出合作夥伴計劃,邀請上下游企業研究機構等加入項目。
已複製
http://www.headline4hk.com/article/20240427/tvb/662cd77f4d7009152efd5811/
內地成功開發影片大模型可生成真實世界不存在虛構畫面 可理解中國特有元素
內地成功開發影片大模型可生成真實世界不存在虛構畫面 可理解中國特有元素