大河網(wǎng)訊(記者 婁恒 劉高雅)深耕人工智能領(lǐng)域20余年的王長虎,是中國網(wǎng)絡(luò)媒體論壇舉辦期間備受關(guān)注的嘉賓之一。作為愛詩科技創(chuàng)始人兼CEO、PixVerse掌門人,他在接受大河網(wǎng)記者采訪時,分享了自己對視頻生成大模型發(fā)展歷程的深刻洞察,以及對AI未來方向的判斷與展望。 從抖音到PixVerse 為什么偏要走那條“最難的路”? “因為過去20年都在人工智能領(lǐng)域,過去幾年也參與了像抖音、TikTok等的發(fā)展過程,所以我認(rèn)為,視頻實際上是離用戶特別近的內(nèi)容。”王長虎說,“視頻生成大模型一旦能夠做好,其產(chǎn)品影響力、商業(yè)化前景不容小覷。” 然而,這條路并不擁擠。“但此前,這個方向幾乎沒有人看到。我們走了一條非常艱難的道路,但我們堅信這件事我們能做成。” 過去三年,愛詩科技見證了視頻生成大模型發(fā)展的歷程,也是全球最早做視頻生成的企業(yè)之一。 王長虎坦言,他的信心源于親身經(jīng)歷。“由于完整參與了抖音、TikTok從0到1的進(jìn)化,特別是背后的視頻AI能力。所以當(dāng)別人沒有信心做出來的時候,我們認(rèn)為我們有信心。” 無限生成、實時互動 視頻的“世界模型”長什么樣? 在描述視頻生成大模型技術(shù)突破時,王長虎描繪了一個極具想象力的場景:“一旦創(chuàng)造完這個設(shè)計之后,它就自己在運(yùn)行,相當(dāng)于你看到的視頻就無限地在進(jìn)化、無限地在生成。” 他強(qiáng)調(diào),用戶可以通過社交或語音互動,實時改變視頻里面的內(nèi)容。“實時互動就意味著你這邊輸入完,那邊已經(jīng)改變了,這是一個創(chuàng)作過程。” “一般生成的視頻也都是最長30秒,但我們這個最長能生成無限。”王長虎說,空間上可以無限延展,內(nèi)容上也可以實時改變。 過去20年,整個互聯(lián)網(wǎng)技術(shù)發(fā)展受到一個動力的驅(qū)動,就是人和信息交互方式的變化。從“人主動找信息”的搜索引擎,到“信息找人”的推薦算法,再到如今的“人創(chuàng)世界”。 王長虎舉例說:“比如我們有一個場景,一個人在睡覺。通過不同的方式可以把他吵醒,我們輸入一些指令,一只小貓會過來把他吵醒。或者把咖啡打翻,讓他把桌子扶起來等等。每一個想法都可以創(chuàng)造一個世界,這個世界里你可以成為世界之主。” 基于這一變革,王長虎描繪了這樣一幅未來圖景:“大家可以暢想,我們現(xiàn)在看的劇,未來可能就是這種交互式的。每個人都可以讓他有不同的劇情和結(jié)果。”他甚至提出一個有趣的問題:“未來會不會依然有電影院的存在?每個人看的電影,因為交互的不同,都可能有不同的結(jié)果,這是想起來就非常興奮的事情。” 從“雪山救狐貍”到全民AI 這不是搶飯碗,是打開新世界 王長虎認(rèn)為“AI的發(fā)展可以加速每一個行業(yè)的發(fā)展,它不會替換很多重要的行業(yè),而是會帶來更多的多元化的機(jī)會”。他舉例說:“如今,不少人追星,未來可以有AI世界,我們或許也會有一些虛擬的偶像、定制偶像,讓每個人可以看到更大的世界。” 談及近期網(wǎng)上火爆的“雪山救狐貍”等網(wǎng)友用AI生成視頻的梗,王長虎表示并不意外。 “我覺得非常有意思。”他回憶道,“在2024年的時候,大部分視頻公司都在服務(wù)專業(yè)創(chuàng)作者,我們當(dāng)時的目標(biāo)就是希望每一個能夠玩抖音、玩快手、玩TikTok的普通人都能夠輕而易舉地創(chuàng)作AI內(nèi)容。” “所以出現(xiàn)這種熱潮,我覺得不意外,我們也是深度推動者。”王長虎說,“鼓勵大家都來玩AI,降低視頻生成的門檻。” 王長虎觀察到,行業(yè)認(rèn)知正在發(fā)生轉(zhuǎn)折,“之前真正關(guān)注到這個行業(yè)的人還沒那么多,但現(xiàn)在不一樣,現(xiàn)在不少人都意識到這是一個大市場,也是一個非常好的機(jī)會。我們也愿意與文旅等行業(yè)一起攜手共創(chuàng)未來”。 ( 編輯:tln ) |
視頻的“世界模型”長什么樣?PixVerse掌門人:無限生成+實時互動
來源: 發(fā)布日期:2026-04-01 打印



豫公網(wǎng)安備 41120202000047號
