市委書記和董事長們都在聊它 杭州怎么干?
就像突然出現(xiàn)在房間里的一頭大象,你很難不注意到Sora——近日,一款由OpenAI推出的文生視頻大模型,只要一段描述,它就能生成長達(dá)1分鐘,具備電影質(zhì)感的視頻。
“Sora大模型的橫空出世,相信很多同志已經(jīng)看到了?!痹趧偨Y(jié)束的杭州市新春第一會(huì)——“深化改革、強(qiáng)基固本”主題年推進(jìn)大會(huì)上,省委副書記、杭州市委書記劉捷兩次提到Sora大模型,“Sora大模型為數(shù)字經(jīng)濟(jì)創(chuàng)新發(fā)展打開了一扇大門,形成了引領(lǐng)人工智能產(chǎn)業(yè)發(fā)展的一個(gè)新的通道,這不僅帶來很大啟發(fā),更大地帶來了產(chǎn)業(yè)的沖擊?!?/p>
很多杭州科技企業(yè)的高管開工后的第一件事,也是和員工們聊Sora。
擁抱Sora為我所用
開工第一天,萬事利絲綢董事長李建華在萬事利新春座談會(huì)上分享了自己對(duì)Sora的一些想法。
在他看來,AI能激發(fā)更多人的創(chuàng)作力,實(shí)現(xiàn)創(chuàng)作上的“科技平權(quán)”。未來Sora可能給廣告業(yè)、電影預(yù)告片、短視頻行業(yè)帶來巨大的顛覆。“所以我們必須要擁抱Sora,學(xué)習(xí)掌握它,讓它為我們的品牌營銷服務(wù)?!?/p>
李建華說,大語言模型最牛的是能完整地理解這個(gè)世界的知識(shí)。OpenAI利用它的大語言模型優(yōu)勢(shì),讓Sora具備了對(duì)現(xiàn)實(shí)世界的理解和對(duì)世界的模擬兩層能力,“大模型基于對(duì)人類語言的理解,對(duì)人類知識(shí)和世界模型的了解,再疊加很多其他的技術(shù),就可以創(chuàng)造各個(gè)領(lǐng)域的超級(jí)工具?!?/p>
作為一家傳統(tǒng)的絲綢企業(yè),這幾年萬事利在AI的道路上一路狂奔。目前,公司的AIGC實(shí)驗(yàn)室已建成50萬+花型數(shù)據(jù)庫,集成了超300種算法組成的AI圖像算法矩陣。
接下來的3月,萬事利打算開展一項(xiàng)面向全員的AI創(chuàng)意大賽,通過AI創(chuàng)意大賽,引導(dǎo)各崗位員工都要掌控各種AI應(yīng)用工具,提高工作創(chuàng)意和效率。
不必對(duì)被AI取代過于焦慮
“測(cè)試賬號(hào)還沒拿到,無法評(píng)價(jià)實(shí)際效果。僅從官方放出的一些生成視頻看,目前這個(gè)版本和動(dòng)畫電影關(guān)系不大,可能更適合個(gè)人創(chuàng)作者,創(chuàng)作成本會(huì)大幅降低。”在Sora發(fā)布的第一時(shí)間,浙江花果山文化傳媒有限公司CEO周建敏便開始留意。
花果山旗下工作室曾參與動(dòng)畫電影《深?!?、科幻大片《流浪地球2》等的特效制作。在Sora橫空出世后,很多人覺得特效相關(guān)工作者的飯碗要保不住了。
“我們目前和浙江、北京一些大學(xué)AI視頻研究的博士團(tuán)隊(duì)都有合作,主要進(jìn)行動(dòng)畫風(fēng)格的測(cè)試訓(xùn)練。”在周建敏看來,所謂AI取代從業(yè)者的焦慮被放大了,從他們的自身實(shí)踐和探索來看,目前無論是文生圖還是文生視頻,還不能作為企業(yè)的“常規(guī)工具”,“不過相信隨著技術(shù)打磨,AI會(huì)對(duì)動(dòng)畫行業(yè)產(chǎn)生深刻的影響。”
周建敏認(rèn)為,短期內(nèi),AIGC更重要的是改變個(gè)人工作習(xí)慣和提升工作效率,更方便內(nèi)容創(chuàng)意方面的從業(yè)者將想法可視化,便于工作上的溝通協(xié)作,“我們一定會(huì)繼續(xù)加大對(duì)AI動(dòng)畫的技術(shù)探索和嘗試,有計(jì)劃在訓(xùn)練成果進(jìn)一步完善后,進(jìn)行AI動(dòng)畫短片創(chuàng)作實(shí)驗(yàn)?!?/p>
AI視頻行業(yè)今年將迎來一輪爆發(fā)
“AI視頻的進(jìn)一步研發(fā)和完善,會(huì)是今年團(tuán)隊(duì)工作的重點(diǎn)之一?!弊鳛閲鴥?nèi)AIGC領(lǐng)域較早的入局者,無界AI聯(lián)合創(chuàng)始人兼CTO張飛彪如是說。
Sora發(fā)布當(dāng)天,無界AI的內(nèi)部分享群一大早便炸開了鍋。相關(guān)的技術(shù)報(bào)告被一一拆解,討論熱烈。
“Sora突破性的語義理解能力、復(fù)雜場(chǎng)景變化的模擬能力、整體畫面的一致性和連續(xù)性,都讓我們驚嘆,并受到鼓舞?!?/p>
作為一家專注于多模態(tài)生成領(lǐng)域的AIGC企業(yè),無界AI在去年相繼上線了視頻生視頻、文生視頻以及圖生視頻等功能。
“Sora所采用的核心技術(shù)Diffusion Transformer(DiT,擴(kuò)散型Transformer)架構(gòu),我們之前也研究過,包括視頻生成前的提示詞理解和完善。OpenAI相當(dāng)于把路線全跑通了,我們后續(xù)也會(huì)及時(shí)跟進(jìn)?!?/p>
在張飛彪看來,“技術(shù)已經(jīng)發(fā)展到這個(gè)節(jié)點(diǎn),AI視頻行業(yè)今年將迎來一輪爆發(fā)?!?/p>
讓AI更安全是個(gè)機(jī)會(huì)
這兩天剛開工,安恒信息的工作群里也在熱烈地討論Sora,“Sora和其他的圖像模型一樣,依然難以處理人類手部細(xì)節(jié),還有一些沙子變躺椅之類的問題視頻,將其關(guān)聯(lián)到世界模型或者AGI似乎還有點(diǎn)遠(yuǎn)。世界模型的主要推動(dòng)者、圖靈獎(jiǎng)得主Yann LeCun也認(rèn)為Sora和世界模型并沒有多大關(guān)系?!卑埠阈畔⒀芯吭焊痹洪L稅雪飛表示。
一家做數(shù)據(jù)安全的公司為何也會(huì)如此關(guān)注Sora?安恒信息的logo中就有一個(gè)英文縮寫“DAS”,其中D代表數(shù)據(jù)安全、S代表服務(wù)、A就代表著AI。
AI也是安恒的重要戰(zhàn)略部署,去年安恒發(fā)布了數(shù)據(jù)安全大模型安恒恒腦,以智能輔助的形式在成都大運(yùn)會(huì)、杭州亞運(yùn)會(huì)、世界科幻大會(huì)、杭州世羽賽的現(xiàn)場(chǎng)得以應(yīng)用。比如杭州亞運(yùn)會(huì)賽事期間調(diào)用恒腦接口34864次,主要用于安全咨詢、告警分析、情報(bào)分析等,降低了ITCC57%的工作量。
AI發(fā)展日新月異,對(duì)安全和隱私要求也越來越高,對(duì)安恒信息來說,既要讓AI更安全,又要讓安全更智能。