人工智能如何賦能科學(xué)研究?他們這樣說(shuō)
4月12日上午,中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院(簡(jiǎn)稱“深圳先進(jìn)院”)舉辦“探Sora真相,論AI未來(lái)”人工智能沙龍講座。本次活動(dòng)邀請(qǐng)到人工智能領(lǐng)域的專家學(xué)者圍繞人工智能領(lǐng)域前沿技術(shù)進(jìn)行了深入探討和分析,并討論了Sora對(duì)AI基礎(chǔ)技術(shù)的推進(jìn)作用。中國(guó)科學(xué)院院士、深圳先進(jìn)院副院長(zhǎng)鄭海榮,數(shù)字所所長(zhǎng)李燁出席,近百位科研人員和學(xué)生參加此次活動(dòng)。?
此次活動(dòng)由深圳先進(jìn)院先進(jìn)計(jì)算與數(shù)字工程研究所、中國(guó)科學(xué)院與香港地區(qū)多媒體技術(shù)聯(lián)合實(shí)驗(yàn)室共同主辦,深圳先進(jìn)院數(shù)字所多媒體集成技術(shù)中心主任董超主持。

圖為鄭海榮院士致辭
鄭海榮院士在致辭中提到,人工智能帶來(lái)科學(xué)研究范式的改變,正在深深影響材料、生命、信息和醫(yī)學(xué)等領(lǐng)域發(fā)展。我們應(yīng)以極高的敏感度去思考如何與人工智能技術(shù)相融合帶動(dòng)相關(guān)領(lǐng)域的變革。希望通過(guò)今天的交流與合作,能夠促進(jìn)非人工智能領(lǐng)域的研究學(xué)者擁有人工智能的意識(shí)和思維,助力開拓學(xué)科的新疆域。
香港中文大學(xué)副教授李鴻升在《圖像生成和視頻生成前沿技術(shù)探索》主題報(bào)告中,介紹了實(shí)驗(yàn)室團(tuán)隊(duì)在面對(duì)生成模型評(píng)估困難、生成圖像文本跟隨性差、生成視頻一致性差、生成模型推理速度慢等多重挑戰(zhàn)時(shí)開發(fā)的一系列工作,包括文生圖模型評(píng)估方法HPS(Human Preference Score)、增強(qiáng)生成圖像的文本依從性方法CoMat、增強(qiáng)生成視頻的一致性方法Motion-I2V、擴(kuò)展圖像生成模型至視頻生成方法AnimateLCM等?!耙曨l生成模型的開發(fā)是一個(gè)龐大的系統(tǒng)工程,應(yīng)對(duì)這一挑戰(zhàn),算力資源和人員組織架構(gòu)都需要集中規(guī)劃,技術(shù)的開發(fā)需要有系統(tǒng)化的數(shù)據(jù)工程。”
騰訊科技高級(jí)研究員王鑫濤在《視頻生成探索及MINI-SORA的初步研究》的報(bào)告中提到,視頻生成正日益受到學(xué)術(shù)界和工業(yè)界的關(guān)注,隨著OpenAI Sora的發(fā)布,視頻生成技術(shù)的潛力和挑戰(zhàn)越來(lái)越明晰。他回顧了視頻生成技術(shù)的發(fā)展路線,以及Sora的出現(xiàn)為視頻生成技術(shù)帶來(lái)的啟發(fā)與思考?!斑@是最好的時(shí)代也是最‘壞’的時(shí)代,我們見證了人工智能技術(shù)的不斷突破,同時(shí)也必須一次次突破認(rèn)知才不至于‘望洋興嘆’?!?/span>

圖為活動(dòng)現(xiàn)場(chǎng)
在圓桌對(duì)話中,5位人工智能領(lǐng)域的科學(xué)家們探討了Sora對(duì)AI基礎(chǔ)技術(shù)的推進(jìn)作用,以及人工智能技術(shù)發(fā)展背后的思考。
談及視頻生成模型的應(yīng)用場(chǎng)景時(shí),華為技術(shù)有限公司高級(jí)工程師蔡穎婕說(shuō)道:“最直接的是在創(chuàng)作場(chǎng)景方面的應(yīng)用,Sora表現(xiàn)出的良好一致性和一部分對(duì)物理世界的理解能力,讓其有希望成為數(shù)據(jù)仿真器,解決自動(dòng)駕駛等任務(wù)中的部分?jǐn)?shù)據(jù)問(wèn)題,有利于提高安全性。”
那么,Sora是如何模擬和理解物理世界的?“數(shù)據(jù)在Sora中起到了很大的作用,其中可能存在一部分使用了游戲物理引擎仿真的數(shù)據(jù),再加上自然圖像大數(shù)據(jù)的訓(xùn)練導(dǎo)致Sora能在一定程度上理解物理規(guī)律,產(chǎn)生符合人類認(rèn)知的畫面?!崩铠櫳治龅?。
王鑫濤同樣認(rèn)為數(shù)據(jù)在Sora中占據(jù)十分重要的地方,他認(rèn)為網(wǎng)絡(luò)模型本身的學(xué)習(xí)方式或許與人類學(xué)習(xí)的模式不一樣,模型從大量數(shù)據(jù)中學(xué)習(xí)可能也可以自適應(yīng)地理解某種規(guī)律。
“物理規(guī)律是人類對(duì)于世界的某種‘壓縮’,將一系列的物理現(xiàn)象濃縮到幾個(gè)公式來(lái)統(tǒng)一表達(dá),某種程度上說(shuō),‘壓縮’即智能?!?span style="font-variant: normal; color: rgb(0, 0, 0); letter-spacing: normal; background: rgb(255, 255, 255); font-style: normal; font-family: arial, helvetica, sans-serif; font-size: 16px;">香港中文大學(xué)助理教授薛天帆補(bǔ)充道。
董超從另一個(gè)角度提到,如果從Sora輸出的結(jié)果中,能推導(dǎo)出某種一致性規(guī)律,那么即使可能與真實(shí)世界規(guī)律有偏差,也算是Sora世界中自成一體的“物理定律”。
“無(wú)論什么樣的技術(shù)都是從人出發(fā),最終也是反饋到人類身上。我們應(yīng)該更多關(guān)注人本身,創(chuàng)造出有利的科研環(huán)境,讓一線的從業(yè)者和科學(xué)家們保持創(chuàng)造力和好奇心。技術(shù)需要被人掌控并回歸人類本身,才能讓前沿技術(shù)帶來(lái)正向價(jià)值、有利于社會(huì)發(fā)展?!被顒?dòng)的最后,董超說(shuō)道。
附件下載: