技術(shù)趨勢(shì):視頻生成正在由檢索生成、局部生成走向依靠自然語(yǔ)言提示詞的全量生成,生成內(nèi)容更加靈活豐富,應(yīng)用空間廣闊
檢索生成主要是對(duì)現(xiàn)有的視頻素材根據(jù)關(guān)鍵詞和標(biāo)簽進(jìn)行檢索匹配,再進(jìn)行相應(yīng)的拼接和排列組合
特點(diǎn)
1 采用傳統(tǒng)的跨模態(tài)視頻檢索技術(shù),通過(guò)視頻標(biāo)
簽的或者視頻語(yǔ)義理解的方式從數(shù)據(jù)庫(kù)中的檢
索,再將這些素材進(jìn)行剪輯、組合拼接在一起,
本質(zhì)上還是鍵值對(duì)匹配的邏輯
2 例如短視頻平臺(tái)的知識(shí)類視頻、解說(shuō)類視頻, 通過(guò)文本關(guān)鍵字在數(shù)據(jù)庫(kù)中進(jìn)行素材檢索,然 后在進(jìn)行拼接組合生成
3 創(chuàng)意空間有限,沒(méi)有貢獻(xiàn)增量素材,但成本極 低,生成速度極快
僅針對(duì)視頻的一部分進(jìn)行生 成,例如視頻中人物角色、 動(dòng)作、背景、風(fēng)格化、特殊 效果等
特點(diǎn)
1 采用傳統(tǒng)的計(jì)算機(jī)視覺(jué)(Cv)、計(jì)算機(jī)圖形學(xué) (CG)技術(shù),但生成功能有限,主要是一些局
部的垂點(diǎn)功能
2 例如效果生成,在現(xiàn)有視頻上添加多種效果, 如濾鏡、光影、風(fēng)格化、美顏特效等。也可以 做局部動(dòng)態(tài)化,如人物的面部表情生成、搞笑 表情、爆款特效、舞蹈動(dòng)作生成等
3 有一定創(chuàng)意空間,生成部分新元素,成本低但 應(yīng)用的場(chǎng)景有限
通過(guò)文字、圖片、視頻作為提示 詞來(lái)進(jìn)行憑空生成,不依賴外部 素材,核心在于大模型的能力
特點(diǎn)
1 采用基于Transformer或者擴(kuò)散模型的大模型路 線,可以通過(guò)自然語(yǔ)言或者指導(dǎo)圖進(jìn)行全局生成 (但也可以嵌入已有內(nèi)容),視頻的內(nèi)容、風(fēng)格、 長(zhǎng)短、分辨率、寬高比都可以進(jìn)行靈活調(diào)整
2 例如生成天馬行空的創(chuàng)意視頻、藝術(shù)視頻、卡通 視頻等等,非常靈活
3 創(chuàng)意空間無(wú)限,所有的元素都是全新生成,現(xiàn) 階段成本高昂,但天花板高,應(yīng)用場(chǎng)景廣泛
附件:AI視頻生成研究報(bào)告-由檢索生成、局部生成走向依靠自然語(yǔ)言提示詞的全量生成
中國(guó)在AI基礎(chǔ)設(shè)施和軟件層面嚴(yán)重依賴國(guó)際廠商,特別是在計(jì)算芯片和存儲(chǔ)芯片領(lǐng)域;在軟件層面,依賴程度更加嚴(yán)重,軟件仍是中國(guó)各大企業(yè)的常用工具占比達(dá)59%
以注意力機(jī)制為核心的Transformer架構(gòu)賦能AI在文本、圖像、視頻生成、文字交互、智能語(yǔ)音和計(jì)算機(jī)視覺(jué) 領(lǐng)域的技術(shù)能力增強(qiáng)和應(yīng)用范圍拓寬
生成式人工智能服務(wù)管理暫行辦法,算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃,關(guān)于加快場(chǎng)景創(chuàng)新以人工智能高水平應(yīng)用促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展的指導(dǎo)意見(jiàn),國(guó)家新一代人工智能創(chuàng)新 發(fā)展試驗(yàn)區(qū)建設(shè)工作指引
中國(guó)多年來(lái)在人工智能論文發(fā)表數(shù)量和專利授權(quán)數(shù)量方面均居世界首位;顯著領(lǐng)先于其他國(guó)家,中國(guó)人工智能專利授權(quán)的數(shù)量在全球范圍內(nèi)占比達(dá)61.3%,位居全球榜首
我國(guó)智能算力占比已經(jīng)超過(guò)通用算力,成為整體算力增長(zhǎng)的主要驅(qū)動(dòng)力;國(guó)算力結(jié)構(gòu)為通用算力:智能算力:超級(jí)算力=40%:59%:1%智能算力占比已較大幅度超過(guò)通用算力占比
分析了大模型發(fā)展趨勢(shì)挑戰(zhàn)的基礎(chǔ)上,提出了大模型安全實(shí)踐總體框架,并從安全性、可靠性、可控性以及評(píng)測(cè)四個(gè)角度對(duì)大模型安全技術(shù)進(jìn)行了深度剖析
白皮書(shū)將聚焦中國(guó)未來(lái)核心產(chǎn)業(yè)的發(fā)展方向,從人工智能、智能制造、大消費(fèi)、生命科學(xué)、碳中和等五大產(chǎn)業(yè)出發(fā),探討中國(guó)將如何迎接下一波增長(zhǎng)浪潮
大模型領(lǐng)域人才供需比為1.76,整體供大于求,但高端技術(shù)崗位如云計(jì)算和算法仍緊缺,薪酬漲幅保持在30%-50%,65.79%每周工作超50小時(shí),從業(yè)者中82%因技術(shù)和前景而主動(dòng)加入
設(shè)備精度提升以及對(duì)更精準(zhǔn)診斷的追求使得我國(guó)醫(yī)學(xué)影像數(shù)據(jù)大量積累人工智能可以充分利用這些數(shù)據(jù)進(jìn)行模型訓(xùn)練;提高了醫(yī)學(xué)診斷效率, 減輕了醫(yī)生工作負(fù)擔(dān)、促進(jìn)了醫(yī)療資源均衡分配
智能體將深入復(fù)雜任務(wù)處理,手機(jī)和電腦智能體將引發(fā)應(yīng)用生態(tài)變革;報(bào)告討論了AIAgent產(chǎn)品的構(gòu)建方式和市場(chǎng)策略,強(qiáng)調(diào)了大模型技術(shù)基礎(chǔ)和行業(yè)數(shù)據(jù)的重要性
AI生產(chǎn)力工具市場(chǎng)快速發(fā)展,用戶規(guī)模和產(chǎn)品類型激增,以AI搜索、寫(xiě)作、翻譯等應(yīng)用為核心的工具正推動(dòng)工作效率和創(chuàng)造力的提升,生成式AI市場(chǎng)預(yù)計(jì)將達(dá)到4000億元
國(guó)內(nèi)AI大模型行業(yè)迅速發(fā)展,形成“6+2”競(jìng)爭(zhēng)格局,產(chǎn)品覆蓋C端和B端,聚焦金融、教育等行業(yè),報(bào)告概括了AI大模型行業(yè)的主要參與者、核心競(jìng)爭(zhēng)力、產(chǎn)品與服務(wù)、融資情況以及未來(lái)趨勢(shì)