字體大?。?a href="javaScript:void(0)">小
中大
之所以認為是神話(huà),是因為科技程度還達不到。
——高銘《天才在左瘋子在右》
用一段文字描述就可以形成一段“真實(shí)”的視頻,曾經(jīng)想象中的場(chǎng)景如今已經(jīng)實(shí)現!
春節假期尚未結束,OpenAI發(fā)布的新一代文字生成視頻模型——Sora就已經(jīng)引發(fā)熱潮,通過(guò)文字生成1分鐘的高質(zhì)量視頻,極其真實(shí)、個(gè)性化的視頻表現,且符合現實(shí)世界物理規律的圖像,令人驚艷,這也直接帶動(dòng)了資本市場(chǎng)的表現。
Sora模型有何特點(diǎn),龍年AI投資有哪些趨勢?本期《風(fēng)向》將為您一一梳理。
文本轉視頻,時(shí)長(cháng)達1分鐘
一個(gè)視頻勝千言,從OpenAI放出的視頻來(lái)看,通過(guò)一長(cháng)串的提示詞,諸如“幾只巨大的毛茸茸的猛犸象踏著(zhù)白雪皚皚的草地走近”,AI就生成了極其真實(shí)的動(dòng)態(tài)畫(huà)面場(chǎng)景。

資料來(lái)源:OpenAI官網(wǎng)
提示詞:幾只巨大的毛茸茸的猛犸象踏著(zhù)白雪皚皚的草地走近,它們長(cháng)長(cháng)的毛茸茸的皮毛在風(fēng)中輕輕飄動(dòng),遠處覆蓋著(zhù)積雪的樹(shù)木和雄偉的雪山,午后的陽(yáng)光下有縷縷云彩,太陽(yáng)高高地掛在空中距離產(chǎn)生溫暖的光芒,低相機視角令人驚嘆地捕捉到大型毛茸茸的哺乳動(dòng)物,具有美麗的攝影和景深。
如果不是猛犸象已經(jīng)滅絕,或者視頻標注了AI生成,我相信包括筆者在內的很多人會(huì )認為是實(shí)拍鏡頭。
不僅僅是動(dòng)物,人物和場(chǎng)景表現也極其真實(shí)。

資料來(lái)源:OpenAI官網(wǎng)
提示詞:一位時(shí)尚女性走在充滿(mǎn)溫暖霓虹燈和動(dòng)畫(huà)城市標牌的東京街道上。她穿著(zhù)黑色皮夾克、紅色長(cháng)裙和黑色靴子,拎著(zhù)黑色錢(qián)包。她戴著(zhù)太陽(yáng)鏡,涂著(zhù)紅色口紅。她走路自信又隨意。街道潮濕且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來(lái)走去。
根據OpenAI官網(wǎng)的介紹,Sora能夠生成具有多個(gè)角色、特定類(lèi)型的運動(dòng)以及主體和背景的準確細節的復雜場(chǎng)景,該模型不僅了解用戶(hù)在提示中提出的要求,還了解這些東西在物理世界中的存在方式。
其次,該模型能夠更加準確的理解人類(lèi)給出的提示詞,借助GPT的能力,Sora將用戶(hù)的簡(jiǎn)短提示轉換成更詳細的提示,使其能夠準確地解釋提示詞,并生成質(zhì)量更高的圖像。
如同電影中常見(jiàn)的多機位拍攝,Sora模型還可以在單個(gè)生成的視頻中創(chuàng )建多個(gè)鏡頭,準確地保留角色和視覺(jué)風(fēng)格。而且生成的視頻也可以重新編輯,比如讓植被更加茂密等等,如果嫌視頻的時(shí)間過(guò)短,也可以讓AI向前或向后拓展視頻。
Sora的技術(shù)報告顯示,OpenAI并不是把Sora單純當作一個(gè)視頻模型來(lái)看待,而是將視頻生成模型作為“世界模擬器”,不僅可以在不同設備的原生寬高比直接創(chuàng )建內容,還能展示出對真實(shí)世界的模擬能力,如3D一致性、長(cháng)期一致性和對象持久性等。
依托于大語(yǔ)言模型,讓機器模仿人
根據公開(kāi)資料,在文生視頻領(lǐng)域,比較成熟的模型思路有循環(huán)網(wǎng)絡(luò )(RNN)、生成對抗網(wǎng)絡(luò )(GAN)和擴散模型(Diffusionmodels)。
結合OpenAI官網(wǎng)下的文獻參考,Sora為使用Transformer架構的擴散模型。它從看起來(lái)像靜態(tài)噪聲的視頻開(kāi)始生成視頻,然后通過(guò)多個(gè)步驟消除噪聲來(lái)逐漸對其進(jìn)行轉換。
如果用通俗但不太嚴謹的話(huà)來(lái)解釋?zhuān)暗腉AN模型更多的是對其他圖片“形”的模仿,而擴散模型更多的是對“神”的模仿,比如圖像內涵,圖像與圖像的關(guān)系等等。
隨著(zhù)訓練計算的增加,樣本質(zhì)量顯著(zhù)提高

圖片來(lái)源:Sora技術(shù)報告
在其技術(shù)報告中,Sora可以將圖片和視頻轉化為補丁,從而可以用更廣泛的數據訓練。OpenAI將圖片和視頻數據轉化為統一的表示方式——補?。╬atches)來(lái)進(jìn)行訓練,補丁類(lèi)似于大語(yǔ)言模型中的tokens,并且可以高度擴展。通過(guò)統一數據的表示方式,Sora可以用更廣泛的數據訓練,使生成的視頻更加真實(shí)。
目前Sora模型還在進(jìn)行安全測試,僅向有限的創(chuàng )作者開(kāi)放。據彭博社預計,GPT-4經(jīng)過(guò)6個(gè)月的測試后正式開(kāi)放,參考GPT-4,預計Sora或將于8月向公眾開(kāi)放。
政策端大力鼓勵,國內AIGC商業(yè)化已全面鋪開(kāi)
去年8月底,國內首批大模型產(chǎn)品通過(guò)《生成式人工智能服務(wù)管理暫行辦法》(下稱(chēng)《辦法》)備案,可正式上線(xiàn)面向公眾服務(wù)。
去年下半年,一批國內大模型陸續向社會(huì )開(kāi)放,C端商業(yè)化逐步鋪開(kāi)。此前,這些大模型廠(chǎng)商已開(kāi)始布局B端部分場(chǎng)景,與多家企業(yè)簽訂合約。當前國產(chǎn)AIGC在BC兩端同時(shí)發(fā)力,商業(yè)化全面鋪開(kāi),已腳踏實(shí)地開(kāi)啟賺錢(qián)之路。上述備案完成與《辦法》正式實(shí)施日相隔僅半個(gè)月,體現監管層對這一新興產(chǎn)業(yè)的鼓勵態(tài)度。
去年9月初,工信部和財政部聯(lián)合印發(fā)《電子信息制造業(yè)2023-2024年穩增長(cháng)行動(dòng)方案》再次強調了對人工智能和大模型發(fā)展的重視,表示要推動(dòng)先進(jìn)計算產(chǎn)業(yè)發(fā)展和行業(yè)應用。
目前,國內AIGC的產(chǎn)業(yè)架構分為基礎層、中間層和應用層。
整個(gè)AI生成內容鏈條第一層是基礎層,也是由大語(yǔ)言模型為基礎搭建的AIGC技術(shù)基礎設施層。
第二層為中間層,及垂直化、場(chǎng)景化、個(gè)性化的模型和應用工具。預訓練的大語(yǔ)言大模型是基礎設施,在此基礎上可以快速抽取生成場(chǎng)景化、定制化、個(gè)性化的小模型,實(shí)現在不同領(lǐng)域的應用部署。
第三層為應用層,面向C端的文字、圖片、視頻生成等內容的生成服務(wù)。側重于用戶(hù)的使用體驗和需求,使得用戶(hù)可以用消費級的顯卡算力挖掘豐富的內容,包括ChatGPT、Sora等等。
根據中國電子學(xué)數據,2021年中國人工智能核心產(chǎn)業(yè)市場(chǎng)規模為1300億元,同比增長(cháng)38.9%。根據《新一代人工智能發(fā)展規劃》,到2025年,我國人工智能核心產(chǎn)業(yè)規模將超過(guò)4000億元,帶動(dòng)相關(guān)產(chǎn)業(yè)規模超過(guò)5萬(wàn)億元。
投資方向怎么選?
中信證券研報認為,從投資角度來(lái)看,Sora背后的涌現能力為自動(dòng)駕駛、設計等需要現實(shí)世界建模的行業(yè)提供了明確方向。Gemini在短期內的部分商業(yè)場(chǎng)景表現可能會(huì )更為出色,尤其是需要結合圖片與文字的多模態(tài)應用場(chǎng)景。除去應用端的投資機會(huì ),硬件端的需求也必然會(huì )隨著(zhù)多模態(tài)的技術(shù)進(jìn)步而不斷提高。
從AI投資的角度看,嘉實(shí)基金大科技研究總監王貴重認為,隨著(zhù)OpenAI和GPT4的面世,意味著(zhù)AI從弱人工智能向強人工智能的邁進(jìn)。目前,AI行業(yè)正處在在一個(gè)爆發(fā)的起點(diǎn),未來(lái)隨著(zhù)大模型成本的不斷下降,AI賦能各行各業(yè)將會(huì )成為一種可能。所有跟信息技術(shù)相關(guān)的領(lǐng)域都會(huì )迎來(lái)一定程度的重塑,但仍有大量的長(cháng)尾的應用沒(méi)有得到顯著(zhù)的滿(mǎn)足。
目前科技投資的整體架構分為底層的基礎設施、芯片層、服務(wù)器層,云層,再到上面的大模型、專(zhuān)用模型,最后到各個(gè)行業(yè)的應用,未來(lái)需要在整體的研究圖譜中密切跟蹤各個(gè)行業(yè)的發(fā)展進(jìn)度。
最看好的環(huán)節依然是AI應用。第一,曾經(jīng)被互聯(lián)網(wǎng)改變的行業(yè)會(huì )再一次被AI改變。首先是內容,無(wú)論是一維媒介文字,二維媒介圖片,三維媒介視頻,四維媒介游戲,還是社交、搜索、短視頻、電商,我們用的互聯(lián)網(wǎng)應用都會(huì )集成AI功能。第二,軟件會(huì )從功能軟件到智能軟件,軟件的能力會(huì )進(jìn)一步提升,幫我們做更多的事情,交互也會(huì )更加友好。無(wú)論是辦公、OA、CRM、ERP,甚至一些專(zhuān)業(yè)的畫(huà)圖、EDA等工具。
*風(fēng)險提示:以上觀(guān)點(diǎn)不構成具體投資建議?;鹜顿Y需謹慎。投資人應當認真閱讀《基金合同》、《招募說(shuō)明書(shū)》、《產(chǎn)品資料概要》等基金法律文件,了解基金的風(fēng)險收益特征及其特有風(fēng)險,并根據自身的投資目的、投資期限、投資經(jīng)驗、資產(chǎn)狀況等判斷基金是否和投資人的風(fēng)險承受能力相適應?;鸸芾砣瞬槐WC基金一定盈利,也不保證最低收益或本金不受損失?;疬^(guò)往業(yè)績(jì)及其凈值高低并不預示其未來(lái)業(yè)績(jì)表現,基金管理人管理的其他基金的業(yè)績(jì)并不構成本基金業(yè)績(jì)表現的保證。
上一篇
中證A50:A股核心資產(chǎn)新名片 見(jiàn)證中國經(jīng)濟龍行向上
下一篇
看好大盤(pán)風(fēng)格,行業(yè)龍頭長(cháng)期配置價(jià)值凸顯