Sora如果真的朝智能制造方向去做,黑燈工廠、自動(dòng)駕駛、數(shù)字孿生中的一系列難題,有希望得到解決。
文|趙艷秋
OpenAI推出Sora后,立刻在影視界、廣告界和游戲業(yè)炸開(kāi)了鍋,但因?yàn)樗鳛?ldquo;模擬器”,在模擬世界上的局限性,很多人并沒(méi)想到會(huì)與智能制造沾上邊。
但一些智能制造的專(zhuān)家,已對(duì)Sora進(jìn)行了觀察研究,看到了底層邏輯的相通之處,也想到了一些結(jié)合點(diǎn)。“如果業(yè)界真的朝智能制造方向去做的話,黑燈工廠、自動(dòng)駕駛、數(shù)字孿生中的一系列難題,是有希望解決的。”幾位智能制造專(zhuān)家說(shuō)。
一個(gè)有意思的現(xiàn)象是,自從2022年底ChatGPT大模型推出后,技術(shù)派、大模型廠商、創(chuàng)業(yè)者出來(lái)說(shuō)得多,但制造企業(yè)和行業(yè)人士鮮有發(fā)聲。“有一點(diǎn)過(guò)度消費(fèi)了,每周都有爆炸式的技術(shù)推出,但它們的落地在哪里?產(chǎn)生了什么商業(yè)價(jià)值?”一位制造人士說(shuō)。一些制造企業(yè)感到焦慮,背后的原因是從技術(shù)到應(yīng)用,中間仍有一些間隙需要彌合。
不過(guò),經(jīng)過(guò)過(guò)去半年的摸索和嘗試,2024年,伴隨政府發(fā)展新質(zhì)生產(chǎn)力,以及一些央國(guó)企在大模型應(yīng)用上的動(dòng)作加快,在智能制造業(yè),尤其是在那些變化快、競(jìng)爭(zhēng)激烈的行業(yè),應(yīng)用大模型創(chuàng)新的進(jìn)程正在提速。
01
Sora能用于制造業(yè)嗎?
Sora推出后,OPPO AI中心產(chǎn)品總監(jiān)張峻,對(duì)生成式AI的迭代速度感到驚訝,“幾乎每天早上起來(lái),都會(huì)看到一個(gè)有意思的新demo”。未來(lái),用戶怎么調(diào)用這些生成式AI,可能將給手機(jī)帶來(lái)架構(gòu)、交互等全方位的改變。OPPO內(nèi)部也在探索。
在終端的變化上,業(yè)界已有一些明確的方向。比如,在短期之內(nèi),可能就會(huì)發(fā)生兩個(gè)較大的變化。一是去App化。大模型本身具備生態(tài)插件及融合能力,它自己會(huì)去調(diào)用服務(wù)接口,不需要打開(kāi)App。第二是搜索入口的變化。大模型本身外部檢索能力非常強(qiáng),多模態(tài)能力也非常強(qiáng),它就是一個(gè)好的搜索入口。
一家車(chē)企人工智能資深人士在Sora推出后,也進(jìn)行了觀察思考。對(duì)于車(chē)廠,他認(rèn)為Sora有一定應(yīng)用場(chǎng)景和價(jià)值。在自動(dòng)駕駛的訓(xùn)練中,他們已用大模型做數(shù)據(jù)生成,但大都是靜態(tài)數(shù)據(jù)。“交通流這些動(dòng)態(tài)數(shù)據(jù),Sora目前還達(dá)不到要求,但至少是看到一些希望。”
在合成數(shù)據(jù)方面,車(chē)企原來(lái)要基于虛擬環(huán)境(元宇宙)去做,而虛擬環(huán)境需要拍攝一些視頻,用Nerf做3D重建,但成本不小,很多地方還不能拍攝。“其實(shí)智能駕駛只關(guān)心場(chǎng)景,不關(guān)心跟地標(biāo)相關(guān)的東西,因此合成數(shù)據(jù)場(chǎng)景對(duì)Sora這類(lèi)技術(shù)的需求應(yīng)該也很大。”
在浪潮信息,硬件研發(fā)部副總經(jīng)理王武軍和團(tuán)隊(duì)之前已介入AIGC的訓(xùn)練中。王武軍從Sora生成的視頻看,“那個(gè)東京街頭,地面上雨水的反光,已逐漸接近于可接受的現(xiàn)實(shí)”。
Sora的底層邏輯是通過(guò)大量數(shù)據(jù)訓(xùn)練而來(lái),現(xiàn)在制造業(yè)有很多地方是人去推算的。如果數(shù)據(jù)量極強(qiáng)的話,運(yùn)用Sora的模式,有希望對(duì)產(chǎn)品設(shè)計(jì)、仿真、柔性安裝和運(yùn)維帶來(lái)改變。
“我現(xiàn)在沒(méi)辦法說(shuō)明它未來(lái)是一個(gè)什么形態(tài),但它將是顛覆性的。”王武軍打了一個(gè)比方,業(yè)界的一個(gè)難題是“柔性安裝”。比如,服務(wù)器機(jī)箱中有幾十條線,這些線怎么“繞”、怎么指揮機(jī)械臂去安裝。
可行的做法是,針對(duì)每條線纜,需要工程師做一個(gè)3D模型。根據(jù)配置不同,一根線纜要插在不同的位置,需要數(shù)十種3D模型,而組裝過(guò)程中,又需要臨時(shí)調(diào)整,從而導(dǎo)致柔性物體自動(dòng)化安裝事倍功半,不太現(xiàn)實(shí)。如果能通過(guò)數(shù)據(jù)訓(xùn)練,自動(dòng)生成“繞線”方式,再直接將數(shù)據(jù)提取出來(lái),告訴機(jī)械臂怎么去組裝,這個(gè)問(wèn)題就解決了。
做仿真的工業(yè)軟件人士也注意到了Sora。“你看Sora視頻中那位女主角走路的姿態(tài),如果結(jié)合了仿真工具,會(huì)更加自然,現(xiàn)在太空靈了。”CAE人士李巖說(shuō)。仿真軟件可以模擬復(fù)雜的機(jī)器、產(chǎn)品,他看到了Sora和仿真的結(jié)合之處。
“現(xiàn)在仿真迭代的過(guò)程很長(zhǎng),如果前期通過(guò)Sora的方式,讓仿真不從最差的初始條件去計(jì)算,整體計(jì)算時(shí)間會(huì)大大縮短。”他說(shuō),“后期也可以對(duì)仿真結(jié)果去做優(yōu)化。”
由于Sora自稱(chēng)是要做“世界模擬器”,業(yè)界也在對(duì)比Sora和數(shù)字孿生的一些差異。數(shù)字孿生是真實(shí)世界數(shù)據(jù)化后的投影。而Sora是基于模擬樣本,構(gòu)建虛擬和真實(shí)交錯(cuò)的數(shù)字世界。
由于大模型有不同的數(shù)據(jù)源,通過(guò)Sora來(lái)模擬世界,帶有一定的想象力和發(fā)散性。比如,在Sora生成的一個(gè)視頻,一只小螞蟻穿越洞穴,這在現(xiàn)實(shí)中無(wú)法拍攝到。但也有網(wǎng)友指出它的漏洞:螞蟻是一個(gè)二維生物,走起路來(lái)不像人,它們會(huì)漫無(wú)目的、來(lái)來(lái)回回,這個(gè)Sora生成的視頻,與潛在物理規(guī)律有一些偏差。
“現(xiàn)階段可以理解Sora是數(shù)字化孿生的一種手段和補(bǔ)充,而不是替代。Sora可用于真實(shí)世界在虛擬世界的美化展示,以及替代人工建模與設(shè)計(jì)的生成,幫助數(shù)字孿生加速。” 聯(lián)想中國(guó)區(qū)大客戶業(yè)務(wù)群及制造行業(yè)總經(jīng)理宋濤說(shuō)。Sora可以用于設(shè)計(jì)階段的效果構(gòu)建,或產(chǎn)品的生產(chǎn)構(gòu)建效果,但沒(méi)法替代數(shù)字孿生的數(shù)據(jù)視圖等功能。
宋濤認(rèn)為,未來(lái)兩者可能會(huì)整合,也可能形成一個(gè)新技術(shù)合集或新突破,如混合宇宙等,但目前看到他們技術(shù)線路的差異,需要有一定的技術(shù)突破才能實(shí)現(xiàn)。
”如果明白現(xiàn)有技術(shù)的局限性,在揚(yáng)長(zhǎng)避短的前提下,它們?cè)谀承﹫?chǎng)景下仍然具有價(jià)值。“IEEE數(shù)字化轉(zhuǎn)型聯(lián)合會(huì)戰(zhàn)略與架構(gòu)主席汪齊齊說(shuō)。
Sora的發(fā)散性,讓它有新的空間。“像我們一些高端汽車(chē)客戶,需求越來(lái)越個(gè)性化?梢愿鶕(jù)客戶的描述,馬上生成一個(gè)視頻推給他,然后再完善設(shè)計(jì)。”ERP軟件廠商Infor大中華區(qū)商業(yè)咨詢(xún)高級(jí)總監(jiān)鹿崇說(shuō)。類(lèi)似的還有外觀設(shè)計(jì)、車(chē)衣、涂鴉等,這是進(jìn)入研發(fā)之前的一個(gè)環(huán)節(jié)。
關(guān)于成本,業(yè)界有種猜測(cè),Sora生成1分鐘視頻,大約要8塊A800計(jì)算3小時(shí),成本接近90美元。“To B這么一條,以往按照每秒幾千收費(fèi),Sora的價(jià)格還是便宜的。”數(shù)碼產(chǎn)品資深人士、Angry Miao創(chuàng)始人李楠向數(shù)智前線估算。這讓業(yè)界看到了它在上述應(yīng)用中的巨大潛力。
目前關(guān)于Sora這類(lèi)技術(shù)和制造的結(jié)合,一位人士稱(chēng),“Demo和產(chǎn)品還沒(méi)到落地狀態(tài),但大家有方向,有思路”。
02
制造業(yè)已用了哪些AIGC技術(shù)?
除了Sora之外,在ChatGPT發(fā)布之后,大模型已在制造業(yè)有什么落地進(jìn)展嗎?
聯(lián)想宋濤從智算資源分布的角度告訴數(shù)智前線,目前國(guó)內(nèi)對(duì)大模型的需求,70%的生意在互聯(lián)網(wǎng),10%在科研單位,落在制造業(yè),主要的機(jī)會(huì)是汽車(chē)自動(dòng)駕駛。
幾位車(chē)企資深人士告訴數(shù)智前線,過(guò)去幾年,汽車(chē)行業(yè)越來(lái)越卷。車(chē)企的錢(qián)在往微笑曲線的兩端投,一個(gè)是研發(fā)端,一個(gè)是營(yíng)銷(xiāo)服務(wù)端。在制造端,過(guò)去半年,沒(méi)有看到典型場(chǎng)景。而大模型落地的主要場(chǎng)景,集中在智能駕駛、營(yíng)銷(xiāo)服務(wù)和智能座艙。
比如,智能駕駛中的數(shù)據(jù)合成以及數(shù)據(jù)標(biāo)注;在售后服務(wù)上,當(dāng)遇到一些不常見(jiàn)的故障,大模型可以找到與描述最接近的情況,迅速給出排序,輔助售后服務(wù)人員,幫助車(chē)主一一排查,這樣的售后服務(wù)接受度較高。
今年大家競(jìng)爭(zhēng)的一個(gè)焦點(diǎn)是智能座艙。預(yù)計(jì)上半年,一些車(chē)企就會(huì)陸續(xù)官宣接入大模型。不過(guò),業(yè)界在智能座艙中還未找到爆炸式場(chǎng)景,今年要進(jìn)一步挖掘場(chǎng)景。
2024年車(chē)企在大模型上的預(yù)算普遍在千萬(wàn)級(jí)以上,用于自動(dòng)駕駛、智能座艙或是大模型私有云部署等。這比2023年有顯著提升。
除了汽車(chē)行業(yè),其他智能制造業(yè)在研產(chǎn)供銷(xiāo)服,都有一些進(jìn)展。
浪潮信息王武軍他們基于“源”大模型,已就研發(fā)的三個(gè)方向進(jìn)行訓(xùn)練。一個(gè)方向是為工程師訓(xùn)練出一個(gè)助手“賈維斯”。另一個(gè)是智能教練系統(tǒng),有點(diǎn)像“科大訊飛學(xué)習(xí)機(jī)”,帶著工程師學(xué)習(xí)和反復(fù)訓(xùn)練。還有一個(gè)方向是軟件設(shè)計(jì),將通過(guò)代碼自動(dòng)生成,實(shí)現(xiàn)服務(wù)器的相關(guān)軟硬結(jié)合環(huán)節(jié)。目前,這幾個(gè)方向內(nèi)部已開(kāi)始測(cè)試,處于持續(xù)優(yōu)化過(guò)程中。
在制造環(huán)節(jié),騰訊云智能制造專(zhuān)家邴金友印象深刻的是,一家代工企業(yè)要處理多個(gè)客戶的產(chǎn)品圖紙。結(jié)合大模型技術(shù),他們迅速將圖紙結(jié)構(gòu)化,直接輸入到SMT產(chǎn)線,驅(qū)動(dòng)它的貼片機(jī)生產(chǎn),降本增效明顯。
在智能客服領(lǐng)域,大模型已可以替代人。宋濤介紹,聯(lián)想在電話呼叫中心中,建立了基于AI智能的Q&A系統(tǒng),可以偵測(cè)到服務(wù)人員在服務(wù)過(guò)程中的關(guān)鍵詞,提供專(zhuān)業(yè)的技術(shù)指導(dǎo)。
在營(yíng)銷(xiāo)方向,有高端裝備企業(yè),嘗試將AI與市場(chǎng)活動(dòng)等結(jié)合起來(lái),撰寫(xiě)策劃文案。美的集團(tuán)也將AI接入到集團(tuán)的系統(tǒng)中,對(duì)文稿等基本的日常工作,做輔助測(cè)試。
鹿崇看到大模型已應(yīng)用到了制造業(yè)的定價(jià)和運(yùn)維上。在定價(jià)方面,很多制造企業(yè)的產(chǎn)品定價(jià)缺乏針對(duì)性,很難根據(jù)產(chǎn)品歷史銷(xiāo)售、市場(chǎng)環(huán)境、成本因素等變化適時(shí)科學(xué)的調(diào)整。AI技術(shù)的使用,使得定價(jià)模型成為可能。
在運(yùn)維方面,大量的數(shù)據(jù)已讓工廠中的機(jī)器開(kāi)口“說(shuō)話”。在機(jī)器發(fā)生疲勞之后,一些模型結(jié)合起來(lái),可以做到預(yù)防性/預(yù)測(cè)性維護(hù)策略更科學(xué)。
而大模型最直接的應(yīng)用落地是產(chǎn)品,比如AIPC、AI手機(jī)。
在過(guò)去一年,邴金友看到,像光伏、新能源或新型高端裝備業(yè),所處的市場(chǎng)競(jìng)爭(zhēng)壓力較大、變化較快,更愿意采用大模型創(chuàng)新技術(shù)。另外,一些制造企業(yè)的三產(chǎn)或數(shù)科公司,對(duì)大模型的接受度也較高。
“大模型在制造業(yè)有點(diǎn)狀落地。按照Gartner的技術(shù)曲線,目前處于上升期。”邴金友介紹。
03
面對(duì)大模型,制造業(yè)要做哪些準(zhǔn)備?
從2024年開(kāi)始,幾乎每周,大模型都有“爆炸性”新聞推出。而根據(jù)業(yè)界的信息,在接下來(lái),仍有一些公司的大招放出。阿里巴巴集團(tuán)副總裁、瓴羊CEO朋新宇接觸的不少企業(yè),焦慮于自己不知道該怎么做。在焦慮不斷延伸下,社會(huì)上也出現(xiàn)了“AI的盡頭是賣(mài)課”這樣一些社會(huì)怪相。
鹿崇坦承,現(xiàn)在概念談得多,但真正的應(yīng)用還要一步步做。
“如果落到企業(yè)層面,無(wú)非是三樣?xùn)|西:算力、企業(yè)的數(shù)據(jù),以及企業(yè)的人才。”朋新宇分析說(shuō),從算力來(lái)講,除了OpenAI等少數(shù)企業(yè),對(duì)大多數(shù)企業(yè)而言,大家的起跑線幾乎一樣。
從數(shù)據(jù)來(lái)說(shuō),OpenAI已把地球上所有的公開(kāi)數(shù)據(jù)基本上都收集完了,但是對(duì)企業(yè)最有價(jià)值的數(shù)據(jù),往往是企業(yè)的自有數(shù)據(jù),這部分是OpenAI收集不到的。企業(yè)要考慮如何把這些數(shù)據(jù)的質(zhì)量提升,變成好的資產(chǎn),與大模型結(jié)合。“我覺(jué)得這是企業(yè)能抓得住的、實(shí)實(shí)在在的投入。”
從人才來(lái)說(shuō),對(duì)于大多數(shù)企業(yè)來(lái)講,去找AI領(lǐng)域的大牛,本質(zhì)上并沒(méi)有必要,關(guān)鍵是現(xiàn)在這樣的人才也找不到。企業(yè)反而需要那些理解如何應(yīng)用大模型,如何與企業(yè)工作流去對(duì)話,將大模型的能力轉(zhuǎn)變成企業(yè)生產(chǎn)力的一撥人。“企業(yè)要抓得住這撥人。”
汪齊齊則強(qiáng)調(diào)了行業(yè)專(zhuān)家的力量。他以直播帶貨為例,社交平臺(tái)的興起,解放了個(gè)人的生產(chǎn)力,改變了許多傳統(tǒng)行業(yè)的運(yùn)作模式。但是,這種模式的成功,往往依賴(lài)于對(duì)特定行業(yè)深入了解的專(zhuān)家。”例如,一個(gè)精通化妝品銷(xiāo)售的專(zhuān)家可能不擅長(zhǎng)電子產(chǎn)品的直播銷(xiāo)售,反之亦然。“他說(shuō),盡管技術(shù)為各個(gè)領(lǐng)域提供了不同程度新的機(jī)會(huì),但真正的專(zhuān)業(yè)知識(shí)和行業(yè)理解仍然是不可或缺的。
“不管大模型未來(lái)以什么樣的姿態(tài)出現(xiàn),它一定會(huì)出現(xiàn)。”朋新宇說(shuō),企業(yè)要做好準(zhǔn)備。
“人工智能屬于智能制造第5級(jí)可以實(shí)現(xiàn)的目標(biāo)。”聯(lián)想宋濤說(shuō),企業(yè)需要從基本的業(yè)務(wù)梳理,軟件應(yīng)用和平臺(tái)打通等數(shù)字化工作開(kāi)始落實(shí),打好地基。而這些也需要基礎(chǔ)架構(gòu)的支持,云計(jì)算、混合云、數(shù)據(jù)安全、數(shù)據(jù)管理等基礎(chǔ)工作,這也是幫助企業(yè)重新梳理IT、OT、DT、ET等之間的機(jī)會(huì)。
宋濤也提到了人工智能技術(shù)落地的四大要素——算力、數(shù)據(jù)、算法和場(chǎng)景。其中,場(chǎng)景是驅(qū)動(dòng),要挖掘能夠利用AI降本提效的場(chǎng)景。算力是底層支撐,數(shù)據(jù)是養(yǎng)分,而算法是人工智能技術(shù)形成的價(jià)值。
他建議,在人工智能落地中,優(yōu)先做好算力建設(shè)和數(shù)據(jù)存儲(chǔ),再做好數(shù)據(jù)治理和數(shù)據(jù)價(jià)值的挖掘;用高質(zhì)量數(shù)據(jù),去訓(xùn)練好對(duì)應(yīng)的算法,從而對(duì)業(yè)務(wù)產(chǎn)生價(jià)值。而AI的落地,也需要對(duì)應(yīng)的人才,分步、分期通過(guò)技術(shù)實(shí)現(xiàn)。
朋新宇提到上周政府工作報(bào)告中的“發(fā)展新質(zhì)生產(chǎn)力”。“大模型用于智能制造是眾望所歸。”他說(shuō),從OpenAI這一年的動(dòng)作來(lái)看,它打開(kāi)了新的空間——人類(lèi)的空間、經(jīng)濟(jì)的空間以及企業(yè)發(fā)展的空間。“本質(zhì)上,目前行業(yè)里還沒(méi)有看到真正顛覆性的改變,但這也是離企業(yè)現(xiàn)場(chǎng)更近的這些人們的職責(zé)。”
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
特斯拉最近發(fā)布了一段視頻,展示了其人形機(jī)器人Optimus(擎天柱)的新功能和進(jìn)展,試圖回應(yīng)外界對(duì)其智能水平的質(zhì)疑。
近日,中國(guó)家電及消費(fèi)電子博覽會(huì)(AWE 2024)隆重開(kāi)幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無(wú)人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。
“以前都要去窗口辦,一套流程下來(lái)都要半個(gè)月了,現(xiàn)在方便多了!”打開(kāi)“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。
由世界人工智能大會(huì)組委會(huì)、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會(huì)共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會(huì)聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開(kāi)放原子開(kāi)源基金會(huì)主辦的“2024全球開(kāi)發(fā)者先鋒大會(huì)”,將于2024年3月23日至24日舉辦。