智譜AI的AutoGLM后,Google和微軟也下場來做“賈維斯”了蘋果App Store摘要功能:自動生成、更新和報(bào)告不準(zhǔn)確的摘要極光通過DCMM3級認(rèn)證,數(shù)據(jù)管理能力獲權(quán)威認(rèn)可華為MatePad 11.5 2024款上市開售:售價(jià)1699元起惠普將向諾基亞支付專利使用費(fèi),結(jié)束視頻技術(shù)相關(guān)訴訟同程旅行榮獲江蘇省省級現(xiàn)代服務(wù)業(yè)高質(zhì)量發(fā)展領(lǐng)軍企業(yè)稱號求變,讓天貓雙11再次偉大?地平線的「護(hù)城河」與「攀云梯」,成就智駕科技企業(yè)樣本雷軍回應(yīng)小米SU7 Ultra車模秒售罄:產(chǎn)能很低抖音生活服務(wù)推出安心吃 最高賠付訂單3倍等額券史上最長雙11,電商新手視頻號小紅書能“上大分”嗎?AI旅行解決方案提供商視旅科技獲億元A輪融資華為Mate70零部件已開始供貨,首批備貨量增加30%Redmi K80 Pro 手機(jī)相機(jī)規(guī)格曝光:5000 萬像素主攝抖音外賣再調(diào)整:上線隨心團(tuán),到家到店統(tǒng)一入口蘋果M4 Pro Mac mini支持外接三臺6K顯示屏京東回應(yīng)App內(nèi)支持支付寶:為用戶提供多樣化支付方式81.49萬買的值!小米SU7 Ultra自帶聲浪外放音響 雷軍現(xiàn)場播放音浪炸場ChatGPT新增重磅功能!能打造自己的聊天數(shù)據(jù)庫了大模型的苦,創(chuàng)業(yè)的AI 科學(xué)家最懂
  • 首頁 > 云計(jì)算頻道 > 大模型

    中國AI企業(yè)創(chuàng)造性壓低大模型成本 部分價(jià)格下降90%以上

    2024年10月21日 18:03:35   來源:愛集微

       由于面臨美國芯片限制和比西方同行更少的預(yù)算,中國人工智能(AI)公司正在降低成本以創(chuàng)建具有競爭力的模型。01.ai(零一萬物)和DeepSeek(深度求索)等初創(chuàng)公司通過采取一些策略來降低價(jià)格,例如專注于較小的數(shù)據(jù)集來訓(xùn)練人工智能模型,以及聘請低價(jià)但熟練的計(jì)算機(jī)工程師。

      阿里巴巴、百度和字節(jié)跳動等大型科技集團(tuán)也展開了價(jià)格戰(zhàn),以降低“推理”成本(即調(diào)用大型語言模型生成響應(yīng)的價(jià)格),大模型價(jià)格下降90%以上,僅為美國同行的一小部分。

      總部位于北京的01.ai由前谷歌中國區(qū)總裁李開復(fù)領(lǐng)導(dǎo),該公司表示,通過構(gòu)建以較少數(shù)據(jù)量進(jìn)行訓(xùn)練、需要較少計(jì)算能力的模型并優(yōu)化硬件,該公司已經(jīng)降低了推理成本。

      李開復(fù)表示:“中國的優(yōu)勢在于制造出真正價(jià)格實(shí)惠的推理引擎,然后讓其應(yīng)用廣泛傳播。”

      近日,在加州大學(xué)伯克利分校SkyLab和LMSYS的研究人員發(fā)布的排名中,01.ai的Yi-Lightning模型與馬斯克名下公司x.AI的Grok-2在LLM(大模型)公司中并列第三,但落后于OpenAI和谷歌。

      評估基于用戶對不同模型對查詢答案的評分。字節(jié)跳動、阿里巴巴和DeepSeek等其他中國公司也在大模型排名榜上名列前茅。

      01.ai的Yi-Lightning的推理成本為每百萬token 14美分,而OpenAI的較小模型GPT o1-mini的推理成本為26美分。與此同時(shí),OpenAI規(guī)模更大的GPT 4o的推理成本為每百萬token 4.40美元。用于生成響應(yīng)的token數(shù)量取決于查詢的復(fù)雜性。

      李開復(fù)還表示,Yi-Lightning的“預(yù)訓(xùn)練”成本為300萬美元,初始模型訓(xùn)練之后可以針對不同用例進(jìn)行微調(diào)或定制。這只是OpenAI等公司對其大型模型所報(bào)成本的一小部分。他補(bǔ)充說,其目標(biāo)不是擁有“最佳模型”,而是一個(gè)具有競爭力的模型,開發(fā)人員使用它來構(gòu)建應(yīng)用程序的成本“要低5到10倍”。

      01.ai、DeepSeek、MiniMax、Stepfun等許多中國人工智能團(tuán)體都采用了所謂的“混合專家模型(MoE)”方法,這一策略首先由美國研究人員推廣。

      該方法不是在從互聯(lián)網(wǎng)和其他來源抓取數(shù)據(jù)的龐大數(shù)據(jù)庫上一次性訓(xùn)練一個(gè)“密集模型”,而是結(jié)合了許多針對行業(yè)特定數(shù)據(jù)進(jìn)行訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。

      研究人員認(rèn)為,混合專家模型方法是實(shí)現(xiàn)與密集模型相同智能水平但計(jì)算能力較低的關(guān)鍵方法。但這種方法更容易失敗,因?yàn)楣こ處煴仨殔f(xié)調(diào)多個(gè)“專家”的訓(xùn)練過程,而不是在一個(gè)模型中。

      由于難以獲得穩(wěn)定充足的高端人工智能芯片供應(yīng),中國人工智能企業(yè)在過去一年中一直在競相開發(fā)最高質(zhì)量的數(shù)據(jù)集,以訓(xùn)練這些“專家”,從而使自己在競爭中脫穎而出。

      李開復(fù)說:“中國的優(yōu)勢不在于在預(yù)算不受限制的情況下,進(jìn)行前所未有的突破性研究。中國的優(yōu)勢在于建設(shè)得好、快、可靠且便宜。”

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    即時(shí)

    新聞

    敢闖技術(shù)無人區(qū) TCL實(shí)業(yè)斬獲多項(xiàng)AWE 2024艾普蘭獎(jiǎng)

    近日,中國家電及消費(fèi)電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實(shí)業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項(xiàng)AWE 2024艾普蘭大獎(jiǎng)。

    企業(yè)IT

    重慶創(chuàng)新公積金應(yīng)用,“區(qū)塊鏈+政務(wù)服務(wù)”顯成效

    “以前都要去窗口辦,一套流程下來都要半個(gè)月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進(jìn)了21600元。

    3C消費(fèi)

    “純臻4K 視界煥新”——愛普生4K 3LCD 激光工程投影

    2024年3月12日,由愛普生舉辦的主題為“純臻4K 視界煥新”新品發(fā)布會在上海盛大舉行。

    研究

    2024全球開發(fā)者先鋒大會即將開幕

    由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實(shí)驗(yàn)室、上海臨港經(jīng)濟(jì)發(fā)展(集團(tuán))有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。