近日,2024火山引擎AI創(chuàng)新巡展上海站活動正式舉辦。會上,火山引擎發(fā)布了豆包大模型一系列產(chǎn)品升級;鹕揭婵偛米T待表示,自豆包大模型正式發(fā)布以來,模型調(diào)用量快速增長,更豐富的業(yè)務(wù)場景也促進了模型關(guān)鍵能力的持續(xù)迭代升級。
以語言大模型為例,在過去的兩個月里,豆包通用模型pro、通用模型lite都完成了多項重要更新。測試數(shù)據(jù)表明,最新版豆包通用模型pro,對比三個月前的版本綜合能力提升了20.3%。
其中,角色扮演能力提升了38.3%,使得豆包模型帶來的對話更加生動、擬人度更高,AI交互流程更自然連貫,從而帶來更好的用戶留存。
語言理解能力則提升了33.3%,這讓大模型在信息分類、抽取、摘要總結(jié)、理解、知識問答等多項能力都有顯著增強,使其越來越多地出現(xiàn)在企業(yè)的生產(chǎn)力環(huán)節(jié)中,幫助企業(yè)解決真實的業(yè)務(wù)需求。
圖像創(chuàng)作方面,豆包大模型對“文生圖”模型做了升級迭代。新模型對長文本有了更精準的圖文匹配能力,并且對于多主體、多位置,以及手部結(jié)構(gòu)等難題,新模型都有大幅提升。
同時,新“文生圖”模型對于中國本土的人物、物品、藝術(shù)風(fēng)格都有更深一層的理解,可以圖文一致的創(chuàng)造出更多中國風(fēng)格的高美感圖片,進而廣泛應(yīng)用到設(shè)計、廣告、營銷、電商等多個領(lǐng)域,幫企業(yè)解決實際問題。
語音模型方面,火山引擎對語義識別準確性進行了相關(guān)升級,尤其是利用大模型豐富的知識儲備和強大的推理能力,結(jié)合上下文感知,提升語音識別的準確性。
對此,譚待以滑雪運動為例進行解釋;┻\動里有非常多專業(yè)術(shù)語,如立刃、搓雪等,如果沒有上下文理解,模型很難識別。豆包語音識別模型通過更精準的上下文感知,就可以讓模型更好理解其意義,讓整個語音識別的召回率提升15%,錯誤率比國內(nèi)公開的其他語音識別大模型相對降低了10%至40%。
同時,火山引擎還將豆包大模型和實時音頻技術(shù)(RTC)結(jié)合在一起,從而能夠提供端到端的大模型實時對話能力,企業(yè)可以將其接入自己的AI應(yīng)用中,讓用戶真正和模型直接、自由對話,讓用戶獲得與真人交流的體驗。
譚待介紹,通過推理,以及RTC的端到端優(yōu)化,火山引擎已經(jīng)可以把這類對話的延遲做到1秒以內(nèi),即使在網(wǎng)絡(luò)環(huán)境很差,可能80%丟包的情況下,仍保持清晰流暢的通話質(zhì)量。
譚待表示,火山引擎通過降價,將企業(yè)的試錯創(chuàng)新成本降到足夠低,使大模型真正成為了創(chuàng)新源泉;鹕揭娌粌H提供了更低的價格,也提供了更好的性能和吞吐。豆包通用模型pro支持初始800K的TPM,比行業(yè)平均水平高出4—5倍。(作者:唐明)
近日,中國家電及消費電子博覽會(AWE 2024)隆重開幕。全球領(lǐng)先的智能終端企業(yè)TCL實業(yè)攜多款創(chuàng)新技術(shù)和新品亮相,以敢為精神勇闖技術(shù)無人區(qū),斬獲四項AWE 2024艾普蘭大獎。
“以前都要去窗口辦,一套流程下來都要半個月了,現(xiàn)在方便多了!”打開“重慶公積金”微信小程序,按照提示流程提交相關(guān)材料,僅幾秒鐘,重慶市民曾某的賬戶就打進了21600元。
由世界人工智能大會組委會、上海市經(jīng)信委、徐匯區(qū)政府、臨港新片區(qū)管委會共同指導(dǎo),由上海市人工智能行業(yè)協(xié)會聯(lián)合上海人工智能實驗室、上海臨港經(jīng)濟發(fā)展(集團)有限公司、開放原子開源基金會主辦的“2024全球開發(fā)者先鋒大會”,將于2024年3月23日至24日舉辦。