百度CTO王海峰:文心一言是百度技術(shù)積累和產(chǎn)業(yè)實(shí)踐的水到渠成
3月17日消息,百度日前在北京總部召開新聞發(fā)布會(huì),百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏和百度首席技術(shù)官(CTO)王海峰出席。
會(huì)上,李彥宏展示了新一代知識(shí)增強(qiáng)大語言模型文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成五個(gè)使用場(chǎng)景中的綜合能力,王海峰解讀了文心一言的技術(shù)特性及其背后的技術(shù)積累。
王海峰認(rèn)為,文心一言是百度多年技術(shù)積累和產(chǎn)業(yè)實(shí)踐的水到渠成,尤其是飛槳深度學(xué)習(xí)平臺(tái)和文心大模型的聯(lián)合優(yōu)化,為文心一言提供了堅(jiān)實(shí)的技術(shù)支撐。據(jù)介紹,文心大模型從2019年發(fā)布以來,已經(jīng)從最初的自然語言理解大模型,發(fā)展成了跨語言、跨模態(tài)、跨任務(wù)、跨行業(yè)的能力完備的大模型平臺(tái)。
據(jù)了解,文心一言是新一代知識(shí)增強(qiáng)大語言模型,也是百度繼文心一格之后的又一個(gè)生成式AI產(chǎn)品,具備對(duì)話交互、內(nèi)容創(chuàng)作、知識(shí)推理、多模態(tài)生成等能力。王海峰表示,新一代知識(shí)增強(qiáng)大語言模型文心一言,是在ERNIE及PLATO系列模型的基礎(chǔ)上研發(fā)的。
王海峰介紹,文心一言的關(guān)鍵技術(shù)包括有監(jiān)督精調(diào)、人類反饋的強(qiáng)化學(xué)習(xí)、提示、知識(shí)增強(qiáng)、檢索增強(qiáng)和對(duì)話增強(qiáng)。前三項(xiàng)是這類大語言模型都會(huì)采用的技術(shù),ERNIE和PLATO中已經(jīng)有應(yīng)用和積累,在文心一言中又有了進(jìn)一步強(qiáng)化和打磨;后三項(xiàng)則是百度已有技術(shù)優(yōu)勢(shì)的再創(chuàng)新,也是文心一言未來越來越強(qiáng)大的基礎(chǔ)。
圖源:百度官微,下同
在知識(shí)增強(qiáng)方面,文心一言的知識(shí)增強(qiáng)主要是通過知識(shí)內(nèi)化和知識(shí)外用兩種方式。知識(shí)內(nèi)化,是從大規(guī)模知識(shí)和無標(biāo)注數(shù)據(jù)中,基于語義單元學(xué)習(xí),利用知識(shí)構(gòu)造訓(xùn)練數(shù)據(jù),將知識(shí)學(xué)習(xí)到模型參數(shù)中;知識(shí)外用,是引入外部多源異構(gòu)知識(shí),做知識(shí)推理、提示構(gòu)建等。
在檢索增強(qiáng)方面,文心一言的檢索增強(qiáng),來自以語義理解與語義匹配為核心技術(shù)的新一代搜索架構(gòu)。通過引入搜索結(jié)果,可以為大模型提供時(shí)效性強(qiáng)、準(zhǔn)確率高的參考信息,更好地滿足用戶需求。
在對(duì)話增強(qiáng)方面,基于對(duì)話技術(shù)和應(yīng)用積累,文心一言具備記憶機(jī)制、上下文理解和對(duì)話規(guī)劃能力,實(shí)現(xiàn)更好的對(duì)話連貫性、合理性和邏輯性。
王海峰強(qiáng)調(diào),飛槳深度學(xué)習(xí)平臺(tái)支撐文心一言效果更好、效率更高、性能更強(qiáng)。他表示,文心大模型加上飛槳深度學(xué)習(xí)平臺(tái),夯實(shí)了產(chǎn)業(yè)智能化基座。隨著文心一言與飛槳平臺(tái)的進(jìn)一步融合發(fā)展,人工智能技術(shù)和應(yīng)用的研發(fā)將越來越標(biāo)準(zhǔn)化、自動(dòng)化和模塊化,加速人工智能的工業(yè)大生產(chǎn),同時(shí)也反哺文心一言加速迭代進(jìn)化,落地更多場(chǎng)景和行業(yè),為千行百業(yè)智能化升級(jí)帶來不竭動(dòng)力。
據(jù)王海峰介紹,如今,飛槳平臺(tái)已凝聚535萬開發(fā)者,服務(wù)20萬企事業(yè)單位,基于飛槳?jiǎng)?chuàng)建了67萬個(gè)模型。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn