百度首席技術官王海峰談文心大模型3.5
7月30日消息,主題為“通用智能,人機共生”的學術會議ACM中國圖靈大會于7月28日-30日在武漢舉辦,百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰解讀文心大模型的核心技術,闡述人工智能產業(yè)模式。
據介紹,百度在“芯片-框架-模型-應用”人工智能四層技術棧全面布局,自研的深度學習平臺飛槳支撐了文心大模型的高效訓練和推理,截至目前飛槳平臺開發(fā)者數量已達到750萬。IDC報告顯示,百度穩(wěn)居中國深度學習平臺市場綜合份額第一。根據中國信通院發(fā)布的《深度學習平臺報告(2022)》,飛槳是中國深度學習市場應用規(guī)模第一的深度學習框架和賦能平臺。
圖源:百度AI公眾號
文心一言是百度自主研制的知識增強大語言模型,首先從數萬億數據和數千億知識中融合學習得到預訓練大模型,在此基礎上采用有監(jiān)督精調、人類反饋的強化學習和提示等技術,并具備知識增強、檢索增強和對話增強等技術優(yōu)勢。
王海峰解讀了文心大模型3.5的核心技術創(chuàng)新,通過飛槳與文心協同優(yōu)化,文心大模型3.5實現了基礎模型升級、精調技術創(chuàng)新、知識點增強、邏輯推理增強等,模型效果提升50%,訓練速度提升2倍,推理速度提升30倍。
在基礎模型訓練上,采用了飛槳最先進的自適應混合并行訓練技術及混合精度計算策略,并采用多種策略優(yōu)化數據源及數據分布,加快了模型迭代速度,顯著提升了模型效果和安全性。同時,百度研發(fā)團隊創(chuàng)新了多類型多階段有監(jiān)督精調、多層次多粒度獎勵模型、多損失函數混合優(yōu)化策略、雙飛輪結合的模型優(yōu)化等技術,進一步提升模型效果及場景適配能力。
百度文心大模型全景圖;圖源:百度AI公眾號
在知識增強和檢索增強基礎上,文心大模型3.5提出了“知識點增強技術”,使得模型能夠更好地利用精細的知識點來提升理解生成等方面的能力,進而提升對世界知識的掌握和運用。
在推理方面,通過大規(guī)模邏輯數據構建、邏輯知識建模、多粒度語義知識組合以及符號神經網絡技術,提升文心大模型3.5在邏輯推理、數學計算及代碼生成等任務上的表現。
文心大模型3.5還新增了插件機制,包括官方插件百度搜索和ChatFile,使得文心一言能夠生成實時準確信息和長文本摘要,拓展了大模型能力邊界。
根據IDC最新發(fā)布的《AI大模型技術能力評估報告,2023》,百度文心大模型3.5在14個參評模型中拿下12項指標的7個滿分,得到“綜合評分第一,算法模型第一,行業(yè)覆蓋第一”三個絕對第一。
圖源:百度AI公眾號
王海峰在演講中展示了文心一言的問答對話、文案生成、行程規(guī)劃等能力,以及在辦公、會議、編碼等場景的應用。
工作中,文心一言化身“超級助理”,幫助總結工作溝通要點,實時記錄會議內容,形成會議議題、摘要及總結等關鍵信息,可以通過各類插件完成指令任務,包括查詢日程、創(chuàng)建會議、設置待辦、申請休假等,也可以在工程師編碼過程中自動推薦和生成代碼。據悉,目前這些功能已通過智能工作平臺“如流”應用于百度的工作流程中,Comate智能編碼伙伴幫助80%百度工程師提升編程效率,吸引100多家合作伙伴。
對于大模型的產業(yè)模式,王海峰表示,在文心一言這類大模型產業(yè)落地的進程中,可以采用“集約化生產,平臺化應用”的模式,即具有算法、算力和數據綜合優(yōu)勢的企業(yè)將模型生產的復雜過程封裝起來,通過低門檻、高效率的生產平臺,為千行百業(yè)提供大模型服務,支撐產業(yè)智能化升級。
2、電商號平臺僅提供信息存儲服務,如發(fā)現文章、圖片等侵權行為,侵權責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯系:info@dsb.cn