阿里云宣布通義千問開源,用戶可以免費商用
1.阿里云開源通義千問70億參數(shù)模型
阿里大模型往開源道路上前進。
近日,阿里云開源通義千問70億參數(shù)模型,包括通用模型Qwen-7B和對話模型Qwen-7B-Chat。
具體來看,Qwen-7B是支持中、英等多種語言的基座模型,Qwen-7B-Chat是基于基座模型的中英文對話模型,已實現(xiàn)與人類認知對齊。
據(jù)介紹,這兩款開源模型均已上線魔搭社區(qū),開源、免費、可商用。用戶既可從魔搭社區(qū)直接下載模型,也可通過阿里云靈積平臺訪問和調(diào)用Qwen-7B和Qwen-7B-Chat,阿里云為用戶提供包括模型訓(xùn)練、推理、部署、精調(diào)等在內(nèi)的服務(wù)。
此次上線兩款開源模型,讓阿里云成為了國內(nèi)首個加入大模型開源行列的大型科技企業(yè)。
開源,簡單來說,就是指開放的源代碼,過去通常指公開某款軟件項目的源代碼。人工智能三要素包括算法、算力和數(shù)據(jù)。從人工智能方面看,大語言模型的開源,其源碼在算法上。算法的核心部分主要包括有模型結(jié)構(gòu)和訓(xùn)練方法,這兩部分都有對應(yīng)的源碼。
開源模型,也就是開源訓(xùn)練好的模型參數(shù),這些模型是通過大量數(shù)據(jù)和算力訓(xùn)練出來的。站在企業(yè)的角度,阿里云上線這兩款開源模型,能夠幫助其他大中小企業(yè)簡化模型訓(xùn)練和部署,極大降低了企業(yè)訓(xùn)練模型的成本。
站在阿里云角度,開源模型能夠讓阿里云建立起一個繁榮的開源社區(qū)生態(tài),助力阿里云開源大模型的發(fā)展。
事實上,阿里云已經(jīng)在構(gòu)建開源模型社區(qū)上有所部署。魔塔社區(qū)就是去年推出的AI模型社區(qū),魔搭社區(qū)成立初衷就是通過開源開放、共建社區(qū)生態(tài)的方式,讓AI開發(fā)使用更簡單。經(jīng)過半年左右的發(fā)展,魔搭成為了國內(nèi)規(guī)模最大AI模型開源社區(qū)。
(圖源:阿里云開發(fā)社區(qū))
阿里云表示,開源大模型可以幫助用戶簡化模型訓(xùn)練和部署的過程,用戶不必從頭訓(xùn)練模型,只需下載預(yù)訓(xùn)練好的模型并進行微調(diào),就可快速構(gòu)建高質(zhì)量的模型。
今年,在世界人工智能大會上,阿里云CTO周靖人透露,阿里云魔搭社區(qū)已聚集180萬AI開發(fā)者和由20多家頂尖人工智能機構(gòu)貢獻的900多個優(yōu)質(zhì)AI模型,將努力把魔搭社區(qū)培育成中國最大的“大模型自由市場”。
開源大模型平臺的不斷完善以及開源生態(tài)的日益繁榮發(fā)展,將助推中國大模型的技術(shù)進步與應(yīng)用落地。
2.阿里云首個加入大模型開源行列
今年4月,阿里云就推出了大模型通義千問。在短短幾個月的時間,阿里云發(fā)布了通義系列大模型,例如,通義聽悟、通義萬相等語言、視覺、多模態(tài)的AIGC工具。
通義千問,是阿里云推出的一個超大規(guī)模的語言模型,功能包括多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持,能夠跟人類進行多輪的交互,也融入了多模態(tài)的知識理解,且有文案創(chuàng)作能力,能夠續(xù)寫小說,編寫郵件等。
(圖源:通義千問官網(wǎng))
那么,阿里云成為國內(nèi)首個加入大模型開源行列的大型科技企業(yè)意味著什么呢?
通義千問成為第一個科技大廠的開源大模型,或許意味著國內(nèi)已經(jīng)白熱化階段的“百模大戰(zhàn)”,進入了一個新階段。
我們需要清楚的是,大模型有開源模型和閉源模型之分。也就是說,不同企業(yè)會結(jié)合自己的戰(zhàn)略需要來選擇開源或者不開源。例如,盤古大模型不采用任何開源技術(shù),華為云相關(guān)負責(zé)人表示,由于華為云盤古大模型定位于賦能千行百業(yè),這里面必將聚集無數(shù)行業(yè)大數(shù)據(jù)(涉及行業(yè)機密等),因此未來盤古大模型不會開源。
不過,總的趨勢來看,大模型的開源將會成為行業(yè)主要發(fā)展趨勢,各大模型廠商需要通過開源迅速搶占市場。當(dāng)技術(shù)難以成為拉開競爭對手的護城河,繁榮的開源生態(tài)就成為了各大企業(yè)關(guān)注的焦點。
在今年7月的世界人工智能大會上,周靖人宣稱,阿里云將把促進中國大模型生態(tài)的繁榮作為自己的首要目標(biāo),向大模型創(chuàng)業(yè)公司提供全方位的服務(wù),包括最強大的智能算力和開發(fā)工具,并在資金和商業(yè)化探索方面提供充分支持。
(圖源:封面新聞)
2022年,阿里云在國內(nèi)首倡MaaS(ModelasaService,模型即服務(wù))理念,搭建了一套以AI模型為核心的云計算技術(shù)和服務(wù)架構(gòu),向大模型初創(chuàng)企業(yè)和開發(fā)者開放,提供包括模型訓(xùn)練、推理、部署、精調(diào)、測評、產(chǎn)品化落地等在內(nèi)的全方位服務(wù)。
目前,阿里云已形成模型即服務(wù)(MaaS)、平臺即服務(wù)(PaaS)、基礎(chǔ)設(shè)施即服務(wù)(IaaS)三層架構(gòu)。
此次開源的兩款模型,大幅降低了研究者使用大模型的門檻。與此同時,開源打通了阿里模型之間的鏈路。例如,AI模型社區(qū)魔搭能夠通過靈積實現(xiàn)服務(wù)化。
阿里云的靈積模型服務(wù)平臺,提供了一系列自動化的模型上云工具鏈路,支持模型的自主接入,所有接入靈積平臺的模型都能自動獲取平臺的強大服務(wù)能力。
總的來看,在行業(yè)開源大模型潮流趨勢下,通義千問的開源勢在必行。
3.開源大模型紛紛免費可商用
開源的一個重要體現(xiàn)就是免費、可商用,阿里云的大模型并不是第一個免費、可商用的大模型。
今年7月,智譜AI和清華KEG發(fā)布公告,稱為了更好地支持國產(chǎn)大模型開源生態(tài),ChatGLM-6B和ChatGLM2-6B權(quán)重對學(xué)術(shù)研究完全開放,并且在完成企業(yè)登記獲得授權(quán)后,允許免費商業(yè)使用。公告提供了企業(yè)登記入口,需要的信息只有姓名、國家、郵箱、機構(gòu),用途和要申請的模型(ChatGLM-6B或ChatGLM2-6B)。
百川智能的Baichuan-13B模型在發(fā)布的同時也開源允許免費商用。據(jù)官方介紹,Baichuan-13B包含130億參數(shù)的開源可商用的大規(guī)模語言模型,在中英文 Benchmark上均取得同尺寸模型中最好的效果。
Meta和微軟合作推出下一代開源大語言模型 Llama 2,并宣布免費提供給研究和商業(yè)使用,開發(fā)者們可以直接在Llama 2官方網(wǎng)站下載該模型。
Meta認為,開放的方法是當(dāng)今人工智能模型開發(fā)的正確方法,特別是在技術(shù)快速發(fā)展的生成領(lǐng)域。通過公開提供人工智能模型,它們可以使每個人受益。為企業(yè)、初創(chuàng)企業(yè)、企業(yè)家和研究人員提供其開發(fā)的工具。
今年6月,人工智能研究機構(gòu)BAAI開源了一個全新的國產(chǎn)開源大語言模型Aquila系列模型。該模型基于大量的中英文數(shù)據(jù)集訓(xùn)練,是一個完全開源可商用國產(chǎn)大語言模型。
顯然,開源模型在競爭中快速發(fā)展,越來越多企業(yè)的開源模型能力越來越成熟。不過,開源模型的使用范圍也存在著局限性。
正如7月23日,在極客公園主辦的AGI Playground大會上,BentoML亞太區(qū)負責(zé)人劉聰表示,開源的模型能力變得越來越好,但還是限于私有化部署以及商業(yè)公司內(nèi)部的一些用例。普適化的用例可能還是依賴 OpenAI 這種大模型的能力。
RWKV、Syrius炬星聯(lián)合創(chuàng)始人羅璇認為,其實現(xiàn)在很多商業(yè)公司也開始開源,但實際上是把一些效果比較差的模型開源,真正好的模型并不會開源,而且數(shù)據(jù)不會開源,數(shù)據(jù)是大家要關(guān)注的問題。
“現(xiàn)在大家開源社區(qū)用的數(shù)據(jù)都是ChatGPT對話的數(shù)據(jù),這個是很大的問題。我認為開源社區(qū)應(yīng)該更關(guān)注數(shù)據(jù)的建立,也希望所有的開源社區(qū)一起做這個事情?!?/strong>
綜合來看,開源大模型的免費可商用仍然需要一番探索,隨著未來生態(tài)多元化的豐富,開源模型會繼續(xù)呈現(xiàn)出更加繁榮的景象。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn