阿里云周靖人:大模型生態(tài)會(huì)進(jìn)行優(yōu)勝劣汰選擇,從而收斂到更完整、完善狀態(tài)
12月4日消息,阿里云CTO周靖人在12月1日的發(fā)布會(huì)上宣布阿里云開(kāi)源通義千問(wèn)720億參數(shù)模型Qwen-72B。據(jù)了解,Qwen-72B在10個(gè)權(quán)威基準(zhǔn)測(cè)評(píng)創(chuàng)下開(kāi)源模型最優(yōu)成績(jī),成為業(yè)界最強(qiáng)開(kāi)源大模型,性能超越開(kāi)源標(biāo)桿Llama 2-70B和大部分商用閉源模型,可適配企業(yè)級(jí)、科研級(jí)的高性能應(yīng)用。
阿里云CTO周靖人宣布開(kāi)源通義千問(wèn)720億參數(shù)模型Qwen-72B
圖源阿里云公眾號(hào)
會(huì)后,周靖人做了一場(chǎng)閉門(mén)分享。在分享會(huì)上,周靖人表示,阿里云目前已經(jīng)和不少硬件廠商在洽談合作。之所以開(kāi)源,就是為了不局限于某一個(gè)或某幾家廠商,而是有更多開(kāi)發(fā)者和硬件廠商一起來(lái)參與、推動(dòng)。
周靖人指出,阿里云目前做是生態(tài)的方方面面,當(dāng)前更加關(guān)注的是模型本身。對(duì)于大模型在C端和B端商業(yè)變現(xiàn)的機(jī)會(huì)和價(jià)值,他表示,在to C和to B方面應(yīng)用的探索會(huì)有一些,但還沒(méi)有到井噴的狀態(tài)。
關(guān)于國(guó)內(nèi)大模型大量發(fā)布現(xiàn)狀,周靖人認(rèn)為,任何一項(xiàng)技術(shù)都有一個(gè)蓬勃發(fā)展并快速迭代的周期,最終也可能受技術(shù)、商業(yè)等各方面的約束而收斂。生態(tài)的好處,就是它自己會(huì)收斂到合適的局面。
通義千問(wèn)發(fā)布會(huì)現(xiàn)場(chǎng)
圖源阿里云公眾號(hào)
以下是對(duì)話實(shí)錄(內(nèi)容經(jīng)摘編):
Q:阿里云在三季報(bào)發(fā)布后宣布,堅(jiān)持更長(zhǎng)期的投入及優(yōu)先公共云的戰(zhàn)略調(diào)整,大模型是否會(huì)有相應(yīng)的策略調(diào)整?
A:我們從年初發(fā)布至今整個(gè)策略都沒(méi)有變化,即一方面做技術(shù)的突破,另一方面做生態(tài),提供模型的能力。阿里CEO吳泳銘提出的戰(zhàn)略調(diào)整,也跟整個(gè)大模型社區(qū)的發(fā)展方向非常吻合,沒(méi)什么具體的差異。公司最近會(huì)把技術(shù)工作路線更加明確下來(lái)。
Q:很多大型廠商選擇了不開(kāi)源,阿里云為什么要選擇開(kāi)源模式?
A:我認(rèn)為是大家站位不同。在過(guò)去10年內(nèi),整個(gè)開(kāi)源社區(qū)蓬勃發(fā)展,今天我們要讓更多技術(shù)和更多人參與進(jìn)來(lái)。開(kāi)源社區(qū)是最佳的、也是唯一的途徑。只有真正從心底去擁抱開(kāi)放的生態(tài),去促進(jìn)開(kāi)發(fā)者社區(qū)的發(fā)展,才能將我們的技術(shù)融入到各行各業(yè),最終幫助整個(gè)核心技術(shù)的突破和創(chuàng)新。
阿里云的初衷不是把模型攥在自己手里,或者做商業(yè)化,而是幫助開(kāi)發(fā)者。我們的開(kāi)源策略,跟整個(gè)阿里云的初心是完全一致的。因此,我們不光在模型方面開(kāi)源,數(shù)據(jù)庫(kù)、技術(shù)等也都貢獻(xiàn)到開(kāi)源社區(qū)。今天AI的發(fā)展,一定不是由一家公司完成的。不管誰(shuí)有最強(qiáng)的模型,如果沒(méi)有開(kāi)放的技術(shù)和經(jīng)驗(yàn),是無(wú)法在各項(xiàng)應(yīng)用場(chǎng)景中落地的。
Q:在大模型能力上中國(guó)企業(yè)和美國(guó)企業(yè)的差距是什么?
A:科技創(chuàng)新上,原則上是大家你追我趕,都在做非常中長(zhǎng)期的一系列探索,在這個(gè)時(shí)間點(diǎn)或許有差距,但也許差距在縮小,甚至扭轉(zhuǎn)也有可能。這就是科技創(chuàng)新的魅力。
我們能看到(和ChatGPT)之間有一定差距,還有需要提升的空間,但是不能妄自菲薄。比如多模態(tài)等,國(guó)內(nèi)很多產(chǎn)品也能做到ChatGPT的水平,甚至超越它。通義千問(wèn)和ChatGPT 4.0在使用體感上,是互有勝負(fù)的。
Q:通義千問(wèn)與其他閉源模型相比水平如何?
A:講到評(píng)測(cè)指標(biāo),國(guó)外的Hugging Face在全球比較有影響力,它有一系列測(cè)評(píng)標(biāo)準(zhǔn),會(huì)展現(xiàn)一個(gè)客觀的評(píng)價(jià)。當(dāng)然,不是所有閉源模型都會(huì)參與測(cè)評(píng)。在Hugging Face上,我們?cè)陂_(kāi)源14B的時(shí)候是非全模型排名第三,72B發(fā)布之后我們會(huì)繼續(xù)等待測(cè)評(píng)。我認(rèn)為我們可能會(huì)登頂。
Q:Open AI 最近選擇了Agent作為下一步開(kāi)發(fā)方向,你們有什么思考和跟進(jìn)?
A:Agent這個(gè)概念不是Open AI最近提出的,但它是一個(gè)非常重要的模型利用的領(lǐng)域。目前我們社區(qū)已經(jīng)貢獻(xiàn)了很多關(guān)于Agent的開(kāi)發(fā)和創(chuàng)新,接下來(lái)每個(gè)月都有相關(guān)進(jìn)展,包括如何幫開(kāi)發(fā)者搭建這樣一個(gè)Agent,也會(huì)有一些新的功能推出。
Q:聯(lián)想未來(lái)將會(huì)發(fā)布與阿里云合作完成的AI PC(個(gè)人電腦),大模型會(huì)給PC帶來(lái)哪些實(shí)質(zhì)性影響?
A:與聯(lián)想的合作是一個(gè)良好的開(kāi)端。我們希望不單單是在復(fù)雜和昂貴的機(jī)器上使用模型的能力,而是把它帶到各種端。當(dāng)我們真正進(jìn)入AI時(shí)代,大模型將改變?nèi)粘I睿P头?wù)在各個(gè)領(lǐng)域無(wú)所不在。今后每一個(gè)電子設(shè)備和生活環(huán)節(jié),從早晨的鬧鐘開(kāi)始,都會(huì)有模型的支持。我相信很快會(huì)進(jìn)入這樣一個(gè)時(shí)代。
Q:未來(lái)是否會(huì)和更多硬件廠商進(jìn)行合作?
A:目前已經(jīng)有不少硬件廠商在洽談,我們的心態(tài)是非常開(kāi)放的。之所以開(kāi)源,就是為了不局限于某一個(gè)或某幾家廠商,而是有更多開(kāi)發(fā)者和硬件廠商一起來(lái)參與、推動(dòng)。
Q:怎么看待大模型在C端和B端商業(yè)變現(xiàn)的機(jī)會(huì)和價(jià)值?
A:我們要做是生態(tài)的方方面面,所以當(dāng)前更加關(guān)注的是模型本身。在to C和to B方面應(yīng)用的探索會(huì)有一些,但還沒(méi)有到井噴的狀態(tài)。模型的應(yīng)用是沒(méi)有to C和to B之分的,但我們也希望模型的能力能夠滲透到日常生活和工作學(xué)習(xí)中。接下來(lái)會(huì)看到一些創(chuàng)新,也許今后幾個(gè)月,我們就會(huì)聊到一系列應(yīng)用,以及如何幫助到to C和to B的產(chǎn)品。
Q:阿里云認(rèn)為實(shí)現(xiàn)AGI還要多久?
A:AGI已經(jīng)成為社會(huì)性的話題,有各種各樣的解釋。但我認(rèn)為現(xiàn)在談AGI還太早,因?yàn)檫€有很多技術(shù)難題,還有很多長(zhǎng)足的工作要做。由于ChatGPT的爆發(fā),讓一年前不怎么關(guān)注人工智能的人現(xiàn)在都在關(guān)注,我作為技術(shù)工作者感到欣慰。但從整個(gè)技術(shù)發(fā)展來(lái)看還需要很多時(shí)間,請(qǐng)大家給予更多耐心。不要今天關(guān)注一個(gè)熱點(diǎn),3個(gè)月沒(méi)爆發(fā),大家就淡忘了。
Q:通義千問(wèn)會(huì)將技術(shù)產(chǎn)品優(yōu)化和商業(yè)化落地當(dāng)成重點(diǎn),還是像Open AI一樣將AGI當(dāng)作愿景?
A:我們做的工作其實(shí)是沒(méi)有人指引的。通義千問(wèn)首先是追求技術(shù)的卓越和極致的技術(shù)探索。如何能夠把模型的方方面面提升起來(lái)?這本身就是一個(gè)研究課題,這方面一定是我們接下來(lái)的工作重點(diǎn)。
但在這個(gè)時(shí)代,科研、技術(shù)、產(chǎn)品這幾個(gè)維度是更有機(jī)地聯(lián)合在一起的,沒(méi)辦法像以前分得那么開(kāi)。光埋頭苦干做研究,不做技術(shù)產(chǎn)品、不做技術(shù)生態(tài),在今天也不行。這就是為什么通義千問(wèn)是一整個(gè)通義模型家族。我們不斷追求技術(shù)突破,同時(shí)也開(kāi)源自己的模型,幫助整個(gè)生態(tài)繁榮。我們還做產(chǎn)品,包括通義千問(wèn)App、網(wǎng)頁(yè)版產(chǎn)品。
Q:通義千問(wèn)在技術(shù)上還面臨哪些挑戰(zhàn)?
A:整個(gè)大模型還處在發(fā)展初期。不管誰(shuí)家的大模型,都還有很多提升空間。今天的模型具備視覺(jué)、聽(tīng)覺(jué)的能力,但如何像人一樣思考、去識(shí)別萬(wàn)物,所有大模型都還有一定差距。通義千問(wèn)產(chǎn)品這次推出了視覺(jué)模型能力,對(duì)圖片的理解在很多層面是超過(guò)ChatGPT 4.0的,但距離人類的認(rèn)知能力還有一定差距。
如何讓這個(gè)模型有更多思維能力、像人一樣去思考,這方面才剛剛起步。我們當(dāng)前有非常多要解決的技術(shù)難點(diǎn),這也是為什么接下來(lái)每個(gè)月都會(huì)有一系列技術(shù)突破。整個(gè)通義千問(wèn)模型的升級(jí)能力遠(yuǎn)遠(yuǎn)沒(méi)有結(jié)束。
Q:實(shí)現(xiàn)了從0到1后,是創(chuàng)新更重要,還是推廣產(chǎn)品更重要?
A:追求技術(shù)的卓越一直是阿里云的初衷。在一定程度上,所謂從0到1和從1到2沒(méi)有本質(zhì)區(qū)別,都是在做突破。從0到1非常難,因?yàn)橐剿饕粭l新的道路。但繼續(xù)把產(chǎn)品技術(shù)打磨好,每提高一個(gè)百分點(diǎn),其實(shí)也隱藏著非常多的技術(shù)難題和投入。
Q:上一次開(kāi)源14B反響不錯(cuò),為什么要再去開(kāi)源更高的72B?哪些場(chǎng)景是14B無(wú)法解決的?
A:14B是一個(gè)非常好的起點(diǎn),但模型的能力還在不斷發(fā)展中,創(chuàng)新技術(shù)的突破一直沒(méi)有停止過(guò),14B更往上還有很多提升的空間。這是推出72B模型的初衷,今后14B和7B也會(huì)有升級(jí)的版本出來(lái)。
在不同的企業(yè)和不同的開(kāi)發(fā)環(huán)境,大家對(duì)模型的尺寸、能力及背后使用的資源有不一樣的考慮,有時(shí)會(huì)追求極致的性能。我們不應(yīng)該用一個(gè)模型、一個(gè)尺寸,要求大家對(duì)接所有的場(chǎng)景,而是應(yīng)該把選擇權(quán)留給開(kāi)發(fā)者和企業(yè)。
Q:國(guó)內(nèi)已經(jīng)發(fā)布了200多個(gè)大模型,需要這么多嗎?合理的生態(tài)是什么樣的結(jié)構(gòu)?
A:任何一項(xiàng)技術(shù)都有一個(gè)蓬勃發(fā)展并快速迭代的周期,最終也可能受技術(shù)、商業(yè)等各方面的約束而收斂。生態(tài)的好處,就是它自己會(huì)收斂到合適的局面。
今天我們有200多款大模型,能夠感受到科技界積極擁抱的態(tài)度。今年1月時(shí)大家還感覺(jué)很消極,覺(jué)得跟海外差距很大,到12月已經(jīng)沒(méi)有這樣的感覺(jué)。我相信整個(gè)市場(chǎng)、整個(gè)生態(tài)也會(huì)進(jìn)行優(yōu)勝劣汰的選擇,也會(huì)收斂到更完整、完善的狀態(tài),這就是生態(tài)的魅力。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn