谷歌CEO皮查伊深度討論人工智能時代
12月8日消息,谷歌在近日發(fā)布了其最新一代的人工智能模型Gemini。這個新模型體現了谷歌首席執(zhí)行官桑達爾·皮查伊(Sundar Pichai)多年努力的成果。在Gemini發(fā)布前夕,《麻省理工學院技術評論》雜志在谷歌位于加州山景城的辦公室采訪到了皮查伊,與他討論了Gemini對谷歌、其產品、人工智能以及整個社會的深遠影響。
關于Gemini,皮查伊指出,谷歌花費更多時間研發(fā)Gemini Ultra的部分原因是為了確保谷歌對其進行了嚴格的安全測試。同時,谷歌也在對其進行微調,以充分發(fā)揮其潛能。他透露,更先進的Gemini將于明年推出。
圖源:Google DeepMind官網首頁
對于AI時代影響就業(yè)問題,皮查伊認為,應該以負責任的態(tài)度來部署這些技術,同時思考如何減輕其可能帶來的負面影響。新的工作類型將會隨著技術的發(fā)展而出現,人們將有機會從重復性的工作中解脫出來,有更多的時間和空間去進行深入思考和創(chuàng)造性表達。他表示 ,作為一個社會,我們需要思考如何對這些受到影響的人們進行再培訓,幫助他們找到新的工作機會。
皮查伊承認,人工智能確實具有兩面性。他指出,企業(yè)需要大膽地向前邁進,同時也需要社會制定出相應的框架來應對可能出現的問題,如深度造假、工作崗位被取代等。“這將是我們未來十年需要努力解決的最大問題之一?!?/p>
谷歌CEO桑達爾·皮查伊(Sundar Pichai) 圖源:Google DeepMind官網
以下為專訪全文:
問:Gemini為何如此引人注目?能否分享一下你對人工智能的整體看法?它的潛力、應用以及其在谷歌所有產品中的發(fā)展前景?
皮查伊:Gemini之所以令人矚目,其中一個重要原因是它從根本上就是一個多模態(tài)模型。就像人一樣,它不僅從文本中學習,還能通過視頻、音頻和代碼進行學習。因此,這個模型天生就具備了更強大的能力,我相信這將推動我們開發(fā)出更多新功能,并推動該領域的進步。這確實令人振奮。
另一個令人感到興奮的原因在于,在32個主要基準測試中,Gemini在30個中都是最佳表現,尤其是在多模態(tài)基準測試中。在MMLU(大規(guī)模多任務語言理解)測試中,它更是取得了巨大的進步。我個人認為,作為領先基準之一的MMLU,Gemini跨越了90%的門檻,這是一個意義重大的里程碑?;叵雰赡昵?,當時的水平只有30%,然后是40%。這充分展示了該領域所取得的巨大進步。在57項測試中,Gemini的表現有89%與人類專家相當。這是第一個達到這一標準的模型。
我本人也感到很激動,因為Gemini終于要應用于我們的產品中了。它將向開發(fā)者開放。人工智能是一個深刻的平臺變革,比網絡或移動變革還要深遠。因此,這對我們來說代表著邁出了重要的一步。
問:讓我們來談談這些基準測試。雖然Gemini似乎在幾乎所有測試中都領先于GPT-4,但領先優(yōu)勢并不明顯。而GPT-4本身就是一個巨大的飛躍。我們是否開始觸及這些大語言模型技術的極限,或者你認為仍然存在巨大的提升空間?
皮查伊:首先,展望未來,我們確實看到了巨大的提升空間。有些基準已經很高了。但我們必須意識到,當你試圖從85%開始突破時,你已經處于曲線的末端。雖然看起來進展不大,但確實意味著我們仍在取得進展。我們還需要開發(fā)新的基準測試,這也是我們研究MMLU多模態(tài)基準的部分原因。對于其中一些新的基準,目前的技術水平仍然很低,未來還有很大的提升空間。比例定律依然有效:隨著模型的擴大,我們會看到更多的進展。從整體來看,我真的覺得我們才剛剛開始探索人工智能的潛力。
問:在你看來,Gemini的關鍵創(chuàng)新是什么?這些創(chuàng)新將如何被實際應用?
皮查伊:人們可能難以想象即將到來的種種突破。我們正在提供應用程序開發(fā)接口(API),使人們能夠以前所未有的方式體驗它。我相信多模態(tài)基準將取得巨大的進展。隨著我們教會這些模型進行更多的推理,將會出現越來越大的突破,而且更深遠的突破還在后頭。
以Gemini Pro為例,它在基準測試中的表現非常出色。但當我們將其集成到Bard中時,我可以親身感受到它的優(yōu)勢。我們一直在對它進行測試,所有類別任務的好評率都有顯著的提升。因此,我們將其稱為迄今為止最大的升級之一。當我們進行并行評估時,它的表現確實令人印象深刻。因此,這些更好的模型在基準上不斷改進,取得了顯著的進步。我們將繼續(xù)訓練和學習。
然而,我迫不及待地想將Gemini應用于我們的產品中。這些模型具有強大的能力。在接下來的幾個月里,設計出能夠充分利用這些模型優(yōu)勢的產品體驗將是令人興奮的挑戰(zhàn)。
問:雖然Gemini在各個方面都略微領先于GPT-4,但你認為從GPT-4的發(fā)布中學到了什么?在這段時間里,有哪些方法發(fā)生了變化?
皮查伊:至少在我看來,這并不是一個零和游戲。想想看,向人工智能的轉變是多么深刻,我們還處于早期階段,前方充滿了無限的機會。
關于你的具體問題,這是一個我們都在快速進步的領域。我們發(fā)表了很多文章,研究像GPT-4這樣的模型在現實世界中是如何工作的。我們從中學到了很多經驗教訓。安全是一個重要的領域。因此,在Gemini項目中,我們已經學習并改進了一些安全技術,這些技術是基于模型在現實世界中的運作方式而改進的。它表明了微調等各種技術的重要性。我們在Med-PaLM 2中展示的一個例子是,采用一個像PaLM這樣的模型,并對其進行微調以適應特定的領域,結果表明它可以勝過最先進的模型。這就是我們學習到微調的方式之一。
當我們研發(fā)Gemini時,很多這樣的經驗都被應用到了其中。我們花費更多時間研發(fā)Gemini Ultra(更先進的Gemini將于明年推出)的部分原因是為了確保我們對其進行了嚴格的安全測試。同時,我們也在對其進行微調,以充分發(fā)揮其潛能。
問:當這些模型在現實世界中應用時,有時候會出現產生幻覺或泄露訓練數據中私人信息的情況??紤]到模型所使用的數據,如果這是不可避免的,那么這在技術中有多少是固有的?如果無法避免,你們會采取哪些措施來限制這種情況的發(fā)生?
皮查伊:你提出的問題非常關鍵。事實上,我們最近發(fā)表了一篇論文,揭示了這些模型如何通過一系列提示泄露訓練數據。雖然目前還沒有解決幻覺問題的方案,但我認為我們都在朝著這個方向努力,只是還需要做更多的工作。我們需要克服一些基本的限制。舉個例子,如果我們使用Gemini Ultra,我們正在積極與外部第三方合作,他們是這些領域的專家。
在多模態(tài)等方面,我們希望能夠更大膽、更負責任。在推出多模態(tài)模型時,我們會更加謹慎,因為錯誤用例的可能性更高。但是,你指出的問題仍然是開發(fā)中技術所面臨的挑戰(zhàn),它們并不適用于所有情況。在搜索中,我們會更加仔細地考慮如何使用它、何時使用、在哪里使用以及何時觸發(fā)。這些模型具有驚人的能力,但也存在明顯的缺陷。這是我們所有人都需要解決的艱巨挑戰(zhàn)。
然而,未來的人工智能系統(tǒng)可能與我們今天所擁有的系統(tǒng)截然不同,就像有人曾認為計算機無法裝進口袋一樣。同樣地,對于這些系統(tǒng),如果有人說無法設計出更好的系統(tǒng),我并不同意這種觀點。目前正在進行許多研究探索,思考如何解決這些問題。
問:你認為人工智能將帶來深刻的變革。然而,在最近的一些轉變中,比如向移動設備的轉變,生產率的提高并不一定是必然的,甚至在很長一段時間內都保持不變。有觀點認為,這甚至可能加劇了收入不平等。谷歌正在開展哪些工作來確保這種轉變對社會更有益?
皮查伊:這是一個非常重要的問題。我從幾個角度思考這個問題。在谷歌,我們一直關注的一件事是:如何讓技術盡可能廣泛地使用?即使在移動領域,我們利用安卓操作系統(tǒng)做了很多工作,但仍有數億人無法使用手機。我們正在努力推出一款價格合理的智能手機,價格可能低于50美元。因此,讓人工智能對每個人都有所幫助是我考慮的重點之一。我們嘗試讓盡可能多的人接觸到這些技術。
同時,我們正在深入思考如何將人工智能應用于對人們有益的用例中。以洪水預報為例,我們早期投入該領域的原因是我們意識到可以探測到模式并做得很好。我們也將人工智能用于翻譯1000種語言。我們現在確實在嘗試用不同的語言提供內容,否則你將無法訪問這些內容。
這并不能解決你提到的所有問題。但我們要慎重考慮在何時何地專注于解決什么樣的問題。以AlphaFold等領域為例,我們?yōu)槭澜绺鞯氐牟《咎峁┝艘粋€開放的數據庫。但是,誰會最先使用它?人工智能不會神奇地讓某些更困難的問題變得更好,比如不平等問題或者它可能會加劇這種情況?
重要的是確保每個人都能使用技術。在早期開發(fā)階段就讓人們接觸到技術并參與到對話中,這樣社會就可以幫助測試技術并適應它。在這方面我們肯定比其他公司更早地參與其中。最近我們參加了英國人工智能安全論壇,并與美國國會和政府合作,我們正在嘗試建立更多的公私合作伙伴關系,以更早地吸引非營利機構和學術機構參與進來。至于對就業(yè)等領域的影響,還需要深入研究,但我確實認為會帶來驚喜。
我可以舉很多例子來說明手機帶來的好處,我認為人工智能技術也是如此。我們已經在糖尿病視網膜病變等領域展示了這一點,畢竟世界上許多地方沒有足夠的醫(yī)生來檢測這種疾病。就像我覺得讓世界各地的人們都能使用谷歌搜索一樣,我認為這是擴大人工智能使用范圍的一種方式。
問:有些技術,如編程,明顯提高了效率,但其普及也對就業(yè)市場構成了威脅。你如何看待這個問題?
皮查伊:技術的確在推動效率提升,但我們也不能忽視它對就業(yè)的潛在影響。然而,問題的答案并非非黑即白。以面部識別技術為例,盡管我們公司沒有提供相關的API,但其他公司已經開發(fā)出了這樣的技術。技術發(fā)展的腳步并不會因為某一家公司的決策而停止。這是一個比單一公司決策更為復雜的社會問題。如果我們不采用這些新技術,可能會影響到我們的經濟競爭力,甚至可能導致更多的工作崗位流失。
我認為,我們應該以負責任的態(tài)度來部署這些技術,同時思考如何減輕其可能帶來的負面影響。新的工作類型將會隨著技術的發(fā)展而出現,人們將有機會從重復性的工作中解脫出來,有更多的時間和空間去進行深入思考和創(chuàng)造性表達。當然,這也會使得某些工作崗位變得不再必要。作為一個社會,我們需要思考如何對這些受到影響的人們進行再培訓,幫助他們找到新的工作機會。
問:對于人工智能的發(fā)展,人們的看法出現了分歧。有的人支持安全第一,有的人則認為商業(yè)用例應該優(yōu)先。有人支持加速開發(fā),也有人擔心出現世界末日。你如何看待這種分歧?
皮查伊:我是一個技術樂觀主義者,我相信人類可以利用技術來造福社會。人工智能確實具有兩面性,但我們不能因為恐懼而停止前進的腳步。我們需要大膽地向前邁進,同時也需要社會制定出相應的框架來應對可能出現的問題,如深度造假、工作崗位被取代等。這將是我們未來十年需要努力解決的最大問題之一。
問:圍繞人工智能的法律法規(guī)也是一個懸而未決的問題。例如,有關于合理使用、版權保護等問題。對于知識產權來說,這似乎將是一件大事。你如何確保那些使用你產品的人有種安全感,不必擔心為自己所做的事情而被起訴?
皮查伊:并不是所有的問題都有簡單的答案。在人工智能之前,我們在開發(fā)搜索、YouTube等產品時,就一直在努力實現正確的價值交換。人工智能也是如此。我們將專注于確保我們的訓練數據符合法律規(guī)定,同時讓人們有機會選擇退出。還有一個層面是關于什么是合理使用。為原創(chuàng)內容的創(chuàng)造者創(chuàng)造價值是很重要的。
隨著時間的推移,會有新的法律框架出現。我們將努力遵守法律,并與內容提供商保持良好的關系。這是一個充滿爭議的領域,但我們正在努力尋找解決方案。我們必須創(chuàng)建一個雙贏的生態(tài)系統(tǒng),讓所有這些元素都能長期共存并發(fā)揮作用。
問:如今,許多人對網絡未來的擔憂集中在搜索領域。當有一種技術能夠根據網絡信息為你提供答案時,有人擔心人們可能不再需要訪問這些網站了。這對谷歌會有影響嗎?你是否在考慮自己的業(yè)務?
皮查伊:在搜索領域,谷歌的獨特價值在于幫助用戶發(fā)現和學習新事物,并找到答案,同時始終注重分享網絡上豐富多樣的觀點。這也是我們產品開發(fā)的重要原則之一。我們相信人們在搜索時并不僅僅想要一個簡單的答案,而是希望通過探索和學習,深入了解更多信息。因此,我們一直致力于提供高質量的搜索結果,并確保我們所做的事情是正確的。在這個過程中,保持平衡至關重要。
當然,我們也需要考慮商業(yè)價值。從臺式機到移動設備,我們一直在面對類似的問題。但是,通過深入了解用戶需求和對高質量廣告的反應,我們對未來充滿信心。以YouTube為例,我們已經推出了訂閱模式,并且取得了很好的效果。
問:隨著這些產品逐漸進入市場并開始與用戶互動,你認為明年人們的體驗會發(fā)生怎樣的變化?
皮查伊:我認為,從現在開始的一年里,使用Google Docs的人將會期待一些不同的體驗。如果我們給他們提供了全新的功能,然后再讓他們回到2022年版本的Google Docs,他們會發(fā)現舊版本已經過時了。這就像我的孩子們一樣,如果他們使用的Google Docs沒有拼寫檢查功能,他們就會認為出了問題。與此同時,與其他公司相比,我們在搜索中融入了更多的人工智能技術,使得自動功能成為許多產品中理所當然的存在。這也是我們多年來學到的一個重要經驗:讓用戶相信這些功能的存在是理所當然的。
隨著我們開發(fā)多模態(tài)能力,人們將能夠以一種以前無法做到的方式完成更復雜的任務。這將帶來真正的用例和更強大的功能。總的來說,我們將繼續(xù)努力改進我們的產品和服務,以滿足用戶的需求和期望。
2、電商號平臺僅提供信息存儲服務,如發(fā)現文章、圖片等侵權行為,侵權責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯系:info@dsb.cn