阿里巴巴達(dá)摩院發(fā)布語(yǔ)音產(chǎn)品“聽(tīng)悟”
10月22日消息,據(jù)天下網(wǎng)商消息,昨日,在杭州云棲大會(huì)上,阿里巴巴達(dá)摩院發(fā)布軟硬件結(jié)合語(yǔ)音產(chǎn)品“聽(tīng)悟”。
據(jù)介紹,相比只能逐字轉(zhuǎn)寫(xiě)的上一代語(yǔ)音產(chǎn)品,“聽(tīng)悟”是面向未來(lái)會(huì)議的AI助理,其集成了達(dá)摩院最新語(yǔ)音及自然語(yǔ)言處理技術(shù),不僅“聽(tīng)”得準(zhǔn),且“悟”性高,可秒速生成智能會(huì)議紀(jì)要及待辦。
針對(duì)傳統(tǒng)語(yǔ)音產(chǎn)品存在“聽(tīng)不準(zhǔn)、分不清、看不懂”;在噪音下識(shí)別準(zhǔn)確率較低,無(wú)法區(qū)分不同說(shuō)話(huà)人,轉(zhuǎn)寫(xiě)內(nèi)容冗長(zhǎng)難以閱讀和沉淀等問(wèn)題,達(dá)摩院語(yǔ)音實(shí)驗(yàn)室通過(guò)讓AI深度參與,讓線(xiàn)上及線(xiàn)下會(huì)議更智能、高效、協(xié)同。
值得注意的是,“聽(tīng)悟”內(nèi)置達(dá)摩院獨(dú)創(chuàng)聲紋融合方位算法,能對(duì)多達(dá)10位說(shuō)話(huà)人進(jìn)行角色分離。此外,它還融入達(dá)摩院新一代端到端語(yǔ)音識(shí)別模型,中文識(shí)別準(zhǔn)確率可達(dá)98%,支持14種方言及中英文“自由說(shuō)”;可嵌入線(xiàn)上音視頻會(huì)議,實(shí)時(shí)出字幕及紀(jì)要。
除聽(tīng)力方面的功能外,“聽(tīng)悟”還能模仿人工整理,進(jìn)行智能糾錯(cuò)和分段,自動(dòng)過(guò)濾語(yǔ)氣詞。同時(shí),“聽(tīng)悟”擅長(zhǎng)抓重點(diǎn),可秒速生成關(guān)鍵詞、核心結(jié)論、重點(diǎn)內(nèi)容和待辦,用戶(hù)能同屏編輯、標(biāo)注摘要、一鍵分享、安全保存。
值得一提的是,在2021云棲大會(huì)上,阿里達(dá)摩院XR實(shí)驗(yàn)室負(fù)責(zé)人譚平分享了他對(duì)于元宇宙的理解。他表示,本質(zhì)上認(rèn)為元宇宙是AR、VR眼鏡上的整個(gè)互聯(lián)網(wǎng),是互聯(lián)網(wǎng)在新計(jì)算平臺(tái)上的一種呈現(xiàn)方式。
在譚平看來(lái),元宇宙的范疇非常廣泛,包括社交、電商、游戲、教育,甚至是支付。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn