首頁 -> 內地

阿里雲音視頻AI助手“通義聽悟”能力升級

分享到:
2024-03-22 15:15 | 稿件來源:香港新聞網

【字號:

香港新聞網3月22日電 阿里雲工作學習人工智能(AI)助手“通義聽悟”發佈多項新功能,包括上線音視頻問答助手,基於紀錄內容回答用戶查詢,並可一鍵跳轉回顧原文。用戶還可以針對超長網課、會議等音視頻內容提問,利用AI能力總結知識點、將口語化表達潤色成書面表達,並製作可視化腦圖等。

音視頻承載訊息密集,但查找、回顧與提煉信息十分耗時。阿里雲“通義聽悟”產品負責人楊帆表示,作為一款工作學習AI助手,“通義聽悟”希望能夠讓高知識附加值的音視頻被輕鬆閱讀、整理和分享。

hk_c_image.png

“通義聽悟”此次推出的音視頻問答助手“小悟”可以根據紀錄內容,回答用戶提問的相關話題。“小悟”支持單個紀錄,多個紀錄和多種語言自由問答,並提供原文位置,用戶可以一鍵跳轉回顧。用戶還可以請“小悟”整理金句、梳理結論、整理會議紀要。

此外,根據用戶需求,“通義聽悟”還上線了一鍵AI改寫以及生成思維導圖的功能。一鍵AI改寫可以將口語化表達的內容在保持原意的基礎上,快速轉化成更具邏輯性、規範性和可讀性的書面格式,尤其適合整理會議和採訪內容。而腦圖則是通過AI以邏輯的方式可視化內容,還可以導出多種格式,方便保存和分享,還能幫助激發用戶靈感,拓展思維。

今次“通義聽悟”新功能發佈,背後是一系列的技術提升。作為AI音視頻產品,“通義聽悟”通過優化複雜多語言理解和多模態檢索、長篇內容建模理解、個性化指令生成和動態意圖檢索增強,提升了精準內容定位、高效問題引導、訂製化摘要與高質量答案回覆等綜合能力,從而提升用戶體驗。

依託“通義千問”大模型,於去年6月升級的“通義聽悟”專注音視頻實時文本轉寫,並能精準、高效地理解和分析多媒體內容,助力個人與企業提升工作和學習效率。“通義聽悟”音頻語言目前支持識別普通話、粵語、英語和日語,翻譯支持中文、英文和日語,韓語預計於4月初上線。支持轉寫單個文檔時長最高達6小時。

“通義聽悟”目前累積服務用戶數量超過百萬,來自各行各業,包括學生、教師、白領、媒體、金融分析師等。活躍用戶日均轉寫音視頻3次以上,平均每天處理字符數約20億字。企業和開發者可以通過“通義聽悟”API集成其AI能力,應用場景包括企業辦公、在線教育、金融服務和新聞媒體等。

“通義聽悟”融合了10多項AI能力,包括轉寫、翻譯、發言人角色分離、全文摘要、章節速覽、發言總結、PPT提取等,並支持標重點、記筆記,大幅提高從音視頻提取知識的效率。(完)


【編輯:張明臻】

視頻

更 多
“廣西三月三”走進香港 近距離體驗壯族姑娘的風情萬種
北京車展看點多!天天擠滿 全球車企大佬齊現身!
穿越千年的凝望 與香港記者一起走進“龍門石窟”
60秒精華回顧 神舟十八號載人飛船成功升空!
印度大選|如果贏家是莫迪,中印關係會如何?
【通講壇】菲律賓“拒和”搞軍演 膽氣從哪來?
埃隆·馬斯克全球首尊蠟像亮相香港杜莎夫人蠟像館