ITCOW牛新网 3月19日消息,阿里巴巴旗下的大模型产品“通义听悟”今日宣布推出多项全新功能,其中包括引人注目的音视频问答助手“小悟”,以及一键AI改写、思维导图自动生成等六大实用功能。

据了解,“通义听悟”此次接入了通义千问大模型,成功融合了转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT提取等十多项AI功能。用户在使用过程中,不仅可以轻松地对音视频内容进行各种处理,还能通过标重点、记笔记等功能,更加深入地理解和把握内容要点。
在新上线的功能中,音视频问答助手“小悟”无疑是最为引人注目的。通过运用多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法等先进技术,“小悟”在业内首次实现了对超长音视频的单记录、跨记录、多语言自由问答。这意味着用户可以直接向“小悟”提问任何与音视频内容相关的话题,无论是针对单一记录还是多个记录,无论是中文还是英文,“小悟”都能迅速给出准确的回答。同时,“小悟”还支持用户整理金句、梳理结论、写会议纪要等需求,为用户提供了更加全面的内容理解和服务。
除了“小悟”之外,“通义听悟”还上线了一键AI改写和思维导图自动生成等新功能。一键AI改写功能可以将口语化的表达转换为书面语言,非常适合用于整理采访内容等场景。而思维导图自动生成功能则可以根据用户的需求,自动生成最多支持五级的xmind脑图,帮助用户更加清晰地梳理和呈现思路。

在产品细节体验方面,“通义听悟”也进行了进一步的升级。例如,笔记功能现在支持一键插入视频时间戳和截图,方便用户快速定位到关键内容。同时,音视频文件的语种也可以自动识别,无需用户手动设置。
值得一提的是,“通义听悟”还推出了“高校公益计划”,为所有中国大陆高校师生提供免费的转写时长和存储空间拓展服务。通过后缀为edu.cn的教育邮箱进行认证后,师生们可以直接获赠500小时的转写时长,并将存储空间从20G拓展至200G。
据官方介绍,“通义听悟”作为国内首个开放公测的大模型产品,自去年6月发布以来已经累计吸引了上百万用户。这些用户来自不同的行业和领域,包括学生、老师、白领、记者、律师、金融分析师等群体。活跃用户日均转写音视频3次以上,平台每天处理的字符数约达到20亿字。