香港特区立法会投用科大讯飞“智识听”系统:实时准确率 96%,特殊口音也能应对

时间:2025-08-04 15:30:01来源:互联网

下面小编就为大家分享一篇香港特区立法会投用科大讯飞“智识听”系统:实时准确率 96%,特殊口音也能应对,具有很好的参考价值,希望对大家有所帮助。

alixixi 8 月 4 日消息,据科大讯飞官方公众号,香港特区立法会与科大讯飞联合打造了智慧誊录系统“智识听”,可深度识别立法会场景的实时字幕功能,运用科大讯飞中英粤混读引擎,结合声纹识别和字幕与帧画面对齐压制技术,实现会议直播中文字和视频画面的同轨显示,公众可通过实时字幕无障碍获取政策资讯。

“智识听”深度学习 2.5 亿字语料、400 小时音频、20 万条香港特色关键词,口音、新地名、混语发言实时适配,即使面对议员特殊口音或复杂地名也能高效处理。目前,实时字幕的准确率达 96%,通过幕后同事的即时修正,准确率通过人机结合可达 99%。

alixixi从官方获悉,“智识听”正式调研、研发、上线历时近 3 年,1.0 版具备录音转文字功能,2.0 引入对实时转文字的支持,3.0 版则开始支持实时字幕。为解决粤语俚语及法律专业术语较多、部分议员存在口音、中英粤混杂等问题,立法会秘书处整理了 2.5 亿汉字的中英文对照和 20 万个高频粤语词汇,将其作为语料库提供给机器学习。经过数据和算法的优化和不断地训练,立法会会议实时字幕的准确率达 96%。

原先,需要 7 个工作日才能发布的议事录,会议召开后第二天即可发布。目前智识听四期正在准备中,该期将建设英语字幕和多语种字幕系统。同时,基于星火大模型的进步,香港立法会的智慧办公系统也提上日程。

本站部分内容转载自互联网,如果有网站内容侵犯了您的权益,可直接联系我们删除,感谢支持!