当前位置: > > >文章详情

能否读懂你的心?Sogou 搜狗 展示 “唇语识别”交互系统

“唇语”,对于普通用户来说可能稍显遥远,毕竟这是一种很难的嘴部语言技巧,需要通过大量的练习才能获得,但唇语沟通是听力障碍者的技能之一,也常常被用于情报等技术工作。2003年的伦敦劫钞案就依靠唇语成功破案,可见读懂唇语的重要性。同样是在2003年,英特尔就成功开发出了唇语技术,谷歌在2016年也开发出了唇语识别系统,准确率已大幅提升,但还远远不够。

近日,Sogou(搜狗)首次向外界展示了国产自主“唇语识别”技术,被定义为全新的人机交互系统,能识别人的唇部动作,并解读说话者所说的内容。该系统支持更多非特定人词汇量,是机器视觉与自然语言处理的集合体,可直接从人讲话视频中分析出讲话内容,该技术可应用于嘈杂环境、公共安全、身份识别和残障教育等领域。

唇语识别技术的原理是,先从面度识别,然后唇形提取,唇形单元匹配,然后将唇语识别模型中,识别出对应的发音,依靠复杂的端到端深度神经网络技术进行中文唇语序列建模,最终识别出唇形对应发音,计算出可能性最大的自然语言,官方表示垂直场景准确率达90%。

搜狗表示,经过数千小时的真实唇语数据训练,终于取得了唇语识别效果,未来唇语识别技术可以辅助语音交互及图像识别,日常周围噪音过大或不便发声的场所更加适用,既能保证识别准确性和稳定性,也可以保证说话内容的私密性。此外,唇语识别技术可以帮助公安人员获取无声视频中重要的讲话信息,还能帮助到先天性听障人群。

以上图片引用来自互联网,仅供参考


什么值得买资讯中心,全景关注各行业的发展风向,集中报道新品发布、业界动态和海淘情报,致力于呈现时效性和价值性俱佳的精选资讯。
+1 已赞
已有15人赞过
评论21

发表评论请 登录
  • 最新
  • 最热
评论举报

请选择举报理由

18 21

已收藏
去我的收藏夹 >

已取消收藏
去我的收藏夹 >