应用

技术

物联网世界 >> 物联网新闻 >> 物联网热点新闻
企业注册个人注册登录

我国语音技术如何实现弯道超车?

2020-08-20 13:57 中国家电网

导读:语音科技,就是一个美国不愿意让我们发展的太快的科技。

语音科技,就是一个美国不愿意让我们发展的太快的科技。国内的语音科技“一哥”科大讯飞,就在去年10月被美国“拉黑”了,当时科大讯飞的很多开发平台使用的都是美国芯片,被“拉黑”后,在美国的很多实验室也被迫关闭。

如果你觉得,美国最近在中美科技战中过于针对华为和Tiktok,那你就错了。随着中美在科技层面的交锋与冲突不断升级,美国商务部开出的实体清单也是一泻千里。5月23日,实体清单上又多出了33家中国公司,大都为科技公司、科研机构。截至5月底,美国实体清单上的中国公司、个人、甚至还有几所大学,总数多达1373家,整整309页PDF文件。

遥想去年5月,这个清单上62个国家和地区的实体,总共只有1182个。其中俄罗斯以316个实体位居第一,中国只有233个实体上榜,其中80个在香港。

所谓“实体清单”,是美国的出口管制手段。在没有许可证的情况下,美国任何企业不得向清单上的实体出口任何东西,也不能帮助这些实体进口任何东西。1997年6月,“实体清单”面世4个月后,中国工程物理研究院,成为了清单上的第一个中国实体。

20多年过去,实体清单已经从美国的出口保护手段,变成了阻碍别国科技发展的打击手段。

语音科技,就是一个美国不愿意让我们发展的太快的科技。

国内的语音科技“一哥”科大讯飞,就在去年10月被美国“拉黑”了,当时科大讯飞的很多开发平台使用的都是美国芯片,被“拉黑”后,在美国的很多实验室也被迫关闭。

不过,在同期被“拉黑”的公司中,科大讯飞算是最淡定的。当时科大讯飞发布公告称,其人工智能核心技术都是自主研发,而且语音科技在硬件方面对芯片的要求并不是特别高,找到替代品或者自己研发,问题都不大。

本周三,科大讯飞董事长再次提及公司被加入实体名单一事,他表示,目前科大讯飞已经有了28nm制程的自研芯片,完全无惧被美国芯片卡脖子。

另一方面,由于谷歌在重压之下已经不再给华为提供语音助手服务,这个服务将由科大讯飞接手。科大讯飞不仅能稳稳地接住华为,提供的服务还更好,在欧洲各主要语种方面都能超越谷歌。

可能是受到科大讯飞的自信影响,周五语音技术板块5支股票全线拉升。科大讯飞收涨5.05%,是近两个月内的最大单日涨幅。

虽然目前语音技术的研究方向主要放在专业领域的语音录入,比如医院、法院等,需要记录的专业词汇多、而且要绝对精准的领域。但是语音技术离我们日常生活最近的应用,正是已经非常成熟的手机助手和日渐普及的智能家居。

语音技术的起步,是语音识别。语音识别技术主要是把人类的语音内容转换成计算机可读的输入,不一定是文本,也可能是编码或者符号。

由于语音交互提供了更自然、更便利、更高效的沟通形式,成为人机互动的主要输入方法,只是时间问题。

目前,主流语音识别框架还是由 3 个部分组成:声学模型、语言模型和解码器。其中,声学模型是热门的研究方向,也就是业界跑马圈地的方向。

语音识别没有什么技术壁垒,就比谁的算法更准,因此国内外各大企业前赴后继的发布着新的声学模型,刷新各个数据库的识别记录。

由于中文方言的博大精深,语音识别的复杂性基本拉满。因此,在声学模型方面的研究进展较其他国家都要快一些。在其他国家把英文识别做到了最好的时候,科大讯飞已经可以识别中、英、粤三语混说的输入了。

事实上,语音识别技术在2010年前后,碰到了天花板,识别率达到了90%,并且难以突破。直到深度学习技术被应用到了语音识别中,识别精度才突破了90%,在安静环境下的识别精度直逼98%。

从此,语音识别领域的产业竞争从研发转为了应用。而在语音识别的精度普遍都能达标之后,语音识别也失去了独立存在的价值,开始更多的为提升其他产品的体验而服务。

也就是这个时候,语音识别相关产品,比如Siri,开始走进人们的视线。不过,Siri们的出现所引起的关注程度,远比实战成绩要高的多。Siri面世的时候,谷歌CEO忧心忡忡,认为它会对谷歌的搜索业务产生根本性的威胁。