澳门金沙-www.4787.com-澳门金沙手机版登录网址 - 文学类专业网站力求原创·干净·绿色

澳门金沙-www.4787.com-澳门金沙手机版登录网址

当前位置: 澳门金沙 > 科技 > 语音识别将Librispeech的WER目标擢升了25%

语音识别将Librispeech的WER目标擢升了25%

时间:2019-02-16来源:未知 作者:admin点击:
2月11日消息,一套基于深度学习实现的语音识别系统ASRT(全称Auto Speech Recognition Tool),由AI柠檬博主开发并在GitHub上开源(GPL 3.0 协议)。本项目声学模型通过采用卷积神经网络和连接性时序分类方法,使用大量中文语音数据集进行训练,将声音转录为

  2月11日消息,一套基于深度学习实现的语音识别系统ASRT(全称Auto Speech Recognition Tool),由AI柠檬博主开发并在GitHub上开源(GPL 3.0 协议)。本项目声学模型通过采用卷积神经网络和连接性时序分类方法,使用大量中文语音数据集进行训练,将声音转录为中文拼音,并通过语言模型,将拼音序列转换为中文文本。基于该模型,作者在Windows平台上实现了一个基于ASRT的语音识别应用软件,同样已在GitHub上开源。

  智东西10月29日消息,云从科技宣布在语音识别技术上取得突破,在全球最大的开源语音识别数据集Librispeech上刷新了世界纪录,错词率(Worderrorrate,WER)降到了2.97%,将Librispeech的WER指标提升了25%,超过阿里、百度、约翰霍普金斯大学等企业及高校,大幅刷新原有记录。据了解,云从科技核心技术闭环包括人脸识别、智能感知与智能分析三个阶段,此次语音识别突破属于智能感知中的一环。

  9月7日,国际多通道语音分离和识别大赛(CHiME)组委会揭晓了最新一届CHiME-5的比赛结果,科大讯飞团队包揽大赛四个项目的冠军,包括单麦克风阵列任务、分布式麦克风阵列任务(Rank A)和两种麦克风阵列对应的两个端到端的语音识别任务(Rank B)。

  CHiME始办于2011年,由法国计算机科学与自动化研究所、英国谢菲尔德大学、美国三菱电子研究实验室等发起,希望针对高噪声和混响等现象影响下的实际场景提出全新的语音识别解决方案。

  近日,阿里巴巴达摩院机器智能实验室语音识别团队,推出了新一代语音识别模型——DFSMN,不仅被谷歌等国外巨头在论文中重点引用,更将全球语音识别准确率纪录提高至96.04%(基于世界最大的免费语音识别数据库LibriSpeech)。该团队同时宣布,即日起向全世界企业与个人开源DFSMN模型,使全球开发者都能共享这一成果,全球语音识别准确率也有望总体提高10%。

  近日,在美国波士顿举行的Re-Work深度学习峰会上,高通的人工智能研究人员克里斯-洛特(Chris Lott)展示了其团队在语音识别计划方面的新进展。这种语音识别系统在智能手机或其他便携式设备上运行,包含两个神经网络:循环神经网络(RNN)和卷积神经网络(CNN)。循环神经网络利用其内存来处理输入信息,而卷积神经网络则模仿人类大脑中神经元之间的联系方式。洛特称,这种语音识别系统识别单词和短语的准确率达到了95%。

  据媒体报道,近日,阿里巴巴机器智能技术实验室表示,其正研发在高工业噪声环境下的语音识别及传输技术,即可将语音交流转换为文字。对此,阿里巴巴AI语音工程师许先生表示,他们研究的语音交互技术已实现在85分贝工业噪声下,将一米处正常音量语音转换为文字。而据《职业性噪声聋诊断标准》等相关标准,噪声大于等于85分贝便可认定为噪声作业环境,工人需有所防护。

顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
相关内容
推荐内容