如何解决语音识别中的口音问题？

作者&投稿：玉柱（若有异议请与网页底部的电邮联系）

语音识别解决了方言和口音有什么实质性的好处和发展，或者还有什么问题吗？~

目前许多语音识别软件或者系统都是基于标准的发音来识别的，内嵌的可能是有限的几种语言或者方言，对于原来没有的语种，还得通过海量的数据去训练软件才能提高识别率。人们说话千差万别，口音各不相同，而且各个地方都有自己的方言，这对于语音识别来说是巨大的严峻的考验。如果对于年轻人而言尽量使用普通话就好，可是真正需要使用语音识别的人群年龄较大，他们多讲方言，口音也独有特色，也没有精力去重新学习一门语言了。

发个QQ号,我给传普通话学习资料,我的普通话考试过关就是靠它的

相信许多人都使用过语音识别产品，Siri、微信语音、度秘和手机自带的语音助手，这些产品正越来越深入我们的生活。除了不能识别我们的语气，有时不知道是不是我们讲的普通话不标准，对于很简单的话，这些语音助手经常答非所问。

最近，我所服务的单位正在试用一套语音识别系统，阿里巴巴旗下的，识别率只有80%左右。和工程师沟通过后，得出最可能的原因有2个：1、使用频次太少，导致系统无法积累足够的数据，没有办法有效自主学习；2、口音问题，试用者的普通话夹带了大量的地方特色口音，让系统难以识别。

抛开云计算能力，语音识别的痛点或许还有两个：1、如果想要构建支持不同口音的语音识别系统，需要对各种语种语音进行大量的采集，这需要海量的设备采集海量的数据，再进行无限次的分析，即使是全球性科技巨头都不大可能做到这种程度；2、语音识别系统的分析能力，这可能要寄望于人工智能和深度学习了。

目前国内的科大讯飞、百度、腾讯、阿里巴巴，以及国外的谷歌、Facebook、亚马逊等等科技巨头都在研究、推广语音识别系统，随着大数据、人工智能和深度学习的发展，或许我们未来都会拥有一个电影钢铁侠里的贾维斯！如果我们想拥有可以情感交流的语音助手，而不是只能听清我们讲的字，更能听懂我们的语气和情感，这将又是另一个层次的问题了！

最近，有很多小伙伴问有没有好用的录音转文字工具，今天就给大家分享一款非常好用的神器，当然了，这款工具不只是具备“录音转文字”功能，还有一大堆其它功能可以使用。

当会议，或者课堂上想要进行录音并且整理录音为文字的时候，应用市场里面的这个“录音转文字助手”就能够帮助完成需要的转换。

找到这个工具，并且将这个工具按在手机后，在它的界面的左侧按下录音识别。就可以开始录音，并且快速的将录制到的声音转换成文字了。

Sense4.0的语音识别功能有何改进
Sense4.0的语音识别功能有何改进？Sense4.0的语音识别功能有何改进？随着智能手机的普及，语音助手已经成为许多用户处理日常事务的必备工具。诸如谷歌助手和苹果的Siri已成为用户熟悉的语音助手之一。而在HTC智能手机的Sense4.0操作系统中，语音识别功能也得到了显著的改进与扩展。首先，Sense4.0的语音识别...

简述什么是声纹识别以及它的分类
语音含有丰富的信息内容，众所周知，语音识别技术能够理解语音所传达的内容，即解决“语音表达的是何种信息”的问题。声纹识别，简而言之，就是识别出特定语音是由哪位说话者发出的技术。该技术的研究始于20世纪40年代，最初主要应用于军事领域。其核心理念基于“每个人的发音特征都是独一无二的”，这种...

黄伟回归CEO岗位,云知声的语音识别技术有何优势?
创始人梁家恩强调，技术和实际业务结合的重要性，开放平台策略使得开发者能轻松创新，同时也预示着公司对广告和商业价值的探索。然而

如何使用Winxp语音识别
你需要安装office2003，打开word,点击工具-语音-就会出现语音输入，一开始你需要进行训练使计算机熟悉你的声音，然后你就可以用麦克风语音输入了

喊了半天小爱同学不出来了,怎么回事啊,有没?
2. 误操作：有时候用户可能误操作了，导致小爱同学不能正常工作。这种情况下，可以考虑检查小爱同学的配置是否正确，或者重新设置一下。3. 系统问题：小爱同学的系统出现了一些问题。这种情况下，可以尝试升级或者重装系统解决问题。4. 语音识别问题：小爱同学可能无法准确的识别用户的语音，造成无法回应的...

特征提取,模式匹配,语音识别,类比推理,有何联系?
特征提取，模式匹配，语音识别，类比推理，为时间先后顺序的对应关系。在机器学习、模式识别和图像处理中，特征提取从初始的一组测量数据开始，并建立旨在提供信息和非冗余的派生值（特征），从而促进后续的学习和泛化步骤，并且在某些情况下带来更好的可解释性。特征提取与降维有关。特征的好坏对泛化能力有...

语音识别和图像识别的区别是什么?
很多专家都认为语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别技术，也被称为自动语音识别Automatic Speech Recognition，(ASR)，其目标是将人类的语音中的词汇内容转换...

questions怎么读语音
6.语音识别的隐私和安全问题如何解决？语音识别涉及用户的个人信息和语音数据，因此隐私和安全问题是需要关注的。解决这些问题的方法包括加密存储和传输数据、明确用户隐私政策、匿名化处理数据等措施。7.语音识别与自然语言处理有何关联？语音识别和自然语言处理（NLP）是密切相关的领域。语音识别将语音转换为...

AI(人工智能)到底是什么?
AI可以分为两类：弱人工智能和强人工智能。弱人工智能（或称为窄人工智能）是针对特定任务设计的系统，如语音识别、图像识别或推荐系统。这些系统通常在它们所设计的任务上表现出色，但在其他方面表现不佳。强人工智能（或称为通用人工智能）则指具有类似人类智能的通用能力的系统，能够在各种任务和环境中...

酷派d60的语音识别功能有何缺点?
酷派d60参数概览 2008年，酷派d60轻盈登场，重量仅为115克，搭载了一块26白配tft彩屏，分辨率高达242x320像素，为当时的用户带来了清晰的视觉体验。内置的锂电池支持wap上网，其出色的基础配置在当时无疑引起了不小轰动。优缺点分析尽管酷派d60拥有语音识别拨盘，但与当时的科技水平相比，识别准确度和便捷...

广丰县13151383303： 怎样提高语音输入的识别率 - ？
藤苗妇洁： 随着智能手机越来越“聪明”,越来越多的新输入方式正在得到长足的发展,而作为最重要的人机交互,“语音”在近几年的发展尤为迅猛,应用也日趋丰富. 说到“语音”,大家脑海中第一闪过的可能是微信语音对话,而目前使用最多的“...

广丰县13151383303： 我说英语有口音怎么办? - ？
藤苗妇洁： 所谓“口音”,主要是发音、语调不正确,以及母语中的元音和复音在讲英语时带来的天然影响.克服口音上存在的问题要做到:1、集中一段时间把英语发音一个个纠正和调整好(以后还须不断练习和矫正);2、找出母语和自己原来地方音对英语的影响,最主要的是英语里没有的那些音必须杜绝,不符合英语语调基本规律的怪调,必须自觉放弃和杜绝;3、经常不断练习朗读,特别是大声朗诵.找好文章好段落,或自己熟悉和喜爱的段落,反复多次联系,直到大声朗诵时不再有不正确的发音和语调为止.然后,把同样的内容用低声或平和的语气再叙述出来,才会有自然好的英语的效果.听录音,一句一句的模仿和练习,是一个很好的方法.

广丰县13151383303： 我普通话一直有南方口音而且有鼻音该怎么办 - ？
藤苗妇洁： 作者:匿名用户链接:https://www.zhihu.com/question/19910254/answer/15309284 来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处.南方人说不好普通话的问题主要有以下几个:1、平舌翘舌不分.2、...

广丰县13151383303： 关于语音识别 - ？
藤苗妇洁： 这个是微软的一套语音识别问题,比如说话带地方口音,可能就会识别错误.最好还是用键盘输入,毕竟语音输入还不是很成熟.

广丰县13151383303： 语音控制为什么不听指令了? - ？
藤苗妇洁： 语音控制已不再听指令的随着智能家居、智能手机等产品的普及,语音控制已经成为了一种趋势.然而,有时候我们会发现,语音控制已经不再听从我们的指令,这是为什么呢?可能的1.环境噪音:语音识别需要清晰的声音,如果周围环境嘈杂...

广丰县13151383303： 现在车载语音识别怎么那么差 - ？
藤苗妇洁： 是呀现在有些车载语言使用的识别系统真的是很差劲哎,不过最近我在新闻上看到一款新的东东,叫趣驾WeDrive,功能很强大的,光是说他的车载语音识别系统就很厉害的,因为用的QQ输入法的语音识别,这个我平时用手机聊天也有用到的,正确率很高呢,感兴趣的话可以去新闻上看下呢.

广丰县13151383303： 安装IBM语音识别系统时问题? - ？
藤苗妇洁： 1.软件的安装 Via Voice在安装过程中会对机器硬件进行检测.如果未检测到所需的最低硬件标准(Pentium 166MMX和32M内存)就会产生文字提示.这时,可以选择继续安装而强行通过.之后,软件经过对麦克风的检测和简单的设定后,就可...

广丰县13151383303： 英语培训学校督导 ？
藤苗妇洁： 1. 营造纯正口音的环境现在有很多家长都是选择让外教给孩子上课,因为外教上课比较有活力,但有的外教本身英语就带有浓重的地方口音,孩子模仿后,很难再改正....

广丰县13151383303： 语音识别的最新进展 - ？
藤苗妇洁： 近几年来,特别是2009年以来,借助机器学习领域深度学习研究的发展,以及大数据语料的积累,语音识别技术得到突飞猛进的发展. 1、技术新发展 1)将机器学习领域深度学习研究引入到语音识别声学模型训练,使用带RBM预训练的多层神...

广丰县13151383303： 说话人识别问题 - ？
藤苗妇洁： 不是的,加窗是指截取声音某个频段的值,其余屏蔽掉. 分帧是对连续语音进行数字化处理后,将其分成可传输的数据块.

你可能想看的相关专题

星空见康网

如何解决语音识别中的口音问题？

你可能想看的相关专题