四六级算啥,思必驰语音识别如何听懂方言的?
不论是勒是雾都的重庆,还是遍地靓女靓仔的广东,吴侬软语的江浙,方言都是各地极具特色文化名片。一方面,方言附着极大的亲切感,另一方面,方言也承载着各地强烈的情感认同与文化价值。
科技发展中的语言交流,不能遮蔽地方性的文化和知识。
考虑方言识别存在文化保护的更高立意,同时也在将老年、弱势群体并入科技生活。思必驰放大全链路语音系统应用在方言的识别、理解、合成上,在家居、银行大厅等应用场景落地,形成了能听懂方言的医疗陪伴音箱、智能客服机器人等多样化的产品,可识别粤语、四川话等多种方言。语音识别的软肋口音、方言
语音识别好比机器的听觉系统,让机器通过识别、理解,将语音信号转变为可理解的文本。汉语语音识别的研究起始于70年代,经历四十余年发展,得益于技术的演进和海量数据的积累,一般场景下普通话识别都能达到较好的识别效果。但口音、方言仍是全球诸多人机交互公司共同面对的挑战。
为了探究方言、口音对语音识别系统的影响,2018年华盛顿邮报,Globalme、PulseLabs(语音研究公司)合作,对市场主流智能音箱进行测试,事实证明智能音箱不能对方言通吃。
方言识别究竟难在哪?
多音多义,使用情境各不同。以中文为例,不仅是在文字使用习惯上(例如,老后悔了),读音上也存在差异性(插读擦,胡读福)。标准普通话由21个声母和39个韵母组成,上海方言中却包含34个声母和54个韵母,不同方言就是不同数量的声韵母组合。同时,语音识别是一个强场景关联的技术,不同使用情境,方言识别效果存有差异。针对性的声学模型语言模型训练是一个长期的过程。
需要丰富的语料用以训练。可以理解为机器的词汇量,思必驰基于多年语音交互领域的研究,积累了大量基于场景化的数据,铢积寸累地汲取方言语料,不断更新、完善语音数据资源库的建设。
需要持续地研究文化、语素、音素,专业人士、方言专家的参与,会让方言识别效果事半功倍。低资源环境,如何保证识别准确率?
面对低资源环境,如何提升语音识别准确率?思必驰研发了多种跨语言预训练、联合学习、迁移学习的技术,使用较少的数据,来实现方言识别效果的提升。
跨语言预训练模型
跨语言预训练,简言之,就是利用大量的有监督或无监督文本,例如用普通话来作为它的基底得到通用的预训练模型,在此基础上叠加少量的方言数据进行模型训练。伴随后期积累起来的方言、垂直场景数据。炼丹炉就可以不断提高模型性能表现,从而提升识别率。
多语言联合学习,例如考虑到贵州、四川地理位置上的接近性,因而语言近似性较高。在方言数据样本低资源下,思必驰将近似性语言进行联合学习,从而降低模型的识别难度。
自研的小样本迁移学习技术,用较少的数据量,可以快速实现场景体验优化。例如使用少量带标注的文本数据,即可对标点断句进行优化,相对传统模式调优,节省了83的数据量。
使用联合学习和迁移学习的识别后处理技术
在实际应用中,满足大规模快速自定制的模型,是企业方的切实需求,一是低门槛快速定制,二是能拥有足够的自主权。思必驰方言识别技术,同时具备快速高效的场景化定制能力。通过数据的快速收集和场景模拟,结合自主研发的识别模型自训练系统,短时间内显著提升方言识别模型在应用领域的效果,满足业务需求。
对于有多语言混合需求的集成商,思必驰运用多混合识别模型,在完成识别特定方言的同时,还可识别普通话,最多支持十多种方言的识别。例如,中川混读模型可以同时识别四川话和普通话。
目前,思必驰提供基于云端混合引擎的连续语音识别,支持四川话、粤语、上海话、闽南语、陕西话、山东话等十几种方言识别。
轻松识别方言,让交互更有温度
探索人机交互的自然、流畅发展,语言的交流一定要足够人性化。
重庆农商行客服机器人刷屏朋友圈,TA能听懂四川话,顺畅完成余额查询、转账等操作,面对说惯了四川话的老一辈人们,这个功能太友好。
基于广泛的生活场景,思必驰与合作伙伴一起将人性化交互的主动权交给用户,聆听更多新声。
在家里,美的空调热水器烤箱等产品均支持多种方言(粤语,四川话,山东话,上海话)识别,方言转普通话等模式,各色乡音无缝交流。思必驰智能医疗音箱亦能听懂方言、重口音普通话,充当家庭医生安心相伴。
汽车里,支持四川话的语音识别服务,导航都略带一丝麻辣味。某城市地铁站内,自助售票机支持普通话中英混合英语粤川沪等多语种及方言的识别,准确识别(lei)岗站、东涌(chong)站等冷门、多音字的站名,乘客语音问询、购票更自由。
会议室里,语音识别入乡随俗,用方言的特技展现出出色的工作能力。
伴随AI语音技术普惠式发展并逐渐下沉,让不会拼音、不会普通话,只会方言的老年人,可以通过方言识别实现无障碍交流,这是可见的事实。广袤的华夏大地,科技反哺传统,正守护着多彩语言文化的灿烂文明。
当下来讲,加强对方言字词、方言音标标准化建设,让TA更懂人们的声音。未来随着语音识别自适应能力越强,不受特定人、口音、方言的影响的识别技术将指日可待。
关于发红包,微信凌晨官宣今天是情人节,据微信派微信号凌晨消息,今天可以发520红包。微信官方还调侃你有人可以发吗?实测显示,微信的确开放0520元红包,额度不能超过520元。由于520谐音……
年轻人喜爱的懒人家电几十块就能解放双手都说80、90后是压力最大的一代,他们不仅要面对时代下的快节奏生活,而且还要面对各种工作压力、婚姻压力、买房压力等等。而一些智能家电的诞生,不仅能够让这两代年轻人减轻一些生活上……
如何正确对待元宇宙,跟比特币一样吗?现在元宇宙项目或许是泡沫期,元宇宙最大的投资机会就是货币和交易平台,只要抓住在未来20年就赢定了。现在能做的就是追踪,研究和观察,等待机会。元宇宙,就是下一代现实和……
三星GalaxyS22Plus怎么样?三星GalaxyS22Plus三星GalaxyS22Plus最新上市价格还未公布,上市时间为2021年。首先,我们关注屏幕方面,屏幕尺寸为6。2英寸。分辨率为320……
手机sd卡怎样修复,手机能自己修复吗?使用手机通常都是要安装sd卡的,不管用的是按键手机还是智能手机,如果手机的内存不多的话,就可安装外部存储卡,来为我们的手机分担一下内存,不过有很多网友会遇到手机sd卡坏了的情况……
一文了解MySQL性能测试及调优中的死锁处理方法,你还看不明死锁检测通过SQL语句查询锁表相关信息:(1)查询表打开情况SHOWOPENTABLESWHEREINUSE0(2)查询锁情况列表SELECTFROMINFO……
8分钟充满电?你没有看错!200W有线快充和120W无线快充国产手机在快充技术方面,只能用牛这个字来形容,这也是国产机碾压三星、苹果等海外巨头的一大优势!就算是国产的千元机,都已经配备了快充技术。就拿Redmi刚刚发布的新机RedmiN……
禁用MATLAB对中国航天的发展有什么影响?没什么影响,matlab也就是个入门上手级的仿真软件,用来教学还是不错的。细分领域的话需要更专业的软件。影响应该不大。航空航天、军工企业,那都是国家的高度机密,用到这类软……
苏宁易购上的苹果手机为什么比苹果官网的便宜?在悟空问答上的201个问题,只写接地气的科技内容,欢迎关注。楼下几个回答我是真的忍不了啊,都在乱说些什么。。。。。。这种问题讲过很多次了。今天看了一下价格,以iPh……
6nm工艺!国产5G芯片来了命名唐古拉近日,在2021紫光展锐创见未来大会上,官方推出了一款6nm芯片,叫做唐古拉T770。实际上,这款芯片的原名叫做T7520,将其定位为5G双载波、急速体验、多媒体、游戏强芯。……
20210420互联网新闻华为旗舰店今起开始卖车今日头条1。华为旗舰店开始卖车首辆车为赛力斯华为智选SF54月19日,华为终端官方正式宣布,将正式开启汽车售卖业务,首款车型为赛力斯华为智选SF5。目前,该车已经上……
港股市场今日为何发疯作者明野数据支持勾股大数据(www。gogudata。com)今天港股市场就很疯狂了,主要是大金融板块互联网的大幅反弹。港股市场,去年应该是全球最惨的主流市场……