技术解读思必驰DUI标注训练一体化平台,语音识别全场景覆盖
坊间总会流传些他们的段子
格子衫、双肩包、沉默且不苟言笑
当然,还有岌岌可危的发量(没有,不是我说的)
那只能说,这些都是表象
堪称新时代的中流砥柱
每天家住回龙观,征战新中关
浑身散发出高级又内敛的气质
究竟是什么塑造的?
(一切为了工作挣钱)
小驰捕捉到一位思必驰程序员小哥哥
今天去看看
他日常的那些封神级操作!
Q:一句话形容你正在做的事情?
A:人类之光在宇宙中心呼唤AI反正很Cool就对了
Q:最近有什么新成果吗?
A:你光顾着关注我们发际线,不关注我们的精神成果,扣鸡腿最近发布了DUI标注训练一体化平台。
Q:如果我中英文掺着说,语音识别TA能听懂吗?
A:不同场景、环境下的语音识别效果多少会受噪声、专业术语、多语言混合影响。契合场景来提升语音识别率,自然就能准确许多。
Q:让场景识别率能持续提升,你们有什么神技傍身?
A:我们融进了最新的端到端识别技术来提升识别准确率,通过大规模预训练模型技术提升语音识别后处理效果。结合增量学习、主动学习、联邦学习和小样本迁移等技术手段,提升用户体验。同时开放端点检测模型自训练、标点断句自训练等功能,让用户自己拥有自主权,来解决实际问题。
Q:呃
A:好,说点你能听懂的高能,划重点!
第一,关于端到端识别技术。
过往严格意义上的端到端识别技术,如基于LAS的端到端系统,虽然可以较明显地提升通用语音识别的准确率,但受限于计算复杂、自定制语言模型技术不成熟等原因,不能大规模的商用。思必驰去年推出新一代端到端语音识别建模技术,在实现通用识别准确率相对提升1015的同时,也提升了模型计算速度,更可以满足快速有效的语言模型自定制。
第二,关于大规模预训练模型技术。
要知道,语音识别系统中除了核心的语音识别(ASR)模型部分,语音识别的后处理模型也是十分重要的,它直接影响到识别结果的可读性。思必驰语音识别系统支持智能纠错、智能标点断句、智能口语顺滑、智能语义分段、智能语义纠错等语音识别后处理技术,能进一步提升语音识别的效果与可懂度。模型采用大规模预训练模型,结合多任务学习(MultiTaskLearning)和知识蒸馏(KnowledgeDistillation)方法。在降低70以上模型规模的条件下,提升了模型效果,运算效率大幅提升同时降低了内存开销。
例如在智能会议场景中,通常转写结果是篇章段落,且多含有口语化的表达,通过我们的识别后处理功能,可以将会议转写结果整理成格式化,易读易懂的会议记录。
第三,增量学习。
受限于深度神经网络技术中的灾难性遗忘问题,采用深度学习方法的ASR建模在权衡既要保障模型原有识别效果,又要提升新的目标场景识别效果时,通常采用基于新旧数据混合训练的方法。弊端是,该方法增长了模型优化的周期,又会带来数据安全隐患。基于思必驰自研的KDFIL增量学习方法,在语音识别优化时,可以仅用新增数据进行模型训练,缩短开发周期同时,也有效保障数据安全。
第四,小样本学习。
自研的小样本迁移学习技术,使用少量数据就可快速实现场景体验优化。例如使用少量带标注的文本数据,即可对标点断句模型进行优化,相对传统模式调优,节省了83的数据量。例如,在真实的航空质检场景中,通用的标点断句模型面对特殊的专业术语和断句方式,一定会水土不服。得益于小样本迁移学习技术,在使用少量的标注文本情况下,即可实现F值40左右的绝对值提升,完成体验效果从不可用到可用的转变。
最后,咳咳。(这个氛围是不是该升华了)在功能层面,我们深知不同用户的使用场景复杂多样,单靠赋能用户自主训练ASR模型不能满足需求。
我们!(升华来了)秉承以解决用户实际问题为核心的产品理念,开放端点检测模型自训练、标点断句自训练等功能,使得用户可以通过我们的产品,完成识别系统中几乎所有模块功能的自训练,最大程度优化用户体验。
Q:啊,真不愧是人类之光。求问,没经验可以用吗?
A:平台建立的出发点就是降低AI使用门槛,只要企业有数智化转型的需求,我们就能匹配提供高可用定制的模型。平台的私有化部署能力,也能将自主权交给企业自己,非AI专家都能使用,零学习成本。
Q:怎么合作呢?
A:平台同时满足模块化输出支持UI可视化界面API输出这两点,可以根据业务需求灵活配置,选择使用一体化平台的全部功能,或者只使用其中几个模块的功能。
Q:可以拓展使用吗?
A:当然可以,全场景覆盖是平台的一大优点。适用于各类行业场景,如会议办公、航空通讯、智慧医疗、城市交通、数字化门店、智慧园区、线下质检、政务、庭审等等,可以快速从当前项目复用到新项目中,形成规模化生产定制,满足多样化的业务需求。
Q:怎么联系你们呢?
如有合作意向,请发邮件:
marketingaispeech。com
Q:好,不愧是气质不凡的你们!今天收获颇丰!
A:总结下,就是我们在一个科技开放和包容的时代,和一群特别Cool的人,做了些特别Cool的产品和事情。如果你想更了解我们,欢迎随时交流。
这届小学生,用yyds写作文2015年出生的小孩子今年6岁,到了上小学的年纪。在大人掌控的世界中,他们是网络那头不值一提的小学鸡。无法回避的是,这一代的小孩泡在网上长大,论冲浪技能不比大人生疏。伴随他们成……
如何保障重要会议正常召开,以下几点需要注意阜新声艺视听数字会议系统作为现代会场建设的核心系统,不仅要有清晰的拾音功能和超长的拾音距离,而且系统的稳定运行保障也是非常重要的,尤其是大型的会议上,一旦出现故障,既耽误了会议的进度与决策……
音频压缩器及其使用阜新声艺视听你可能是第一次接触压缩器,又或者你已经有多年混音经验,以下的内容希望可以帮助各位更明白压缩器及简单分享笔者用压缩器的心得和一些小秘方。1)压缩器:自动音量调教器压缩……
女人自信是一种精致自解放了女人,就举国上下百年来鼓励女人要自信,要独立,要做强者,以至于现在都强到男人们的肩头上了,扳着男人的双耳。想必当初提倡妇女解放的先辈们也会失落,竟为这世上开辟了造就泼妇……
无线耳机听音乐岂能听个响?JEETAirPlus无线耳机体验随着科技的发展,无线耳机的技术也越来越成熟,耳机的体验也得到了质的提升。但市面上无线耳机质量良莠不齐,对于对TWS耳机不太了解的用户来说,选购一款适合自己的TWS耳机显得尤为困……
名企头条中兴称不具备芯片生产制造能力德国电信跟华为签5G合同马斯克豪宅以2900万美元价格出手:买家是丁磊关联公司据《华尔街日报》消息报道,特斯拉首席执行官埃隆?马斯克近日以2900万美元的价格出售了他在洛杉矶BelAir地区的一……
真快乐深化用户思维真选严选赋能高品质消费在消费升级背景下,用户对高品质消费平台的需求与日剧增。一个高品质零售平台,可以提供高质量的商品和服务,既要满足消费者对品质好货的需求,也要实现消费者放心无忧购的需求。而这正是电……
发福利了!魅族16全系最高直降30012月20日0点,魅族16系列最高降300元,魅族16th售价2498元起,魅族16thPlus售价2998元起;轻奢拍照旗舰魅族16X更优惠,仅售1798元起。魅族官网、魅族……
WindowsService服务和定时任务框架quartz之前言:项目开发完成后,对接的项目有很多个模块,由于其中的一个环节疏忽,现在需要在原有的基础上把缺失的数据自动写入数据库存储起来。重新修改程序逻辑已然不现实,现在需要一个补……
简谈以太网RDMA网卡的应用各式各样的数据在网络介质中通过网络协议(如TCPIP)进行传输时,如果信息量过大而不加以限制的话,那么超额的网络流量就会导致设备反应缓慢,由此就造成了网络延迟。延迟越低越……
数据表明谁在接盘华为手机,三星枉为全球销量第一,还是降价算了三星手机长时间,在全球智能手机市场处于榜首地位。在2020年第二季度,华为迸发出最后的力量,从三星手中夺走手机销量第一的宝座,但华为在芯片代工渠道上遭遇极致的遏制,因无芯可用导……
能成为年轻人的购车首选吗?95后小伙体验比亚迪宋DMi价格理想其实向前买车的预算是18万左右,虽然这个价位的合资SUV有很多,但是向前经过选购发现它们在空间、配置,以及节能方面都不如宋PLUSDMi。再加上宋DMi作为一款插……