游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

iOS15上线图片翻译功能,能取代专业翻译软件吗?

  此前iOS15系统更新,有一个功能引发了不小的关注,那就是内置图片翻译。
  用户可以直接选择照片中要翻译的文本,查看翻译结果。据说苹果还更新了翻译模型,提升了翻译效果。
  这就刺激了,如果说几年前神经机器翻译的出现,是许多人类翻译的噩梦,那这个系统内置翻译图片功能的推出,大概能让不少专业翻译软件睡不着觉吧。
  就拿我这种需要经常阅读英文资讯的人来说,时常遇到pdf文献、图片类内容,需要第三方软件拍照识别后进行翻译。如果iOS15直接可以识别图片,不就省略了几个步骤吗?简直懒人福音。
  那么问题来了,翻译好不好,重点在疗效,iOS15的图片翻译能力已经强大到能替代专业翻译软件了吗?要知道,信达雅的中文表达一直是NLP领域的难题,一家带着硅谷基因的科技公司,真能完成地道的中英互译?
  本着实践出真知的态度,我们准备了多道考题,并选取了口碑和用户数都相对突出的有道词典APP来参与横向评测,以此来摸索iOS15图片翻译的真实水平。
  真心话与大冒险:
  图片翻译三步曲
  针对翻译功能的专业评测有不少,各种指标诸如短中长句都有详细的评测标准与规范,不过作为普通用户,我们决定从大家日常使用图片翻译的具体场景和步骤中去进行测评。
  一般来说,图片中的文字要被精准地翻译出来,需要至少具备三种能力:
  第一步:火眼金睛,看得准。
  图片翻译想要满足用户需求,首先考验的不是NLP技术,而是OCR能力。只有识别得准,才能为后续翻译奠定基础,这一能力的关键考核指标,就是字准率。
  从操作上来看,苹果iOS15采用内置方式,可以直接选择照片中要翻译的文本,查看翻译结果;有道词典需要打开app中的拍照识别功能。前者在使用上要更方便一些。不过到了识别环节,iOS15就有些拉胯了。
  我们找了一个英文短句、一个英文长句和一个中文长句。结果显示,在英文字准率上,苹果和有道差距不大。
  比如,有道100识别出了原文Domeafavor,canyoulookformycreditcard。Idontfindit。
  iOS15的结果是:Domeafavor。,canyoulookformycreditcard,Idonfindit。
  尽管苹果将dont识别成了don,但不太影响阅读,准确率还是可以接受的。
  换个英文长句测试一下,下面这张图片,有道的识别结果是:
  Onebadchapterdoesntmeanmystoryisoveruntilyoufindanewchapterwhichyouthinkitsright,达到了98。96的字准率。
  iOS15的结果是:
  Onebadchaptertmeanmystoryisoveruntilyoufindchapterwhichyouthinkit’lSright。
  将itsright识别成了itlSright,可能会影响后续的语义理解。
  到了中文字准率测试,有道和苹果就拉开差距了。比如下面这张图片:
  有道是100完整识别,苹果iOS15则将雨水的雨,一系列的一,没有识别出来,倒数第二段的纪念祖三个字也被遗漏了,直接影响阅读体验和用户理解。
  综合来说,英文字准率二者差距不大,有道略胜一筹;中文字准率上,有道能做到90以上的精准识别,苹果iOS15只有79,有道优势明显。
  造成这一差距的原因,可能是有道词典在图片翻译上积累更多。
  早在5年前有道就开始尝试开发图片翻译功能,后续又通过有道智云为许多主流手机厂商提供相关能力,许多用户会在各种光照条件、各种用法下使用,因此积累了大量训练语料,通过不断迭代段落分析、图片检测、图像偏移角度检测、语种检测等算法,OCR能力自然能得到针对性优化。
  加上有道作为中国公司,对中文母语的理解更深,而苹果iOS15刚刚开始广泛推广,在现实场景下的中文识别还有不足,也是可以理解的。
  第二步:心如明镜,搞得懂。
  图片文本识别完成后,就需要神经机器翻译来将其转化成相应的译文。中英文都是语料相对丰富的语种,因此对其理解能力的要求也更高。
  所以我们选择了两个比较细节的点来考察:
  一是时态。
  原文是的,今天出去玩,含有计划的意思。
  有道翻译为Yes。weregoingouttoday;
  苹果的译文是:Yes。goouttoday。
  显然,有道采用了begoing一般将来时,更准确地理解了原文的意图,表达出了计划、安排、打算做某事的意思,苹果的译文则没能体现出计划的状态。
  二是单复数。
  英文单词的单复数常常承担着截然不同的释义,如果无法准确识别可能会让译文与原意南辕北辙。
  比如这个1200square,有道词典翻译为1200平方,苹果iOS15的翻译是1200个广场。
  square在单数状态下指的是平方单位,苹果的译法很容易让读者产生歧义。
  当然,在整体理解上,有道和苹果的中英互译水平都能满足基本的阅读需求。
  比如这个长句:
  Heputsdown20,000asadepositonthebeautiful200,000villabelievingthathisinvestmentwouldincreaseovertime。
  有道的译文:他为价值20万美元的漂亮别墅付了2万美元的定金,相信他的投资会随着时间的推移而增加。
  iOS15的译文:他存了2万美元作为这栋美丽的20万美元别墅的押金,相信他的投资会随着时间的推移而增加。
  目前,图片翻译的中文互译,有道和iOS15基本都表现出了较强的理解能力。对一些单词用法、表达习惯上的细节洞察有差距,这背后还是语料积累、模型选择、性能优化等的差异。
  第三步:舌灿莲花,说人话。
  中文翻译,很多人的黄金指标就是信达雅,指的是译文要准确,不偏离原文;要通顺,语法结构符合习惯;还要优雅,用语地道而富含文采。
  神经机器翻译发展到今天,能否满足这一要求呢?有道和苹果这两个带有不同语言基因的翻译平台,恰好可以调戏一番。
  先来一道送分题:
  原文:你们收了我80块;
  有道译文:Youchargedme580;
  iOS15译文:Youreceivedme80yuan。
  收钱是用charge,有道翻译更符合英文表达,苹果将收到直接翻译为receive,不够地道。
  再来一道中长句试试:
  原文:Aftertheaccident,Ifeltmyselfanotherperson。
  有道译文:事故发生后,我觉得自己变了一个人;
  iOS15译文:事故发生后,我觉得自己是另一个人。
  苹果将anotherperson直接翻译为另一个人,而不是表达心态的转变,容易产生歧义,有道译作变了一个人,更准确和口语化。
  当然,过于直译的问题有道也会犯。比如下面图片中,原文:Inconclusion,drawingontheelectronicmediaorprintedbooksmightbeagoodapproachtounderstanddifferentplacesorcountries。
  有道译为:总之,利用电子媒体或印刷书籍可能是一个很好的方法来了解不同的地方或国家;
  苹果译为:总之,利用电子媒体或印刷书籍可能是了解不同地方或国家的好方法。
  iOS15对语序进行调整之后,表达更妥帖自然,有道则出现了按照对应模式直译的情况。
  不过,这次测试题主要是基于生活旅游、文化交流场景来进行的,对于专有名词的翻译效果如何,还有待进一步考察。
  另外,由于苹果iOS15在第一步OCR识别上字准率较低,这会直接影响后续的文本理解,因此苹果的部分翻译结果数据不具有参考性,对其翻译水平不能妄下定论。
  评测可以看出,一次信达雅的图片翻译,依靠的是多技术的融合,需要OCR、分词、语义理解、上下文记忆、主题抽取等多种能力共同发力。
  因此,初出茅庐的苹果系统级图片翻译,想要取代专业翻译软件,路还很长。不过,有道也存在一些机器翻译的普遍问题,作为专业的翻译软件,仍可以继续强化其专业壁垒。
  这也引发了我们的思考,为什么有了AI,神经机器翻译依然无法媲美人类译者?
  理想与现实的参差:
  戴着镣铐跳舞的神经机器翻译
  神经网络刚被引入机器翻译时,被视为所向披靡的神器。但几年过去了,这一神奇技术确实比传统的统计机器翻译优秀很多,但距离人类翻译家的水平还有差距。
  就拿这次苹果iOS15与有道词典的横向测评来说,二者或多或少都有不足之处。简单来说,原因可能出在几个方面:
  1。OOV(OutofVocabulary)问题难以解决。
  基于深度神经网络的机器翻译模型需要海量数据的学习。如果数据量比较小,出现次数极少的词的词向量质量就会比较低,在实际应用中出现太多未登录词,会导致错译、漏译等情况。目前,一些垂直领域资料稀少、语料不足,尤其是中文有几千上万个字符,其中很多是生僻字,这些都会影响模型表现及译文的质量。
  要解决这一点,只能靠笨功夫积累数据。据有道词典的技术人员表示,要做好中文识别没有特别好的办法,只能不断的积累数据,迭代算法,有道在过去几年做了大量工作。
  2。算法优化与创新等待突破。
  不同语言文化的文字表达、逻辑结构、信息冗余度、语法结构都不同,存在大量信息不对称,在编解码过程中出现错译也就不足为奇了。
  《文化翻译论纲》一书中提到,译文等于原文原文化背景译文译文文化背景原作者的气质和风格译者的气质和风格的混合体。
  而要理解背后的文化、气质、风格等隐藏属性,只能通过技术迭代和创新来实现。比如有道允许用户提供额外的自定义词典,来精准调整神经网络机器翻译的局部结果,解决专有名词的翻译难题;
  业内也开始尝试引入多模态翻译,通过图片中其他事物的特征来辅助理解文本。举个例子,如果机器翻译只看到GATE这个词,可能会把它简单的翻译成门,但如果图片中显示这是一张机票或者背景是飞机场,那么翻译为登机口就会更恰当。
  3。细分场景适配没有捷径。
  随着机器翻译的普及,用户对翻译质量提出了更细分的要求,比如图片翻译时前置环节的少量识别错误可能带来的级联问题;网页翻译时不仅要提供正确的翻译,还要尽可能保持原有网页样式的一致性;文档翻译时,人名、地名、组织机构名或专业术语可能多次出现,上下文如何保持一致;在配置较低的端侧设备上,也要提供又快又好地翻译体验不同场景下的各种问题,需要针对性地优化。
  就拿图片翻译来说,自然场景下的图像识别十分复杂,往往在实验室中效果很好,但用户会在各种光照条件下,拍各种稀奇古怪的东西,识别完以后还需要判断哪些词属于一个句子,哪些句子是一个段落,翻译出来的结果应该如何呈现。据了解,有道也优化了很久,在算法侧对翻译模型做了鲁棒性增强,即便在实际环境中遇到个别无法避免的文字识别错误,仍然有稳定的性能表现。
  从这个角度来说,图片翻译等新应用场景想要给用户带来体验的颠覆式改变,需要的不仅仅是实验室中的创新,还要关注并解决技术在应用场景中落地遇到的具体问题,来优化最终体验,没有捷径可走。
  从被人类译者惊呼抢饭碗的妖术,到阅读学习娱乐场景中频繁出没的日常应用,神经机器翻译技术落地现实的速度超出了很多人的想象。
  对于这些致用型技术来说,应用突破比理论突破要更简单,也更急迫。这也是我们在此时想聊聊图片翻译这个小功能的原因。
  随着全球往来的逐步重启,以更自然实时的方式了解跨语种资讯越来越成为一种必然。图片翻译对于旅游出行、专业阅读、无障碍人士触网等都有着不可或缺的价值。这也是苹果、有道等产业界力量的价值所在,通过来自现实环境的数据、互动与反馈,不断迭代并推动神经机器翻译的点滴进步。
  目前看来,苹果iOS15的系统级图片翻译要取代专业翻译软件还为时尚早,事实上可以预见,未来两者并不会相互替代,而是在各自适用的场景和不同需求强度下,相互补充,各擅所长。
  来自产业界的每一次实践,都推动着技术向前一步。积沙成塔,终有一天,人类能翻越阻碍语言交流的通天塔。
  好了,今天的文章分享到这就结束了,要是喜欢的朋友,请点个关注哦!我是简搭(jabdp),我为自己带盐,感谢大家关注。

spring循环依赖三级缓存循环依赖BeanFactory作为bean工厂管理我们的单例bean,那么肯定需要有个缓存来存储这些单例bean,在Spring中就是一个Map结构的缓存,key为bea……你已经接不住机器人发的乒乓球了《我们的5G》是虎嗅X高通联合打造的5G系列报道,旨在关注5G产业发展动态,以及背后的人、公司以及行业如何通力合作,实现5G从技术基础到日常应用的链路通达,勾勒每个参与者对5G……什么是Pro级体验?灵越14Pro带你了解商务出差,生活必需品得有,电脑也必不可少!想想看,在外办公本就诸多不便,要是再背上厚重的电脑,你随时都可能暴跳如雷!这个文件今天得交哦好嘞,一会就准备一下外出……李嘉诚看好印尼电信市场,旗下长江和记印尼分公司将完成与印尼本文CandiceWong2018年,香港首富李嘉诚从长江和记董事长一职退休,但仍担任该公司的高级顾问。图片来源:APPHOTOKINCHEUNG香港亿万富豪李嘉诚的……滴滴APP无法下载,每天订单量还在持续增加,为什么?自20世纪五十年代中期,当今时代的大趋势转为信息化。一大批线上打车软件应运而生。以前,人们出行还在依靠打车的方式,出租车价格水涨船高,宰客现象不在少数。程维发现社会漏洞问题,准……如何解决手机卡顿内存不足的问题?以上问题一般在手机内存空间较小的较老的手机经常出现的问题。手机内存实际上是两个部分:一是运行内存,二是机身存储空间,前者作用类似电脑是内存条,用于应用程序的运行,后者类似电脑的……手机运行内存4G和6G的区别很大吗?手机性能是很多机友在选购手机时最看重的一方面,而影响手机性能的因素除了处理器外,手机内存的大小也是至关重要的。通常大家把手机的运行内存和闪传混为一谈,其实两者的区别可大了……C泛型指针与共用体对泛型编程的模拟C用模板来实现泛型,C没有模板,但通过void指针可以一定程度上模拟泛型,特别是在库函数中用做函数参数或函数返回值,如memmove()、qsort()等。以下是一个用v……华为在贵安建了个童话小镇里面藏着它最重要的数据资产从贵安新区向南驱车40分钟,进入数谷大道后,一座占地1521亩童话小镇逐渐映入眼帘,红黄蓝绿交错的建筑外墙颇有异域风格,很难让人想到这里放置着华为最重要的数据资产。9月9……选购手机,对应需求,性价比才会最高,你想清楚了吗现代人离不开手机,手机不仅用于打接电话,现在已成了人们与这个世界联接的一个移动终端。大家都在感叹,没有了手机,寸步难移。手机作一个工具,是一个必须品,也会是一个重要的花销,特别……华为OR荣耀,你选哪个?脱离华为的荣耀,昨日召开新品发布会,推出荣耀magic3至臻版。6。76英寸曲面屏,1080P高清像素,456ppi,最高120HZ刷新率。这感觉,屏幕这块还是华为的P5……华为定于6月2日发布升级鸿蒙万物互联系统这篇文字可能不是人多关心的话题,但我实在告诉大家,不论你用的是什么手机,不论你生活在哪里,也你现在生活如何,都绝对对你有紧密关系。在科技圈有关鸿蒙的关注度在国内还是占据榜……
大唐女法医小说女主和谁在一起了揭晓冉颜结局和扮演者资料近日,电视剧《大唐女法医》官宣了,将在2月14日情人节的时候和大家见面,那么,在小说当中,女主和谁走在了一起呢?揭晓冉颜结局和扮演者资料,一起来看一下。大唐女法医小说女主……西游记杀性最重的神仙是谁得罪他的人没有一个好下场西游记杀性最重的神仙是谁:得罪他的人没有一个好下场西游记是一本讲述社会故事的书,只不过是把人替代成了妖魔鬼怪、神仙而已,吴承恩也是想通过书中的情节,揭露社会存在的种种问题……唐探3回归春节档唐探3讲述了什么故事近日,电影《唐人街探案3》宣布回归春节档,将于2021年大年初一上映,这是时隔了9个月之后终于和大家见面了,那么,《唐人街探案3》主要讲述的是什么故事呢?一起来看一下具体的情况……电影大轰炸什么时候上映大轰炸电影剧情介绍和影片信息电影大轰炸什么时候上映:大轰炸电影剧情介绍和影片信息《大轰炸》是由萧锋执导,梅尔middot;吉布森担任艺术指导,由刘烨、布鲁斯middot;威利斯、宋承宪、陈伟霆、范伟……又一款望远镜?三星S11搭载潜望式镜头眼看着2019年还有不到两个月的时间就结束了,市面上关于三星新旗舰手机GalaxyS11的消息也越来越多。近日据PhoneArena报道,三星GalaxyS11手机的内部代号为……全新奇骏采用三缸机瞬间脱粉,同价位车型不妨看看它们说起SUV,不得不提提哈弗H6、本田CRV跟丰田RAV4,这三款车可以说是消费者最喜欢的车型,深受消费者的喜爱。而日产奇骏虽然不如它们销量火爆,但是也有着自己庞大的粉丝群体,不……给高四的孩子的几句话1。容易睡觉的话,可以冷水冲脸,或者站起来(但不要挡着别人),如果困得不行,可以适当涂抹风油精在太阳穴上,但不可涂抹太多,会很疼(注:使用次数不要过多)2。要逼迫自己上课……宛瑜的扮演者死了?为什么这么说事件始末及真相《爱情公寓》大火,让我们知道了林宛瑜。据悉,《爱情公寓》林宛瑜的扮演者赵霁,然而,就是因为赵霁不演林宛瑜了,几乎没在荧屏上出现,从而被传闻死了。那么,宛瑜的扮演者死了?为什么这……台积电11月8日前将向美国提交商业数据备受关注的美国要求各大芯片企业向其提供商业数据一事,现在基本上有了一个结果。到目前为止,英特尔、台积电、英飞凌、通用、SK等各个芯片领域的行业巨头,已经表示,将在限期内向……庆余年第二季来袭唯一想换掉的竟是肖战电视剧《庆余年》第一季已经播出完了,在近日,《庆余年》的第二季似乎已经预定好演员,据了解,在第二季当中大部分都还是原班人马,但是很多人员还不能够确定,但是网友表示为想换掉的竟是……葛优电影集合葛优的电影18部电影全集葛优,称得上当今中国最优秀的男演员之一。本文介绍葛优电影,葛优主演的电影全集,葛优电影合集部部经典,18部电影你喜欢哪一个?葛优电影集合(18部)1、《天下无贼》这……延迟退休政策正式实施!708090后退休年龄划清楚了最近,延迟退休再次引起热议。研究了8年之后,延迟退休这一次真的要来了。近日,新华社授权发布的《中共中央关于制定国民经济和社会发展第十四个五年规划和二三五年远景目标的建议》……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网