纠纷奇闻社交美文家庭
投稿投诉
家庭城市
爱好生活
创业男女
能力餐饮
美文职业
心理周易
母婴奇趣
两性技能
社交传统
新闻范文
工作个人
思考社会
作文职场
家居中考
兴趣安全
解密魅力
奇闻笑话
写作笔记
阅读企业
饮食时事
纠纷案例
初中历史
说说童话
乐趣治疗

你知道吗?每次输入验证码都是在给Google义务劳动

5月1日 海岸线投稿
  每次输入验证码,你都在义务劳动。
  最近发现,上网遇见的验证码“越来越有内容”了。
  为了证明自己是个真人,除了要输入方框里的文字,还得做从下面图中挑出路牌、挑出门牌这种连连看似的高级任务。
  在连续干了好几茬之后,硅星人突然醒悟:我这哪里是在填验证码,根本就是在帮别人标注数据,训练AI啊!
  不管是给图片分类:
  给路牌勾边:
  还是把路牌圈出来:
  感觉都是在教无人驾驶的AI认路啊
  其实,“输验证码就是在为AI打工”并不是硅星人想得太多。事实上,我们在输验证码时义务劳动的历史,从古早的文字验证码时期就开始了。
  每次输入验证码,你都在义务劳动
  今天,应用最广的验证码系统就是reCAPTCHA(CompletelyAutomatedPublicTuringTestToTellComputersandHumansApart,区分人机的全自动图灵测试系统)了。
  这家如今已被Google收购的公司,承担了世界上大部分网络的人机验证工作(上文给出的三个例子均来自reCAPTCHA)。
  2007年,reCAPTCHA的创始人之一,卡内基梅隆大学教授路易斯冯安(LuisvonAhn)想到:“如果人类与机器各有擅长,能不能利用验证码系统,让人类和机器共同解决问题呢?”
  当时,一个亟待解决的问题就是,如何把浩如烟海的人类纸质典籍数字化。
  想要数字化文本,一种方法是手工录入。这种方法费时费力,还容易出现录入错误。另一种方法是先扫描文本,再结合光学文字识别技术录入文字。听起来很美,但有些年代久远或本身质量就差的文本扫描出来后实在是太糊了
  以至于电脑识别出来的文本漏洞百出,根本没法看。
  为了解决文本数字化的问题,2007年,路易斯推出了新的验证码系统reCAPTCHA。
  在reCAPTCHA验证码系统里,一个验证码会由两部分构成。
  第一部分和之前一样,是自动生成并且经过变形处理的文字,用来检验你是不是真人。而第二部分,则是从无法识别的文本中截取出来的词。
  如果用户正确输入前半部分,那么reCAPTCHA就会假设用户输入的后半部分也是正确的,然后把录入结果返回至reCAPTCHA的项目主机。
  结果返回主机后,主机还会把这个结果再派发给多个用户进行交叉验证,以确保没有不小心或故意输错单词的情况。
  也就是说,真正有效的人机测试在验证码的前半段已经完成,而后半段,就是用户在义务为人类文明做贡献了。
  那么,reCAPTCHA到底做了多大贡献呢?
  2007年推出之初,reCAPTCHA每天都能帮助录入3000万个字符。2008年,这个数字飙升到了6000万个。粗略统计,在今天,全世界每天都有2亿个字符通过reCAPTCHA录入,相当于人类15万小时的工作量。
  也就是说,一个人要不吃不喝不睡连轴转两年半,才能完成reCAPTCHA一天的工作量。
  到今天为止,reCAPTCHA已经录入了从1851年至今的所有《纽约时报》,共计1300万篇文章。除《纽约时报》外,reCAPTCHA还数字化了超过2500万本书,而全球的图书数量约为1。3亿本。
  路易斯在接受媒体TheHustle采访时这样评价reCAPTCHA:“我创造了一个系统,以十秒为单位,数百万小时为增量,来利用世界上最宝贵的资源:人的大脑。”
  验证码是在剥削我们么?
  如果reCAPTCHA的故事到这里就结束了,每个人都会很开心。但事情没那么简单。
  2009年,Google以大约2780万美元的价格收购了reCAPTCHA,并开始利用reCAPTCHA帮助标注数据。
  正如前文所说,reCAPTCHA的前半段是在验证你是不是真人,后半段就是真人为验证码打工阶段了。
  2012年,Google开始把Google街景中难以识别的门牌和路牌加入验证码,请用户帮忙标注。
  除了标注门牌路牌,让用户帮忙给数据库分类也是常见的形式之一。比如下图这种请用户“挑出所有有猫的图片”的验证码。
  如今,GoogleAI已经能精确辨认路牌上的文字和数字,准确度和人眼不相上下。
  当有一天我们终于用上Google的自动驾驶技术,依靠AI来辨识路牌和路灯时,这背后不能不说没有上千万用户无偿标注的苦劳。
  对于这一目的,Google也并不避讳。在reCAPTCHA官网上,Google公开说明了reCAPTCHA集众人之力标注数据、训练AI的“众包”模式。
  但是仍有用户对这一点感到不满。
  一位觉得验证码不道德的Reddit用户写到:“这就好像让几百万个人每人为你干5秒钟活儿,然后一分钱都不给一样,这合适么!”
  验证码的前世今生
  验证码提出之初,是为了解决一个特别实在的问题。
  网络世界这么大,你怎么知道网线另一端是不是一条狗(或者机器人)?
  在公开版面上,刷评机器人可以用大量垃圾评论和广告淹没真人用户留下的有价值的信息;在金融交易平台,脚本程序可以靠不停试验来暴力破解密码;在票务网站,我敢说你就算有十只手也抢不过自动刷票的黄牛
  如何确定网络请求是真人发送的,成了维护网络环境和保护用户安全的大问题。
  2002年,正是路易斯冯安提出了一种切实可行的解决方案,能分清网线对面“是人是狗”。
  虽然计算机的算数和分析能力比人类强得多,但是当时的计算机连“一只小猫在奔跑”这种难不倒三岁小孩儿的图都认不出来。基于这种思想,路易斯和其他同事合作开发了reCAPTCHA的祖宗CAPTCHA,也就是我们俗称的验证码。
  初代验证码一般是一些经过扭曲变形的文字或数字。人类可以识别这些文字(尽管偶尔也会出现连人类也认不出的情况),但机器难以理解字符的含义。
  之后,验证码也经历了算数题、选择题,甚至植入广告等类型的迭代,但都掩盖不住一个最致命的问题:虽然CAPTCHA已经是相对比较好的解决方案,但也并非铁板一块。
  通过撞库、人工智能识别图像、甚至是把验证码图片返回给人工再批量输入等方法,黑客们总能为垃圾脚本找到可乘之机。
  更别提有些验证码,连真人都搞不定!
  附加题:请点击图中所有的范伟
  正因为验证码浪费时间,辨识难度大,而且对于执行某些特定行为(比如爬数据或做学术研究)的人类用户而言极不友好,验证码长期在“互联网时代最烦人发明”榜上名列前茅。
  于是,reCAPTCHA推出了更科学的验证系统。这种验证系统会检测用户的客户端环境,追踪用户的鼠标和键盘操作轨迹,提高了机器人的模拟成本。用户再也不需要苦哈哈地识别歪歪扭扭的文字,只需要在对话框里点击“我不是机器人”,就能通过验证。
  既然已经有了更简单、更安全的替代方式,那么伴随我们成长的验证码,是不是也该被淘汰了呢?这种能解决大问题的“众包模式”,又是否合理呢?
  来源:硅星人
投诉 评论

你知道吗?每次输入验证码都是在给Google义务劳动每次输入验证码,你都在义务劳动。最近发现,上网遇见的验证码“越来越有内容”了。为了证明自己是个真人,除了要输入方框里的文字,还得做从下面图中挑出路牌、挑出门牌这种连……扫红包新方法:白菜摊主3小时赚5千多近日,北京某小区出现罕见一幕:商家运来一卡车白菜,摆出“不要钱白菜摊”,围观众人扫红包换白菜,摊主三小时赚了五千多,比平时赚得多出好几倍。视频中,摊主叫到:“手机扫描红包码,把……使用黑猫警长做文章配图自媒体博主被索赔10万元近日,一位自媒体博主发文称,因为一篇阅读量只有18次的微信文章,他被上海美术电影制片厂告上法庭,索赔10万元。这名博主认为上美厂索赔额度过高在网上发帖“吐槽”,引来网友关注。对……“华为”用事实和数字证明了他们强大的实力华为技术有限公司是一家生产销售通信设备的民营通信科技公司,于1987年正式注册成立,总部位于中国深圳市。华为总部论收入华为轮值董事长徐直军正式对外宣布:华为2……360、搜狗、QQ在2018年PC浏览器综合实力排名前三“红芯造假门”事件引发了国内舆论对浏览器的关注,加之10月份谷歌、火狐、微软等品牌服务商纷纷做出行动,优化浏览器产品,优化服务与体验,使得浏览器的热度一度飙升。对此,iiMed……Python越来越火,Python简史你知道多少?Python的起源Python的作者,GuidovonRossum,确实是荷兰人。1982年,Guido从阿姆斯特丹大学(UniversityofAmsterdam)获得……百度旗下好看视频微信朋友圈全面封杀,控诉微信朋友圈“霸王”行12月10日,百度旗下好看视频官微发布置顶微博,称自己已被微信朋友圈“全面封杀”。发表了一篇名为《好看视频的小伙伴们对不起,我们在微信朋友圈不约了》的声明,称好看视频的内……小鹏发布第二期智能数据报告自动泊车频率领先业界【智车派新闻】日前,小鹏汽车官方发布了其第二期智能数据报告。小鹏官方表示,该智能数据报告是对10月24日小鹏智能日的补充,以及对之前成果的总结。小鹏智能数据报告显示,其用户最多……“代码只服雷军”:网曝雷军22年前写的代码作为小米科技的创始人、董事长和首席执行官,雷军的名字如雷贯耳。网上出现一篇“刘强东的代码水平如何”的文章,有网友在下面回复“代码只服雷军”。这个回复吸引了小编的注意,雷军的代码……曾经第三大互联网公司没落:奇虎3602018年对360并不友好,一月份的时候他们把目光放在了直播答题上,周鸿祎还推出了103万的大奖,但是没多久,这股热风就过期了。到了7月份,他们的快视频已经在很多的应用商店上下……Tumblr于12月4日发布成人内容禁令!老司机们一直耿耿于自从Tumblr12月4日发布成人内容禁令以来,老司机们一直耿耿于怀,公益请愿网站Change。org目前已有4条要求Tumblr撤回禁令的请愿,人气最高的一条支持者已超过40……12月份使用支付宝薅羊毛福利的攻略,预祝大家拿红包拿到手软!时不时就送福利的支付宝今天起又开始了一场年终狂欢,线下付款瓜分15亿元,能拿到最高18888元的红包,同时还有双12跨年盛典、境外红包,而天天领红包、邀请好友赚赏金等传统福利也……
上汽大众ID。4X纯电SUV正式批量投产有望年内上市【智车派新闻】10月27日,上汽大众首款纯电动紧凑型SUV车型大众ID。4X正式批量投产。这是上汽大众首款量产的ID家族纯电车型,该车基于MEB平台打造,NEDC工况……如果Google回来,李彦宏凭什么说非常有信心再赢一次?李彦宏称,百度曾通过技术和产品创新反超Google在中国的市场份额,如果Google回来,我们非常有信心再赢一次。8月7日周二,李彦宏称,百度曾通过技术和产品创新反超Go……八年前3Q大战360输给了腾讯,如今还是拼不过人家的副业八年前闹得沸沸扬扬的3Q大战,想必大家都知道。最终还是在工信部的介入下,这场大战才得以平息,但是这场战争也载入了中国互联网的史册,它不仅告诉了创业者该怎么和巨头过招,也深……陈一舟忆人人网:能否回到过去,回答是不行大学毕业后你还登录过人人网吗?一篇名为《13年后重新登陆人人网,你会看到你青春的截止日期》的文章刷屏,给不少网友带来了回忆杀。2009年8月4日,校内网更名为人人网,成为……涉嫌欺诈斐讯微信公众号被封杀,今日头条回应内涵段子借皮皮虾“随着各路P2P互联网金融平台纷纷炸雷,相关合作企业也陷入前所未有的困境,尤其是路由器行业两个曾经响当当的名号,被0元购彻底拖入深渊,极路由濒临倒闭,斐讯也是麻烦缠身。近日……马化腾曾给海尔集团老总推销QQ,结果人家秒拒了!现如今的QQ可以算得上是如日中天的企业了,甚至可以说现如今的QQ更是非常了不起的一家公司了,但是曾几何时,作为QQ的创始人马化腾曾经在一个颁奖典礼上给海尔集团的老总推销QQ,结……3年能上市不意外,拼多多身后五大投资人个个不输马云最近,关于拼多多平台销售山寨假冒产品的新闻占据了各大媒体的头条,甚至还惊动了国家市场监管总局。作为一家成立仅仅三年的电商公司,拼多多一路走来伴随着诸多非议,但这也丝毫不影响拼多……红包该归谁?员工帮公司采购中支付宝4888元红包,老板:抵扣在给公司采购时中了大奖,那么这大奖是归员工个人还是归公司呢?8月1日,武汉一服装厂员工小张在帮公司采购时,意外获得了支付宝4888元的余额宝红包大奖,本来以为是天降喜事,……福布斯2018中国慈善榜:恒大许家印首善福布斯中国今天发布了2018中国慈善榜,今年共有100位企业家上榜,现金捐赠总额达到173。1亿元。恒大集团董事长许家印、美的集团创始人何享健家族、瑞华控股董事长张建斌分别以4……揭秘非法APP敛财真相,苹果商店下载应用被骗12万通过苹果应用商店审核上架、印有福彩LOGO的违禁词App,为何成了诈骗圈套、黑产提款机?近日,央视新闻报道了一位山东苹果手机用户牟先生,因下载违禁词App被骗12万元的经历,引……暗网正在售卖浙江省1000万学籍数据包括家庭信息8月1日晚间,“威胁猎人”微信公众号披露,其当日下午通过暗网监测到浙江省1000万学籍数据正在暗网上售卖。截图显示,售卖的学籍数据覆盖了浙江的大部分市区,被泄露的信息包含……第二代丰田Mirai正式开售外观设计新潮售价50万起【智车派新闻】智车派此前报道过,丰田的氢动力车型新一代丰田Mirai的路试谍照曝光的消息。近日,第二代丰田Mirai正式在德国开售。由于这款车此前已有众多爆料,还采用了全新的设……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找美丽时装彩妆资讯历史明星乐活安卓数码常识驾车健康苹果问答网络发型电视车载室内电影游戏科学音乐整形