游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

斑马识别成狗,AI犯错的原因被斯坦福找到了丨开源

  Pine发自凹非寺
  量子位公众号QbitAI
  明明是只斑马,AI为什么说它是一条狗?
  分类模型在归类图像时有时会错误地判断类别。
  经过学习的AI,还会搞砸一些预测,肯定是在其中的某个环节出现了纰漏。
  斯坦福大学的两位博士生和教授JamesZou在一篇论文中,带我们探究了分类模型犯错的原因。
  随后,论文提出一种方法反事实的概念性解释(ConceptualCounterfactualExplanations),并评估了它的效果。
  通过这种方法,我们就能重新定义模型的分类标准,从而解释AI犯错的原因。
  一起来看看吧。AI为什么会犯错?
  想要提高分类模型后续预测的准确性,就先得整明白这个模型在哪里出了岔子。
  一般来说,AI搞砸预测是以下原因造成的:
  首先是在模型实际预测的过程中,分类标准可能会与预训练时有些偏差,使得训练模型在实际预测的过程中效果不佳,进而降低预测结果的准确性。
  比如说,病理学家使用预先训练好的模型来分类组织病理学图像,但效果在他的图像上却不是很好。
  这就可能是在他的图像中,色调与原始训练数据中不同导致的。
  其次,在模型学习的过程中,可能会学习到一种叫做伪相关性的东西,即将一些看似无关的要素与被识别的图像关联起来。
  可以看这个例子:
  在这个模型训练过程中,样本里所有狗的照片里都有雪,这导致该模型将雪与狗联系在一起,并错误地预测:没有雪的狗不是狗。
  这可能是用的数据集,都是在同一场景下收集的,会阻碍模型的泛化。
  除此之外,也可能是在训练模型时,人为制造的一些偏差。
  例如,某一皮肤科专家利用训练好的AI来分类图像中的皮肤病,但其他同事使用的效果却不尽如人意。
  这可能是因为在训练的样本中,皮肤的肤色单一、且年龄段分布窄。
  了解了AI犯错的原因后,我们要怎样才能准确地判断模型哪里出现了错误呢?AI犯错,它来解释
  JamesZou在论文中提出了一种叫反事实的概念性解释(CCE)的方法。
  具体来说,就是通过这种方法,来探究输入数据与预测结果之间的联系,最终找到模型的错误之处。
  那CCE是怎么来解释的呢?定义概念库
  首先要做的,就是设置并细化一个概念库C,即制作一个分类标准。
  具体来说,概念库C中的各个概念可以用来分类图像,如装置c1(街道、雪等)、图片质量c2(清晰、模糊等)
  这样,就能获得一组可解释的概念库C{c1,c2,}。
  然后,需要给其中的每个概念找对应训练数据。
  具体的,就是收集与其相符(Pci)和不符(Nci)的例子,一般来说数量上要一样(PciNci100)。
  对于每个概念,CCE都要学习它们的分类方法和思维方式。
  分别通过两种方法:
  一个是通过学习支持向量机(SVM),来寻找可以区分两种事物最优方式的算法(线性分类器)。
  另一个是学习相应的概念激活向量(CAV),它可以用来解释图像被错误分类的具体原因。
  就像下图,都是斑马的图像,归类错误的原因却不一样。
  这一步只需要对每个想要评估的模型做一次,之后CAV便可以用来解释任意数量的错误分类。给定错误分类标准
  我们可以通过改变不同概念在模型中的比重,对其分类标准进行相应的调整,这些调整要满足以下原则:
  1、正确性:如果一个分类标准达到了预期的结果,那么它就被认为是正确的。
  2、有效性:分类标准不能违反人类的基本认知。
  3、稀疏性:最终目标是向用户传达模型的错误之处,太多的变量不利于有效传达信息。
  我们的目的是尽可能地使预测结果贴近训练结果,即最小化交叉熵损失。
  因此就要不断优化模型预测的标准,通过调整待修改的标准,对其进行加权,最终达到纠正错误分类的效果。
  了解之后,我们通过一个实际例子来看看,怎么用CCE探测分类模型出错的地方。
  在这里,分类模型错误地将斑马图像识别为非洲猎犬。
  于是,我们首先生成这个模型将斑马识别成狗的一系列标准。
  然后,对这些标准进行评分,如果评分为正,则代表在图像中增加这个概念,将会提高正确分类的概率,反之亦然。
  在这个例子中,如果增加stripes(条纹)这个概念,识别出它为斑马的概率就会大一些。
  在c)图中,通过CCE分析也可以直观地看到,PolkaDots(斑点)和Dog(狗)是导致模型预测错误的原因。CCE效果怎么样?
  看到这里,想必大家对CCE的原理都有了初步的认识。
  那它判断得到底准不准确,效果究竟如何呢?
  CCE的目的,主要是揭示模型在训练过程中学习到的伪相关性,用它就可以捕获图像中出现的其他无关要素和图像的伪相关性。
  测试发现,在大多数情况下,该模型在超过90的错误分类的测试样本中识别出伪相关。
  看看这个表格,相较于其他方法,使用CCE,识别出样本中伪相关的概率最高。
  CCE能够精准地识别出样本中的伪相关,可以看这个例子:
  改变苹果图片的颜色(使图片变灰),分类模型识别错误的概率增大时(黑线),CCE辨别出绿色为伪相关的分数也就越高(绿线)。
  除此之外,CCE也有用在医学领域的潜力。
  像AbubakarAbid等人就使用CCE,在皮肤病学(皮肤状况分类)、胸片图像中的心脏病学(气胸分类)中都做了相关测试。
  CCE使用学习到的偏差和图像质量条件来解释模型犯错,也已被专业的皮肤科医生证实这些因素,确实很大程度上是导致皮肤图像难以分类的原因。
  此外,CCE的速度也很快。
  概念库只需要使用简单的支持向量机学习一次,每个测试示例在单个CPU上花费的时间小于0。3s。
  重要的是,它可以很简单地应用到任何深度网络,在不需要训练数据的情况下检测到模型犯错的原因。
  如果你对这种方法感兴趣,想亲自试试的话,可以戳下文链接查看。作者介绍
  JamesZou,论文通讯作者,是斯坦福大学生物医学数据科学系的助理教授,计算机科学与电气工程系的助理教授。
  于2014年获得哈佛大学博士学位,曾是微软研究院成员、剑桥大学盖茨学者和加州大学伯克利分校西蒙斯研究员。
  他的研究得到了SloanFellowship、NSFCAREERAward以及Google、Amazon和腾讯AI奖项的支持。
  AbubakarAbid(前)、MertYuksekgonul(后)论文第一作者,均为斯坦福大学博士生。
  参考链接:
  1、https:arxiv。orgpdf2106。12723。pdf
  2、https:github。commertygdebugmistakescce
  3、https:twitter。comjamesyzoustatus1541452062344417280
  完
  量子位QbitAI头条号签约
  关注我们,第一时间获知前沿科技动态

世界旅游地图揽胜大洋洲新西兰西岸区通过世界旅游地图来看世界各国的著名的旅游景点,领略世界的大好河山。大洋洲第二篇新西兰新西兰:西南太平洋的岛国。由南岛、北岛及附近一些小岛组成。面积平方公里。人口万。……行摄西藏隐世天堂措普沟措普湖【行摄西藏】隐世天堂:措普沟措普湖摄影文字阳光脚步有人说:内有苏杭,外有巴塘巴塘,有美丽如诗的措普沟措普沟,一个神仙居住的地方湛蓝的天、原始的树、……胡杏儿晒和老公浪漫约会照,头上白发抢镜,被指连生三儿影响身体今天情人节,单身狗都要被狗粮喂饱了,网络上满屏都是明星秀恩爱的新闻。中国香港女星胡杏儿也跟随大潮,在社交账号晒出与老公李乘德的亲密合照,秀了一波恩爱。胡杏儿晒出的多……夏季多喝汤,别忘记多喝这汤,补足营养,汤汁鲜美,助力孩子长个进入酷暑之后,太阳越来越毒辣,是我们阳气正盛,身体最旺盛的时候,这个时候的营养很容易消化,尤其是家里有孩子,一定需要补充营养。由于最近太炎热,身体特别容易出汗,会丢失一些营养成……杨鸣揪出辽篮水货!暂停期间痛定思痛,场边怒批了1分钟杨鸣揪出辽篮水货!暂停期间痛定思痛,场边怒批了1分钟CBA常规赛继续进行,大家都知道,刚刚结束的比赛中,北控男篮差一点就再次,掀翻了辽宁男篮,而这场比赛其实大家也都发现了……什么是数字货币?数字货币概念股一、数字货币按照央行数字货币研究所的定义来看,狭义的数字货币主要指纯数字化、不需要物理载体的货币;而广义的数字货币等同于电子货币,泛指一切以电子形式存在的货币,包括电子货……房琪新书真希望你也喜欢你自己摘录的优美句子第1章你不需要成为任何人1。这世界很喧嚣,做自己就好2。在我看来,生活是一款单机游戏,不能多人组局。虽然我们追求爱情、依赖亲情、珍视友情,但比起……巴黎女生也追赶的潮流今夏告别白衬衫和牛仔裤巴黎女生的品味无容置疑,在时尚界拥有无可撼动的地位,从她们护发的秘诀到搭配牛仔裤的方法,都吸引无数人参考。不过往常喜欢以白衬衫和牛仔裤迎接夏日的巴黎女生,在今年却迎来了一个新转……氢燃料电池汽车市场今年或将爆发2022年燃料电池汽车产销均呈现良好增长势头,2023年燃料电池汽车销量将实现翻番。根据中汽协最新发布的汽车工业经济运行情况,2022年11月,氢燃料电池汽车产销分别完成322……亚马逊大幅涨薪背后的囚徒困境欧美工资物价螺旋式上升已难避免?财联社(上海,编辑潇湘)讯,新的一年里你涨薪了吗?这个不少办公族每年伊始最为感兴趣的话题,却可能正令欧美经济陷入一场无解的囚徒困境之中。上周五,美国劳工部公布的数据显示,……神鸡营比赛Vs刘氏家族,吕德华巅峰赛1700不如韩涵,梦之队在今年末尾,全网突然火起来了一种主播战队,那就是以人气主播为名义,广邀一些巅峰赛当中的高分段选手组成的队伍,其实最早这种形式的队伍也特别的多,比如GFS战队,在全网当中,这支队……9大NBA常青树!效力最长的球员科比第七,威利斯45岁才退役勒布朗进入职业生涯第20年,除了老詹之外NBA常青树球员有谁?美媒统计了历史上在联盟效力最长的9大球员!在勒布朗詹姆斯正式效力进入20年前,排在老詹前面的分别是湖人两大传……
大数据平台建设方案(58页)附下载大数据平台是基于数据分析而产生的,通过数据分析可以帮助企业做出最好的抉择,改善企业的业务现状,以求获得更多的利益回报,并且还可以分析出竞争对手的策略,针对性地提供领先竞争对手的……马云妻子年轻时长这样,看上去气质满满,没有她就没有现在的阿里要说中国互联网大头企业,无一例外人们一定会先想到两马:马云、马化腾。一个创立了阿里巴巴,改变了中国的购物方式。一个创立了腾讯,改变了中国的社交方式。马云和马化……02出局!胡尔克最艰难一役90分钟掉重12斤,尿检4小时喝6中超昔日超级大牌球星胡尔克在巴甲重新找回了巅峰状态,率领米内罗竞技夺取了2021赛季的巴甲冠军,他本人则拿到了金靴大奖,强势回击了各方的质疑。在回到巴甲的一开始,胡尔克被批评体……新赛季短道速滑国家集训队成立任子威领衔张晶任主教练中新社北京9月26日电(记者邢翀)20222023赛季短道速滑国家集训队26日正式公布了成员名单,新赛季国家集训队共有17位运动员,包括北京冬奥会两金得主任子威,此前执教匈牙利……后悔当初放弃华为Mate50Pro,选择了iPhone14P前段时间,趁着双十一打算入手一台新手机,一直纠结是买华为Mate50Pro,还是购买iPhone14Pro,纠结了好久还是打算都入手一台,看看哪款更适合自己。第一映像感受……LPL005号张宏伟我相信绝大多数人对这个名字是非常陌生的,说道他的游戏ID:Mor,也不是非常熟悉,因为他的职业生涯太过远古不说,也非常短暂,其中有段时间还是还是在海外打比赛,今天就让我们走进他……澎湃好物这件打底可穿春秋冬三季!高级有气质最近这两年,我越来越深刻的感觉到:越是简单经典的衣服,越是高级耐看。而这就不得不提到这个经典中的经典纯色打底衫。搭得了衣服,撑得起场面。款式高级,耐看不……一加Ace2V用上5000mAh长寿版80W快充,吃个饭就能近两年,安卓手机最大的高光时刻之一,应该就是快充技术的发展。尤其是咱们的国产品牌,早已实现了百万快充的普及,甚至有些品牌已经上探到了200W以上的快充水准。即便是在千元机中,国……乞拉朋齐一年降雨2万毫米,抵过北京40年降水,当地人还会缺水世界广阔,奇妙多姿。就以我们中国来说,有着世界最为复杂多变的地形,境内高山、丘陵、平原、谷地交错,构建了多元化的地理环境。青藏高原被誉为世界屋脊,喜马拉雅山峰傲视全球但若是将视……410万拆迁款存银行,到手只有18万利息,本金呢?当下,有很多中国老百姓都非常热爱存钱,这主要是因为很多人都有未雨绸缪的观念,在资金没有可用的情况下,存入到银行里,还能够获得一部分利息,最重要的是还能够保证大家资金的安全性,但……金灿灿银杏香,寻秋潭柘寺!满寺秋光银杏黄潭柘寺帝王树银杏叶2021年深秋,如约而至每年10月底到11月中旬是潭柘寺帝王银杏树最佳观赏时期当然今年也不例外虽然我们经历了……高通胀影响美国节日餐桌!鸡蛋涨价最严重据美国中文网22日报道,由于禽流感对鸡蛋行业造成的严重冲击,鸡蛋价格正在飙升,而在节日季之前,鸡蛋需求也在上升。据彭博社报道,最新消费者价格指数(CPI)数据显示,从9月……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网