人工智能学会战略性遗忘:三种方法
9月25日 不星湖投稿 编者按:人工智能越来越频繁地出现在人们的生活中,而其技术上的重大进步仍然不曾明朗。本文作者NatalieFratto在“MachineUnLearning:WhyForgettingMightBetheKeytoAI”一文中讲述了实现人工智能战略性遗忘的三个方法。
让我们先直面那些事情一团糟的情况。你不记得自己把钥匙放在了哪里,你不记得刚刚在杂货店遇到的同事的名字因而只能磕磕绊绊地说着话,这都令你异常沮丧。然而,遗忘是人类得以生存的核心。事实上,我们必须对自己有能力做到这一点感到幸运。
对于人类来说,遗忘不仅仅意味着记忆的遗失,也意味着这也是一个帮助大脑吸收新知识并有效做出决策的积极过程。
现在,数据科学家正在应用神经科学原理改进机器学习技术,他们相信人类的大脑是完全揭开人工智能面纱的关键。
根据最近发表在《神经元》(Neuron)杂志上的一篇论文所言,人们的大脑充当着信息过滤器的角色。它能输入一大堆乱七八糟的数据,再过滤出有用的数据,然后清除所有无关的细节,从而使人们能够成功讲述一个故事或者是做出决定。这种删除未使用信息,以便为接受新信息腾出空间的行为,就如同清理计算机上的磁盘空间。用神经生物学术语表示,当神经元之间的连接随着时间的推移变得减弱甚至是消失时,遗忘就会发生,而随着新神经元的出现,它们会重新连接海马体的回路并覆盖现有记忆。
对于人类来说,遗忘的发生带来两个好处:
它通过减少过时信息对人们产生的影响来提高决策灵活性。
它能够预防人们过度沉浸于某些过去的特定事件,提高适应能力。
人们为了有效适应发展,必须具备战略性遗忘的能力。
但是电脑又能如何呢?
这即是人工智能所面临的最大挑战之一,计算机的遗忘逻辑与人类的情况不同。深度神经网络是一系列机器学习任务中完成度最高的技术,但是它不会像人们那样去遗忘。
举个简单的例子,如果你要教一个会说英语的孩子学习西班牙语,那么他会将学习英语过程中的相关经验应用到学习西班牙语的过程中,这有可能是名词、动词时态和句子结构等,同时忽略掉那些不相关的部分,比如口音、晦涩词语和语调等。孩子们可以基于战略性遗忘策略不断地学习与重建。
神经网络的逻辑与此不同,如果一个神经网络被训练学习英语,那么其会通过调用参数解决英语问题。如果你想教它学习西班牙语,那么神经网络对于西班牙语的认知就会覆盖掉之前为英语学习所储备的知识,有效清空所有内容并从零开始。我们将其称为“灾难性遗忘”,“这是神经网络所面临的基本局限之一。”
攻克这一局限是一个全新领域,但是科学家已经在关于如何克服这种局限性所涉及的潜在理论的探索上取得了长足的进步。
人工智能学会战略性遗忘:三种方法
1。长短期记忆网络(LSTM,LongShortTermMemoryNetworks)
长短期记忆网络是一种递归式神经网络,它通过特定的学习机制决定在什么时候记住哪些信息,更新哪些信息,注意哪些信息。
用电影类比来解释长短期记忆网络工作的逻辑十分简单易懂。想象这么一种场景,一台电脑通过分析之前的场景来预测电影接下来会发生什么。在某个场景中,一个女人拿着一把刀,电脑会猜她是厨师还是杀人犯?在另一个场景中,这个女人在一个金色拱门下面同一个男人一起吃着寿司,他们是在日本还是在麦当劳?或者是能确定他们在圣路易斯?
这的确非常难以预测。
长短期记忆网络则在这一过程中帮助神经网络实现:
遗忘记忆;
保存;
聚焦。
(1)遗忘记忆
“例如,在一个场景结束后,模型应该忘记当前的位置信息、时间信息,并重置任何有关场景的特定信息。但是,如果某个角色在某个场景中死去了,那么它需要记住这个人已经不再会出现。因此,我们希望模型能够学习一种单独的遗忘记忆机制:当新的信息出现时,它需要知道哪些信息需要保留而哪些信息需要丢弃。”
(2)保存
当模型看到一个新图像时,它需要了解这个图像的信息是否值得使用和保存。如果某个场景中一个女人走过了一个广告牌,是记住这个广告牌,还是仅仅将其视为冗余?
(3)聚集
模型需要记住电影中的这位女性是一个母亲,因为之后的场景会出现她孩子的画面。但是如果在某个场景中女人并没有出现,那么这一信息就显得不甚重要,所以在这个场景中模型不需要关注这一信息。同样,并非所有存储在神经网络长期记忆中的东西每一次都会发挥直接相关的作用。因此,长短期记忆网络需要帮助确定模型在某个特定时间需要关注哪些部分,同时将所有信息妥善保管。
2。弹性权重固化(EWC,ElasticWeightConsolidation)
弹性权重固化是谷歌旗下DeepMind的研究人员于2017年3月创建的一种算法,该算法模拟了一种叫做“突触整合”的神经科学过程。在突触整合过程中,人们的大脑会进行任务评估,计算众多用于执行任务的神经元的重要性,并确认一些神经元所扮演的重要角色使其对正确执行任务发挥更加重要的作用。这些关键性神经元被标记上重要程度并使其在后续任务中被覆盖的几率减小。在神经网络中也有多个如神经元的连接用于执行任务。弹性权重固化将某些连接编码标注上关键性,从而保护其不被过度写入遗忘记忆程序。
3。瓶颈理论(BottleneckTheory)
2017年秋天,在人工智能社区的一次演讲中,来自耶路撒冷希伯来大学的计算机科学家与神经学家纳夫塔利提斯比讲述了其称之为“瓶颈理论”的观点。“其思想是,一个网络会排除掉那些无关重要的嘈杂的输入数据,这就如同通过瓶颈向其中压缩信息,只保留与一般概念最相关的特性。”
正如提斯比所解释的那样,神经网络在学习过程中需要经历两个阶段,拟合与压缩。在拟合过程中,网络对其训练数据进行标记。而在更为复杂的压缩过程中,其“将基于标记的数据信息只追踪那些具备巨大特征的信息。”而这一过程对于之后的概化过程极为重要。在此过程中,压缩是一种策略上的遗忘方式,人工智能研究人员可以在未来用其构建更强大的神经网络和框架。
正如提斯比所言,“学习过程中最重要的环节是遗忘。”
人类的大脑可能蕴藏着创造强大人工智能的图解,而如今科学家们仍然停留在如何解读这些可能的层面。
投诉 评论
我想说像马云、刘强东这些大佬们创业其实一点也不辛酸我原来凑过一篇文章,是关于京东刘强东的,叫《开餐馆被坑、卖光盘被骗、搞连锁遇非典,京东刘强东创业辛酸之路》。后来有读者这么一番评论:马云心酸,刘强东辛酸,王健林辛酸你们扪……
月薪多少最幸福,离你有多远?我们都在拼命追求高收入的工作。很多人下班后主动加班,培训提升自我能力,参与各种项目积累经验,都是为了钱。但是最近一篇《月薪过万的人,过的是怎样的生活?》却让我们望而……
iOS11正式发布最全功能介绍视频体验经过长达3个月多月的测试,iOS11正式版终于发布了。与前几代的iOS系统相比,iOS11是非常特别的存在,它是历史上测试版本最多的系统,经历了10个Beta测试版。iOS11……
马云吃方便面咸菜忆苦思甜?网友:或是在纽约吃不惯西餐近日,阿里巴巴创始人之一兼B2B事业群总裁戴珊,在今日头条头条号上发了一组自己公司老板马云吃饭的照片,引来500多万网友围观。这到底是一张怎样的图片呢?原来,这是一张马云……
胡润公布30位30岁以下创业领袖榜:戴威王思聪等上榜据新浪科技讯昨日下午消息,胡润研究院发布《2017胡润30X30创业领袖》(Hurun30Under30forChina2017),胡润研究院称,综合考量创业者的创新精神、行业……
小学生新技能:一招解锁新款小黄车共享单车因为具有便捷、环保的特点,正成为越来越多人的必选短途代步工具,不过共享单车禁止12周岁小学生注册、骑行。前不久,小学生5秒破解小黄车密码的视频引起广泛关注,视频显……
新款广汽埃安LX上市!百公里加速3。9秒售25。96万起【智车派新闻】11月3日,新款广汽埃安LX正式上市,新车共有5款车型供消费者选择,价格区间是25。9634。96万元。这款车型因为配备了一系列智能化装备,因此放在新能源车型热销……
大佬是不都爱说大实话呢,近日面对央视采访又爆经典语录谈到中国商界的几位大佬,好像都特别爱一本正经的说大实话刘强东娶了女神奶茶妹妹,然后说自己脸盲,不知道奶茶妹妹漂不漂亮(你不知道没关系,大家心里都清楚)王健林坐拥数百……
对比库克,BAT大佬作息各有特色库克每天3点45起床,在国内互联网界,就工作量和难度而言,BAT大佬能与库克一较高下,那么,我们来看看BAT大佬的作息。先说李彦宏,他和库克的作息最相近,非常规律。李彦宏……
你喜欢哪个:QQ网易酷我酷狗虾米App大PK以前听歌需要购买磁带、光盘还要有播放设备,后来MP3格式出现了,于是电脑里随随便便几百首歌的收藏量但是需要到处寻找。再到了后来,随着智能手机的普及,手机中装个音乐应用就可……
阿里与腾讯人的区别,就是明教与武当的反差小早说:马云是火性,火若神明,高举高打,气势如虹;马化腾是水性,低调沉潜,入木三分,小步快跑。然后他们的性格被事业放大了。”这也许是对腾讯阿里两个门派最好的描述。阿里18……
顺丰快递96件钻饰丢42件,未保价怪谁?运输贵重物品一定记得保价,不然物品损毁或遗失后,仅能获得运费3倍赔偿,对损失来讲杯水车薪。据新闻晨报报道,8月份,四川一家金伯利钻石门店,通过顺丰快递向上海邮寄96件崭新……