张建锋(行癫)站在云栖大会十周年的舞台上,语速比其他演讲者几乎高出一倍。他裹着一身合体的西装,对面就是依旧宽大格子衫的王坚,两任阿里CTO往那一站,主持人打趣到,从体型和打扮,大概能看出阿里的技术之路如何走来。 两年前,云栖大会八岁。开幕前一天,阿里巴巴搞了一场小小的聚会。不同以往,企业家身份的马云,成了这场聚会中身份特殊的少数派。而在那些多数派宾客们身上,都闪烁着同一种光亮:他们都有一颗绝顶聪明的脑袋那是不同于马云的另一种聪明。 座上宾是一群世界顶尖的计算机科学家:比如姚期智,中国目前唯一的图灵奖获得者,在中国,只有最顶尖的计算机学生才能进入他的课堂;哥伦比亚大学的周以真坐在旁边,他的著名论文《计算思维》超越了技术本身,定义出一种当下世界的生存必需;她时不时地和身旁的汤晓鸥聊上几句,后者的公司已经成为全球智能视觉识别领域的翘楚,是当下中国估值最高的人工智能公司之一马云坐在其中,他是人群中最不懂技术的那个,却常自称是最坚固的技术拥趸。 达摩院成立前夜的科学家聚会阿里巴巴 第二天一大早,马云在云栖现场高调宣布了名为达摩院的阿里巴巴全球研究院正式成立,并且计划三年内为此投入1000亿。那场聚会中的学术明星,大多被马云请进了这所研究院的学术咨询委员会。 这是一个久违的好消息。参与当天成立活动的人群中,王坚和张建锋是最开心的两个:前者曾在多年前创立了达摩院的前身iDST(InstituteofDataSTechnologies),那次尝试浅尝辄止,当时被王坚邀请回国的学术专家,大多都在后来的时间里遭遇了一场残酷的身份认同危机,当他们踏出象牙塔,把频道切换到商业公司,才发现气质格格不入;而后者,在接棒王坚成为阿里技术掌门人的第一年,就喊出了必须向技术要红利。 多年来,科研与业务在阿里内部不停地化学反应,终于酿成了临界点的出现。这家公司从成功利用了技术的公司开始变为一家创造技术的公司。 在iDST年代,那些被笼络到阿里的科学家频繁地被指摘为只做基础研究,不懂具体业务。之后,他们被安排到各个业务线练兵,星散于野,iDST计划搁浅。他们说,那是一场上山下乡运动。 说白了,技术和商业能不能相互理解,这可能是当时最大的矛盾。当年iDST三位创始人之一、蚂蚁金服副总裁漆远说。 再强大的中国互联网公司都明白,如果不打造一颗强有力的技术心脏,大厦倾塌的隐忧将如影随形。可那些倒在阿里前面的先例证明,这条路上真正的瓶颈不在于决心和财力,而是要在公司内部创造出最恰当的机制、环境和场景,把一群高高在上的科研天才拉进凡尘,既让他们有平台证明个人价值,又能带领公司寻找新大陆。 即使是对于阿里巴巴,这也会是一场漫长而艰难的修行。 聪明大脑批发计划 漆远办公室的正对着一片开阔的小山坡,青翠层叠的一片。在杭州无雨的日子里,时常有人三三两两地在其中散步玩耍从他的窗子望去,像一处自成格局的大学城。 这是漆远喜欢和熟悉的景色:比硅谷的环境还好。 五年前,他收到王坚的邀约,登上回国探亲的飞机,电视和网络上最热的话题是中国糟糕的空气质量。那时,漆远最大的顾虑之一就是雾霾。 旅居美国多年,漆远不缺钱,不缺名誉,更不缺机会。他把前半生埋在了实验室中:在MIT读博士时,Google和Facebook都抛来橄榄枝,但当时漆远一心想当老师;搬到了印第安纳州,专攻大规模机器学习和贝叶斯推理,在普渡大学做到了计算机系和统计学系终身教授。那里有全美国大学最快的超级计算机,学科排名世界前列。除此之外,他的名字后还挂着一连串让人仰望不及的名号:ICML领域主席、微软牛顿研究奖和美国科学基金NSFCareer获得者 求仁得仁,他缺的是下一个令人兴奋的挑战。 没人知道王坚何时相中了漆远,也许是两人之前在美国的短暂会面,也许更早。2014年,机会来了,王坚带着时任蚂蚁金服CFO的井贤栋,以及CTO程立,几人和漆远约在北京的一家酒店大堂彻夜长谈。他们谈了技术、战略、商业,甚至家庭。 天色渐白时,王坚许诺给漆远一个挑战建立超大规模机器学习平台。阿里坐拥取之不尽的商业数据,但大量数据的价值远没有被挖掘出来。当时的阿里,用王坚的话讲,是坐在金山上啃馒头。 这次,漆远真的动心了。 彼时,距离阿里奔赴纳斯达克敲钟还有几个月,由王坚带领一群工程师拿命拼来的阿里云已经走上正轨,正实现着季度100的增长,马云开始热衷于大数据的话题,并委任王坚招兵买马,筹建阿里的数据技术研究院iDST以确保阿里在未来数十年做到技术领先的地位。 曾经的iDST阿里巴巴 这是阿里由来已久的执念。2008年开始,马云就焦虑着独立研发必要性的问题,时任微软亚洲研究院常务副院长的王坚,就是在这个背景下来到阿里。后来的故事无心插柳:技术研究院没有做起来,却做成了阿里云。 以至于这成为了阿里技术体系中的一种感慨,这是幸运的地方,因为我们终于有了一个技术驱动的业务,不再只有商业模式驱动的。但不那么幸运的是,如果当时成立了研究院,也就坚定地走下去了。 2014年那个北京的夜晚,漆远和王坚相见恨晚:(当时)他用望远镜和显微镜比喻大数据的价值。我说这太巧了,我申请终身教授时作报告,PPT头两页,第一页就是放望远镜,第二页就是显微镜。咱俩的比喻都一模一样,我一定要把那份PPT发给你看看。 iDST的初始团队都抱着想做点事情的强烈热情,才很快被感召、集结起来。在此之前,他们多是在前沿领域突破犀利,但往往困顿于技术如何落地。漆远2008年就开始研究大规模GPU集群和机器学习,那时候AlphaGo还只是实验室里的一段代码;iDST另一位创始人金榕,曾是美国密歇根州立大学终身教授,发表过200多篇重要论文,在随机优化、在线学习、半监督学习等领域都提出过原创算法和理论,可直到2015年左右,其中很多成果都还没有找到发挥作用的真实场景。 光鲜的履历背后,一种不甘的感觉在挠人。 这股劲儿好像还没有使出来。这是华先胜的感受。他在2012年就曾获选国际电气与电子工程协会院士(IEEEFellow),从微软亚洲研究院辗转到西雅图Bing产品部门,华先胜待了14年。他憋足了劲儿写论文、拿专利,直到一阵强烈的迷茫在某一天扑面而至:把论文写到200多篇的时候,就麻木了接下来我到底要继续做技术转化?还是做技术创新?2015年,主攻机器视觉的华先胜来到iDST担任副院长,后来又成为了达摩院城市大脑实验室负责人。 至少在2014年,纯粹科学世界之外的光景可以对冲这种不甘,企业当中的诱惑夹杂着新鲜感、挑战以及太多的未知。 在加入阿里之前,金榕受邀为阿里妈妈做过一年的技术顾问,他帮助解决了一个大规模算法优化问题,从而为团队把广告展示的收入提高了1520。公司业务人员也对这位谦逊的技术大牛十分敬重。金榕觉得,这个能迅速转化自己知识能力的平行世界太美好。 漆远的热情被强大的阿里企业文化迅速灌满。第一天来到杭州报道,他参加了面向新成员的破冰活动,一直打鸡血到转天凌晨三点。 这帮人挺玩命的,漆远心想。 浪尖风口,南墙撞头 科学家来了。紧接着,一次职场失意空袭了他们。 先是漆远的超大规模计算平台报告,在提议阶段就遭到了残酷的审视。 计算平台的必需是GPU,而如此大规模的GPU集群意味着巨额的资金投入。面对2014年的中国互联网公司,这份提议太不靠谱:那时,AlphaGo还没有诞生,人工智能被认为是个华而不实的噱头。大家认为漆远的提议简直瞎掰:你要的机器这么贵,公司为什么要搞这个?和我们的云战略又要怎么结合? 漆远觉得,瞎掰的是对方。让我们做超大规模GPU,没有集群,这不也是瞎掰么? 阿里云三代掌门,从左至右为胡晓明、王坚、张建锋阿里巴巴 在2014年的阿里,技术力量尚未成为这家商业公司的主导。华先胜记得一个细节,自己入职时参加了几轮面试,竟然没人能问出和技术相关的问题。这个迹象曾让他感到忧虑。在微软研究院,自己共事的团队基础扎实,那些人绝对是顶尖人才;而阿里的团队胜在勤奋有斗志,高层对业务判断很笃定,可面对一些未来的前沿方向,眼界还没那么宽。 金榕来到iDST的第一项任务是用算法帮助聚划算提升GMV。当时集团提出了数字化运营的目标,阿里内部甚至一度有个口号,要革掉小二的命。 新同事眼中曾经理所当然的崇拜与敬仰,在小二那里变作了警觉和距离。大神金榕自觉地拿出humble的态度,常向小二虚心请教业务问题,甚至为此从西雅图搬回杭州常驻。忙碌一年的结果令人啼笑皆非:算法默认把便宜的商品增加展示权重,吸引了大批三四线城市用户,GMV上来了,却无意间模糊了当时聚划算的产品定位。面对团队的不满,金榕身心俱疲:到底什么是有价值的事?没有确切答案。 事情渐渐发生了一些变化。业务团队在一开始就低估了技术突破要花的时间和难度;而这些自带光环的科学家,也因为不归属于任何一个业务单位,纷纷陷入无物之阵。 在残酷的竞争环境里长大,阿里就是一台由组织战斗力点燃并驱动的机器,强有力的体制之内,对迷茫和风险的宽容度是甚至比对于失败本身还要严苛。 2015年的夏天,成立不到一年,关于拆分iDST的决策硬邦邦地出现在了科学家们的邮箱里金榕带队去了淘系,漆远则去了蚂蚁金服,他曾经的语音团队被留在了阿里云。很长一段时间,公司内外都没人再提起这个研究院,甚至连阿里自己的算法工程师都还以为iDST已经解散了。 这是一场残酷的信任考核要看看这帮人到底能做什么。 心理落差接踵而至。漆远依然记得那种脸着地的感觉。在学校时,许多学生都说过,不管漆教授开什么课都想选,他向来都是积极人格魅力和善于人际沟通的那种人;来到阿里,他才知道一家流淌着江湖绿林基因血脉的企业里,沟通的学问胜过一切要考虑组织、团队、文化、历史等种种复杂背景,没法让所有人都喜欢。 所以大家都说,学校是象牙塔。漆远感叹。 这就是一场试验。2019年,再聊起当年集团的决策,阿里技术生态负责人刘湘雯很直白,她经历了曾经的iDST,也参与了达摩院的体系设计工作。即便有人会因为不适应离开,调整也会继续。在中国最成功的互联网公司里,系统的意志坚固胜过一切。 被扔进业务团队的漆远和金榕没少经历磕碰,渐渐地,熟悉的科研工作转变成为了一种业务问题驱动的模式,他们与公司的相互信任才重新建立起来:2017年,金榕带团队把组合优化技术应用到了数据中心资源分配方面,这年双十一,这项技术将资源匹配率提升到了94;漆远则在蚂蚁金服主导了智能客服的项目,以解决客服人力成本增加的困境,一年后,这套准确率逐步提升的系统为公司节省了一个亿的成本。 几场胜仗下来,科学家有了指挥官的感觉。有人比喻说,刚来iDST时我们做的是原子弹、导弹,打阿富汗没问题,一个炸弹下来就牛逼了;但到伊拉克战场,要搞地面战场,铺人进去,这考验的不只是技术能力,是个组织配合问题。其中的沟沟壑壑,漆远觉得很难与外人道,那简直是术与道的差别。 毕竟是一群绝顶聪明的人,这里还有他们想要的东西。如果他们长出了能力,阿里就是个很好的舞台,它会给你许多回馈,如果没有,给你也拿不住。刘湘雯说。在这方面,阿里是很真实的,我们不会将错就错。 中国特色的研究院 2017年加入蚂蚁金服时,达摩院金融科技实验室负责人、蚂蚁金服副总裁蒋国飞就和井贤栋反复讨论过一个问题:在中国公司做研发,对失败的容忍度有多高? 他曾在NEC美国研究院负责过十多年的前沿创新工作,清楚其中的艰难。在那里,他见证过很多令人惋惜的失败。2000年开始,蒋国飞曾带领团队投身一个计算平台项目,但接下来持续10年没有拿到实质突破。2010年,他终于受不了,砍掉了这个项目的经费投入。 一群非常优秀的人,花了那么多时间和努力就是搞不定这件事,领导或许不会怪你,可谁不想要成功呢? 在硅谷,类似的故事层出不穷,结局常带有美式英雄主义色彩永远无惧失败,永远可以从头再来。就像是YannLeCun和GeoffreyHinton与神经网络和深度学习算法的故事,漫长的数十年,从起步、停滞、陷入低谷,直到十多年孤独穿行后的曙光重现。 这样的矛盾一度拷问着阿里巴巴。iDST调整后,打造技术研究院的目标并没有被完全搁置。当2016年,筹划达摩院的计划被张建锋摆上会议桌时,iDST的旧部被再次集结起来。 重新规划研究院的过程没有想象中顺滑,卡在业务商业与科研前瞻之间的浮漂依然飘来荡去。有些目标是很明确的:比如,达摩院的使命是技术创新,但必须结合阿里巴巴的具体业务。达摩院还要继续吸引最顶尖的人才,他们必须有激情、格局和远见;也有一些细节经历了反反复复的讨论。比如,什么样的架构才能保证这个研究院保持生命力?作为技术中台的一部分,又担负着技术先进性的使命,到底该为了聚焦在单个业务的营收指标,还是适当跳出来一点,考虑前瞻性? 阿里巴巴集团CTO张建锋,花名行癫阿里巴巴 达摩院几乎没有理想的参考对象。在企业研究院里,微软研究院曾如日中天。那里被称为科研人员的天堂,可从研究到产品中间隔着一道厚重的城墙,有技术转化很好,没有也无所谓,微软曾因此错失许多机会比如搜索,这个方向很早就出现在微软研究院的战略会上,但当时没有引起业务层面重视,直到Google在搜索领域大获成功,微软才再推出Bing追击,显然为时已晚。 没必要被别人的眼光束缚住。我们会把达摩院看作一个业务去做,甚至希望它的技术尽快走向市场、赚钱。负责参与设计达摩院体系架构的刘湘雯说,很多人会觉得一个研究院应该是怎样的,但如果照搬一个指标,肯定会把这件事做死。她曾经在微软亚研院工作多年,清楚那里的情境。最近几年,人工智能成为主流方向,微软才开始调整策略,花力气把AI研发体系和业务线打通,中间经历不少痛苦那是阿里不能接受的。 价值观的统一仍是首要。这是一家以梦想为粘合剂的公司,它擅长将一个宏大的图景拆分成无数细节,再自上而下的传递下去,不断激发战斗力。很长时间里,需要有人和这群志存高远的科学家们坐在一起梳理细节。唱红脸的角色一直是必需,有时候,像刘湘雯这样的人就要扮演起园林修建师的角色,晓之以理、动之以情,狠心让团队砍掉一些和大方向不符的小创新,那时她一般是最不受欢迎的人。 科学家都是好奇心驱动、使命驱动的一群人。但达摩院是承接着集团使命的。我们要把大的目标和大家说清楚,让大家做更有价值感的工作。 许多突破的确是被业务的需求逼出来的,金榕曾经带领过的拍立淘团队,起初只是在淘宝端不那么显眼的入口级产品,但随着日活一路突破千万,团队被倒逼着做淘宝内部链路架构的打通,以不断提升图片搜索的精度。经历这么一遭,团队把底层算法训练框架、数据处理能力都升级和迭代了一遍。现在,拍立淘已经上云,成为了阿里云杀手级的产品之一,在平头哥最新发布的NPU芯片中,拍立淘也成为重点应用场景之一。 金榕阿里巴巴 这样的例子让阿里巴巴的技术路线反而加成了更多的侵略性和野心。达摩院在其中扮演的角色,正拉开了架子向产业端靠近,从中打开实验场合、发现挑战、解决问题,再反哺给产品。 这条能够快速滚动的锁链,是一个理想主义和现实主义混合的产物它不会犯大的错误,也能同时保证速度和公司营收稳步增长。到了2019年的云栖,达摩院刚好两岁,马云曾许诺下的1000亿,也许从投资的角度看到了具象化的表达:年轻的平头哥在一站式设计平台无剑后,又发布了NPU芯片含光;量子实验室完成了第一颗可控的量子比特研发。 蒋国飞在企业创新研究院这个领域专注了将近20年,来到阿里后,他曾和达摩院的同时聊起技术创新的空间复杂性在美国,不乏生命力长达百年的公司,在技术投入方面这些企业态度笃定。那不是几个牛人的创举,而是一套传承下来的体系。但中国公司只有几十年历史,企业生存的经济体制也不一样,要找到路线、节奏,这不是一两天的事如果看不清5000米以外的事情,我们就先结合业务,看看500米以外有什么。 企业研究院中国特色的问题,一直困扰着阿里,后来干脆释然。达摩院的设计者们认为:大的层面看,在举国体制下,中国曾经用钱学森的科学架构融入国家意志,获得了一套完整的科技创新体系。科研铺上去,又把航天、医疗、铁路很多产业带动起来,好多成果也是这样被逼出来的。经历了经济周期的调整和考验,这个方法论依然是成熟、行之有效的。 现在是市场经济比较充分发展的阶段,再怎么继续打造科技创新体系?我们可以多思考这样的问题。甚至,像阿里这样庞大的公司、达摩院这样的企业机构在整个社会互动层面又会扮演什么角色?对于这个历史使命,我觉得还要走更远的路。 NoRegret 最近,漆远刚刚领导组建了一支名为NBT的团队,没日没夜地工作。他和手下的年轻人想要寻找下一个重大突破:随着蚂蚁金服开展国际业务,AI训练师的增长必将成为业务负担,有没有可能在算法层面再做一些突破、未雨绸缪? 业界很少人在探索这个方向,看不到进展时,漆远常给大家做心灵按摩:NBT的意思,我们是在寻找NextBigThing,我还告诉他们,我们就是一支牛逼Team。为了表示决心,最近大家还集体换上了NewBalance的球鞋。 这些年过去,兴奋和郁闷的情绪会轮番在这些阿里科学家的心中荡漾,也有那么几次,项目的确做砸了,或许是方向出了问题,或许是时间的问题。总之,他们也都渐渐了适应了这样的起伏。 蒋国飞已经从20年前的科研人员做到了如今的企业管理者,他有时候跟朋友开玩笑,说自己就是最辛苦的农民。种子撒下去也不一定有收获。蒋说,你不仅要照顾到执行、细节,最大的挑战其实是心理上的挑战,必须要有determination,意志要硬。 我们的工作里有几个境界,是用自己的能力做锦上添花、雪中送炭的事情,还是做无中生有的事情?人工智能就是一个公式出来的,算法加上算力,最后再看对某个领域的价值。这几个关键词里最重要的是价值。你觉得某件事很有价值,还把它实现了,那这段职业生涯就没白费。那种感觉和坐在办公室里上上班、领领薪水是不一样的。华先胜这么说。 他正完整地经历着这个过程。来到阿里后,华国胜短暂带领过自己熟悉的图片搜索方向,2016年又跳到了城市大脑团队。当时这也只是个宏大的构想:把城市里每天产生的数据打通、挖掘价值,再和城市管理模式结合,城市大脑就是一个完整的生命体,带动城市以更好的方向发展。 华先胜和团队最先攻下的是交通环节里的视觉渗透。先要说服客户升级智能摄像头,再从无到有的搭框架、更新算法,超越过去的端上方案,做到更精准、实时的交通改制。城市大脑有了感知能力,才能对交通趋势给出具体预测,给出治理建议。 在今年的云栖大会开场主论坛,阿里提供的智能交通应用,是政府官员代表反复夸赞的成绩。可在最开始,华先胜的业务根本没人买账。当时的阿里巴巴不是一家以技术先进闻名的公司。城市大脑的噱头很足,一不小心就会沦为政府大厅里的展示大屏,华而不实,只有展示作用。 从定大方向,到落地调试,城市大脑团队做了三年,也是第一个原生于阿里云的重点业务。杭州、上海、苏州等多个城市都成了这个项目的客户。华先胜常要花时间密集接触客户,理解对方的需求。妻子曾经半是抱怨地对华先胜开玩笑,总以为换了个工作,他的节奏会松弛一点,后来才发现,这和去哪家公司没关系,挑战来了,他就会变成很兴奋、又很投入的人。 最终发现,真正的科学家精神和企业家精神没什么差别。他们都是乐观的冒险者,敢想也敢干,带团队在无人区里探索时,也要有远见、野心和定战略的能力。那些和这群科学家打过交道的阿里员工,多有感触:大家的争吵是比较少的,看到一个问题时,他们会先想这个事情应该做,接下来就会想怎样做到,很少人会说,这个事情我不能做、不想做。 是不是真的技术驱动的公司,并不只是财报上云业务利润回报数字能够说明的。公司内部是否能形成完整的技术文化和技术体系,才是最重要的命题由阿里人评价说,这是个渡己渡人的过程。 现在,在阿里巴巴集团36位合伙人里,已经有17位是技术背景出身,话语权的天平有了变化。算法工程师团队越来越壮大,贾扬清、任小枫这些人工智能领域赫赫有名的新一代大牛也陆续进入了达摩院。 空气里的一些氛围变了。各个团队常办纯粹的前沿探讨会,除了业务KPI,一些新鲜有趣的东西开始感染着这个庞大的公司,比如金榕,他坚持为自己的团队保留10的时间和空间去探索那些更遥远的目标。 2017年,马云豪言壮语地指出,要让达摩院比阿里巴巴活得更久。但五年、十年后的事,暂时谁也说不清。拥有了一桌做好菜的材料,对厨师的考验也不小。 要让阿里巴巴驶入那个更激动人心的新世界,许多事情还在一种混序中变化和进展。漆远觉得,不如把世界放在算法里去理解: 下个月我们团队会不会被喷?下一个项目是不是完蛋了?这都不能预测。但你清楚自己是在一个大趋势上,这个时代对我们这群人来说,是生机勃勃的在线学习算法追求的就是减少regret(最优策略的差异),所以我们只能尽量去追求noregret的一套算法。 来源:极客公园