当人们还在抱怨Siri反应迟钝和硬核回复的时候,一场来自苹果内部的变化正在发生Siri三位创始人的最后一位TomGruber近日宣布退休,与此同时苹果搜索业务的主管VipulVedPrakash也离开了苹果。时间往前稍微拨动一下,还可以看到苹果最近着手整合了Siri和ML团队并任命了新主管JohnGiannandrea。 伴随着TomGruber的离开,ML和Siri团队的整合,Siri这个承载着苹果人工智能梦想的服务也彻底打上了苹果的烙印。 而发生着的这一切都毫无掩饰的向外界传达出苹果终于要在Siri上发力了不再是随iPhone4s推出的注脚,更不再是影响苹果生态的掣肘。 苹果的人工智能梦与Siri的起源 由于健康状况恶化,Siri是史蒂夫乔布斯在苹果公司的最后时光里积极参与的项目之一。 然而,智能语音助手的起源可追溯到乔布斯离开公司后的20世纪80年代苹果研发计划。 在20世纪80年代后半期,当时的苹果首席执行官约翰斯卡利委托星球大战导演乔治卢卡斯为他所谓的知识导航器制作概念视频。 该视频以卓越的先见之明,向人们展示出了智能助手的未来,并且在今后一一变为现实。 视频中一位大学教授使用着类似iPad的设备,屏幕中出现的一个打着蝴蝶结的助手提醒着他,今天你12点有一份教员午餐;你需要在下午2点之前把凯茜带到机场;你在下午4点15分就亚马逊热带雨林的森林砍伐进行演讲。 但在当时,这项技术还没有做好拥抱新世界的准备。一直到2003年,国防部下属的投资部门先进科研项目局(DARPA)找到了一家非盈利的研究机构SRIInternational,委托他们领导一项长达5年、500多人参与打造的一个虚拟助理项目,美国政府希望利用其研究成果来帮助军队的指挥官处理大量的战场信息和日常事务。虽然Siri并不是这一项目的直接成果,但这个叫做可学习与组织的认知助理(CALO)的人工智能助理,最终为Siri的开发提供了灵感与模型。 就这样,在国防部1。5亿美元的资金支持下,上百名人工智能领域的顶尖专家展开了一次雄心勃勃,但又前途未卜的探索:教计算机如何在自然环境中学习,而这也成为了当时史上规模最大的人工智能项目。 而Siri的创始人之一亚当奇耶(AdamCheyer)也正是这个项目中的一员。在SRI,奇耶的任务是将CALO项目下27支团队建造出的不同组件组合成一个完整的助理。每年这个虚拟助理都要接受一次测试,来检验它在这一年的时间中都学到了什么。奇耶打造的这款研究用虚拟助理(名字也是CALO)十分简陋,离消费者的电脑与手机还有很远的距离。但CALO已经可以完成许多原来只能由人类完成的任务了。 这段时间,奇耶一边训练CALO,一边在SRI的先驱者计划中帮忙。先驱者计划于2003年和CALO项目同时启动,目标是帮助德国电信和摩托罗拉等公司探索智能手机的发展前景。先驱者计划中的科研人员也开发了他们自己的虚拟助理原型。这个助理虽然没有CALO那么神通广大,但可行性更高。 这个开发中的原型助理引起了摩托罗拉公司一位经理,同时也是Siri三位创始人之一的戴格吉特劳斯(DagKittlaus)浓厚的兴趣,后来他从摩托罗拉公司离职并加入SRI。加入SRI后不久,吉特劳斯和奇耶以及SRI的另外几位同事便开始讨论如何将CALO和先驱者两个项目的精髓合并在一起,并开办一家公司把它发扬光大Siri的故事便由此开始。 (图片来源:HuffPost) 独立应用Siri与苹果Siri 十多年后的2007年秋天,智能助理软件等待已久的机会终于到来了。更高速的无线网络、更准确的语音识别、云计算的快速发展和各种全新的网络服务,这些都让智能助理成为了可能。 与此同时,在这个秋天苹果发布了初代iPhone这款革命性的产品,加之前面的技术铺垫,都让吉特劳斯和他的伙伴们意识到在这块小小的屏幕上,除了可以进行图形交互,还可以加入智能助手进行语音交互,这个助理可以帮助用户完成各种各样的工作,同时也免除了在狭小的触摸屏上点来点去和等待网页加载完成的痛苦。 此外吉特劳斯和他的伙伴们还有另一个很重要的优势:他们可以使用CALO项目开发出的技术。根据1980年国会通过的一项法案,像SRI这样的非盈利机构有权从政府资助的软件项目中获得收益。这项法案还允许创业公司用股权与SRI换取CALO项目核心技术的使用权。 虽然奇耶对能否将CALO项目转化成有利可图的生意还持有怀疑态度,但吉特劳斯还是成功地劝说他辞去了他在SRI的工作,一起成立了这家叫做Siri的公司。吉特劳斯在新公司中担任CEO,格鲁伯担任技术主管,奇耶则是负责工程开发的副总裁。 (图片来源:HuffPost) 2008年初,Siri公司拿到了850万美元的投资,而他们随后几个月里的进展都有重大突破。 几位创始人将他们的Siri原型软件放在他们自己设计开发的人工智能系统里面,教它如何理解和回答用户的提问。当用户向Siri提出一个问题,Siri会将用户的语音信息传送到数据中心的服务器。这些服务器上的语音识别软件可以将语音信息转录成文字信息。 接着,Siri要搞清楚这些文字的含义这一过程被计算机科学家们称为自然语言处理。因为人们可以用许多种不同的方式来表达同一个意思,而机器则需要更加精巧和灵活的算法才能理解,而这也恰恰成为了日后智能助手技术方面最大障碍。 一开始,开发者们没有给Siri的功能添加任何限制。他们构想中的Siri可以连接到任何网络服务。但他们也知道想让Siri成功,这个虚拟助理不仅要聪明,还要风趣。 所以在2010年,可以看到Siri首次作为iPhone的第三方应用亮相,并在之后发布会中回答苹果高管你是谁时,屏幕上出现了我是一位谦逊的私人助理的巧妙回复逗笑了现场的观众们。 (图片来源:HuffPost) 你还可以看到Siri对流行文化有着些许了解,还有点冷幽默。如果你向它打听那里有健身房,Siri会回复你:没错,你手机握得的确不太紧,甚至Siri厌烦你的提问时,偶尔还会在屏幕上蹦出Fuck这样的词语。 同时,Siri在上线之初支持Android、BlackBerryOS等平台使用,它还可以与42个网络服务相连接从餐馆点评网站Yelp、售票网站StubHub,到电影点评网站RottenTomatoes和数学计算网站WolframAlpha然后Siri会将各个网站上的信息整合在一起再回馈给用户。无需打开其他的应用软件,Siri就可以帮助用户买票、订餐馆或叫出租车。它几乎可以感觉到用户的好恶,按照用户的个性提供相应的建议。 在开发者的构想中,Siri不再是搜索引擎的附属品,而是把目标瞄向了人工智能,这一点也在多年后汤姆格鲁伯(TomGruber)的TED演讲中得到证实。 他们希望Siri可以聆听用户的要求,然后给出相应的反馈。当你在酒吧里喝高了的时候,用谷歌搜索找车送你回家并不是件容易事;但Siri则可以理解你口中含糊的我喝高了回家,然后帮你叫车。 在他们的设想里,人工智能系统可以主动提供用户需要的答案,而不仅仅是找到相关的链接让用户自己做出选择。如果说搜索引擎定义了第二个网络时代,Siri的创始人则相信任务引擎将开创第三个网络时代。 就当Siri向人们抖着机灵展示其服务的时候,吉特劳斯接到了来自乔布斯的电话。 第二天Siri创始人与乔布斯见了面,彼此探讨了智能助手的未来,并且后者一直对使用语音识别技术为iPhone打造一个语音交互界面很感兴趣。在此之后苹果对这家创业公司产生了强烈的收购意向。 当然对Siri感兴趣的并不止苹果公司一家,2009年秋天,比苹果早了几个月,Verizon也与Siri签署了一项授权协议,意图为之后推出的Android手机全部预装Siri应用,并且拍好了宣传广告,但是苹果的收购让这一计划惨遭流产。 2010年4月苹果以接近2亿美元的价格收购了Siri,并在其他平台下架了Siri应用,而伴随着这个由24人所组成的团队入驻苹果公司总部,其也开始了对Siri大刀阔斧式的整合。 收购Siri后,苹果纠正了它的一些坏毛病,在赋予它一些新能力的同时,也大大限制了其他的功能。包括用语音直接回复用户提问,而在此之前,它只能提供文字反馈。同时赋予了Siri更多的语言,使它可以在多个国家为上百万(当时的苹果用户数)使用。它还与iOS系统深度整合在一起,可以调用十几个iOS内置工具来完成像安排会议、回复邮件和查看天气这样的简单任务。 而这些功能在苹果收购Siri公司16个月后的2011年10月14,随着iPhone4s一同问世,这也成为有史以来第一款深植系统内部的智能助手。不过,2010年Siri应用发布时的主要功能之一的餐馆预订等功能,直到2012年才重新与iPhone用户见面。 苹果Siri的危机与未来 Siri的出现为苹果的生态又增添的几分活力,但在这背后似乎还蕴藏着更多的危机。 Siri发布不久乔布斯逝世,使得苹果的智能语音助手规划暂时停滞,在此后的一年,苹果聘请前亚马逊搜索主管比尔斯塔西奥(BillStasior)领导Siri业务,外界则认为斯塔西奥的专长是搜索,而不是语音交互,Siri团队的一些成员认为他并没有完全理解产品的原始愿景从iPhone拓展到更多的第三方应用,从而使得Siri的发展偏离正轨。在此期间Siri创始人吉特劳斯和奇耶都相继离职,尽管俩人离职的原因一直是个谜,但外界猜测与此事存在一定的关系。 另外,Siri问世之后一直都面临着语音识别能力不强的窘境,经常因环境声和说话人的口音出现识别错误。同时竞争对手的智能语音助手也陆续上线抢占市场,包括早期的谷歌GoogleNow、三星SVoice、微软Cortana等,待到后来迎着AI的春风走来的亚马逊Alexa、谷歌GoogleAssistant等助手以更加精准的识别和更好的体验使得Siri面对的形式更加严峻。 苹果对Siri的重视一直都在线,一边将Siri纳入越来越多的平台iPad、AppleWatch、HomePod以及AppleTV等,而另一边又顶着用户对Siri的不满和来自行业的压力。 外媒称,制约Siri不够智能的原因可能是苹果公司十分在意对用户隐私的保护,Siri与亚马逊和谷歌不同的是它不直接利用设备内的数据来连接云端进行服务,这也成为Siri无法更智能的原因之一。而这也恰恰解释了在20172018年硅谷大规模爆出用户隐私被泄漏,而苹果则能独善其身。 伴随着近期Siri部门职位的扩招以及本次Siri和ML部门的整合,相信苹果能在用户隐私和Siri之间平衡出更好的办法,让Siri更加智能。 【来源:数字尾巴】