聚热点 juredian

专访百度开放云副总经理谢广军:与英特尔深度定制合作

近日,英特尔在北京面向中国正式发布了新一代服务器平台处理器至强E5 v4,同时畅谈了Cloud for All等云战略,而来自中国的阿里巴巴、百度、中国移动也倾力支持,公布了英特尔的深度战略合作。

百度开放云副总经理谢广军也就与英特尔的合作、百度开放云的发展接受了媒体采访。

谢广军:刚才发布会上我们讲到的百度开放云战略,实际上就是把百度以前积累过的技术架构、机器学习、人工智能等一些经验和技术对外输出,使我们整个生态圈里的客户、生态圈里的开发者,能够很便捷地达成自己想要的创新。在这样一个过程中,这么多年来我们和英特尔之间有很强的战略合作关系,不仅仅在我们的服务器和硬件领域,也包括了数据中心的建设、网络规划、分布式技术甚至现在的机器学习和人工智能,可以说百度和英特尔在进行全方位的合作,这也快速助推了我们当前业务的发展。

提问:请谢总介绍一下英特尔在百度开放云上的推动力主要体现在哪些方面。

谢广军:主要在三个方面。一是在新技术的引入方面,比如说英特尔的网络加速技术,使我们可以快速构建自己能够自定义的网络设备。二是在合作探索方面,我们正在和英特尔共同探索更前沿的技术,涉及很多领域,比如数据中心,而在一些重要的期刊和杂志上我们也共同发表了论文。三是渠道方面,英特尔是一家国际化的公司,它在帮助我们做一些更前沿的或者使得我们的视野更开阔的渠道,使我们的业务快速发展。

提问:百度基于E5 v4的产品是否有一些深入定制?对基于百度业务做的特殊性优化上,可以详细介绍吗?

谢广军:有很多。在前期的需求收集方面,我们就和英特尔经过了充分的交流,包括今天我介绍的CAT技术,之前百度一直在探索如何在数据中心里把资源效能利用的更好,我们还做了大规模的集群操作系统。在集群操作系统领域,服务器效能的控制或者性能保障技术是特别关键的。今天我们对服务器的CPU、内存、网络关键的资源节点进行性能控制,一些细节技术,比如CPU缓存技术,其实更多是依赖于英特尔给我们提供的支持,使我们更加有效地控制数据中心的一些性能资源,达到质量保证。这使得我们整体的资源利用率有很大幅度的提升。

我们和英特尔的深入合作不仅是在CPU上,软件技术上我们也做了大量共同的定制,包括在Linux领域,使得今天百度数据中心的平均CPU使用率达到了50%,这是一个非常高的数字。结合CPU技术的演进,预期未来会达到更高的数字,这方面还有更大的潜力可挖。

提问:麻省理工学院此前评选了2016年度十大技术,其中特别提到百度的语音技术,中国有几亿网民,在加上汉字的特殊性,语音技术前景非常广阔。对于普通网民来说,百度语音技术有什么能够切身体会到的便捷性?

谢广军:对百度来讲,语音技术是底层的公共技术。基于这个技术,我们推出了很多相关产品,使得交互方式由以前的文字真正变成了多媒体形式,比如现在百度力推的一个产品“度秘”,这就是语音技术的体现,又比如百度地图、百度导航。语音不只是语音识别,还包括了语音合成、语音和语义的理解,它是一个很广阔的领域。正是这种基础技术研究的推进,使得我们在业务上能够进行快速创新。这两年移动互联网领域创新很快,我想这也与基础技术的推动是分不开的。

提问:百度对E5 v4的应用规模现在有多大?是新采购的还是原来的升级版?

谢广军:新采购的和在原有基础上升级的都有。百度的硬件平台一直跟随英特尔的节奏,只不过我们可能比业界很多友商更快一些,基本上是全方位的。我们与英特尔合作不是试试而已,而是到了一定阶段就一代一代地往前推动。

追问:百度开放云相关的数据中心用的都是英特尔平台吗?

谢广军:目前全部是。

提问:应用定制硬件,到底什么样的硬件需要定制?

谢广军:在机器学习领域,有很大的并行处理需求,我们希望把整个计算硬件,包括处理器、协处理器的并行度做得更好。传统上一直就是用GPU,但是GPU在控制上又不是太灵活。目前结合百度深度神经网络的算法,可以把硬件这块做得更符合我们的需要。另外在SSD的硬件领域也有和软件定义相关的。

提问:在将E5 v4支持的新技术转化为每个人都能感受到的实际产品方面,除了大家众所周知的百度开放云盘、语音识别技术,百度还有什么不为人知的黑科技?

谢广军:其实今天的黑科技,也许明天就变成大众普及的技术。比如说无人车,现在这方面我们投入很大,希望三年能够达到商用水平,五年能够量产。这个战略是我们公司内部很重要的方向,其实这边也和英特尔有很多的合作。

提问:百度开放云会在无人驾驶汽车后台提供哪些技术支持?

谢广军:提供数据处理技术、大数据和图像、语音识别技术。我们通过云平台给它推送,比如它需要的多媒体信息,我们就会推送给它。

提问:百度这次升试E5 v4的过程中英特尔提供了哪些技术支持?

谢广军:举SSD这个例子来说,其实对于NAND闪存而言,它的总空间是制造商做好的,但是英特尔和百度可以提供软件定义的方案,来配合硬件使用。比如百度这边的应用大多数情况下需要很强的随机读写能力,此时假如SSD的总空间有1TB,我就通过软件来隐藏200GB做擦写均衡。还有一种情况就是,有些应用是需要顺序读写,这时候空间对我又变成了更有价值的资源,我就会预留相对少一点,单GB的成本就会降低。这就是通俗语言上的根据不同的业务场景进行软件自由定义。

提问:英特尔Xeon产品线E3、E5、E7几个系列都有,百度开放云这边为何选择使用E5级的产品?对于即将发布新E7系列,百度如果采用的话大概占怎样的比例?E5还是主力吗?

谢广军:这么多年来,E5这个档次一直是主力,百度采购的绝大部分都是E5系列。对我们这种新兴的互联网公司来说,它线上主要靠分布式处理能力,性能扩展不是单靠一台机器性能越来越强就能堆出来的。对于一种工作负载,我们更看中TCO,给用户相同的服务质量,投入成本会有多少差异,总的评估下来看E5系列在当前最合适。

E3一代我们看中的是它的一些新特性,比如多媒体处理、图片处理,在这上面我们也有很强的愿望将E3的这些特性使用起来,但主要是一些垂直领域。在通用CPU这块这么多年都是以E5为主。

英特尔补充:互联网行业大部分是以使用E5系列为主流,这跟应用特性不一样。E7更多是在关键应用,比如针对单一机器上需要很高性能的可能考虑E7。就跟我们选车一样,不同车不同配置和不同档次,行业根据不同的需要和目的选择不同的平台来跑。

提问:E5 v4可以无缝升级,那淘汰下来的E5 v3老平台百度一般怎么处理呢?

谢广军:淘汰是有专门渠道和专门的公司进行处理。举个例子,在百度的数据中心里,某个设备三年过保了,三年之后这个服务器是零成本了,但还不如换一台新的更合算,因为还有机架、功耗的成本,硬件性能发展的很快,总的来说还是从TCO方面考虑。

提问:我们也知道E5 v4还没有在百度开放云启动。如果我是普通客户,启用E5 v4这一代产品以后,会什么具体感受?

谢广军:性能更高了,这是最直观的感受。现在的云服务商,比如公有云的服务商,主流的产品是云主机,比如我们更新换代到了另一个平台,但是成本并没有增加。对于用户来说,他在使用云服务的时候计算性能将得到提升,这就是他最大的收益。

搜索建议:
热文

 古代历史上有哪些倒霉的人?

连倒霉带作死的急子这回写个咱们华夏的吧,最近总有哥们让我试试写自己国家的历史。话说春秋时期有个国家叫卫国,是周武王的弟弟康叔被分封的领地,周武王应该很喜欢这个弟...(展开)