大数据行业里的两大误区
11月3日 枯心人投稿 大数据这个词,恐怕是近两年IT界炒的最热的词汇之一了,各种论坛、会议,言必谈大数据,“大数据”这个词,在IT界已经成了某果一样的“街机”或者叫“街词”,不跟风说两句“大数据长,大数据短”都不好意思跟人说自己是搞IT的。从某种程度来讲,大数据这个“圈”太乱了,一点不比“贵圈”好。
先从概念上来说,大数据是什么?其实数据处理从人类诞生时期就有了,古人结绳记事就是基本的统计,统计自己吃了几顿饭打了几次猎等等;再往近说,皇帝每晚翻嫔妃的牌子也是数据处理,在翻牌子之前,要从一大堆牌子里分析“方便”、“热度高”、“新鲜度”等指标;更近的说,数据仓库早在大数据这个词出现前就已经成熟发展了好几十年了。所以说,大数据并不新鲜,只是某些技术如Hadoop、MR、Storm、Spark发展到一定阶段,顺应这些技术炒出来的概念,但是这些概念都基于一个基本的理念“开源”,这个理念是之前任何阶段都没有过,可以节省费用提高效率,所以大家才都往这个行业里扔火柴(话说现在很多人跟风乱吵,个人认为也不是坏事)。
误区一:只有搞大数据技术开发的,才是真正“圈内人”。
笔者曾经参加过若干会议,70是偏技术的,在场的都是国内各个数据相关项目经理和技术带头人,大家讨论的话题都是在升级CDH版本的时候有什么问题,在处理Hive作业的时候哪种方式更好,在Storm、Kafka匹配时如何效率更高,在Spark应用时内存如何释放这些问题。参会者都一个态度:不懂大数据技术的人没资格评论大数据,您要不懂Hadoop2。0中的资源配置,不懂Spark在内存的驻留时间调优,不懂Kafka采集就别参加这个会!对了,最近Google完全抛弃MR只用Dataflow了,您懂吗?不懂滚粗!
在这里我想说,技术的进步都是由业务驱动的,某宝去了IOE才能叫大数据吗,我作为一个聋哑人按摩师用结绳记事完成了对于不同体型的人,用什么按摩手法进行全流程治疗,就不叫大数据分析了吗?技术发展到什么程度,只有一小部分是由科学家追求极致的精神驱动,大部分原因是因为业务发展到一定程度,要求技术必须做出进步才能达成目标的。
所以,真正的大数据“圈内人”至少要包含以下几种人:
一、业务运营人员。比如互联网的产品经理要求技术人员,必须在用户到达网站的时候就算出他今天的心情指数,而且要实现动态监测,这时候只能用Storm或者Spark来处理了;比如电信运营商要求做到实时营销,用户进入营业厅的时候,必须马上推送短信给用户,提示他本营业厅有一个特别适合他的相亲对象(呈现身高、三围、体重等指标),但是见面前要先购买4G手机;再比如病人来到银行开户,银行了解到用户最近1周曾经去医院门诊过两次,出国旅游过3次,带孩子游泳两次,马上客户经理就给客户推荐相关的银行保险理财产品。这些业务人员,往往是驱动技术进步的核心原因。
二、架构师。架构师有多么重要,当一个业务人员和一个工程师,一个说着业务语言,一个说着技术术语在那里讨论问题的时候,工程师往往想着用什么样的代码能马上让他闭嘴,而架构师往往会跳出来说“不,不能那样,你这样写只能解决一个问题并且会制造后续的若干问题,按照我这个方案来,可以解决后续的若干问题!”一个非技术企业的IT系统水平,往往有70以上的标准掌握在架构设计人员手里,尽快很多优秀的架构师都是从工程师慢慢发展学习而来的,IT架构的重要性,很多企业都意识到了,这就是很多企业有CTO和CIO两个职位,同样重要!架构之美,当IT系统平稳运行的时候没人能感受到,但是在一个烟囱林立、架构混乱的环境中走过的人眼中,IT开发一定要架构现行,开发在后!
三、投资人。老板,不用说了,老板给你吃穿,你给老板卖命,天生的基础资料提供者,老板说要有山便有了山,老板说要做实时数据处理分析,便有了Storm,老板说要做开源,便有了Hadoop,老板还说要做迭代挖掘,便有了Spark
四、科学家。他们是别人眼中的Geek,他们是别人眼中的高大上,他们是类似于霍金一样的神秘的早出晚归昼伏夜出的眼睛男女,他们是驱动世界技术进步的核心力量。除了世界顶级的IT公司(往往世界技术方向掌握在他们手中),其他公司一般需要12个科学家足以,他们是真正投身于科学的人,不要让他们去考虑业务场景,不要让他们去考虑业务流程,不要让他们去计算成本,不要让他们去考虑项目进度,他们唯一需要考虑的就是如何在某个指标上击败对手,在某个指标上提高0。1已经让他们可以连续奋战,不眠不休,让我们都为这些科学家喝彩和欢呼吧。在中国,我认为真正的大数据科学家不超过百人
五、工程师。工程师是这样一群可爱的人,他们年轻,冲动,有理想,又被人尊称为“屌丝”“键盘党”,他们孜孜不倦的为自己的理想而拼搏,每次自己取得一点点进步的时候,都在考虑是不是地铁口的鸡蛋灌饼又涨了五毛钱。他们敏感,自负,从来不屑于和业务人员去争论。工程师和科学家的不同点在于,工程师需要频繁改动代码,频繁测试程序,频繁上线,但是最后的系统是由若干工程师的代码组合起来的。每个自负的工程师看到系统的历史代码都会鄙视的发出一声“哼,这垃圾代码”,之后便投入到被后人继续鄙视的代码编写工作中去。
六、跟风者。他们中有些是培训师,有些是杀马特洗剪吹,有些是煤老板有些是失足少女。他们的特点就是炒,和炒房者唯一不同的就是,他们不用付出金钱,他们认为只要和数据沾边就叫大数据,他们有些人甚至从来没碰过IT系统,他们是浑水摸鱼、滥竽充数的高手,他们是被前几种人鄙视的隐形人。不过我想说,欢迎来炒,一个行业炒的越凶,真正有价值的人就更能发挥自己的作用。
误区二:只有大数据才能拯救世界
大数据目前的技术和应用都是在数据分析、数据仓库等方面,主要针对OLAP(OnlineAnalyticalSystem),从技术角度来说,包含我总结的两条腿:一条腿是批量数据处理(包括MR、MPP等),另一条腿实时数据流处理(Storm、内存数据库等)。在此基础上,部分场景又发现MR框架或实时框架不能很好的满足近线、迭代的挖掘需要,故又产生了目前非常火的基于内存数据处理Spark框架。很多企业目前的大数据框架是,一方面以Hadoop2。0之上的Hive、Pig框架处理底层的数据加工和处理,把按照业务逻辑处理完的数据直接送入到应用数据库中;另一方面以Storm流处理引擎处理实时的数据,根据业务营销的规则触发相应的营销场景。同时,用基于Spark处理技术集群满足对于实时数据加工、挖掘的需求。
以上描述可以看出,大数据说白了就是还没有进入真正的交易系统,没有在OLTP(OnlineTransactionsystem)方面做出太大的贡献。至于很多文章把大数据和物联网、泛在网、智慧城市都联系在一起,我认为大数据不过是条件之一,其余的OLTP系统是否具备,物理网络甚至组织架构都是重要因素。
最后还想说,大数据处理技术,再炫如Google的Dataflow或成熟如Hadoop2。0、数据仓库、Storm等,本质上都是数据加工工具,对于很多工程师来说,只需要把数据处理流程搞清楚就可以了,在这个平台上可以用固定的模版和脚本进行数据加工已经足够。毕竟数据的价值70以上是对业务应用而言的,一个炫词对于业务如果没有帮助,终将只是屠龙之术。任何技术、IT架构都要符合业务规划、符合业务发展的要求,否则技术只会妨碍业务和生产力的发展。
随着时代变迁,大浪淘沙,作为数据行业的一员,我们每个人都在不同的角色之间转换,今天你可能是科学家,明天就会变成架构师,今天的工程师也会变成几年后的科学家,部分人还终将步入跟风者的行列。
走出战略管理的误区Dess和Picken两位战略管理学者在对诸多公司进行了广泛深入的研究后,按企业战略所涉的环境分析、战略制定与形成及战略执行三个不同阶段,概括指出的企业在经营战略方面面临的七大……
企业未来和未来企业相对的个体要在客观环境下生存发展的两种选择分别是:1、改变环境;2、适应环境,改变自己。从这个角度来讲,市场中的企业组织可以分为两大类别:进化型企业组织与非进化型企业组织。进化……
北汽“解密”收购萨博:到底买来了什么北汽控股公司董事长徐和谊介绍,这次北汽收购萨博不仅包括萨博的整车、发动机等技术产权,同时包括整个技术研发、质量管理、供应商开发管理等一整套体系。据新华社12月24日报道,……
并购啤酒花三度卡壳嘉士伯或梦断西部啤酒王嘉士伯并购啤酒花、一石二鸟将乌苏啤酒和新疆啤酒纳入囊中、剑指西部啤酒王的美梦因为监管部门迟迟未批越来越悬。昨日啤酒花公告,大股东新疆蓝剑嘉酿投资有限公司向嘉士伯出售公司41股权……
北汽最缺什么?收购萨博是开始真正困难在后头近日,北汽专门在京召开发布会,披露斥资两亿美元从萨博购买的资产包括3个整车平台、两款发动机和两款变速箱技术。北汽踌躇满志,准备借此在自主品牌上大干快上。这是一项被北汽视为胜利的……
北汽将收购福建戴姆勒不低于40股权福汽集团高层上周在接受记者采访时对外界关于北汽将收购东南一事进行了否认,并透露说东南为了坚定自主发展路线,内部已经制定了未来三年产销翻三倍的跨越目标。该高层表示,在东南汽车拒绝……
北汽2亿美元只买来萨博“过时货”?今年国内汽车业第一宗海外整车收购案已经尘埃落定。北汽控股昨天公布了收购萨博的细节和金额。与此同时,一场关于北汽到底有没有淘到“真宝贝”,只收购部分老平台和技术到底值不值的争论,……
中粮1。94亿元收购万威客继今年7月联合厚朴基金以61亿港元收购蒙牛20股权之后,中粮再出手。12月23日,中粮宣布以1。94亿元收购万威客100股权,并将其纳入中粮集团肉食产业链发展计划中。……
柳传志:跨国并购要交学费早在预期之中2009年的春季,几乎是所有的企业共同面临的艰难时代,金融危机冲击下,大部分企业2008年第四季度财报都受到影响,下滑或亏损;宏观经济所带来的波动,给行业以及企业的自信度、发展……
今年美国数字行业十大并购预测:谷歌收购Roku1、谷歌收购RokuYouTube被视为谷歌最有增长潜力的业务,该网站在网络视频领域占据38的市场份额,每天的观看量达到10亿次。然而,YouTube用户每天看电视的时间……
和记黄埔拟全面收购和记电讯国际和记电讯国际有限公司(HutchisonTelecommunicationsInternationalLtd。,简称:和记电讯国际)周一表示,其最大股东和记黄埔有限公司(Hut……
通用延长萨博竞购交易的最后期限至1月7日据国外媒体报道,瑞典萨博公司12月30日表示,美国通用汽车公司已经将萨博竞购交易的最后期限12月31日延至1月7日,萨博在停产一个月后将在2010年1月重新启动一些生产线。……
自编相声《面试》参考自编相声《面试》参考甲:您好,经理(紧张)乙:。。。(瞪了瞪他)你紧张什么甲:我。。我没紧张阿(更紧张)乙:你还说没紧张(生气)甲:我。我。。我真……
面试妆的画法关于面试妆的画法第一步、选择滋润度较高的粉底,用指腹先大范围由中央向外涂抹。用粉底刷将粉底大范围推开。第二步、黑眼圈偏重的话,请用偏暖色调且滋润度高的遮瑕膏轻点在眼……
进击的面试叙事文进击的面试3000字叙事文我一边走着一边吃着红豆面包,喝着柠檬茶,看了时间,刚好赶得及。来到了教室,师兄师姐热情接待,跟我聊起了天。无非都是问问是哪个院系,什么专业……
面试的材料关于面试的必备材料1、钢笔或水笔两支:为什么要两支?做备份以防万一啊!带钢笔或者水笔是以备随时填写正式的表格。2、记事本:面试时记录或计算可能用得到。将笔和笔记本放……
面试笔题库有关面试笔题库一、基本题:1、请您作一下简单自我介绍。2、您来面试前有没有想过整个过程?说说您先前是如何打算应对这场面试的,包括各个阶段。3、您的缺点或……
面试难得直率关于面试难得直率一家跨国公司向社会公开招聘高级质量管理员,面试,难得直率。由于受聘者年薪高达十多万元,且各种待遇相当优厚,一时报名竞聘者如潮。经过笔试、面试和实际操作等严……
倒霉的面试案例关于倒霉的面试案例面试是通过书面、面谈或线上交流(视频、电话)的形式来考察一个人的工作能力与综合素质,通过面试可以初步判断应聘者是否可以融入自己的团队。下面是小编为大家带……
就业面试应具备的素质关于就业面试应具备的素质一、虚心虚心是指不自满,不自以为是,就业面试应具备的心态。如虚心使人进步,骄傲使人落后。面试是要以向用人单位学习的态度去。例如,对外经济贸易……
为何面试不可贸然前往为何面试不可贸然前往熟能生巧同样可以运用在面试技巧上,千万不可毫无准备就贸然前往,找个熟识的朋友,先和他来场预演,请他客观地对你的答案和举止仪态提出建议,通过事先的演练,……
迎接校长的面试迎接校长的面试我们六年级下学期最重要的一件事就是争取进入适合自己的中学。而我很幸运地在激烈的竞争中,终于拥有了一次进入文澜中学的机会:迎接任校长的面试。那天下午,我……
面试中听的学问关于面试中听的学问周恩来之所以为亿万人赞颂,其中很突出的一条就是他在听别人讲话时态度极其认真,不论对方地位高低、年龄大小,都同样对待。美国有一位外交家曾评价道:“凡是亲切……
家乐福面试家乐福面试范例面试是企业招聘中最后一个环节,求职者大多不知道该如何“取悦”主考官,不同行业面试时对求职者的要求也不一样。本期我们走访了世界500强企业、零售业巨头家乐福的……