游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

BI不是可以拖拉拽取数吗?为什么还要SQL取数?专家视角

  本文由36氪企服点评专家团吕品原创。
  36氪企服点评专家团吕品
  正文
  BI工具不是可以直接拖拉拽取数吗?为什么还要写SQL取数?这是很多初次接触商业智能BI的朋友会提到的一个问题,因为在他们接触到一些BI市场或者产品宣传的时候,很多人就是这么来介绍BI的。
  简单来说,这个问题背后的逻辑等同于:拿着碗和筷子不是可以直接吃饭吗?为什么还要自己动手做饭?有没有想过,即使是直接吃饭,饭总是要有人来做的吧,无论这个人是自己还是别人,做饭这个过程并不会少。
  所以,从这个问题背后能看出来还是有很多人对于BI的理解还是存在一定的误区,我们可以从以下这几个角度来分析讲解一下。
  可视化BI
  很多人对于BI的印象就停留在数据的可视化图表,但可视化图表只是BI的最终呈现,可视化的拖拉拽并不是BI的全部。
  一个完整的商业智能BI解决的应该是端到端(EndtoEnd)的问题,需要从各个业务系统的数据源取数,通过ETL(Extract抽取、Transformation转换、Loading加载)的过程将要分析的数据从规范的不可分析的、或不规范不可分析的数据最终变为规范的、可分析的形式,最终通过BI可视化拖拉拽的方式将数据进行有效的、带有逻辑性的组织形成可视化分析报表。
  派可数据大屏可视化分析
  而大部分的BI工具如果重在强调前端可视化的能力,这类BI工具的定位就是解决数据可视化分析展现的问题,属于BI前端可视化报表工具,但并不能代表BI的全部。
  如何形象的理解BI
  如果把BI可视化实现的过程比作到餐厅出菜的过程,那就是:
  数据源环节vs菜市场
  从各个业务系统取数按照餐厅营业需求准备所需菜品的原材料,就需要到各个市场买菜。不同的业务系统对应不同的菜市场,不同的菜市场有不同的摊位对应的就是业务系统数据库中不同的数据表。摊位上的菜就可以理解为数据表中的数据,要分析什么就取什么样的基础数据。
  数据仓库vs后厨仓库
  数据仓库环节从各个市场买回来的菜堆在哪里呢?后厨仓库。有的菜是今天要用的,有的菜是明天要用的,所以先买回来堆起来。从各个系统抽取上来的数据也是如此,这些数据有的来源于Oracle系统,有的来源于MySQL或者SQLServer,按照分析需求从不同的数据库抽取之后放到自己的数据仓库中集中管理起来。
  ETL过程厨师做个猪肉炖粉条不可能把整扇猪肉、一颗一颗的大白菜扔到锅里,一定是猪肉切片,大白菜去除坏掉的叶子,菜该切切,肉该剁剁剁。同时,还会备好一些辅助的佐料等原材料,最后把所有的原材料放到操作台上,这个就是备菜(择菜、洗菜、切菜)的过程。
  数据也是如此,把数据从各个业务系统先抽取(Extract)上来,等同于把放在不同仓库格子的菜拿过来。数据要做转换(Transformation),比如一些脏数据的处理、格式的转换、数据计算口径的统一、指标的计算等等,就如同洗菜、择菜、切菜的过程。最后将处理之后的数据按照一定的模型或者格式加载(Loading)到指定的可被前端调用的数据表中,就如同把所有备好的菜放到一起准备下锅。
  报表可视化Reportingvs上菜
  Reporting报表可视化就是最后的呈现,也通常视为BI的前端,所以也叫做BI前端可视化。用户需要什么样的可视化报表,就如同用户点菜一样可以高度定制化,前提是基于已有的原材料(数据)。
  派可数据大屏可视化分析
  所以,大家可以看到从业务系统数据取数到最后的报表呈现实际上经历了很多的阶段。在商业智能BI开发过程中,80的时间在处理底层数据(跑菜市场、买菜、运菜、择菜、洗菜、切菜到备好菜),20的时间在做可视化分析报表(做菜)。底层数据的处理重点就是ETL过程,而实现ETL过程的主要方式就是通过ETL工具(例如:Kettle、Informatica、Pentaho、IBMDataStage、MicrosoftSSIS等)或其它ETL框架结合SQL查询语句、StoredProcedure存储过程等方式来组织和管理数据处理的先后顺序。
  特别是企业级BI项目建设,不仅仅是简单的ETL过程还需要涉及非常专业的数据架构设计、数据仓库建模、分层设计等数据仓库的构建,这里面最常用的开发语言就是SQL。
  BI直接取数分析并不可行
  很多BI工具会经常强调直连取数,这样就不需要写SQL,直接通过表与表之间的关系进行表间建模,形成一个大宽表,文本类型的就是维度Dimension,数值类型的变成度量Measure,通过BI前端可视化进行拖拉拽操作形成很多AdhocReport即席报表。
  在实际演示案例的时候也是如此,最常见的就是一个标准的、数据格式极为标准规范的EXCEL表上传一下按照上面的方式来一遍;要么就是销售订单表和销售明细表关联一下,算算订单数量、订单金额等等。
  其实验证一下BI工具的这种直连且拖拉拽的能力到底有多强非常简单,让业务部门提几个实际的分析需求,现场拿BI产品从实际的业务系统中取数来验证一下是否那么容易就明白了。
  以下面一个小DEMO为例,可以使用任意的国内外BI可视化分析工具尝试一下当直连到这张表的时候,是不是就可以直接、任意的进行拖拉拽分析。
  案例:统计外包业务的人工效率(时长)
  背景:某金融公司把一部分贷款业务外包出去给第三方公司,第三方公司业务人员每与客户联系一次,就会根据沟通的状态记录一下,形成了以下的业务数据表DurationTime,有以下三个核心字段:
  ID客户的身份证号,唯一标识ID
  Operation一个操作记录,重点节点有0034、0036、0048
  Date一个操作记录的时间日期(实际上是时间,为了简化用日期表示)
  业务系统中的原始数据表
  计算规则如下:
  1)计算00340036,00360048,00340048的时间间隔。
  2)如0036之前没有0034,不可单独计算00360048的时间间隔。
  3)如0036后跟着多个0048,则取到最晚的一个0048的时间间隔。
  4)如0034后跟着多个0048,则取到最早的一个0048的时间间隔。
  5)。。。。
  实际的计算规则多达20多种,就以上面4条计算规则为例,最后的计算结果是:
  Transformation表
  为了得到上面的最终结果,通常往往会创建一些中间转换表,用来记录转换的过程,便于检查和纠正逻辑,这种表我们通常叫做Transformation表。
  业务系统中的原始数据表的数据规范吗?非常规范。但是适合分析吗?并不适合。所以在BI分析之前要做什么?那就是写SQL、ETL取数,把这种在业务系统中规范的不可分析的、或不规范的不可分析的变成规范的、可分析的数据格式结果表。
  在实际的BI项目开发过程中,来自各个业务系统数据源的数据大部分情况下就是一种不可直接分析的状态,与分析思维不同,他们是描述业务过程的。
  还会有一种说法是:可以直连业务数据源,通过写SQL查询一个数据集再通过前端BI可视化分析工具来呈现做可视化分析报表行不行?我们的建议是,除了以下几种情况,不要这样做:
  第一,这类可视化分析报表基本上就是一次性的,一年可能就改不了几回。
  第二,本身数据量不大,使用频率也不会非常的高。
  原因在于:没有合理的建模、指标计算复用性太差、影响业务系统性能、无法应对后续日益增长和不断变化的业务分析需求,按照这种方式做的BI基本上不会超过两年就会面临推翻重做的风险。
  所以,在使用BI的时候,不管是直连业务系统数据源的表进行表间关系建模,还是通过写SQL查询数据结果集的方式直连业务系统,在大多数情况下都不合理,BI开发人员应极力避免采用这样的数据操作方式,这些还都是在没有涉及到多异构数据源取数、主数据档案不一致、组织架构缺失补位、缓慢渐变维度等问题的前提下。
  BI直接取数分析什么样的情况下是可行的?
  也有朋友说到,我们公司就是直连数据库取数做可视化分析的。我们让朋友回去问了一下,原来连接的是企业已经构建好的数据仓库。在这种情况下,底层的数据模型相对比较标准,数据也经过了非常良好的格式转换,可以直接使用一些前端BI可视化分析工具进行快速的分析,这样的一种搭配就非常好。
  所以,BI直连数据库不是不可行,但得分清楚直连的是业务系统的数据源数据库,还是直连的是已经通过SQL从业务系统的数据源取数和建模处理后的数据仓库、数据集市。
  派可数据自助开发平台包括数据仓库与BI可视化分析
  IT和业务的边界就在这里,IT负责底层数据建模、数据仓库的构建,业务基于已经建好的基础分析模型通过BI前端可视化分析工具来进行拖拉拽的可视化分析操作。倘若是这样,也确实实现了不通过SQL取数使用BI前端工具就可以做报表的目标。但绝对不能认为,不通过SQL取数就可以对接任何业务系统数据源做任何BI可视化分析。
  所以,当一家企业底层已经有架构非常良好的数据仓库,这个时候使用一个轻量的BI前端可视化分析工具基本上就够用了。但如果所在企业底层还没有良好的数据仓库系统,只寄希望单纯的使用一个BI前端可视化报表工具解决一切分析问题,这个时候就需要认真思考一下是否可行。
  想要了解更多行业知识、软件推荐、功能对比、工具测评,敬请关注36kr企服点评官方网站(www。36dianping。com)。轻点鼠标,发现更多高效率的企服软件!
  www。36dianping。com
  〔免责声明〕
  原文标题:《BI不是可以拖拉拽取数吗?为什么还要SQL取数?专家视角》
  作者:吕品
  本文来源于36氪企服点评

十万左右的国产suv,长城荣威比亚迪长安吉利和奇瑞哪个质量比首先要肯定一点,上面列举的这些品牌造车经验都是相当丰富的。尤其在造SUV上,除了荣威差一点起步晚之外,其他几个车企造SUV都是信手拈来,旗下的SUV总体质量都差不多。毕竟……阿里华为争相进入,AI制药能否探索生命禁区人类创造了AI,AI能否反过来拯救人类呢?除了问答聊天画画,ChatGPT们正在加速向细分领域渗透,而AI制药正成为当下AI应用落地的先行者。科技巨头跨界进入医疗赛道……怎么才能熟练倒车?倒车主要还是要通过查看后视镜,以及在最佳的时机快速调整方向盘角度,以保证车身在不同的阶段有正确的角度。倒车一般发生在进入停车位时,很多人经常犯一个错误,在开始倒车时角度就是错误……电动三轮车为什么允许生产销售,有的地方却不给上牌,不让上路?一些进入工信部目录的产品是允许生产销售的。这样的电动三轮车都是合规车辆,可以合法销售、合法上牌,依法上路。我们看一下进入工信部目录的部分电动三轮车品牌与型号:只要进入工信……排量越大越费油吗?很多人在买车的时候都有一个误区,认为车子排量越大越费油,其实这是一个非常错误的认知,今天我就来说说关于发动机排量和油耗之间的关系。先说一个我身边的真实故事十几年前,……想自驾游去一趟西藏,哪个时间段去最佳?五千元人民币够吗?这个是我们的行程和话费,供参考。行程:我是焦作的,我、我老婆和朋友夫妻在2019年8月2日下午5点出发的。第一天通宵开车直接杀向成都(焦作成都1150km),住在成……为什么老司机建议买车尽量买便宜的?首先,维修成本低廉,技术过硬,你见过电动窗坏的,中控锁失灵的,你见过手摇玻璃坏的吗?,多半是用力过猛摇把碎了,手动变速箱已经不能在老了,技术成精了,那些什么cvt,双离合,干湿……城市中电动自行车如果被彻底禁止了,会怎样?如果电动自行车被彻底禁止,那么自行车和摩托车就会增加。其实,电动自行车不适合城市使用,因为重量大、速度快、没有声音,容易撞人伤人,而且锂电池容易爆炸起火,铅电池污染严重。……一辆汽车的寿命有多久,15年以上的车真的就不能开吗?一辆汽车的寿命有多久,15年以上的车真的就不能开吗?一辆汽车的寿命有多久?那可长了,以今时今日车子的制造工艺来看,跑个百万公里都不是什么太难的事(出租车都能做到),而以咱……打坐调息时呼吸之间的停顿,是在呼完停顿,还是在吸满气后停顿?顺其自然,呼短息长下丹田,周气全身在息间。初学腹动,有功了气动。我是呼完停顿。吸满后停顿时,会感觉到气血从背部呼呼地往颈部涌,而且一直往上涌,这时候特别害怕头……为什么很多人都在戒糖呢?戒糖会给身体带来什么好处?从早餐的豆浆到下午的冷饮,再到晚上的巧克力,含糖食物全天陪伴着许多人。但是糖到底有多不健康?你怎么能戒掉它呢?糖并没有最好的声誉,但许多人不能不管它。糖是碳水化合物之一。……从喀什开车到拉萨,走219国道可以开小排量轿车吗?谢谢邀请。小排量轿车正走219一定要保证车况良好,并且要做好抗高反的物质和心理准备。从叶城219零公里起点算起,行驶100公里左右,将要翻越库地达坂,这里的弯道能把……
北京环球影城深夜发布公告4月22日,北京环球影城发布公告称,一游客在环球度假区内游玩霸天虎过山车时出现突发状况,送医后不治身亡。22日晚9时许,北京环球度假区工作人……大众宝来1。5哪款合适?宝来进入中国已经很长时间了,凭借中庸的表现以及接地气的名字赢得中国很多消费者的信赖。现在宝来销量一直非常稳定,在紧凑级别轿车中,一般都能挤进在前五名。现在宝来有两种动力组合可以……72岁黄梅莹状态太好了,长相秀丽,品位高级,优雅时髦似50岁在很多人看来,人一旦上了一定的年纪了,不仅事业上停滞不前,连带着很多思维也固定在了局限方面上。但是如今已经72周岁的黄梅莹女士却用自己的人生经历和不俗的审美,告诉了我们有……身高不到1米6的小个子,过年就这么穿,不露脚踝保暖又时尚在年味渐浓的冬季,相信不少人都制订了新的变美计划,特别是小个子女生,对美丽与时尚的热情更是高涨,不过在追求时尚的同时,大家也要注重保暖,有温度又有风度才最符合小个子普通人的穿搭……诗一首红船1921年的南湖听见了风在走动听见了水在翻涌声音里埋着惊雷远远望去那一只画舫静若止水烙印在七月的湖面投映在七月的屏幕上渐渐地……心中完美小公主到店看凯迪拉克XT525T豪华型黑色展车在展厅的灯光和春日暖阳的照耀下光彩夺目、熠熠生辉,许多人肯定一下子就被其外观吸引住了,当然还有比BBA众车型厚道多的配置。钻石切割车身大气而端庄,L型大灯极具个性;内饰……昆明市区高峰期打车平均只需等3到5分钟会议现场供图巡游出租车接入网约平台,司机的接单效率和收入都得到显著提升都市时报全媒体记者李浩3月30日,由高德主办的推动数实融合促进区域经济聚合生态区域发展研讨会在……放下后易醒小睡短入睡难,03个月婴儿睡眠特点与解决策略在我怀大宝的时候,孕晚期的各种不适让我天真地认为,孩子生下来,我就解放了。但真等到孩子出生后,我却发现,孩子还不如在肚子里时让人省心。其实在照顾新生儿时,很多东西都可以临……电动车新规后,不符合标准电动车该怎么办?车主已经上牌不影响2019年4月15日《电动自行车安全技术规范》国家强制标准(新国标)正式实行,这也意味着执行了20年的《电动自行车通用技术条件》(老国标)正式退出历史舞台,新国标出台以后,我们……拿到驾照后,人生第一辆车该怎么选?新手购车需要了解这几点!很多刚拿到驾照的新手朋友,都会第一时间买车练手。面对眼花缭乱的汽车市场,这时候很多新手朋友就会无从下手。我总结了一下新手朋友比较关心的几个问题,希望对新手朋友买车有一定帮助!本……难修的发动机,水平对置发动机遇到它你慌不?在发动机界,除了我们常用的发动机和马自达专一的转子发动机外,有一种发动机也是和转子发动机一样属于让人又爱又恨的发动机,它就是今天的主角水平对置发动机。常见发动机的类别……拿到驾驶证以后,你第一次开车是什么感觉,可以分享一下吗?2009年,那时候边工作边抽时间去考驾照,拿到驾照后第一时间告诉了我老板。我是我老板的助理,平时跟他去应酬、拜访领导、媒体,按理说应该是我来开车,他坐老板位,但因为我还没……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网