Flink操练（十四）之DS简介（14）搭建Flink运行流

美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

Flink操练（十四）之DS简介（14）搭建Flink运行流

　　1部署方式1。1独立集群
　　独立集群包含至少一个master进程，以及至少一个TaskManager进程，TaskManager进程运行在一台或者多台机器上。所有的进程都是JVM进程。下图展示了独立集群的部署。
　　master进程在不同的线程中运行了一个Dispatcher和一个ResourceManager。一旦它们开始运行，所有TaskManager都将在Resourcemanager中进行注册。下图展示了一个任务如何提交到一个独立集群中去。
　　客户端向Dispatcher提交了一个任务，Dispatcher将会启动一个作业管理器线程，并提供执行所需的JobGraph。作业管理器向ResourceManager请求必要的taskslots。一旦请求的slots分配好，作业管理器就会部署job。
　　在standalone这种部署方式中，master和worker进程在失败以后，并不会自动重启。如果有足够的slots可供使用，job是可以从一次worker失败中恢复的。只要我们运行多个worker就好了。但如果job想从master失败中恢复的话，则需要进行高可用（HA）的配置了。
　　部署步骤
　　下载压缩包
　　链接：http：mirror。bit。edu。cnapacheflinkflink1。11。0flink1。11。0binscala2。11。tgz
　　解压缩tarxvfzflink1。11。0binscala2。11。tgz
　　启动集群cdflink1。11。0。binstartcluster。sh
　　检查集群状态可以访问：http：localhost：8081
　　部署分布式集群所有运行TaskManager的机器的主机名（或者IP地址）都需要写入。confslaves文件中。startcluster。sh脚本需要所有机器的无密码的SSH登录配置，方便启动TaskManager进程。Flink的文件夹在所有的机器上都需要有相同的绝对路径。运行master进程的机器的主机名或者IP地址需要写在。confflinkconf。yaml文件的jobmanager。rpc。address配置项。
　　一旦部署好，我们就可以调用。binstartcluster。sh命令启动集群了，脚本会在本地机器启动一个作业管理器，然后在每个slave机器上启动一个TaskManager。停止运行，请使用。binstopcluster。sh。1。2ApacheHadoopYarn
　　YARN是ApacheHadoop的资源管理组件。用来计算集群环境所需要的CPU和内存资源，然后提供给应用程序请求的资源。
　　Flink在YARN上运行，有两种模式：job模式和session模式。在job模式中，Flink集群用来运行一个单独的job。一旦job结束，Flink集群停止，并释放所有资源。下图展示了Flink的job如何提交到YARN集群。
　　当客户端提交任务时，客户端将建立和YARNResourceManager的连接，然后启动一个新的YARN应用的master进程，进程中包含一个作业管理器线程和一个ResourceManager。作业管理器向ResourceManager请求所需要的slots，用来运行Flink的job。接下来，Flink的ResourceManager将向Yarn的ResourceManager请求容器，然后启动TaskManager进程。一旦启动，TaskManager会将slots注册在Flink的ResourceManager中，Flink的ResourceManager将把slots提供给作业管理器。最终，作业管理器把job的任务提交给TaskManager执行。
　　sesison模式将启动一个长期运行的Flink集群，这个集群可以运行多个job，需要手动停止集群。如果以session模式启动，Flink将会连接到YARN的ResourceManager，然后启动一个master进程，包括一个Dispatcher线程和一个Flink的ResourceManager的线程。下图展示了一个FlinkYARNsession的启动。
　　当一个作业被提交运行，分发器将启动一个作业管理器线程，这个线程将向Flink的资源管理器请求所需要的slots。如果没有足够的slots，Flink的资源管理器将向YARN的资源管理器请求额外的容器，来启动TaskManager进程，并在Flink的资源管理器中注册。一旦所需slots可用，Flink的资源管理器将把slots分配给作业管理器，然后开始执行job。下图展示了job如何在session模式下执行。
　　无论是作业模式还是会话模式，Flink的ResourceManager都会自动对故障的TaskManager进行重启。你可以通过。confflinkconf。yaml配置文件来控制Flink在YARN上的故障恢复行为。例如，可以配置有多少容器发生故障后终止应用。
　　无论使用job模式还是sesison模式，都需要能够访问Hadoop。
　　job模式可以用以下命令来提交任务：。binflinkrunmyarncluster。pathtojob。jar
　　参数m用来定义提交作业的目标主机。如果加上关键字yarncluster，客户端会将作业提交到由Hadoop配置所指定的YARN集群上。Flink的CLI客户端还支持很多参数，例如用于控制TaskManager容器内存大小的参数等。有关它们的详细信息，请参阅文档。Flink集群的WebUI由YARN集群某个节点上的主进程负责提供。你可以通过YARN的WebUI对其进行访问，具体链接位置在TrackingURL：ApplicationMaster下的ApplicationOverview页面上。
　　session模式则是。binyarnsession。sh启动一个yarn会话。binflinkrun。pathtojob。jar向会话提交作业
　　Flink的WebUI链接可以从YARNWebUI的ApplicationOverview页面上找到。2高可用配置
　　Flink的高可用配置需要ApacheZooKeeper组件，以及一个分布式文件系统，例如HDFS等等。作业管理器将会把相关信息都存储在文件系统中，并将指向文件系统中相关信息的指针保存在ZooKeeper中。一旦失败，一个新的作业管理器将从ZooKeeper中指向相关信息的指针所指向的文件系统中读取元数据，并恢复运行。
　　配置文件编写highavailability。zookeeper。quorum：address1：2181〔，。。。〕，addressX：2181highavailability。storageDir：hdfs：flinkrecoveryhighavailability。zookeeper。path。root：flink2。1独立集群高可用配置
　　需要在配置文件中加一行集群标识符信息，因为可能多个集群共用一个zookeeper服务。highavailability。clusterid：cluster12。2yarn集群高可用配置
　　首先在yarn集群的配置文件yarnsite。xml中加入以下代码propertynameyarn。resourcemanager。am。maxattemptsnamevalue4valuedescriptionThemaximumnumberofapplicationmasterexecutionattempts。Defaultvalueis2，i。e。，anapplicationisrestartedatmostonce。descriptionproperty
　　然后在。confflinkconf。yaml加上yarn。applicationattempts：43与Hadoop集成
　　推荐两种方法下载包含hadoop的Flink版本。使用我们之前下载的Flink，然后配置Hadoop的环境变量。exportHADOOPCLASSPATH｛hadoopclasspath｝
　　我们还需要提供Hadoop配置文件的路径。只需设置名为HADOOPCONFDIR的环境变量就可以了。这样Flink就能够连上YARN的ResourceManager和HDFS了。4保存点操作。binflinksavepointjobId〔savepointPath〕
　　例如。binflinksavepointbc0b2ad61ecd4a615d92ce25390f61adhdfs：xxx：50070savepointsTriggeringsavepointforjobbc0b2ad61ecd4a615d92ce25390f61ad。Waitingforresponse。。。Savepointcompleted。Path：hdfs：xxx：50070savepointssavepointbc0b2a63cf5d5ccef8Youcanresumeyourprogramfromthissavepointwiththeruncommand。
　　删除保存点文件。binflinksavepointdsavepointPath
　　例子。binflinksavepointdhdfs：xxx：50070savepointssavepointbc0b2a63cf5d5ccef8Disposingsavepointhdfs：xxx：50070savepointssavepointbc0b2a63cf5d5ccef8。Waitingforresponse。。。Savepointhdfs：xxx：50070savepointssavepointbc0b2a63cf5d5ccef8disposed。5取消一个应用。binflinkcanceljobId
　　取消的同时做保存点操作。binflinkcancels〔savepointPath〕jobId
　　例如。binflinkcancelshdfs：xxx：50070savepointsd5fdaff43022954f5f02fcd8f25ef855Cancellingjobbc0b2ad61ecd4a615d92ce25390f61adwithsavepointtohdfs：xxx：50070savepoints。Cancelledjobbc0b2ad61ecd4a615d92ce25390f61ad。Savepointstoredinhdfs：xxx：50070savepointssavepointbc0b2ad08de07fbb10。6从保存点启动应用程序。binflinkrunssavepointPath〔options〕jobJar〔arguments〕7扩容，改变并行度操作。binflinkmodifyjobIdpnewParallelism
　　例子。binflinkmodifybc0b2ad61ecd4a615d92ce25390f61adp16Modifyjobbc0b2ad61ecd4a615d92ce25390f61ad。Rescaledjobbc0b2ad61ecd4a615d92ce25390f61ad。Itsnewparallelismis16。

工信部5G手机终端连接数超3亿户新华社北京5月25日电（记者张辛欣）记者25日从工信部获悉，截至4月末，三家基础电信企业移动电话用户总数达16。05亿户，5G手机终端连接数达3。1亿户。5G加快应用不仅……工人力量评司马南质疑联想高管司马南老师质疑联想高管的问题是前所未有的，这场口水大战是千万级的。其中有很多不文明的现象甚至出现了恐吓、辱骂、造谣、人肉攻击等违法行为。平台没有制止，反而有点随波逐流的感觉，国……java10新特性局部变量类型推断01java10新特性局部变量类型推断很多人抱怨Java是一种强类型，需要引入大量的样板代码。很明显类型声明往往被认为是不必要的。JDK10之前的Java代码中，声明一个……同济医院探索建立医师决策机器人执行的手术新模式中国青年报客户端讯（邓国欢鲍捷中青报中青网记者刘昶荣）11月28日，华中科技大学同济医院、华中科技大学、武汉联影智融医疗科技有限公司三方合作的三维影像导航手术机器人整机系统研发……电视无线接收器一般多少钱？有什么推荐？不知道题主到底啥意思？估计是说的网络机顶盒吧，亦或是卫星机顶盒。网络机顶盒价格在二百元左右，可以到实体店去购买，也可以上网去购买。网络机顶盒的价格在一百多到三百元不等，实……互联网中究竟该如何自救？大家好，我是明灯，互联网创业导师，你创业梦上的引路人。最近我在忙碌网站的时候，寻求身边朋友给我帮忙的时候，发现身边的大部分在追小说，而我在之前的时候也是看小说看的很入迷，……微信支付宝从明年三月份开始将无法使用个人收款码经营收款微信支付宝从明年三月份开始将无法使用个人收款码经营收款！最近这几天我也都有去了解这件事情，毕竟这件事情落实后很多行业都要做出修改。2022年3月1日起个人收款码禁用……联想研发投入这么少，为什么还能连年保持全球第一大PC的地位？第一、PC已经是个夕阳产业，各国或各公司已经不在PC领域发力角逐，联想只是维持了以前渠道的残余消费市场，不是什么值得骄傲的事。第二、联想的中科院企业的招牌，所谓民族之光的……复合思维与思维方法创新复合思维与思维方法创新（三）：万有引力思维法。万有引力定律（Lawofuniversalgravitation）是艾萨克。牛顿于1687年在巜自然哲学的数学原理》中所发表的一种……谁能从元宇宙革命中脱颖而出？大摩点名Facebook和这四只财联社（上海，编辑黄君芝）讯，自从Facebook在10月份宣布更名为Meta，似乎在一夜之间将元宇宙概念推向了公众的视野。从那时起，大大小小的公司都在试图利用这一轰动的消息，……大厂造富神话终结拼命加班熬夜换期权，只盼二线城市能买套房图源：视觉中国3月以来，中概股暴跌，阿里、腾讯、美团等大厂的股价均已较去年高点腰斩。在社交平台上，一名前腾讯员工帖子引发热议：30多岁的他高调宣布去年退休，但今年持……有什么一辈子都不想换的壁纸吗？如果把结婚证当壁纸你会做到一辈子不换吗？废话不多说，直接上图以示尊重。这三张属于简约风壁纸。也是组合起来用的时间最久的，至少都是以年为单位在使用的。色彩、构图、意境……

<<<<<<－>>>>>>

三百元预算解决全屋WiFi6网络覆盖，锐捷星耀X32路由器评【科技犬】随着百兆甚至千兆宽带的快速入户，在家看高清直播、刷剧和玩手游等对网速要求越来越高，普通路由已无法有效满足，需要能够跑满宽带，特别是能保证全屋处处都能满速上网的路……阿里巴巴现在出手能不能拯救恒大？不能也不可能出手。首先现在恒大最主要的困难是资金问题，阿里巴巴不可能凭空掏出万亿去拯救很大，马爸爸也不是傻子，现在地产下行，哀鸿遍野，出圈还来不及，这种投资很大概率打水漂……迄今为止我们发现的安卓12最佳功能外媒拿到了安卓12的测试版本，试验了新功能。安卓12测试版的最终版本出来了，它让我们最近距离地看到了下一个大更新中的所有功能。在这个最新版本中，我们可以看到新的Mater……李彦宏在百度AI开发者大会描绘未来交通图景不限购不限行无拥堵12月27日，百度Create2021（百度AI开发者大会）召开。百度创始人、董事长兼CEO李彦宏在开场演讲中表示：智能交通将是影响未来1040年的重大变革，可使5年之内中国一……你们玩soul吗？有没有约出来见面过？从前玩过soul。但时间不长，大约不到半年。我是男性，当然想有艳遇，但是没有主动约别人出来见面，因为怕被拒绝后，感觉没有面子。开始玩的时候，有几位女性打招呼，目的各……嘉世达的洒拖机器人上央视了今年我们要攻克一个世界级技术难题，让我们的机器人不仅能扫地拖地，还能实现擦高层玻璃，实现‘一机五用’。2月14日，在央视新闻频道《稳中求进干在实处中国工业经济开新局》栏目中，作……开年首月国产手机销量环比大增苹果手机整体销量走低每经记者：岳琦每经实习记者：李明会每经编辑：梁枭今年1月，国内智能机销量同比、环比双增长。连续三个月霸榜月销冠军之后，苹果销量环比下滑，而国产手机则一反常态，各大品牌销量……中国电信的霸王条款真是让人无语，碰到过么？十多年的电信用户，前几天套餐内流量用完了，网速被降速，就抓紧买了60元的10g流量包，并升级了29元每月的5G套餐包，结果网速依然很慢，下载速度1M左右。反馈给电信客服，……一开电脑都是广告，请问怎么永久关闭？一开电脑都是广告，请问怎么永久关闭？电脑上的一些弹窗广告确实非常让人头痛，谁不想要一个干净的电脑系统，安安静静地办公上网。那么，有没有办法可以禁止这些广告呢？办法当然是有的。……特斯拉要进军家用空调，大金格力美的一夜难眠最近，特斯拉首席执行官马斯克称，它将进军空调市场，制造更安静、更高效、更节能的空调。这句话一出，立即引起空调行业的极大关注。然而，空调行业市场规模虽大，但早已日落西山，继汽车后……现在买苹果se或者6s划算吗？现在买苹果手机不合适啦！前几天，中国新闻发布了华为手机已经超过了苹果手机，成为世界老大，功能上更先进，买华为手机又支持国货，为什么还想着美国佬的烂苹果呢这个问题去年的这个……贾跃亭或将回归？FF汽车再度启航冲击上市，目前市值高达220随着新能源市场的火爆，越来越多的互联网巨头都开始加入到这个行业之中，现在的新能源汽车市场要想插入其中可谓是非常困难了，在前几年的造车潮之中，涌现出很多的汽车概念，很多行业的创始……

友情链接：易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网