游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

自动调优工具AOE,让你的模型在昇腾平台上高效运行

  本文分享自华为云社区《自动调优工具AOE,让你的模型在昇腾平台上高效运行云社区华为云》,作者:昇腾CANN。什么是AOE?
  AOE(AscendOptimizationEngine)是一款自动调优工具,目的是为了充分利用有限的硬件资源,满足算子和整网的性能要求。
  AOE通过生成调优策略、编译、在运行环境上验证的闭环反馈机制,不断迭代,最终得到最佳的调优策略,从而更充分利用硬件资源,提升网络的性能。
  AOE的架构如下。
  Application层:调优入口,支持如下。AOE:这里的AOE表示AOE进程,是离线推理场景下的调优入口。TFAdapter(TensorFlowAdapter):TensorFlow训练场景下的调优入口。PyTorchAdapter(PyTorchAdapter):PyTorch训练场景下的调优入口。
  Tuning层:调优模式,支持以下类型。SGAT(SubGraphAutoTuning):子图调优。一张完整的网络,会被拆分成多个子图。针对每一个子图,通过SGAT生成不同的调优策略。SGAT的调优算法通过获取每个迭代的调优策略性能数据,找到最优的调优策略,从而实现对应子图的最优性能。OPAT(OperatorAutoTuning):算子调优。AOE将一张整图输入给OPAT,OPAT内部进行算子融合,将融合得到的图进行算子粒度切分,针对每一个融合算子子图生成不同的算子调优策略,从而实现最优的算子性能。GDAT(GradientAutoTuning):梯度调优。分布式训练场景下,GDAT通过最大化反向计算与梯度聚合通信并行度,缩短通信拖尾时间,提升集群训练的性能。
  Execute层:为执行层,支持编译(Compiler)和在运行环境上运行(Runner)。AOE工作原理
  如下以算子调优为例,介绍AOE的工作原理。
  1。将原始开源框架模型传入GE、FE进行图准备(InferShape、算子选择等)及子图拆分。
  2。进入算子编译阶段,根据拆分的子图信息匹配知识库。
  若能匹配到知识库:
  未开启REPEATTUNE的场景,直接使用已有知识库中的调优策略编译算子。
  开启REPEATTUNE的场景,通过AOE进行调优。
  若调优后的结果优于当前已有的知识库,则会将调优后的结果存入用户自定义知识库,并使用自定义知识库中的调优策略编译算子。
  若调优后的结果不优于当前已有的知识库,则不再生成用户自定义知识库,直接使用已有的知识库编译算子。
  若未匹配到知识库,则通过AOE进行调优。
  若调优后的结果优于默认调优策略的性能,会将调优后的结果写入自定义知识库,并使用自定义知识库中的调优策略编译算子。
  若调优后的结果不优于默认调优策略的性能,不生成自定义知识库,使用默认调优策略编译算子。
  3。推理场景下,编译完成后,生成适配昇腾AI处理器的离线模型文件。训练场景下,编译完成后,生成训练好的网络模型文件。AOE使用场景
  当算子性能或者网络性能不佳时,可以使用AOE进行调优。AOE调优支持的场景如下:离线推理TensorFlow训练PyTorch训练在线推理IR构图如何使用AOE进行调优?
  如下以离线推理场景下Caffe网络的算子调优为例,介绍如何进行AOE调优。
  1。准备模型文件。
  2。配置环境变量。
  必选环境变量
  CANN组合包提供进程级环境变量设置脚本,供用户在进程中引用,以自动完成环境变量设置。执行命令参考如下,以下示例均为root或非root用户默认安装路径,请以实际安装路径为准。以root用户安装toolkit包usrlocalAscendascendtoolkitsetenv。sh以非root用户安装toolkit包{HOME}Ascendascendtoolkitsetenv。sh
  AOE工具依赖Python,以Python3。7。5为例,请以运行用户执行如下命令设置Python3。7。5的相关环境变量。用于设置python3。7。5库文件路径exportLDLIBRARYPATHusrlocalpython3。7。5lib:LDLIBRARYPATH如果用户环境存在多个python3版本,则指定使用python3。7。5版本exportPATHusrlocalpython3。7。5bin:PATH
  可选环境变量exportASCENDDEVICEID1exportTUNEBANKPATHhomeHwHiAiUsercustomtunebankexportTEPARALLELCOMPILER7exportREPEATTUNETrue
  命令中的参数含义如下。ASCENDDEVICEID:昇腾AI处理器的逻辑ID。TUNEBANKPATH:调优后自定义知识库的存储路径。TEPARALLELCOMPILER:开启算子的并行编译功能。REPEATTUNE:是否重新发起调优。
  3。进行AOE调优,命令如下。命令中使用的目录以及文件均为样例,请以实际为准。aoeframework0modelHOMEmoduleresnet50。prototxtweightHOMEmoduleresnet50。caffemodeljobtype2
  命令中的参数含义如下。framework:原始网络模型的框架类型。0表示Caffee。model:原始模型文件路径与文件名。weight:原始模型权重文件路径与文件名。jobtype:调优模式,2表示算子调优。
  4。若提示如下信息,则说明AOE调优完成。Aoeprocessfinished
  调优完成后,生成文件如下。
  自定义知识库:若满足自定义知识库生成条件则会生成自定义知识库。
  om模型文件,存放路径为:{WORKPATH}aoeworkspace{modelname}{timestamp}tunespaceresult{modelname}{timestamp}tune。om
  {WORKPATH}:调优工作目录
  {modelname}:模型名称
  {timestamp}:时间戳
  算子调优结果文件:在执行调优的工作目录下实时生成命名为aoeresultopat{timestamp}{pid
  xxx
  }。json的文件,记录调优过程中被调优的算子信息。示例如下。basic:{tuningname:调优任务名,tuningtime(s):1827}OPAT:{modelbaselineperformance(ms):113。588725,modelperformanceimprovement:0。31,modelresultperformance(ms):113。236731,opattuningresult:tuningsuccessful,repomodifiedoperators:{addrepooperators:〔{opname:stridedslice10,optype:stridedsliced,reposummary:{repoaddnum:2,repohitnum:17,reporeservednum:15,repounsatisfiednum:0,repoupdatenum:2,totalnum:19}
  5。调优完成后,请使用调优后的自定义知识库重新推理,验证性能是否提高。
  以上就是AOE的简单介绍。关于更多内容,可以在昇腾文档中心昇腾社区官网丨昇腾万里让智能无所不及查看,您也可在昇腾社区在线课程板块学习视频课程昇腾社区官网丨昇腾万里让智能无所不及,学习过程中的任何疑问,都可以在昇腾论坛链接互动交流!
  关注华为云开发者联盟点击下方,第一时间了解华为云新鲜技术
  华为云博客大数据博客AI博客云计算博客开发者中心华为云

生活因有趣而非凡为什么许多孩子沉迷游戏?尽管老师和家长苦口婆心说尽了道理,依然无法改变孩子的状态,他们仍然抓住一切时间去玩,而且严重影响学习。中国现代儿童教育之父陈鹤琴说过,工作与体操虽……终于登顶!再见了,NBA第一主帅!干完今年就要退休NBA属于老家伙们的一天!3月6号打勇士才砍下56分,12号对阵奇才又狂轰50分。一周两次50,这是37岁的詹姆斯交出来的数据,不断证明着他仍没老去的事实,且这两战……小米推出米家智能快煮电饭煲电饭锅5L,319元IT之家9月1日消息,小米方面今日宣布米家智能快煮电饭煲电饭锅5L开启预售,首发319元。据介绍,这款电饭煲可以实现28分钟快煮饭,支持自调节防溢,拥有860W大火力,采……半年亏掉535万,上海吉野家不香了?锦江酒店拟抛售9。8股权本文来源:时代财经作者:王言一则股权交易的消息,披露了日式快餐连锁品牌吉野家的经营情况。上海联合产权交易所官网显示,上海锦江国际餐饮投资管理有限公司(下称锦江餐饮)……CBA中职篮最不靠谱的转会消息是北京首钢方硕要投奔北控马布里做为北京的篮球球迷,都知道方硕是北京队的一个精神象征,北京首钢是北京的传统篮球标识队伍,也是北京体育的三个有代表性的项目,和北京国安,北汽女排一样,都是北京体育的窗口项目。……1973年李小龙去世当晚,一名记者潜入殡仪馆,发现他脸上有个1973年7月21日,星期六。台风黛蒂带来的影响仍未消失,整个香港沉闷异常。然而,当香港市民们醒来之后,还没来得及抱怨天气的沉闷,就被一则轰动了全香港的消息给震惊了。……我国科学家在中国境内首次发现真钱伯兽化石近日,中科院古脊椎所刘俊研究员等在《生物学快报》报道了在中国首次发现真钱伯兽化石的相关研究成果,并对其是否存在毒腺进行了探讨。研究团队在中国内蒙古大青山二叠纪晚期的地层中……威金斯承认比赛划水有时候没尽全力,勇士和格林改变了我勇士夺冠让枫叶乔丹威金斯的名气上了一个新的台阶!他如何看待自己的中庸表现?在一档节目中,他谈到了这个部分。谈到威金斯,已经有很多绰号,无论是养生乔丹、枸杞哥还是人类18分……为什么说人类不可能飞出太阳系?虽然说太阳系在整个大宇宙中很渺小,渺小得不如一粒尘埃。但是,与地球相比还是大到了我们无法理解的程度。太阳系到底有多大呢?很多人以为太阳系第大八大行星海王星的轨道就是太阳系……泰山队输给申花队咎由自取!傲慢加用人不当的代价?泰山队今晚输给申花,纯属咎由自取。用人不当加傲慢,输球在所难免。首先,足够的傲慢。排兵布阵上,一个前锋不用,充分体现了对对手的轻视,不把对手放在眼里。郭田雨、克雷桑和费莱……场均10。7分,3分命中率12!攻不进,防不住!这外援,太菜昨晚,时代中国广州队以123105大比分击败新疆队,取得了一波4连胜。新赛季至今的8场比赛,他们取得了6胜2负的战绩。这是队史最佳。我们可以看到,这2个赛季广州男篮……美媒美国父母越来越担心孩子在外过夜来源:环球时报【环球时报特约记者苗涛】随着美国枪支的泛滥、疫情的蔓延,素来有些讲求放养的美国父母开始越来越纠结。父母的担忧不无道理,据英国天空新闻网17日报道,最新……
报告苹果iPhone保值率最高,HTC手机最低IT之家1月21日消息就像汽车一样,智能手机也会随着时间的推移而贬值。一个名为BankMyCell的网站会追踪手机的保值率,去年全年,该公司每小时追踪310款流行智能手机的回购……西部排行火箭遭绝杀,继续垫底!快船拒绝爆冷,爵士大胜升第311月1日上午,NBA常规赛,火箭客场对阵快船,希望拿到胜利。戈登发挥出色,三分球更是实现两连中,帮助球队拉开一度建立优势。火箭替补球员在首节发挥较为低迷。首节结束,火箭以23……Angew水对二氧化碳加氢合成甲醇的瞬态动力学促进机制第一作者:吴文龙,王亚楠通讯作者:李洪良通讯单位:中国科学技术大学论文DOI:10。1002anie。202213024全文速览利用可再生能源产生……用户反映存光晕效应,苹果称新iPadPro的XDR显示屏已最IT之家5月25日消息一些用户注意到12。9英寸iPadPro的LiquidRetinaXDRminiLED显示屏出现了比预期要更加明显的光晕效应,但根据苹果的官方文件,他们已……杨紫把原版婚纱改了,到底是杨不露,还是怕显胖?杨紫参加直播活动虽然已经过去几天了,但作为90花中的领头羊,她当日的造型还是为人津津乐道,还有网友扒出了模特穿得原版,和她一通对比。从对比图可以看出来,无论是杨紫所穿的还……研究谷歌Pixel3吸引三星用户,但未动摇iPhone地位北京时间4月10日早间消息,据美国科技媒体9to5Google报道,谷歌的Pixel系列智能手机正逐渐受到欢迎,并抢走竞争对手的用户。但根据市场研究公司CounterPoint……HomePodMini开始向用户发货,首批订单将于11月16IT之家11月15日消息HomePodmini的预购订单已经开始向全球用户发货。在美国,许多订单仍处于处理或准备发货阶段,但一位德国的用户分享了一张截图,他的HomePo……阿里云Teambition网盘App正式版预计11月20日上IT之家11月8日消息近期,阿里云旗下Teambition宣布新的开发消息,Teambition网盘内测迎来新进展,团队表示,喜迎一批优秀的阿里程序员加入,人手充裕了有问题好解……水韵琅琊城市文旅综合体项目登场水韵琅琊城市文旅综合体项目作为临沂市十四五期间重点项目,既是经济项目、又是民生工程,是市第十四次党代会报告和政府工作报告中主推的全市重点工程,是激活临沂旅游的重要支点。开……美网首位男单4强!北欧天才创141年历史,再赢1场或登顶NO北京时间9月7日,美网男单赛场诞生首个4强选手!挪威名将鲁德直落三盘,30(616476)击败意大利选手贝雷蒂尼,生涯首进美网男单4强,也是美网141年历史上首次在男单半决赛出……苹果新iPhone的黑科技UWB技术揭秘9月11日,苹果公司秋季发布会在乔布斯剧院举行。以iPhone11为代表的一系列新品揭开了神秘的面纱,与果粉见面。新iPhone的特点和参数,相信大家通过各大媒体的介绍已……微软推出听听文档微信小程序,会说话的文档来了IT之家11月2日消息除了交流之外,现在越来越多的人使用微信来办公、学习、进行集体活动等,那么如何在微信里一边看文档,又要一边和同事等讨论呢?微软近期推出了听听文档微信小程序,……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网