游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

ChatGPT引爆大模型,上海数字大脑研究院决策智能成果小起

  ChatGPT爆火再度引发了各界对于大模型的关注,内容生成(AIGC)已经展示出大模型对于实际应用的高效提升,也让业界对于其赋能实际应用有了更多期待。在内容生成之上,社会更需要借助大模型去做更深层次的决策辅助,行动生成(AIGA)是进阶的深水区。
  AIGA的关键在于A(Action),智能决策(IDM)则是A中最为关键的一环。IDM是应用AI和相关技术来解决现实世界的决策任务,鉴于环境的高度变化,决策任务的复杂性和不确定性对IDM提出了远高于信息收集整理的要求。AIGA被寄予更高的希望,可以进一步降本增效并广泛应用在复杂的现实生产活动中,为更广泛、更动态和更复杂的任务给出最优策略。可以看到的是,决策智能在多智能体游戏AI、生产调度和机器人任务中都有无限潜力。
  IDM的范式转变
  上海数字大脑研究院(简称数研院)自创立之初就锚定决策智能这一难而正确的事情,历经一年多,成果显著。在技术方向,已有多篇论文发表在国际顶级会议上,在多模态决策大模型、四足机器人决策控制、足球AI领域都有领先的技术成果,并且也在产业中落地,获得了良好的效果验证。国内首个多模态决策大模型DB1
  去年,数研院推出首个数字大脑多模态决策大模型(简称DB1),填补了国内在此方面的空白,进一步验证了预训练模型在文本、图文、强化学习决策、运筹优化决策方面应用的潜力。此外,创新性地尝试将预训练模型的成功复制到决策任务上,并且取得了突破。
  数研院推出的DB1,主要对Gato进行了复现与验证,并从网络结构与参数量、任务类型与任务数量两方面尝试进行了改进。实验任务数量达870,较Gato提升了44。04,较Gato在50专家性能上提升2。23。在决策类任务方面,DB1另外引入了200余个现实场景任务,即100和200节点规模的TSP问题求解。作为一个基础决策模型,DB1将是迈向更自主和高效的现实世界IDM应用的第一步。
  此前,数研院提出MADT(https:arxiv。orgabs2112。02845)MAT(https:arxiv。orgabs2205。14953)等多智能体大模型,在一些离线大模型通过序列建模,使用Transformer模型在一些单多智能体任务上取得了显著效果。
  DB1(右)与GATO(左)指标对比
  跨地形、具身四足机器人控制大模型
  在机器人控制方面,数研院成功用强化深度学习方法,将Transformer大模型应用于四足机器人跨地形、跨具身运动控制,让不同具身的四足机器人成功在多种真实复杂地形上化险为夷,如履平地,为自由、自主的运动控制奠定基础。相关成果以两篇论文的形式发表在国际机器人顶级会议ICRA2023上。
  相比传统深度学习模型,Transformer序列模型有着更大的模型容量以及更强的泛化性,数研院在此基础上提出了针对跨地形四足机器人运动控制框架TerrainTransformer(TERT)和跨具身的四足机器人运动控制框架EmbodimentawareTransformer(EAT)。TERT可以成功通过九种复杂的地形,包括沙坑、下楼梯等;EAT模型可以在前后腿一样长、前腿比后腿短、前腿比后腿长三种具身类型上完成较好的泛化,还可以根据所处环境的不同变化自身的身体,达到一种类似进化的方式。多智能体足球AI
  在多智能体决策方面,数研院以足球球队为应用场景,基于Transformer建立起了一支人工智能球队。数研院的足球AI训练框架把每一个球员作为一个单独的策略智能体,在个人层面上,通过提供在不同球场情况下人为设计的奖励信号来指导单个个体学习基础的行为比如带球、射门等。在此基础上,给予个体附近的队友和对手的信息,来提供团队内配合的可能,再将11个智能体组建成一支球队并一同与不同风格对手对抗来训练球队的技战术配合。针对训练量大的问题,在MALib的基础上开发了一套轻量版本的多智能体强化学习的训练框架,并为其命名为LightMALib。此外,采用了自博弈(selfplay)的方式(和AlphaGo一样),让智能体从零开始学习,使球队自我对抗,逐步开发探索出新的技能来升级。
  该足球AI首次亮相于IEEEConferenceonGame上的5vs5、11vs11赛道的多智能体竞赛,为比赛提供了强力的Baseline模型,并获得了积分榜双料亚军的成绩。
  数研院开放了足球AI的研究资源在https:github。comShanghaiDigitalBrainLaboratoryDBFootball,除了训练框架,还包括分析工具、基线模型等,希望推动足球AI研究社区的进一步发展。商业落地促智能化升级
  在商业落地方面,数研院的决策智能平台在各个领域都有着出色的表现。以高端制造业的研发环节为例,一直存在时间与成本居高不下的问题,在研发的不同阶段,研发物料、任务排程和研发人力三者之间也存在资源协调上的矛盾。在与上汽研发总院的合作中,基于数据驱动的业务计划智能决策引擎,将决策大模型引入业务计划的制定和执行过程中,通过数据让机器辅助决策,从根本上优化传统靠人的经验排程和变更带来的弊端,使得管理提质、增效。
  多模态决策大模型是实现决策智能体从游戏走向更广泛场景,从虚拟走向现实,在现实开放动态环境中进行自主感觉与决策,最终实现通用人工智能的关键探索方向之一。数研院团队在大模型研究上发力已久,未来,仍将持续迭代数字大脑决策智能大模型,实现跨域、跨模态、跨任务的知识泛化与迁移,最终在现实应用场景下提供更通用、更高效、更低成本的智能决策。
  附:数研院近期大模型论文成果:
  1。OnRealizationofIntelligentDecisionMakingintheRealWorld:AFoundationDecisionModelPerspective。Arxiv2022。https:arxiv。orgabs2212。12669
  2。SimtoRealTransferforQuadrupedalLocomotionviaTerrainTransformer。ICRA2023。https:arxiv。orgabs2212。07740
  3。MultiembodimentLeggedRobotControlasaSequenceModelingProblem。ICRA2023。https:arxiv。orgabs2212。09078
  4。Multiagentreinforcementlearningisasequencemodelingproblem。NeurIPS2022。https:arxiv。orgabs2205。14953
  5。Offlinepretrainedmultiagentdecisiontransformer:Onebigsequencemodelconquersallstarcraftiitasks。MIR2023。https:arxiv。orgabs2112。02845

伏特加和白酒同是烈酒,为什么一个卖遍全世界,一个只有中国人喝在全球出售的伏特加都是原味的!而中国白酒,包括茅台酒,五粮液味道都是经过勾兑的!请问?你愿吃转基因粮食吗?你愿喝勾兑出色香味俱全的飮料吗?你愿喝勾兑酒吗?如果告诉你……学校门口能卖哪些美食?学校门口能卖很多种美食呢,这简直是一个超级大的市场。来说说我们学校周边卖的那些美食吧。第一个,我想说的是红豆饼,小小的红豆饼可能毫不起眼,但是吃起来,非常香甜的。大概2元……麻婆豆腐怎么做?好吃吗?麻婆豆腐收藏(341648)更多分享到:工艺烧难度新手尝试人数4人份口味麻辣味准备时间10分钟烹饪时间10分钟BardD菜谱:25关注:1粉丝:4372015032094990……包子面条都散发着资本的铜臭味,老百姓如何找到一顿好吃的饭?出国,吃外国的那百姓无奈只能吃燕窝鲍鱼了自己做我个人认为,现在的食品中的包子,面条中很难吃出资本的铜臭味。各地有各种各样适合当地人口味的包子,也有当地人喜爱吃……唐山最好吃的饭店有哪些?推荐一家我吃过不错的餐厅满庭芳坐落于唐山市路南区建设南路南湖1970影视基地,集文化庭院、戏曲小剧场、餐饮休闲为一体,从味觉、听觉、视觉等感官触发心灵的共鸣。有不少……截至7月底,法国全国共有35311个授权5G站点据Rcrwireless8月9日报道,根据法国频谱机构ANFR发布的最新月度报告,截至8月1日,法国共有35311个授权的5G站点,其中26093个已被当地移动运营商宣布在技术……原材料相同,为啥在上海做泡菜和老家做泡菜口感差别很大?确实不同,之前有朋友吃过我们饭店的泡菜,她说深深的记住了那种酸脆爽口味道,就买了泡菜坛清洗干净让我给她起盐水。我和老家一样让她准备好了老姜青花椒干辣椒……快看!冬日蓝天碧空如洗,沉浸式体验赣州蓝连日来赣州城区晴空湛蓝云卷云舒,清新怡人整个城市在蓝天白云映衬下显得格外美丽构成了令人神怡的冬日美景12月19日,记者在赣州市中心城区看到,……继IOS之后,Sony也终于为Android带来DualSe四月份的时候,iOS加入了PS5DualSense摇杆支持之后,想必安卓用户希望未来也能同样支持Android。。。现在,终于等到它的出现了。在GooglePlay商店中的最新……谈一谈我对未来黄金走势的看法最近有很多投资者问我老师黄金是不是已经到顶了?这个走势是不是和2011年一样走的是双头顶。问的人太多了,我就在这里说一下我个人对黄金的看法。黄金价格走势图目前黄金的……长江存储迎来强援,国家大基金增资1052亿救助,无惧美国制裁长江存储迎来强援,国家大基金增资1052亿救助,无惧美国制裁作为国内乃至国际上具有知名度的高科技企业,长江存储在半导体行业有着一定的地位,尤其是旗下闪存产品,连续打破国外……冬奥,花滑全红婵高居第一,央视解说赞不绝口,犹如冰上公主时光飞逝,转眼之间已经是2022年的2月6日了,备受关注的北京冬奥会正在如火如荼地进行着,比赛精彩纷呈,令人欢喜不已。在2月6日的花样滑冰团体赛女单短节目比赛上,备受期待……
来大连住这里,每天都是海景富翁朋友们,有没有人和我一样觉得今年过得未免也太快了。谁敢信,一不小心就到了九月,今年只剩下4个月可以挥霍了(灬灬)。这个夏天我似乎什么都没有干,只是浅浅地去大连看了一场海,……做皮蛋瘦肉粥时,皮蛋不要直接下锅,学会这点,粥不腥味道好!做皮蛋瘦肉粥时,皮蛋不要直接下锅,学会这点,粥不腥味道好!皮蛋瘦肉粥是一道美味的粥品,虽然口味是咸的,但是味道很棒。将皮蛋、瘦肉搭配大米熬粥,发明的人简直是一位天才,因为……3677亿元项目将在合肥集中签约9月13日,2022世界制造业大会新闻发布会对外发布消息,本届大会以制造世界创造美好为主题,大会期间拟举办开幕式暨主旨论坛、巡馆、专题活动、平行论坛、六百项目对接等各类重要活动……创维推出新款29X1显示器29英寸带鱼屏,首发899元IT之家8月26日消息,今天,创维推出新款29X1显示器,29英寸带鱼屏,2560x108075Hz,首发899元。IT之家了解到,创维29X1显示器配备29英寸ADSI……茄子不放一滴油,又香又入味,做了一盘吃精光,连着吃三天都不腻茄子是我们家人最爱吃的蔬菜之一,小的时候家里的茄子是老妈在农场自己种植的,那种农家种植的茄子吃起来就是特别香。现在市场上买的很多茄子,很大一根,但吃起来总是感觉没有太多茄子的香……大虾新吃法,做法比香辣虾简单,比油焖大虾好吃,全家都抢着吃我是原创作者:为爱下厨教给大家最简单的做法,让你做出不一样的美食让饭菜充满浓浓家乡的味道,一起分享美味与快乐让你省时、省力、又省心,做出营养又好吃的美味……华为是不是真的不行了吗最近这段时间,华为的曝光率与以前相比减少了,关心华为发展的国人似乎为华为捏了一把汗,确实,由于美国政府的专攻打压,导致华为的全球5G订单数量比往年是有所减少了,但是,由于国内5……许昌那里有特色的饭店小吃?做为地地道道的许昌人我看到这个提问就很想发言!烩面篇许昌基本也是以面食为主,许昌的烩面和郑州烩面不太一样,汤应该更浓稠些,也就是许昌人喜欢厚重的味道!本人推荐三家烩……第一次去女朋友家,送老丈人酒是选五粮液好,还是梦之蓝呢?问你的女友,她的父母喜欢什么酒。一般喝什么酒,买中上档次两瓶。如果不喝酒,就送点实惠的,适合她父母用的。关键是用心了解他们的口味。是讲排场的还是比较讲实际的。另外,你自己也得实……山西农村发现一百年老宅,房屋被铁罩网封盖,出价上千万都不卖文所谓旅行的意义(欢迎个人转载及分享)一个人抱着什么样的目的去游历,他在游历中,就只知道获取同他的目的有关的知识。我的家乡就在山西,在这里的的确确聚集了很多有历史文……探索太空的前哨站!天宫是怎样炼成的?壬寅虎年中国完成了天宫空间站的在轨建造取得了举世瞩目的航天成就在癸卯兔年即将来临之际一同回顾我国天宫空间站的研制及建造进展过程探索太空的前哨……73岁王薇薇确实牛!胸衣外穿又放飞,踩20公分高跟鞋倚着墙怕王薇薇又晒自己的新造型了,外媒称现在73岁的王薇薇比20多年前都要嫩,王薇薇的大胆扮嫩风格引发了热议,这个73岁老太太,从内心深处就觉得自己还是个年轻的少女呢!不过这么大岁数的……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网