游戏电视苹果数码历史美丽
投稿投诉
美丽时装
彩妆资讯
历史明星
乐活安卓
数码常识
驾车健康
苹果问答
网络发型
电视车载
室内电影
游戏科学
音乐整形

金融圈注意了!彭博研究人员刚推出BloombergGPT

  ChatGPT引爆的AI热潮也烧到了金融圈,彭博社重磅发布为金融界打造的大型语言模型(LLM)BloombergGPT。
  3月30日,根据彭博社发布的研究报告显示,其构建了迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型BloombergGPT。
  该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务,在执行金融任务上的表现远超过现有模型,在通用场景上的表现与现有模型也能一较高下。
  BloombergGPT到底有多强
  根据彭博发布的报告来看BloombergGPT对金融行业来说无疑是一次颠覆性创新。
  我们先来看一下BloombergGPT使用到的庞大数据集。
  研究人员利用彭博社现有的数据,对资源进行创建、收集和整理,构建了迄今为止最大的特定领域数据集,并创建了一个拥有超过7000亿个标签的大型训练语料库:彭博作为金融数据公司,数据分析师在公司成立的四十年间收集了大量的金融材料,拥有丰富的金融数据档案,涵盖了一系列的主题。
  我们将这些数据添加到公共数据集中,创建了一个拥有超过7000亿个标签的大型训练语料库。
  BloombergGPT的训练数据库名为FINPILE,由一系列英文金融信息组成,包括新闻、文件、新闻稿、网络爬取的金融文件以及提取到的社交媒体消息。
  为了提高数据质量,FINPILE数据集也使用了公共数据集,例如ThePile、C4和Wikipedia。FINPILE的训练数据集中约一半是特定领域的文本,一半是通用文本。为了提高数据质量,每个数据集都进行了去重处理。
  利用庞大的数据集,并基于通用和金融业务的场景进行混合模型训练,BloombergGPT诞生了。
  一般来说,在NLP领域,参数数量和复杂程度之间具有正相关性,GPT3。5模型的参数量为2000亿,GPT3的参数量为1750亿。
  根据BloombergGPT的训练结果显示,其在执行金融任务上的表现远超过现有的模型,且在通用场景上的表现与现有模型也能一较高下。
  BloombergGPT优势:不可替代性和准确性
  当下,通用NPL模型也可以处理金融领域的任务,那为金融圈量身定制的模型究竟有何意义?
  彭博认为,针对特定领域模型有其不可替代性且彭博的数据来源可靠:因彭博社的大多数应用均为金融领域,着手构建了一个针对金融领域的模型具有优势。
  除了构建金融领域的LLM外,本文的经验也为其他研究专用模型提供了参考。我们的方法是在特定领域和一般数据源上训练LLM,以开发在特定领域和通用领域上均表现优异的模型。
  此外,我们的训练数据不同于传统的网络爬取数据,网络上的数据总有重复和错误,但我们的数据来源可靠。
  而更重要的是,报告指出,通用NLP模型处理金融领域任务时会面临不少挑战,首先就是无法理解财经新闻背后的市场情绪:
  以情感分析为例,一个题为某公司将裁员1万人,在一般意义上表达了负面情绪,但从金融市场情绪来看,它有时可能被认为是积极的,因为这一做法可能提振投资者信心,使公司的股价上涨。
  从测试来看,BloombergGPT在五项任务中有四项(ConvFinQA,FiQASA,FPB和Headline)表现最佳,NER(NamedEntityRecognition)排名第二:测试一:ConvFinQA数据集是一个针对金融领域的问答数据集,包括从新闻文章中提取出的问题和答案,旨在测试模型对金融领域相关问题的理解和推理能力。
  测试二:FiQASA,第二个情感分析任务,测试英语金融新闻和社交媒体标题中的情感走向。
  测试三:FPB,金融短语库数据集包括来自金融新闻的句子情绪分类任务。
  测试四:标题,数据集包括关于黄金商品领域的英文新闻标题,来判断新闻标题是否包含特定信息,例如价格上涨或价格下跌等。
  测试五:NER,命名实体识别任务,针对从提交给SEC的金融协议中收集金融数据,进行信用风险评估。
  对于ConvFinQA来说,这个差距尤为显著,因为它需要使用对话式输入来对表格进行推理并生成答案,具有一定挑战性。
  (注:GPTNeoX为OpenAIGPT3的一个开源替代品)
  BloombergGPT将助力新闻领域
  既然BloombergGPT测试中的表现如此优异,那未来可以怎么用?
  除了金融数据查询、回答金融相关问题,BloombergGPT未来可以被新闻领域广泛使用:BloombergGPT训练是以众多新闻为基础的,因此它未来将协助记者日常工作。
  记者需要为每个部分编写简短的标题,专门为此任务设计的模型维护成本太高,但BloombergGPT在这个方面表现优异。
  可以利用BloombergGPT更好的查询金融相关的知识。
  如,BloombergGPT能够很好地辨别公司的CEO。(虽然BloombergGPT正确地识别了CEO,GPTNeoX出现了错误,FLANT5XXL则完全未能识别)。
  对于这个或将颠覆金融圈的大型语言模型,部分网友并不买账,有人认为彭博此次只发布报告,不发布模型,颇有些雷声大雨点小之意。
  也有网友认为,彭博赶在愚人节之前发布,可能在骗人。
  ChatGPT为彭博点赞
  部分网友不买账,那ChatGPT怎么看?
  华尔街见闻就这件事专门询问了ChatGPT,ChatGPT认为BloombergGPT是一项很有意义的技术进步:它是专门为金融领域开发的一种语言模型,可以更好地处理金融领域的数据和任务,并且在金融领域的基准测试中表现出色。
  这将有助于金融从业者更好地理解和应用自然语言处理技术,促进金融科技的发展。同时,BloombergGPT还可以为其他领域的语言模型的发展提供参考和借鉴。总的来说,BloombergGPT是一个有益的技术创新。
  本文来自华尔街见闻,欢迎下载APP查看更多

你最喜欢的山东菜是什么?做为一个地道的山东人,我最喜欢的有10道很出名山东菜,全都是大菜硬菜,这每道菜也都是山东人的心头爱!下面我就和大家分享一下,赶紧看看您吃过哪几道?1、德州扒鸡德州扒……早餐光吃牛奶鸡蛋就很健康?错!这5个不健康的早餐搭配别再吃了许多人有不吃早餐的习惯要么起不来,起来忙着赶路一不留神早餐就拖到中午了殊不知长时间不吃早餐可能会给自己埋下健康隐患还有些人虽然吃了早餐看似神……乒乓球世界杯两场31!日本削球名将晋级,决战王艺迪争女单四强2021年12月4日,乒乓球WTT世界杯决赛继续进行,首场单打14决赛对阵出炉,国乒名将王艺迪31淘汰波多黎各选手迪亚兹,第二轮对阵佐藤瞳,争夺一个四强席位,王艺迪将遭遇外战考……刘诗雯再次落选国乒大名单!31岁公布生涯目标,刘国梁真没看错在国际乒联修改积分制度后,国乒球联为了弥补比赛空白期,推出了一系列的比赛,尽全力提高选手的积分。据媒体爆料,面对小比赛,国乒选择替补队员和年轻队员,但是在首届冠军赛中,将所有主……台湾人怎么称呼出租车司机?那年,我到台湾省旅游。第一次到台北,对什么都感兴趣譬如说,北京洗车的价格是越来越贵,就特别想知道在台北洗一次车要多少钱。图中的加油站附设洗车行,加油与不加油洗车的价格略有不同。……央视5将直播中国男篮对伊朗,能否拿到世界杯门票?世预赛中国男篮比赛时间确定,CCTV5直播!中国男篮11月7日(星期一)启程乘飞机前往伊朗首都德黑兰!2023年男篮世界杯预选赛第五窗口的赛程:一、北京时间1……比利时运气爆棚!门将扑点小胜对手,场外与俄贸易躲过制裁比利时与加拿大的这场对阵略显平淡,但也留下了一个让人印象深刻的精彩画面。比赛中,加拿大队一度获得点球有望先声夺人,无奈比利时门将库尔图瓦发挥神勇,将点球拒之门外,逃过一劫……2月11日,中国传来12个消息真没想到,2月11日,中国传来的这12个好消息这么给力。相信大家看后,估计悬着的心,都可以妥妥地安顿下来了。我知道,也许大家看了消息过后,情绪方面可能会出现些许小波动,所以希望……售后成决定性因素,手机市场小米做表率成苹果最强对手苹果近几年不得不说在口碑和销量这块下滑还是相当明显的,准确来说是从iPhoneX之后开始苹果似乎就已经忘了立本的东西。反观国内的手机厂商,虽然华为的陨落让人惋惜,但小米的崛起也……一千块去老挝能呆多久?看完特想去对于喜欢追求新鲜感的人而言,旅游无疑是一个很好的选择,这个休闲方式不仅可以放松自己,还能让整个人的人生观、世界观都朝着更良好的角度改变。不少中国人在选择外出旅游地时,首先……甘肃让你最难忘的美食是什么?分享舌尖上的甘肃丝绸路上的美食长廊!《舌尖上的中国》,一部探讨中国人与美食关系的食物纪录片。这部纪录片以追溯美食的诞生为契机,以伴随人们生活的食物为话题,为世界打开了一扇……有没有一种美食总是让你魂牵梦绕?你还记得小时候吃过的油油饭吗?在奶奶家常吃的一种家常饭,猪油、酱油搅拌其中,热气腾腾的香味总是先发制人,让人垂涎欲滴!放学的时候,总是飞奔着跑回家,大声嚷嚷着:油油……
鸡内金怎么吃正确?鸡内金怎么吃正确鸡内金药用,可以煎汤服用,也可以研末服用,研末服用效果比较好。鸡内金具有消食健胃、涩精止遗、通淋化石的功效,对饮食积滞、肾虚遗精、结石症等有很好的治……齐鲁青未了时光里的薄荷味作者耿艳菊有一年,小姨从城里回来,给我们带了一包糖。小姨说,是薄荷糖呢。小姨的眼里竟然还闪着光。我一听薄荷二字,本来像阳光般在花枝上跳来跳去的欢欣,呼啦啦落了一地。薄荷有……iQOO9Pro评测这才是真正的驯龙高手近日,iQOO正式发布了全新一代iQOO9系列旗舰,优秀的屏幕,顶级的处理器,最新的闪存规格,还有全新首发的GN5主摄说实在的,我和大家一样好奇,因为iQOO8Pro在各方面配……卤水第二锅加盐怎么加?谢邀回答。卤水第二锅加盐怎么加?我觉得这得分两种情况,一种是调味以盐为主的卤水,第二种是增加酱类或者酱油类的卤水。每一种卤水的盐量添加是不一样的。下面就以我的经验跟大家介……徐州最具代表特色的菜是什么呢?在外地,最想念的就是家乡的美食,还有很多是在外地吃不到的,现在把我最怀念的家乡美食列出来,看看老家人有没有共鸣哈!徐州人爱吃羊肉,所以徐州有伏羊节,徐州人夏吃三伏,冬吃三……体内寒湿感觉自己气血不足?常喝一杯茶,气血充盈活力无限气血不足,会给健康带来很多麻烦,然而有些麻烦是看不见的,只有生病的时候,才会知道自己需要补充气血。同时,寒湿分布多,也会给身体带来一样的麻烦,这些看不见的麻烦,是被中医视为健康……观察中超场边挂遗像到底侮辱了谁?半岛全媒体记者刘礼智8月31日,中超官方一条声明,把中国足球又推到了风口浪尖之上。中超联赛委员会声明说,2022年8月5日,中超联赛时隔978天终于重新回归了主客场……怎么让果子膨大不软?你好,我是倪氏农丰,很高兴回答你的问题!怎么让果子膨大不软?我是种桃子的,我的大棚桃子卖了半个月了,桃子的硬度非常好,深受客户的喜爱,因为客户要把桃子运输的全国各地,只有……为什么北方偏瘫的人多,而南方却很少?偏瘫的发生,多与脑梗、脑出血等心脑血管疾病有关,属于较严重的后遗症,严重影响患者及家人的生活质量与经济负担。而为什么北方偏瘫的人比南方多?这个结论笔者并没有找到明确的依旧……你吃过哪些让人看了就惊悚的菜?山东一些地区吃的大青虫。早些年经常去山东,朋友请吃饭时,常点当地的特色美食:油炸蚱蜢和大青虫。我一看就心悚了。因我最怕软体生物,如蚯蚓和豆虫之类。大青虫主要生……烟台美食山麻楂大包子你吃过吗?山麻楂,学名山苜楂,多年生草本植,主要食其鲜嫩茎叶。山麻楂是一种山野菜,实际上它就是一种多年生的草本植物。多分布于华东北部,胶东半岛山上随处可见。山麻楂一般在开春的时候,……六旬冒险者完全依靠人力独自航行全球,目的攀登六大洲最高峰埃尔登埃鲁克(ErdenEruc)是土耳其裔美国探险者,最近他中止了他梦寐以求的六峰攀登计划。从2003年开始,他一直试图依靠人力到达所有大洲的最高峰(南极洲文森峰除外),然后……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网