纠纷奇闻社交美文家庭
投稿投诉
家庭城市
爱好生活
创业男女
能力餐饮
美文职业
心理周易
母婴奇趣
两性技能
社交传统
新闻范文
工作个人
思考社会
作文职场
家居中考
兴趣安全
解密魅力
奇闻笑话
写作笔记
阅读企业
饮食时事
纠纷案例
初中历史
说说童话
乐趣治疗

阿里版ChatGPT就快来了

12月24日 浅时光投稿
  机器之心原创
  作者:杜伟
  每个人都有一个自己的大模型这是一个想象力演示,还是真正的技术发展方向?
  本周,阿里AI会有大动作已经传开了。自去年11月底OpenAI发布ChatGPT以来,大语言模型成为整个AI社区关注的焦点。国外大厂要么在自己的应用中融合ChatGPT(如微软新必应),要么推出对标大模型(如谷歌Bard)。国内也掀起了研发类ChatGPT的热潮,先后出现了ChatYUAN、MOSS、文心一言等文本对话大模型和产品。
  第一个透出的是阿里大模型联合项目团队(以下简称联合团队)调教出了一个有个性的大模型,与脱口秀演员鸟鸟合作训练出她的数字分身鸟鸟分鸟。在这个针对消费级终端的大模型技术交流中,机器之心参与评测了几个重要体验:唤醒一次,即可与鸟鸟分鸟不间断自由语音对话。鸟鸟分鸟很拟人化,拥有了鸟鸟的音色、语气、表达方式。与其他对话机器人一样,可以从鸟鸟分鸟那里了解百科知识,还能在创作时获得灵感。
  鸟鸟是一位脱口秀演员,她在《脱口秀大会第5季》中获得年度亚军,其社恐式脱口秀风格收获了大量粉丝,被称为文本之神、互联网嘴替。
  机器之心还向这个联合团队了解,其研究的特点是两个方面:一是如何让大模型为个人终端、家庭场景等安全高效的服务;二是AIGC以多模态驱动,包括文本、图像、语音、视频。
  由于整个技术接口通过天猫精灵终端进行演示,我们应该可以预期,阿里版ChatGPT应该会融合多种产业场景,推向智能助手和消费终端行业是其中之一。
  鸟鸟分鸟为你说段子、讲名著、辅导写作
  是骡子是马拉出来遛遛,在拿到天猫精灵音箱后,机器之心立即体验了一把鸟鸟分鸟的聊天能力。
  既然是脱口秀演员,那就讲两个段子吧:
  一番体验下来,鸟鸟分鸟超出了预期,就像跟鸟鸟本人交流一样,很有那个味!此外在知识启蒙、共情和创作辅助的多轮对话中带给用户帮助。不过目前能力不稳定,比如让它来段周杰伦的音乐,只能说出几句歌词,没有跳到播放音乐技能。相信后续版本会呈现更好的效果。
  个性化:大模型研究的重要方向
  最近几年,大模型在通识任务上的表现越来越出色,基于超大规模语料训练的大模型在知识评测等任务上超越了人类平均水平。ChatGPT等对话大模型的出现更让人切身感受到AI的智能水平,其回答人类问题的能力令人叹服。然而,目前的通识大模型似乎缺少了个性,当问它的偏好、对某事的看法这类问题时,回答效果就没那么好了。
  因此,在主流通识大模型的基础之上注入个性化是一个重要的探索方向。从相关研究的演进来说,这种个性化大模型在对话场景训练中关注多轮对话中人设一致性、对话风格、逻辑一致性和对话三观以及有偏好的个性化对话。这意味着它们被赋予了相应的角色设定,包括身份、性别、名字、性格、偏好等,并拥有了共情能力。针对个性化大模型的这四个细分方向,学界和业界已经发表过一些相关的观点和论文。
  关于多轮对话中人设一致性,哈工大研究团队在AAAI2019论文〔1〕中提出利用自然语言推理(NLI)技术来解决,将来自响应角色对(responsepersonapairs)的NLI信号作为对话生成过程的奖励。关于对话风格,Meta在论文〔2〕中利用三种可控生成方法(即检索和风格迁移、即插即用和有条件生成器微调)控制开放域对话的风格。关于对话过程中的三观,爱丁堡大学联合DeepMind在论文〔3〕中提出要赋予对话大模型不同的三观。
  最后关于有偏好的个性化对话,华南理工联合清华大学在论文〔4〕中提出了一个基于影视角色的大规模中文个性化和情感对话数据集CPED,它包含了与共情和个人特征相关的多源知识(性别、人格特质、情感等)。该研究还强调了说话人个性和情绪在对话式AI中的作用。
  对于阿里而言,这个领域最早可以追溯到2020年其联合南洋理工大学发表在顶会EMNLP2020的论文〔5〕,对基于角色的共情对话模型进行了深入研究。但这篇论文似乎不是今天看到的个性化大模型的同类技术方向。
  为了让大模型更好地符合角色的特点,阿里联合团队这次首次提出了知识、情感、记忆、性格四位一体的个性化大模型方向,相信相关的研究论文应该在路上。
  鸟鸟分鸟不仅要听得清、还要说得像
  融合个性化大模型能力的对话产品在回答问题时会给出符合身份、性格的答案,提升用户的满意度。鸟鸟分鸟正是联合团队在个性化大模型中训练出来的,用了仅仅15天时间完成工程链路。
  整个过程分为了大规模语言训练、知识和工具增强、个性化对话增强和人类反馈增强等四步。
  第一步大规模语言预训练,用到了层次化训练方法,模拟人类学习,从简单知识到专业复杂知识,逐步增加难度。就鸟鸟分鸟而言,联合团队先用大规模语料进行预训练,让大模型学习到足够的世界知识,其中也包含了鸟鸟的公开信息。
  但第一步后发现,每天都会有大量新增和过时的知识,因此把所有知识记下来不是好的选择。联合团队选择使用搜索引擎等工具让大模型能力变得更强,比如利用搜索引擎输入在对搜索结果的理解和归纳基础上更准确和及时地回答问题。这样一来,鸟鸟分鸟可以回答最新信息、新闻等。
  接着第三步,在知识和工具增强的基础上进行个性化对话增强。这里鸟鸟分鸟既要学习多轮对话和启发式对话,具备了较好的多轮一致性和连贯性;又被赋予了人格标签,联合团队标注了少量的鸟鸟语料来做个性化增强和调优,实现了快速的角色复刻。
  最后像不像鸟鸟,人类反馈更直接真实。联合团队利用人类反馈增强做角色强化,检查多个回答候选中哪个更像或不太像鸟鸟、哪个对或不太对。这些反馈和标注对个性化对话大模型进行纠偏,朝着更像鸟鸟的方向正向增强。不过目前联合团队只是基于成员反馈来增强,未来将开放给更多鸟鸟粉丝以收集更多反馈,让鸟鸟分鸟更具真实感。
  语音交互是一项系统性工程,对天猫精灵鸟鸟分鸟而言,不仅要听得清,还要说得像。联合团队在训练鸟鸟分鸟之后,着力在听清、音色和文风几个方面提升它的对话式AI体验。
  首先在对话中让鸟鸟分鸟听清人说的话。联合团队采用了猫耳算法,即准确地听声辨位。一方面做回声消除,设备播放产生的回声会对对话有较大干扰。联合团队结合深度学习方法与传统AEC、多通道立体声消除回声,确保设备只听到人说的话。另一方面是定向拾音,借助设备中的麦克风阵列,在被唤醒时准确识别说话人位置,精准捕捉人声。同时利用降噪消除非人声或远处说话人的声音。
  其次让鸟鸟分鸟的音色接近鸟鸟,这要归功于阿里达摩院自研的声学模型。传统人声定制方案复杂,可能需要收集20个小时的有效录音数据,并以年为周期定制算法,时间成本太高。传统语音合成的声音机械感也强,一听就是机器人的声音。达摩院的KANTTS定制方案只需收集1个小时的鸟鸟有效录音,从录音到训练完成、模型上线差不多一周时间。呈现出的拟人化声音更自然,接近了鸟鸟的音色。
  最后是文本风格。鸟鸟分鸟不仅要在音色上接近鸟鸟,还要沿用她的表达风格。这可以通过人格标签的方式为对话大模型设置角色风格,角色性格开朗则整体给人快乐、乐观的形象。同时在人设描述上进一步约束,比如叫什么、多大了、干什么的、哪里人。联合团队针对鸟鸟分鸟选择了脱口秀演员、内蒙古人、有深度、幽默、内向、90后等标签词。
  另外,在与鸟鸟分鸟的互动中发现,当人说话时,它会发出一些承接词,比如嗯,我在、容我想一想。当它回答上一个问题到一半时,我们还可以打断它直接问下个问题。整体对话时延非常低,基本接近人与人之间的对话。这都要得益于已经在云上运行很久的双工对话系统,使对话体验有了很大提升。善于倾听、增量对话和较低时延成为这种双工对话系统有别于传统对话的几个显著特征。
  整体来看,联合团队致力于四位一体的大模型个性化,从问问题产生Query、利用ASR猫耳算法精确转换成文本、文本又通过通义大模型产生个性化对话回复、最后个性化TTS给出个性化音色(鸟鸟)答案。这个大模型能实现知识、情感、记忆和性格四位一体。
  联合团队还希望鸟鸟分鸟具备长短期记忆,短期要能记住过去三至五轮讲到的话题,并基于这些来回复;长期则是在做好安全隐私共识的基础上,会对用户对话中的偏好、喜欢做什么、吃什么等信息存储下来,在未来对话过程中更加理解用户并产生共情和风格化的对话。
  这样看来,鸟鸟分鸟目前似乎是一个专门部署的大模型,而不是一个大模型进行角色扮演。这背后似乎也暗含着面向未来的探索。如果鸟鸟可以有一个自己的大模型,是不是每个家庭也可以独立部署自己的AIGC智能服务呢?
  参考资料:
  〔1〕HaoyuSongetc。GeneratingPersonaConsistentDialoguesbyExploitingNaturalLanguageInference
  〔2〕EricMichaelSmithattitudeetc。ControllingStyleinGeneratedDialogu
  〔3〕AtoosaKasirzadehetc。InconversationwithArtificialIntelligence:aligninglanguagemodelswithhumanvalues
  〔4〕YirongChenetc。CPED:ALargeScaleChinesePersonalizedandEmotionalDialogueDatasetforConversationalAI
  〔5〕PeixiangZhongetc。TowardsPersonaBasedEmpatheticConversationalModels
投诉 评论 转载

再次把张艺谋导演的创意变成现象,全球最大LED地屏惊艳世界长江日报大武汉客户端2月20日讯(驻京记者柯立)2月20日晚,北京冬奥会在鸟巢闭幕。利亚德集团冬奥会开、闭幕式项目负责人黄一飞激动地告诉长江日报记者:闭幕式依旧简约,鸟巢中仅保……人类知道暴露地球坐标是极其危险的,还让先驱号带上地球坐标?先驱者号就像太平洋的一粒砂它已经不发出任何信号也几乎不怎么反射光体积可能还没有云天明的脑子大但速度可就比云天明慢得多了发射这种微型飞行器和用……苗族女孩的酒不可随意喝,不听导游劝,想走直线很困难在苗族旅行,千万不要随便喝苗族姑娘递来的酒,因为中国小伙不听导游的劝阻,结果走起了猫步。大家都知道,很多少数民族都在推广特色的旅游服务,一方面,为了宣传家乡,另一方面可以……夜来风组诗作者王立文秋日生活打卡季(一)夜来风夜来风,是一只大鸟扇呼着硕大翅膀搅闹得世间昏天黑地辨别不出方向月中,嫦娥花容失色吓得魄散魂飞……美媒科学家发现臭氧层空洞或与极光有关据美国太空网站23日报道,极光在夜空上演壮观的灯光秀,但它们也为臭氧层逐渐遭到蚕食的现状给出了另一个解释。报道称,臭氧层的大部分损耗都应归咎于人类,不过科研人员在观察了一……谷歌Pixel6a惊艳设计曝光,Pixel5史无前例沦为白菜据国外网点gsmarena报道,不少网友认为,谷歌将在5月推出新的Pixel6a,成为其新一代廉价智能手机。值得一提的是,由于Pixel6a新机的曝光,导致Pixel5价……爸妈还在重口味饮食?快转给长辈们看看!我国的中老年人大多数喜欢重口味饮食,这个重口不单指咸辣,还指重油。每天摄入过多油脂会导致老年人肥胖、易患心脏病、脑中风、引发癌症、性格暴躁、消化不良还易引起三高。那如何在……阿里版ChatGPT就快来了机器之心原创作者:杜伟每个人都有一个自己的大模型这是一个想象力演示,还是真正的技术发展方向?本周,阿里AI会有大动作已经传开了。自去年11月底OpenAI发布……揭秘真相,为什么CBA和NBA的球馆效果差距那么大?看完涨知对于经常观看CBA与NBA的比赛的球迷会发现,两个联赛的场地硬件设施之间存在着巨大的差距,现场气氛的营造,观众视觉体验上的差距很大!假如观众只是通过电视转播观看CBA和NBA,……萨克拉门托国王队过去24个赛季常规赛战绩汇总199899赛季(缩水赛季):27胜23负,西部第六,季后赛首轮23不敌犹他爵士199900赛季:44胜38负,西部第八,季后赛首轮23不敌洛杉矶湖人2……2022年换手机首选这三款,性能出色价格良心,入手至少能用三如果你今年有更换手机的打算,不妨考虑一下这三款机型,市场好评率超高,不但性能出色,关键价格还不贵,入手之后至少能用上三五年,入手超划算。第一款:realmeGTNeo3这……今年春天火了一种裙子,叫赫本裙,简约不简单,复古与时尚同在今年春天火了一种裙子:赫本裙,简约不简单,复古与时尚同在。一到春天,各式各样的裙子就被刷屏了,有的看起来温柔娴熟,有的看起来高级大方,而要说最值得入手的一款裙子,那一定非……
曾经堪称国产佳作的三国杀,没想到却成了steam的年度最差作7月国内智能手机销量榜公布,OPPO重回第一,苹果同比大增对面试必问tcp还是一知半解?最浅显易懂的高并发架构TCP知U23国奥中越之战,版权方索要100万美元转播费,还有必要看天然嘌呤大王或被发现,海鲜靠边站,这一素菜不建议吃贾乃亮又出来直播了,直播间5万人,网友为什么不用他的大号?南极洲的夏天是什么样子的?跨越13年体操姐妹花再聚首!从女孩到女神,邓琳琳仍坚守体操事阿的江想终结深圳两连胜,哪怕残血,他也要送吴庆龙一份大礼一次下腰,换来孩子终身瘫痪这些兴趣班,不到年龄千万别急着报报告热词海南实践儋州发展土糖产业带动村民致富还吃上旅游饭2023年春节,不管有钱没钱,这5样零食别错过,营养解馋还实学校的小操场五年级作文奥林匹克森林公园小学五年级寒假作文上海没有结婚怎么办理准生证蔬菜配伍禁忌有哪些呢2047?2048?2077?为什么现在的人,明知自己条件不好,却还是想要买一辆车?暗黑特色传奇,武器附带光暗雷冰火,一个地钉全屏五行属性伤害理化所刘静低熔点金属多孔材料增材制造性能潜在应用与挑战家中出现蚂蚁了该怎么处理怎样防止蚂蚁进入室内呢宝宝不怕冷教案及反思羽西腮红怎么样羽西腮红的色号有哪些懒惰的喵咪咪作文800字

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找美丽时装彩妆资讯历史明星乐活安卓数码常识驾车健康苹果问答网络发型电视车载室内电影游戏科学音乐整形