商汤科技发布日日新大模型体系,含自然语言生成、照片生成服务、感知模型预标注、模型研发。1800亿参数中文语言大模型应用平台商量支持超长文本知识理解,支持问答、理解与生成等中文语言能力。 现场演示用商量写作儿童故事。 4月10日,商汤科技董事长兼CEO徐立在商汤技术交流日上发布日日新大模型体系,取自《礼记大学》,汤之盘铭:苟日新,日日新,又日新。日日新大模型体系包含自然语言生成、照片生成服务、感知模型预标注、模型研发。商汤发布中文语言大模型应用平台商量,1800亿参数中文大语言模型支持超长文本知识理解,支持问答、理解与生成等中文语言能力,可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。 现场演示了中文语言大模型写作广告语、续写儿童故事、编程等。编程核心功能包括代码补全、扩写、翻译、重构、修正,以及注释生成代码、复杂度分析、测试用例生成等。徐立表示,内部实测代码编写效率提升62,HumanEval测试集一次通过率40。2。下一代软件开发范式是AIforAI,代码80AI生成20人工。 商汤科技董事长兼CEO徐立表示,下一代软件开发范式是AIforAI,代码80AI生成20人工。 超10亿参数自研文生图生成模型秒画,支持二次元等多种生成风格。单卡A100支持,2秒生成1张512K分辨率的图片。用户可基于单卡A100自训练。基于平台发布的模型,可设置toB服务API(应用程序编程接口),结合商汤大算力对外提供服务。 现场演示用秒画生成上世纪80年代港风女性图片。 此外,商汤科技对外发布AI数字人视频生成平台如影,以及3D内容生成平台琼宇(场景生成)、格物(物体生成),基于3D内容生成技术对空间和物体复刻与交互。100平方公里城市级生成,琼宇用时2天,具有厘米级重建精度,还原场景的真实细节和光照效果,应用场景涵盖城市及园区数字孪生、建筑设计、影视创作、文旅和电商等。 城市级生成,应用场景涵盖城市及园区数字孪生、建筑设计、影视创作、文旅和电商等。 徐立对澎湃科技(www。thepaper。cn)表示,在这个时间点推出大模型体系,是希望吸引更多下游用户,自然语言模型能够把各种垂直类的任务串联起来,用多模态混合的模式迭代行业场景。通过提供新的多模态训练框架,训练下一个阶段的多模态大模型,通过细分场景端到端的迭代和应用,帮助多模态大模型的发展。目前已有8家商业客户使用商汤多模态训练框架进行大模型训练。我们希望我们的大模型体系能够帮助行业生产出下一代最领先的多模态模型,并且升级性能。