百度的文心一言
今天终于排队等到了文心一言的测试资格,做个开箱测试分享给大家
测试1:任务型,文本命令
任务
截图
备注
续写
可能它没理解我的意思
分类
说出了逻辑和结果,效果满意
翻译
文言文的翻译其实比chatGPT要差些,星分翼轸没翻译、襟三江带五湖基本是文言文习惯
测试2:代码能力conda创建python虚拟环境,python版本为3。9
我截图这里还是OK的,但是后面那些有点啰嗦且没实际用处,而且创建完之后也没有提示我activate。比chatGPT要逊色一些。
测试三:角色扮演
进入到角色,内容完整,这个和chatGPT不相上下。我想让你扮演一个电影评论家的角色。你将开发出引人入胜且富有创意的电影评论。你可以涵盖情节、主题和基调、表演和角色、方向、配乐、电影摄影、制作设计等主题,特效、剪辑、节奏、对话。最重要的方面是强调电影给你的感受。真正引起你共鸣的是什么。你也可以批评这部电影。请避免剧透。我的第一个要求是我要为电影《星际穿越》写影评
测试四:推理英国修道士JohnofWorcester在1128年12月8日记录了两个异常大的太阳黑子的出现。五天后,韩国南部观察到了一个明亮的极光。太阳黑子活动通常在平均五天的时间段之后,极光出现。因此,韩国的观测有助于证实JohnofWorcester的观测。以下哪项是正确的,如果是正确的,最能加强这个观点?a)即使在前一周没有重要的太阳黑子活动,极光也有时会发生。b)在JohnofWorcester之前的1000多年中,中国的资料记录了太阳黑子的出现。c)只有大规模的太阳黑子活动才能导致在韩国这样的纬度下看到的极光。d)由于在典型的日光条件下肉眼无法观察到太阳黑子,因此JohnofWorcester记录的观测必须发生在不寻常的天气条件下,如雾或薄云。e)JohnofWorcester的记录包括一个太阳黑子的图画,这可能是太阳黑子活动的最早插图。
可能是Prompt太长了,我问了贝叶斯的题目也是一样,抄了题目就没下文了
题目稍微短一些还OK如果John有5个梨子,吃了2个,又买了5个,然后把3个给了他的朋友,他还剩下多少个梨子?
测试五:知识储备
只有浙大本科专业的回答偏离了题意,其他回答都比较靠谱,这个和chatGPT不相上下。
其他特性:绘画
可以直接聊天绘画,这个比chatGPT体验要好些。
整体生成、推理能力还是可以,复杂任务的解决能力比chatGPT略逊色。但是不用科学上网,已经是很大的优势,给百度点赞。