近日,人工智能公司OpenAI宣布,开发者可以将文本生成图像模型DALLE2,直接集成到其应用程序和产品中。 OpenAI在官网表示,截至11月3日,已经有超过300万人使用DALLE2,每天创建的图片数量达到400万张。而在9月28日,DALLE2被允许所有人注册并使用,当时用户量有150多万,每天生成的图像约200万张。即在一个月左右的时间里,DALLE2的使用人数和生成图片数量都翻了一倍。 如今当更多开发人员和企业将DALLE2集成到其应用中后,该模型的影响力无疑会进一步扩大。 (来源:OpenAI) 目前,OpenAI已经与一些客户合作。比如,微软正在将DALLE2引入其新发布的Designer图形设计应用程序中,可帮助用户创建专业的社交博文、邀请函、幻灯片设计等。DALLE2也在微软的艺术生成器工具ImageCreator所集成,如果用户没有搜索到他们想要的内容,则可自己创建图像。值得一提的是,微软也是OpenAI的重要资助者。 另外,图片公司Mixtiles正在使用OpenAI开放的API(ApplicationProgramInterface,应用程序接口),生成海报和艺术画作;时装设计公司CALA也正在借助DALLE2生成新的产品构思理念。 目前,通过使用DALLE2的API,可实现3种与图像交互的方法:根据文本提示从头开始创建图像、根据新的文本提示创建现有图像的编辑、创建现有图像的变体。 生成的图像的大小有256x256、512x512或1024x1024像素三种规格。尺寸较小的图像生成速度更快。 图在现有基础上,对图像进行编辑和扩展(来源:OpenAI) OpenAI在官网表示:随着研究的发展,将继续把最先进的技术引入API,包括在图像质量和可用性等方面的进步。我们非常希望看到客户使用DALLE2产生出各种创意。 据了解,DALLE2发布于2022年4月(同年7月进入测试阶段),借助于该模型,用户只需简单输入一些文字描述,就可以将文字描述的场景以图片的形式真实展现出来。目前用户能免费生成一定数量的图像,额外的图像则需要付费。 DALLE2通过一种名为扩散的过程,来理解文本和对应图像间的关系。除了可以生成和编辑图像,它还可以组合概念、属性和样式,并将原始画像进行扩展,从而创建广阔的新构图或生成原图的变体。 (来源:OpenAI) 值得注意的是,当前的文本生成图像AI仍存在一些问题。这些系统可能产出某些有害内容,并在数据使用方面存在着版权和道德风险。 对于此,OpenAI已采取一定措施,来防止DALLE2生成暴力、仇恨或色情图像,像将模型训练数据中的有害内容进行删除,并通过过滤器(还设置了自动化和人工监控系统),禁止生成和上传可能违反其政策的文本提示和图片。 该公司还采取了相关技术来防止现实人物(包括历史公众人物)的面部生成。总之,OpenAI正尽可能减少DALLE2对不良内容的接触。 在官方博文中OpenAI还提到,他们从全球300万使用DALLE2的用户中,得到了很多有关安全方面的经验教训,将继续把信任和安全作为首要任务,以便所有人能够专注于作品构建。 DALLE2系统虽然广受用户欢迎,但文本生成图像模型正在快速发展,它也面临着多方的竞争,像Midjourney和StabilityAI,两者目前对用户的限制较少。 然后,还有一个值得关注的问题是,像DALLE2这样的AI系统,训练所用的数据大都直接来自互联网,包括摄影师、设计人员等的版权作品。 对于自己的作品被使用,艺术家们不仅没有得到补偿,文本生成图像模型还可能会模仿他们的风格,甚至产出侵犯版权的作品。这让很多人类创作者感到不满甚至愤怒。 不过,某些开发文字生成图像系统的公司,例如Shutterstock,最近对外表示正在建立一个贡献者基金,以补偿为训练AI提供数据的个人。 对于提供补偿等解决方案,据悉,OpenAI目前还没有相关计划。该公司负责API的产品经理卢克米勒(LukeMiller)告诉媒体,这是一个非常复杂的问题,需要从很多不同的角度来考虑,公司会从社区等渠道继续寻求用户的反馈。 同时,他也对外提到,用DALLE2创建图像,其实与其他作品的创作过程没有什么不同,人们首先提出自己的想法,并不断进行调整修改,逐渐取得适合自己需求的满意作品。 参考资料: https:openai。comblogdalleapinowavailableinpublicbeta https:beta。openai。comdocsguidesimagesintroduction https:openai。comdalle2 https:www。theverge。com202211323438604texttoimageaiopenaidalleapipublicbetaprice https:venturebeat。comaidalleapireleasedbyopenaiinpublicbeta