OpenAI刚刚发布了Dall-E3它正在进行一些重大升级
OpenAI是为ChatGPT提供支持的大语言模型(LLM)的巨大成功背后的公司,它正准备通过新发布的图像生成模型Dall-E再次提升自己的实力。Dall-E2不再是该公司最前沿的选择。认识Dall-E3。
据OpenAI称,Dall-E3继承了该公司从Dall-E2中学到的一切,并将其图像生成能力推向了新的水平。
“在图像内和手等人体细节中生成文本时,Dall-E3比DALL·E2有了显着改进,”OpenAI在其博客中解释道。
值得注意的是,新版本将允许用户生成直接嵌入图像本身的可读文本,这将有助于使其与Ideogram等服务更具竞争力,Ideogram是谷歌前员工上个月推出的一家初创公司。总而言之,Dall-E3将允许图像生成在图像中包含文本和版式。
这个即将发布的版本的发布令人兴奋,特别是如果从GPT-3.5到GPT-4的增强能够表明OpenAI已经取得了多大的进步。OpenAI继续训练其人工智能系统并对其进行改进,使它们对用户输入的响应更加灵敏。当然,AI还远未完美,无法保证Dall-E3对提示的反应有多好。
Dall-E3中的另一项重大更新应该允许用户从图像生成中看到更可靠的响应,从而使他们能够进一步确定图像中的对象和人物之间的相对位置,这是Midjourney等其他系统难以解决的问题。
该公司提供了一个示例屏幕截图,这似乎确实表明了在提示中提供此类说明的有效性。然而,正如过去使用过人工智能提示的任何人都会告诉你的那样,这一切都取决于计算出创建这个完美的示例图像需要进行多少次尝试。
Dall-E3很快将向ChatGPTPlus和ChatGPTEnterprise的订阅者提供。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。