ChatGPT Images 2.0 正式发布!免费可用,OpenAI 最强图片模型!效果到底有多强?| 零度解说
By 零度解说
Summary
Topics Covered
- AI图片生成已到达以假乱真的临界点
- 文字生成终于解决了AI图片的致命弱点
- 一张普通照片加一句话就能秒变商业大片
- 内容创作者正面临AI带来的降维打击
- AI已能直接生成可打印的传统国画级别作品
Full Transcript
大家好 这里是零度解说 就在今天 OpenAI最新一代图片生成模型 ChatGPT Images 2.0正式发布了 这是目前它最先进的图片生成模型 确实非常强 只需要简单的提示词 就可以生成高质量的图片 而且很多图片 越来越感受不到是AI生成的 真正可以做到以假乱真 效果非常赞 关键是它目前向所有用户都是开放的 人人都可以使用 相比上一代模型
ChatGPT Images 2.0 它能够处理更加复杂的视觉任务 并生成精准可立即使用的图片 而且具有更高的精度和控制力 最高支持2K的分辨率输出 渲染细微元素更加精准 比如小文本 图标 UI元素 密集构图 还有多种风格设置 它都可以完成 同时具备更强的跨语言能力 尤其像在日语 韩语 中文 印地语 孟加拉语等方面 它不仅能够正确渲染
带有非英文文本的图像 而且还能使语言流畅贯通 再也不用担心像之前那样 出现各种乱七八糟的文本了 而且Images 2.0在各种视觉风格上 都展现出更高级的保真度 这对游戏原形设计 故事版绘制 营销创意 以及特定媒介或类型素材创作 尤为重要 而且生成的图片更具写实主义 比如这种生成类似抓拍的照片 如果不告诉你这是AI生成的
估计很多人都会以为这是手机抓拍的 还有像这种超现实主义肖像 粗粝电影现实主义 演讲人照片 手机拍摄的外星人 时尚杂志 以及像这种使用一次性相机 拍摄的一张逼真的快照 展现着虚构的2000年代初 美国高中电影实验室里的场景 看着非常真实 还有像这种街头摄影等等 它都可以轻松驾驭 生成款式也非常丰富 比如这种日本青年漫画 电影海报
仿20世纪中期的粉彩漫画 现代独立漫画 还有角色卡 工作室装饰壁画等等 生成效果都非常不错 而且支持灵活的高宽比 无论是延时摄影风 iPhone全景 国画 故事书排版等等 应有尽有 同时它对现实世界的理解更加自然 这个Images 2.0 它将更贴近时代的视觉认知 融入图像创作 这对于解释性图像 教育图表
和视觉摘要等作品尤为重要 因为在这些作品中 准确性和清晰度 和美观性同等重要 它的自然视觉能够熟练地处理 端到端的任务 比如综合信息 撰写故事 并以清晰的结构 有意的留白 和强烈的视觉流畅性进行布局 接下来我们实际演示一下 看下它生成效果到底如何 目前我用的是免费账号 我先来试一下 比如先让它一句话生成图像 我就输入一个简单的提示词 就让它帮我创建一个
极简风格的科技产品海报 黑色背景 发光边缘 类似于苹果发布会 我们来试下效果到底如何 我们直接点击发送一下 它现在开始了 正在创建图片 我们稍等一会 我现在来看一下 它目前生成图片需要多长时间 大概10秒钟左右它就搞定了 那看一下 现在我们来看一下 这是它生成的效果 这张iPhone 16 Pro的照片 目前无论是它生成速度 还有构图都非常清晰 大家注意啊 这里我没提供复杂的提示词
它就已经做到这种帮我补全这个设计逻辑了 这比以前确实强多了 同时它上方提供一个不同宽高比选项 如果你不满意的话 那么可以根据自己需求 来选择不同的宽高比 目前总共有10个选项 像方形的 竖屏 故事 超宽屏 宽屏 竖屏等等 都是可以自由切换的 那接下来我们测试一下 它精准控制能力 比如现在我输入要求 就是一个电商主图 白色背景 产品居中 带有阴影
文字写着 限时优惠50% 字体现代简洁 就这么简单的提示词 我们发送一下 看下它会生成什么样的图片 过几秒钟它现在已经完成了 大家看下效果 这个文字生成没问题啊 限时优惠50% OFF 都是按我要求来设计的 关键是没有任何错别字 在文字生成方面稳如可靠 而且排版能力 商用感 都非常精准 这一点非常关键 以前像AI最大的问题 就是文字会崩溃
它会生成一些乱七八糟的文字 但现在已经可以用来 直接做这个电商图片了 这一点确实非常可以啊 同时我们可以在上面进行微调 比如让它把那个表带改成黑色的 输入要求以后我们点击发送一下 来看下它行不行啊 大家看下效果到底如何 搜尾中 你看马上就好了 大家可以看一下 立马搞定了 非常完美啊 大家看这原图 我刚才只大致圈选那个表带 让它把表带改成黑色的 它立马就可以搞定了 其他元素都没有改变
就按我的要求改了表带 精准控制能力方面可以啊 然后现在我随便拍张照片 让它帮我改下图片 我拍照一下 那现在我拿一张我的自拍照 让它帮我修改一下 那先把图片上传给它 我们点击上传图片 那现在我输入要求 就让它把背景换成高级感的工作室 把人物换成西装 然后增加电影灯光效果 那么发给它 看下它会生成什么样的图片 正在创建图片 我们稍等一会儿 这么快就完成了 大家可以看一下
它头上那个灯光还有这个 肩膀上灯光打光确实是可以的 然后背景也它给我替换了 那左侧的话是主光灯 右侧的话 右侧的话是辅光灯 头上还有一个打光灯 相当可以啊 而且人物角色一致性没问题 同时也按我要求把西装给换上去了 这个功能已经非常接近PS加AI组合了 也就意味着 只需一张普通照片加一句话 它就可以帮你秒变成商业大片 接下来我们再测试一下它风格修改
比如我们拿这张图片来做测试 就让它帮我把图片 改成赛博朋克风格 我们来试一下效果 发给它 那现在我输入要求 改成这个赛博朋克 那么点击发送一下 正在开始创建图片 大家可以看一下 立马就完成了 它上面用的是日文啊 我们可以让它把这文字改成中文 立马就可以搞定了 都可以进行微调 同时也支持对批量图片进行修改 比如现在我让它把这三张图片 改成漫画风格的
我们来看一下效果怎么样 它打好场景了 打磨细节 我是同时给它三张图片啊 大家可以看一下 立马搞定了 确实非常可以啊 大家看一下这原图 然后这是它按我要求 生成的漫画图片 原先内容不变 风格完全重做 这对于那些做内容创作的人来说啊 绝对是降维打击啊 比如现在我输入一个简单的要求 就让它根据这三个漫画 设计出一个带故事情节的 动画绘本 就这么一个简单的要求啊
我们看下最终效果怎么样 就让它根据这三个漫画 来设计出一个带故事情节的动画绘本 就类似带文字的连环画 我们先来看一下它怎么想的 它现在开始做最后的微调了 我们来看一下它是怎么理解的 这完全是三个不相关的角色 大家看一下 它立马也搞定了 大家可以看一下 第一个是初遇 它下面还有解释啊 就这个女的 它是一步步的故事情节的 然后第四个是挫折 第五是守护
第六是成长 然后第七步是尾声 它的故事情节我倒是不想看啊 我主要是想看一下它的文字啊 大家可以看一下 我仔细看了一下 没有一个错别字啊 这个确实比以前强多了 因为上一个版本ChatGPT图像生成模型啊 它对中文理解不是很强 经常会出现这个错别字啊 但现在 100%完全正确 没有一个错别字啊 同时我让它帮我生成一个 你认为最好看的中国 日本 韩国美女各一张
我们来看一下最终效果怎么样 这是它生成的图片 第一个是中国的 第二个是日本的 第三个是韩国的 说句实在话 这个第一张还有第三张 这个生成的图片 这个AI味道还是比较浓的 第二张稍微好一点 但是我把提示词优化以后 我增加了要求 让它生成图片更加真实一点 这样的话生成图片就没什么AI味道了 感觉像是真人拍摄一样的 然后接下来我给大家提供一个 万能的结构提示词
就这个主体加风格加场景 加光影加细节加用途 就可以按我要求生成我需要的图片 比如现在输入要求 就是一款高端智能眼镜 这就是主体 还有风格是未来科技风 场景的话是深色背景 光影 比如霓虹灯光效 还有细节 还有用途 这样的话通过我们这个万能结构 你就可以生成一个万能的商业图片了 大家看下效果 所以说你只要记住这个结构 它基本就不会翻车
生成国画也一样没问题 比如现在让它帮我生成一个 清明上河图 宽幅的 我们来看一下效果 哇 非常可以啊 给力啊 大家看一下这个效果 都可以直接打印出来当壁画了 大家看下效果 是不是跟真的一样啊 相当可以啊 清明上河图 给它打个钢印 比如让它把这个图片设置成壁画 挂在墙上3D字图 给我看下效果 这样我们可以先看效果啊 如果喜欢可以直接把它打印出来 当成壁画 那以后做这个壁画的话
那更加简单了 几乎没什么成本啊 大家看一下效果 它立马出来了 大家看一下它目前都没有水印的 非常漂亮啊 这原图 然后这是它按我要求 把这做成壁画的样子 展示给我们看 更多好玩的大家可以自己去尝试啊 好 今天视频所用的全部资料 它们的下载链接 我都放在视频下方还有零度博客上
Loading video analysis...