原文
| |||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||
![]() |
原始链接: https://news.ycombinator.com/item?id=43474112
Hacker News 用户正在讨论 OpenAI 新的 40 亿参数图像生成能力。最初的反应褒贬不一,一些人对最初的结果印象不佳,并指出了文本生成的不足。一些用户将其与 FLUX 不利对比。 其他人则指出图像生成速度缓慢,估计每张图像大约需要 30 秒,并推测它使用了类似 DALL-E 的基于 token 的解码方法。这与 Google 的 Gemini 形成对比,Gemini 可以更快地生成和编辑图像。缺乏 readily available 的 API 和预期的较高成本也是令人担忧的问题。 一些人认为发布时机与 Google Gemini 2.5 的发布相吻合,这种情况以前也发生过几次。一位用户认为,ChatGPT 新的、广泛可用的图像生成功能将严重影响小型 AI 图像生成初创公司和数字艺术家,创造一个简单的“表情包生成器”。他们希望开发一个免费且快速的开源模型来竞争。总的来说,生成的图像的文本连贯性和质量比之前的迭代更好。
| |||||||||||||||||||||||||||||||||||||||
| |||||||||||||||||||||||||||||||||||||||
![]() |
reply