一种名为“底稿法”的新技术,显著提高了人工智能生成图像中文字和数字的准确性,甚至超越了最近的进展,如ChatGPT-Images-2和Gemini 3.0 Pro。该方法利用了不同类型人工智能的优势:确定性工具用于精确性,生成模型用于艺术性。
它包含一个两步过程。首先,使用代码生成人工智能(如Claude)创建包含精确文本/数字的轮廓(“底稿”),并将其导出为图像(例如,SVG)。其次,将此底稿*连同*风格提示一起输入到图像生成模型(如Gemini),指示它在准确的基础之上“绘制”所需的视觉风格。
这种方法克服了人工智能难以准确描绘数字和文本的常见问题。虽然并非万无一失,但该方法明显产生更可靠的结果,作者认为这是一个足够简单的概念,很快将被集成到标准的图像生成工具中。
在macOS上创建`.tar.gz`文件,用于部署到Linux服务器时,用户在解压时经常会遇到警告或错误,这是由于默认的`bsdtar`工具添加了macOS特定的扩展属性造成的。这些属性会创建重复的文件(前缀为`._`),并触发“忽略未知的扩展头关键字”警告。
有三种主要的解决方案:
1. **`--no-xattrs`:** 在创建tar包时包含`--no-xattrs`(例如,`tar -cvzf --no-xattrs pix.tar.gz pix`),以防止添加这些属性。
2. **`--disable-copyfile`:** 类似于`--no-xattrs`,在创建tar包时使用`--disable-copyfile`(例如,`tar -cvzf --disable-copyfile pix.tar.gz pix`)。
3. **安装`gnu-tar`:** 使用Homebrew(`brew install gnu-tar`)替换默认的`bsdtar`为`gnu-tar`。然后,调整你的`~/.bash_profile`,使`gnu-tar`在系统的PATH中具有更高的优先级。
切换到`gnu-tar`提供了一个永久的解决方案,无需每次创建tar包时都记住额外的标志。这些解决方案可确保创建干净的tar包,在Linux系统上可以无错误地解压。
## DeepSeek V4 Pro:经济实惠的 Claude Code 替代方案
DeepSeek V4 Pro 提供了一个比运行 Claude Code 更经济的选择,Claude Code 是一款强大的自主编码代理。Claude Code 通常每月费用为 200 美元(有使用上限),而 DeepSeek 的性能与之相当,每月仅需 20 美元 – 节省高达 90%。
DeepSeek 在保留 Claude Code 熟悉界面和功能(终端访问、文件编辑、bash、git 等)的同时,替换了 Claude 的后端模型。它通过利用 DeepSeek V4 Pro 实现这一点,在 LiveCodeBench 上获得了 96.4% 的分数,成本为每百万 token 0.87 美元,而 Anthropic 的成本为每百万 token 15 美元。
设置涉及获取 DeepSeek API 密钥并设置环境变量。用户还可以轻松切换到 OpenRouter(每百万 token 0.44 美元)和 Fireworks AI,以进一步优化成本或速度。虽然 DeepSeek 在常规编码任务方面表现出色,但 Claude Opus 在复杂推理方面仍然更胜一筹 – 可以通过后端切换轻松访问。
DeepSeek 的自动缓存进一步降低了成本,尤其是在自主循环中。 局限性包括缺乏图像输入支持和并行工具执行。