每日HackerNews RSS

## 使用 Ollama 降低 Claude 代码费用 本教程详细介绍了如何通过 Ollama(一个运行开源大型语言模型平台)大幅降低 Claude 代码费用(高达 90%)。该策略利用两者的优势:使用 Anthropic 的 Claude Desktop (Pro) 进行高级思考和规划,同时将资源密集型任务(如代码检查、重构和批量文件操作)卸载到免费的、本地运行或云托管的开源模型(如 Gemma、Qwen 或 DeepSeek)通过 Ollama 实现。 一个 21 页的视觉教程 ([coherencedaddy.com/tutorials/use-ollama-to-enhance-claude](coherencedaddy.com/tutorials/use-ollama-to-enhance-claude)) 和一个便捷的复制粘贴提示可以自动化在 macOS、Windows (WSL2) 和 Linux 上的设置过程。该系统验证两个引擎可以并排工作,确保具有统一用户界面的无缝体验——同时大幅降低您的 AI 成本。该项目是开源的(MIT 许可证),并可在 GitHub 上获取。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 通过 Ollama 路由 Claude 代码的成本计算 (~90% 的节省) (github.com/coherence-daddy) 9 分,CoherenceDaddy 发表于 1 小时前 | 隐藏 | 过去 | 收藏 | 2 条评论 帮助 irishcoffee 发表于 5 分钟前 | 下一个 [–] > 像 lint、重构、文件批量操作和 grep-and-replace 这样的上下文密集型任务可以在几天内耗尽你的月度限制。 Grep-and-replace?你的意思是 sed?人们用 tokens 代替使用 sed?真诚地提问。回复 fxtentacle 发表于 2 分钟前 | 父评论 | 下一个 [–] AI 初学者将 Opus 作为 grep/sed 的替代品。 平庸的程序员用 AI 为他们编写 sed 一行命令,然后吹嘘 AI 生产力提升。 而专家直接使用 sed,然后他们想知道为什么其他人对 AI 如此狂热。回复 考虑申请 YC 2026 年夏季批次!申请截止至 5 月 4 日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

最近测试的一颗Athlon 1200 CPU(雷鸟核心)显示出一种异常:一个之前未记录的CPUID位(CPUID leaf 80000001h寄存器EDX中的第18位)被设置。虽然AMD文档中官方将其列为“保留”,但调查表明它最初指示了ECC(纠错码)内存能力。 早期的AMD芯片组和Slot A Athlon *确实*支持ECC,但AMD似乎在2000年末/2001年初放弃了对雷鸟Athlon的官方支持,这与他们数据手册的修订时间相吻合。CPUID位仍然存在,造成了差异。后来,ECC支持与多处理器能力(第19位)在Athlon MP系列中整合。 可能的原因是AMD最初计划为K7处理器提供更广泛的ECC支持,但最终放弃了,使该位变得过时。使用非AMD芯片组的主板反正也不支持ECC,而且典型的Athlon用户更看重性能而不是可靠性。作者怀疑设置了第18位的CPU *可以*支持ECC,但验证起来很困难,因为测试板即使安装了兼容的Athlon MP,也无法在启用ECC的情况下启动。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 神秘Cpuid位 (os2museum.com) 5 分,由 userbinator 1小时前发布 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 考虑申请YC 2026年夏季项目!申请截止至5月4日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

## AI成本与效率问题 一则Hacker News讨论强调了对使用AI,特别是大型语言模型(LLM)的成本,目前*高于*雇佣人工的担忧。 许多评论指出,由于输入结构不良和重复循环,即使对于简单的任务,LLM处理的“token”(单位)使用效率低下。 问题不在于这项技术的潜力,而在于其当前的实施方式。 许多工程师正在将AI用于传统脚本可以轻松处理的任务,这是受到管理层压力,要求采用AI但未优先考虑成本效益所致。 有些甚至看到客户试图利用AI的进步来*降低*费用,尽管AI存在局限性和不准确性。 用户认为,一种“创业”心态正在出现,公司正在大力投资以证明AI的可行性,希望未来的迭代会变得更有效率。 另一些人则提倡*现在*通过更好的规划和工具来优化AI的使用,认为token效率是盈利的关键。 最终,这场讨论质疑AI是否能够兑现其承诺,或者由于成本居高不下且生产力提升未经证实而面临放缓。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 夏威夷大学古巴卫星任务与总线设计指南 (hawaii.edu) 6 分,来自 o4c 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 考虑申请YC 2026年夏季项目!申请截止至5月4日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系方式 搜索:

史诗研究:自2018年以来,用于心血管疾病一级预防的低剂量阿司匹林使用量下降了一半以上。 您需要启用JavaScript才能查看此页面。 史诗研究无法使用Internet Explorer查看。请尝试使用其他浏览器访问。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 低剂量阿司匹林用于一级预防的使用量自2018年以来下降了>50% (epicresearch.org) 6点 由 salkahfi 2小时前 | 隐藏 | 过去 | 收藏 | 1条评论 帮助 Herodotus38 8分钟前 [–] 很高兴看到一个具体的例子,证明医生在证据表明需要改变时做出了改变。回复 考虑申请YC 2026年夏季项目!申请截止至5月4日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## Flipdisc 显示屏项目总结 该项目详细介绍了使用翻转盘技术构建的大型互动墙面显示屏——一种使用电磁圆盘在两种颜色之间翻转的80年前的系统。制作者寻求LED屏幕的替代方案,欣赏翻转盘的可读性、寿命(25-60fps)以及独特而舒缓的“雨声”。 该显示屏使用了九个 Alfazeta 面板(总共 84x42 个圆盘),由 ATMEGA128 微控制器和查理复用 MELF 二极管控制。供电需要 24V 10A,框架由 80/20 铝挤压型材构成。通信通过 RS485 进行,并使用自定义 Node.js 库通过 RLE 压缩传输图像数据。 软件开发涉及 Nvidia Orin Nano 用于处理,利用 PIXI、Three.js 和 Google 的 MediaPipe 等 Web 技术进行实时可视化和用户交互。REST API 和 WebSocket 连接管理场景,Expo 应用程序提供用户界面以进行控制和自定义。 该项目强调了组件采购方面的挑战以及翻转盘作为独特显示介质的潜力,并希望未来能够提高其可访问性和负担能力。

Hacker News新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录 Flipdiscs (flipdisc.io) 20 分,skogstokig 1小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 kaipereira 0分钟前 [–] 这太酷了,它们发出的声音也很令人满意!整个项目的成本/时间分解是什么,因为翻转盘的价格隐藏在报价中,而且完成整个显示屏似乎需要花费大量时间!回复 考虑申请YC 2026年夏季项目!申请截止至5月4日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 证书撤销的演变 证书撤销——在数字证书自然过期前将其标记为不可信的过程——仍然是互联网安全中一个复杂且存在问题的重要领域。虽然它是公钥基础设施(PKI)的基础,并支持在线信任,但有效的撤销实施一直很困难。 历史上,证书撤销列表(CRL)是标准,但其大小和分发挑战导致了在线证书状态协议(OCSP)的采用。然而,OCSP 引入了隐私问题和性能问题。“OCSP Stapling”试图通过让服务器提供预签名的 OCSP 响应来缓解这些问题,但即使这样也不是一个完美的解决方案。 目前,浏览器对撤销的处理方式不一致。Chrome 大部分情况下忽略它,依赖于专有的、精简的列表,而 Safari 和 Firefox 则尝试进行 OCSP 检查。核心问题仍然是:撤销和广泛认知之间存在滞后,从而留下了被利用的窗口。 业界正朝着更短的证书有效期(现在 Let’s Encrypt 为 45 天)和改进的 CRL 管理(如 Mozilla 的 CRLite)方向发展。然而,真正及时的解决方案仍然难以捉摸。一些人建议利用 DNS 来进行证书状态管理,借鉴其高效的更新机制。最终,这一挑战凸显了一种根本性的矛盾:长期有效的证书提供了便利性,但需要强大(且目前缺乏)的撤销能力。未来可能在于完全放弃长期有效的证书,优先考虑速度和敏捷性,而不是持久性。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 X.509 证书吊销 (apnic.net) 6 分,由 jandeboevrie 1 小时前发布 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 考虑申请 YC 2026 年夏季批次!申请截止至 5 月 4 日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

## Gemini Nano 提示词 API:摘要 提示词 API 将 Gemini Nano 的 AI 能力直接带到浏览器,使开发者能够构建诸如 AI 驱动的搜索、个性化信息流和自动化内容处理等功能——所有都在客户端进行。它允许在本地处理自然语言请求,无需将数据发送到 Google。 **主要特性与要求:** * **功能:**支持文本、图像和音频输入(音频需要 GPU),用于诸如摘要、改写和内容创作等任务。 * **兼容性:**适用于 Windows 10/11、macOS 13+、Linux 和 Chromebook Plus 设备(仅 Chrome 浏览器)。需要至少 22GB 的可用存储空间以及强大的 CPU/GPU。 * **使用:**开发者必须确认 Google 的 AI 政策并管理会话上下文,以避免超过 token 限制。提供诸如流式响应和 JSON 模式约束等功能。 * **本地处理:**模型初始时下载,之后即可离线运行,确保隐私。 **入门:** 开发者可以通过 Chrome 标记在 localhost 上进行测试。提供演示和代码示例,并鼓励提供反馈以塑造 API 的未来发展。 **重要提示:**该 API 仍在开发中,性能优化正在进行中。

对不起。

## Evanflow:基于TDD的开发循环,由Claude Code驱动 Evanflow是一个结构化的、迭代的软件开发流程,专为与Claude Code配合使用而设计,利用16项技能和2个定制子代理,引导项目从头脑风暴到实施。该循环以“让我们evanflow一下”开始,依次进行头脑风暴、计划、执行、TDD和迭代阶段——始终在设计和计划批准以及每次迭代后进行人工检查点。 至关重要的是,Evanflow *不会* 自动驾驶开发。它在每次潜在的git操作前都会暂停,等待您的明确指示——没有自动提交或强制流程。该系统优先考虑有纪律的迭代,专注于垂直切片TDD,并结合检查以防止常见的LLM失败模式(幻觉、范围蔓延、上下文漂移)。 对于复杂的任务,Evanflow可以利用编码员/监督员代理并行编码,并通过集成测试确保代码质量。它可以通过Claude Code插件、CLI或手动设置进行安装,并内置了防止危险git命令的安全措施。Evanflow旨在成为一个强大但受控的助手——一个指挥家,而不是自动驾驶仪——用于构建健壮的软件。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 EvanFlow – 一种为 Claude 代码设计的 TDD 驱动的反馈循环 (github.com/evanklem) 13 分,由 evanklem2004 发布 1 小时前 | 隐藏 | 过去 | 收藏 | 4 条评论 帮助 s20n 16 分钟前 | 下一个 [–] EvanFlow - 想法像蝴蝶一样飞来?回复 bseitz 13 分钟前 | 父评论 | 下一个 [–] 哦,他不知道,所以他把它们赶走 jamesbfb 6 分钟前 | 根评论 | 父评论 | 下一个 [–] Oooohhhh 回复 jtfrench 28 分钟前 | 上一个 | 下一个 [–] 在循环时,如何处理“愚蠢区域”规避?回复 考虑申请 YC 2026 夏季批次!申请截止至 5 月 4 日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

## TurboQuant:高性能向量量化 TurboQuant 是一种新颖的向量量化技术,可实现对现代语言模型(如 KV 缓存和嵌入)中使用的长向量的近乎最优压缩——将坐标压缩到 2-4 位,*无需*校准或每块元数据。其核心思想利用随机旋转:这会将任何输入向量转换为每个坐标遵循可预测分布的形式。然后,可以使用为该分布设计的单个预计算码本来有效地量化*所有*输入。 该过程包括旋转向量,使用此通用码本(通过 Lloyd-Max 优化构建)量化每个坐标,并可选地应用最终校正步骤 (QJL) 以消除内积偏差。这种方法避免了现有方法(如 GPTQ)的元数据开销,在存储空间显著减少的同时,实现了相当的质量。 TurboQuant 在 LLM 推理和向量搜索任务中证明了与现有方法相匹配或超越的性能,在保持准确性的同时,提供了显着的加速和内存节省——非常接近香农定理所规定的压缩理论极限。它通过将问题简化为高效的标量量化来实现这一点,这得益于初始的随机旋转。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 TurboQuant: 一种基于第一性原理的讲解 (arkaung.github.io) 15 分,由 kweezar 1小时前发布 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 linuxhansl 8分钟前 | 下一个 [–] 我对这个以及类似的研究(RotorQuant等)很着迷。 看起来明年我们就能在去年的硬件上运行今年的最大模型。 :) 也许我们不需要那么多数据中心和电力。 也许我们可以在本地运行更强大的模型。回复 考虑申请YC 2026年夏季项目!申请截止至5月4日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

更多

联系我们 contact @ memedata.com