每日HackerNews RSS

## Ollama 0.19:在 Apple Silicon 上更快的大语言模型 Ollama 的最新版本 (0.19) 通过利用 Apple 的 MLX 框架,为在 Apple Silicon 上运行大型语言模型提供了显著的性能提升。这带来了巨大的加速——在 M5 芯片上高达 1810 个 token/秒的预填充速度,这得益于利用 GPU 神经加速器。 主要更新包括对 NVIDIA 的 NVFP4 格式的支持,该格式提供更高质量的响应并减少内存使用,以及改进的缓存机制。这些缓存增强功能——智能检查点、更智能的驱逐和缓存重用——提高了响应速度,尤其是在编码和代理任务中。 Ollama 0.19 最初加速了 Qwen3.5-35B-A3B 模型(针对编码进行了优化),并且需要具有 32GB+ 统一内存的 Mac。未来的开发重点是扩展模型支持并简化自定义模型导入。此版本标志着在 Apple 设备上实现高效强大的本地 LLM 推理迈出了重要一步。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Ollama 现在由 MLX 在 Apple Silicon 上提供预览版 (ollama.com) 14 分,由 redundantly 发表于 52 分钟前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

## 语义代码检索服务概要 该本地 Rust 服务提供确定性的代码检索和智能开发者辅助,专注于超越简单文本搜索的代码语义理解。它索引代码库(使用 SQLite & Tantivy),以支持按符号、代码片段以及逻辑/数据流图进行检索。 主要功能包括一个强大的 API,具有检索端点(`/retrieve`)和意图路由/动作分发端点(`/ide_autoroute`),由两个核心工具通过统一的 MCP 桥接提供支持。可选的项目摘要器生成 LLM 就绪的项目映射,附加的令牌跟踪模块监控使用情况。 最近的开发重点是图语义(控制/数据流、逻辑节点)和模块感知索引,以提高推理和检索能力。一项重大进展是安全的编辑管道,它结合了影响分析、规划和策略执行,以实现可靠的代码修改。 A/B 测试表明,最新的改进显著提高了开发者步骤节省量(高达 27.78%)。该服务优先考虑隐私,提供可配置的遥测选项,并利用环境变量进行配置。 详尽的文档指导与 IDE 的集成,并概述了 API 的使用方法。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Semantic – 通过 AST 逻辑图减少 LLM “代理循环” 27.78% (github.com/concensure) 12 分,由 concensure 39 分钟前发布 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

单元 一个自我复制的 Forth 解释器。 生成 (1/5) 网格 喋语 GitHub crates.io

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 Unit: 一个在浏览器标签页中运行的自我复制 Forth 网状代理 (davidcanhelp.github.io) 5 分,DavidCanHelp 1小时前 | 隐藏 | 过去的 | 收藏 | 1 条评论 帮助 andai 11分钟前 [–] 很有意思。在这个语境下,目标、适应性和变异是什么?回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 阿耳忒弥斯二号:风险重返月球轨道 美国宇航局计划于2026年3月发射阿耳忒弥斯二号,将四名宇航员送往月球周围。然而,在2022年的无人阿耳忒弥斯一号任务后,关于猎户座飞船隔热罩的严重担忧浮出水面。 那次飞行显示,在重返大气层时,隔热罩遭受了显著损坏——大块隔热材料脱落,螺栓腐蚀——损坏程度超过了预测水平。 最初,美国宇航局淡化了这个问题,但监察长报告强调了三个关键风险:隔热层剥落可能导致烧穿,碎片对降落伞舱的冲击损坏,以及螺栓失效可能导致灾难性的车辆解体。 尽管存在这些危险,但由于成本和时间压力,完全重新设计或进行无人测试飞行不可行。 美国宇航局认为,轨迹调整可以减轻剥落,并计划为未来的任务设计新的隔热罩。 包括前宇航员查尔斯·卡玛达在内的专家认为,美国宇航局正在重蹈覆辙——优先考虑时间表而非安全,并依赖于有缺陷的模型——本质上是“靠感觉飞行”。 随着阿耳忒弥斯计划的时间表修订,现在包括近地测试飞行,任务的合理性也受到进一步质疑,这使得载人阿耳忒弥斯二号在降低风险方面变得不必要。 尽管美国宇航局坚持安全性,但人们仍然担心政治和财务压力正在推动一项潜在的危险决定。

一篇最近发表在idlewords.com上的文章引发了对即将到来的阿耳忒弥斯2号任务安全性的担忧。作者认为该任务不安全,从而在Hacker News上引发了讨论。 一些人认为这些担忧是合理的,并暗示美国宇航局可能将形象优先于宇航员的安全——这让人联想到挑战者号灾难。另一些人则质疑作者的可信度,指出他对阿耳忒弥斯计划一直持批评态度。 评论员们争论太空飞行的固有风险,一些人指出阿波罗任务也存在危险。还有人强调了SLS火箭(由航天飞机部件制造)和猎户座飞船的潜在问题,认为它们存在问题历史,并且依赖于可能不可靠的技术。讨论的中心是,考虑到其成本和开发时间表,阿耳忒弥斯2号是否足够安全。

该项目详细介绍了根据简单的手绘草图创建的可定制、3D打印的洞洞板玩具的过程。利用人工智能(Codex)和Python脚本,创作者在Fusion 360中快速生成和迭代设计,与传统CAD方法相比,大大缩短了设计时间。 与手动建模每个零件不同,参数化生成器允许轻松修改和扩展——甚至可以由人工智能代理完成。当前套装包括七个游戏零件、四个齿轮和两个洞洞板,所有都基于40毫米网格系统。 该仓库不仅提供最终的STL文件,还提供用于生成这些文件的Python脚本,以及清晰的说明(“AGENTS.md”),说明如何使用编码代理扩展该套装,添加新的零件、尺寸或功能。这使得玩具具有高度适应性,并鼓励进一步的创造性探索。重点是快速的设计-打印-测试循环,优先考虑游戏和定制。

一位 Hacker News 用户名为 virpo,分享了一个项目,他使用 AI 代理(Codex)将简单的草图快速转化为可 3D 打印的洞洞板,给孩子使用。 他没有手动在 Fusion 360 中设计洞洞板——这个过程需要几个小时——而是简单地向 AI 提供了草图照片和关键尺寸(孔间距和插销宽度)。 在五分钟内,AI 生成了一个可打印的设计,经过一些小的调整后,效果完美。Virpo 已经在 GitHub 上分享了这个项目,供其他人使用和修改。他认为这是一个有趣且“奇怪”的 AI 应用,强调了即使在时间有限的情况下,AI 也能释放创造力,另一位评论者也对此表示赞同,称赞了 LLM 空间中的“代理 x 家长”组合。

## Axios 供应链攻击总结 (2026年3月) 2026年3月,攻击者入侵了一位 Axios 主要维护者的 npm 凭据,发布了流行的 HTTP 客户端库的恶意版本:`[email protected]` 和 `[email protected]`。 攻击绕过了标准的 CI/CD 管道,通过更改维护者的电子邮件后手动发布软件包。 这些版本注入了一个依赖项 `[email protected]`,该依赖项本身并未在 Axios 中使用。 相反,它的 `postinstall` 脚本充当一个跨平台远程访问木马 (RAT) 下发器,目标是 macOS、Windows 和 Linux。 下发器会联系指挥控制服务器,交付特定平台的有效载荷,然后删除自身并替换其 `package.json` 以隐藏入侵证据。 攻击者预先部署了恶意依赖项以避免检测。 受影响的系统应被视为已泄露,需要轮换凭据并分析网络日志。 **用户应立即降级到 `[email protected]` 或 `[email protected]` 并固定这些版本。** 此事件凸显了供应链易受入侵维护者帐户的影响,以及健全安全措施的重要性,包括依赖项监控和网络外向控制。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 Axios 在 NPM 上被攻破 – 恶意版本投放远程访问木马 (stepsecurity.io) 16 分,mtud 34 分钟前 | 隐藏 | 过去的 | 收藏 | 2 评论 帮助 koolba 0 分钟前 | 下一个 [–] > 这两个版本都是使用被攻破的 Axios 主要维护者的 NPM 凭据发布的,绕过了项目的正常 GitHub Actions CI/CD 流程。 NPM 不是从去年开始强制使用 2FA 吗?它是如何被绕过的?回复 mtud 34 分钟前 | 上一个 [–] 供应链问题持续 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

关于按住版权联系我们创作者广告开发者条款隐私政策和安全性YouTube的工作原理测试新功能© 2026 Google LLC

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Clojure: 纪录片,官方预告片 [视频] (youtube.com) 21 分,fogus 发表于 2 小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 铁路事件总结 - 2026年3月30日 铁路于2026年3月30日UTC时间10:42至11:34期间发生一起重大事件,CDN缓存意外地为约0.05%的域名启用,而这些域名用户并未选择启用。这导致潜在的敏感认证数据被提供给未经授权的用户。 问题源于部署到铁路CDN提供商的配置更新。虽然`Set-Cookie`头部未被缓存,但大多数没有特定缓存指令的GET响应都被缓存,导致用户数据泄露。该更改在52分钟内被回滚并清除了缓存。 铁路已实施预防措施,包括加强预生产测试和更慢、分阶段的CDN发布。受影响的用户将直接收到通知。铁路承认此错误的严重性,并将安全性与稳定性置于新功能开发之上,以重建信任并防止未来发生。更多详细信息请参见其状态页面。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 2026年3月30日事件 – 意外CDN缓存 (railway.com) 12点 由 cebert 1小时前 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## CLAUDE.md:减少Claude输出和成本 **CLAUDE.md** 是一个单独的文件,旨在显著减少Claude的冗余性——基准测试中减少约63%——无需任何代码更改。虽然它主要针对输出token的减少(影响成本),但也解决了令人讨厌的倾向,例如过度礼貌、重复问题和不必要的格式。 该文件通过上下文修改Claude的行为,禁止例如谄媚的开场白、空洞的结尾和未经请求的建议等内容。它与模型无关,但主要在Claude上进行了测试。 **最适合:** 自动化、结构化任务以及需要一致输出的团队。 **不适合:** 单个查询、休闲使用或修复模型的基本问题,例如幻觉。 **主要权衡:** 该文件*增加*输入token,因此只有当输出量足够大以抵消此成本时,才能节省成本。 **用法:** 将 `CLAUDE.md` 文件简单地放入您的项目根目录。 预构建的配置适用于编码、代理和分析,或者您可以使用特定规则自定义该文件。 欢迎社区贡献! **在此处查找:** [https://github.com/drona23/claude-token-efficient](https://github.com/drona23/claude-token-efficient)

一个新GitHub项目旨在将Claude的输出令牌减少高达63%,可能降低成本,尤其是在处理大型数据集时。然而,Hacker News上的讨论提出了一个问题:这种简洁性是否会影响更复杂、更具“代理性”的编码任务中的性能。 一些用户认为,Claude的自然冗长性实际上可以*提高*迭代编码项目中的连贯性和决策能力,防止它“迷失方向”,并最终通过更好的结果节省令牌。其他人则分享了管理上下文长度的策略,包括创建会话摘要(“交接”技能)以及利用Headroom、RTK和MemStack等工具来压缩数据并提供持久内存。 一个关键点是,Claude的成本主要由*输入*令牌驱动,而非输出,因此收益可能有限。此外,一些人担心限制输出可能会对模型的整体智能和推理能力产生负面影响。该项目似乎在输出令牌成本是一个重要问题且任务不太依赖于复杂迭代推理的情况下最有益。

丽江黎明前,一名跑者为独自跑步做准备,注重简单和效率。根据预计的跑步中途温度——目前是零下3.9摄氏度,将升至4.4摄氏度——穿着合适的衣物至关重要,分层穿衣以适应变化。携带的装备很少:手持水瓶提供补水,能量胶在短裤口袋里,以及两块手表——一块Garmin用于记录路线/训练,另一块Apple Watch用于听有声读物和通讯。 跑者强调大部分时间“轻松”跑步(80/20原则),以防止受伤并最大化进步,同时结合结构化训练和轻松配速。跑步是一种探索方式,在人群到达之前,提供对这座城市独特的视角。 除了跑步本身,还采用整体训练方法,结合交叉训练(骑自行车、举重)来增强力量并防止不平衡。这个系统不仅仅是关于身体素质;跑步培养了精神节奏,激发创造力和解决问题的能力,最终改善整体健康和睡眠。这是一个循环的过程,每晚从为下一次跑步做准备开始,重新开始。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 原则与装备 (arun.is) 4 分,由 surprisetalk 1小时前发布 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

更多

联系我们 contact @ memedata.com