每日HackerNews RSS

## Gemma Gem:您的本地AI助手 Gemma Gem 是一款 Chrome 扩展程序,它将强大的 AI 助手直接带入您的浏览器,由 Google 的 Gemma 4 模型提供支持。它完全在您的设备上运行——无需互联网连接或 API 密钥——利用 WebGPU 进行快速、私密的处理。 安装后(需要下载约 500MB),Gemma Gem 可以阅读网页、与元素交互(点击按钮、填写表单),甚至执行 JavaScript。您可以通过浏览器中的图标访问它,并通过聊天界面进行交互。 该扩展程序通过内容脚本、服务工作线程和托管模型的离屏文档系统工作。它提供截图捕获、文本提取和页面滚动等工具,所有这些都可以通过自然语言控制。 用户可以自定义 AI 的“思考”过程,并管理上下文清除和特定站点禁用等设置。提供开发版本和生产版本,详细日志可通过 Chrome 的扩展程序检查工具访问。

## Gemma Gem:直接在浏览器中运行的AI 一个名为**Gemma Gem**的新Chrome扩展程序,将谷歌的Gemma 4 (2B) AI模型直接带入您的浏览器——无需API密钥或云连接。由ikessler开发,并在GitHub上提供,它利用WebGPU在本地运行模型并与网页交互。 Gemma Gem提供了一个聊天叠加层,允许用户就当前页面提问。它可以读取内容、截取屏幕截图、点击元素,甚至运行JavaScript。虽然对于简单任务有效,但复杂的、多步骤请求可能不可靠。 值得注意的是,该扩展程序的代理循环没有依赖项,可以用作一个独立的库进行进一步的实验。一位评论员还强调了Chrome正在进行的**Prompt API** Origin Trial,其中包含v3Nano模型,作为另一种基于浏览器的AI途径。

即使是开发人工智能工具的公司,如微软的Copilot、OpenAI的模型以及xAI的产品,也在告诫用户不要盲目信任其输出结果。 他们的服务条款明确指出,这些人工智能容易出错,不应被用于重要决策。 微软目前正在向企业推广Copilot,最初包含免责声明,将该工具标明“仅供娱乐”,并建议用户“自行承担风险”。 他们承认这种措辞已过时,并计划更新。 同样,OpenAI和xAI也警告不要将他们的人工智能的回复视为绝对真理或事实信息。 这些免责声明强调了一个关键点:虽然人工智能正在迅速发展,但它仍然存在缺陷,需要对生成的内容进行批判性评估——这种观点与怀疑论者*和*人工智能开发者本人不谋而合。

最近一篇TechCrunch文章强调了微软的使用条款,指出Copilot“仅供娱乐”,引发了Hacker News上的讨论。用户们正在辩论微软当前的AI战略,一些人认为他们在早期投资OpenAI后落后了。 一位评论员指出,直接测试Copilot就能发现它的局限性,这强化了“仅供娱乐”的声明。另一些人认为,认识到“AI寒冬”的可能性并缩减投资实际上可能是一个聪明的竞争举措。讨论以一种轻松的方式延伸到质疑那些*避免* AI投资的企业——比如一家当地的冰淇淋店——最终可能会受益。这场讨论反映了人们对当前AI技术的即时实用性和长期可行性日益增长的怀疑。

## Modo:一个开源、规划优先的AI IDE Modo是一个基于VS Code的Void编辑器构建的桌面IDE,旨在通过优先考虑*规划*而非直接执行来增强AI辅助编码。与典型的“提示-生成代码”工具不同,Modo通过明确的工作流程来构建开发过程:**提示 → 需求 → 设计 → 任务 → 代码。** 用户在`.modo/specs`中定义功能或错误修复,为需求、设计和实现任务创建markdown文件。然后,AI代理填充这些内容,允许审查和迭代完善。任务是持久的,并且可以从IDE中一键执行。 主要功能包括通过markdown规则进行项目指导,通过JSON钩子实现自动化操作,以及为复杂任务并行生成代理。它支持多种LLM,并与OpenAPI规范等工具集成。一个切换开关允许在自主“自动驾驶”模式和监督模式之间切换。 Modo是完全开源的(MIT许可证),并且高度可定制,提供专用主题、自定义命令以及通过可安装的“能力”进行扩展。虽然目前由社区维护,但它为寻求更结构化的AI驱动编码方式的开发者提供了强大的基础。 [https://github.com/modoeditor/modo](https://github.com/modoeditor/modo)

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Show HN: Modo – 我构建了一个开源的 Kiro、Cursor 和 Windsurf 的替代品 (github.com/mohshomis) 8 分,由 mohshomis 2 小时前发布 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 esafak 18 分钟前 [–] 你学到了什么?回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 开源软件的可移植性价值 本文论述了开源社区中日益增长的对软件可移植性的敌对态度。作者反驳了常见的将移植到“旧”或不太流行的架构(如Alpha、MIPS、PowerPC或32位系统)视为无意义的观点,以及对字节序(大端与小端)的担忧。 作者认为,支持不同的架构并非沉溺于过去,而是承认活跃的社区兴趣并提高软件质量。移植可以发现隐藏的错误——一个安全漏洞甚至是通过在旧硬件上测试Linux内核发现的。大端和小端系统都有其价值,而字节序安全的代码就是*更好*的代码。 同样,32位支持仍然相关,尤其是在资源受限的环境中,甚至可以在64位系统上提高效率。最终,接受社区驱动的移植表明了对用户的尊重,并促进了更健壮、经过充分测试的代码库。作者提倡协作方法,敦促维护者拥抱贡献,即使是针对意想不到的平台,将其视为项目蓬勃发展和有价值的标志。

一个 Hacker News 的讨论围绕着开源项目维护者对于社区驱动的新架构移植的责任。发帖者认为维护者*应该*接受移植以造福社区和提高软件质量,并以 Linux 内核作为成功管理多个架构的例子。 然而,一位评论者反驳说,维护者没有义务*维护*这些移植,承认维护和测试的持续成本很高。他们强调维护者拒绝的是*维护的负担*,而不是移植本身。 核心观点是,在开源领域,如果原始维护者拒绝这样做,任何人都可以分叉项目并独立维护移植。这突出了社区贡献与维护者控制项目范围和资源的平衡。

APEX v0.1.0-alpha 定义了人工智能代理与经纪商、交易所、交易商和其他执行场所的通信方式。 一种协议。实时状态。自主安全。多资产设计。连接FIX协议的电子交易。APEX连接代理交易。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Apex 协议 – 基于 MCP 的开放 AI 代理交易标准 (apexstandard.org) 5 分,by andmerm 1 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 hendzen 16 分钟前 | 下一个 [–] 不错的主意,但明显是粗制滥造。另外,Apex Clearing 很快会给你写一封愤怒的信,要求你更改名称。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## mdarena:评估您的 CLAUDE.md 文件效果 **mdarena** 是一款工具,用于评估您的 `CLAUDE.md` 文件(您提供给 Claude 等代理的指令)相对于您的代码库实际 PR 的有效性。研究表明,这些文件通常会*降低*代理的成功率并增加成本。 **工作原理:** 1. **`mdarena mine`**: 提取合并的 PR 以创建任务集,自动从您的 CI/CD 配置中检测测试命令。 2. **`mdarena run`**: 通过将不同的 `CLAUDE.md` 配置(或无上下文)应用于 PR 之前的提交并评估生成的代理补丁来测试它们。它可以运行您现有的测试(如 SWE-bench),或退回到差异重叠评分。 3. **`mdarena report`**: 将代理补丁与原始 PR 差异进行比较,衡量测试通过/失败率、代码重叠、成本和统计显著性。 **生产 monorepo 测试的关键发现:** 与没有它们的基线相比,提供针对性上下文的按目录 `CLAUDE.md` 文件显著提高了测试解决率(约 27%),并且优于合并的单文件方法。 **mdarena 优先考虑安全性**,通过隔离检出防止访问未来的提交。它支持 SWE-bench 任务,并需要 Python 3.11+、`gh` 和 `claude` CLI。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 工作 | 提交 登录 展示 HN: Mdarena – 基准测试你的 Claude.md 与你自己的 PRs (github.com/hudsongri) 7 分钟前,hudsongr | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 hudsongr 1 小时前 [–] 大家好!我构建了这个工具,因为现在每个人都在编写 CLAUDE.md 文件,但没有人知道他们的文件是否真的有效。研究结果也存在矛盾,一篇论文说它们会损害性能,另一篇论文说它们有帮助。所以我制作了一个工具,使用你自己的仓库、你自己的 PRs 和你自己的测试套件来衡量它。 结果是,你很少能指出一个 markdown 文件并说“这使代理在解决实际任务方面提高了 27%”。这就是我们在生产 monorepo 中看到的结果。我设想这是一种让团队真正改进代理编写代码的方式,而不是猜测。 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

## 本地多模态记忆:用搜索查找任何内容 这个工具允许您使用自然语言创建本地、可搜索的文件数据库——包括图像、音频、视频、PDF 和文本。只需嵌入您的文件,然后使用描述性查询*查找*它们,即使没有任何现有的元数据或标签。例如,搜索“团队晚餐”将显示相关的照片! 它由 Gemini Embedding 2(免费版本)和 ChromaDB 提供支持,所有内容都存储在您本地机器上以保护隐私。设置过程经过简化,并配备了一个动画向导,Raycast 扩展程序提供带有缩略图的即时视觉搜索。 **主要特点:** * **跨模态搜索:** 无缝处理所有文件类型。 * **本地和私密:** 数据保留在您的机器上。 * **易于设置:** 动画向导引导您完成整个过程。 * **Raycast 集成:** 从您的启动器进行快速视觉搜索。 **开始使用:** [https://github.com/hughminhphan/vector-embedded-finder](https://github.com/hughminhphan/vector-embedded-finder)

对不起。

## GuppyLM:一个小型、可训练的语言模型 GuppyLM是一个拥有900万参数的语言模型,旨在证明构建自己的LLM并不需要大量的资源。它使用单个Colab笔记本和最少的训练时间(约5分钟)创建,展示了语言模型的内部运作——从数据到输出,使其不再像一个“黑盒子”。 该模型体现了一条名为Guppy的小鱼,用简短的、小写的句子交流,专注于它的水生世界:水、食物和鱼缸生活。它故意缺乏对复杂人类概念的理解。 GuppyLM在6万条合成对话上进行训练,涵盖60个主题,利用简单的香草Transformer架构。该项目优先考虑简单性,放弃了像GQA或RoPE这样的高级技术,以保持小规模的清晰度和效率。 代码和预训练模型已在HuggingFace上公开提供,允许任何人进行实验并直接与Guppy聊天。它是一个实际的例子,证明即使没有博士学位或巨大的计算能力,LLM的创建也是可行的。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Show HN: 我构建了一个微型 LLM 来揭示语言模型的工作原理 (github.com/arman-bd) 9 分,by armanified 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 从头开始构建了一个约 9M 参数的 LLM,以理解它们实际的工作方式。 纯 Transformer,60K 个合成对话,约 130 行 PyTorch 代码。 在免费的 Colab T4 上 5 分钟内训练完成。 这条鱼认为生命的意义是食物。 Fork 它并替换为你自己想要的角色个性。 帮助。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

请启用 JavaScript 并禁用任何广告拦截器。

这场黑客新闻的讨论集中在雇主利用个人数据来确定潜在员工的最低可接受工资。一些评论员指出这种做法并不新鲜——就业市场本质上是雇主报价与员工期望之间的拍卖。但另一些人则对数据隐私表示担忧。 一个关键点是“The Work Number”等服务向Equifax等公司出售薪资信息。用户对需要主动“选择退出”数据共享感到沮丧,因为他们从未同意这些做法,并且对即使只是*冻结*他们的数据也需要的大量个人信息感到进一步的恼怒。总体情绪倾向于一种被剥削的感觉以及对个人财务信息缺乏控制。

## 超越文件系统:利用语义寻址改进AI编程 传统上,代码组织依赖于文件系统,模仿人类可理解的层级结构。然而,这迫使AI编程代理在较低的“操作”层面工作,需要大量的工具(如IDE)来管理基于代码*存储位置*而非*功能*的代码。 为了提高AI效率,Sumato AI 建议将重点转向**叙事卫生**——为AI代理编写清晰、直接的“故事”。 这通过两个关键创新实现:**Spath** 和 **Splan**。 **Spath** 是一种语义寻址格式,允许代理在*不*引用文件或行号的情况下识别代码符号。 **Splan** 定义了一种表达对这些符号的*操作*的语法——完整的意图,例如“用这个新版本替换这个函数”——同样不依赖于文件系统。 通过操作语义含义而非文件路径,Spath & Splan 减少了浪费的计算,提高了AI的“认知质量”,并实现了事务性代码更改(全部成功或全部失败)。 两者都设计为开放、可适应的语法,具有特定于语言的“方言”。 Sumato AI 正在开源这些工具,相信转向语义抽象将释放AI辅助编码的重大进步。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Spath 和 Splan (sumato.ai) 3 分,作者 jasonmoo,2 小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

更多

联系我们 contact @ memedata.com