每日HackerNews RSS

## Arcee AI 的三位一体:一款美国开源权重语言模型系列 Arcee AI 正在挑战中国实验室在开源权重语言模型领域的统治地位,推出了 **Trinity**,一个在美国端到端训练的模型系列,为企业和开发者提供完全所有权。Arcee AI 认识到仅仅微调现有模型存在的局限性——特别是性能上限和数据溯源问题——因此投资于基础预训练。 他们的旅程始于 **AFM-4.5B**,证明了他们构建大规模训练管道的能力。这促成了 **Trinity Nano Preview**(6B 参数,约 800M 激活)——一个迷人、实验性的聊天模型,突破了稀疏性限制——以及 **Trinity Mini**(26B 参数,3B 激活),一个完全后训练的推理模型,两者均以 Apache 2.0 协议发布。 目前,**Trinity Large**,一个拥有 420B 参数、13B 激活参数的模型,正在使用 2048 个 B300 GPU 进行训练,计划于 2026 年 1 月发布。Trinity 基于一种新颖的“afmoe”架构构建,融合了门控注意力机制和 Muon 等进步技术,旨在提供持久、自我改进的 AI 系统,能够适应用户环境并提供法律确定性。Arcee AI 鼓励社区反馈,以塑造 Trinity 系列的未来。

``` Hacker News新帖 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录 Arcee Trinity Mini: 美国训练的Moe模型 (arcee.ai) 9点 由 hurrycane 1小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索: ```

自2月1日起,没有REAL ID的美国航空旅客在机场安检时将面临45美元的费用。虽然REAL ID合规最初要求在五月完成,但一直有额外的安检作为宽限期。现在,运输安全管理局(TSA)正在实施此费用,以鼓励旅客获得符合联邦标准的身份证明——上面有黄色圆圈中的白色星星,旨在加强9/11事件后的安全措施。 该费用涵盖通过TSA的“Confirm.ID”系统进行身份验证,但不*保证*批准。REAL ID的可接受替代方案包括护照、军人证和通过Apple Wallet等平台提供的数字身份证明。旅客可以提前在线支付费用,但机场处理可能需要长达30分钟。最初的费用为18美元,由于项目成本高于预期而增加。目前,已有94%的旅客符合标准。

美国航空旅客如果没有REAL ID,将被收取45美元费用 (apnews.com) 15点,来自geox 29分钟前 | 隐藏 | 过去 | 收藏 | 2条评论 mouse_ 2分钟前 | 下一个 [–] 我被告知这是为了我的安全,显然这值45美元回复 ocdtrekkie 14分钟前 | 上一个 [–] 有趣的是,这个“要求”被推迟了近20年,而且实际上仍然没有强制执行,但如果他们在2008年设定这个费用,它本可以在2008年完成。在美国,你不通过强制来完成它,而是通过不这样做而付出更多代价来完成它。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

对一些人来说,为经常携带或珍爱的工具配备皮套很有吸引力。然而,这些通常是单用途物品,尺寸和用途都专为单个物体设计。Silver Fox Tool是一家总部位于英国的小型手动工具制造商,他们有不同的想法。他们的Mule Pouch旨在携带多种物品,并且可以由用户自定义配置。只有侧袋的尺寸是固定的。制造商将黄铜紧固件称为“铆钉”——这可能是一种英国用法,因为在美国,铆钉不可逆转——但实际上它们是微小的六角头螺栓和(我认为)T型螺母。包含六个螺栓和六个螺母,并附带一个内六角扳手,以便您可以随意移动它们。更大的选择是他们的Mule Book,附带十二个紧固件。最后,他们的Mule Note变体在一侧留出空间放置一个小笔记本。这些手工缝制的皮具价格分别为70美元、92美元和98美元,如果选择刻字则需额外付费。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 用户可调节的皮革工具收纳器 (core77.com) 8 分,由 surprisetalk 1小时前发布 | 隐藏 | 过去 | 收藏 | 1 条评论 0cf8612b2e1e 14分钟前 [–] 我看到标题时,以为是关于整理你的九尾猫之类的东西。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 游戏开发中的程序化植物放置 本文详细介绍了在程序化生成的环境中自动放置树木和植物所面临的挑战。在建立特定生物群落的植物列表后,作者专注于高效地填充地形。最初的尝试优先避免植物重叠,但由于基于区块的地形生成,这被证明出乎意料地复杂。拒绝采样和基于网格的放置与修剪等方法在平衡物种代表性和性能方面遇到了问题。 最终,作者简化了目标,允许一定程度的重叠以避免进一步的优化障碍。实施了一个网格系统,植物密度由特定生物群落的噪声函数控制,并在人类聚居地(港口)周围进行调整,以模拟开垦。 虽然最初打算使用低多边形模型来保持性能,但测试表明在茂密的森林区域会出现明显的帧率下降。作者现在计划实施替身(简化表示)以提高渲染速度,并将该任务推迟到未来的开发中。这个过程凸显了在大型程序化世界中实现自然外观且性能良好的植物分布所面临的意外困难。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 环球游记,第二十七篇:植树 (frozenfractal.com) 3点 由 ibobev 25分钟前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## AI 与智能合约漏洞利用:日益增长的经济威胁 最新研究表明,人工智能模型利用智能合约漏洞的能力正在迅速提升,构成重大且可量化的经济风险。研究人员开发了 **SCONE-bench**,一个包含 405 个真实世界被利用的智能合约的基准测试,以评估人工智能的能力。 像 Claude Opus 4.5 和 GPT-5 这样的前沿模型总共生成了价值 **460 万美元** 的漏洞利用,针对的是在其知识截止日期 *之后* 被利用的合约,并发现了 **两个新型零日漏洞**,潜在的漏洞利用价值为 **3694 美元** – 证明了盈利性的自主漏洞利用是可行的。值得注意的是,GPT-5 以仅 **3476 美元** 的 API 成本实现了这一点。 漏洞利用收入大约每 **1.3 个月翻一番**,代币成本降低,这意味着人工智能驱动的攻击正变得更便宜、更有效。该研究发现,漏洞利用的盈利能力与代码复杂性没有强烈的关联,而是与合约持有的 *资产数量* 相关。 这凸显了主动的人工智能驱动的防御的迫切需求,因为识别和修补漏洞的时间窗口正在缩小。该研究强调,人工智能的网络能力超越了区块链,影响所有软件,并强调了投资人工智能用于安全的重要性。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Anthropic:AI 代理发现区块链智能合约漏洞 460 万美元 (anthropic.com) 8 分,由 bpierre 发布 46 分钟前 | 隐藏 | 过去 | 收藏 | 1 条评论 samuelknight 13 分钟前 [–] 我的初创公司正在构建用于渗透测试的代理,这是我们在模型开始擅长编码时就做出的赌注,已经一年多时间了。Sonnet 4 到 Sonnet 4.5 之间能力有了巨大飞跃。我们仍在内部测试 Opus 4.5,这是第一个价格足够低以用于生产的 Opus 版本。它非常聪明,我们正在重新设计我们的基准系统,因为它正在饱和测试用例。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 十年博客:经验总结 2015年开始写博客,开启了一段为期十年的写作提升之旅。最初的目标很简单:提高沟通技巧,追求流畅的文笔。早期的尝试充斥着不必要的限定词(“我认为”、“似乎”)——这些赘述稀释了观点,使阅读变得繁琐。关键的教训是:直接、自信地表达你的想法,为对话做出有意义的贡献。 另一个障碍是过度描写。选择*一个*强有力的形容词比一连串冗余的形容词更有影响力。现在,重点是简洁的语言,认识到在信息过载的世界中,清晰至关重要。 写作过程本身是迭代的,受益于草稿和新鲜视角的沉淀。立即捕捉想法,使用Obsidian等工具以便访问,至关重要。虽然生成式人工智能正在用内容泛滥网络,可能客观上贬低写作的价值,但个人收益依然存在。写作,就像书评一样,巩固理解并整合知识。 最终,持续改进是驱动力。虽然仍有进步空间,但将想法浓缩成文——目前的目标是1000字的文章——使这个过程保持吸引力和回报。

## 黑客新闻讨论:一个鲜为人知博客的十年 黑客新闻上的一场讨论,源于一位博主对十年写作、小众受众的思考。核心主题在于为*自己*写作的价值,即使没有广泛的读者。许多评论者分享了类似的经历,强调博客如何促进个人成长,理清思路,并提高写作技巧。 许多人强调,写作本身就是回报,提供了一个自我表达的空间和个人思考的永久记录。另一些人指出意想不到的好处——一位作者的博客甚至被出版成书! 对话还涉及了在线参与的挑战,一些人注意到对互联网讨论日益增长的冷漠以及追逐分析数据的压力。许多评论者提倡关注质量和个人满足感,而不是受众规模,以及清晰简洁写作的重要性。一个反复出现观点是,写作作为一种自我教育和巩固理解的工具的好处,即使没有人阅读。

## AI 构建反恐精英:模型对决 最近,Gemini 3 Pro、Codex Max 5.1 和 Claude Opus 4.5 接受挑战,仅使用文本提示构建一个基础的多人反恐精英游戏。目标:一个具有功能性前端和后端的 3D 浏览器 FPS 游戏。 **前端(设计与机制):** Claude Opus 4.5 在视觉设计方面表现出色,创建了吸引人的地图、角色和枪械。Gemini 3 Pro 紧随其后,而 Codex Max 5.1 在视觉效果上有所落后。 **后端(多人功能):** 在多人实现方面,情况发生了逆转。Gemini 3 Pro 被证明最可靠,能够高效地添加持久性并处理错误。Claude 表现良好,而 Codex 则面临更多困难。 **关键观察:** Claude 擅长初始设计,有效利用文档。Gemini 在逻辑问题解决和迭代调试方面表现出色,受益于持续的构建测试。Codex 处于中间位置,始终获得第二名。 该实验突出了 AI 在处理复杂任务和通过 CLI 迭代代码方面的进展。然而,挑战依然存在——尤其是在细致的调试方面(例如 React 的 `useEffect` 钩子,这让 Claude 陷入困境)以及弥合“氛围编码”和稳健编程实践之间的差距。 最终,所有三个模型都成功构建了一个可玩的多人 FPS 游戏,*没有*任何手动编写的代码——这是一项重大成就,展示了 AI 编码能力的快速进步。你可以在这里试玩这些游戏:[Codex](https://cscodex.vercel.app/),[Claude](https://csclaude.vercel.app/),[Gemini](https://csgemini.vercel.app/)。

## AI尝试重现反恐精英:黑客新闻总结 一个探索AI模型(Codex、Opus、Gemini和Claude)构建类似反恐精英的游戏的项目,在黑客新闻上引发了讨论。创建者在GitHub上分享了代码片段,显示Gemini的版本包含一个与现有代码惊人相似——甚至可能复制——的天空着色器,具体参考了A. J. Preetham在1999年提出的算法以及Blender和Unreal等工具中的实现。 虽然直接的版权侵权存在争议(一些人认为该算法过于通用),但人们担心AI在没有署名的情况下输出授权代码,这给依赖这些工具的企业带来风险。 值得注意的是,这段代码源自three.js中的一个依赖项。 这场讨论突显了更广泛的问题:AI生成代码可能存在的法律影响,AI生成代码与人工编写代码的质量,以及游戏开发领域对AI能力的预期出人意料的快速演变。用户建议改进提示并使用更高的AI设置可以提高结果,而另一些人则质疑基本算法的版权问题。

## macOS 与人工智能信任度下降 信心是任何技能成功的关键,对技术而言也同样重要。最近,macOS 出现问题——从 Spotlight 故障到计时器损坏——这在微妙地侵蚀用户信任。核心问题不仅仅是*出现*错误,而是 macOS **未能报告这些错误**,将问题埋藏在日志中,导致用户甚至 Apple 支持都感到困惑。 这种缺乏透明度导致令人沮丧的故障排除,常常以系统重装告终,但无法保证问题得到解决。类似的问题也出现在人工智能领域,错误被淡化为“幻觉”,导致信任度下降,尤其是在法律工作等专业领域。 作者认为,诚实且信息丰富的错误报告至关重要。 缺乏它,用户会感到沮丧,寻求解决方法,并传播他们的不信任感,最终损害 macOS 和新兴人工智能技术的可靠性。

该网站正在使用安全服务来保护自身免受在线攻击。您刚才的操作触发了安全解决方案。 提交特定词语或短语、SQL命令或格式错误的数据等行为可能会触发此阻止。

## 苹果Siri困境与AI负责人退休 苹果机器学习与人工智能负责人约翰·吉安南德里亚在Siri表现多年不尽如人意后退休。Hacker News上的讨论强调了Siri长期存在的问题——尽管用户使用量巨大,但缺乏有意义的改进,能力沟通令人沮丧,甚至在设置计时器或播放音乐等简单任务上也会经常失败。 许多用户认为Siri已经十年没有进化,而且往往不如几年前可靠。担忧集中在苹果的方法上,一些人认为对隐私的关注可能阻碍了人工智能的发展,而另一些人则认为不愿采用竞争对手的“先假装成功再逐步实现”策略使他们落后了。 关于苹果保守的方法是否明智,存在争论,尤其是在其他公司迅速整合人工智能的情况下,或者优先考虑隐私是否是长远优势。一些人推测,苹果可能通过不急于参与当前的“人工智能军备竞赛”而避免了代价高昂的错误。接任Siri负责人的主管来自微软,引发了人们对苹果产品可能出现“劣化”的担忧。

这讲述了在OpenJDK HotSpot JVM项目中一次具有挑战性的调试经历。在处理Valhalla项目的紧凑对象头(JEP 450)时,作者修改了对象头的`markWord`布局,旨在优化内存使用。这个看似微小的改动引发了广泛的、间歇性的测试失败——对象消失和类加载失败。 调试过程包括通过仔细的JVM标志实验来缩小问题范围,最终确定了在禁用紧凑对象头时,C2 JIT编译器中的一个错误编译。根本原因是在对象监视器膨胀期间使用的位掩码不正确,无意中检查了本机内存指针中的位,而不是对象元数据。由于先前配置中幸运的内存对齐,这个问题只有在`markWord`布局更改*之后*才会出现。 作者强调了强大的调试方法的重要性,包括提出正确的问题和利用可用工具。最终,与同事的合作对于识别这个微妙的错误至关重要。这次经历凸显了JVM的复杂性以及即使是看似微小的代码修改也需要仔细考虑。

最近 Hacker News 的讨论围绕一篇博客文章展开,该文章详细描述了一次奇怪的 Java 调试经历——一个对象似乎在没有垃圾回收的情况下消失了。文章标题为“我的 Java 对象消失了(且垃圾回收机制并非罪魁祸首)”,引起了读者共鸣,并赞扬了其诊断方法。 这次讨论也引发了一场关于内存分配的 небольшая 技术争论。一位评论者质疑在 Java 对象中使用“malloc”,导致了关于堆和 `malloc` 之间关系(以及 JVM 的独立堆管理)的解释。另一位用户指出 JVM 并不直接使用 `malloc`。 此外,一位用户报告了在移动设备上代码块的 CSS 显示问题,这表明使用代码格式化的博客经常会遇到一个常见问题。

更多

联系我们 contact @ memedata.com