每日HackerNews RSS

## Rail:一种自举的系统编程语言 Rail 是一种新颖的、自举的系统编程语言,专为速度和简洁性而设计。它不依赖 C 语言,并且占用的空间非常小——一个 729KB 的 ARM64 二进制文件可以编译自身,并达到字节级的固定点。核心运行时功能,包括垃圾回收,直接用 ARM64 汇编实现。 最近的进展(v3.0.0)引入了通过纯 Rail TLS 1.3 协议栈实现的本地 HTTPS 支持,消除了对 OpenSSL、curl 或类似库的依赖。这允许直接与 Anthropic 的 Claude 等 API 通信。 Rail 支持多种后端(macOS ARM64、Linux ARM64/x86_64、WASM),并具有独特的自我改进系统,编译器充当 AI 训练的适应度函数。它包括原生浮点数、效果处理程序以及带有模式匹配和 ADT 的函数式编程风格等特性。 Rail 不追求形式化验证或 ANSI 标准化,而是优先考虑性能、可靠性和狭窄、明确定义的表面积。它采用商业源代码许可证,可免费用于非生产用途。

一种名为“Rail”的新型自托管语言发布,旨在单独处理TLS,但正在受到Hacker News社区的批评。用户声称该项目似乎主要由人工智能驱动,作者似乎使用LLM生成代码和营销材料——优先考虑编译而非正确性。 具体而言,担忧集中在一个有缺陷的TLS实现上:它无法正确验证证书链,即使使用自签名证书也容易受到中间人攻击。安全漏洞还包括用于私钥创建的可预测随机数生成器以及静态文件服务器中的目录遍历漏洞。 评论员认为该项目的声明被夸大,并且代码本身难以理解,质疑发布广泛的加密组件而不进行适当实现的语言的价值。

## 微型浮点数的兴起 历史上,浮点数从32位发展到如今标准的64位精度。虽然程序员们欣赏更高的精度,但现代神经网络正在推动一个令人惊讶的趋势:对*更低*精度的需求。这些网络包含数十亿个参数,最小化它们的内存占用至关重要——通常将数量优先于单个精度。 这促使人们对诸如4位浮点数 (FP4) 之类的格式产生兴趣。虽然可以使用整数,但FP4提供了更宽的*动态范围*——能够表示非常小和非常大的数字。FP4格式因其在符号、指数和尾数之间分配4位的方式而异(例如,E3M0、E2M1)。E2M1格式很常见,并受到Nvidia硬件的支持。 FP4数字使用偏差来表示指数,即使在这种有限的格式中,也存在诸如+0和-0之类的概念。Python库Pychop有助于使用这些降低精度的格式。FP4并非孤例;许多4位格式正在涌现,例如NF4旨在更好地表示LLM权重。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 4位浮点数 FP4 (johndcook.com) 8 分,由 chmaynard 发表于 3 小时前 | 隐藏 | 过去 | 收藏 | 2 条评论 帮助 chrisjj 发表于 3 小时前 [–] > 程序员们感谢从 32 位浮点数到 64 位浮点数的转变。拥有更高的精度没什么坏处。 kimixa 发表于 9 分钟前 | 父评论 [–] 即使是最新款的 CPU,fp64:fp32 的性能比率也只有 2:1 - 加上数据大小增加一倍对缓存和带宽使用造成的影响,你通常会得到超过 2 倍的差异。如果你在数值计算密集型应用中,这会是一个巨大的差异。这并不是导致注重性能的语言默认使用 fp32 的一些过时的“古老传说”。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 解决 Web Agent 身份验证问题:rtrvr & Subroutines 大多数 Web Agent 在扩展到单个任务之外时会遇到困难,因为 Web 身份验证(cookie、轮换令牌和特定于浏览器的安全措施)非常复杂。直接调用 API 会失败,因为身份验证才是真正的挑战。rtrvr 通过**在用户浏览器*内*记录和重放 Web 交互**来解决这个问题,利用浏览器现有的会话和安全环境。 rtrvr 不会重建身份验证,而是会在执行任务期间拦截网络请求,对其进行排序以识别相关的 API 调用(过滤掉分析和噪音),然后直接从页面上下文重放它们。这创建了**“Subroutines”**——可供 Agent调用的工具,例如发送 LinkedIn 请求或发布到 X。 Subroutines 作为确定性 JavaScript 脚本运行,最大限度地减少 LLM 的 token 使用量并确保可靠性。Agent 选择参数,但实际操作本身是一个脚本,而不是持续推理。rtrvr 提供了一个辅助命名空间 (`rtrvr.*`) 用于常见的 Web 交互,简化了 Subroutine 的创建。 这种方法旨在构建一个**可靠 Web 操作的共享库**,超越理论上的 Agent 能力,实现实用且可扩展的自动化。rtrvr 随附了针对流行平台和功能的初始 Subroutines,以及自定义 LLM 订阅和工作流程调度的集成。

对不起。

## 设计工具的未来:回归代码 最近使用 Claude Design 的体验预示着设计领域即将发生转变,这源于人工智能的兴起以及 Figma 等现有工具的局限性。Figma 的成功在于创建了一个系统化、"规范化"的设计环境,但这也导致了组件、变量和覆盖层等复杂且常常令人沮丧的系统。这种复杂性反而削弱了 Figma 在人工智能时代的相关性,因为 LLM 是在 *代码* 上进行训练的,而不是 Figma 的专有元素。 作者认为,真相的来源将回归代码,使 Figma 复杂的系统变得过时。Figma 现在被困在手动、人工智能之前的流程中。未来设计工具可能会出现分叉:一条路径,以 Claude Design 为例,拥抱直接的代码操作以及与编码伙伴的无缝集成。另一条路径将是一个纯粹的探索环境,摆脱系统约束——一个用于快速原型设计和视觉实验的空间,可能类似于更强大的 Photoshop 或简化的 iPad 素描应用程序。 最终,作者认为 Figma 的辉煌时刻正在消退,敦促 Sketch 等竞争对手大胆创新,超越基本功能。“材料的真实性”是关键——Claude Design 通过根本建立在 HTML 和 JS 之上提供了这一点。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 关于 Claude Design 的想法和感受 (samhenri.gold) 20 分,cdrnsf 1 小时前 | 隐藏 | 过去的 | 收藏 | 2 评论 帮助 dang 12 分钟前 | 下一个 [–] 最近的相关:Claude Design - https://news.ycombinator.com/item?id=47806725 - 2026年4月 (732 评论) 回复 mojuba 2 分钟前 | 上一个 [–] 精彩的文章。我同意作者的观点,基本上是“去他妈的 Figma,至少修复 Sketch”。一直觉得对 Figma 的憎恨很孤独,原因有很多(其中之一,它是一个极其糟糕、占用大量内存和 CPU 的 Electron 应用,看起来和感觉比任何或多或少设计良好的网站都差),但读完这篇文章后,我意识到原因增加了一倍。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 无头服务崛起与设计的未来 应用程序和服务交互的未来正朝着“无头”架构转变——为人工智能代理提供访问,而无需传统的用户界面。这得益于人工智能辅助带来的卓越用户体验,以及与屏幕抓取 GUI 相比,人工智能任务的更高可靠性。 这种转变已经发生,这体现在像 MCP 这样的 AI 专用 API 的出现以及命令行界面 (CLI) 的普及。像 Google Workspace CLI (gws) 和 Salesforce CLI 这样的工具允许通过文本命令直接与服务交互,从而为人工智能实现强大且可组合的工作流程——并且越来越多地,为用户提供服务。 CLI 在安全性方面具有优势,因为最大限度地减少复杂性可以降低漏洞,这对于人工智能发现漏洞的能力而言至关重要。前端设计不会消失,但会演变为专注于建立强大的“氛围”和品牌标识,因为用户很可能主要通过其人工智能代理与服务交互。 重点将从优化用户旅程转移到为人工智能提供安全、简化的访问,从而促使银行和政府部门等企业优先开发强大的 CLI 工具。这代表着我们与技术互动方式的根本性变化,优先考虑人工智能时代的功能性和安全性。

这个Hacker News讨论围绕“个人AI”的未来,以及AI代理与日常应用程序之间互联互通的可能性。用户‘markusw’分享了一个关于“为个人AI构建无界面应用”的链接,引发了‘stephenlf’对采用时间线的预测。 ‘Stephenlf’认为广泛集成比许多人预期的要遥远,预测需要10年时间。最初,像谷歌和微软这样的科技巨头将在其现有生态系统中扩展AI(微软的尝试可能因闭源而失败)。随着时间的推移,接受度会提高,最终苹果可能会建立一个主导标准(“AILP”),然后最终与其他协议融合。 评论者强调了潜在的影响,指出即使严重依赖命令行工具(如Salesforce CLI)的开发者,也可能会频繁地与这些AI助手互动。

## Remoroo:深度科技的自主研究 Remoroo 是一款自主研究引擎,旨在加速机器学习开发。与提供单一建议的编码代理不同,Remoroo 会在您的代码上运行大量实验(最多 30 个),*过夜*自动编辑、测试和评估更改,基于定义的指标——例如示例中的 `val_bpb`,该指标提高了 31%。 您通过一个简单的规范文件 (`program.md`) 定义实验,指向您的训练和评估代码。它在时间预算内运行,并严格验证和复现结果,提供清晰的“已验证”状态和通过 git 的可追溯历史。 Remoroo 并非关于*猜测*代码,而是关于通过结构化实验*证明*改进。计费基于运行时间(“积分”),并提供免费套餐。它专为寻求可扩展、可靠的方式来自动化和加速其机器学习研究流程的深度科技团队设计。

## Remoroo:编码代理的长期记忆 Remoroo (remoroo.com) 是一种新工具,旨在解决编码代理面临的一个关键挑战:在长时间运行的任务中保持上下文和记忆。与在简单编辑之外就难以应对的代理不同,Remoroo 旨在处理涉及文件访问、命令执行和迭代测试的复杂、持续数小时的“工程实验”。 其核心创新是一种“按需分页内存系统”,其灵感来自操作系统虚拟内存,可以有选择地存储和检索所需上下文。这使得 Remoroo 能够管理长时间运行期间产生的大量数据,防止代理“忘记”其目标或重复失败的尝试。 用户向 Remoroo 提供一个仓库和一个可衡量的目标,它将自主迭代,测试更改并从结果中学习。创建者正在寻求那些从事类似长时间运行的代理、训练或评估系统的人的反馈。网站上提供详细的技术文档。

## 美国-伊朗冲突中的可疑投注与潜在内幕交易 在线预测市场和商品期货中出现了一波时机把握得异常精准的投注,引发了人们对与美国-以色列伊朗相关发展相关的潜在内幕交易的担忧。大量投注准确预测了事件——包括美国空袭、阿亚图拉·哈梅内伊的遇刺以及停火公告——为一些交易者带来了巨额利润。 具体而言,Polymarket上的16个账户在预测2月份空袭方面获得了超过10万美元的收益,而一位用户在哈梅内伊被报道死亡*之前*,押注其被移除获得了超过55万美元的利润。类似的活动也发生在停火公告期间,与石油价格大幅下跌(9.5亿美元)的投注同时发生。 这些模式被描述为“狂野西部”般的情况,表明可能有人利用提前获得的知识来操纵这些市场。商品期货交易委员会(CFTC)据报道正在调查此事,但由于有限的执法能力、技术障碍以及与各州的管辖权纠纷而面临挑战。 专家指出,证明这些新兴市场中的非法内幕交易非常复杂,而且现行法律无法有效应对区块链技术提供的匿名性。一项两党法案旨在禁止政府官员参与这些市场,但核心问题仍然是:确保在一个日益复杂的环境中进行公平和透明的交易。

## 预测市场与内幕交易:摘要 一份最新报告显示,在伊朗战争爆发前,有超过10亿美元的赌注通过预测市场以惊人的时机下注。 这引发了黑客新闻的讨论,中心围绕这些市场的伦理和功能。 许多评论员认为,成功的预测需要内幕信息,质疑这些市场是否本质上依赖于——并可能促成——非法内幕交易。 有人建议人工智能可以追踪大量潜在的非法赌注。 另一些人指出,与国家相关的行为者可能利用这些平台进行情报收集。 一个关键的争论围绕预测市场的价值。 有人认为它们通过揭示内幕信息为公众提供有价值的见解,而另一些人则认为它们主要使那些*拥有*内幕信息的人受益,可能助长“赌博流行病”并剥削弱势投资者。 人们对这些市场可能被用于非法活动以及缺乏监管表示担忧。 一些评论员强调了建立在信息不对称和人为稀缺性基础上的平台的更广泛的伦理影响,并将它们与更广泛的社会问题联系起来,例如财富不平等和信任的侵蚀。

1910年,路易斯·“巴德”·艾伯内西(10岁)和他的弟弟坦普尔(6岁)从俄克拉荷马州骑马开始了长达2000英里的旅程,前往纽约市。他们继承了父亲杰克·“活捉”·艾伯内西的冒险精神——他是一位传奇的美国法警,以徒手为罗斯福总统捕获狼等壮举而闻名。 在父亲的祝福下,以及一系列安全规则(每日有限的行程、不得在无人监督的情况下过河、携带少量现金、以及周日不骑马)的约束下,兄弟俩于四月出发。巴德骑着他父亲著名的马“萨姆·巴斯”,而坦普尔骑着“杰罗尼莫”,每天都需要帮助才能上马。 他们携带了食物、床铺和马的燕麦等必需品,并运用牛仔战术来确保夜间安全。这次雄心勃勃的旅行是为了与罗斯福总统从非洲归来时相遇,艾伯内西一家希望能在纽约与他见面。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 传奇美国法警的年轻儿子从俄克拉荷马州骑马到纽约 (texascooppower.com) 12 分,mhb 39 分钟前 | 隐藏 | 过去的 | 收藏 | 2 条评论 帮助 NoNotTheDuo 3 分钟前 | 下一个 [–] The Dollop 播客对此段冒险经历做了一个精彩的节目,在塔尔萨现场录制:https://www.iheart.com/podcast/299-the-dollop-with-dave-anth... 回复 jandrewrogers 8 分钟前 | 上一个 [–] 与今天关于自由放养式童年的讨论形成了鲜明对比。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## Fly.io 分布式系统挑战:只增计数器总结 本文详细介绍了在使用 Fly.io 的 Maelstrom 平台及其 `SeqKV` 服务构建只增计数器时遇到的挑战。核心任务——在分布式节点上递增和读取计数器——由于并发操作,证明出乎意料地复杂。简单的实现会丢失更新,凸显了对原子操作的需求。 使用 `SeqKV` 的 `CompareAndSwap` (CAS) 提供了一种解决方案,但结果是不确定的。探索无冲突复制数据类型 (CRDT),特别是 G-Counter,提供了一种替代方案,其中每个节点管理自己的计数器,从而消除了写入冲突。然而,这种方法仍然依赖 `SeqKV` 来求和值,如果没有 gossip 机制,就无法实现真正的 CRDT 实现。 关键在于理解 `SeqKV` 的 *顺序一致性* 模型。虽然它保证了操作的总顺序,但它允许出现陈旧读取等异常。测试的 10 秒冷却期加剧了这种情况。最终,一种“hacky”的解决方法——在每次读取之前进行一次唯一的写入——迫使在 `SeqKV` 的限制范围内获得最新的视图。更强大的解决方案包括实现完整的 CRDT 或切换到像 `LinKV` 这样的线性化键值存储。该挑战强调,理解底层一致性模型和实现细节至关重要,而不仅仅是理论知识。

对不起。

## 2026年人工智能:快速进展与日益增长的担忧 – 摘要 2026年斯坦福人工智能指数显示,人工智能能力持续爆炸式增长,美国公司在模型开发方面仍然领先——2025年发布了50个“值得注意”的模型,但中国正在迅速赶上。目前,行业主导了模型创建(90%以上),而中国在机器人部署方面领先,2024年安装的工业机器人数量几乎是美国的3倍。 全球人工智能计算能力自2022年以来每年翻三倍,这主要得益于英伟达的GPU,但这一进展带来了巨大的环境成本——训练像xAI的Grok 4这样先进的模型,可能产生超过72,000吨的碳排放。 尽管存在这些担忧,人工智能在基准测试中正在迅速改进,尤其是在代理任务和医疗应用(药物发现出版物在两年内翻倍)方面。2025年的投资达到创纪录的5810亿美元,GitHub上与人工智能相关的项目激增。然而,人工智能在诸如读取模拟时钟等基本任务上仍然存在困难,凸显了其多模态理解的局限性。 公众认知持谨慎乐观态度(59%的人认为益处大于弊端),但对政府监管的信任度仍然较低,尤其是在美国。这反映了更广泛的趋势,即根据具体应用和地理位置,情绪和结果各不相同。

对不起。

更多

联系我们 contact @ memedata.com