美国人工智能公司 Anthropic 与中国科技巨头阿里巴巴之间的紧张关系升级,最终导致阿里巴巴禁止其员工使用 Anthropic 的“Claude Code”工具。 此前,Anthropic 指控阿里巴巴进行“模型蒸馏”,即非法利用从 Anthropic 模型中提取的数据来训练自家的 AI 模型。在开发者发现 Claude Code 包含旨在识别中国相关用户并防止未经授权的访问或模型抓取的安全机制后,双方紧张局势进一步加剧。对此,阿里巴巴已指示员工改用其内部编码平台 Qoder。 这场冲突凸显了人工智能竞赛中更广泛的地缘政治竞争。随着美国公司实施更严格的访问控制以防止知识产权被窃,中国公司正日益转向阿里巴巴的 Qwen 或 DeepSeek 等开源模型等国内替代方案。市场格局的转变使情况变得更加复杂;中国的人工智能模型正变得极具竞争力,其性能几乎与美国的前沿模型相当,但成本却只有后者的一小部分。因此,尽管存在监管壁垒和安全担忧,中国模型仍获得了显著的市场影响力,这预示着全球人工智能格局可能发生转变。

在纪念美国建国250周年的演讲中,纽约市长佐兰·曼达尼(Zohran Mamdani)对这个国家进行了尖锐的批判,并将他的异议定义为最高形式的爱国主义。这位社会主义领导人将美国描述为一个以至上主义、不平等和企业贪婪为特征的体制,并对从寡头到保险业等各方势力进行了抨击。 曼达尼的演讲重点关注了移民问题,他将联邦执法称为“入侵”,并称赞那些阻挠执法的人是真正的爱国者。他进一步批评了国家在“炸弹和救助金”上的支出,同时强调了国内的贫困问题,尽管他本人近期也接受了政府的救助资金。 这篇演讲成为了美国民主社会主义者协会(DSA)在民主党内影响力不断上升的宣言。通过将抵制联邦法律和系统性反对重塑为核心的美国价值观,曼达尼标志着该党派系在意识形态上的根本性转变。曼达尼没有歌颂国家的历史,而是利用这一平台否定现状,并主张对美国身份进行彻底的重构。

发布 登录 注册 发布 Karthik Kumar Viswanathan @_vkaku 对我而言,在任何系统上支持 Unicode 都很重要,即使是在 DOS 上。所以,开始吧 *** 初步成果 *** 00:00 2026年6月29日 上午5:44 587 次浏览 1 1 13 3 阅读 1 条回复 刚接触 X? 立即注册以获取您的个性化时间线! 使用 Google 注册 使用 Apple 注册 创建账号 注册即表示您同意服务条款和隐私政策,包括 Cookie 使用。 相关人物 Karthik Kumar Viswanathan @_vkaku 关注 热门趋势 条款 · 隐私 · Cookie · 无障碍 · 广告信息 · 更多 © 2026 X Corp. 不要错过正在发生的事 X 上的用户最先知晓。 登录 注册

最近一则 Hacker News 上的讨论探讨了在 DOS 操作系统上实现 Unicode 支持的可行性。尽管一些用户质疑 DOS 如何处理 UTF-8 庞大字符集的内存限制,但原作者解释称,现代工具和现成的位图字体使得在旧环境中渲染多个码位变得愈发可行。为了帮助那些有兴趣进行此项实验的用户(无论是针对 DOS 还是嵌入式固件项目),该用户提供了一个包含相关实现代码的 GitHub 仓库链接。

发表在《科学》杂志上的一项研究揭开了孤独迁徙鸣禽(如斑姬鹟)如何成功抵达特定越冬地的谜团。研究人员利用微型数据记录仪追踪了来自欧洲各地的鸟类,发现无论其繁殖地在哪里,它们都遵循一条一致的非直线路径:经由伊比利亚半岛,穿过大西洋前往非洲。 这种漫长的绕道被认为是上一个冰河时代的进化遗留。通过将荷兰鹟的蛋移植到瑞典的鸟巢中并进行种群杂交,研究人员确定越冬目的地受遗传因素与成长过程中环境因素的共同影响。 至关重要的是,研究结果表明迁徙并非父母传授的习得性行为。相反,鸟类似乎拥有对迁徙距离的先天感知,而非固定的指南针方向。这一发现对于理解物种如何适应气候变化至关重要,因为鸟类调整迁徙时间的能力与它们越冬的地点密切相关。

Hacker News最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交登录科学家发现迁徙鸣禽的导航系统 (exeter.ac.uk)10分 由 bit_economist 1小时前发布 | 隐藏 | 过往 | 收藏 | 讨论帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

请启用 JavaScript 和 Cookie 以继续。

这份 Hacker News 讨论探讨了美国邮政署(USPS)私有化的可能性,大多数参与者对此表示强烈反对。批评者认为,USPS 是一项至关重要的公共服务,受宪法保护,提供不可或缺的普遍覆盖,特别是对于那些可能被以营利为目的的私营实体所放弃的农村地区。 许多评论者认为,USPS 的财政困境是由功能失调的国会“制造”出来的,而非该组织本身的失败。私有化怀疑论者警告称,这可能会重演其他行业(如日本铁路网)出现的后果,即通过提高价格和削减不盈利地区的服务来实现盈利。 尽管少数评论者认为邮政投递并非传统的“公共产品”,并指出该服务并非完美无缺,但主流观点认为私有化将导致成本上升、质量下降以及财富进一步集中。归根结底,参与者将推动私有化视为政治裙带关系的产物,认为这威胁到了被视为美国社会基石的服务。

一名安全研究人员在 MSI 笔记本电脑和台式机预装的 MSI Center 软件中发现了严重漏洞。通过对应用程序的可执行文件进行反编译,研究人员发现了一个实现不安全的命名管道(`MSI_SERVICE_2`),这使得任何经过身份验证的用户都能以 `LocalSystem` 权限执行命令。 这些命令可用于操作注册表、修改 Windows Defender 设置或执行任意代码。该系统依赖过时的 3DES 加密和薄弱的注册流程,甚至可以通过 SMB 协议被利用,从而在网络上实现远程代码执行(RCE)。 漏洞报告过程最初遇到了一些障碍,研究人员提交的报告因对方邮箱满载而被退回。在获得 Gamers Nexus 的协助联系到相关负责人后,研究人员发现 MSI 的响应非常迅速,在两天内修复了该漏洞。尽管研究人员尚未因其重大的安全贡献获得任何漏洞赏金,但目前正在等待该发现的 CVE 编号。该漏洞已在 MSI Center 2.0.70.0 版本中得到修复。

一份最新报告指出 MSI Center 存在一个严重漏洞,攻击者可在数秒内获取系统最高权限(SYSTEM-level)。尽管该漏洞因软件实现不当而极其严重,但披露过程的结果却出奇地积极:MSI 在收到通知后的两天内便迅速做出响应,完成了补丁的开发并排定了发布计划。 Hacker News 上的评论者对此反应不一:一方面对 MSI 的快速响应感到欣慰,另一方面对厂商提供的实用程序质量感到不满,指出这些程序往往是必需的,但代码编写水平却很糟糕。此外,讨论还转向了有关遗留安全性的技术担忧,用户质疑为何在已有 AES 等更高效、更安全标准的情况下,2018 年就已被弃用的 3DES 仍出现在现代软件环境中。

本文指出,“威胁建模”常被滥用为流行语,但它实际上应成为评估安全性的实用且动态的框架。 一个合格的威胁模型必须定义以下内容: 1. **资产**:我们需要保护什么? 2. **参与者**:谁想造成伤害? 3. **攻击场景**:他们如何才能得逞? 4. **缓解措施**:我们采取了什么措施来阻止他们? 5. **假设**:我们认为理所当然的前提是什么? 6. **关系**:系统组件之间如何交互? 7. **已接受的风险**:我们选择不处理哪些威胁? 作者指出,尽管一个不完美的威胁模型(如 Matrix 的模型)也比没有好,但高质量的模型需要绘制系统依赖关系并记录假设。这一过程能防止“未知的未知”,并帮助工程师做出更好的设计选择,例如优先使用通行密钥(passkeys)而非密码。 除了架构之外,威胁建模还充当着“胡扯探测器”。通过明确定义风险,并将意识形态上的危言耸听与技术现实(例如后量子密码学争论)区分开来,从业者可以做出客观决策,而不是陷入恐惧、不确定和怀疑(FUD)之中。归根结底,威胁建模的意义在于构建直观的纵深防御,而非追求抽象的学术完美。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Soatok 的非正式威胁模型指南 (soatok.blog) 10 分,作者:zdw,24 分钟前 | 隐藏 | 过往 | 收藏 | 2 条评论 | 帮助 mapontosevenths 7 分钟前 | 下一条 [–] 这是我今天看过的关于威胁建模的同性恋兽迷博客文章中写得最好的一篇! 回复 evanprodromou 10 分钟前 | 上一条 [–] 哇,出色的指南!我很喜欢那个端到端加密(E2EE)的例子。 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

播客主持人塔克·卡尔森(Tucker Carlson)宣布计划协助建立第三个政党,尽管他坚决重申自己无意竞选公职。 卡尔森的转变源于他对两党制的失望,他将这种制度形容为在外交政策上的“一党制国家”。他特别批评了民主党和共和党在国际干预问题上的“步调一致”,并以近期以色列和伊朗之间的紧张局势作为主要例证。卡尔森认为,由于当前的政治领导层(包括唐纳德·特朗普总统)在这些议题上保持一致,选民缺乏有意义的选择。 卡尔森加入了越来越多的政治人物行列,包括埃隆·马斯克、乔·曼钦和安德鲁·杨,他们都主张为当前的党派建制派寻找可行的替代方案。卡尔森强调,他打算尽其所能打破现状,并表示自己还“太年轻”,无法接受一个由他所描述的“不择手段者”所统治的制度。

Tinkerfont 是一款专为设计师和开发人员打造的浏览器扩展程序,旨在无需修改代码即可在实时网页上快速检查、测试和替换字体。 Tinkerfont 源于在客户项目或接手代码库时对排版进行轻松实验的需求,提供流畅的工作流程。主要功能包括: * **检查:** 右键点击任意文本,即可查看其字体族、字重、字号、颜色和对比度。 * **检测:** 查看页面上使用的所有字体族的详细列表。 * **替换:** 即时测试来自 Bunny Fonts 的 1,900 多种开源字体,或上传您自己的本地字体文件。 * **范围与持久化:** 将更改应用于特定页面元素,并按主机名保存规则。 该扩展程序秉持隐私至上的原则,完全免费,无需注册账户,所有数据均存储在您的本地设备上。它适用于 Chrome 和 Firefox 浏览器,利用 Manifest V3 和 mutation observers 技术,确保字体替换在动态网页和单页应用中保持稳定。 您可以在 [mighil.com/tinkerfont](https://mighil.com/tinkerfont) 获取文档、安装链接及更多详细信息。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 构建 Tinkerfont 的笔记 (mighil.com) 4 个积分,由 surprisetalk 发布于 1 小时前 | 隐藏 | 过往 | 收藏 | 讨论 | 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 加入 YC | 联系 搜索:

在美国,拥有住房变得越来越遥不可及。高昂的房价与高企的抵押贷款利率相叠加,再加上个人储蓄的枯竭,使得购房门槛不断攀升。通货膨胀和更广泛的全球不确定性加剧了经济压力,迫使许多潜在买家重新考虑将租房作为唯一可行的选择。 盖洛普最近的一项民意调查显示,消费者对房地产市场的信心已跌至历史最低点。如今,三分之二的美国成年人认为现在不是买房的好时机。这种悲观情绪与疫情前的趋势形成了鲜明对比;在2022年之前,即便是在2008年金融危机期间,美国民众对房地产市场的信心也始终保持在50%以上。然而,目前的信心水平已降至盖洛普自1978年开始追踪该数据以来的最低点,反映出美国人的“住房梦”正发生深刻的转变。

本文探讨了关于 2026 年维基百科删除 Odin 编程语言词条的争议。在经过“删除讨论”(AfD)流程后,贡献者们认为该语言因缺乏可靠的独立来源而不具备知名度;对此,该语言的创建者“GingerBill”及其同行 Casey Muratori 公开抨击维基百科,将其贴上“被意识形态俘获的机构”这一标签。 作者认为,这些关于“激进派把关”的指控毫无根据,并指出编辑们的共识是基于既定的可验证性程序准则,而非政治偏见。文中强调了现代非正式编程生态(知识多存在于 Discord、个人博客和 GitHub 中)与维基百科对传统、可验证媒体的依赖之间存在脱节。 最终,文章认为像 GingerBill 这样的网红利用此类争议进行“流量收割”。通过将一次标准的程序性拒绝描绘成针对“意识形态游乐场”的文化战争,这些人物迎合了特定受众的偏见。作者总结道,虽然维基百科的规则可能难以顾及现代编程的细微之处,但关于阴谋和迫害的指控,很大程度上是一种表演性、反主流的在线文化的产物——这种文化比起建设性地参与规则讨论,更倾向于制造愤怒诱饵。

```Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Odin、维基百科与参与度耕作 (katamari64.se) 13 分,由 stock_toaster 发布于 36 分钟前 | 隐藏 | 过往 | 收藏 | 讨论 | 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索: ```

詹姆斯·希克曼(James Hickman)认为,美国250年的历史由一个反复出现的悖论所定义:深刻的国内动荡与非凡的创新并存。在整个20世纪,美国经历了严重的社会不稳定、政治暴力、金融恐慌以及政府职能的扩张,包括美联储的建立和所得税的实施。然而,这些从20世纪初到70年代滞胀时期的“黯淡”阶段,却始终催生了革命性的技术突破,最终推动了国家的发展。 如今,尽管美国正面临着新的政治分裂、债务攀升和社会动荡,但它同时也走在人工智能、生物技术和核能领域的前沿。希克曼认为,美国的韧性根植于其对个人自由的根本承诺。虽然未来的道路很可能包含通货膨胀和不稳定,但历史表明,押注美国理念的失败是一个赔本的买卖。他总结道,虽然最好的日子很可能还在后头,但个人应当制定一份“B计划”——这并非出于恐惧,而是为了确保在不可避免的动荡时期,能够立于不败之地。

正在建立安全连接... 请启用 JavaScript 以继续。 请求 ID: f0e7ec8a160e9bfb8993c00d3141b201

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 质疑《独立宣言》(historytoday.com) 4 点,由 pepys 发布于 1 小时前 | 隐藏 | 过往 | 收藏 | 讨论 | 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

由于人工智能推理需求超过了英伟达 Blackwell GPU 的供应,相关成本正在飙升。Wafer 认为,AMD 的 Instinct MI350 系列提供了一个极具吸引力且性价比更高的替代方案,其每块 GPU 的价格约为英伟达竞品的 2.75 分之一,且拥有相当的硬件规格。 尽管英伟达的“首日”软件支持仍然是一项重要优势,但“CUDA 护城河”正在迅速瓦解。Wafer 表明,在 AMD 平台上实现高性能推理,更多地取决于优化,而非硬件本身的局限性。通过采用 AMD Quark 的 MXFP4 量化、选择战略性框架(sglang)以及对内核回退(kernel fallbacks)进行自定义调整等技术,Wafer 在 GLM5.2 模型上实现了惊人的吞吐量。 在基准测试中,Wafer 在 MI355X 上达到了 2626 tok/s/node 的总吞吐量,以不到一半的成本实现了 B200 性能的 80%。尽管目前 AMD 的技术栈需要更多的手动配置和工程投入,但 Wafer 证明,通过适当的优化,AMD 硬件能够提供最佳的推理性能价格比,有效地缩短了与英伟达在实时性能上的差距。

最近一篇 Hacker News 帖子指出,Wafer.ai 正在 AMD MI355X 硬件上运行 GLM5.2,速度达到每节点 2,626 tokens/s,并声称其成本比英伟达的 Blackwell 架构低 50% 以上。 用户间的讨论主要集中在 AMD 作为英伟达替代方案的可行性上,特别是在电力成本高昂且英伟达供应受限的国际市场。主要观点包括: * **性能指标:** 用户要求提供“每瓦性能”数据,并指出能源效率和软件可靠性对于在美国境外运营的数据中心至关重要。 * **软件解锁:** 一位评论者建议,“代理编码驱动程序”(agentic coding drivers)的兴起可能会推动替代架构支持的普及,使工程师能够比过去更轻松地针对 AMD 等硬件进行优化。 * **商业模式:** 讨论中提出了有关底层经济性的问题,特别是较低的成本究竟是由于更高的毛利率,还是硬件利用率的限制所致。 总体而言,该讨论反映出人们对 AMD 作为英伟达统治地位潜在挑战者的兴趣日益浓厚,前提是其软件支持和能源效率能够在大规模应用中得到验证。

GITHUB × 2026 世界杯 将你的 GitHub 数据转化为 99 分制的“世界杯风格”球员卡。 试试 torvalds、sindresorhus 或你自己的用户名。 已生成 150,990 张卡片 运作方式 ↗ 96 ST (前锋) TORVALDS 82 速度 77 盘带 92 射门 58 防守 87 传球 95 身体 94 CM (中场) THEPRIMEAGEN 78 速度 83 盘带 91 射门 56 防守 87 传球 94 身体 86 ST (前锋) PEWDIEPIE 77 速度 75 盘带 95 射门 75 防守 91 传球 69 身体 GITFUT.COM @pewdiepie-archdaemon 95 CM (中场) BROWNE 77 速度 81 盘带 90 射门 58 防守 90 传球 93 身体

Hacker News | 最新 | 往期 | 评论 | 提问 | 展示 | 招聘 | 提交 | 登录 GitFut – 将你的 GitHub 数据转化为世界杯风格的球员卡片 (gitfut.com) 3 分 | redbell | 59 分钟前 | 隐藏 | 往期 | 收藏 | 2 条评论 thi2 | 2 分钟前 | 下一条 [-] 在手机上滚动页面时,图片的大小似乎会发生变化。 另外,我不清楚这些数据代表什么。我不会称其为世界杯风格,这难道不是在模仿 FIFA 终极球队(Ultimate Team)的卡片吗? 回复 xinayder | 17 分钟前 | 上一条 [-] 这些卡片并不是世界杯卡片(我本以为是 Panini 贴纸相册风格),从整个网站的风格来看,可以看出这是通过“氛围编码”(vibecoding)做出来的。 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

为了确保本地开发环境与生产环境的一致性,Encore 将基础设施直接集成到了其运行时中,而不是依赖外部的 Docker 容器。此前,基于 Go 的 Encore 应用使用的是内存版 Redis;而在开发新的 Rust 运行时以避免管理辅助进程的复杂性时,团队需要一种原生的解决方案。 Encore 的开发者通过将 `miniredis` 库移植到 Rust 来解决了这个问题。该实现作为运行时内部的一个库运行,提供了一个功能完备的 Redis 服务器,支持通过标准 Redis 通信协议进行事务、Lua 脚本和发布/订阅等复杂操作。通过嵌入服务器,Encore 允许开发者在代码中声明缓存基础设施,无需手动设置;运行时会自动检测环境,并根据情况在托管的 Redis 连接与本地内存实例之间进行切换。 为了保证高保真度,团队通过运行原始 Go 实现的集成测试套件来验证了该 Rust 移植版本,并逐字节对比了响应结果。这确保了应用逻辑在开发和生产环境中表现一致。最终,这种方法消除了管理本地依赖的繁琐,同时保持了生产部署所需的严格运维标准。

Encore.dev 团队在其运行时中内置了一个用 Rust 编写的、兼容 Redis 的服务器,专门用于本地开发。 这一公告在 Hacker News 社区引发了质疑。批评者认为,为了确保与官方更新保持字节级的兼容性而维护一个 Redis 的重实现,相比直接运行标准的 Redis 容器,是一种不必要的技术负担。 评论者指出,Docker Compose 和 TestContainers 等工具已经让管理 Redis 实例变得非常简单,这使得该内部实现所谓的“易用性”论点显得苍白无力。一些贡献者将这种做法称为“疯狂”,认为为了避免运行一个额外的容器而重写复杂的底层架构,是在为不存在的问题提供一种过度设计的解决方案。

点击“第二步”即表示您知悉并同意本网站将在您的设备上运行开源内核漏洞利用程序。若运行成功,该程序可能会执行以下操作:在 Firefox 的私有数据存储中创建临时文件;向 /bin/su 和 /data/local/tmp/su 写入文件;修改您的设备壁纸;进行可能影响设备稳定性的系统级更改。 此内核漏洞利用程序处于实验阶段,可能不稳定。它可能导致意外行为、系统崩溃、数据损坏或永久性数据丢失。在继续之前,您应该:备份所有重要数据;明确此操作可能会对您的设备进行系统级修改;仅在您拥有或已获得明确测试许可的设备上进行操作;并对可能发生的任何损坏、不稳定或数据丢失承担全部责任。除非您完全理解相关风险,否则请勿继续。 我已了解相关风险,并同意在此设备上运行该漏洞利用程序。

Hacker News | 最新 | 往日 | 评论 | 提问 | 展示 | 招聘 | 提交 | 登录 将权限从 Firefox 提升至 Android Root (nebusec.ai) 9 点,由 kozika 发布于 52 分钟前 | 隐藏 | 往日 | 收藏 | 3 条评论 帮助 gnabgib 18 分钟前 | 上一条 | 下一条 [–] 绝对不是标题(IonStack) 回复 LordShredda 35 分钟前 | 上一条 [–] 好吧,我不该点这个的。它声称在运行漏洞利用程序前会请求确认,但我的壁纸还没变。 回复 krautsauer 0 分钟前 | 父评论 [–] 如果评论正文里有链接就好了。 > 警告:实验性内核漏洞 > 点击“第二步”,即表示您知悉并同意该网站将在您的设备上运行开源内核漏洞。 话又说回来,点进这样的网站,且不是每次点链接都被询问,确实存在风险。 回复 准则 | 常见问题 | 列表 | API | 安全 | 法律 | 加入 YC | 联系 搜索:

Leanstral 1.5 是一个用于 Lean 4 证明工程的全新开源(Apache-2.0)模型。它拥有 119B 总参数(6B 激活参数),在形式化验证领域展现出顶尖性能,且成本仅为同类竞争模型的一小部分。 该模型在各项主要基准测试中表现卓越:在 miniF2F 上达到满分(100%),在 FATE-H/X 上创下新纪录,并解决了 PutnamBench 中的 587/672 道难题。值得注意的是,它实现了极高的成本效益——平均每道题仅需约 4 美元,远低于其他方案数百美元的成本。Leanstral 1.5 展现了强大的测试时扩展能力,在高达 400 万个 token 的推理预算下仍能保持稳定的推理性能。 除数学领域外,Leanstral 1.5 还能验证复杂的代码属性并发现现实世界的漏洞。它成功验证了 AVL 树的 O(log n) 复杂度,并在开源 Rust 代码库中发现了 11 个真实存在的漏洞,其中包括此前未被报告的边界情况。 Leanstral 1.5 经过严谨的三阶段训练过程(包括多轮证明环境和代码代理工作流),现已通过 Hugging Face 和免费 API 接口开放使用。它针对“Mistral Vibe”进行了优化,使开发人员能够将形式化验证无缝集成到现有的代码库和工作流程中。

这场 Hacker News 讨论聚焦于 **Leanstral 1.5** 的发布,这是一个专用于 Lean 自动定理证明的模型。 尽管该项目强调了模型能够捕捉到一个棘手的整数溢出错误(作者称传统测试通常会遗漏该错误),但评论者对此表示怀疑。多位用户指出,此类边界情况是常规质量保证(QA)和模糊测试的重点,并对作者的叙述方式提出了质疑。这场辩论凸显了一种反复出现的矛盾:批评者认为这些成果可能是被夸大的“AI 垃圾”,而支持者则强调,像 Lean 这样的形式化证明辅助工具,消除了开发者手动编写复杂测试用例的需求。 技术反馈建议,为了让 Leanstral 这类工具更具实用性,开发者需要更好的文档、更清晰的提示词构建指南,以及对强化学习(RL)记录的访问权限,以便了解如何有效地与模型进行交互。该讨论串还推广了 **OpenATP**,这是一个旨在帮助用户在本地实验这些代理定理证明器的开源框架。

请启用 JavaScript 和 Cookie 以继续。

Hacker News | 最新 | 往日 | 评论 | 提问 | 展示 | 招聘 | 提交 | 登录 让你的大脑思考与观察的电路 (columbia.edu) 5 点,由 hhs 发布于 33 分钟前 | 隐藏 | 往日 | 收藏 | 讨论 | 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

十七世纪时,阿姆斯特丹巨大的财富和工业增长,使得城市面临严重的火灾风险。起初,该市使用抽水机进行灭火,但随着一家大型制糖厂和一家世界知名的印刷厂被彻底烧毁,事实证明这些设备并不足以应对灾情。 多才多艺的画家兼发明家扬·范·德·海登(Jan van der Heyden)改变了这一局面。他运用“系统分析”的方法,开创了更先进的消防技术,包括柔性皮革吸水软管,以及用于保持连续高压水流的空气室。 除了硬件之外,范·德·海登还全面改革了城市的应急基础设施。他建立了一个协调一致的响应网络,包括警报系统、各区消防队,以及针对快速响应的经济奖励机制。到1682年,这种将技术创新与城市管理相结合的综合策略,大幅降低了火灾造成的损失。范·德·海登的改革使阿姆斯特丹从一个易受灾难侵袭的城市,转变为欧洲最具防火韧性且组织最为严密的城市之一,为系统化的城市危机管理树立了早期标杆。

Hacker News | 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 | 登录 阿姆斯特丹发明了消防队 (worksinprogress.co) 15 分,zdw 发布于 44 分钟前 | 隐藏 | 过往 | 收藏 | 3 条评论 decimalenough 19 分钟前 | 下一条 [–] 发明?古罗马有话要说:城市夜巡队(Vigiles Urbani)的历史可以追溯到公元 6 年。https://en.wikipedia.org/wiki/Firefighting_in_ancient_Rome 私人消防队甚至更早,克拉苏(Crassus)在这方面尤其臭名昭著:https://en.wikipedia.org/wiki/Marcus_Licinius_Crassus 回复 stingraycharles 5 分钟前 | 父评论 | 下一条 [–] 确实,这篇文章标题党了,更准确的标题应该是他们改进了或扩大了其规模。 回复 irishcoffee 12 分钟前 | 上一条 [–] 阿姆斯特丹并没有发明消防队。这太荒谬了。 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

本文提出了“嵌入坍缩”(embedding condensation)这一概念,即较小语言模型中的词嵌入会坍缩至一个狭窄的锥形子空间,从而限制了其表达能力。观察结果证实,这种现象在小模型中比在大模型中更为显著,存在于各种数据集,且源于模型初始化阶段。关键在于,作者证明了利用大模型进行知识蒸馏无法缓解这一坍缩问题。 为解决该问题,作者引入了“离散损失”(dispersion loss)。该训练目标旨在通过鼓励嵌入在单位超球面上分布开来,从而抵消坍缩。通过促进均匀的角离散,该技术使小模型能够获得更接近大模型的高质量潜在表征。实验结果表明,在训练中加入离散损失可有效缓解嵌入坍缩,为在不增加参数规模的前提下缩小小型与大型语言模型之间的性能差距提供了有效路径。作者总结认为,模型的优异性能不仅源于其规模,还源于其潜在信息的结构化组织方式。

Hacker News 上近期的一项讨论关注了研究论文《分散损失抵消小型语言模型中的嵌入凝聚》(Dispersion loss counteracts embedding condensation in small language models)。 该讨论的核心议题涉及“嵌入凝聚”(embedding condensation)现象,以及将“分散损失”(dispersion loss)作为一种缓解策略的应用,特别是在小型语言模型中的应用。评论者探讨了大型语言模型(LLM)存储信息方式的更广泛影响,并引用了“语言模型物理学”(Physics of Language Models)框架,该框架估计模型每个参数大约保留两比特的事实知识。 参与者指出,这项研究最可能适用于小规模模型,这与大型语言模型通常所需的海量计算资源形成了对比。讨论还涉及了参数分布与模型量化能力之间的关系,认为更广泛的分布能够使模型更有效地被压缩。

Steam Controller Auto-Charge 是一款开源 Web 应用程序,可自动将 Steam 控制器导航至其磁吸充电底座上。该系统利用头顶摄像头,结合用于 Lucas-Kanade 光流跟踪的 OpenCV.js 以及基于浏览器内 Rust/WASM 的 CNN(卷积神经网络)进行目标检测。 该应用通过 WebHID API 与控制器通信,利用其内部的线性谐振执行器(LRA)产生 70Hz 的触觉脉冲,从而将设备“震动”至底座。为确保平稳的对接过程,系统采用了“近距离缓行”模式,当控制器处于目标 150 像素范围内时,会降低触觉强度。此外,该应用还会拦截特定的控制器报告,以实时监控电池状态和电压。 该项目使用 Vue 3 构建,具有跨平台特性,仅需 Nix 包管理器和基于 Chromium 的浏览器即可运行。它提供了一种无缝的自动化体验,并可在需要时进行手动跟踪覆盖。本项目灵感源自 Very Lazy Pixel,为家庭自动化领域中计算机视觉和硬件遥测技术的应用提供了一个复杂的实现方案。

Hacker News 最新 | 往日 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Steam Controller 自动充电 – 使用计算机视觉(CV)将原型机改装为磁吸充电底座 (github.com/fossprime) 15 分分,由 zdw 发布于 49 分钟前 | 隐藏 | 往日 | 收藏 | 讨论 | 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

发表在《科学》杂志上的一项新研究对一个长期存在的理论提出了挑战,即高大的热带树木由于难以将水分输送到最高枝叶,而天生更容易受到干旱的影响。 通过研究马来西亚婆罗洲的巨型龙脑香科树木(其中一些高度超过 80 米),研究人员发现这些树木已经进化出了复杂的液压适应能力。其中包括加宽靠近树干底部的输水导管,以及使叶片能够承受显著的水分压力。这些调整使树木能够完全补偿高度带来的影响,确保其内部的水分系统无论长到多高都能保持高效运行。 研究关键发现,与高度相关的生长并不会增加树木对干旱的敏感性。这反驳了现有的气候变化模型,该模型曾预测最高、碳密度最大的树木在干旱时期面临的风险最大。由于这些巨树储存了全球一半以上的地上森林碳,这一发现对于准确预测热带生态系统将如何应对气候变暖至关重要。研究人员强调,这些发现有力地支持了保护这些具有韧性且生态上至关重要的森林的必要性。

Hacker News 最新 | 往期 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 巨树将水分输送到顶端枝叶并无困难 (exeter.ac.uk) 13 分由 hhs 发布于 48 分钟前 | 隐藏 | 往期 | 收藏 | 2 条评论 帮助 nullorempty 12 分钟前 [–] > 巨树将水分输送到顶端枝叶并无困难 嗯,可能是因为它们并不是真的在“泵送”水分? 回复 leni536 6 分钟前 | 父节点 [–] 那你管这叫什么? 回复 指导原则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

黑石集团旗下的 QTS Realty Trust 已退出北弗吉尼亚州庞大的“威廉王子数字门户”(Prince William Digital Gateway)项目,这对人工智能基础设施的开发是一个重大挫折。虽然当地的反对声音最初看起来像是群众运动,但有报告指出,这些行动是旨在拖延美国人工智能进步的有组织活动的一部分。 包括 Y Combinator 创始人加里·谭(Garry Tan)在内的批评人士指出了比特币政策研究所(Bitcoin Policy Institute)的研究,该研究确定了一个由内维尔·罗伊·辛格姆(Neville Roy Singham)资助的左翼非营利组织网络。辛格姆是一位据报道与中国共产党宣传机构有联系的亿万富翁。调查显示,该网络已成功阻止或推迟了数十亿美元的美国人工智能基础设施项目。 联邦当局目前正在审查辛格姆及相关非政府组织是否参与了金融犯罪。这种阻力并未被视为自发的社区担忧,而是被视为旨在削弱美国在全球计算竞赛中竞争力的“非常规战争”的一个侧面。随着美国加速人工智能建设,这些调查结果凸显了国内激进主义、外国影响力和国家安全利益之间日益交织的复杂局面。

这篇文章剥离了晦涩的术语,揭示了数字技术的根本原理,从而为现代计算的“魔法”解密。文中指出,我们流畅的设备背后是一套复杂的抽象层,每一层都凝聚了人类的智慧。 这一过程始于物理学:利用电流驱动开关(晶体管),进而组合成逻辑门。这些逻辑门实现了二进制运算、数据存储及指令执行。以此为起点,文章梳理了计算技术的发展脉络: * **硬件**:晶体管如何演变为通过“取指-译码-执行”周期来运行指令的处理器。 * **软件**:编程语言(从汇编到 Python)如何将人类逻辑转化为机器可读的代码。 * **系统**:操作系统如何管理多任务和内存,以及网络如何实现全球互联。 文章最终认为,软件素养已不再仅仅是计算机科学家的专属,而是驾驭数字优先世界的生存技能。通过掌握这些思维模型,我们能够更安全地使用技术、高效排除故障,并利用人工智能构建工具,从而确保自己是技术的主人,而非被动的从属者。

这篇 Hacker News 讨论聚焦于文章《软件:从第一性原理出发》,该文通过图表和模拟来解释底层的计算概念。 虽然评论者称赞了作者通过视觉辅助工具揭开了软件运行原理的神秘面纱,但也提出了几点批评。用户认为文本过于冗长,并批评作者劫持了浏览器的“后退”按钮,以及包含了关于人工智能的不必要的社论式评论。一个特别引起争议的点是作者将 CPU 比作“会计算的石头”,一些读者认为这种比喻既屈尊俯就又陈词滥调,将其视为以牺牲准确性为代价来简化技术。 作者“faza”积极回应了这些反馈,承认了技术问题(如后退按钮的错误),并表示愿意在未来的内容中改进,保持语气自然,避免使用社论式的修辞。归根结底,这篇讨论凸显了社区对技术深度和清晰度的欣赏,同时也揭示了他们对技术写作中过度简化或“奇观化”的营销语言缺乏容忍度。

**Nerdle** 源于伦敦交通堵塞时的一次闲聊,是由数据科学家 Richard Mann 和他的孩子们共同打造的数学版“Wordle”游戏。自迅速走红以来,它不仅吸引了从比尔·盖茨到 Stormzy 等各界名流,更成为了那些比起词汇更钟情于逻辑与算术的玩家们的必备游戏。 **游戏体验:** Nerdle 提供了一种基于逻辑推理的益智体验,既有挑战性又不失公平。凭借简洁的设计、针对移动端优化的自定义键盘,以及详尽的历史游戏存档,它堪称绝佳的每日大脑锻炼工具。尽管玩法几乎无可挑剔,但用户体验却因那则阻挡在玩家与首个猜题步骤之间的侵入式全屏隐私声明而大打折扣。 **结论:** 虽然 Nerdle 本质上是 Wordle 的模仿之作,但它凭借独特的个性和“数学友好型”魅力脱颖而出。它在适度、非侵入式的广告与统计数据、联赛及慈善支持等深层功能之间取得了平衡。在 DLE 评测框架中获得 **84/102** 分的 Nerdle,是一个精致、易上手且充满温情的项目,它证明了一个由家庭成员共同构思的简单创意,也能演变成风靡全球的数字经典。

2026年4月,Anthropic宣布其最新的内部模型(Claude Mythos Preview)具备了自主发现并利用网络安全漏洞的能力。此后,Anthropic和OpenAI均致力于利用前沿模型来加固关键软件,以防恶意行为者利用同类模型进行破坏。研究表明,在这些公告发布后,常见漏洞与披露(CVE)的数量显著激增。与Mythos Preview发布前的月度纪录相比,6月份高危及严重漏洞的数量增加了3.5倍以上。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 在 Claude Mythos Preview 发布前后,新的严重漏洞激增 (epoch.ai) 4 分,由 cubefox 发布于 1 小时前 | 隐藏 | 过往 | 收藏 | 讨论 | 帮助 准则 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

本文认为,美国工人的士气低落并非源于“静默离职”或懒惰,而是对破碎的经济契约作出的理性反应。尽管生产力几十年来不断增长,工人的薪酬却停滞不前,而住房、医疗和育儿成本却飙升。 作者强调了企业如何通过股票回购和极端的员工薪酬比率,将股东回报置于员工稳定之上。与此同时,机构投资者将住房变成了投机工具,使中产阶级家庭几乎无法实现购房梦。美国的医疗和退休体系进一步将风险和成本从雇主转嫁给个人,导致工人在索赔被拒、医疗债务和养老金储蓄不足的困境中苦苦挣扎。 通过将美国与其他将医疗、育儿和休假视为公共产品的发达经济体进行比较,作者指出,当前的美国危机是特定政策选择的结果。归根结底,工人们感到“士气低落”,是因为他们履行了社会契约中的义务——努力工作并储蓄——却发现整个体系对他们不利。由此产生的疏离感,是对“美国梦”已无法平衡这一现实的理性妥协。

Hacker News 最新 | 过往 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 白领工作者的士气低落 (nooneshappy.com) 6 分,njrc 发布于 38 分钟前 | 隐藏 | 过往 | 收藏 | 2 条评论 | 帮助 felix-the-cat 1 分钟前 | 上一条 | 下一条 [–] 关于医疗保健的问题我深有同感,几年前我是一名独立承包商,我的健康保险费一年将近 2.5 万美元,而且免赔额高达 6500 美元。如果必须购买私人医疗保险,这简直荒唐透顶。 回复 robin_reala 5 分钟前 | 上一条 [–] 提醒(文章在提到员工生产力和薪资增长的语境下仅提及一次):https://ethanmarcotte.com/books/you-deserve-a-tech-union/ 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

Bas van Geffen 的最新报告重点介绍了中央银行和全球市场的关键动态。在欧洲央行辛特拉会议上,官员们重申了对央行独立性的承诺,尽管目前美国联邦储备委员会的自主权面临法律挑战,且其领导层可能因政治压力而面临重组。 在财务方面,欧洲央行正考虑提高银行的最低存款准备金要求。此举旨在缓解因向超额准备金支付利息而导致各国央行亏损所带来的政治敏感性,而非将其作为常规的货币政策工具。 在美国,6 月份疲软的非农就业数据和不断下降的劳动参与率导致市场下调了对美联储加息的预期,在人工智能行业重新焕发的乐观情绪推动下,股市因此受到提振。 在地缘政治方面,尽管近期美国与伊朗的谈判在未发生重大冲突的情况下结束,但在冻结资产的解封和霍尔木兹海峡通行费的控制权问题上,双方仍存在严重分歧。尽管政治言辞显示出进展迹象,但协议的执行因诉求冲突而陷入停滞,地区紧张局势依然高涨。

俄亥俄州哥伦布市娱乐与公园管理局曾发布一条现已删除的社交媒体帖子,宣布市政厅将升起索马里国旗以庆祝索马里独立日,此举引发了保守派评论员和立法者的强烈抵制。 包括斯蒂芬·米勒(Stephen Miller)和俄亥俄州众议员布莱恩·斯图尔特(Brian Stewart)在内的批评人士谴责此举“反美”,认为政府大楼不应悬挂外国国旗,尤其是在美国即将庆祝建国250周年之际。一些官员进一步指出,这种姿态阻碍了文化融合,并削弱了公共机构的宗旨。 在舆论哗然及媒体质询后,该市删除了相关帖子。市政府发言人随后澄清称,最初的公告并不准确,表示国旗不会被升起,并称市政府误传了一项错误的政策。

联系我们 contact @ memedata.com