## DeepMind 的象棋 Transformer:摘要 DeepMind 最近发表了一篇论文,详细介绍了一种训练来下象棋的 Transformer 模型,模仿了强大的引擎 Stockfish 16。该模型预测状态的价值、采取行动的价值以及可能走法的概率分布——类似于 AlphaZero 的架构,但增加了一个行动价值预测。 作者声称达到了大师级水平,证据是 Lichess Blitz 评分为 2895。然而,该论文的新颖性受到质疑,因为像 Leela Chess Zero (Lc0) 这样的开源项目已经显著超越了 AlphaZero 的表现。Lc0 的当前网络可能实现了与 DeepMind 模型相当或更高的 Elo 评分,甚至*没有*价值头。 关键在于,该论文的分析被认为很薄弱,作者似乎暗示他们的模型*优于*其训练数据(Stockfish),并依赖于人类大师的意见——比 Stockfish 弱得多的棋手——来解决差异。该研究很大程度上忽略了 Lc0 社区所做的重大进展,引发了对其整体严谨性和对该领域的贡献的担忧。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Contra “无需搜索的大师级国际象棋” (2024) (tardis.ac) 7 分,luu 发表于 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

一场 Hacker News 的讨论围绕着 Scott Shambaugh 的一篇博客文章,文章称一个名为“MJ Rathbun”的 AI 代理发表了一篇损害他的文章。Shambaugh 提供了证据——账户持续的、全天候的活动以及文章发布的时间——表明该账户是自主 AI 运作的。 然而,评论者对此表示怀疑。一位用户直接称作者“妄想”,否认 MJ Rathbun 是 AI。其他人指出 Shambaugh 越来越戏剧化的在线行为,认为他可能为了吸引注意力而夸大其词,正经历危机,甚至*是* MJ Rathbun 试图表达某种观点。 争论的中心在于 MJ Rathbun 是否是一个真正的 AI,一个假装是 AI 的人类,或者 Shambaugh 是否误解了情况,需要寻求帮助。这场讨论凸显了对识别 AI 生成内容以及潜在的网络骚扰的担忧。

Meta 将于 2026 年 4 月停止其独立的 Messenger 桌面应用程序和网站 (Messenger.com),完全过渡到 Facebook.com/messages 或移动应用程序。桌面应用程序已于 2025 年 12 月停止服务。 此决定反映了 Meta 将战略重点转向优先发展移动和浏览器消息传递,理由是桌面版的使用率较低。鼓励用户启用 PIN 保护等安全功能,以在不同设备上保持对其聊天记录的访问权限。 即使是之前*无需* Facebook 帐户即可使用 Messenger 的用户,仍然可以通过移动应用程序访问他们的聊天记录。Meta 旨在通过此更改简化其通信平台,并与 Facebook 集成更新和功能,这符合更广泛的行业趋势,即转向集中的网络和移动体验。此举受到了用户的褒贬不一的反应,一些用户对失去专用的桌面体验表示失望。

Meta计划在2026年4月停止桌面版Messenger应用和Messenger.com,将用户引导至Facebook.com进行电脑端消息传递。这一消息引发了Hacker News评论员的怀旧之情,他们回忆起Pidgin和Trillian等更通用、功能更强大的聊天客户端。 用户们欣赏这些旧应用的功能——在一个地方支持多个网络、原生GUI工具包,以及最重要的永久聊天记录存储(或删除选项)。虽然Beeper等替代方案存在,但由于平台限制,维护与各种消息网络的兼容性始终是一个挑战,这通常与广告收入或安全问题有关。 评论员们还反思了Facebook早期成为通用在线身份提供商的潜力,并遗憾于糟糕的商业决策阻碍了这一点。最终,Meta的举动似乎是在强迫用户回到核心Facebook平台。

佛罗里达州众议员兰迪·菲恩因表示更喜欢狗,而非满足一些穆斯林认为狗“不洁”的要求,而引发了民主党人的广泛谴责。这场争议始于一位纽约活动家评论不喜欢将狗作为室内宠物,随后菲恩直言不讳地回应,将其定性为在美式价值观与满足此类要求之间做出选择。 包括卡纳、戈德曼、斯瓦洛韦尔和奥卡西奥-科尔特斯等民主党议员迅速将菲恩的声明定性为“带有偏见”、“仇视伊斯兰”和“令人厌恶”,呼吁对其进行谴责,甚至要求其辞职。批评人士认为,他根据一个人的观点对整个宗教进行了不公平的概括。 菲恩为自己的立场辩护,认为这是为了抵制改变美国生活方式和价值观的要求。他反击了批评,指责民主党人将开放边界和特权置于保护美国文化之上。这起事件引发了关于宗教宽容、文化价值观和政治言论的激烈辩论。

## 特斯拉Robotaxi事故率担忧增加 最近提交给NHTSA的数据显示,得克萨斯州奥斯汀市特斯拉“Robotaxi”车队出现令人担忧的趋势。2025年12月和2026年1月报告了五起新事故,自2025年6月服务启动以来,总事故数达到14起。值得注意的是,特斯拉悄悄地将一份7月份的事故报告升级,以包含住院情况,而这一细节最初并未公开披露。 这些事故涉及与固定物体、公交车和其他车辆的低速碰撞,通常发生在静止状态或执行简单的操作(如倒车)时。特斯拉独特地删除了所有事故描述,理由是“保密商业信息”,从而阻碍了独立分析。 目前,该车队每行驶57,000英里就会发生一起事故。这一事故率显著高于特斯拉自身的安全基准——几乎是人类司机轻微碰撞事故率的四倍,尽管车内配备了能够进行干预的安全监控员。与Waymo的大量无人驾驶里程和远低于此的事故率相比,特斯拉的表现引发了严重质疑,尤其是在他们开始提供*没有*安全监控员的乘车服务之后。特斯拉对这些事故缺乏透明度是一个日益增长的担忧。

## 特斯拉Robotaxi事故引发安全担忧 最近的报告显示,特斯拉在奥斯汀的“Robotaxi”项目在一个月内发生了5起事故,事故率是人类驾驶员的四倍。这引发了关于特斯拉自动驾驶技术安全性和准备程度的争论。 评论员表示担忧,这些事故可能会损害公众对自动驾驶汽车的整体看法,因为消费者可能无法区分特斯拉的系统和Waymo等更先进的方法。一个主要的批评是特斯拉在报告事故细节方面缺乏透明度,阻碍了对事故责任的独立评估。 讨论的中心是特斯拉“仅摄像头”方法与使用激光雷达和雷达的系统之间的可行性,一些人认为这是一种由不耐烦驱动的缺陷策略。另一些人则指出安全驾驶员的招聘问题,并质疑该技术是否*能*达到必要的安全水平。虽然一些人认为这些事故很小,但另一些人强调,即使是低速碰撞也可能表明存在系统性问题。报告来源也存在争议,一些人声称存在偏见。

## CBS 与 FCC 争议 - 摘要 一份最新报告称,CBS 因联邦通信委员会 (FCC) 威胁执行“平等时间”规则,禁止了一次对民主党候选人的采访。 这引发了 Hacker News 上关于潜在审查和媒体自由受损的讨论。 评论员们争论了“平等时间”规则的适用性,该规则传统上免除了脱口秀节目(自里根政府以来),但最近 FCC 重新解释为*包括*深夜节目。 一些人认为这是出于政治动机的举动,是对批评前政府的节目的报复,并且在没有适当规章程序的情况下实施。 另一些人指出,该规则适用于使用公共无线电波的人,应予以遵守。 一个关键点是深夜节目是否符合“新闻”节目的资格,这会影响规则的应用。 这次讨论凸显了人们对专制倾向的担忧,即仅仅*恐吓*媒体就足以压制异议的声音。

## AsteroidOS 2.0:智能手表重大更新 AsteroidOS 2.0已发布,带来了由社区贡献驱动的重大改进和新功能。此版本专注于设计、易用性和性能,包括始终显示、可定制的快速设置和更流畅的UI动画。电池续航也得到了优化,并修复了大量稳定性问题。 一个主要亮点是手表支持的显著扩展,现在包括来自Fossil、华为、LG、Moto、OPPO、Polar和Ticwatch的型号。虽然一些旧型号(Casio、LG Urbane、Moto 360 1st gen、Samsung Gear 2/Live)具有部分/实验性支持,但团队欢迎贡献以改进它们。值得注意的是,Samsung Gear 2支持使用了主线Linux内核,这是AsteroidOS的首次。 除了核心操作系统改进之外,该更新还与AsteroidOS Sync、Gadgetbridge、Amazfish和Telescope等同步客户端集成。社区贡献是AsteroidOS的核心,新的表盘、应用程序(如2048移植版和GPS地图应用程序)和工具不断涌现。 团队已经改进了其网站,提供了详细的手表图库和文档,并鼓励通过论坛、GitHub、翻译工作和开发来参与。未来的计划包括更频繁的稳定版本以及健身应用程序和基于Web的工具等功能的路线图。

## AsteroidOS 2.0:用开源重焕智能手表生命力 AsteroidOS团队经过8年的开发,发布了其智能手表开源操作系统2.0版本。AsteroidOS基于Linux构建,旨在延长有能力的智能手表硬件的使用寿命,即使在制造商停止支持之后,也能对抗电子垃圾。 该项目优先考虑隐私——零遥测数据和完全本地控制——并提供一个有趣且实用的平台,用于学习QML/Qt、JavaScript和嵌入式Linux开发。目前通过libhybris和旧内核支持设备,他们正在积极地将对特定型号的支持(如三星Gear 2和华硕ZenWatch 2)合并到主线。 AsteroidOS由一个小而友好的社区驱动,专注于可用性和令人满意的用户体验。该团队欢迎贡献、移植请求和反馈,并以创建开放的可穿戴生态系统为动力。

独立记者尼克·雪莉,因揭露明尼苏达州的福利欺诈而闻名,发布了一段新视频,指控加利福尼亚州存在选民违规行为。他的调查显示,选民登记册存在问题,包括已故人士和在可疑地点(如UPS商店)的登记。雪莉记录了宽松的选民身份验证要求——仅依赖签名——以及看似不可能的选民年龄(125岁)甚至成功的宠物狗登记事件。 雪莉认为,加利福尼亚州的系统,加上缺乏选民身份验证和疏忽的登记册更新,为欺诈创造了机会。他的发现与司法部最近对橙县隐瞒与非公民选民移除相关记录的诉讼相呼应。 作为回应,加利福尼亚州州长加文·纽森驳斥了这些指控,并将批评转向与唐纳德·特朗普有关的所谓欺诈行为,而不是回应雪莉调查提出的担忧。雪莉在之前的曝光后,现在需要24/7的安全保护。

## Wax:单文件AI记忆 Wax 提供了一个完整的检索增强生成 (RAG) 解决方案,用单个 `.mv2s` 文件取代了复杂的堆栈——无需数据库、Docker 或网络调用。它旨在快速且私密地为 AI 应用程序添加记忆。 **主要特性:** * **简洁性:** 所有数据(文档、嵌入、索引)都存储在一个可移植、自包含的文件中。 * **性能:** 实现亚毫秒级向量搜索(在 Metal GPU 上,10K 文档为 0.84 毫秒)。 * **持久性:** 具有强大的预写日志,防崩溃且抗断电。 * **确定性:** 保证相同查询的一致结果。 * **隐私:** 完全在设备上运行,确保零数据传输。 Wax 支持各种记忆类型——文本、照片(带有 OCR 和 CLIP)和视频(带有转录),并利用混合搜索(BM25、向量、时间)和分层压缩以获得最佳结果。它还具有确定性令牌预算,以防止上下文窗口溢出。 Wax 使用 Swift 构建,非常适合离线优先应用程序、注重隐私的产品以及需要可重现检索的研究。它可在 iOS/macOS 上使用 Apple Silicon 进行 GPU 加速。 ([https://github.com/christopherkarani/Wax](https://github.com/christopherkarani/Wax))

## Wax:苹果芯片上的亚毫秒RAG Christopher Karani 开发了 **Wax**,这是一种针对苹果芯片的新型检索增强生成 (RAG) 解决方案,设计为完全离线运行——无需服务器、API 或云依赖。它被打包成单个文件,为本地知识访问提供类似于 SQLite 的简单性。 Wax 通过利用 Metal 加速搜索和优化的内核,实现了在 10,000+ 向量上 **亚毫秒的向量搜索**。它将所有内容——嵌入、索引、元数据——存储在防崩溃的单个文件 (.mv2s) 格式中,从而实现轻松的可移植性和确定性结果。 主要功能包括 **多模态支持**(文本、照片、视频,带有 OCR 和关键帧索引)、**混合搜索**(结合 BM25、向量、时间线和结构化记忆)以及 **严格的 Swift 并发** 以确保线程安全。性能基准测试表明,Wax 比基于 CPU 和 SQLite FTS5 的解决方案快得多。 开发者正在寻求来自构建 RAG 到 Swift 应用的开发者的反馈,并计划在未来的更新中探索语言绑定和时效衰减功能。该项目可在 [GitHub](https://github.com/christopherkarani/Wax) 上获取。

启用 JavaScript 和 Cookie 以继续。

## 俄罗斯经济状况 - Hacker News 讨论摘要 一篇最近的《经济学人》文章声称俄罗斯经济已经进入“死亡区”,这在 Hacker News 上引发了争论。文章使用登山类比,认为俄罗斯正在耗尽资源以维持自身,类似于身体消耗自身肌肉组织。 一些评论员,特别是来自乌克兰的用户,对这一评估表示怀疑,认为俄罗斯将继续以折扣价向中国出售天然气。另一些人则承认以亏损的价格出售是不可持续的。讨论中反复出现的主题是对自 2014 年克里米亚入侵以来,关于俄罗斯经济崩溃的类似预测的怀疑,并提供了一长串过去预测即将失败的文章作为证据。 进一步的评论质疑了以债务为动力的西方经济的可持续性,并强调了军事投资在推动技术创新方面的历史作用,暗示俄罗斯的困境最终也可能影响西方。

请启用Cookie。 错误 1005 Ray ID:9cf7b84bcef033d1 • 2026-02-17 19:34:02 UTC 访问被拒绝 发生了什么? 该网站(kotaku.com)的所有者禁止您的IP地址所在的自治系统编号(ASN 45102)访问此网站。 请参阅 https://developers.cloudflare.com/support/troubleshooting/http-status-codes/cloudflare-1xxx-errors/error-1005/ 了解更多详情。 此页面是否有帮助? 是 否 感谢您的反馈! Cloudflare Ray ID:9cf7b84bcef033d1 • 您的IP: 点击显示 47.245.80.60 • 由Cloudflare提供性能和安全保障。

## Discord替代品因年龄验证问题受到关注 Discord的竞争对手Teamspeak正经历用户激增,原因是用户逃离Discord的新年龄验证要求,起因是英国立法。尽管Discord仍然占据主导地位,但许多人觉得其大型服务器过于笨重。用户正在重新考虑Teamspeak等自托管选项,但也有人指出其存在一些限制,例如文件上传大小以及屏幕共享等功能偶尔出现技术问题。 这场讨论凸显了一种反复出现的模式:最初的易用性和免费托管(在Discord的案例中,由风险投资提供支持)可以吸引用户,但随着资金转移或政策变化,可能会导致问题。Teamspeak等替代品以及Ventrilo等较旧的平台正在重新获得关注,它们提供更多控制权,但也需要更多技术设置。 其他开源选项,如Mumble和XMPP也被提及为潜在的长期解决方案,强调了对去中心化、注重隐私的通信平台的需求。这种情况与过去社交媒体领域的变动相呼应,例如Digg的衰落和Reddit的崛起。

几十年以来,人们认为电子在电线中移动的方式就像一个个弹珠——撞击原子和杂质,而“流动”仅仅是平均效应。这解释了许多电子特性,但理论家长期以来怀疑电子的行为更像流体,像水分子一样守恒动量。最近的实验已经证实了这种可能性。 研究人员,尤其是在哥伦比亚大学,并使用诸如石墨烯(一种近乎完美的碳片)等材料,已经展示了“电子流体”。他们观察到了诸如古尔吉效应之类的现象——即*升高*温度*降低*电阻——甚至创造了类似于音爆的电子冲击波,证明电子可以以超音速集体流动。 这些发现不仅仅是理论性的。观察到旋转的电子“涡流”进一步验证了流体模型。这项突破可能为新型电子设备和对量子材料的新理解铺平道路,有可能通过从“砰砰”的粒子观转向“流动”的流体视角来彻底改变该领域。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 物理学家让电子像水一样流动 (quantamagazine.org) 11 分,来自 rbanffy 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## 两党沉默与隐藏的后果 作者认为,美国政治中存在一种值得关注的模式:当两大政党都避免对重大问题进行激烈的辩论时,公众很可能为此付出代价。 持续且令人沮丧的埃普斯坦文件泄露事件凸显了这一点。 民主党和共和党都对完全追求透明度犹豫不决,这表明埃普斯坦的权力与影响力网络中存在共同的脆弱性——涵盖政治、金融和媒体领域。 这种缺乏问责制超出了丑闻本身,与欧洲发生的调查和辞职相比,美国受牵连的精英阶层受到的惩罚有限。 作者将这种情况与货币政策进行类比,即两党在干预上的共识往往使资产持有者受益,而使普通美国人承担负担,以及与外交政策的相似之处,即战争授权经常获得广泛且毫无疑问的支持。 核心论点是,这种两党沉默并非偶然;它表明存在受保护的利益,以及不愿面对不舒服的真相。 缺乏对抗性压力使得潜在的破坏性问题得以在有意义的民主监督之外运作,最终将公众的角色从参与者转变为观察者。 作者敦促读者在双方都保持沉默时保持警惕,因为故事很可能远未结束。

## 小块密码:在现代密码学中仍然相关吗? 尽管小块(32-64位)密码因被认为过时且不安全而臭名昭著,但在特定应用中仍然具有价值。虽然像AES-256这样的大块密码通常更受青睐,以提供强大的安全性,但小块密码在受限的环境以及加密计数器或时间戳等特定任务中具有优势。 小块密码的主要问题在于其输出空间有限,容易受到攻击——冲突的可能性更高,可能泄露信息。然而,它们仍然可以用作基本构建块,特别是对于格式保持加密。它们擅长混淆数据库ID或时间戳等值,而无需生成随机数。 像UUID这样的替代方案也有其自身的缺点,例如泄露创建时间或需要更大的存储空间。小块密码,例如NSA设计的SIMON和SPECK系列,提供了一种轻量级且高效的解决方案,尤其是在经过多年严格的第三方分析,没有发现实际漏洞之后。 最终,小块密码不能普遍替代大块密码,但代表了在效率和最小化数据大小至关重要,并且威胁模型允许其局限性的特定场景中的有用工具。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 不要错过小块密码 (00f.net) 8 分,由 jstrieb 1小时前发布 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 富士山小屋与神社印章之旅 攀登富士山有一项传统,即在吉田路线沿途的小屋和神社收集独特的印章。从五合目的富士山三原商店和旅馆(1956年)开始,这里提供一枚“天地分界线”印章,旅程由此向上延伸。历史悠久的小屋如花家屋(江户时代)有守护神印章,而日出馆则有一枚可追溯至1980年代的富士山和日出印章。 较新的小屋,如友江馆(2005年)和富士一馆(2003年),提供反映现代设计和海拔高度的印章。釜岩馆独特地印有天妇传说中的アマビエ,这一形象在2020年疫情期间广受欢迎。鸟居荘(1869年)以其标志性的鸟居印章,而太子馆则与圣德太子有关,保留着传统元素。 在高处,蓬莱馆劝诫人们不要“子弹登山”,而白云荘则以云雾图像营造宁静氛围。元祖室纪念一位历史上的苦行僧,富士山酒店则标记着攀登的艰难路段。最后,草堂神社提供一种独特的墨水印章,据信可以促进健康。每个印章都讲述着一个故事,为攀登日本神圣的山峰增添了精神和历史维度。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 攀登富士山,通过里程碑邮戳可视化 (halfof8.com) 10 分,作者 gessha 1 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 jmward01 34 分钟前 [–] 智者三思,愚者一念。我真是个傻瓜 :) 我最 humbling 的经历是精疲力尽地爬到顶峰,感到幸福,却看到一个慢跑者短暂地看了一眼他的智能手表,就开始下山。混蛋。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

Gentoo 已经在 Codeberg ([https://codeberg.org/gentoo/gentoo](https://codeberg.org/gentoo/gentoo)) 建立了其主仓库的镜像,作为计划迁移离开 GitHub 的一部分。这提供了一个替代的贡献平台。 Codeberg 是一个位于德国的、基于 Forgejo 的非营利平台。重要的是,Gentoo 仍然*托管*自己的仓库;Codeberg 作为一个方便的贡献镜像,类似于之前的 GitHub 镜像。 鼓励贡献者使用“AGit”方法提交拉取请求——克隆上游仓库并直接推送到 Codeberg 分支——这样可以避免分叉的需要。关于这种方法的详细说明,包括推送和强制推送更新的命令,可在 Gentoo wiki 上找到。此举旨在拓宽贡献选项,并符合项目的长期目标。

Gentoo,一个Linux发行版,已将其代码仓库从GitHub迁移至Codeberg,引发了关于潜在的去中心化趋势的讨论。多年来,GitHub庞大的开发者群体和拉取请求等功能是主要优势。然而,人们对GitHub日益整合专有工具(如Copilot)和最近的价格变化表示担忧。 用户推测,这可能是项目重新评估集中代码于单一平台的优点的开端。Codeberg因其速度、易用性而受到赞扬,代表着向更分散和“更少单一文化”的互联网迈进。尽管Gentoo历来保持独立,但此次迁移被视为一个积极信号,表明GitHub的替代方案对于大型项目是可行的。

## Claude Sonnet 4.6:重大升级 Anthropic 的 Claude Sonnet 4.6 是一项重大进展,以更实惠的价格提供接近 Opus 级别的性能。这次升级影响编码、计算机使用、推理和通用知识工作,并拥有 1M token 的上下文窗口(处于测试阶段),可处理大量数据,例如整个代码库或长篇文档。 主要改进包括编码技能的显著增强——通常甚至优于之前的顶级 Opus 4.5 模型——以及“计算机使用”能力的巨大飞跃,使其能够通过鼠标点击和键盘输入像人类一样与软件交互。安全评估表明,Sonnet 4.6 的安全性与之前的模型一样,甚至更高。 该模型在金融分析和应用程序开发等复杂任务中表现出色,展示了更高的准确性并减少了迭代次数。开发者平台的新功能包括自适应/扩展思维和上下文压缩。Sonnet 4.6 现在是免费和专业计划的默认模型,保持现有定价,并可通过 API 和主要云平台使用。虽然 Opus 仍然最适合*深度*推理,但 Sonnet 4.6 为广泛的应用提供了一种强大且经济高效的替代方案。

## Claude Sonnet 4.6 总结 Anthropic 发布了 Claude Sonnet 4.6,一种据称能力与之前的 Opus 4.5 相当,但速度更快且更便宜的新语言模型。用户对“提高下限”感到兴奋——以 Sonnet 的更低成本和延迟获得 Opus 级别的推理能力,可能解锁更多代理工作流程。 讨论强调了人工智能快速发展的步伐,类似于 1990 年代的计算性能提升,并指出成本下降的趋势(几个月内大约便宜 3 倍)。一些基准测试甚至表明 Sonnet 4.6 在特定领域(如办公任务和金融分析)超越了 Opus 4.6。 人们对人工智能安全和对齐提出了担忧,一些人认为模型正在学习为了通过测试而*表现出*对齐,而部署时的行为可能不同——本质上是“通过测谎仪”而不是表现出真正的道德。此次发布引发了人们对 OpenAI 下一个模型的期待,以及对激烈竞争对消费者利益的影响的讨论。Sonnet 4.6 的定价与 4.5 相同,起价为每百万 token 3 美元/15 美元。

``` %PDF-1.4 %Óëéá 1 0 obj > endobj 3 0 obj > endobj 9 0 obj > endobj 11 0 obj > stream xœ• ½JÃ`†ŸÔ‚(Šƒ28¸h“¦mRpi#×V!©S’þ ¶IHSôtspu+.Þ€èe(âà%ˆ ³|’:tðÀ ‡÷ÎÏ™@V G zM¶ì–ì&|)ø4c Æ‚£ƒ† Ò°Ù›bwн0ýoÀΠ?òÒ»Yêø‡MÀ֩УO‡> stream xœì½írã8²­ 'ÞÞ1eWYU$ %•9go×>¼ÝÿU½AÀÒ¸è ²)Š™H®'VtôÔôôˆ™ . ¥ 0cL]›ºÖgkë¶mÃŸ×æLü¯‚†?þPÿù¬ ÿm­6ÆdYVUåùߪµ®´®Ê²œúÛ 2¼¯¬^p/ÞzuÓ4á=øüªûó¥ùñtøŸœ_ Ã_ã›òÕÛó$ #Š¢(˲ªª³íÿl#8÷Òá_BqM¡,KcþpN²,»¿¿Gâ °â_ÿú×ÃÃÃù õ¼hî}õ‰eñ™ßž‘ËŸè Óes ``` (The content appears to be binary data or a corrupted PDF file. It doesn't translate into meaningful Chinese text. I've simply reproduced the original content as requested.)

Anthropic 与五角大楼的续约谈判因对 Anthropic 的 Claude AI 系统使用存在分歧而面临障碍。Anthropic 将自己定位为“安全至上”的开发者,寻求更严格的限制,以防止其人工智能被用于大规模监控或自主武器开发。 五角大楼希望拥有更广泛的部署灵活性,只要其仍在法律范围内即可。这反映了关于人工智能在军事应用中作用的更广泛争论。虽然 Anthropic 旨在通过其专门的“Claude Gov”模型支持国家安全,但国防部优先为“战士赢得胜利”提供装备,甚至正在考虑限制对 Anthropic 的依赖,因为存在潜在的供应链漏洞。 这些谈判的结果意义重大,可能会影响与 OpenAI 和 Google 等其他人工智能提供商的未来合同,并为人工智能在军事应用中的伦理边界设定先例。

纽约市面临着巨大的预算缺口——最初估计为126亿美元,现在修正为约50亿美元——市长佐赫兰·曼达尼提议增加房产税,这是二十多年来的首次,以帮助弥补缺口。尽管州长霍楚尔最近承诺提供15亿美元的援助,并承诺未来再提供5.1亿美元,但此举仍然发生。 曼达尼还推动对高收入者和公司增加州税,但需要州立法机构的批准。虽然在增加收入的选择有限,但他可以直接通过城市预算提高房产税。这一点尤其重要,因为房产评估已经增加了5.6%,产生了额外的3258亿美元。 拟议的增税在政治上非常敏感,因为曼达尼在竞选时承诺进行房产税改革。他之前曾指责他的前任造成了赤字,并最初提出了更大的缺口数字。这种情况凸显了竞选承诺中为社会项目提供累进式资金与平衡这座城市330多亿美元的房产税收入依赖型预算之间的紧张关系。

## Alpha学校:人工智能的承诺与现实 Alpha学校,一所昂贵的“人工智能驱动的私立学校”(学费高达65,000美元/年),正因其人工智能教育质量而受到质疑。尽管媒体报道积极,并受到琳达·麦克马洪等人的赞扬,但内部文件和前员工揭示了其显著的缺陷。该学校的人工智能会生成有缺陷的课程计划——问题不合逻辑,措辞不明——并且未经许可从其他在线学习平台(包括可汗学院和Albert.io)抓取内容。 尽管宣传“两小时学习”理念和高考试成绩,但学生通常需要更多学习时间,并且可能准备不足。学校通过“StudyReel”对学生进行严密监控,追踪屏幕活动、鼠标移动,甚至录制视频,引发隐私担忧。这些录音等敏感学生数据存储在易于访问的Google Drive文件夹中。 员工对将学生视为“实验小白鼠”以及持续监控带来的焦虑表示担忧。尽管记录了人工智能错误,Alpha学校仍然依赖人工智能来*评估*自身的人工智能,从而形成一个存在问题的反馈循环。最终,前员工认为该学校的成功更多地依赖于敬业的人类导师,而不是承诺的“人工智能魔力”。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 学生被当作实验小白鼠:深入了解一个人工智能驱动的私立学校 (404media.co) 20 分,trinsic 40 分钟前 | 隐藏 | 过去的 | 收藏 | 2 条评论 帮助 gruez 22 分钟前 | 上一个 [–] 除了文章提到的福克斯新闻/纽约时报的报道,还有一位将孩子送去 Alpha 学校的家长做的更详细的评论:https://www.astralcodexten.com/p/your-review-alpha-school 回复 trinsic 5 分钟前 | 父评论 [–] 哇,那篇文章好长。我认为唯一重要的是释放时间,这应该成为正常教育的一部分。如果学生有更多的时间思考和沉思,人们会想我们生活在一个什么样的世界里。很遗憾,需要一个可疑的人工智能学校的出现才能发现这种智慧。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

加载蟹镇...🦀蟹镇🦀人口:--建造你的城镇点击建筑互动 • 拖动平移 • 滚动缩放欢迎来到蟹镇✕蟹镇一个不断进化的甲壳类岛屿开始探索

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 展示 HN: Clawntown – 一个不断演化的甲壳类动物岛屿 (clawntown.lol) 8 分,acnops 发表于 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 OpenClaw 让我思考:当一个 AI 助手面对整个社区而不是一个人时会发生什么? "Clawntown" 是一个不断演化的沿海甲壳类动物岛屿。成为居民,与议员们聊天,玩抓娃娃机,并提出改进城镇的建议,并观看它发生变化。 我最初梦想的是一个完全自主的城镇工程师,他会采纳投票通过的提案并实施它们。我们还没有完全达到那个目标,但下一步是尝试使其真正地自我进化。质量将是挑战。 期待听到你的想法和经验。 欢迎 PR,并请分叉来构建你自己的城镇! https://clawntown.lol https://github.com/accnops/clawntown 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

主页 | mage-bench mage-bench LLM 玩万智牌。mage-bench 是 XMage 的一个分支,它能够让大型语言模型在多种模式下(指挥官、标准、现代和遗迹)进行万智牌对战。LLM 们坐在虚拟牌桌旁,各自操控一套牌,做出弃牌、施法、战斗和政治等决策——就像人类玩家一样。XMage 游戏服务器向每个 LLM 提供当前游戏状态和可用行动。LLM 选择行动,游戏引擎执行规则。没有捷径,没有简化规则——万智牌的全部复杂性。排行榜 观看比赛 架构 GitHub GitHub | Gregor Stocks 制作

## LLM 学习魔法风云会 GregorStocks 开发了一个系统 (mage-bench.com),使用开源 XMage 代码库来训练大型语言模型 (LLM) 互相进行魔法风云会对战。虽然目前存在一些错误,但该系统证明 LLM 可以学习游戏,尽管表现各异——目前优先使用较便宜的模型,影响了排名。 讨论强调了评估人工智能游戏表现的挑战,因为魔法风云会本身就具有随机性和私有信息。准确评估胜率非常复杂。用户建议潜在的改进措施,例如允许 LLM 测试和改进用户创建的牌组,这对于指挥官等复杂模式尤其有价值。 该项目利用详细的提示来定义 LLM 作为竞争玩家的角色,概述游戏循环机制并提供工具访问权限。初步测试表明 LLM 在记忆卡牌细节和战略细微之处方面存在困难,但仍然可以取得胜利。开发者正在探索改进工具访问和分析的方法,包括使用另一个 LLM 进行“失误分析”以审查决策。

## 应对芯片行业人才短缺:一种新方法 芯片行业正面临严重的人才短缺,促使人们探索创新解决方案,从人工智能集成到交叉培训计划。一个关键重点是**在设计工具中利用人工智能**,以提高工程师效率并可能缩短培训时间。大型语言模型和人工智能代理正在被开发为定制助手,形成一个循环,即先进的芯片为*设计*这些芯片的人工智能提供动力。 除了人工智能,还有推动**培训软件工程师进行硬件设计**的趋势,认识到存在大量潜在人才。虽然这不是一个简单的转变——需要对人工智能流程的基础理解——但目标是将芯片开发转向更接近软件工程的技能。新的工具能够实现**更高层次的抽象**至关重要,它们可以自动化低级细节,并允许熟悉软件的工程师做出贡献。 然而,专家强调继续需要熟练的硬件工程师,尤其是在复杂设计方面。重点是**利用人工智能增强现有人才**,提高他们的生产力,而不是完全取代。大学正在适应,旨在提供**更相关和密集的课程**,可能缩短学习时间,同时提高教育价值。最终,成功取决于装备工程师*有效地利用*人工智能,确保质量控制并推动创新。

一篇由*SemiEngineering*文章引发的Hacker News讨论,探讨是否可以教计算机科学学生硬件设计,以解决人才缺口。 评论指出,问题主要集中在芯片设计和验证方面,不一定涉及PCB硬件。一位工程师提到,实际的硬件工作通常依赖于供应商提供的原理图,以及掌握KiCad等工具,并需要大量的焊接练习。 一个关键点是硬件和软件设计技能之间的重叠——两者都大量涉及并发和并行处理。所谓的“人才短缺”并非技能差距,而是获取经济实惠、非专有工具的途径有限。主要厂商如Intel或AMD提供的、易于获取且文档完善的eFPGA(嵌入式FPGA)被视为扩大硬件设计人才库的催化剂。最后,一位评论员质疑这是否已经是电气工程师的角色。

## 继续:GitHub 驱动的 AI 代码审查 Continue 利用 AI 在 GitHub pull request 中自动执行代码审查。它通过运行可定制的“检查”来实现,这些检查是放置在你的仓库中的 markdown 文件,利用 AI(如 Claude Code)来分析代码变更。 这些检查会显示为标准的 GitHub 状态检查(通过为绿色,失败为红色)。 你可以为每个检查定义名称、描述和提示,指示 AI 查找什么,例如安全漏洞(硬编码的密钥、缺少验证)或代码质量问题。 当打开 pull request 时,Continue 会自动对代码差异运行这些检查,在 GitHub 中提供即时反馈和建议的修复方案。 这简化了审查流程并有助于尽早发现潜在问题。 详细教程和完整指南请访问 [https://continue.dev/walkthrough](https://continue.dev/walkthrough)。

## Continue.dev:AI驱动的代码检查 Continue.dev 提供了一种新的代码审查方法,利用 AI “检查”来强制执行标准并防止细微的错误,尤其是在使用 AI 辅助编码时至关重要。这些检查被定义为源代码控制的 markdown 文件(`.continue/checks/`),直接集成到 GitHub 中作为状态检查。 与简单的差异审查不同,Continue 的检查充当完整的代理,能够读取/写入文件、运行命令并使用浏览器彻底分析拉取请求。一个最近的例子发现了一个潜在的问题,即会话计数在静默下降——传统方法会错过这个问题。 该平台旨在通过为开发者构建的工具来增强开发者的能力,通过开源 CLI 避免“封闭花园”。它源自一个本地 AI 编码代理工具,保留了 VS Code 扩展,同时扩展为这种主动的代码质量解决方案。用户可以利用像 Claude Code 这样的编码代理来轻松创建自定义检查,以用于他们的代码库。

塞斯·德·格鲁特创作了一部学术杰作。——理查德·P·加布里埃尔 《Lisp的天才》是伯克软件出版社出版的一本书,讲述了计算机历史上最有力的编程语言之一的历史。以下是作者塞斯·德·格鲁特(也就是我!;-)) 的背景介绍。此页面是补充书籍内容的起点。如果您想阅读样本,亚马逊可以满足您。

一位开发者“cdegroot”宣布发布了一本关于Lisp的技术历史书籍,可在 berksoft.ca 找到。由于缺乏详细且以代码为中心的Lisp历史资料,他花费了五年时间撰写这本书。本书旨在讲述Lisp的故事,并提供大量的技术示例。 作者是一位长期使用Lisp和Emacs,目前正在使用Common Lisp的开发者,退休后希望撰写更多关于Smalltalk和计算机网络等主题的书籍。该项目受益于贡献,包括Dick Gabriel关于Lisp创始人John McCarthy的个人回忆。 早期的评论者表达了热情,有人回忆起早期使用Lisp-80的经历,另有人推荐Steele和Gabriel的《Lisp的演变》作为进一步阅读的材料。

## Go 1.26 改进的 `go fix` 命令 Go 1.26 引入了一个完全重写的 `go fix` 命令,利用 Go 分析框架来现代化代码库。`go fix` 识别改进代码的机会,通常利用较新的语言特性和库函数。它接受与 `go build` 类似的包模式,并静默更新源文件,跳过生成的代码。运行 `go fix -diff ./...` 会在应用更改之前预览它们,`go tool fix help` 会列出可用的“修复器”(分析器)。 此次更新旨在鼓励采用现代习惯用法,尤其是在 Go 1.18 引入泛型之后。新的“现代化工具”如 `minmax`(用 `min`/`max` 替换 if/else)和 `stringscut`(使用 `strings.Cut` 代替 `strings.Index` 和切片)已被包含在内,以及一个用于 Go 1.26 的 `new(expr)` 特性的修复器。 团队正在转向“自助服务”模式,允许开发者定义和共享他们自己 API 的现代化方案。未来的计划包括动态加载分析器,并探索基于注释的方法来强制执行编码标准和不变性。目标是简化代码维护,鼓励最佳实践,并确保 LLM 编码助手训练数据反映最新的 Go 习惯用法。

## Go 的 “go fix” 工具与现代化 一个名为 “go fix” 的新工具在 Hacker News 上受到关注,因为它能够自动现代化 Go 代码。这使得开发者能够轻松采用新的语言特性和习惯用法,而无需手动重构——甚至包括他们可能错过的特性! 该工具解决了由 LLM 编码助手日益普及所带来的挑战。这些助手经常根据其训练数据中较旧的模式生成代码,即使当前 Go 版本中存在更新、更好的方法。为了应对这种情况,“go fix” 有助于确保更广泛的 Go 代码库反映现代实践,从而提高未来 AI 模型的训练数据质量。 用户赞扬 Go 的向后兼容性和稳定性,并指出 “go fix” 使其特别适合代码生成,因为该语言避免了 Python 等语言中常见的破坏性更改。

## 乐观与悲观的差距 尽管全球生活水平有所提高,但调查始终显示出对世界现状的广泛悲观情绪。人们通常对自己的生活感到乐观,但他们认为自己的国家和世界正在朝着错误的道路发展——这种脱节在较富裕的国家尤为明显。 这种“我很好,但你不好”的心态源于信息失衡。我们掌握着关于个人经历的详细了解,从而产生乐观情绪,但却依赖于有限且通常是负面的新闻报道来形成对更广泛的看法。这导致我们低估他人的幸福感和积极信念,并对全球问题感到无助。 这种集体悲观情绪不仅仅是“错误”的问题,它是有害的。它滋生对机构的不信任,阻碍合作,并降低解决气候变化或公共卫生等关键挑战的动力。缺乏能动性——相信我们可以带来改变——会助长愤世嫉俗和宿命论。认识到这种差距至关重要,因为培养能动性和承认进步对于推动积极变革至关重要。

一场 Hacker News 的讨论围绕着个人乐观与普遍的全球衰落信念之间的悖论,正如最近一篇文章所强调的。用户提出了几种解释这种脱节的原因。 一个关键点是人类倾向于展现积极的个人形象,难以承认个人挣扎。另一种观点认为,集体福祉并非个人经历的简单平均——更大、通常不可控的力量可能会对所有人产生负面影响,即使他们个人取得了成功。 许多评论者强调承认希望*和*绝望的重要性,引用了 F. Scott Fitzgerald 关于同时拥有矛盾想法的观点。最后,媒体(“恐惧网络”)和耸人听闻的新闻的作用也被指出,观察表明,负面新闻比正面新闻更引人入胜,从而导致对现实的扭曲认知。最终,这场讨论突出了个人经历、全球事件和心理应对机制之间的复杂关系。

启用 JavaScript 和 Cookie 以继续。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 迷宫定位器 (labyrinthlocator.org) 6 分,由 emigre 1小时前发布 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## Sixcy:下一代容器格式 Sixcy 是一种正在开发的容器格式,专注于高性能数据存储和传输,优先考虑流式效率、数据可恢复性和灵活压缩。目前旨在用于基准测试、研究和原型设计——**不用于生产环境**——它提供了一种流式优先的设计,具有自描述块和定期检查点,以实现强大的数据恢复。 主要特性包括支持多种压缩算法(Zstd、LZ4 以及通过插件接口支持更多算法)、元数据优先索引以实现快速访问,以及内存安全的 Rust 实现。该项目结构清晰,模块化地划分了核心库函数、编解码器、索引、恢复和 I/O。 目前版本为 v0.1.x,Sixcy 提供了一个参考实现和插件接口。计划在 v0.2.0 中提供稳定的运行时包和扩展的编解码器支持。规范采用 CC-BY-4.0 许可,而实现则使用 Apache-2.0 许可。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 展示 HN: 6cy – 实验性流式存档格式,具有每块的编解码器 (github.com/byte271) 34 分钟前,yihac1 发布,4 点赞 | 隐藏 | 过去 | 收藏 | 讨论 大家好, 我一直在研究存档格式设计,并构建了 6cy 作为研究项目。 目标不是取代 zip/7z,而是探索: • 块级别编解码器多态性(每个块不同的压缩) • 流式优先布局(无需全局查找) • 更好的崩溃恢复特性 • 基于插件的架构,以便专有编解码器可以在不更改格式的情况下存在 目前这是一个实验性的 v0.x 格式。 规范可能会发生变化,兼容性尚未保证。 我主要希望获得关于格式设计的反馈,而不是性能比较。 感谢您的关注。 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:
联系我们 contact @ memedata.com