每日HackerNews RSS

## 训练用于定性奖励的模型:喜剧作为案例研究 该项目解决了在主观奖励(幽默)上训练语言模型的问题。受到Moonshot基于评分标准的强化学习(RL)用于创意写作的启发,作者旨在将“有趣”分解为可验证的属性,如时效性、相关性和对主题的深刻理解。 该过程包括两个阶段:监督微调(SFT)和RL。SFT利用了来自Twitter、TikTok、Reddit和幽默博客等平台精心策划的48k个示例数据集,重点关注当前的在线用语。RL使用“评分器”模型(Qwen3-30B)根据特定评分标准(清晰度、投入度、具体性)评估生成的回复,并给出用作奖励的分数。一个关键的补充是针对“AI特征”的负面奖励,例如犹豫不决或过度使用表情符号,这是从模型利用评分偏差中学习到的。 使用排序评论和合成数据进行的直接偏好优化(DPO)尝试被证明是无效的。成功取决于迭代评分标准改进、数据混合以及结合具体的、高质量的喜剧示例。由此产生的模型,`jokegen2-1t-rl`(RL)和`jokegen2-1t-sft`(SFT基线),展示了这种方法的潜力,但由于成本原因,目前无法提供公开演示。代码和数据计划发布。

训练一个拥有万亿参数的模型来变得有趣 (sdan.io) 6点 由 sdan 1小时前 | 隐藏 | 过去 | 收藏 | 1条评论 suddenlybananas 7分钟前 [–] 这些真的不好笑 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

启用 JavaScript 和 Cookie 以继续。

最近一篇Frommers文章强调了一项有争议的新TSA费用:对于无法出示符合REAL ID标准的身份证明的乘客,将收取45美元费用。Hacker News的讨论显示出对该费用合法性和公平性的担忧,评论员指出个人*有权*尝试在没有身份证明的情况下飞行,但航空公司和机场可以拒绝服务。 许多人批评该费用是一种强制获取联邦身份证的形式,可能导致更广泛的监控。建议包括提供免费且易于获得的护照卡,或使用州政府签发的符合Real ID标准的卡。一些人指出,该费用对低收入人群的影响尤为严重,他们可能缺乏法律挑战该费用的资源。另一些人则将讨论扩展到更广泛的政府颁发身份证明和数字基础设施问题,认为全国身份证也可以作为选民身份证,并促进安全的在线交易。之前Hacker News关于同一主题的讨论链接也一并提供。

法院已下令恢复所有暂停的美国海上风电项目建设,此前美国拜登政府在本年初意外暂停了相关项目。这一决定源于对暂停合法性的担忧,争论的中心是潜在的“征用”公司投资的情况——类似于政府撤销石油租赁的情况。 Hacker News上的讨论表明,暂停可能是出于对风电场易受破坏的未公开的安全担忧,尽管攻击的可能性很低。另一些人认为,前总统特朗普长期以来对风力涡轮机的个人敌意影响了这一决定。 评论员还辩论了继续发展海上风电与优先发展太阳能的战略价值,考虑到太阳能技术的最新进展。一种普遍的观点是,取消这些“基本完成”的项目将是一种巨大的浪费,并会损害美国的竞争力,尤其是在减少碳排放的紧迫性日益增加的情况下。

joedb 1. 介绍 2. 用户指南 3. 参考 joedb Joedb,仅日志嵌入式数据库 Joedb,仅日志嵌入式数据库 1. 介绍 1.1. 优点与缺点 1.2. 示例 1.3. 并发示例 2. 用户指南 2.1. 入门 2.2. 打开文件 2.3. 检查点 2.4. 并发 2.5. 远程过程调用 2.6. 模式升级 2.7. 向量 2.8. 索引 2.9. Blob 3. 参考 3.1. API 参考 3.2. 文件格式 3.3. 网络协议 3.4. 工具 3.5. 测试 3.6. 日志记录 3.7. TODO 3.8. 链接 3.9. 发布检查清单 3.10. 历史记录 3.11. 许可 下一页 © 版权所有 Rémi Coulom。 使用 Sphinx 构建,采用 Read the Docs 提供的 主题。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Joedb,仅日志嵌入式数据库 (joedb.org) 4 点赞 by mci 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

截至2026年2月2日,GitHub目前正在经历多项问题。**GitHub Actions**受到严重影响,托管运行器面临高等待时间和作业失败。 这影响了依赖Actions的功能,包括**Copilot Coding Agent**和**Dependabot**。 根本原因已被确定,并正在与上游提供商解决,但完全解决仍在等待中。 除了Actions之外,**GitHub Copilot**和**GitHub Pages**也报告性能下降。 自托管运行器*不受*Actions问题的影响。 GitHub团队正在积极调查所有事件,并随着缓解工作的进展提供更新。 Actions的整体可用性正在下降,同时团队正在努力寻找解决方案。

## Azure 中断影响 GitHub 及更多 微软 Azure 的大范围中断正在对各种服务造成严重干扰,包括 GitHub、Azure DevOps 和 LinkedIn。该问题始于 2026 年 2 月 2 日 19:46 UTC 左右,源于影响虚拟机扩展所用存储帐户访问权限的配置更改,从而阻止了诸如缩放和更新等关键服务管理操作。 用户报告的影响范围从 GitHub Actions 失败和自托管运行程序到多个区域内更广泛的虚拟机管理问题。微软正在积极通过恢复访问权限来缓解问题,并已对一个区域应用了初始更新。 评论员表示担忧,GitHub 对 Azure 的日益依赖暴露了底层平台的脆弱性和停滞。一些人推测此次中断凸显了 Azure 基础设施中更广泛的问题,而另一些人则开玩笑地建议利用人工智能来解决问题。预计将在 22:30 UTC 之前发布更新。

Please provide the content you want me to translate. I need the text to be able to translate it to Chinese.

## SpaceX 收购 xAI:摘要 SpaceX 收购了埃隆·马斯克的 AI 公司 xAI,引发了争论和怀疑。马斯克设想“基于太空的 AI”的未来,将发射大型卫星星座以提供可扩展的计算能力,并可能利用太阳能。然而,许多评论员质疑该计划的可行性,并指出冷却、维护、辐射和发射成本方面存在重大挑战。 许多人认为此次收购是一种财务策略,可能旨在提高 SpaceX 的估值,为计划中的 IPO 做好准备,并挽救 xAI,据悉 xAI 消耗大量资金。人们对利益冲突以及此举是否有利于 SpaceX 股东表示担忧。 虽然一些人承认潜在的协同效应,但许多人认为“太空中的数据中心”概念不切实际,并且是马斯克雄心勃勃、常常未能实现的项目模式的延续。此举受到了犬儒主义和对马斯克动机以及两家公司未来方向的猜测。

一个黑客新闻的讨论围绕着《Morningstar.com》的一篇文章,该文章声称欧洲正在开发针对美国科技的“关闭开关”。 许多评论者对文章的可信度表示怀疑,指出《Morningstar》是一家金融公司,其关注点可能较为狭窄——尽管它在投资领域是一个重要参与者。 一位用户指出,这条新闻并没有提供任何新信息,而是提到了欧盟在数字主权方面已经做出的努力。 另一些人认为,此举强化了美国长期以来对欧洲作为盟友的可靠性的怀疑。 另一条评论强调了个人对美元的放弃,原因是担心强大的实体控制金融和使用“关闭开关”。 最后,一位用户最初预计会看到左翼评论,因为文章名称与英国共产党报纸相似,但发现文章的重点是欧盟/美国科技政策。
TileIR Internals 2 小时前

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 TileIR 内部结构 (maknee.github.io) 5 分,来自 vimarsh6739 1 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 mathisfun123 3 分钟前 [–] 提示:重新查看 `--print-before-all`:`tileiras` 的 `--help-hidden` 会输出大量有趣/有用的选项。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

英伟达的股价周一略有下跌,原因是有关其可能对 OpenAI 进行 1000 亿美元投资计划停滞的报道。虽然该协议已于九月宣布,但内部人士透露对该交易最终能否完成存在不确定性。 英伟达首席执行官黄仁勋最初表示,1000 亿美元的数字并非具有约束力,并对 OpenAI 的战略和竞争表示担忧。他后来否认了对 OpenAI 不满的说法,重申将进行“巨额”投资,并赞扬了 OpenAI 的首席执行官 Sam Altman。但他澄清,投资不会超过 1000 亿美元。 分析师认为,黄仁勋的声明旨在解决对“循环融资”的担忧——人工智能公司相互投资——并防止竞争对手(如谷歌)从中获益。尽管存在反复,专家认为英伟达仍然致力于进行大量投资,可能接近 1000 亿美元的水平,这将使双方受益,并缓解对 OpenAI 财务稳定性的担忧。

英伟达股价在报道称其对 OpenAI 的投资停滞后下跌,引发了 Hacker News 上关于人工智能支出财务可行性的讨论。一些评论员认为这可能*利好*英伟达,质疑 OpenAI 偿还巨额债务的能力。 更广泛的担忧集中在微软等大型人工智能公司(被称为“Microslop”)的过度支出上,并将其与安然丑闻和互联网泡沫相提并论。甲骨文已经面临与人工智能投资相关的法律挑战。 焦点也转向了 CoreWeave,这是一家最近收到英伟达 20 亿美元投资的数据中心提供商,但其基础设施的运营和盈利能力面临持续挑战——已经提起了一起集体诉讼。总体情绪倾向于潜在的人工智能投资校正,其严重程度可能超过互联网泡沫破裂。

## Anki 的未来:过渡到社区驱动的开发 在 Damien 的邀请下,AnkiHub 团队将承担 Anki 更大的领导角色。他们强调对 Anki 核心原则的深刻尊重——用户自主权、避免操纵性设计以及优先考虑真正有用的工具——并致力于维护其开源性质和可负担的价格。 他们的主要目标包括用户界面/用户体验改进、加强开发团队以避免对单个个人产生依赖(“公交车因素”)、扩大对医学以外学生的支持,以及培养更强大的插件生态系统。他们旨在提高决策的透明度,借鉴成功的开源模式,并在 Anki 社区内建立更统一的协作流程。 虽然许多细节仍在制定中——包括治理、路线图和过渡过程——但该团队强调这并非由财务问题或外部投资者驱动。他们致力于可持续性、可访问性,并避免风险投资收购的陷阱。他们欢迎社区反馈,并计划通过开放沟通和持续行动来建立信任。AnkiDroid 的主要贡献者 David Allison 将全职加入团队,以帮助应对这些变化。

流行的开源抽认卡应用Anki的创建者在维护项目19年后,已将所有权转让给AnkiHub (ankiweb.net)。此举旨在确保Anki拥有更可持续的未来,原创建者将以较低的参与度继续参与。 重要的是,AnkiHub声明**没有**投资者参与,旨在避免通常在风险投资收购中看到的“劣质化”。他们承诺坚持Anki的开源原则,并优先考虑社区构建的价值。 虽然该消息最初引起了用户对潜在变化的担忧,但缺乏外部投资在很大程度上令人安心。社区对此持谨慎乐观态度,认为这是一个积极的过渡,可以在保持Anki核心价值的同时,允许持续开发。用户仍在监测情况,寻找潜在的替代方案,但对Anki的未来充满希望。

更多

联系我们 contact @ memedata.com