每日HackerNews RSS

## 训练用于定性奖励的模型:喜剧作为案例研究 该项目解决了在主观奖励(幽默)上训练语言模型的问题。受到Moonshot基于评分标准的强化学习(RL)用于创意写作的启发,作者旨在将“有趣”分解为可验证的属性,如时效性、相关性和对主题的深刻理解。 该过程包括两个阶段:监督微调(SFT)和RL。SFT利用了来自Twitter、TikTok、Reddit和幽默博客等平台精心策划的48k个示例数据集,重点关注当前的在线用语。RL使用“评分器”模型(Qwen3-30B)根据特定评分标准(清晰度、投入度、具体性)评估生成的回复,并给出用作奖励的分数。一个关键的补充是针对“AI特征”的负面奖励,例如犹豫不决或过度使用表情符号,这是从模型利用评分偏差中学习到的。 使用排序评论和合成数据进行的直接偏好优化(DPO)尝试被证明是无效的。成功取决于迭代评分标准改进、数据混合以及结合具体的、高质量的喜剧示例。由此产生的模型,`jokegen2-1t-rl`(RL)和`jokegen2-1t-sft`(SFT基线),展示了这种方法的潜力,但由于成本原因,目前无法提供公开演示。代码和数据计划发布。

## 人工智能制造幽默的困难 最近在Hacker News上的一场讨论探讨了训练大型语言模型(LLM)变得幽默的令人惊讶的困难。参与早期GPT-3/4研究人员尝试了各种方法——基于规则的笑话、喜剧演员的稿件、笑话数据集,甚至“思维链”笑话解释——但始终未能生成真正幽默的内容。这让一些人重新考虑对人工智能快速崛起的担忧,认为幽默需要一种目前人工智能无法企及的理解水平。 一些评论员指出,早期、不太精细的模型有时会产生有趣的“无意义”内容,而指令调优和强化学习似乎会*降低*喜剧能力。其他人分享了幽默评估资源,例如Reddit笑话基准测试,并指出Gemini-3-flash-preview和Kimi K2等模型显示出更大的潜力。 一个关键的结论是,幽默是复杂的,需要的不仅仅是模式识别。它涉及细微差别、颠覆和对语境的理解——这些品质很难复制,更难评估。一些人认为,人工智能开发的伦理约束也可能阻碍喜剧创造力,因为真正有趣的內容往往会突破界限。最终,共识是创造真正有趣的AI仍然是一个重大挑战。

启用 JavaScript 和 Cookie 以继续。

joedb 1. 介绍 2. 用户指南 3. 参考 joedb Joedb,仅日志嵌入式数据库 Joedb,仅日志嵌入式数据库 1. 介绍 1.1. 优点与缺点 1.2. 示例 1.3. 并发示例 2. 用户指南 2.1. 入门 2.2. 打开文件 2.3. 检查点 2.4. 并发 2.5. 远程过程调用 2.6. 模式升级 2.7. 向量 2.8. 索引 2.9. Blob 3. 参考 3.1. API 参考 3.2. 文件格式 3.3. 网络协议 3.4. 工具 3.5. 测试 3.6. 日志记录 3.7. TODO 3.8. 链接 3.9. 发布检查清单 3.10. 历史记录 3.11. 许可 下一页 © 版权所有 Rémi Coulom。 使用 Sphinx 构建,采用 Read the Docs 提供的 主题。

## Joedb:仅日志型嵌入式数据库 Joedb是由Rémi Coulom创建的一个新型、内存中、仅日志型嵌入式数据库,Coulom以其在蒙特卡洛树搜索方面的工作而闻名。其关键特性是能够在无需完整数据库副本的情况下重放历史记录,相比于需要时间表(temporal tables)的传统SQL系统具有优势。 目前,Joedb以紧凑的二进制格式存储数据——避免了像JSON等格式中看到的解析开销——但缺乏磁盘支持和强大的查询语言,限制了其可扩展性和在复杂应用中的可用性。 讨论强调了仅日志型数据库的潜力,尤其是在事件溯源和实现撤销/重做功能方面。建议包括压缩策略以管理日志大小,以及对多用户访问的可靠文件锁定的需求。相关项目如Datomic和s2-kv-demo也被提及,作为类似方法的示例。

截至2026年2月2日,GitHub目前正在经历多项问题。**GitHub Actions**受到严重影响,托管运行器面临高等待时间和作业失败。 这影响了依赖Actions的功能,包括**Copilot Coding Agent**和**Dependabot**。 根本原因已被确定,并正在与上游提供商解决,但完全解决仍在等待中。 除了Actions之外,**GitHub Copilot**和**GitHub Pages**也报告性能下降。 自托管运行器*不受*Actions问题的影响。 GitHub团队正在积极调查所有事件,并随着缓解工作的进展提供更新。 Actions的整体可用性正在下降,同时团队正在努力寻找解决方案。

## GitHub 与 Azure 中断总结 2 月 2 日开始,GitHub、Azure 服务(包括虚拟机、DevOps 和 Batch)以及 LinkedIn 遭遇大范围中断,起因是影响虚拟机扩展所用 Microsoft 管理存储帐户访问权限的配置更改。这导致多个区域的虚拟机缩放、创建和更新等服务管理操作失败。 用户报告了 GitHub Actions 和自托管运行程序的问题,一些用户遇到了配额限制和错误。根本原因似乎是 Azure 方面的问题,Microsoft 正在通过恢复访问权限来缓解。 讨论强调了 Azure 可靠性问题反复出现的模式,与 AWS 的体验形成对比,但一些用户指出 AWS 也并非没有问题。人们对 GitHub 越来越依赖 Azure 以及未来可能出现中断的担忧,以及对在该平台上托管的开源项目的影响表示关注。 许多评论员指出,当提供商是 Microsoft 本身时,GitHub 将责任归咎于“上游提供商” 具有讽刺意味。

Please provide the content you want me to translate. I need the text to be able to translate it to Chinese.

## SpaceX 收购 xAI:摘要 SpaceX 收购了埃隆·马斯克的 AI 公司 xAI,引发了争论和怀疑。马斯克设想“基于太空的 AI”的未来,将发射大型卫星星座以提供可扩展的计算能力,并可能利用太阳能。然而,许多评论员质疑该计划的可行性,并指出冷却、维护、辐射和发射成本方面存在重大挑战。 许多人认为此次收购是一种财务策略,可能旨在提高 SpaceX 的估值,为计划中的 IPO 做好准备,并挽救 xAI,据悉 xAI 消耗大量资金。人们对利益冲突以及此举是否有利于 SpaceX 股东表示担忧。 虽然一些人承认潜在的协同效应,但许多人认为“太空中的数据中心”概念不切实际,并且是马斯克雄心勃勃、常常未能实现的项目模式的延续。此举受到了犬儒主义和对马斯克动机以及两家公司未来方向的猜测。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 TileIR 内部结构 (maknee.github.io) 10 分,由 vimarsh6739 1 天前发布 | 隐藏 | 过去 | 收藏 | 1 条评论 mathisfun123 1 天前 [–] 提示:重新查看 `--print-before-all`:`tileiras` 的 `--help-hidden` 会输出大量有趣/有用的选项。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

英伟达的股价周一略有下跌,原因是有关其可能对 OpenAI 进行 1000 亿美元投资计划停滞的报道。虽然该协议已于九月宣布,但内部人士透露对该交易最终能否完成存在不确定性。 英伟达首席执行官黄仁勋最初表示,1000 亿美元的数字并非具有约束力,并对 OpenAI 的战略和竞争表示担忧。他后来否认了对 OpenAI 不满的说法,重申将进行“巨额”投资,并赞扬了 OpenAI 的首席执行官 Sam Altman。但他澄清,投资不会超过 1000 亿美元。 分析师认为,黄仁勋的声明旨在解决对“循环融资”的担忧——人工智能公司相互投资——并防止竞争对手(如谷歌)从中获益。尽管存在反复,专家认为英伟达仍然致力于进行大量投资,可能接近 1000 亿美元的水平,这将使双方受益,并缓解对 OpenAI 财务稳定性的担忧。

## Anki 的未来:过渡到社区驱动的开发 在 Damien 的邀请下,AnkiHub 团队将承担 Anki 更大的领导角色。他们强调对 Anki 核心原则的深刻尊重——用户自主权、避免操纵性设计以及优先考虑真正有用的工具——并致力于维护其开源性质和可负担的价格。 他们的主要目标包括用户界面/用户体验改进、加强开发团队以避免对单个个人产生依赖(“公交车因素”)、扩大对医学以外学生的支持,以及培养更强大的插件生态系统。他们旨在提高决策的透明度,借鉴成功的开源模式,并在 Anki 社区内建立更统一的协作流程。 虽然许多细节仍在制定中——包括治理、路线图和过渡过程——但该团队强调这并非由财务问题或外部投资者驱动。他们致力于可持续性、可访问性,并避免风险投资收购的陷阱。他们欢迎社区反馈,并计划通过开放沟通和持续行动来建立信任。AnkiDroid 的主要贡献者 David Allison 将全职加入团队,以帮助应对这些变化。

## Anki 所有权转移至 AnkiHub - 摘要 Anki,流行的间隔重复软件,正在将其所有权从其创建者 Damien 转移至 AnkiHub,一家以销售 Anki 卡组和附加组件而闻名的公司。Damien 将以更可持续的层级继续参与。此举旨在确保 Anki 的未来并解决原始维护者可能面临的倦怠问题。 Anki 的核心代码将保持开源,AnkiHub 已声明致力于避免“劣质化”——将用户体验置于利润之上。然而,一些评论员对 AnkiHub 的商业模式和潜在利益冲突表示担忧。 值得注意的是,独立的 AnkiDroid 项目将继续进行,其主要维护者将加入 AnkiHub。用户正在讨论潜在的替代方案,如 Mochi,以及鉴于 Anki 的开源性质,必要时分叉 Anki 的可能性。许多长期用户表达了对 Anki 对其学习产生的影响的感激之情,并希望在新的管理下拥有积极的未来。社区持谨慎乐观态度,强调维护 Anki 的核心原则和开放性的重要性。

更多

联系我们 contact @ memedata.com