每日HackerNews RSS

## Git 事件通知 通过电子邮件和/或短信更新,及时了解 Git 操作失败情况。此服务会在事件更新时提供通知,并通过短信在 GitHub 创建*或*解决事件时立即向您发出警报。 要接收短信提醒,您需要使用一次性密码 (OTP) 验证您的手机号码。目前,我们支持广泛的国家/地区,包括(但不限于)美国、加拿大、英国、德国、印度、澳大利亚以及非洲、亚洲和南美洲的许多国家/地区——注册时会提供支持的国家/地区代码的完整列表。 如果您愿意,您可以仅订阅电子邮件通知,而无需短信验证。这对于依赖 Git 进行版本控制的开发人员和团队来说是一个有价值的工具。

## Tokenflood:LLM 负载测试 – 摘要 Tokenflood 是一款专为指令微调的大型语言模型 (LLM) 设计的负载测试工具。它通过定义提示长度、前缀长度、输出长度和请求速率等参数来模拟真实的工作负载——*无需*实际的提示/响应数据。这使得用户能够有效地评估 LLM 在不同提供商、硬件、量化和提示配置下的性能(延迟、吞吐量、成本)。 Tokenflood 利用 Litellm,支持所有兼容的提供商(OpenAI、Anthropic、Azure 等)。它对于自托管 LLM 以及在生产部署*之前*评估托管提供商都很有价值。测试涉及定义指定负载类型和请求速率的“运行套件”,然后分析结果,例如延迟百分位数和 token 使用量。 **主要优势:** 快速配置更改、模型之间的直接比较以及基于 token 数量的可靠数据。**重要提示:** Tokenflood 在按 token 收费的服务中可能会产生 significant 成本。安全功能包括 token 使用量估算、预算限制和错误率监控,但仔细配置至关重要。该项目欢迎通过 GitHub 进行社区贡献。

## Tokenflood:LLM 负载测试工具发布 开发者 twerkmeister 发布了 Tokenflood,一个用于负载测试指令微调的大型语言模型 (LLM) 的开源工具。该工具可在 GitHub 上找到 ([https://github.com/twerkmeister/tokenflood](https://github.com/twerkmeister/tokenflood)),允许用户通过配置提示词、前缀和输出长度,以及每秒请求数来模拟各种 LLM 负载,从而无需预先收集提示词数据。 该工具旨在帮助构建延迟敏感型 LLM 应用程序的开发者:测试自托管模型、在实施*之前*预测提示词更改对延迟的影响,以及评估托管 LLM 服务的性能。 Tokenflood 建立在开发者为客户优化 LLM 性能的经验基础上,旨在简化测试流程,并分享以收集反馈并可能促成新项目。感兴趣的用户可以探索该项目,并通过电子邮件或 LinkedIn 与开发者联系。

这篇博文反思了人们对杰里·宋飞因喜剧内容受到过度敏感观众抵制的主张所做出的本能反应。作者承认,自己最初*为*批评宋飞的人辩护,尽管对他的最新作品或具体投诉知之甚少。 这种反应源于对右翼关于言论自由的抱怨感到沮丧,导致自动假设宋飞方面存在问题。然而,作者意识到这种方法的缺陷——在缺乏了解的情况下形成观点。 宋飞*仍然*在演出,但他表示不愿在大学校园演出,因为担心被指责种族主义或性别歧视。作者最终得出结论,他们*不需要*知道这些投诉是否有效,或者宋飞的喜剧是否确实有问题;他们只是愿意承认这种情况,并抵制立即选边的冲动。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

欧盟修订的“聊天控制”提案,旨在打击在线儿童性虐待,尽管存在重大隐私问题,但仍在推进。虽然已取消了对私信的强制扫描,但关键条款——第4条的“风险缓解措施”——可能实际上会恢复对“高风险”服务的扫描,可能包括加密内容。 批评人士认为,这种含糊的措辞赋予了政府广泛的自由裁量权,可能会迫使平台扫描所有内容以避免被贴上“高风险”的标签。该提案还将扫描范围扩展到聊天*文本*和元数据,而不仅仅是媒体,引发了对欧盟4.5亿公民进行大规模监控的担忧。 此外,该提案要求对所有用户进行年龄验证,实际上消除了匿名性——这对记者、举报人以及需要隐私以确保安全的人来说至关重要。专家警告说,在加密应用程序中安全检测儿童性虐待材料的技术尚不存在,欧盟再次试图监管技术上不可行的内容。 该提案现在将提交给核心小组(Coreper),然后进行快速推进的三方谈判,隐私倡导者担心妥协可能会削弱保护措施,尽管最初已取消了强制扫描。

## Gemini 3 Pro:摘要 谷歌于2025年11月18日发布Gemini 3 Pro,定位为Gemini 2.5的升级版,与GPT-5.1和Claude 4.5 Sonnet等领先模型竞争。它保留了Gemini 2.5的功能——100万token的输入窗口和64,000 token的输出——并支持多模态输入(文本、图像、音频、视频)。 谷歌的基准测试表明,Gemini 3 Pro在大多数标准测试中略胜于竞争对手,但独立验证仍在进行中。定价介于Gemini 2.5 Pro和Claude Sonnet 4.5之间;输入成本范围为每100万token 2.00-4.00美元,输出成本为12.00-18.00美元。 测试展示了其在复杂任务中的强大性能。它准确地从基准图像生成替代文本,并成功地转录了一场超过3小时的市议会会议(尽管时间戳不准确)。该模型还展示了改进的图像生成能力,尤其是在更详细的“骑自行车的鹈鹕”基准测试中,其输出优于GPT-5.1和Claude Sonnet 4.5。Gemini 3 Pro引入了一个“思考级别”设置(低/高),影响图像细节。

## Gemini 3 Pro 测试:音频转录与新基准 这次Hacker News讨论的核心是测试Gemini 3 Pro的能力,特别是音频转录和Simon Willison创建的名为“pelican”的新基准。主要关注点在于自动化目前由人类完成的任务,例如总结冗长的议会会议——这对小型新闻机构来说至关重要。 Simon Willison 使用3.5小时的会议录音测试了Gemini 3 Pro,提示它创建包含说话者姓名、时间戳和摘要的Markdown转录稿。虽然整体内容被很好地捕捉,但人们对时间戳的准确性和潜在的“幻觉”(捏造的信息)表示担忧。 对话强调了多阶段方法的优势:使用专门的ASR模型(如Whisper)进行准确的转录,然后利用LLM进行总结和完善。 许多用户推荐使用MacWhisper和Parakeet等工具进行说话人分离(diarization)。 还有人指出Gemini在说话人识别和识别语气方面的优势。 Willison 还引入了一个更详细的pelican基准,引发了关于更引导性的提示是否会创建更简单的测试的争论。 总体而言,讨论强调了对可靠基准的需求,以及LLM辅助但不能完全取代人类监督在需要高精度任务中的潜力。

美国国家公共广播电台(NPR)和公共广播公司(CPB)已达成和解,CPB将向NPR拨款约3600万美元,以继续运营公共广播互联系统。这解决了NPR指控CPB屈服于前总统特朗普的压力,削减资金,原因是认为NPR存在偏见的法律纠纷的一部分。 特朗普曾公开表示希望取消对NPR和PBS的资助,NPR声称CPB最初批准了一项拨款,然后改变了主意,将资金转移到未经授权的实体。CPB否认了报复行为。 虽然这项和解并未解决NPR提出的更广泛的诉讼,该诉讼质疑特朗普的行政命令以停止资助,但NPR和CPB都同意该命令违宪,并且CPB不会在没有法院命令的情况下执行它。 NPR的首席执行官称该协议为捍卫编辑独立性和第一修正案权利的胜利。

## NPR 资金与技术摘要 最近的庭外和解将为 NPR 提供 3600 万美元,用于运营美国公共广播系统。该系统名为公共广播卫星系统 (PRSS),并利用 ContentDepot,在技术上出乎意料地复杂。它已从线性卫星馈送 (SOSS) 发展到基于 TCP/IP 的系统,通过卫星向电台传送 MP2 编码的音频文件和 IP 多播流。国际数据广播公司的专用接收器处理预录和直播内容。 讨论强调了该系统的韧性——与基于互联网的分发相比,它具有更低的延迟和冗余,对于直播活动和紧急广播尤其重要。虽然使用互联网分发,但卫星仍然对于覆盖连接不可靠的偏远地区很有价值。 然而,未来的资金来源尚不确定。由于国会削减资金,公共广播公司 (CPB) 可能在三年内停止存在,这引发了对长期可持续性的担忧。许多评论员建议采用替代的资金模式,例如增加对听众捐款的依赖,但承认该系统对于可访问性和应急准备的重要性。

## 超越内卷:三次即一次 许多数学运算,例如取一个数的负数,应用两次后会抵消自身。这些被称为内卷运算,重复偶数次运算不会产生变化,奇数次则等同于应用一次。但如果运算*不是*完全的内卷呢? 本文探讨“近内卷”——应用三次运算等同于应用一次,四次等同于两次,以此类推的运算。与标准的计数(模2)不同,这些运算遵循“零,一,二,一二……”的模式。 三个例子说明了这一点:几何中的**正交补**(寻找垂直于一组线的线),逻辑中的**直觉否定**(一种构造主义的“非”),以及图论中的网络运算 (**K(S)**)(寻找认识一个群体中所有人的那些人)。 在每种情况下,应用三次运算都会返回到原始状态,展示了一个循环。虽然看似小众,但这些“三次等于一次”的运算揭示了超越传统数学行为的迷人模式,突出了重复可能产生意想不到的结果。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 谷歌CEO:如果人工智能泡沫破裂,没有人能幸免 (arstechnica.com) 75 分,由 doctorshady 1天前发布 | 隐藏 | 过去 | 收藏 | 2 条评论 ChrisArchitect 1天前 [–] [重复] https://news.ycombinator.com/item?id=45961886 回复 dang 1天前 | 父评论 [–] 评论已移动至此处。谢谢! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

谚语“出头的椽子先被钉”和“会叫的轮子得到润滑”说明了对与众不同或有需求的不同反应。虽然两者都涉及较大系统中的“缺陷”元素,但一个面临压制,另一个获得关注。 作者反思了这些隐喻,特别是作为那些不善于自我倡导的人。他们强调,问题的紧迫性与元素的重要性相关——一个失灵的轮子比一颗弯曲的钉子更能阻碍功能。有效的倡导需要*适度地*传达紧迫性,并*清晰地*提出解决方案请求。 然而,“钉子”也有价值。有时,勇敢地指出根本性的缺陷——即使付出个人代价——也是必要的。如果足够多的“钉子”发声,系统性问题可能会得到解决。关键在于辨别*何时*提出问题,尽可能提供解决方案,并在问题严重时保持坚定,即使这意味着面临阻力。

这个黑客新闻的讨论围绕着“吱吱作响的车轮得到润滑”和“突出钉子会被敲下去”等常见谚语的含义和影响。 最初的帖子引发了关于这些隐喻是否可比的争论。一些人认为“吱吱作响的车轮”指的是解决明显的问题,而“突出钉子”指的是在群体中被认为*过于*成功或显眼的人。 一个关键点是,领导者有责任解释优先级和权衡,以防止在忽视有效担忧(“吱吱声”)时产生沮丧。 许多评论者提供了强调细微差别的替代谚语——第二只老鼠得到奶酪,哭闹的婴儿得到牛奶,但也有嘎嘎叫的鸭子会被射击,吱吱作响的车轮会被替换——说明表达意见并不*总是*能产生积极的结果。

## Guts:前往 TypeScript 代码生成 Guts 是一个 Go 库,旨在将 Go 类型转换为 TypeScript,从而在前端和后端之间保持类型一致性。与命令行工具不同,Guts 优先考虑程序化配置和自定义,允许开发者通过代码定制转换过程。 该过程涉及解析 Go 包,遍历其抽象语法树 (AST),并将 Go 类型映射到等效的 TypeScript AST 表示。然后,Guts 利用官方 TypeScript 编译器 API 将这些结构序列化为有效的 TypeScript 代码。 Guts 专注于最小的类型转换,提供变异来调整输出——例如,将 Go 类型转换为 TypeScript 枚举或类型别名。这种灵活性,加上它对 TypeScript 编译器的依赖,确保了语义上正确且最新的 TypeScript 定义。 Guts 旨在提供一个更动态和可配置的 Go 到 TypeScript 生成器替代方案。

更多

联系我们 contact @ memedata.com