MemeData

曼巴-3 Mamba-3 54 天前

## Mamba-3：一种新的状态空间模型推理关注点继Mamba-2专注于状态空间模型（SSM）的训练速度后，LLM领域的重点正在转向高效*推理*——使用训练好的模型的过程。虽然Mamba-2简化了SSM以加快训练速度，但这导致了受内存限制的推理，从而限制了性能。 Mamba-3通过设计一种专门用于高效推理的SSM来解决这个问题。它解决了线性模型（如Mamba-2）中固定大小状态的局限性——这些状态压缩了所有过去的信息——通过提高SSM机制的表达能力，利用复值系统扩展状态跟踪能力，并利用并行处理。关键改进包括更通用的递归、多输入多输出（MIMO）SSM以及QKNorm等架构更新。这些变化在保持与Mamba-2相似的推理延迟的同时，显著提升了性能，甚至在某些情况下超越了Transformer。Mamba-3利用Triton、TileLang和CuTe DSL等工具来实现优化的内核性能，并已开源以供进一步开发。最终，Mamba-3旨在突破LLM的质量-效率边界，认识到快速有效的模型部署日益重要。

## Mamba-3 总结 Mamba-3，Together AI 的一种新型状态空间模型 (SSM)，优先考虑**推理效率**——使用模型的速度和成本——而非训练速度，这与其前身 Mamba-2 不同。主要改进包括更具表现力的递归公式、复值状态跟踪以及用于提高准确性的 MIMO 变体。讨论的重点是比较 Mamba-3 与 Mercury-2 等其他模型，以及 SSM 架构与扩散模型之间的更广泛差异。一个关键的争论点在于，优先考虑推理计算是否有益，一些人认为这会限制批次大小和整体吞吐量，而另一些人则认为这对于低延迟应用很有价值。对话还涉及将 Mamba 等线性模型与传统 Transformer 结合的混合架构的可能性，以利用两者的优势，以及将为 Transformer 设计的现有基础设施（GPU 和软件）适应这些新方法的挑战。最终，社区对 Mamba-3 的潜力持乐观态度，特别是作为未来扩展的基础。

Traces of Evil 54 天前

黑客新闻新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交登录邪恶的痕迹 (tracesofevil.com) 17 分，由 jacquesm 1 天前发布 | 隐藏 | 过去的 | 收藏 | 2 条评论帮助 LoganDark 23 小时前 [–] 我无法阅读 Fraktur 字体标题，并尝试将其复制粘贴到其他地方以便阅读，这通常是我在类似情况下的做法，但显然该网站不允许文本选择？回复 treetalker 20 小时前 | 父评论 [–] > 邪恶的痕迹：剩余纳粹遗址索引顺便说一句，我可以在 iOS 上选择文本。指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式搜索：

Cryptography in Home Entertainment (2004) 54 天前

## 实体介质的回归与数字版权管理对昂贵、零散且充斥广告的流媒体服务的日益不满，正在推动实体介质如DVD和蓝光光盘的复兴，这些光盘在唱片店可以廉价购买。然而，播放这些“过时”的光盘需要应对复杂的数字版权管理（DRM）系统。早期的保护措施如CSS（用于DVD）相对容易破解，导致了DeCSS等工具的出现。蓝光光盘的保护更为复杂，通常需要逐个光盘的解密密钥或解码制造过程中故意添加的“故障掩码”。令人惊讶的是，下载这个故障过程的输出往往是最简单的解决方案，因为整个数据集相对较小。尽管如此，由于蓝光光盘已经高效压缩，因此撕裂蓝光光盘并不总是实用的。许多评论员强调了实体介质的便利性——一种专注的观看体验，没有持续的流媒体问题——以及它提供的长期所有权，与数字租赁的短暂性形成对比。人们对介质本身和播放硬件的寿命表示担忧，但低成本和有形的所有权正对许多人具有吸引力。

FFmpeg 101 (2024) **FFmpeg 101 (2024)** FFmpeg 101 (2024) 54 天前

## FFmpeg 概述 FFmpeg 是一套强大、开源的工具和库，用于处理多媒体。它包含诸如 `ffmpeg`（用于转换）、`ffplay`（一个简单的播放器）和 `ffprobe`（用于流分析）等命令行工具，以及用于集成到自定义项目中的库。核心库包括 `libavformat`（I/O 和复用/解复用）、`libavcodec`（编码/解码）以及用于过滤、缩放和重采样的其他库。典型的流程包括将多媒体流解复用为音频和视频组件，然后使用诸如 `AVFormatContext`、`AVStream`、`AVPacket` 和 `AVFrame` 等结构将这些组件解码为原始数据。该过程从使用 `avformat_open_input` 打开文件、使用 `avformat_find_stream_info` 查找流信息，然后迭代流以提取帧率和编解码器类型等详细信息开始。编解码器使用 `avcodec_find_decoder` 识别，并为解码创建一个 `AVCodecContext`。最后，使用 `av_read_frame` 读取数据包，使用 `avcodec_send_packet` 将数据包发送到解码器，并使用 `avcodec_receive_frame` 接收解码后的帧。一个完整的示例，可在 `ffmpeg-101` 仓库中找到，演示了此过程，并可以使用 `meson` 和 `ninja` 构建。

最近的 Hacker News 讨论突出了一份新的 FFmpeg 101 资源 (igalia.com)，引发了人们对这个强大的多媒体框架的兴趣。虽然有些人觉得最初的文章命令很简单，但用户热情地推荐 Leandro Moreira 的深入教程 ([https://github.com/leandromoreira/ffmpeg-libav-tutorial](https://github.com/leandromoreira/ffmpeg-libav-tutorial)) 作为真正理解 FFmpeg 及其底层库 libav 的最佳方式。对话中也反映了 FFmpeg 发展之迅速（“FFmpeg 8 感觉就像昨天！”）以及对其能力的赞赏——一位用户称其为组装视频的“超能力”。另一个有用的指南也通过链接到之前的 YCombinator 讨论分享。总而言之，该帖子表明了社区对掌握这个基本工具的强烈兴趣。

purl：一个类似curl的CLI，用于发起需要支付的HTTP请求。 purl: a curl-esque CLI for making HTTP requests that require payment 54 天前

``` 一个类似curl的CLI工具，用于发起需要支付的HTTP请求。专为人类和代理设计。 payments + curl = purl 安装 # Homebrew $ brew install stripe/purl/purl # 或通过shell脚本 $ curl -fsSl https://www.purl.dev/install.sh | bash 用法 # 设置你的钱包 $ purl wallet add # 测试免费端点 $ purl https://www.purl.dev/test/free # 测试付费端点 (0.01 USDC) $ purl https://www.purl.dev/test/paid ```

## purl：按请求付费的 HTTP CLI 一个名为“purl”（purl.dev）的新 CLI 工具旨在实现需要付费的 HTTP 请求，利用 HTTP 402 Payment Required 状态码。该工具采用“curl 类似”的界面构建，旨在通过经济激励请求来对抗抓取。 Hacker News 上的讨论显示出对其实用性的怀疑。担忧包括支付金额操纵的可能性、由于支付流程导致的请求延迟增加，以及鉴于其财务资源，它是否真的能阻止机器人。用户还指出了文档问题——关于机器人（通过 `AGENTS.md`）的文档比关于人类用户的文档更完善——以及 Stripe（参与方）不明确的营销。一位用户还遇到了 Debian 上旧版 glibc 的兼容性问题。该项目重新定义“purl”一词，将其作为“persistent uniform resource locator”的缩写。

图灵奖授予贝内特和布拉萨德，以表彰他们在量子信息科学领域的贡献。 Turing Award Honors Bennett and Brassard for Quantum Information Science 54 天前

该网站正在使用安全服务来保护自身免受在线攻击。您刚才的操作触发了安全解决方案。提交特定词语或短语、SQL命令或格式错误的数据等行为可能会触发此阻止。

黑客新闻新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交登录图灵奖授予 Bennett 和 Brassard 以表彰他们在量子信息科学领域的贡献 (acm.org) 64 分，由 throw0101d 1 天前发布 | 隐藏 | 过去的 | 收藏 | 讨论帮助指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式搜索：

莫莉卫士 Molly Guard 54 天前

## “莫莉护卫”——设计中的安全网 “莫莉护卫”是一种设计元素——最初是重要按钮上的物理保护罩——旨在防止意外激活。传说这个名字源于一个孩子“莫莉”，她在参观数据中心时反复按下了一个关键按钮。起初这是一种硬件功能（例如凹陷的按钮或SIM卡弹出器），但这个概念也延伸到了软件中。“你确定吗？”对话框和Ctrl+Alt+Del之类的组合键充当软件莫莉护卫，需要用户有意的操作。有趣的是，“反向莫莉护卫”也存在——由*无操作*触发的自动化操作，防止系统仅仅停止运行。作者强调了找到这些功能时的轻松感，回忆起因未响应提示而导致无人值守机器停止运行的沮丧。最终，“莫莉护卫”以其所有形式，代表了一种防止错误并确保系统按预期运行的周到方法。

最丑的飞机：一种欣赏 The Ugliest Airplane: An Appreciation 54 天前

启用 JavaScript 和 Cookie 以继续。

## AirTruk：对一架“丑陋”飞机的欣赏最近的Hacker News讨论集中在AirTruk上，这是一种独特设计的农业飞机，通常被描述为视觉上不吸引人。AirTruk最初设计于澳大利亚，用于在崎岖地形上运行，采用钢结构和高有效载荷能力——能够携带超过4吨的货物。用户分享了与其他不寻常飞机的经验和比较，包括PZL M-15 Belphegor、DFW Floh，甚至奇特的Stipa Caproni。许多人强调了令人印象深刻的工程设计，使其能够在相对较低的速度下起飞并携带重载。对话扩展到关于飞机设计理念、钢和铝等材料之间的权衡，以及自制飞机的独创性。一些评论员分享了关于超轻型飞机和实验航空的个人轶事，强调了飞行在主流、受监管航空之外的可及性。最终，尽管外观非常规，AirTruk仍然激发了人们对独特而实用飞机设计的积极欣赏。

Heisuke Hironaka Has Died 54 天前

## 广中平助逝世著名数学家广中平助去世。Hacker News上分享了对他的悼词，强调了他的善良以及对同事和学生的影响。一位评论者回忆起曾寻求广中平助作为导师，并收到了一封慷慨的手写推荐信，这“为他打开了所有机会之门”。他以谦逊著称，甚至会向学生的父母夸大其研究生的重要性。广中平助因其1964年对奇点分解的突破性解决而闻名——这是代数几何领域的一个关键成就，被亚历山大·格罗滕迪克誉为20世纪最深刻的结果。一个解释奇点分解的技术论文链接也被分享了。除了他的数学贡献外，评论者还提到了他妻子令人惊讶的政治生涯，并回忆起她在哈佛大学数学系活动中的安静身影。

斋戒期与 Lisp Lent and Lisp 54 天前

Dr. Drang 最初想解释为什么他之前的文章中没有将灰烬星期三与斋月和农历新年并列。这让他陷入了日历计算的深入研究，并可能从 Emacs Lisp 转向 Common Lisp。他发现了一个由 Reingold & Dershowitz 编写的宝贵的日历库，但由于包/命名空间问题，原始代码无法加载。一个简单的修复——删除特定行——使其能够在 CLISP 中工作。利用这个库，他编写了一个脚本 (`ramadan-lent`) 来识别斋月的第一天和灰烬星期三在 500 年内重合的年份，发现大约每 98 年发生一次。然后，他扩展了这个脚本 (`ramadan-lent-new-year`) 以同时检查农历新年的庆祝活动，揭示了罕见的三重巧合。这个项目重新燃起了他对 Lisp 编程的兴趣，并促使他购买了 Reingold & Dershowitz 最新版的综合日历参考书，承诺将进一步探索与日历相关的主题。

一个黑客新闻的讨论围绕着《Lent and Lisp》一书中的代码，特别是其非惯用的 Lisp 实现的日历计算系统。用户发现原始代码源过于复杂，并在 Apache 许可下找到一个镜像版本。一位用户成功地将代码适配到 SBCL 上运行，通过使用特殊变量解决了风格警告和 ANSI 常量定义问题。尽管代码风格陈旧——包括过度使用宏、缺乏文档和单字母变量名——但它执行效率很高，可以在大型数据集上在一毫秒内计算斋月/圣灰星期三的相关性。评论者批评代码风格糟糕，并建议完全重写，指出可以通过结构、类和适当的文档字符串进行改进。他们还讨论了 Lisp 中宏相对于内联函数的历史偏好。最后，一位用户提供了一个代码的建议包定义。

每日HackerNews RSS