每日HackerNews RSS

## LLM 使用:超越炒作 – 基于数据的总结 最新研究揭示了大型语言模型 (LLM) 采用情况比通常认为的更为复杂。该领域并非由单一模型主导,而是蓬勃发展着一个多样化的生态系统,闭源模型(OpenAI、Anthropic)和日益强大的开源模型(DeepSeek、Qwen)共享显著的使用量——有时开源模型甚至占代币的 30% 以上。 令人惊讶的是,LLM 使用的大部分并非以生产力为中心。角色扮演和娱乐占开源模型使用量的 50% 以上,突显了面向消费者的互动应用方面的巨大机会。此外,使用方式正在演变 *从* 简单的提示 *到* 复杂的、多步骤的“代理推理”,模型规划并执行任务。 从地理位置上看,LLM 需求正在迅速扩展到北美以外的地区,亚洲现在占总使用量的 31%。至关重要的是,价格并非采用的唯一驱动因素,用户优先考虑质量、可靠性和能力。最后,*留存*——找到完全适合特定工作负载的模型——正在成为长期成功的关键指标,超越了简单的增长指标。 这些发现强调了对 LLM 开发和部署采取灵活、全球化方法的需求,该方法应基于现实世界的使用模式。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 AI 现状:使用 OpenRouter (openrouter.ai) 的 100T Token 实证研究 19 分,作者 anjneymidha 33 分钟前 | 隐藏 | 过去 | 收藏 | 1 条评论 themanmaran 17 分钟前 [–] > 该指标反映的是推理模型提供的所有 token 的比例,而不是模型输出中“推理 token”的份额。 我对推理与非推理指标的澄清感兴趣。 这是否意味着推理总数是 (输入 + 推理 + 输出) token?还是仅仅是 (输入 + 输出)? 显然,推理 token 会大大增加总计数。因此,与非推理模型进行公平比较会很有趣。 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

数字物理学认为宇宙运作着一个巨大的底层计算过程——本质上是一台巨大的计算机。 楚塞、冯·诺伊曼和沃尔夫拉姆等先驱提出,这种计算并非由复杂的数学来*描述*,而是*构成*了基本的现实,数学是其结果。 一个引人注目的例子是晶格气体自动机:控制粒子碰撞的简单规则可以令人惊讶地近似复杂的流体动力学Navier-Stokes方程。 这说明了核心思想——基础层面的极端简单性产生内在的复杂性。 与许多提供关于世界预测性解释的科学模型不同,数字物理学提出了一个大胆的形而上学主张,关于世界*是什么*:不是受数学*支配*,而是由计算*构成*。 它假设了一个比传统假设更简单的底层结构,所有现象都源于基本规则的执行。

一个黑客新闻的讨论围绕着宇宙是根本上*就是*数学,还是仅仅被数学*描述*的问题。最初的帖子链接到一个探索更大胆的现实模型项目。 许多评论者表示更倾向于支配宇宙的简单底层规则,而不是复杂的隐藏数学。然而,一些人认为这些简单规则*本身*就是数学的。一个关键点是难以定义宇宙“由”数学构成意味着什么——像加法这样的抽象概念能物理存在吗? 另一些人持怀疑态度,指出缺乏支持时空离散模型(例如宇宙作为计算机运行)的实验证据。他们强调当前连续模型的成功,以及验证替代方法所需的新的预测。最终,共识倾向于需要可证明的、新颖的预测来支持这些更大胆的理论。

## 语言价值观:Go、Rust 和 Zig – 一次个人探索 出于理解编程语言做出特定设计选择的*原因*,而非仅仅列出特性,作者尝试了 Go、Rust 和 Zig。目标不是精通,而是辨别每种语言所体现的核心价值观。 **Go** 优先考虑简洁性和企业协作。它刻意保持极简,旨在易于理解和编写稳定的代码,即使这意味着需要编写样板代码。它被设计用于广泛的可用性和团队内的并发编程。 **Rust** 则相反,是最大化的,力求安全性和性能。其复杂的类型系统和众多特性旨在在编译时消除未定义行为,提供强大的保证,但也带来了陡峭的学习曲线。 **Zig** 提供了一种叛逆的替代方案,提供最大程度的控制并避免抽象。它拥抱手动内存管理并拒绝面向对象范式,鼓励数据导向的方法。Zig 旨在赋予开发者完全的控制权,即使这意味着更多的责任。 最终,作者认为 Go 适合协作环境,Rust 适合需要毫不妥协的安全性的应用程序,而 Zig 适合那些寻求自由和摆脱传统编程模式的人。每种语言不仅仅是一种工具,更是一种价值观的体现。

## Go vs. Rust vs. Zig:一则黑客新闻讨论总结 一篇比较Go、Rust和Zig的文章在黑客新闻上引发了热烈讨论。核心观点是,虽然Rust功能强大,但Zig更吸引那些寻求更大控制权并摆脱面向对象范式的开发者——特别是那些来自C/C++的开发者。 评论者们争论了这些语言的权衡。Go缺乏泛型被归因于长时间的决策过程,而Rust的复杂性,尤其是生命周期,是一个常见的痛点。一些人认为Rust的安全特性过于官僚,与Zig更宽松的方法形成对比。 一个关键的争论点是Zig的设计选择,例如手动内存管理,是源于对数据导向设计的关注的美德,还是仅仅是不同的权衡。 还有关于RAII(资源获取即初始化)的讨论,一些人批评其过度使用,并更喜欢Zig的显式控制。 最终,这次讨论凸显了对一种结合Go的简洁性与Rust强大的错误/结果处理和泛型的语言的需求。 许多评论者认为Rust的困难源于过于复杂的代码,而另一些人则捍卫其显式性作为一种优势。

## Django 更新:安全与后台任务 本次 Django 发布引入了安全和后台处理方面的重大改进。**内容安全策略 (CSP)** 支持现已内置,增强了对跨站脚本 (XSS) 等攻击的防御。开发者可以通过 `SECURE_CSP` 等设置定义可信内容来源,利用 Django 常量以提高清晰度。通过中间件和上下文处理器提供强制执行和监控工具。 此外,Django 现在包含一个 **任务框架**,用于将工作卸载到请求/响应周期之外——非常适合发送电子邮件或数据处理等任务。任务使用 `@task` 装饰器定义,并通过配置的后端进行排队(尽管 Django 不*运行*任务,而是依赖于外部工作进程)。 最后,Django 的电子邮件处理已实现现代化,采用 Python 的 `email.message.EmailMessage` API,以实现更简洁、Unicode 友好的电子邮件编写,取代了旧的遗留方法。

## Django 6 与 Web 框架讨论 - 总结 一个 Hacker News 的讨论围绕 Django 的优势,尤其是在 AI 代码生成兴起的情况下。用户强调 Django 的“开箱即用”方法非常适合快速原型化具有功能性 Web 应用程序,例如身份验证和管理面板,这使得 AI 能够更容易地进行迭代,因为代码库更小。 对话延伸到与其他框架的比较。一些人指出 Rails 在 AI 代码生成(Claude)方面表现更好,而另一些人则赞扬 Django 的可维护性和清晰结构。 许多用户表达了对 Django 寿命长和易用性的喜爱,将其与 Java 中 Spring Boot 的复杂性形成对比。 讨论还涉及不断发展的 Web 开发格局,提到了诸如 Flask 之类的微框架、Javascript 堆栈以及 Go 和 Rust 等语言。一个反复出现的主题是功能齐全的框架与构建自定义解决方案的灵活性之间的权衡。 最后,存在关于传统框架与现代 Javascript 为中心的方法的优缺点的争论,一些人哀叹新技术中简单性和稳定性的丧失。

在2023年荷兰之旅中,克里斯在乌特勒支的Speelkok博物馆(自动乐器博物馆)发现了一个有趣的异常现象。虽然该博物馆拥有令人瞩目的自动机、钟表和街头风琴收藏,但一台经过改装的20世纪30年代舞厅机器尤其吸引了他。 这台机器最初设计用于播放编码在穿孔纸板书上的音乐——这是相对于传统音乐筒的一次技术飞跃。令人惊讶的是,它得到了更新。有人巧妙地连接了一台笔记本电脑,使其能够播放现代MP3文件,而不是原始的基于书本的系统。 克里斯现在正在努力揭开这次改装背后的故事:是谁做的,如何实现的,以及为什么。他已联系博物馆获取信息,并向互联网发出求助,希望有人能揭示这个有趣的谜团。

ChrisbyMe 在 Hacker News 上分享了一个链接,指向 chrisbako.com,内容是关于有人将笔记本电脑连接到 1930 年代的舞蹈厅机器来创作音乐。这个帖子引发了关于类似内容在 YouTube 上出现的讨论,评论者 Teever 提到推荐了一首 Ace of Base 的翻唱,并链接到一位“机械音乐人”的网站 ([https://www.mechanicalmusicman.com/](https://www.mechanicalmusicman.com/))。 Teever 戏谑地建议进行一场机器人表演——机器人传送磁带、按下播放键,然后随着机械生成的 MIDI 音乐跳舞,将其描述为人工智能统治的幽默序幕。ChrisbyMe,最初的发布者,感谢了 Teever,并分享了一个关于迪士尼自动机历史的视频 ([https://www.youtube.com/watch?v=jjNca1L6CUk](https://www.youtube.com/watch?v=jjNca1L6CUk))。

## 从杂草到实验室图标:*拟南芥*的故事 *拟南芥*是一种原产于欧亚大陆的小型开花植物,已成为植物生物学的主要模式生物——从不起眼的杂草到实验室必需品,这真是一段非凡的旅程。它最早于 16 世纪被描述,但其潜力直到 20 世纪初才被德国植物学家弗里德里希·莱巴赫认识到,他注意到它简单的遗传构成(只有五对染色体)并开始收集不同的样本。 尽管莱巴赫倡导将其用于遗传研究,但*拟南芥*在 1980 年代之前 largely 被忽视。利用细菌*农杆菌*的植物转化技术的突破,最终释放了它的潜力。易于操纵其基因的能力,加上其小的基因组,促成了广泛的突变体收集,并最终在 2000 年完成了其全基因组测序。 如今,*拟南芥*对于理解植物遗传学、发育和对环境的反应至关重要。从研究这种“植物界的埃希氏大肠杆菌”中获得的见解直接影响作物改良和更广泛的生态学研究。它的适应性——甚至在太空中也能茁壮成长——巩固了它作为全球植物科学家不可或缺的工具的地位。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 最重要的芥末 (asimov.press) 26 分,由 surprisetalk 5小时前发布 | 隐藏 | 过去 | 收藏 | 1 条评论 AstroNutt 10分钟前 [–] 典型的 HN 风格,我们似乎已经集体给这个网站带来了致命的拥堵。我稍后会再检查。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## CUDA-L2:AI 优化的矩阵乘法 CUDA-L2 是一个新颖的系统,利用大型语言模型和强化学习自动优化用于半精度通用矩阵乘法 (HGEMM) 的 CUDA 内核。它在 1000 种 A100 配置中,明显优于现有解决方案,包括 PyTorch 的 `matmul` 和 NVIDIA 的闭源库,如 cuBLAS。 内核具有硬件特异性;为 A100 优化的内核最好在 A100 GPU 上使用以保证加速,并计划发布针对其他架构的版本。对于超出提供的配置的用户,可以选择填充现有配置或通过 GitHub 请求新的内核发布。 **关键要求:** Python、PyTorch (2.6.0+) 和 NVIDIA CUTLASS (v4.2.1 – *务必下载正确版本*)。必须正确配置环境变量 `CUTLASS_DIR` 和 `TORCH_CUDA_ARCH_LIST`。 评估通过 `eval_one_file.sh` 脚本进行,支持离线批量处理和查询每秒 (QPS) 目标服务器模式。支持和问题可以通过 GitHub issue 或电子邮件 ([email protected]) 提交给开发者。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 CUDA-L2:通过强化学习超越cuBLAS矩阵乘法性能 (github.com/deepreinforce-ai) 7点 由 dzign 26分钟前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

根据英国空中事故调查局(AAIB)的报告,三月份在格洛斯特郡机场发生的一起飞机失事是由一个3D打印部件的故障造成的。 Cozy Mk IV飞机在最后进近时失去动力,原因是购买于航空展的塑料进气弯头因发动机热量而软化并坍塌。 飞行员成功进行了受控坠毁,仅 sustained 轻伤,但飞机在撞击着陆辅助系统后被毁。 AAIB确定该部件使用的材料“不适合”该应用。 作为回应,轻型飞机协会(LAA)正在向检查员发布安全警报,关于使用3D打印部件,强调材料适用性的必要性,并强调暴露于热量和压力下的潜在风险。 这起事件强调了航空领域对3D打印部件进行严格测试和监管的重要性。

## 飞机坠毁与3D打印零件失效有关 英国一架飞机坠毁是由于一个3D打印的进气弯头失效造成的,该部件是发动机的关键组件。调查显示,该零件是在航空展上购买的,由CF-ABS塑料制成,其玻璃化转变温度(Tg)远低于规定值——这可能是由于材料或打印参数不正确所致。 飞行员对飞机进行了改装并安装了该零件,他依赖于对塑料和传统环氧材料之间Tg值的错误比较,未能理解它们不同的行为。专家指出,在不适合零件的制造/销售以及安装/审批过程中都存在疏忽。该飞机是实验飞机,允许进行更多改装,但关于材料属性和测试的标准工程实践被忽略了。 这起事件强调了在没有严格测试和正确材料选择的情况下使用3D打印零件的风险,尤其是在安全关键应用中。人们对误导性的长丝规格以及在应力和热作用下发生蠕变的潜力表示担忧。

启用 JavaScript 和 Cookie 以继续。

最近的欧盟法院裁决引发了关于在线平台责任的争论,担忧这可能会严重限制用户生成的内容。该裁决似乎对包含“敏感个人数据”的内容,即使是用户发布的,也要求平台承担严格的责任。 Hacker News上的讨论集中在这一裁决的影响。一些人,例如用户“xg15”,支持美国的《第230条》,它通常保护平台免受用户内容责任,将责任归于原始发布者——这在匿名盛行的情况下是一个挑战。另一些人担心该裁决将导致大范围审查,因为恶意行为者可能会利用它发布具有损害性的数据并提出投诉。 然而,用户“free_bip”认为反应过于夸大,建议需要对广告进行更严格的监管,并指出欺诈行为猖獗。Heise Verlag的一篇文章暗示,该裁决可能导致一个受到更严格监控的“Cleannet”。总体情绪倾向于对开放在线平台的未来表示担忧。

## 玻利维亚亚马逊的古代景观揭示了可持续实践 最近在玻利维亚Exaltación大断层湖西南部的跨学科研究,揭示了人类与环境之间丰富而复杂的历史。由人类学家卡拉·海姆斯·贝坦科特教授领导的团队记录了广泛的考古遗址——帕基奥、科基纳尔、特索罗岛和哈斯查哈,展示了600-1400年期间的宏伟土方工程,如抬高田和运河系统。 这些发现表明,古代社区巧妙地适应并改造了湿地,实践了多样化的经济,包括捕鱼、狩猎、采集和以玉米为基础的农业。激光雷达测绘和挖掘揭示了精湛的水资源管理技术和多样化的饮食,突出了与亚马逊的自然节律和谐相处的可持续生活方式。 重要的是,这项研究与卡尤巴巴和莫维马土著社区密切合作,尊重他们的知识和优先事项。该项目强调了该地区的生物文化遗产,并倡导对其进行保护,尤其是在面临森林砍伐和气候变化等现代威胁的情况下。Rogaguado和Ginebra的景观提供了宝贵的 sustainability(可持续性)经验教训,证明了 resilience(韧性)源于多样性和对环境的深刻理解——这对我们未来至关重要的遗产。

最近在玻利维亚重新发现了一个古老的亚马逊世界,相关报道见ScienceDaily,并在Hacker News上讨论。该发现强调了哥伦布发现美洲之前的复杂土地管理实践,侧重于可持续性和韧性。 然而,评论员对该发现的解读表示怀疑。一位用户批评使用“全球责任”等流行语,认为这与自决权相悖,并担心联合国或教科文组织等组织可能的外来管理会削弱土著社区的权力。另一位用户指出“储存碳”这种说法不够精确,认为这更像是误导性的科普,而非对二氧化碳减量的明确指代。 这场讨论引发了对历史知识如何被解读以及谁能从其重新发现中受益的担忧,强调了尊重当地知识和避免外部控制的重要性。

更多

联系我们 contact @ memedata.com