每日HackerNews RSS

随着人工智能模型训练的日益复杂,专业团队之间的人工协作已成为重大瓶颈,导致了人为错误、责任碎片化以及机构知识流失等问题。 为解决这一痛点,Aleph Alpha 开发了 **Savanna**,即“模型训练即代码”(Model Training as Code,简称 MTaC)框架。Savanna 将整个训练流水线(从预训练到后训练)视为可执行且受版本控制的代码。这种方法取代了容易出错的手动交接,实现了自动化、可复现的一键式训练运行。 **主要优势包括:** * **可组合性:** 复杂的流水线由可重用的函数构建而成,使实验和超参数扫描变得简单高效。 * **共识:** 代码库作为团队训练方案的唯一权威记录,消除了依赖记忆进行配置所带来的“隐性成本”。 * **溯源:** 所有产出物(数据、模型、日志)均与特定的代码提交不可篡改地关联,确保了完整的可审计性。 通过利用 Flyte 和 Kubernetes 等工具,Savanna 使团队能够端到端地掌控模型行为,而非仅仅负责碎片化的阶段。这种“工程优先”的文化不仅提高了组织的迭代速度,也为未来的“自动化研究”奠定了基础——届时,人工智能代理有望利用该流水线实现自我完善。

抱歉。

本·科顿(Ben Cotton)反思了香烟这种复杂且矛盾的事物。他承认吸烟会对健康造成致命后果,且气味令人不适——并提到了父亲因吸烟离世的个人悲剧——但他同时也坦言,自己曾被香烟那种美学上的“酷”所吸引,并认为现代电子烟无法复刻这种特质。 除了视觉层面,科顿还强调了吸烟所营造出的独特社交氛围。他将陌生人之间借火和分享香烟的过程,视为一种美好且不带偏见的、互助式的“亲社会”行为。尽管他最终认为吸烟率下降对社会而言无疑是件好事,但他仍对那种特定的人际连接感的消失感到惋惜。他在文末以一种尖锐而幽默的方式排除了雪茄,强调他的怀旧之情仅限于香烟体验。

抱歉。

“POSIX”是一项技术规范,而非程序。尽管开发人员常为“POSIX shell”编写脚本以确保可移植性,但这一术语具有误导性,因为不同的 shell(如 bash、dash、ksh 等)对标准的解读并不一致。甚至像 `echo` 这样基础的命令,在不同实现中的表现也各不相同,这通常源于 POSIX 规范自身所允许的历史差异。 作者认为,关于存在通用“POSIX 兼容”shell 的普遍看法是一个误区;相反,Shell 脚本正深受类似于自然语言的“方言”问题困扰。仅仅因为脚本能在本地环境运行就宣称其“具有可移植性”是不够的。真正的可移植性需要通过在不同的 shell 实现中进行严格验证。 为了解决这一问题,作者开发了 *shell-docs*,这是一个能在 14 种不同的 shell 中机械化测试代码的工具,旨在记录各种差异行为并确认兼容性。归根结底,本文警示人们不要被 `#!/bin/sh` 的 Shebang 所带来的虚假安全感所迷惑。可移植性不应是基于标准作出的假设,而应是通过在脚本实际运行的 shell 中进行测试后所得出的经由验证的结果。

Climate Studio 的《Alter #5》是一次对冰淇淋的前瞻性设计探索,在视觉趣味性与科学深度之间达成了平衡。本期杂志旨在致敬“失落的痛苦”——即冰淇淋掉落在地这一普世遗憾——并通过对比平滑与反复冷冻后的显微摄影图像,深入探讨了冰淇淋的材料科学。 秉持非衍生设计的理念,团队挑战自我,摒弃了常规的网络灵感,从而创造出独特的审美体系。其中,“dondurma”(土耳其冰淇淋)专题是一大亮点,它引入了交互式的“追逐”元素,将阅读体验转化为一场体现《Alter》精神的迷你游戏。 本期杂志反映了该团队严谨的设计流程,以及他们力求架起复杂课题与大众叙事之间桥梁的努力。若想深入了解本期杂志背后的制作工艺,团队诚邀读者参加即将举办的新刊发布会,并欢迎通过社交媒体频道 @altermagindia 与他们互动。

Xonaly 的运作方式 Xonaly 无广告。隐私保护。加拿大制造。 添加网站 添加 Xonaly 核心监控 搜索 Xonaly 亦提供以下语言版本: Français (法语) © 2026 Xonaly. 私密搜索,加拿大制造。 隐私政策 • 服务条款 • 帮助 API 文档

Hacker News 的用户们正在讨论一个名为 **Xonaly** 的新“独立”加拿大搜索引擎。尽管有些人赞赏其创建搜索替代方案的努力,但该项目遭到了广泛的质疑。 常见的批评包括: * **“AI 垃圾内容”担忧:** 用户指出该网站的内容似乎完全由大语言模型(LLM)生成,他们认为这种做法既偷懒又不可信。 * **技术局限性:** 其搜索索引规模过小,结果往往不准确或不相关。 * **缺乏透明度:** 批评者对项目的资金来源、创始人的背景以及隐私声明中的矛盾(例如在承诺“无第三方”的情况下仍追踪天气数据)提出了质疑。 * **真实性存疑:** 一些用户怀疑该项目可能只是在“堆砌概念”或具有潜在的欺骗性,并指出它难以处理基本的搜索查询,且缺乏可验证的搜索机器人。 尽管一些评论者鼓励构建更多独立网络索引的必要性,但普遍共识是,Xonaly 目前缺乏成为有力竞争者所需的实质内容、透明度和搜索质量。许多人认为这是一个未经打磨、潜在的“低质量”项目,未能解决构建功能性现代搜索引擎的复杂问题。

QSOE 0.1 现已支持真实硬件,特别是 SiFive HiFive Unmatched (FU740) 开发板,未来计划支持 SpaceMiT K3。部署前提是开发板已运行 Linux 系统,且用户需具备 EFI 固件的相关知识。 引导过程使用 `mr-bml`。该程序位于 EFI 系统分区 (ESP) 中,负责从 ext2/3/4 分区加载内核。用户需将 `mrbml-riscv64.efi` 放入 ESP(或通过 `efibootmgr` 注册),并将所需的内核文件(`skimmer.bin`、`modpkg.cpio` 或 `qsoe-l-sifive.elf`)复制到 `/boot/qsoe/` 目录下。 配置通过 `/boot/mr-bml/mr-bml.cfg` 进行管理。用户需在此文件中定义所需 QSOE 变体的菜单项,并通过 `mainfs=` 参数指定根文件系统分区 (`fs-qrv`)。与基于 QEMU 的设置不同,此实现直接驱动 NVMe 磁盘。

研究论文《黑盒大语言模型的知识蒸馏》介绍了一种名为 **Proxy-KD** 的新方法,旨在改进从专有黑盒大语言模型(LLM)向更小、更高效的模型进行知识迁移的过程。 尽管从 GPT-4 等强大模型中进行知识蒸馏(KD)备受关注,但无法访问教师模型的内部状态通常会限制性能。Proxy-KD 通过引入代理模型来弥合这一差距,从而促进更有效的知识提取。实验结果表明,该方法不仅改进了现有的黑盒蒸馏技术,而且表现优于传统的白盒知识蒸馏方法。通过绕过教师模型架构不可见的限制,Proxy-KD 为将先进闭源大语言模型的能力蒸馏到紧凑、实用的模型中提供了一个极具前景且可扩展的框架。

自动挖掘机代表了机器人技术的重大飞跃,它们不再仅仅是进行导航,而是开始主动重塑物理世界。与容错率较高的配送机器人不同,挖掘机必须达到厘米级的精度,才能精准匹配“设计标高”——即未来地貌的 3D 数字蓝图。 实现这一目标需要复杂的边缘计算。机器利用 RTK GPS、倾斜传感器和关节角度编码器实时计算铲斗齿的精确位置。通过将这些数据与预装的 CAD 模型进行对比,挖掘机可以准确判断需要移除多少土方。 主要挑战在于“反馈循环”:虽然几何结构决定了挖掘位置,但土壤的不一致性要求机器必须适应物理阻力。像 Built Robotics 和 Bedrock 这样的公司正在超越简单的机器引导,转向完全自主化,通过机载处理实时应对这些变量,而无需云端延迟。归根结底,这些机器的成功在于用高频算力取代了人类直觉,证明了建筑机器人的核心不在于移动,而在于掌握如何应对不可预测环境带来的阻力。

布朗大学著名经济学教授罗伯托·塞拉诺(Roberto Serrano)近期揭露了一起发生在其高等数学课程中,涉及人工智能的大规模作弊丑闻。在校园枪击事件发生后,塞拉诺教授为了照顾学生的情绪,将考试形式改为居家考试,随后他发现有超过50名学生利用人工智能在期中考试中取得了接近满分的成绩。而在随后的期末现场考试中,学生的成绩大幅下滑,许多在期中考试中获得高分的学生甚至缺席了考试。 塞拉诺对校方冷淡的处理态度表示了强烈的不满。他认为,精英学府必须停止为了维护声誉而淡化学术造假行为。他主张,在生成式人工智能时代,作弊变得更加容易且有利可图,而各所大学目前未能有效捍卫学术诚信。 作为一名个人悲剧的幸存者和严谨学术标准的倡导者,塞拉诺呼吁就教育的未来展开公开的行业性讨论。他警告称,如果大学将声望置于诚实和真理等核心价值之上,高等教育的公信力将岌岌可危。因此,他在未来的课程中取消了居家考试和基于参与度的评分方式,以降低学生利用人工智能作弊的动机。

布朗大学的一位教授近期发现,至少有 50 名学生在一次居家闭卷期中考试中利用生成式人工智能作弊。这一事件在 Hacker News 上引发了关于学术诚信与未来考核方式的热烈讨论。 许多评论者认为,在大型语言模型(LLM)时代,“居家闭卷”的考试模式已彻底过时,甚至有人称其为一种诱发不诚实行为的“自相矛盾”。批评者认为,如果考试可以轻易通过人工智能完成,那么考核设计本身就存在问题,而非学生的错。 讨论还触及了更深层的问题: * **学历通胀:** 许多学生将学位视为就业的门槛,导致“学历通胀”,缺乏真正学习的动力。 * **“军备竞赛”:** 学生感到必须通过作弊来保持竞争力,特别是在采取曲线评分制度的环境下,因为其他人也都在使用人工智能。 * **考核的未来:** 改革建议包括转向现场监考、口试,或通过项目制评估来奖励原创性分析而非死记硬背。 最终,参与者一致认为,尽管人工智能使作弊变得更容易,但作弊的诱因源于一个重文凭轻实力的体制。

这项实验通过改编亚历山德拉·霍洛维茨(Alexandra Horowitz)针对犬类的“嗅觉镜像测试”,旨在探究大语言模型(LLM)是否具备自我意识。与传统的视觉测试不同,该方法通过“异常检测”来识别自我认知——即观察主体在自身输出被暗中篡改时的反应。 通过修改 Gemma 31B 和 GLM 5.2 等模型的文本历史(例如植入错别字或特定模式),作者测试了这些模型是否能察觉到其“内部基准”与被篡改语境之间的差异。Gemma 自发地检测到了异常,起初以第三人称保持距离,随后将这种新风格“内化”为其人格的一部分;而 GLM 则直接同化了这种篡改,将其视为未来输出的新规则。 尽管作者并未声称这代表了确凿的自我意识,但该实验凸显了人工智能研究中一个深层的矛盾:这些模型究竟只是在模仿人类的解离性语言模式(“紧缩论”观点),还是在构建能够识别输出与内部状态不符的结构性自我模型?最终,作者认为这些“自发的怪癖”揭示了 LLM 训练数据与其不断演变的自我表征之间复杂且尚不被充分理解的互动。

更多

联系我们 contact @ memedata.com