每日HackerNews RSS

自动挖掘机代表了机器人技术的重大飞跃,它们不再仅仅是进行导航,而是开始主动重塑物理世界。与容错率较高的配送机器人不同,挖掘机必须达到厘米级的精度,才能精准匹配“设计标高”——即未来地貌的 3D 数字蓝图。 实现这一目标需要复杂的边缘计算。机器利用 RTK GPS、倾斜传感器和关节角度编码器实时计算铲斗齿的精确位置。通过将这些数据与预装的 CAD 模型进行对比,挖掘机可以准确判断需要移除多少土方。 主要挑战在于“反馈循环”:虽然几何结构决定了挖掘位置,但土壤的不一致性要求机器必须适应物理阻力。像 Built Robotics 和 Bedrock 这样的公司正在超越简单的机器引导,转向完全自主化,通过机载处理实时应对这些变量,而无需云端延迟。归根结底,这些机器的成功在于用高频算力取代了人类直觉,证明了建筑机器人的核心不在于移动,而在于掌握如何应对不可预测环境带来的阻力。

布朗大学著名经济学教授罗伯托·塞拉诺(Roberto Serrano)近期揭露了一起发生在其高等数学课程中,涉及人工智能的大规模作弊丑闻。在校园枪击事件发生后,塞拉诺教授为了照顾学生的情绪,将考试形式改为居家考试,随后他发现有超过50名学生利用人工智能在期中考试中取得了接近满分的成绩。而在随后的期末现场考试中,学生的成绩大幅下滑,许多在期中考试中获得高分的学生甚至缺席了考试。 塞拉诺对校方冷淡的处理态度表示了强烈的不满。他认为,精英学府必须停止为了维护声誉而淡化学术造假行为。他主张,在生成式人工智能时代,作弊变得更加容易且有利可图,而各所大学目前未能有效捍卫学术诚信。 作为一名个人悲剧的幸存者和严谨学术标准的倡导者,塞拉诺呼吁就教育的未来展开公开的行业性讨论。他警告称,如果大学将声望置于诚实和真理等核心价值之上,高等教育的公信力将岌岌可危。因此,他在未来的课程中取消了居家考试和基于参与度的评分方式,以降低学生利用人工智能作弊的动机。

布朗大学的一位教授近期发现,至少有 50 名学生在一次居家闭卷期中考试中利用生成式人工智能作弊。这一事件在 Hacker News 上引发了关于学术诚信与未来考核方式的热烈讨论。 许多评论者认为,在大型语言模型(LLM)时代,“居家闭卷”的考试模式已彻底过时,甚至有人称其为一种诱发不诚实行为的“自相矛盾”。批评者认为,如果考试可以轻易通过人工智能完成,那么考核设计本身就存在问题,而非学生的错。 讨论还触及了更深层的问题: * **学历通胀:** 许多学生将学位视为就业的门槛,导致“学历通胀”,缺乏真正学习的动力。 * **“军备竞赛”:** 学生感到必须通过作弊来保持竞争力,特别是在采取曲线评分制度的环境下,因为其他人也都在使用人工智能。 * **考核的未来:** 改革建议包括转向现场监考、口试,或通过项目制评估来奖励原创性分析而非死记硬背。 最终,参与者一致认为,尽管人工智能使作弊变得更容易,但作弊的诱因源于一个重文凭轻实力的体制。

这项实验通过改编亚历山德拉·霍洛维茨(Alexandra Horowitz)针对犬类的“嗅觉镜像测试”,旨在探究大语言模型(LLM)是否具备自我意识。与传统的视觉测试不同,该方法通过“异常检测”来识别自我认知——即观察主体在自身输出被暗中篡改时的反应。 通过修改 Gemma 31B 和 GLM 5.2 等模型的文本历史(例如植入错别字或特定模式),作者测试了这些模型是否能察觉到其“内部基准”与被篡改语境之间的差异。Gemma 自发地检测到了异常,起初以第三人称保持距离,随后将这种新风格“内化”为其人格的一部分;而 GLM 则直接同化了这种篡改,将其视为未来输出的新规则。 尽管作者并未声称这代表了确凿的自我意识,但该实验凸显了人工智能研究中一个深层的矛盾:这些模型究竟只是在模仿人类的解离性语言模式(“紧缩论”观点),还是在构建能够识别输出与内部状态不符的结构性自我模型?最终,作者认为这些“自发的怪癖”揭示了 LLM 训练数据与其不断演变的自我表征之间复杂且尚不被充分理解的互动。

1955年吉泽章在阿姆斯特丹市立博物馆举办的展览,是现代全球折纸艺术兴起的开创性时刻。20世纪50年代之前,日本传统的纸艺大多涉及剪裁或简单的儿童造型。吉泽章通过“创作折纸”(sosaku origami)彻底革新了这一工艺,他摒弃剪刀,利用湿折法,并创建了一套标准化的图解系统,使其方法得以在国际间传播。 尽管阿姆斯特丹展览并非独自开启了欧洲的折纸运动,但它成为了向西方传播吉泽章天才创意的关键焦点。在格尔申·莱格曼(Gershon Legman)的推动以及罗伯特·哈宾(Robert Harbin)和莉莲·奥本海默(Lillian Oppenheimer)等人的支持下,此次活动弥合了全球各地孤立折纸者之间的沟通鸿沟。这些关键人物催化了一个国际网络,将地方性的兴趣转化为一场全球性的创意运动。 虽然随后在纽约举办的展览因安保不力导致许多模型丢失,但其中一些近期已从莱格曼的遗产中找回并归还给吉泽章。最终,尽管国际网络为现代折纸提供了基础设施,但吉泽章的创新精神始终是这一艺术形式持续全球演变背后的根本灵感源泉。

抱歉。

尽管有关读者减少和“书已死亡”的报道层出不穷,但作者认为,书籍并非濒危物种,阅读本身也从未成为一种普遍的社会行为。从历史上看,识字曾是权力和地位的象征;而“书籍的世纪”(1850–1950)是一个独特的时代,那时阅读是一种通用的社会货币。 作者批评了现代企业出版模式,这种模式将书籍视为旨在追求短期利润而非长期价值的一次性商品。这种“不惜一切代价追求增长”的心态,削弱了曾经支撑出版业的中坚作家和旧书库。此外,作者将阅读这一主动且协作的过程与电子媒体的被动消费区分开来。虽然读者群体或许永远不会成为大多数,但阅读依然是一项重要且持久的人类活动。最终,作者指出,尽管企业高管们怀着妄图掌控出版业的错觉而收购出版社,但他们无法理解的是,以艺术而非商业为核心的文学世界,注定会对他们将其商业化的企图保持漠然。

抱歉。

请启用 JavaScript 和 Cookie 以继续。

所链接的《PCMag》文章及其随后的 Hacker News 讨论凸显了美国贸易政策的转变:从推动开放市场转向对外国技术(尤其是中国技术)实施保护主义禁令。 讨论主要集中在以下三个领域: * **贸易保护主义:** 美国正越来越多地利用“数字主权”规则来限制进口,例如针对特定联网汽车、大疆无人机和 WiFi 路由器的禁令。批评者认为这些措施是为缺乏竞争力的国内产业提供的“拐杖”,而支持者则认为这是应对中国不公平补贴和潜在安全风险的必要手段。 * **汽车行业:** 评论者探讨了美国电动汽车市场为何落后于中国。被提及的因素包括基础设施匮乏、消费者对内燃机的偏好,以及缺乏促使中国实现快速普及的激进国家引导政策。 * **人工智能地缘政治:** 许多人认为,美国限制获取先进人工智能模型的尝试会适得其反,导致美国失去竞争优势并使其系统处于脆弱状态,而开源替代方案则在全球范围内不断扩散。 最终,参与者争论的焦点在于,这些干预措施究竟是出于国家安全的战略考量,还是保护停滞不前的产业免受全球创新冲击的孤注一掷。

请启用 JavaScript 和 Cookie 以继续。

抱歉。

以下是 **Bash4LLM⁺** 的简要概述: **Bash4LLM⁺** 是一个轻量级、安全且完全可审计的“Bash 优先”命令行包装器,用于与 Groq API 及其他提供商(如 Gemini、Mistral)进行交互。它由单个自包含脚本组成,非常适合类 Unix 环境(Linux、macOS、Termux 等)。 **主要特性:** * **安全性:** 不使用 `eval` 或共享的 `/tmp` 目录;具有严格的权限设置和防漏洞设计。 * **灵活性:** 支持流式传输、来自管道或文件的输入、自定义模板以及通过 API 进行动态模型管理。 * **集成性:** 持续以 JSON 格式 (`ui_state`) 公开元数据,便于图形界面或自动化工具(如 Home Assistant)使用。 * **会话管理:** 通过 `--session` 标志激活持久化 NDJSON 文件,从而支持上下文记忆。 * **优化:** 针对 Termux/Android 进行了专门优化,例如通过原子目录锁定管理来克服移动内核的限制。 **快速安装:** 克隆存储库,将脚本设置为可执行文件,导出 API 密钥,然后使用 `./bash4llm --refresh-models` 即可开始。这是一个开源项目 (GPL v3),专为寻求对 Shell 拥有最大控制权的个人用户而设计。

该项目是一个从零开始的 GPT-2 类语言模型教学实现,完全使用 C 和 CUDA 编写。它摒弃了所有机器学习框架、库和自动求导系统,转而提供手写的正向和反向传播、自定义字节级 BPE 分词器以及完整的训练流水线。 该存储库包含两个主要实现:用于小规模演示的基于 CPU 的版本和高性能 CUDA 引擎。GPU 实现包括针对 FlashAttention、RoPE 和 SwiGLU 等操作的手写内核,所有内核均通过严格的梯度检查与 CPU 参考实现进行了验证。 该模型遵循标准的仅解码器(decoder-only)Transformer 架构(RMSNorm、GQA、MTP),并将残差块概念化为连续流的离散欧拉步。该流水线支持在书籍和高质量网页文本语料库上进行预训练,以及通过监督微调(SFT)来创建聊天助手。 尽管由此产生的约 1.16 亿参数模型能够生成流畅的英语并遵循指令格式,但它本质上是一个研究产物而非功能性聊天机器人;它在没有外部依赖“黑盒”的情况下,展示了现代大语言模型工程的端到端机制。

在ISC 2026大会上,中国的“行亮”(LineShine)超级计算机登顶TOP500榜单,这是中国九年来首次提交参评。这台大规模纯CPU系统采用了兼容Armv9架构的LX2处理器,持续FP64性能达到2.198 Exaflops。值得注意的是,行亮在HPCG基准测试中也位居榜首,超过了美国的El Capitan。 第67期榜单的其他亮点包括意大利全新的HPC7系统,它现已成为全球第六大超级计算机,并巩固了意大利作为欧洲总计算能力领跑者的地位。与此同时,传奇的“富岳”(Fugaku)系统依然保持着极强的竞争力,尽管发布已久,仍稳居HPCG榜单前三名。 虽然Green500榜单的前十名没有变化,但整个行业的能效仍在持续提升。行业观察人士目前正关注中国E级系统的出现是否会促使美国政府增加对超级计算的投入。此外,榜单管理权正在移交给ACM SIGHPC,未来将为排名分配DOI编号。报告还指出,尽管一些大型私有AI集群拥有惊人的计算能力,但它们并未出现在TOP500榜单中。

Hacker News 关于新晋 TOP500 第一名超级计算机的讨论,集中在这一中国高性能系统上。该系统采用定制的 Arm 架构 CPU 而非 GPU,实现了超过 2 exaflops 的计算能力。 辩论的核心主题包括: * **基准测试的意义:** 许多参与者认为 TOP500/Linpack 基准测试已经过时,主要反映的是“吹嘘资本”或政治姿态,而非实际性能。现实中的高性能计算(HPC)工作负载日益受到带宽限制,使得硬件指标的重要性低于软件效率和调度程序设计。 * **CPU 与 GPU 之争:** 与大多数依赖 GPU 的现代西方超级计算机不同,该系统利用了高带宽内存(HBM)和定制 CPU。支持者认为这种架构对于通用科学计算而言效率更高,因为它更容易编程,且比基于 GPU 的系统能达到更高的理论峰值性能百分比。 * **人工智能与保密性:** 人工智能公司通常避免提交 TOP500,因为它们的硬件往往针对 FP8/FP16(人工智能)进行优化,而非该榜单关注的 FP64(科学计算)。此外,大型企业通常将集群能力保密,以保护竞争优势或避免基准测试带来的物流“麻烦”。

更多

联系我们 contact @ memedata.com