每日HackerNews RSS

麦迪逊广场花园(MSG)近期发生的一起数据泄露事件显示,该场馆曾建立档案,专门记录那些公开批评其使用人脸识别技术的活动人士。 在一份从45GB被窃数据中恢复、名为“人脸识别活动人士”(Facial Recognition Activists)的文档中,包含了三位知名数字权利倡导者的个人信息、社交媒体账号及其过往批评言论。该文件可供MSG员工访问,这进一步证明了在首席执行官吉姆·多兰(Jim Dolan)的领导下,该场馆采取了激进的监控策略。 被针对的三位活动人士——埃文·格里尔(Evan Greer)、阿尔伯特·福克斯·卡恩(Albert Fox Cahn)和亚当·施瓦茨(Adam Schwartz)——对这一发现表示谴责。他们认为,该文件揭示了私人公司利用生物识别监控来监视并压制批评者的危险性。此次披露加剧了外界对MSG争议性做法的担忧;此前,该公司曾利用人脸识别技术,系统性地禁止参与针对该公司诉讼的律师以及其他被视为敌对的人士进入场馆。MSG尚未回应有关这些档案的置评请求。

这份常见问题解答(版本 1.21,2003 年)旨在为开发人员提供有关矩阵和四元数数学的技术资源,主要面向 3D 计算机图形学和动画领域。 **涵盖的关键领域包括:** * **矩阵基础:** 基本定义、在 C/C++ 中的存储方式(线性数组与二维数组)以及算术运算(加法、减法、乘法)。 * **行列式与逆矩阵:** 计算矩阵逆矩阵的技术,包括克莱姆法则和线性方程组,以及对特殊矩阵(各向同性与各向异性)的处理。 * **变换:** 生成旋转矩阵(X、Y 和 Z 轴)的方法、组合旋转、通过四元数解决“万向节死锁”问题,以及在矩阵之间执行插值(线性/三次)。 * **四元数:** 关于使用四元数进行旋转以避免万向节死锁的指南。主题包括四元数乘法、归一化、四元数与矩阵之间的转换,以及利用四元数进行平滑插值和向量旋转。 * **编程说明:** 包含针对 OpenGL 特定内存布局的重要注意事项(与标准数学符号相比,其行和列是互换的),以及利用归一化输入的相关最佳实践。 本文档作为开源参考资料进行维护,欢迎贡献者添加 3D 数学算法的优化和修正。

这篇 Hacker News 讨论对 j3d.org 上的“矩阵与四元数常见问题解答”提出了批评,并强调了几何编程中常见的陷阱。 主要争论点在于对“单位四元数”的依赖。一位评论者认为,假设模长精确为 1 的公式在浮点运算中存在问题,并建议使用 `atan2` 代替 `acos`,以及使用显式分量而非平方根简化。其他人则反驳称,预先归一化四元数是标准做法,且比使用通用公式更具计算效率。 此次对话还触及了对在线“速查表”的普遍不满,这些资料常因缺乏专业计算机图形学教科书的严谨性而受到批评。此外,一些参与者主张摒弃传统的四元数记法,转而采用几何代数的“转子”(rotors)。支持者认为,转子为旋转提供了更清晰、更直观的约定,而四元数记法依赖抽象的标签($i, j, k$),容易导致对隐含假设的误解。 最终,各方共识是,此类常见问题解答仅对那些已经具备深厚数学理论基础的人来说是实用的参考工具。

本项目是一个高性能、现代化的 Common Lisp 实现,旨在复刻经典的 SchemeBBS 论坛引擎。作为原版 /prog/ BBS 的忠实克隆,它保留了传统的 `<dl>` 标签布局和单线程发帖模式。 主要功能包括: * **丰富的格式支持:** 支持 Markdown 样式的粗体、斜体、代码、剧透遮盖、引用以及动态帖子引用。 * **媒体与用户体验:** 支持自动图片预览、链接自动跳转,并通过 Cookie 实现持久化的主题自定义。 * **高性能:** 采用服务器端渲染,无需任何 JavaScript。 * **健壮性:** 基于 SBCL、Hunchentoot 和 Clack 构建,使用 Qlot 管理依赖,并配备完整的 Parachute 测试套件。 * **配置灵活:** 支持通过环境变量进行高度灵活的部署,允许自定义数据目录、管理员凭据以及设置只读版块。 * **存储方式:** 使用轻量级的纯文本 S-expression 文件进行数据持久化。 开始使用前,用户需安装 Roswell 和 Qlot 以管理依赖,并启动监听 8222 端口的服务器。

2026年5月,维基百科联合创始人拉里·桑格(Larry Sanger)在阔别多年后宣布重返该平台。在多年观察并批评该项目后,桑格旨在通过领导改革,使维基百科变得更加开放且在智识上更多元。 他回归的核心是其“维基百科九大论纲”,该提案超越了他以往的批评,为改进项目提供了建设性的蓝图。作为该倡议的一部分,他正主张建立一个新的“智识多元化维基专题”(WikiProject Intellectual Diversity),以促进更具包容性的贡献者群体。 回顾2002年的离开,桑格重申了他对这本百科全书的最初愿景:他强调中立性、贡献者之间的相互尊重,以及在遏制破坏性行为的同时,专注于产出高质量、有充分参考依据的内容的重要性。通过这些努力,桑格希望营造一个更友好的环境,以吸引专家并坚守该项目的最初目标。

维基百科联合创始人拉里·桑格(Larry Sanger)因围绕其“维基百科知识多样性项目”(WikiProject Intellectual Diversity)引发的争议,已被禁止编辑该网站。 桑格提出该项目旨在增加知识多样性,但批评者认为这是一种变相推行保守派议程、规避现有中立标准,并将此前被视为不可靠的来源列入白名单的企图。当桑格利用其推特粉丝将外部支持者引入维基百科内部提案时(这种做法被称为“拉票”),紧张局势进一步升级。 维基百科社区认为“拉票”违反了其基于共识的治理模式,该模式旨在防止有组织的团体进行“抱团”或操纵内部决策。禁令的支持者认为,维基百科反对外部干预的规则对于维护其完整性是必要的;而批评者则认为,该网站受到由管理人员组成的政治化“阴谋集团”的控制,他们利用官僚规则来压制不同意见。 这一事件重新引发了关于维基百科管理、“非民主”政策,以及如何在开放协作与防范协调操纵之间取得平衡等问题的长期辩论。虽然一些用户认为该禁令是针对恶意行为者的必要防御,但另一些人则将其视为该网站存在有毒且封闭文化的进一步证据。

分娩在历史上一直被定义为极度且往往带有创伤性的疼痛——像玛莎(Macha)的诅咒这类古代神话便是为了对此进行解释。尽管分娩是一个自然过程,但其带来的身体负担可能会导致长期的心理和情绪后果。 现代医学通过硬膜外麻醉改变了这一体验。该技术研发于一个多世纪前,通过向硬膜外腔注射镇痛药来阻断疼痛信号,同时使产妇保持清醒。虽然存在头痛或需要器械助产等罕见的副作用,但该过程非常安全;永久性并发症几乎不存在。 尽管疗效显著,但全球范围内硬膜外麻醉的普及程度差异很大。虽然它在法国和美国等国家已被广泛采用,但在其他一些地区,由于资源匮乏、认知不足或将“自然”分娩视为优先的文化偏见,其使用率仍然较低。归根结底,硬膜外麻醉为女性提供了一项深刻的医疗选择:即有权选择规避这通常是她们一生中最痛苦的经历。通过减轻分娩的强度,现代科学实际上已使那种“分娩必须承受痛苦”的古老观念变得不再必要。

这篇 Hacker News 的讨论探讨了硬膜外麻醉在慢性背痛管理和分娩这两个主要背景下的复杂效用与风险。 对于脊柱疾病患者,参与者就硬膜外麻醉与手术的疗效展开了辩论。虽然一些人认为注射能缓解疼痛,但另一些人警告称,由于存在椎间盘再次突出和疗效不一致等风险,手术是一种高风险的“最后手段”。该讨论贴强调了在医疗体系中寻求治疗的挫败感,因为保险公司往往要求患者在获准进行必要手术前,必须先接受无效的物理治疗。 在分娩方面,讨论变得更加两极分化。许多用户捍卫硬膜外麻醉的作用,认为它是减轻疼痛和提高分娩安全性的重要工具;而少数声音则认为,现代分娩方式已变得过度医疗化或具有创伤性。对于“自然分娩”运动,人们表现出怀疑态度,参与者指出人类分娩本身就存在危险且容易出现并发症。讨论还涉及了医疗经济因素,包括美国高昂的医疗成本以及各医疗机构间硬膜外麻醉药物配方的差异。归根结底,这一讨论反映了人们在追求缓解疼痛与医疗干预风险之间难以达成共识。

Shumai 是一个开源平台,旨在通过先进的资产管理和人工智能协作来简化创意工作流程。它提供安全且兼容 S3 的存储、精细的基于角色的访问控制,以及逐帧标注、分布式视频转码和可自定义元数据等专业级工具。 其核心人工智能功能包括:具备上下文感知能力的聊天助手、使用向量嵌入的语义搜索,以及通过 Google Gemini 实现的自动化元数据生成。该平台还提供了一个安全的沙盒环境,用于执行自定义脚本和自动化工具。 部署方式灵活,可满足不同用户的需求: * **Docker Compose**:最快捷的方法,无需手动安装即可快速设置。 * **NPM/包管理器**:适合全局安装,需要 PostgreSQL (pgvector) 数据库以及 FFmpeg 和 bubblewrap 等特定的系统依赖项。 * **源代码**:提供给希望直接构建或进行开发的贡献者。 Shumai 还配备了功能强大的命令行界面 (CLI),允许用户直接从终端管理项目、资产和版本。对于包括云存储或 Temporal 工作流编排在内的高级配置,请查阅官方文档。

Shumai 是一个全新的开源平台,旨在作为 Frame.io 的精简版自托管替代方案,用于创意协作。它提供了一个工作区,可用于上传文件、管理项目、收集精确反馈以及与 AI 智能体协作。 该平台基于 Bun 构建,设计简洁易用,可通过 Docker Compose 在几分钟内完成部署。虽然它运行在带有 `pgvector` 扩展的 PostgreSQL 实例上,但也支持通过 Temporal 进行分布式处理,从而实现资源密集型任务(如视频转码)的扩展。 该项目由 Yiling-J 创建,目前处于早期开发阶段。开发者正积极邀请用户测试平台并提供反馈。在线演示地址:staging.shumai.one。

Boris Cherny 探讨了向“代理循环”(agentic loops)的转变,即 AI 在无需人工直接干预的情况下,通过持续提示、评估和迭代来编写代码的自动化工作流。虽然这些循环在移植、基准测试和安全扫描等机械性任务上表现出色,但 Cherny 对其在构建长期软件方面的应用深感忧虑。 他认为,当前的 AI 驱动循环往往产生防御性、过度复杂且混乱的代码,更倾向于局部修复而非架构完整性。除了质量问题,这种转变还存在风险,即软件可能从工程师能够理解和维护的“确定性机器”,变成一种需要依靠 AI 才能诊断或修补的不可预测的“有机体”。 Cherny 警告称,我们正在进入一个“认知依赖”阶段,即人类将失去在没有机器辅助的情况下阅读代码库的能力。尽管他对此感到不安,但他承认,竞争压力、安全需求以及 AI 驱动开发的高速度,使得这一未来不可避免。工程师面临的挑战不是停止这些循环,而是设法保持人类的判断力,确保代码的可读性,并构建出在机器主导的环境中依然能够“生存”且负责任的系统。

本次 Hacker News 讨论聚焦于“代理循环”(agentic loops)——即自主迭代编程任务的 AI 系统——的日益流行,以及由此带来的软件工程范式转变。 **核心主题:** * **“劣质代码”(Slop)问题:** 许多参与者认为,大语言模型会产出“劣质代码”:这些代码防御性过强、过度复杂且缺乏架构美感。由于生成的代码往往倾向于修补而非解决根本问题,这造成了长期的维护债务。 * **对系统理解的丧失:** 人们对于开发者与系统“脱钩”感到深切忧虑。批评者认为,过度依赖 AI 编写和重构代码,阻碍了工程师建立解决复杂问题及进行安全监管所需的深度心智模型。 * **过程与产出:** 尽管有人视 AI 为提升速度的强大助力,但另一些人认为它在“需求规格说明”和“代码评审”环节制造了瓶颈。资深开发者感到日益疲惫,他们不再是创造性的架构师,而更像是低质量 AI 产出的“安保人员”。 * **行业分歧:** 社区在“AI 加速主义者”(他们拥抱生产力变革)与那些认为行业正陷入“内卷”(即以牺牲可持续的高质量工程为代价,盲目追求短期内 token 产出量)的人群之间产生了割裂。

科技巨头甲骨文(Oracle)在过去一年中裁减了约 21,000 个工作岗位,约占其全球员工总数的 13%,旨在将业务重心转向人工智能。根据公司年度报告,此次裁员是科技行业为筹集建设人工智能基础设施(如数据中心)所需巨额成本而普遍削减员工这一趋势的一部分。 甲骨文报告称,与裁员相关的重组成本为 18 亿美元,较上一年大幅增加。尽管该公司计划优先发展云计算和人工智能,但同时也承认,由于某些领域熟练工人的短缺,重组可能会导致运营中断和潜在的生产力损失。 甲骨文的举措反映了整个科技行业的裁员潮,亚马逊和 Meta 等巨头也在削减员工,以将数十亿美元投入到人工智能领域。截至 2026 年 5 月 31 日,甲骨文的员工人数为 141,000 人,低于上一年的 162,000 人。

抱歉。

**Unlimited-OCR** 是一款全新的高级文档解析模型,专为单次、长程任务而设计,其基础构建于 Deepseek-OCR 之上。该模型于 2026 年 6 月正式发布,可通过 ModelScope 和 Hugging Face 获取,擅长解析单张图像以及复杂的多页文档或 PDF。 核心技术亮点包括: * **灵活推理:** 支持两种配置模式(“gundam”和“base”),可根据文档复杂度和分辨率优化性能。 * **可扩展性:** 具备 32k token 的上下文长度,并采用专门的 ngram 重复预防机制,以确保输出质量。 * **部署选项:** 用户既可以通过 Hugging Face 的 `transformers` 直接进行标准任务推理,也可以利用基于 **SGLang 的服务器**进行高性能、并发及兼容 OpenAI 的 API 调用。 * **易用性:** 资源库包含用于 PDF 转图像及批量处理的辅助脚本,使其非常适合大规模文档数字化项目。 该项目作为对社区的开源贡献而开发,并致敬了 Deepseek-OCR 和 PaddleOCR 的既有成果。技术论文及完整实现细节可在 [arXiv](https://arxiv.org/abs/2606.23050) 上查阅。

百度最新的“无限OCR”(Unlimited OCR)研究提出了一种进行高质量、长篇幅文档解析的方法,解决了大语言模型(LLM)常见的内存瓶颈问题。 **问题所在:** 通常情况下,当大语言模型处理长文档(如100页的PDF)时,其“KV缓存”(短期记忆)会呈线性增长,直至耗尽显存。这迫使开发者不得不使用低效的“切割与拼接”方法,而这往往会导致文档上下文的丢失。 **解决方案:** “无限OCR”采用了“参考滑动窗口注意力机制”(R-SWA),将人工智能的关注点分为两条不同的路径: * **全局参考:** 模型保持对文档图像的完整预览,确保不会丢失结构性上下文。 * **局部生成:** 模型在文本生成时的内存被限制在一个紧凑的移动窗口内(例如最近的128个词),使其能够处理无限长的文档而不会崩溃。 **社区反应:** Hacker News上的讨论强调,OCR远未达到“被解决”的状态,特别是在处理手写文档、科学论文或非英语脚本等复杂任务时。虽然有些人质疑使用大语言模型是否大材小用,但另一些人认为,对于处理传统OCR工具难以胜任的版式布局、多栏文本和全文档推理而言,这种具备上下文感知能力的解析方式具有革命性的意义。

继蒂姆·库克(Tim Cook)针对内存和固态硬盘成本激增可能导致涨价发出警告后,行业观察人士纷纷猜测涨价的时间节点。虽然马克·古尔曼(Mark Gurman)认为涨价可能迫在眉睫,但作者对此持怀疑态度,认为苹果不会在产品周期中期涨价,并指出这符合公司的品牌策略,且库克接受采访后并未立即进行调整。 作者认为,涨价很可能会与新款硬件发布同步,即今年 9 月的 iPhone 18 Pro 和传闻中的折叠屏“Ultra”机型。库克的提前预警可能是一种战略手段,旨在产品发布前尽早让消费者消化这一坏消息。尽管全球内存短缺在理论上使中期涨价成为可能,但作者认为苹果更有可能在下一次产品更新前消化成本波动,或者目前正寄希望于供应链在秋季新品发布前趋于稳定。

更多

联系我们 contact @ memedata.com