每日HackerNews RSS

## QRTape:纸带上的音频存储 本项目探索使用现代技术——计算机视觉和高效音频压缩,在纸带上存储音频。受数据存储历史的启发,QRTape通过将音频编码为一系列打印在连续纸带上的二维码,绕过复杂的机械磁带传输。 该系统利用Arduino驱动的步进电机,制作了一个由纸板和纸张制成的简单“磁带传输”装置,将纸带送过网络摄像头。软件是关键:Opus音频编解码器将音频压缩到非常小的尺寸(例如,4分钟的音轨压缩到355KB),而定制工具会将音频分割成二维码大小的块,并添加错误校正。 播放涉及使用网络摄像头扫描二维码,并使用ZBar解码,直接将数据传输到播放器(如mplayer)——无需中间文件。虽然可以进行改进(居中机制、双向电机控制),但概念验证表明,从一种非常低科技的介质中可以获得令人惊讶的好音质。 QRTape 强调了结合现成组件和巧妙软件,实现独特且实用的数据存储解决方案的强大力量。

## QRTape:通过计算机视觉从纸带中提取音频 最近的Hacker News讨论集中在“QRTape”项目上,该项目展示了使用计算机视觉读取二维码,从而从纸带中播放音频。该项目巧妙地利用了12kbps的OPUS编码器,在如此低的数据速率下实现了令人惊讶的音质——这是十年前不可能实现的。 评论者指出,这与现有技术相似,例如杜比在电影胶片上使用类似编码,以及声音胶片这一历史概念。一些人提出了二维码的替代方案,例如数据矩阵码,因为它紧凑且可组合,甚至可以使用频谱图来获得更具美感和伪影的声音。 对话还扩展到关于替代数据存储方法,包括磁带以及利用较旧的技术(如VTR)重现数字音频录音而无需DRAM的可能性。最终,该项目因其独创性和迷人的低科技构造而受到赞扬。

## 2024 年网络爬虫:每天抓取十亿页 该项目重新审视了大规模网络爬虫,这是一个自 2012 年以来未得到充分更新的主题,以确定启动一个谷歌规模的爬虫是否仍然可行。作者成功地在约 **25.5 小时**内抓取了 **10 亿个网页**,成本约为 **462 美元**,远低于之前的估计。 尽管硬件有所改进(更快的 CPU、NVMe 驱动器、增加的网络带宽),但挑战依然存在。网络越来越动态且内容密集。该爬虫专注于 HTML,绕过了 JavaScript 渲染以直接与过去的爬虫进行比较,并令人惊讶地发现仍然可以通过这种方式访问网络的大部分内容。 该爬虫利用了 **12 个优化节点**的集群,每个节点处理爬虫的一部分,在有限的预算下优先考虑效率。**解析被证明是一个主要瓶颈**,这归因于与 2012 年相比,平均页面尺寸显著增加(242KB vs. 51KB),因此需要切换到更快的 `selectolax` 库并截断页面。网络带宽不是限制因素,但 **SSL 握手消耗了大量的 25% CPU 时间**。 该项目强调了**礼貌性**(尊重 `robots.txt`、爬取延迟)和**容错性**。虽然与理论模型相当,但作者的结果表明,仅提取机器的扩展可以实现类似的吞吐量。未来的工作应解决动态内容渲染问题,并分析抓取数据的特征。人工智能驱动的抓取技术的兴起也正在促使互联网基础设施提供商采取新的防御措施。

## 大规模网络爬取:挑战与成本 一篇最近的文章详细描述了在短短24小时内爬取十亿个网页的经验。虽然实现这种速度令人印象深刻,但作者强调,最大的障碍不是带宽或存储,而是**规避反爬虫措施**,例如Cloudflare。成功需要一个复杂的设置,包括住宅代理、验证码破解器和轮换用户代理。 这场讨论引发了关于绕过网站保护的合法性和道德性的争论,人们担心在欧盟等地区可能面临法律后果,以及对网站稳定性的影响。许多评论者强调了获得网站IP白名单的难度,以及不断适应变化的IP分配的必要性。 几位用户指出,反机器人技术的复杂性日益提高,以及在规模上需要“礼貌”——尊重爬取延迟指令和速率限制。另一些人建议使用比AWS更便宜的替代托管解决方案。一位评论员甚至声称使用高度优化的Rust实现达到了每秒35,000个请求,暗示了公开可用的爬取服务的潜力。这篇文章强调,爬取现代网络比以往任何时候都更加复杂,需要大量的投资和技术专长。

## 价格调整通知 - 云产品和独立服务器(2026年4月1日生效) 本通知宣布对德国、芬兰、美国和新加坡的云产品和独立服务器进行价格调整,所有在此日期*之后*完成的新订单和现有订单均将适用调整后的价格。所列价格包含19%增值税。 **云产品:** 我们提供了各种云服务器(CAX、CCX、CPX、CX)、负载均衡器、卷和快照服务在所有地区的更新后的按小时/每月定价的详细列表。价格上涨因产品和地点而异。 **独立服务器:** 德国和芬兰的独立服务器(AX、DX、EX、GEX、SX系列)定价也已更新。 “Server-Börse”服务器的价格上涨约为3%,而特定配置的价格调整则更为显著。 完整文档中包含每个地区和产品的详细定价表。客户应查看这些表格,以了解价格变化对其服务的影响。

MMC 提供了一种可持续的替代方案,以取代传统的发泡聚苯乙烯 (EPS) 包装,该方案使用 **Mushroom® Packaging**,由蘑菇菌丝体和农业废料生长而成。 MMC 认识到 EPS 的环境和经济弊端——其垃圾填埋场的持久性、塑料税以及声誉损害——因此 MMC 提供了一种具有成本效益且可扩展的解决方案,*匹配* EPS 的保护性能。 作为欧洲首家工业规模的菌丝体包装生产商,MMC 已经消除了数千吨的 EPS 废弃物,并计划在 2025 年单独生产约一千万件。 BA Kitchens 和 Tom Dixon 等领先品牌信任 Mushroom® Packaging,它使企业能够满足不断增长的可持续性需求,并避免与过时塑料相关的风险。 MMC 将自己定位为寻求保护其产品*和*地球的公司的前瞻性选择。

## 菌丝体包装:摘要 一家名为神奇蘑菇(Magical Mushroom)的英国公司正在工业规模生产菌丝体包装,声称是欧洲第一家。这种包装利用菌丝体(蘑菇根)与农业副产品结合,作为聚苯乙烯和潜在纸板的替代品,具有可持续性。 Hacker News上的讨论显示,Ecovative等公司已经在研究类似技术多年,并且欧洲已经存在多家竞争对手。虽然前景可观,但可扩展性和成本效益仍然是关键挑战。 用户还讨论了家庭蘑菇种植作为一种爱好,分享资源并解决孢子传播和污染问题。对话强调了菌丝体在包装之外的潜力,包括用作肥料,甚至食用塑料的真菌。最终,菌丝体包装的可行性取决于它在提供真正环境效益的同时,能否与更便宜、成熟的材料竞争。

光标的“调试模式”是一项突出的功能,能够显著提升AI辅助的错误修复能力。与传统的调试工具不同,它通过智能地添加文本“插桩”(本质上是日志记录)到代码中,从而跨越*任何*语言或环境工作。这使得AI能够在用户重现错误时观察代码执行路径和变量值,提供关键的运行时上下文。 这种方法产生的修复质量高于标准的基于LLM的错误修复,甚至可以解决复杂的前端/后端问题。虽然功能强大,但调试模式仍未得到充分利用,因为它需要用户主动重现错误并*知道*使用该功能。 作者设想未来代理会*始终*对代码进行插桩,在提交更改前删除日志,甚至训练模型以固有地进行这种方式的调试。这将把依赖性转移到人工测试,并最终带来更健壮的代码生成。尽管由于用户参与度等问题,广泛采用面临挑战,但光标的调试模式等功能代表着AI编码助手潜力方面的一大飞跃。

一个 Hacker News 的讨论围绕着 Cursor,这是一款备受赞誉的调试模式代码编辑器。发起者 davidgomes(Cursor/Anysphere 的员工——另一位用户指出)强调了这一功能。 用户普遍认为 Cursor 在快速解决问题方面表现出色,特别是由于它能够绕过其他 AI 编码助手(如 Claude)中提供大量上下文所带来的“冷启动”问题。一位用户建议 Cursor 可以通过使用 Playwright 等工具来重现错误,从而进一步改进。 虽然有些人承认调试技能仍然至关重要,并且 LLM 在这方面尚未完美,但另一些人认为 Cursor 对于高效解决问题非常有价值。对话中也简短地提到,最近很少听到“Cursor”这个名字。

## Elsevier撤稿事件揭露引文卡特尔 一起重大丑闻在经济学界爆发,Elsevier期刊撤回了12篇论文,所有论文均由都柏林三一学院教授Brian Lucey共同署名。撤稿源于Lucey在担任编辑期间批准了自己的论文,这违反了期刊政策,且存在明显的利益冲突。 此事件揭露了一个长期以来被怀疑的“引文卡特尔”,Lucey和他的合作者,特别是Samuel Vigne,通过互引和潜在的合作署名交易,人为地夸大了引用次数。分析显示,在Lucey的影响力下,Elsevier金融期刊生态系统内的引用数量显著增加。 Lucey已被撤销五个期刊的编辑职务,但仍保留另一个期刊的职务。虽然Elsevier承认存在问题,但人们仍然担心问题的严重程度以及出版商在激励此类行为方面的作用。这起丑闻不仅限于被撤回的论文,还引发了对学术出版诚信、通过与Lucey和Vigne相关的私人咨询公司进行的潜在财务不当行为,甚至直接出售论文的指控。核心问题在于,学术声誉被制造和货币化,奖励操纵而非真正的研究。

## CVSS评分补丁的终结 传统的基于CVSS评分进行漏洞补丁的企业安全实践正变得过时。Linux内核CNA负责人Greg Kroah-Hartman现在正在为*所有*错误修复发布CVE,而不分配CVSS评分,理由是漏洞影响取决于具体环境。这让组织面临选择:细致的手动分级(缓慢且容易出错)或快速、持续的补丁(“速度”)。 许多人担心“更新疲劳”——频繁的内核更新导致生产系统崩溃。然而,一种新的方法使用**bootc**将整个操作系统视为容器镜像。这使得**原子更新**成为可能:部署新的操作系统版本,如果出现问题会自动回滚,从而消除重启焦虑。 Bootc还促进了**按设计进行的环境分级**:漏洞扫描仅关注您最小操作系统镜像*内部*的组件。最终,这会将安全从争论CVSS评分转变为将补丁作为核心流水线功能进行自动化——将每个错误修复视为相关,并构建弹性以更快地应对潜在漏洞利用。安全变得本地化和策略驱动,不再依赖外部评分系统。

## 可启动容器与内核补丁:摘要 最近的 Hacker News 讨论集中在“可启动容器”——包含内核的容器——以及更广泛的安全漏洞补丁理念上。核心论点建议将*每个*内核漏洞修复都视为相关,并将补丁作为核心系统策略自动化(“补丁即策略”)。 一些评论者争论其可行性。虽然为补丁构建新的操作系统镜像本身并非坏事,但增量更新(如 OSTree)更受欢迎。人们对测试这些完整镜像更新表示担忧,特别是如果未发现问题,可能会导致大范围的启动失败风险。 讨论还涉及 CVSS 评分,安全专业人士批评其具有误导性的“最坏情况”场景和资源消耗。一些人建议使用自动补丁作为替代方案,模仿 Chainguard 等方法。分享了 Fedora Silverblue 等系统的经验,突出了 rpm-ostree 的性能问题。最终,争论围绕着在安全严谨性和运营效率之间取得平衡,以及保持系统更新的最佳方法。

我们正在验证您的浏览器。网站所有者?点击此处修复。 Vercel 安全检查点 | sin1::1771835406-A5HTcorC7UD6FQ0CIPyWWUwJsti8fk9G 启用 JavaScript 以继续。 Vercel 安全检查点 | sin1::1771835406-A5HTcorC7UD6FQ0CIPyWWUwJsti8fk9G

## 教宗呼吁神父们避免在讲道中使用人工智能 教宗方济各最近建议神父们在撰写讲道时,应依靠他们自己的智慧和对教区的理解,而不是使用人工智能工具。Hacker News上的讨论强调了人们的担忧,即神父们可能缺乏对会众细致入微的理解,从而无法有效地引导人工智能,可能侵犯隐私或产生千篇一律的布道。 评论员指出,有效的讲道是根据特定社区量身定制的——梵蒂冈并未通过创建标准化版本来解决这个问题。 许多用户质疑将批判性思维外包给人工智能的更广泛影响,担心对订阅服务的依赖以及失去真实的联系。 这场辩论也涉及了天主教会与知识和进步的历史关系,以及它常常被忽视的对教育的支持作用。最终,许多人认为教宗的信息不仅仅是关于人工智能,而是关于深思熟虑、积极投入工作的重要性,以及人工智能可能掩盖缺乏真正信仰或理解的潜力。 有些人甚至认为人工智能的兴起暴露了教会内部现有的真实性问题。

## MicroVision 旨在革新激光雷达定价 MicroVision 正在寻求在汽车激光雷达技术上取得突破,其固态传感器潜在价格低于 200 美元——远低于目前 10,000-20,000 美元的成本。 这一价格点可以使激光雷达适用于高级驾驶辅助系统 (ADAS),而不仅仅是高端自动驾驶汽车,从而解决了该技术广泛应用的最大障碍:成本。 他们的 “Movia S” 系统采用相控阵方法实现 180 度覆盖,探测距离可达 200 米。 虽然探测距离略有缩短,但专家认为,通过大规模制造可以实现大幅降本。 向经济实惠的固态激光雷达转变需要系统层面的方法。 汽车制造商可能需要集成多个传感器以实现全面覆盖,但总体成本仍然可能更低。 这符合渐进式的 ADAS 改进,而不是完全的自动驾驶,从而增强现有的摄像头和雷达系统,以实现更强大的 3D 检测。 MicroVision 在这方面的努力并非孤军奋战,但他们专注于低于 200 美元的生产定价使其与众不同。 实现这一目标需要大规模需求和投资,但可能会从根本上改变车辆安全系统的未来,并可能挑战人们对激光雷达必要性的怀疑。

## 环境智能:重审愿景 二十五年前,欧盟的IST咨询组设想了一个“环境智能”的未来——一个无缝集成计算的世界,能够预测我们的需求。重审他们2010年的设想,发现到2026年为止,既有成功,也有失误。 我们已经看到进展:个性化移动设备(“P-Coms”)已很普遍,数字身份正在出现,汽车提供无钥匙进入和导航功能。家庭自动化,如智能冰箱和语音控制照明,已经存在,但普及程度不一。实时翻译和远程呈现也成为现实。 然而,真正普遍、主动的智能仍然难以捉摸。“数字自我”化身、个性化代理和真正普遍的网络尚未实现。对隐私的担忧和缺乏开放标准阻碍了互联系统的广泛应用。虽然技术*允许*自动拼车和主动协助等功能,但社会和经济因素尚未协调一致,无法完全实现它们。 该报告强调了实现这一未来的关键要求:不显眼的硬件、无缝连接、分布式网络、自然界面和强大的安全性。虽然硬件和连接已经进步,但标准化和公共投资——长期进展的关键——仍然不足。最终,这个愿景并非技术失败,而是优先事项和协作努力的问题。

## 2010年预测的准确度(摘要) 一个Hacker News的讨论回顾了2000年对2010年生活的预测,发现既有命中,也有失误。许多技术进步被准确预见——例如数字身份(带有NFC芯片的护照)和移动计算能力——但乐观的、无缝且有帮助的“代理”技术愿景并未实现。当前的人工智能*正在*开始接近几十年 ago 设想的能力,但对数据剥削和“劣质化”的担忧冲淡了兴奋之情。 对话强调了一个反复出现的主题:预测通常能准确预测*是什么*,但未能预测*如何*以及对社会的影响。人们争论软件质量是否因技术文化的变化而下降,并认识到以利润为优先的社会结构常常导致反乌托邦的结果,尽管技术潜力是乌托邦式的。 参与者还推测了2036年,预测人工智能将进一步发展(可能导致“人工智能宗教”),机器人技术和生殖生物学将取得突破,以及一个持续存在且有缺陷的资本主义体系。最终,这场讨论强调了预测不仅技术,而且人类将*如何使用*技术是多么困难。

更多

联系我们 contact @ memedata.com