每日HackerNews RSS

瓢虫,一个网页引擎,正在从C++过渡到Rust,以提高内存安全性和构建更强大的生态系统。 之前考虑过Swift,但由于互操作性问题和平台支持有限而受阻。 尽管最初担心Rust不适合网页平台的OOP风格,但其优势现在超过了这些缺点,这与Firefox和Chromium等项目的采用相呼应。 首次重大移植是LibJS,瓢虫的JavaScript引擎,在人工指导下,借助Claude和Codex等AI工具成功翻译,耗时约两周——手动操作估计需要数月。 这25,000行Rust代码与C++版本输出*字节对字节*完全相同,并且在广泛的测试套件(test262和瓢虫内部测试)和基准测试中未发现任何回归。 最初的重点是兼容性,因此Rust代码有意模仿C++模式。 未来的开发将涉及子系统的逐步移植,同时继续C++开发,由核心团队管理以确保高效集成。

人工智能时间线 — 169+大型语言模型完整历史 (2017–2026) 全部 开放 关闭 里程碑 所有供应商 紧凑 全面 完整的人工智能时间线 — 追踪从最初的Transformer (2017) 到ChatGPT、GPT-4、Claude、Gemini、LLaMA、Mistral、DeepSeek以及之后的所有大型语言模型。 由Splox提供支持。

## AI 时间线与黑客新闻讨论 一个新交互式时间线(llm-timeline.com)分享在黑客新闻上,详细列出了2017年至预计2026年发布的171个大型语言模型,引发了关于人工智能快速发展及其对未来世代影响的讨论。 用户反思人工智能正变得多么普及,将其与互联网甚至冰箱的引入相提并论——这些技术定义了前几代人的体验。一个关键主题是培养儿童的无聊感和解决问题的能力的重要性,因为对人工智能的依赖可能会削弱这些关键能力。 对话还涉及用户界面正在发生变化,年轻一代自然以老一辈感到惊讶的方式与技术互动。 许多评论员指出了时间线中的遗漏和不准确之处,创建者积极回应并添加了建议的模型。 存在关于定义大型语言模型发展里程碑以及发布速度不断加快的争论,从每年到每周不等。 最终,这场讨论凸显了人工智能塑造的未来既令人兴奋又充满不确定性。

Hacker News上的一场激烈讨论显示,Tailwind CSS 最初受到强烈质疑。批评者认为它违反了CSS将样式与结构分离的核心原则,本质上重新引入了类似于过时HTML属性 `<font color=...>` 的内联样式。许多人认为它破坏了CSS本身的意义,并且没有比过去的“不良实践”有所改进。 然而,尽管最初存在广泛的抵制——类似于React早期受到的批评——Tailwind CSS迅速获得了巨大的流行度。它已成为全球下载量最多的CSS框架,每月拥有超过1亿的npm下载量,并受到Shopify、OpenAI、Netflix甚至GitHub等大型公司的青睐。这段文字强调了早期认知与框架最终成功之间的脱节,展示了开发者采用如何违背最初的批判性评估。

## Pinterest 用户因人工智能大改动而反抗 Pinterest 正在面临用户,尤其是艺术家的强烈反对,他们认为该平台因其积极推动人工智能而正在被毁掉。过去一年,用户报告称,人工智能驱动的审核功能不断出现问题,错误地标记和删除内容——尤其是女性图像——并需要繁琐的上诉。与此同时,信息流中充斥着人工智能生成艺术作品,经常与真实的手绘作品一起被错误标记,并带有不准确的“人工智能修改”标签。 这为艺术家们创造了一个令人沮丧的循环,他们花费宝贵的时间来纠正错误和对抗算法的错误识别。许多人担心 Pinterest 正在优先发展人工智能——最近的裁员和对人工智能驱动职位的关注证明了这一点——而牺牲了用户体验和内容完整性。 这种情况正在促使一些艺术家完全离开该平台,担心他们的作品未经同意会被用于训练 Pinterest 自己的 AI 工具。虽然 Pinterest 坚持使用人工智能和人工审核相结合的方式,但用户越来越感到被忽视,并认为该平台由于合成内容的涌入和有缺陷的审核而正在变得“过时”。

## NASA对卡车设计的意外影响 1973年,NASA工程师埃德温·J·萨尔茨曼在骑自行车上班时观察到空气动力学湍流,由此领导了一个提高卡车燃油效率的项目。他的团队使用改装的福特厢式货车,后来又使用半挂卡车,系统地测试了空气动力学改进。 最初,他们使用平铝板建立基线,然后专注于将前缘圆滑化并密封底盘。这些改变显著降低了阻力——厢式货车圆滑前缘可降低高达52%的阻力,而底盘密封可进一步降低7%,从而可能将燃油经济性提高15-25%。 对半挂卡车进行的进一步测试显示,平滑的前端可降低超过50%的阻力,底盘整流罩可降低15%。这项NASA研究直接影响了现代卡车设计,促使广泛使用空气动力学整流罩、圆角,甚至像Airtab这样的涡流发生器,证明了NASA的工程专业知识远不止于太空探索。

## 灵感源自 NASA 的卡车空气动力学:现代更新 最近一篇 Hacker News 的讨论,源于 [TheDrive.com 的文章](https://thedrive.com/news/a-nasa-engineer-discovered-a-world-of-semi-truck-aerodynamics-by-accident),强调了半挂卡车燃油效率的显著提升。虽然 NASA 在 1970 年代的研究最初表明通过空气动力学改进可以获得潜在收益(15-25%),但该行业已经超越了简单的附加解决方案。 如今,严格的第三方测试,例如 Mesilla Valley Transportation Services 进行的测试至关重要。现代卡车通常配备无后视镜驾驶室、侧裙和轮罩。斯堪尼亚的“Super”动力总成和梅赛德斯-奔驰的 Actros L 等创新表明了持续的努力,但驾驶员行为仍然是主要因素。 最近最大的转变是自动化驾驶以提高效率——自动手动变速箱和预测巡航控制,利用 GPS 和地形图,始终优于人类驾驶员。虽然怠速仍然是一个问题,但数据表明高速公路速度的提高可以带来更大的燃油节省。最终,经济可行性和监管限制塑造了设计选择,由于长度法规和驾驶条件的不同,欧洲卡车与美国型号有所不同。

## SETI@home:对分布式计算的回忆 最近一篇关于SETI@home数据采集的论文(iop.org)引发了Hacker News的讨论,突显了该项目的持久影响和现状。许多用户分享了在旧机器上运行该软件的怀旧回忆, fondly recalling 寻找外星生命时期乐观的心情。 该项目分析了阿雷西博天文台的无线电信号,率先采用了分布式计算的概念——利用数百万个人电脑的空闲处理能力。虽然SETI@home目前处于休眠状态,不再分发任务,但数据分析仍在继续。 对话涉及了相关项目,如Folding@Home(仍通过BOINC活跃)以及人工智能训练等现代领域中类似分布式努力的潜力。然而,用户指出,经济实惠的云计算的兴起改变了格局,降低了贡献空闲CPU周期以实现更大科学目标时的个人联系感。这场讨论最终庆祝了SETI@home的遗产,它是一个开创性的项目,证明了公民科学的可行性,并改变了研究的进行方式。

## 云和服务器价格调整 - 2026年4月1日生效 本文档概述了德国、芬兰、美国和新加坡云和专用服务器产品的价格变动,自2026年4月1日起生效。这些调整适用于新订单和现有服务;在4月1日之前下达但之后交付的订单将按新价格计费。所有价格均不含增值税。 **主要变更:** 详细列出了各种云服务器(CAX、CCX、CPX、CX)和负载均衡器(LB)产品的每小时/每月定价,显示所有地区欧元(€)和美元($)定价均有所上涨。 **专用服务器:** 德国和芬兰的专用服务器定价也将每月上涨,AX、DX、EX、GEX和SX系列服务器的具体调整已列出。“服务器拍卖”服务器的价格上涨3%。 **附加服务:** 所有地点的卷影存储和快照存储的价格也将略有上涨。 有关每个产品和地区的详细定价,请参阅完整文档。

## QRTape:纸带上的音频存储 本项目探索使用现代技术——计算机视觉和高效音频压缩,在纸带上存储音频。受数据存储历史的启发,QRTape通过将音频编码为一系列打印在连续纸带上的二维码,绕过复杂的机械磁带传输。 该系统利用Arduino驱动的步进电机,制作了一个由纸板和纸张制成的简单“磁带传输”装置,将纸带送过网络摄像头。软件是关键:Opus音频编解码器将音频压缩到非常小的尺寸(例如,4分钟的音轨压缩到355KB),而定制工具会将音频分割成二维码大小的块,并添加错误校正。 播放涉及使用网络摄像头扫描二维码,并使用ZBar解码,直接将数据传输到播放器(如mplayer)——无需中间文件。虽然可以进行改进(居中机制、双向电机控制),但概念验证表明,从一种非常低科技的介质中可以获得令人惊讶的好音质。 QRTape 强调了结合现成组件和巧妙软件,实现独特且实用的数据存储解决方案的强大力量。

## QRTape:通过计算机视觉从纸带中提取音频 最近的Hacker News讨论集中在“QRTape”项目上,该项目展示了使用计算机视觉读取二维码,从而从纸带中播放音频。该项目巧妙地利用了12kbps的OPUS编码器,在如此低的数据速率下实现了令人惊讶的音质——这是十年前不可能实现的。 评论者指出,这与现有技术相似,例如杜比在电影胶片上使用类似编码,以及声音胶片这一历史概念。一些人提出了二维码的替代方案,例如数据矩阵码,因为它紧凑且可组合,甚至可以使用频谱图来获得更具美感和伪影的声音。 对话还扩展到关于替代数据存储方法,包括磁带以及利用较旧的技术(如VTR)重现数字音频录音而无需DRAM的可能性。最终,该项目因其独创性和迷人的低科技构造而受到赞扬。

## 2024 年网络爬虫:每天抓取十亿页 该项目重新审视了大规模网络爬虫,这是一个自 2012 年以来未得到充分更新的主题,以确定启动一个谷歌规模的爬虫是否仍然可行。作者成功地在约 **25.5 小时**内抓取了 **10 亿个网页**,成本约为 **462 美元**,远低于之前的估计。 尽管硬件有所改进(更快的 CPU、NVMe 驱动器、增加的网络带宽),但挑战依然存在。网络越来越动态且内容密集。该爬虫专注于 HTML,绕过了 JavaScript 渲染以直接与过去的爬虫进行比较,并令人惊讶地发现仍然可以通过这种方式访问网络的大部分内容。 该爬虫利用了 **12 个优化节点**的集群,每个节点处理爬虫的一部分,在有限的预算下优先考虑效率。**解析被证明是一个主要瓶颈**,这归因于与 2012 年相比,平均页面尺寸显著增加(242KB vs. 51KB),因此需要切换到更快的 `selectolax` 库并截断页面。网络带宽不是限制因素,但 **SSL 握手消耗了大量的 25% CPU 时间**。 该项目强调了**礼貌性**(尊重 `robots.txt`、爬取延迟)和**容错性**。虽然与理论模型相当,但作者的结果表明,仅提取机器的扩展可以实现类似的吞吐量。未来的工作应解决动态内容渲染问题,并分析抓取数据的特征。人工智能驱动的抓取技术的兴起也正在促使互联网基础设施提供商采取新的防御措施。

## 大规模网络爬取:挑战与成本 一篇最近的文章详细描述了在短短24小时内爬取十亿个网页的经验。虽然实现这种速度令人印象深刻,但作者强调,最大的障碍不是带宽或存储,而是**规避反爬虫措施**,例如Cloudflare。成功需要一个复杂的设置,包括住宅代理、验证码破解器和轮换用户代理。 这场讨论引发了关于绕过网站保护的合法性和道德性的争论,人们担心在欧盟等地区可能面临法律后果,以及对网站稳定性的影响。许多评论者强调了获得网站IP白名单的难度,以及不断适应变化的IP分配的必要性。 几位用户指出,反机器人技术的复杂性日益提高,以及在规模上需要“礼貌”——尊重爬取延迟指令和速率限制。另一些人建议使用比AWS更便宜的替代托管解决方案。一位评论员甚至声称使用高度优化的Rust实现达到了每秒35,000个请求,暗示了公开可用的爬取服务的潜力。这篇文章强调,爬取现代网络比以往任何时候都更加复杂,需要大量的投资和技术专长。

## 价格调整通知 - 云产品和独立服务器(2026年4月1日生效) 本通知宣布对德国、芬兰、美国和新加坡的云产品和独立服务器进行价格调整,所有在此日期*之后*完成的新订单和现有订单均将适用调整后的价格。所列价格包含19%增值税。 **云产品:** 我们提供了各种云服务器(CAX、CCX、CPX、CX)、负载均衡器、卷和快照服务在所有地区的更新后的按小时/每月定价的详细列表。价格上涨因产品和地点而异。 **独立服务器:** 德国和芬兰的独立服务器(AX、DX、EX、GEX、SX系列)定价也已更新。 “Server-Börse”服务器的价格上涨约为3%,而特定配置的价格调整则更为显著。 完整文档中包含每个地区和产品的详细定价表。客户应查看这些表格,以了解价格变化对其服务的影响。

更多

联系我们 contact @ memedata.com