每日HackerNews RSS

## 词法分析器加速与Tar.gz的故事 我开发了一个ARM64汇编词法分析器(由解析器生成),最初性能比官方Dart扫描器快2.17倍。然而,在104,000个Dart文件上的基准测试显示,词法分析器不是瓶颈——I/O是。读取这些文件比词法分析花费的时间长5倍,并且SSD由于过多的系统调用开销(超过300,000次`open`/`read`/`close`调用)仅以其理论速度的1.5%运行。 尝试内存映射和直接系统调用带来的改进微乎其微。解决方案?模仿pub.dev和package文件,使用`tar.gz`归档。这减少了需要处理的文件数量,从104,000个降至1,351个,将1.13GB压缩至169MB。I/O时间下降了42.85倍,最终实现了2.27倍的整体加速,即使*包含*解压缩开销。 这表明,只有通过对较大文件的顺序访问才能实现现代SSD的速度。这个实验解释了为什么像pub.dev这样的包管理器使用归档:更少的系统调用、减少的带宽和更快的提取速度。虽然像`zstd`压缩和并行解压缩这样的进一步优化是可能的,但核心教训是,在处理大量小文件时,系统调用开销很容易掩盖存储速度。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 我构建了一个速度快两倍的词法分析器,然后发现真正的瓶颈在于I/O (modulovalue.com) 5 分,来自 modulovalue 2 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系方式 搜索:

正在验证您的浏览器。网站所有者?点击此处修复。 Vercel 安全检查点 | sin1::1769329872-53x9Nd844l6JgIjJdZCa6ehihZ3AAd7w 启用 JavaScript 以继续。 Vercel 安全检查点 | sin1::1769329872-53x9Nd844l6JgIjJdZCa6ehihZ3AAd7w

一个 Hacker News 的讨论围绕着 webmatrices.com 上的一篇文章,该文章声称人工智能不会取代工作,但利用 Mac Mini(599 美元)和 Claude 等工具的个人将获得优势。 评论大多批评这篇文章以及对“氛围编码”(使用人工智能生成代码)的炒作。许多人认为人工智能对于创造性问题解决实际上没有帮助,即使编码速度更快,也不能等同于开发人员技能的提高。一些人指出这篇文章缺乏实质内容,感觉像是人工智能生成的内容。 然而,一个关键的收获是,一位用户成功地用在 Mac Mini 上运行的本地 whisper.cpp 模型取代了昂贵的云服务(如 Google 的 Cloud Transcribe),从而节省了大量资金。其他人也分享了使用 Claude 进行 DevOps 任务的类似经验,表明尽管存在怀疑,但实际的好处是存在的。一个反复出现的主题是,现代就业往往优先考虑“虚张声势”而不是实际技能。

## 澳大利亚意想不到的科技成功 一份最新报告证实,澳大利亚在创造具有全球影响力的科技公司方面一直表现出色——每10亿美元风险投资能产生1.22家独角兽企业,超过美国、英国、中国和以色列。这并非新现象,而是持续数十年的优异趋势,无论融资水平如何。大约每2.5年就会出现一家估值超过100亿美元的“超级独角兽”企业。 有趣的是,这些成功案例很少源于加速器或孵化器。一个关键模式是,在澳大利亚证券交易所(ASX)早期上市,估值相对较低,有效地将公开市场用作“B轮”融资——这种路径在全球范围内并不常见。这表明澳大利亚企业家常常选择公开市场,是因为难以获得有利的风险投资条款。 澳大利亚在特定领域表现突出:市场平台、SaaS、金融科技以及基础设施/建筑。值得注意的是,澳大利亚*缺乏*企业软件、实物产品、电子商务、社交媒体、游戏或直接面向消费者的“超级独角兽”企业。这表明其生态系统独特,偏爱盈利且可扩展的企业,可能源于澳大利亚投资环境对长期亏损业务的容忍度有限。 最终,澳大利亚展现出创造高影响力科技公司的卓越能力,这得益于其独特的增长路径和对特定成功商业模式的关注。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 澳大利亚独角兽 (sohum.com) 5 分,来自 Sohum 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

谷歌正在推出一项新的“高摩擦”流程,用于在Android 8.0及更高版本上安装第三方应用,旨在提高用户对潜在风险的认知。 这并非对第三方安装的限制,而是增加了从Google Play商店以外来源安装应用时的额外步骤和警告。 用户仍然可以选择“无验证安装”,但会面临额外的提示,强调来自未经验证的开发者的危险。 谷歌坚持认为这是一个侧重于教育的“责任层”,而不是阻止安装。 目前,这些变化表现为Play商店内增加的警告信息。 关键问题在于谷歌是否会维持这种对用户教育的关注,或者微妙地使第三方安装变得更加困难,从而可能阻碍Android传统上的开放性和高级用户灵活性。 谷歌目前尚未表明需要PC连接或外部工具。

## Android 侧载更新与用户担忧 谷歌正在实施一项新的、据称“高摩擦”的 Android 侧载应用流程——在 Google Play 商店之外安装应用。虽然一些用户认为此变化很小,类似于现有流程或 macOS 系统,但另一些用户则表示沮丧。 担忧集中在普通用户的复杂性上,一位评论员预测这将是一个繁琐的过程,涉及多个步骤和命令。许多人强调侧载的合法需求,引用诸如呼叫记录器和改进的工作配置文件管理器之类的用例。 一个关键的争论围绕着安全与易用性。一些人认为增加摩擦对于保护用户免受恶意软件侵害是必要的,而另一些人指出,即使是已签名应用也可能具有欺骗性(以 LastPass 为例),并且当前系统并不能阻止决心已定的恶意行为者。这场讨论凸显了开放式操作系统灵活性与用户安全之间的紧张关系。

## Vortex:一种新型列式文件格式,集成DuckDB Vortex是由SpiralDB开发,现由Linux基金会管理的全新开源列式文件格式,旨在解决Parquet等现有格式的局限性。与Parquet的块压缩不同,Vortex采用轻量级压缩和创新编码(如浮点数的ALP和字符串的FSST),从而能够在**压缩数据上直接执行计算函数**——这一功能称为“延迟物化”。 这最大限度地减少了解压缩,并提高性能,尤其是在处理向量、文本、图像和音频等多样化数据类型时,并优化CPU和GPU处理。 SpiralDB团队与DuckDB Labs合作,创建了一个核心DuckDB扩展,以实现无缝的Vortex集成。基准测试表明,在TPC-H基准测试中,Vortex的性能比Parquet v2快**18%**,比Parquet v1快**35%**,并且在多次运行中结果更一致。 Vortex在三个关键领域表现出色:传统的SQL分析、机器学习预处理和AI模型训练。它能够高效地将数据直接传输到GPU,使其成为现代数据工作负载的一个有前景的格式。它支持动态加载库,甚至嵌入WebAssembly以实现自定义计算内核。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 DuckDB 中的 Vortex 支持 (duckdb.org) 10 分,作者 0x1997,3 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## Apple Aperture 的持久遗产 一位长期使用 Mac 的用户反思了 Apple 软件的过去和现在,发现了一个出乎意料的例外:Aperture,这款于 2015 年停用的照片管理和编辑应用程序。虽然承认现代工具在功能上超越了旧软件,但 Aperture 因其独特高效的工作流程而脱颖而出。 与当前需要用户“前往”功能的应用程序不同,Aperture 拥有浮动、上下文相关的控制,直接“呈现在你面前”——这是一种革命性的方法,允许在地图、版式或任何视图中直接进行编辑,而不会中断创作过程。即使在当时,这也要归功于令人印象深刻的工程技术,实现了诸如无处不在的高分辨率放大工具等功能。 作者将这种无缝体验与 Adobe Lightroom 和 Apple Photos 等现代替代品的笨重感进行了对比,强调了设计停滞不前,侧重于花哨的功能而非实际可用性。Aperture 的卓越之处在于它对赋能用户的安静而低调的奉献,这是当今软件领域中严重缺失的品质。他甚至曾短暂考虑过为了重返 Apple 的 Aperture 团队而改变职业生涯,但最终没有选择这条道路,为他对这款真正特别的应用程序的惋惜增添了一笔个人色彩。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 对光圈的挽歌 (ikennd.ac) 4 分,由 firloop 1小时前发布 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

美国TikTok已正式过渡到新的、由美国人控股的“TikTok USDS Joint Venture LLC”所有权,解决了对其中国背景的担忧。此前曾有一段不确定时期,为了继续运营,必须将其出售给美国利益相关者。 关键变化主要在幕后进行,侧重于数据安全和算法控制。美国用户数据将安全地存储在Oracle的美国云环境中,并受到严格的网络安全标准保护。重要的是,TikTok的推荐算法将使用美国用户数据进行重新训练,这可能会改变用户看到的内容。 新的所有权还将全面控制内容审核和信任与安全政策。虽然应用程序的可见变化可能很小,但目标是解决国家安全问题,并确保该平台超过2亿美国用户和750万企业的安全体验。内容质量的长期影响还有待观察。

一场 Hacker News 的讨论围绕 TikTok 最近转向美国所有权,以服务美国用户。虽然这被宣传为一种数据隐私解决方案,但评论员质疑用户数据是否*真的*更安全。许多人指出,核心问题不是*谁*控制数据,而是*如何*使用数据——从潜在的中国政府访问,转变为美国情报机构和企业数据挖掘的可能性。 对话还涉及 TikTok 本身的价值。一些人认为短视频是“脑残”,而另一些人则观察到 Z 世代,并注意到它作为搜索实用信息(如食谱和旅行提示)的搜索引擎的功能。 一个关键点是,这种变化可能涉及 TikTok 美国版和世界其他地区的划分,采用美国本地算法和审核系统,并由 Oracle 提供协助——不是一个全新的应用程序,但对内容和用户数据具有重大控制权。最终,许多人表达了愤世嫉俗,认为结果只是用一种形式的控制和潜在操纵,换来另一种形式。

该网站正在使用安全服务来保护自身免受在线攻击。您刚才的操作触发了安全解决方案。 提交特定词语或短语、SQL命令或格式错误的数据等行为可能会触发此阻止。

一场 Hacker News 的讨论集中在对 Palantir 参与英国公共服务的问题的担忧,许多评论员认为这个问题远不止于一家供应商。核心观点是,许多大型科技公司——微软、亚马逊、谷歌和苹果——对隐私和公民自由构成相似甚至更大的风险,特别是考虑到它们在*托管* Palantir 服务的角色。 几位用户表达了黯淡的看法,认为英国正在稳步建立一个拥有广泛公众接受度的监控国家。他们认为仅仅更换公司无法解决问题,需要公众态度和政治代表制的根本转变才能扭转局面。对话涉及更广泛的权力动态,将其定型为新兴寡头与公民之间的潜在冲突。

正在验证您的浏览器。网站所有者?点击此处修复。 Vercel 安全检查点 | sin1::1769315756-F6cu8Kyb24XwQJOXpgRLlsTCiIj6BxgO 启用 JavaScript 以继续。 Vercel 安全检查点 | sin1::1769315756-F6cu8Kyb24XwQJOXpgRLlsTCiIj6BxgO

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 视频修复中的时间一致性挑战 (videowatermarkremove.com) 6 分,来自 ilmj8426 2 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

[提交于2026年1月8日 (v1),最后修改于2026年1月14日 (此版本,v2)] 查看论文PDF:大型语言模型推理硬件的挑战与研究方向,作者:马晓宇和David Patterson 查看PDF 摘要:大型语言模型 (LLM) 推理很困难。底层Transformer模型的自回归解码阶段使得LLM推理与训练根本不同。由于最近的人工智能趋势,主要挑战在于内存和互连,而非计算。为了应对这些挑战,我们强调了四个架构研究机会:具有HBM类似带宽的10倍内存容量的高带宽闪存;用于高内存带宽的近内存处理和3D内存-逻辑堆叠;以及用于加速通信的低延迟互连。虽然我们的重点是数据中心人工智能,我们也回顾了它们在移动设备上的适用性。 来自:马晓宇 [查看邮箱] [v1] 2026年1月8日 星期四 15:52:11 UTC (832 KB) [v2] 2026年1月14日 星期三 20:37:46 UTC (983 KB)

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 David Patterson: LLM 推理硬件的挑战与研究方向 (arxiv.org) 7 分,来自 transpute 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

更多

联系我们 contact @ memedata.com