arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。
arXivLabs是一个框架,允许合作者直接在我们的网站上开发和分享新的arXiv功能。个人和与arXivLabs合作的组织都认同并接受我们开放、社群、卓越和用户数据隐私的价值观。arXiv致力于这些价值观,并且只与秉持这些价值观的合作伙伴合作。您是否有为arXiv社群增加价值的项目想法?了解更多关于arXivLabs的信息。
这篇帖子哀叹了大多数编程语言处理文件访问方式出乎意料的原始。虽然语言提供了基本的读/写函数和序列化库,但它们大多将文件视为与内存分离的,迫使开发者进行冗长、顺序处理——这是基于磁带系统的遗留物。 作者将其与C的`mmap`函数形成对比,该函数允许直接内存映射文件,即使这些文件大于内存,从而提供高效、与数据类型无关的访问。这避免了代价高昂的解析和序列化。 核心论点是,语言假定文件数据*总是*需要解析/序列化,忽略了直接数据操作更可取的场景,尤其是在处理大文件的内存受限系统上。这导致了不必要的复杂性,并且常常迫使开发者转向低效的解决方法,例如在文件系统*之上*构建完整的数据库(例如SQLite),从而进一步复杂化数据访问。作者认为,鉴于现有语言特性(如自定义分配器),改进的文件处理是可行的。
我们检测到您的浏览器已禁用 JavaScript。请启用 JavaScript 或切换到受支持的浏览器以继续使用 x.com。您可以在我们的帮助中心查看受支持的浏览器列表。帮助中心 服务条款 隐私政策 Cookie 政策 版权信息 广告信息 © 2026 X Corp.
## 失去的联结艺术 最近的日常相遇引发了一种认识:我们正在失去——并且不愿——仅仅*与*彼此交谈的能力。两次看似微小的互动——一次与火车上的女性的对话,一次与餐厅服务员的聊天——促使人们反思一种正在消失的社交技能。一个儿子关于如何与陌生人搭讪的问题,突显了支配这些互动的未成文规则,这些规则似乎在现代生活中已被遗忘。 作者认为一场“关系衰退”正在进行,其动力来自技术、社会规范和焦虑。从耳机到触摸屏,随处可见阻碍随意对话的障碍。专家指出,社交技能正在下降,尤其是在年轻一代中,并且对拒绝的恐惧阻碍了联结。 虽然内向等可以理解的原因存在,但更广泛的问题是对冒险的恐惧——无论是发起还是接受联结。研究表明,我们高估了这些互动的风险。作者认为,关键在于降低风险,拥抱“微小的人性化行为”,例如评论天气,并记住,即使是简短的交流也能加强我们共同的人性。 重拾这项技能并非关于改变人生的对话,而是关于维护使我们成为人类的基本方面。
我们检测到您的浏览器已禁用 JavaScript。请启用 JavaScript 或切换到受支持的浏览器以继续使用 x.com。您可以在我们的帮助中心查看受支持的浏览器列表。帮助中心 服务条款 隐私政策 Cookie 政策 版权信息 广告信息 © 2026 X Corp.
## 监控的武器化 在斯诺登事件揭露八年后,美国国家安全局的大规模数据收集基础设施已经演变成一个强大、由人工智能驱动的监控和目标定位系统。该系统被像移民及海关执法局(ICE)这样的机构积极利用,超越了被动的数据收集,开始*预测*威胁并自动化执法行动——包括驱逐出境和政治镇压。 ICE已与Palantir等公司签订合同,构建“移民操作系统”(ImmigrationOS)和“ELITE”等平台,整合来自各种来源的数据——包括社交媒体、财务记录,甚至应用程序的位置数据——以创建详细的个人资料和“可信度评分”。像Zignal Labs这样的人工智能工具每天监控数十亿条社交媒体帖子,根据用户的在线活动标记个人进行审查,甚至通过地理定位追踪他们。 政府通过从数据经纪人处购买数据,绕过传统的搜查令要求,获取以前受第四修正案保护的信息。面部识别技术被部署在边境各地,尽管人们对其准确性和偏见存在担忧,但其使用范围在缺乏有效监督的情况下不断扩大。此外,旨在监控ICE活动的应用程序经常从应用商店中移除,而政府继续扩大其监控能力,引发了对言论自由的寒蝉效应和公民自由侵蚀的严重担忧。专家警告说,这种不受控制的扩张类似于一个危险的循环,反映了社交媒体时代的陷阱,但规模远大于以往。
## gzpeek:揭示Gzip文件中的隐藏数据
Gzip文件除了压缩数据外,还包含着丰富的元数据。一个新的工具,**gzpeek**,允许用户检查这些隐藏的信息。Gzip头部会显示诸如用于压缩的操作系统(尽管可靠性各异——有些工具会硬编码值或将其设置为“未知”)、原始文件的修改时间、指示潜在文本数据的标志、压缩级别、原始文件名,甚至可选的注释或任意数据等细节。
作者出于对文件格式规范的兴趣以及学习Zig语言的愿望,创建了gzpeek来探索这些细节。虽然操作系统标志并不总是准确,并且修改时间存在日期限制,但这些元数据提供了对文件历史的有趣见解。
gzpeek是一个命令行工具,可以提取这些信息,从而比以往任何时候都更深入地了解gzip文件。它可供使用,作者鼓励用户探索并分享他们的发现。
## MicroGPT:200行代码实现的LLM Andrej Karpathy 使用200行Python代码创建了一个完全可用的GPT语言模型,展示了像ChatGPT这样的模型背后的核心原理,*无需*依赖外部库。该模型从32,000个示例的数据集中学习生成合理的人名。 过程首先将名称转换为数字标记——为每个字符分配一个ID,以及一个“序列开始”标记。然后,模型预测序列中的下一个标记,学习字符之间的统计关系。这种预测依赖于“注意力”机制,允许模型权衡输入不同部分的重要性。 至关重要的是,模型通过反向传播学习,使用交叉熵方法调整其参数以最小化预测误差(损失)。这涉及计算梯度并通过像Adam这样的优化器更新参数。 虽然这个micro-GPT使用简单的Python标量,但其底层算法与更大的LLM相同——这只是规模的问题。差异在于利用GPU、更大的数据集、更复杂的标记化以及大幅增加的模型大小(参数和层)。最终,核心循环保持不变:预测下一个标记,衡量误差,并完善模型。
Please provide the content you want me to translate. I need the text to be able to translate it to Chinese. Just paste it here, and I will give you the Chinese translation.
几位民主党人和所有共和党人在今晚特朗普宣布禁止股票交易时起立鼓掌。有趣的是,共和党人曾试图阻止本党人乔希·霍利(@HawleyMO)的干净法案——一项直接禁止在任期间交易个人股票的法案。该法案仅以委员会投票(8-7)通过,因为所有7名民主党人加入了霍利。所有共和党成员都投了反对票。霍利的法案还将禁止总统和副总统(从2028年开始)。自2025年7月30日以来,该法案一直搁置。⬇️ 现在,正在推动的“禁令”恰好只适用于国会——不包括行政部门。