MemeData

蝌蚪 – 一个模块化且可扩展的 DSL，专为网页抓取而构建。 Tadpole – A modular and extensible DSL built for web scraping 3 天前

```json { "addresses": [ { "address": "华盛顿州西雅图市东詹姆斯街2011号，邮编98122" }, { "address": "华盛顿州西雅图市西北第17大道8020号，邮编98117" }, { "address": "华盛顿州西雅图市西南多诺万街4015号，邮编98136" }, { "address": "华盛顿州西雅图市第13大道116号，邮编98122" } ... ]} ```

## 蝌蚪：一个网页抓取 DSL 蝌蚪是一种新的、模块化的领域特定语言 (DSL)，基于 KDL 构建，旨在简化和标准化网页抓取和浏览器自动化。由 zachperkitny 创建，它旨在为真实的浏览器行为（如缓动和贝塞尔曲线）提供抽象，通过 Git 实现零配置模块共享，并通过可组合的操作实现可重用的抓取逻辑。核心思想是超越传统的抓取库，如 Beautiful Soup，提供一种更简洁、更有组织的方法。一个例子展示了使用简洁的 KDL 脚本从 Redfin 抓取地址。路线图包括诸如控制流（循环和 try/catch）、DOM 选择/过滤、扩展评估器以及管道输出到数据库和利用有向无环图 (DAG) 进行复杂爬取等功能。目前专注于数据提取，开发者正在考虑根据用户反馈扩展功能，可能包括文件下载和语言绑定（如通过 WASM 实现 Python）。该项目在 GitHub 上可用，并提供一个社区仓库用于共享模块。

展示HN：C离散事件SIM，使用堆栈式协程，运行速度比SimPy快45倍。 Show HN: C discrete event SIM w stackful coroutines runs 45x faster than SimPy 3 天前

## Cimba：高性能离散事件模拟库 Cimba是一个快速、免费且可靠的离散事件模拟库，使用C和汇编语言编写，利用POSIX pthreads进行并行执行。它将模拟过程实现为堆栈式协程（“纤程”），速度比使用SimPy构建的等效模型**快40-50倍**——通过一个简单的M/M/1队列基准测试表明，速度提升了45倍。值得注意的是，Cimba甚至可以在单核上超越SimPy的性能。这种速度能够实现数百次重复和参数变化的快速实验，提供紧密的置信区间和密集的数据。Cimba提供了一个全面的工具包，包括预封装的进程交互（资源、队列等）、条件变量和各种随机数生成器。 Cimba专注于可靠性，采用了大量的断言（代码行数的13%）和单元测试。它采用面向对象原则在C中设计，并利用手工编写的汇编代码进行上下文切换。虽然用C编写，但Cimba可以轻松与其他语言和库集成，甚至可以通过CUDA支持GPU加速。它适用于建模复杂的系统，如网络、制造和医疗保健。 Cimba是公开可用的，可以使用C编译器和Meson构建管理器进行安装。

## Cimba：一个快速离散事件模拟库 Cimba是一个新的、多线程的离散事件模拟库，用C语言编写，旨在追求速度。它利用POSIX线程进行并行试验执行，并使用**堆栈式协程**——通过手工编写的汇编语言实现——在每个模拟内部实现并发。这允许一种自然、面向代理的编程风格。在一项模拟M/M/1队列的基准测试中，Cimba实现了比使用SimPy（Python）构建的等效模型**快45倍**的性能。即使在单个核心上，它处理的事件每秒数也超过了SimPy使用64个核心时的数量！这种速度归功于高效的协程、哈希堆事件队列、快速随机数生成器和内存池。作者欢迎对API和代码的反馈，并计划将其移植到Apple Silicon和ARM架构。一个关键的讨论点围绕着优化协程上下文切换，涉及汇编级别优化和消毒器兼容性等建议。该项目欢迎贡献，特别是移植到新的架构。 **链接：** [文档](https://cimba.readthedocs.io/en/latest/)， [仓库](https://github.com/ambonvik/cimba)

展示HN：Octosphere，一个用于分散科学出版的工具 Show HN: Octosphere, a tool to decentralise scientific publishing 3 天前

主页 - Octosphere 连接开放科学与社交网络什么是 Octosphere？ Octosphere 弥合了学术出版物与社交网络之间的差距。它会自动将您的研究出版物从 Octopus 同步到 AT 协议（氛围）——一个为 Bluesky 等社交应用程序设计的开放、去中心化网络。通过在氛围中分享您的工作，您可以接触到更广泛的受众，与公众互动，并提高您的研究在传统学术渠道之外的可见性。运作方式使用 ORCID 登录——使用您的研究人员标识进行身份验证。连接到氛围——使用您的 Bluesky 帐户（或任何 AT 协议应用程序）登录。链接您的 Octopus 个人资料——连接您的 Octopus 作者页面。同步您的出版物——选择一次性同步或启用未来出版物的自动同步。使用 ORCID 开始由 AndreasThinks 创作，并得到一些 ✨氛围✨ 的帮助。

## Octosphere：利用ATProto协议实现科学出版去中心化 Crimsoneer发布了Octosphere，一种基于ATProto协议（Bluesky使用）的新工具，旨在解决对传统学术出版的 frustations。该项目源于对更开放、更高效系统的渴望，并受到ATProto聚会的启发。讨论很快强调了在ATProto上构建研究者平台的现有努力，并提供了与相关群组的联系以及一个专注于该主题的会议。然而，关于ATProto本身也出现了争论，一些人批评它是在重新发明像ActivityPub这样的现有协议，可能将数据收集置于去中心化和隐私之上。另一些人则捍卫ATProto对用户体验和充满活力的开发社区的关注。关键点包括ATProto与ActivityPub的“自带电池”特性，以及同行评审中持续存在的门槛机制与开放获取之间的需求。虽然一些人倡导完全开放、众包的评审，但另一些人强调专家评估的重要性以及可能存在的操纵风险。对话还涉及了对密码学验证和内容寻址的必要性，以实现真正去中心化、可验证的科学出版，而不仅仅是简单的去中心化路由。

迁移向导 – 基于IMAP的邮件迁移工具 Migrate Wizard – IMAP Based Email Migration Tool 3 天前

## 迁移向导：无缝电子邮件迁移迁移向导提供快速、安全和可靠的电子邮件迁移解决方案。该服务专为个人和企业设计，拥有**99.9%的成功率**，平均迁移时间仅为**5分钟**，即使对于千兆字节的数据也是如此。主要功能包括**零停机时间**、**100%数据完整性**和**企业级安全性**——凭据被加密并在迁移后立即删除。无需技术专长，该平台支持各种场景，如提供商切换、帐户整合以及电子邮件备份/归档。迁移向导优先考虑用户隐私，**不存储凭据**，并提供**增量同步**功能以确保持续的数据一致性。提供**免费试用**，无需信用卡，用户可享受**24/7支持**。已成功完成超过10,000次迁移，使其成为电子邮件管理的可靠选择。

千字节精确等于1000字节。 1 kilobyte is precisely 1000 bytes? 3 天前

## 千字节：1024 还是 1000？多年来，人们一直认为计算机内存中的千字节是 1024 字节，兆字节是 1024 千字节，以此类推——这源于计算机的二进制特性。然而，以 1 千字节等于 1000 字节的十进制系统更具逻辑性，并且越来越被使用，尤其是在硬件制造商宣传存储容量时。这种差异的产生是因为虽然计算机*运行*在二进制中，但以十进制（基数为 10）报告大小更容易被人类理解。对于较小的单位，差异很小，但随着太字节及更大单位的增加，差异会显著增长——对于夸字节，可能超过 20% 的不准确性。这导致混淆，因为操作系统（通常使用二进制定义）显示与存储供应商宣传的容量（通常使用十进制）不同的容量。为了解决这个问题，国际电工委员会引入了不同的二进制前缀（KiB、MiB、GiB）来清楚地表示 2 的幂，以及标准的十进制前缀（kB、MB、GB）来表示 10 的幂。虽然旧的惯例由于行业惯性而仍然存在，但理解这种差异并使用正确的前缀有助于清晰地讨论计算机内存和存储。

```Deno 沙箱``` Deno Sandbox 3 天前

## Deno 沙箱：安全运行不受信任的代码 Deno Deploy 推出 **Deno 沙箱**，这是一种安全执行由 LLM（或任何不受信任的来源）生成代码的新方案，而不会损害系统安全。传统的沙箱不足以应对代码自动访问具有敏感凭据的 API 的情况；Deno 沙箱直接解决了这个问题。它利用轻量级的 Linux 微型虚拟机进行隔离，启动时间小于一秒，可通过 SSH、HTTP 或 VS Code 访问。至关重要的是，**密钥受到保护**：API 密钥从不存在于沙箱环境中，仅在批准的传出请求时才生成，从而防止数据泄露。网络出口也受到控制，阻止连接到未经授权的主机。 Deno 沙箱与 Deno Deploy 无缝集成——代码可以直接从沙箱部署到生产环境，只需一条命令，无需重建。它还通过卷和快照提供持久性选项，用于缓存和预安装的工具链。 Deno 沙箱现已进入 Beta 测试阶段，包含在 Deno Deploy 的按使用量计费的计划中。它非常适合 AI 代理、安全的插件系统以及处理用户提供的代码的环境。

## Deno 沙箱总结 Deno 沙箱为运行不受信任的代码提供了一个安全环境，特别是具有 API 访问权限的 LLM 生成代码，解决了密钥泄露的风险。它利用 Deno Deploy 云中的轻量级 Linux 微型虚拟机，并通过仅允许为批准的主机进行密钥替换来控制网络出口。此外，还提供了一个 Python SDK。其核心创新在于仅在向授权域名发出的外向请求期间，动态地将占位符替换为真实的 API 密钥，从而防止密钥被永久盗取。然而，讨论中也指出了潜在的漏洞，例如通过 API 响应或 HTTP 标头进行密钥反射或操纵。许多评论员注意到类似沙箱解决方案的激增（Modal、E2B 等），并质疑其与自托管 VM 相比的价值主张。此外，人们还对博客文章的写作风格表示担忧，许多人怀疑是 AI 生成的。价格也是一个争议点，一些人认为它明显高于传统的 VM 成本。

雅典娜·帕特农神像：复原 (2000) Athena Parthenos: A Reconstruction (2000) 3 天前

Please provide the content you want me to translate. You've only given me an empty code block. I need text to translate *into* readable Chinese.

黑客新闻新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交登录雅典娜帕特农神像：重建 (2000) (goddess-athena.org) 15 分，joebig 1 天前 | 隐藏 | 过去的 | 收藏 | 1 条评论 utopcell 1 天前 [–] 这次重建太糟糕了！考虑到我们从古代希腊获得的其余文物，如此重要的雕像不可能看起来这么糟糕。这次重建让我想起了 [1]。 [1] https://en.wikipedia.org/wiki/Ecce_Homo_(Garc%C3%ADa_Mart%C3... 回复指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系搜索：

法国放弃Zoom和Teams，欧洲寻求摆脱美国数字自主。 France dumps Zoom and Teams as Europe seeks digital autonomy from the US 3 天前

## 欧洲寻求数字独立欧洲各国政府正在积极减少对微软和Zoom等美国大型科技公司的依赖，这源于对数据隐私、安全以及潜在政治影响力的担忧。在特朗普政府制裁影响国际组织以及担心数据访问被切断等事件发生后，这种“数字主权”的推动力日益增强。法国正处于领先地位，计划到2027年禁止其250万公务员使用Zoom、Teams等美国视频会议工具，转而选择本土替代方案。德国和奥地利也在转向开源办公软件，部分地区甚至正在探索Linux操作系统。这场运动源于对受外部控制的脆弱性的担忧——特别是来自美国和中国，以及对培养欧洲科技领导地位的渴望。尽管微软等美国公司强调在欧洲的数据保护，但官员们认为真正的独立需要本土或开源解决方案。这种转变正在获得进展，成为全球论坛上的一个关键讨论点，并促使了“主权云”等倡议的出现——这些数据中心由欧洲实体独立运营。

定义安全硬件设计 [pdf] Defining Safe Hardware Design [pdf] 3 天前

This appears to be a corrupted PDF file containing binary data, not readable text. Therefore, a meaningful translation into Chinese is impossible. It's mostly gibberish. It's not possible to provide a Chinese translation of this content as it is not coherent text.

这场 Hacker News 讨论的核心是**改进硬件设计安全性**，超越传统语言如 Verilog 和 VHDL 的局限性。初始帖子链接到一篇关于定义安全硬件设计的论文。评论者讨论了实现完全验证的挑战，有人认为动态延迟问题可能从根本上是不可判定的。作为替代方案，他们建议采用“类似 Rust”的方法：**构建具有内部复杂但安全的“黑盒”抽象**，为用户提供静态可验证的延迟保证——SUS 项目的“SlowState”功能就是一个例子。其他讨论点包括 **Bluespec** 的潜力，这是一种完全开源的硬件描述语言，但其学习曲线可能会阻碍其在工业界的采用。一个关键主题是弥合 **类型理论专业知识和实际硬件知识** 之间的差距的难度。最后，一位评论员指出，现实世界的硬件设计通常受到物理现实和实际考虑因素（供应链、制造差异）的限制，这使得*完全*形式化变得困难，并建议将重点放在 **AI 辅助设计工具** 上，作为更有希望的改进途径。

人工智能并未违反版权法，它只是暴露了版权制度的缺陷。 AI Didn't Break Copyright Law, It Just Exposed How Broken It Was 3 天前

## 人工智能、版权与岌岌可危的体系数十年以来，版权法一直基于一些不成文的假设：创作是缓慢的，分发是昂贵的，执法是自由裁量的。例如，粉丝艺术就存在于一个被容忍的灰色地带——个人使用可以，出售则不行。生成式人工智能打破了这种平衡，将模糊性转化为巨大的法律和经济问题。核心问题不是*新的*版权侵权，而是*规模*。试图在“训练”阶段执行版权（阻止人工智能学习受版权保护的材料）是不切实际的——互联网充斥着合法使用的受版权保护的内容，并且将其解开是不可能的。监管“生成”同样存在缺陷，因为意图无法确定，处罚也变得荒谬地不成比例。有效的执法最终取决于*分发*——实际发生损害的地方——这反映了现有的在线版权实践。然而，即使这样也存在过度监管和扼杀创造力的风险。此外，全球人工智能发展意味着美国的法规可能无效，可能会将创新推向其他地区。归根结底，为内容稀缺的世界而建立的现有版权法，难以应对人工智能创造流畅、个性化体验的能力。这场辩论不仅仅是关于修复现有规则，而是认识到内容的本质正在发生变化，使传统的版权概念日益过时。我们试图监管一个正在消失的世界，而未来需要提出新的问题。

## 黑客新闻讨论：人工智能、版权和失效的系统一篇题为“人工智能并未破坏版权法，它只是暴露了版权制度的缺陷”的文章引发了一场黑客新闻的讨论，其中心在于版权执行方面的虚伪性。许多人指出，过去对版权的批评主要来自那些认为其是大型企业扼杀竞争的工具，而当前的愤怒则源于企业*无视*版权，损害艺术家和小型公司。核心论点是，问题并不一定在于版权的*原则*，而在于其执行和实施方式，后者始终偏袒强大的实体。一些评论员提倡进行重大改革，建议缩短版权期限（例如，5-20年，并分层使用权和版税），以更好地支持创作者，同时促进创新。还有人强调了一种历史上的不一致性：过去批评版权的科技行业，现在却在*他们*从侵权中获益时为其辩护。讨论还涉及到一个观点，即法律通常是为人类规模的场景设计的，难以适应人工智能和大规模数据使用的复杂性。最终，许多人认为当前的情况揭示了一个根本性的缺陷：法律体系常常服务于资本利益，而非个人和创作者的利益。

每日HackerNews RSS