每日HackerNews RSS

SourceHut 正在更新其服务条款,以明确其对数据抓取的立场,主要原因是大型语言模型爬虫数量的增加带来了越来越大的负担。新的条款将明确允许出于搜索索引、开放获取研究和存档目的的抓取,前提是爬虫遵守 robots.txt 协议,使用清晰的 User-Agent,并且不会对服务性能造成负面影响。未经明确许可,出于揽客、盈利、训练机器学习模型或其他未经批准的目的进行抓取是被禁止的。 SourceHut 认为平台上的数据是为开源用户和贡献者准备的。他们不赞成为了大型语言模型或其他不直接惠及开源社区的用途进行批量数据收集。他们拒绝公司有权获取这些数据的观点,并且不会提供特殊访问权限,即使是付费也不例外。SourceHut 优先考虑用户的利益,并将自己视为其数据管理者,致力于确保数据被用于改进开源软件。他们的资金来源是订阅,而不是数据销售。

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 你无法获取我们的用户数据 (sourcehut.org) 25 分,来自 Tomte,48 分钟前 | 隐藏 | 过去 | 收藏 | 讨论 加入我们,参加 6 月 16-17 日在旧金山举办的 AI 初创公司学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系我们 搜索:

PgDog是一个网络代理,它能够智能地对PostgreSQL数据库进行分片,而无需更改应用程序代码。它理解PostgreSQL的线协议,包括简单和扩展协议,并通过包装的PostgreSQL解析器解析SQL查询以识别分片键。这使得PgDog能够将读/写查询路由到适当的分片。 对于简单的查询,PgDog直接解析SQL。对于包含预处理语句的扩展查询,它缓存抽象语法树 (AST) 并使用`Bind`消息传递参数值。PgDog使用与PostgreSQL声明式分区相同的哈希函数,以确保不同数据访问方法之间的一致性。 PgDog通过合并结果来处理跨分片查询,管理`RowDescription`和`CommandComplete`等消息,并智能地排序`DataRow`消息。对于批量数据导入,它会操作`COPY`命令,将行路由到正确的分片,并通过缓冲和重建完整的行来确保数据完整性。这使得在不同的PostgreSQL环境中工作时能够实现可扩展的数据导入。

PgDog 项目(详见 pgdog.dev)旨在破解 Postgres 线程协议。其关键在于使用 Rust 接口直接与从 Postgres 中提取的 C 代码交互,从而使 PgDog 能够理解 Postgres 可以理解的任何查询。这种方法突显了元编程的强大功能,特别是利用外部系统语法和模式的能力。 评论者 PaulHoule 强调了这一点的价值,并指出如果这种能力更广泛地应用,将会出现更多工具。另一位评论者 skeptrune 赞扬了 Rust 生态系统,因为它提供了一个合适的 SQL 解析库 `pg_query`,该库作为一个参考点。craigkerstiens 解释说 `pg_query` 由 pganalyze 团队开发,并提到它的高质量以及针对多种语言的可用包装器。levkk 确认该项目利用该库来重写查询。

经过两年的Rust B2B SaaS后端开发,总体体验非常积极。Rust 的性能是一个主要优势,它允许编写“默认快速”的代码并提供充足的优化空间。Cargo优秀的声明式工具简化了依赖管理。Rust强大的类型系统和错误处理机制带来了健壮的代码并减少了调试工作。借用检查器虽然最初具有挑战性,但它强制执行内存安全并引导高效的设计。异步编程提供了性能优势,尽管其复杂性可能令人望而却步。 然而,构建时间可能是一个显著的痛点,模块系统基于板条箱级别的编译单元加剧了这个问题。由于生命周期的问题,模拟依赖项进行测试比在Python等语言中更复杂。虽然Rust提供了强大的表达能力,但过度使用宏和高级特性可能导致代码难以维护。 总的来说,Rust 提供了高效且可靠的开发体验,并具有构建高性能、可维护系统的潜力。关注架构和构建过程至关重要。

这篇 Hacker News 帖子讨论一篇关于两年 Rust 经验总结的博文。评论者关注几个关键痛点。一位用户指出了原文中的一个错别字。另一位建议构建一个借用检查器可以作为很好的本科生项目。几位评论者批评了 Rust 的模块/板条箱系统,认为将代码分割成单独的板条箱很麻烦,并渴望 Go 更简单的依赖管理。一位用户详细介绍了 Rust 的各种“万物类型”(值、引用、原始指针)以及理解这些类型如何帮助解决借用检查器问题。最后,提到了 `build.rs` 可能是 Cargo 相关挫折的来源,这与作者的积极评价相矛盾,并附上了 Bevy 在改进 Rust 构建性能方面工作的链接。整体基调是建设性的批评,并希望改进开发者工具和清晰度。

霍华德·马尔凯尔的《生命的秘密》揭示了DNA双螺旋结构发现背后复杂且常常不道德的故事。虽然詹姆斯·沃森在拿波里初遇莫里斯·威尔金斯常常被认为是导火索,但马尔凯尔揭露了一个更阴暗的背景,其中涉及婚外情和沃森自身的野心。这本书的核心是罗莎琳德·富兰克林受到的虐待,她至关重要的X射线晶体学工作(照片51)未经许可就被分享,为沃森和克里克的模型提供了关键的见解。马尔凯尔认为,沃森和克里克低估了富兰克林的贡献,甚至在他们具有里程碑意义的论文中省略了正式引用。尽管富兰克林在诺贝尔奖颁发前去世,但马尔凯尔强调的证据表明她理应获得认可。他强调了竞争环境和掩盖富兰克林作用的个人偏见,沃森的种族主义观点更增添了一层复杂性。马尔凯尔强调,虽然竞争是科学固有的,但对富兰克林的不道德对待是一种严重的非正义行为,其动机是控制发现的叙事。

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 科学史上最臭名昭著的骗局之一——DNA竞赛 (nautil.us) 16 分,由 robaato 2 小时前发布 | 隐藏 | 过去 | 收藏 | 讨论 加入我们,参加 6 月 16-17 日在旧金山举办的 AI 初创公司学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系我们 搜索:

一位资深制造商在文章中表达了他的观点:近期宣布的10%到49%不等的进口关税,并不能振兴美国制造业,反而可能损害美国经济。关税税率不足够高,而且美国工业供应链薄弱。由于拥有完善的供应链、熟练的劳动力和优越的基础设施,中国仍然保持着制造业的竞争优势。 此外,作者还指出了美国的劳工问题、关税导致产品制造成本上升(因为原材料和零部件也加征关税)、关税政策的不确定性和复杂性以及劳动力短缺等问题。作者强调了关税执行的不均衡性,这反而有利于外国公司,并且关税结构本身存在缺陷,它对成品和零部件一视同仁地征税,同时也对机器征税,并且缺乏出口退税政策。 作者提出了有针对性的解决方案,包括解决根本性的劳动力效率问题、优先发展高端制造业、逐步实施改革以及为外国制造业专家发放签证。作者警告说,目前的政策存在引发经济衰退和丧失美国在全球化中作用的风险。

Hacker News的一个帖子讨论了一篇文章,该文章认为美国低估了将制造业从海外带回来的难度。评论者们强调了各种挑战:中国完整的工业体系,对熟练劳动力和配套基础设施的需求,以及关税可能造成的政策不稳定性。一些人争论这项努力是否值得,认为专注于设计和创新等更高附加值的活动可能更有益。 几位用户指出,制造业的衰落不仅仅是经济问题,还涉及劳动力与必需品生产脱节的社会和政治后果。讨论还涉及自动化、政府干预的作用以及贸易政策对国内和国际经济的影响。普遍的观点是,解决这个问题需要长期战略性的方法,而不是像关税这样的短期政策。

谷歌正在整合其搜索体验,即将来自特定国家/地区谷歌域名(例如google.fr、google.ng)的流量重定向到Google.com。这项变更将在未来几个月内逐步推出,旨在简化用户体验,因为谷歌现在无论使用哪个域名,都能提供相同的本地化搜索结果。 谷歌表示,由于其提供本地结果的能力得到改进,国家/地区级域名已不再必要。虽然大多数用户不会注意到明显的区别,但有些人可能需要重新登录并重新配置搜索设置。 此更改主要影响浏览器地址栏的显示,不会改变谷歌搜索的功能或其在国家/地区法律下的义务。网站所有者可能会观察到来自谷歌搜索的推荐流量略有变化。

Hacker News 讨论了谷歌将国家顶级域名 (ccTLD) 重定向到 Google.com 的决定。用户推测此举可能是为了整合数据以便更好地进行追踪,并与第一方 Cookie 安全模型保持一致,类似于 maps.google.com 转向 www.google.com/maps 的转变。另一位用户指出,该公司有可能像使用 https://google 那样使用其 .google 顶级域名,但这对于通用顶级域名 (gTLD) 来说是不允许的,尽管一些国家顶级域名 (ccTLD) 允许类似的实现方式。一些用户强调了此举的潜在好处和坏处,包括与 AOL 关键词的相似之处以及潜在的单点故障问题。

Hacker News 上的一个帖子讨论了一项研究,该研究表明 CT 扫描可能导致 5% 的癌症。用户 TaupeRanger 批评了这项研究的方法论,质疑患者的唯一性识别方式、是否考虑了每个患者的多次扫描以及缺乏既有癌症数据。他们认为,这项研究并没有探讨扫描是否会增加或减少寿命/生活质量。 其他人质疑这项研究是否控制了 CT 扫描检测到的既有未诊断癌症。讨论转向权衡辐射诱发癌症的风险与 CT 扫描在诊断和挽救生命方面的益处。讨论了 MRI 的安全性;与使用 X 射线的 CT 扫描不同,MRI 不使用电离辐射,从而降低了癌症风险。提到了 MRI 造影剂的风险,但认为不太可能发生。许多人认为,CT 扫描的潜在风险小于根本不去检查。一位用户分享了有关 CT 扫描辐射剂量的信息。

请启用JavaScript和Cookie以继续

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 7000年前撒哈拉绿洲的骸骨揭示了一个神秘的人类血统 (smithsonianmag.com) 20 分,来自 pseudolus,2 小时前 | 隐藏 | 过去 | 收藏 | 讨论 加入我们 6 月 16-17 日在旧金山举办的 AI 初创公司学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

在她的文章中,克莱尔·梅苏德探讨了弗拉基米尔·纳博科夫的《洛丽塔》在其70周年之际依然存在的“问题”性质。她批评了将“有问题的”一词用来回避关于小说恋童癖叙述者亨伯特·亨伯特及其罪行的艰难对话的做法。梅苏德强调了围绕该书最初的争议,以及纳博科夫本人拒绝象征性解读,而是强调了他旨在创造的美学体验和“幸福”。 梅苏德承认了该小说在#MeToo运动和现实世界中的性侵犯事件背景下的相关性。她认为,像亨伯特对洛丽塔那样“利己地”看待受害者,仍然是一个令人不安的现实。最终,梅苏德认为《洛丽塔》需要积极主动、认真细致的阅读,拒绝彻底的谴责和净化的解读。她将纳博科夫对“好奇心”的强调解读为一种道德要求:直面令人不安的真相,抵制助长残酷的“缺乏好奇心”。小说的力量在于它同时探索了人类境况中可怕的、滑稽的、美丽的和悲惨的各个方面。

Hacker News 最新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 以其最纯粹的形式 (lareviewofbooks.org) 6 分,来自 lermontov,2 小时前 | 隐藏 | 过去 | 收藏 | 讨论 加入我们,参加 6 月 16-17 日在旧金山举行的 AI 初创公司学校! 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系我们 搜索:

您的请求已被阻止,原因是网络策略。请尝试在此处登录或创建帐户以继续浏览。如果您正在运行脚本或应用程序,请在此处使用您的开发者凭据注册或登录。此外,请确保您的 User-Agent 不为空,并且是唯一且具有描述性的,然后重试。如果您提供了替代的 User-Agent 字符串,请尝试改回默认值,因为这有时会导致阻止。您可以在此处阅读 Reddit 的服务条款。如果您认为我们错误地阻止了您,或者您想讨论获取所需数据更简便的方法,请在此处提交工单。联系我们时,请提供您的 IP 地址:47.245.80.60 和 Reddit 帐户。

更多

联系我们 contact @ memedata.com