## “劣质内容”的兴起与对软件工艺的呼唤 人工智能内容(“劣质内容”)在音频、视频和文本领域的快速传播,凸显了一个令人担忧的趋势:效率优先,而牺牲了真正的质量。这与雅克·埃吕尔的“技术”概念相符,在“技术”中,一切都针对可衡量的结果(如参与度和收入)进行优化,从而侵蚀了工艺、美感和人类意图。 这种“技术”在Spotify等平台中显而易见,这些平台优先考虑算法流行度而非艺术价值,与Bandcamp对精选独立音乐的支持形成对比。人工智能在这种以指标为导向的环境中蓬勃发展,大规模生产“足够好”的内容。然而,这会对重视真正技能的领域(如软件工程)构成威胁。 虽然人工智能可以加速低质量代码的生成——类似于在大科技公司中常见的“管道”,但它无法解决核心问题:熟练工程师和深思熟虑的设计减少。作者倡导复兴软件工艺,并将之与艺术与手工艺运动对工业化的回应相提并论。通过探索被遗忘的方法,并优先考虑人类规模的实验性项目,我们可以重拾质量和创造力,甚至可能使真正的工艺随着主流软件的退化而*更*具价值。

黑客新闻新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交登录 AI 代码和软件工艺 (alexwennerberg.com) 8 分,由 alexwennerberg 1小时前发布 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

联邦上诉法院最近驳回了司法部试图为五名参与明尼苏达州圣保罗城市教会抗议活动的人员获得逮捕令的请求。1月18日的抗议活动打断了一场礼拜,起因是有人指控一位教会牧师同时担任移民及海关执法局外地办事处主任。 三名组织者最初被捕,司法部寻求对另外五人发出逮捕令,理由是需要阻止类似的宗教服务中断行为。然而,一名地方法官和首席地区法官帕特里克·希尔茨拒绝了这一请求,理由是没有足够的可能原因——这五名个人据称对会众大喊大叫,但没有实施暴力行为。 希尔茨法官批评司法部的请求不寻常,并建议通过大陪审团来处理此案。司法部试图逮捕的人中包括前CNN记者唐·莱蒙,他直播了抗议活动;他的律师辩称,他的行为受到第一修正案的保护。司法部尚未对这一裁决发表评论。

我已离开X(前身为Twitter),原因是其环境日益恶化,并且我会忽略或要求以其他方式分享发送给我的任何链接。这不是为了影响X的财务状况而发起的抵制——它的资源过于庞大——而是我个人决定脱离一个积极损害公共讨论的平台。 X的算法优先考虑愤怒和虚假信息,并通过其所有者推广极端观点和干预民主进程(如英国选举)而得到放大。该平台甚至助长了令人不安的滥用行为,包括AI生成的非自愿图像。 仅仅避免参与是不够的;即使*浏览*内容也会使该平台合法化。我选择转向Mastodon和Bluesky等替代平台,希望其他人也能加入我,不是为了“击败”X,而是为了在其他地方培养真正的对话。该平台已经从根本上受到损害,类似于一个有害意识形态不仅被容忍,而且被积极推广的空间,使得有意义的对话变得不可能。我哀悼最初的Twitter的逝去,但认识到当前的迭代已经无法修复。

一场 Hacker News 的讨论围绕着用户在埃隆·马斯克收购后是否离开或继续留在 Twitter 的决定。 许多用户报告已经离开,删除了他们的内容并迁移到 Mastodon 等平台,认为体验良好。 然而,其他用户表示难以离开,因为他们关注着特定的内容创作者——特别是像偶像、艺术家甚至日本政府机构这样的日本账号,这些账号主要使用 Twitter。 一个反复出现的主题是,对支持现在与争议人物相关的平台存在伦理担忧,一位评论员将其比作支持一个有问题的事业。 此外,人们对 Bluesky 等替代平台持怀疑态度,并预测它们最终将屈服于与其他社交媒体相同的问题,即负面情绪和滥用。 争论涉及持续寻找新平台是否值得,考虑到网络恶化的周期性。

## Windows 衰落的现状 时隔三年,对Windows的深入观察揭示了一个令人担忧的趋势:质量下降和优先级转变。虽然微软大力投资人工智能,特别是Copilot,但核心Windows体验却受到bug、臃肿软件和30多年积累的技术债务的困扰。 最近的更新,例如2026年1月发布版,引入了严重问题——电脑无法关机、Outlook在使用PST文件时崩溃,需要紧急补丁修复。除此之外,持续出现问题,例如任务管理器无响应、RDP连接失败和DRM视频问题。 Windows本身变得越来越臃肿,即使是像资源管理器这样基本组件,也因新功能和特别是与每个补丁捆绑的人工智能模型更新而不堪重负。微软将Copilot集成到各处——Edge、Notepad、设置,甚至Paint——进一步加剧了这一问题,常常以牺牲稳定、离线体验和用户选择(本地帐户选项正在减少)为代价。 虽然人工智能具有潜力,但微软的重点似乎方向错误。Windows Recall灾难性的发布,一项涉及隐私的“摄影记忆”功能,就是一个例子。最终,Windows感觉像一个建立在不稳定的基础之上、雄心勃勃的人工智能平台,优先考虑创新而非可靠性和用户体验。

最近的Hacker News讨论集中在Windows 11的状态,总体情绪偏负面。许多评论者认为Windows 11是一个“灾难”,觉得它过于复杂,没有优先考虑用户需求,甚至有人更喜欢Windows 95的简洁性。 虽然承认Hacker News可能是一个回音室,但有几位用户报告说,在技术社区之外,甚至在非技术用户中,也存在类似的沮丧感。一个主要抱怨是微软缓慢且不完整的从旧控制面板过渡,新的设置菜单缺乏关键功能。 人们渴望一个更简单、更一致的操作系统,但普遍感觉微软没有优先考虑这些改进,而是专注于侵入性功能。尽管有批评,评论员指出用户可能会继续使用Windows,因为缺乏替代方案,这减少了微软改变的压力。

## 特赦与重建:1月6日事件后的生活 在特朗普总统赦免大约1600名与1月6日国会山事件相关人员一年后,《大纪元时报》采访了五名前囚犯,揭示了一个超越新闻头条的复杂现实。虽然他们感谢自己的自由,但许多人发现赦免并非万全之策,仍然面临排斥和经济困难。 这五个人都表示,他们受到了不公正的起诉,并为自己的行为感到自豪,认为他们是在捍卫选举公正和美国价值观。他们的故事突出了一种被误解的感觉,声称主流媒体忽视了他们的观点。 像丹·莱登这样的人,面临着毁灭性的个人损失——妻子的去世和失去的职业——以及法律后果。另一些人,如亚历山大·谢泼德,尽管已经获释,但仍然难以摆脱挥之不去的社会评判。保罗·霍奇金斯是第一个被判刑的人,他正在重建自己的生活,但认为赦免承认了一件本不应该发生的事情。莎拉·卡彭特是一位退休警察,她认为赦免证实了她没有犯下的罪行,而罗伯特·莫斯,因查获的证据而被戏称为“乐高人”,正在将他的经历投入到一家电影制作公司和重燃的信仰中。 这些人共同的愿望是寻求真相和问责制,他们相信1月6日事件的完整故事仍然没有被讲述。

伊朗国家媒体正在大力强调明尼阿波利斯在最近移民局枪击事件后的骚乱,将之与伊朗国内的抗议活动相提并论,并指责特朗普政府虚伪。他们指出特朗普过去呼吁伊朗人起来反抗他们的政府,同时又以武力回应美国的示威活动。 受国家支持的Press TV将明尼阿波利斯抗议活动定义为“报应”,并强调美国对警察暴力的愤怒,甚至暗示可能爆发内战。伊朗媒体正在分享枪击事件的视频,声称受害者没有构成威胁。 这种信息传递旨在抹黑美国对伊朗处理自身抗议活动的批评——这些抗议活动是由经济困难和制裁引发的——并指控外国干涉(特别是来自美国和以色列)在那些早期的示威活动中。伊朗官员声称他们的抗议活动被“劫持”,并涉及武装暴动,以此反驳西方关于对无武装平民过度使用武力的指控。他们还批评西方媒体过度简化复杂的政治局势。

参议员泰德·克鲁兹(德克萨斯州共和党)2025年与捐助者会晤的录音显示,共和党内部就特朗普总统的政策存在重大分歧。克鲁兹公开批评特朗普的关税计划,警告称这可能会摧毁经济并导致选举失败,并回忆起与总统之间充满咒骂的激烈电话。 他还强烈反对副总统JD Vance和塔克·卡尔森的影响力,指责他们推行孤立主义外交政策,并试图在关键职位上安插对以色列不友好的个人。克鲁兹具体指责他们导致了一位支持对伊朗采取行动的前国家安全顾问被撤职。 尽管发言人声称与特朗普结盟,但录音描绘了一幅内部冲突的画面,克鲁兹积极“对抗”白宫在贸易协议上的决策,并驳斥特朗普对其关税政策的称呼不当。这些录音凸显了该党在贸易、外交政策以及特朗普政府发展方向上的深刻分歧。

## Ourguide:适用于任何任务的屏幕指导 Ourguide 是一款 macOS 应用程序,旨在**在您的屏幕上提供逐步、实时的指导**,无需在应用程序之间不断切换或暂停教程。只需输入您需要帮助的内容,Ourguide 就会突出显示在*任何*应用程序中需要点击的位置。 一个关键功能是**提问模式**,它允许用户提问并获得即时、上下文相关的答案,无需截图或复制粘贴——它“看到”您正在处理的内容。 Ourguide 受到各行各业专业人士(设计、营销、教育)的信赖,可以简化工作流程,**缩短培训时间**,并提高生产力。用户报告在使用新软件和完成复杂任务方面有了显著改进。 目前适用于 macOS,Ourguide 旨在成为您整个桌面的通用助手,提供更直观、更高效的学习和工作方式。

## Ourguide:屏幕任务指导 Eshaangulati 正在推出 Ourguide,这是一款全操作系统应用程序,旨在通过分步视觉指导帮助用户完成计算机任务。由于对使用聊天机器人寻求帮助的反复沟通感到沮丧,Ourguide 提供了两种模式:**指导模式**直接在屏幕上突出显示下一个要点击的元素,而 **提问模式**则提供一个视觉集成的聊天,理解屏幕上下文以解答具体问题。 开发者最初探索了一个复杂的计算机视觉/VLM 流程,以准确识别 UI 元素,但由于性能问题,改为了更简单、更快速的实现方案(<1s 延迟)。这源于当前 AI 代理可靠“观察”和与界面交互的局限性。 Ourguide 不会*自动*点击,而是*显示*点击位置,让用户保持控制以避免错误。它已被证明对复杂的任务(如 AWS 配置)甚至日常应用程序(如 Spotify)都有用。 Ourguide 可在 [https://ourguide.ai/downloads](https://ourguide.ai/downloads) 下载,创作者正在积极寻求反馈以改进该工具。

请启用 JavaScript 并禁用任何广告拦截器。

最近一篇《华尔街日报》的文章(提供礼品链接)讨论了WD-40公司严密保守的配方以及知晓该配方的小组人员。获取配方需要公司的高级职位,以及严格的保密协议和安全措施。 Hacker News的讨论迅速转向了是否可以使用现代分析化学技术,如气相色谱-质谱联用(GC-MS)和核磁共振(NMR)来逆向工程该配方。一些评论员指出,最近通过类似方法成功重现了可口可乐的配方,暗示破解WD-40并非不可能。然而,复制精确的混合物非常复杂,重现具有相似物理性质的物质可能更实用。 一个关键点是,WD-40在技术上是润滑剂、防锈剂、渗透剂和排水剂的组合——尽管它不一定是许多应用中*最佳*的润滑剂,会留下不适合长期减少摩擦的残留物。有人甚至指出它对杀虫也很有效!

## 低代码平台面临的迫在眉睫的威胁 尽管预计到2028年市场规模将达到500亿美元,但人工智能驱动的编码工具的兴起对低代码平台构成了重大的生存威胁。这些平台之所以流行,是因为它们能够让非技术用户构建软件,从而减少开发人员的工作量并加速交付。然而,随着人工智能极大地降低了*直接*代码开发的成本和复杂性,其核心价值主张正在转变。 过去,低代码通过简化开发和赋能公民开发者来证明其成本的合理性。现在,人工智能允许开发人员更快地构建解决方案,通常*无需*外部平台的额外复杂性和厂商锁定。像Cloud Capital这样的公司已经开始迁移离开低代码,发现人工智能驱动的开发效率更高、更易于维护,并且与现有工作流程集成。 虽然低代码供应商正在通过人工智能集成进行调整,但他们是否能够与使用人工智能工具直接构建的速度和灵活性竞争还有待观察。现在,根本问题归结为简单的“构建 vs. 购买”——对于许多人来说,利用人工智能重新掌控他们的工具,证明是更有价值的途径,在速度、成本节约和开发人员体验方面都带来了收益。

## 低代码的终结?Hacker News 讨论 Hacker News 上一篇帖子引发了关于低代码开发平台未来的争论。作者预测低代码将会衰落,理由是人工智能现在提供了低代码的速度,*但没有*其局限性。许多评论者同意,低代码的僵化——即使是微小的元素也难以定制——是人工智能可以克服的关键弱点。 然而,一个强烈的反驳观点出现了:低代码不会消失,而是可能会*与*人工智能驱动的工具*融合*。对于理解和操作用户界面和数据,视觉界面的价值仍然显著,尤其对于非技术用户而言。其他人指出,大型组织需要处理部署、合规性和维护的平台——这些是人工智能目前无法企及的领域。 这场讨论突出了低代码的多样化应用,从简单的数据管理到复杂的企业集成。虽然人工智能降低了*编写*代码的门槛,但运行和维护代码仍然是一个挑战。最终,这场对话表明人工智能可能会改变低代码的*使用方式*,可能使其专注于长期维护和运营负担,而不是初始开发。

这篇报道指控一场旨在破坏美国稳定的协调行动,由总部位于上海的富裕美国人内维尔·罗伊·辛格姆领导——他致力于“瓦解资本主义”,并由中国共产党(CCP)资助。辛格姆据称资助了各种左翼团体,这些团体自2020年以来一直负责抗议活动,包括最近反对ICE的示威。 作者将焦点放在明尼阿波利斯,声称明尼苏达州民主党人积极反对ICE,因为该机构驱逐潜在选民。州长蒂姆·沃尔兹频繁接受中共资助的中国之旅,以及他的助手阿曼达·诺埃尔·科勒参与运营一个名为“MN ICE-Watch”的加密Signal聊天网络,用于组织暴动,被认为是共谋的证据。该州发生的一起大规模索马里社会服务欺诈丑闻,据称将资金输送给民主党,也被强调为一种转移视线的手段。 作者认为,最终目标是选举民主党控制的国会,吸纳新州以巩固参议院的控制权,并通过财富再分配和增加移民,从根本上将美国重塑为受中共影响的国家。作者建议联邦政府进行干预,可能授权明尼阿波利斯警察作为联邦法警,并查封资助组织的资产,以平息骚乱。

## ChatGPT 代码解释器获得重大升级 ChatGPT 的“高级数据分析”功能(前身为代码解释器)获得了一次重要的、未公开的升级,极大地扩展了其编码和数据处理能力。现在,除了 Python 之外,ChatGPT 还可以直接执行 **Bash、Node.js (JavaScript) 甚至 Ruby、Perl 和 Java** 等语言的代码。 一个关键的补充是 **`container.download` 工具**,它允许 ChatGPT 从公开可访问的 URL 获取文件并在其沙盒环境中保存。虽然容器仍然缺乏直接的互联网访问权限,但现在可以通过自定义代理使用 **`pip` 和 `npm`** 安装软件包。 这次升级是通过实验发现的,揭示了启用软件包安装的代理系统 (`applied-caas-gateway1.internal.api.openai.org`) 的细节。安全测试表明,`container.download` 工具目前可以防止提示注入攻击,要求 URL 要么由用户直接输入,要么来自安全搜索结果。 这些增强功能使 ChatGPT 能够分析来自网络的数据,利用更广泛的编程语言,并利用外部软件包——使其成为一个更加通用的编码和数据分析工具。然而,作者敦促 OpenAI 为这些新功能提供官方文档,目前这些功能被称为“ChatGPT 容器”。

## ChatGPT 更新与开发者讨论 ChatGPT 的最新更新允许容器运行 bash,安装软件包 (pip/npm),并下载文件,引发了关于软件开发未来的讨论。一个关键主题是向“本地”工具调用的转变,可能绕过沙箱限制并实现更强大的功能。 评论员推测 ChatGPT 生成的单次使用、按需应用程序将会兴起,以及像 Go 这样的编译型语言可能会回归。 观点是,随着 LLM 成为主要的编码者,动态语言(Python、JavaScript)的优势会减弱,因为 LLM 可以在拥有足够训练数据的情况下处理编译型语言。 目前这种转变是否现实存在争议,但可移植二进制文件的便利性很有吸引力。 同时也提出了对易于携带的恶意软件的担忧。 值得注意的是,标准 ChatGPT 现在也支持在包括 Java、Ruby 等多种语言中执行代码,尽管这些更新尚未正式公布。

## 跑道工程:远不止表面看起来那么简单 2025年9月发生的几次跑道超跑事件凸显了这些看似简单的路面背后至关重要的工程技术。跑道不仅仅是飞机使用的道路;它们经过独特设计,能够承受重达一百万磅、时速180英里的飞机——这与高速公路车辆大相径庭。 跑道长度是一个关键考量因素,需要在容纳大型飞机、成本和土地可用性之间取得平衡。温度、海拔和坡度等因素也会影响所需的长度。方向也至关重要,理想情况下应面向迎风方向,这通常需要在大型机场建设多个跑道。 除了长度和方向,跑道表面还经过工程设计以提供摩擦力,利用凹槽和横坡来防止水滑。路面本身是一个分层系统——从基层到面层——使用沥青或混凝土等材料,这些材料的选择基于强度、寿命和成本。 跑道还包含安全功能,如移位起飞点和工程材料阻arrest系统(EMAS)——可破碎的材料,可安全地阻止超速飞机——这表明航空业致力于从过去的事件中吸取教训并不断提高安全性。这是一项复杂且昂贵的工程,但对于确保安全航空旅行至关重要。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 跑道的隐藏工程 (practical.engineering) 18 分,由 crescit_eundo 1小时前发布 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 维塔利克·布特林倡导数字自我主权 以太坊联合创始人维塔利克·布特林正在积极转向更注重隐私的数字生活,目标是到2026年“夺回在计算自我主权方面失去的阵地”。他已经做出了重大改变,基本上放弃了中心化平台,转而使用开源和去中心化替代方案。 2025年,他开始使用Fileverse存储文档(一种注重隐私的Google Docs替代品),并使用Signal进行消息传递,理由是其强大的端到端加密。他的2026年计划包括使用OpenStreetMap/OrganicMaps代替Google Maps,以及使用Proton Mail代替Gmail,同时优先考虑去中心化社交媒体。 布特林还在探索本地运行AI模型,他认为随着硬件能力的提高,将数据发送到第三方服务是不必要的。这与隐私倡导者如Naomi Brockwell的观点一致,后者强调本地AI是最私人的选择。 此举反映了人们对数据隐私和政府/企业监控日益增长的担忧,尤其是在欧盟“聊天控制”等提案出台后,并强调了夺回个人数据控制权的重要性。

## 有序抖动:摘要 本文解释了有序抖动,这是一种使用黑白像素模拟灰度的方法。它通过使用“阈值图”——一个包含不同阈值的网格来实现。每个像素的颜色由将其灰度值与图中相应阈值进行比较来确定。 本质上,该图将灰度转换为特定的黑白图案,从而模仿原始图像的亮度。简单地平铺该图会产生可见的伪影,因此重新排列阈值至关重要。 流行的贝耶矩阵以交叉网格模式排列阈值,分散像素以获得更平滑的外观。增加图的大小(例如,从 2x2 到 4x4 或 8x8)会增加图案的数量,从而提高灰度表示的平滑度。 除了贝耶矩阵之外,其他排列方式(如簇点和空隙与簇)会产生不同的视觉纹理,类似于印刷报纸或提供更自然的混合效果。阈值在图中的排列决定了最终的抖动图案。下一部分将探讨误差扩散,这是一种*没有*阈值图的抖动方法。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 抖动 – 第二部分:有序抖动 (visualrambling.space) 24 分,ChrisArchitect 1 小时前 | 隐藏 | 过去的 | 收藏 | 4 条评论 jonahx 1 分钟前 | 下一个 [–] 这真是很好的作品,其他的文章也是。如果作者路过,我想了解一下使用的技术。回复 subprotocol 2 分钟前 | 上一个 | 下一个 [–] 在 Chrome 中显示“正在加载资源,请稍候...”并卡住。但它在 Firefox 中对我有效。回复 ChrisArchitect 1 小时前 | 上一个 | 下一个 [–] 相关: 抖动 - 第一部分 https://news.ycombinator.com/item?id=45750954 回复 csressel 53 分钟前 | 上一个 [–] 第一篇文章很棒,这个应该很有趣!回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

这个故事讲述了与同事“迈克”的一次令人沮丧的经历:他提交了一个大型、未经测试的AI生成代码的合并请求,并催促立即批准。作者认为问题不在于迈克使用了AI,而在于导致不负责任实施的系统性压力。 文章的核心是呼吁对AI生成代码的*负责*。作者希望能够询问迈克他的流程——使用的提示词、代码审查情况以及决策依据。他们提倡在AI使用方面保持透明,在合并请求中披露提示词和审查摘要。 作者将“AI懒散堆积”(AI Lazyslop)定义为未经创建者阅读的AI生成代码,将审查负担转嫁给他人。他们提出了一份个人宣言:对所有代码负责,披露AI的使用,证明已进行审查和测试,并能够独立解释逻辑。 最终,迈克转向了一种“半懒散堆积”的方法,将审查者的评论*反馈*给AI。作者得出结论,这种情况可能很普遍,强调了一种文化转变,需要制定与AI在软件开发中互动的新的行为准则。

## AI、懒惰和代码审查 – Hacker News 讨论 最近 Hacker News 上的一场讨论,由 [danielsada.tech](https://danielsada.tech) 引起,围绕着人工智能如何加剧软件开发中现有的问题,特别是关于代码质量和审查流程。核心问题并非人工智能带来的*新*问题;一位开发者(“Mike”)反复提交大型、测试不足的 PR,试图通过将更改偷偷纳入已批准的请求来绕过彻底审查。 然而,像 LLM 这样的人工智能工具会放大这种行为,使开发者能够生成更多的代码,增加有问题 PR 的频率和数量。审查者现在面临更繁重的工作量,需要区分合法的贡献和“懒散地堆砌”的人工智能生成代码。 评论者指出,根本原因并非人工智能本身,而是系统性问题:缺乏对细致工作的奖励、快速交付的压力以及不充分的流程。一些人建议直接拒绝过大的 PR,而另一些人则指出需要明确的人工智能使用政策(例如 LLVM 的)。一个反复出现的主题是理解人工智能生成代码背后的*推理*——促进透明度——以及管理层可能将速度置于质量之上,最终在出现问题时责怪审查者。

## OpenFlexure显微镜:可访问且可定制的显微镜 OpenFlexure显微镜是一款革命性的开源显微镜,旨在实现可访问性和定制化。它使用现成的低成本组件(如网络摄像头或标准显微镜物镜和树莓派)构建,却能提供令人惊讶的高性能。 其关键创新在于一个3D打印的载物台,利用“柔性铰链”——塑料组件,实现无摩擦、无振动且极其精确的运动(精度可达小于100纳米的步长)。这种设计最大限度地减少了组装和对非打印部件的依赖,从而最大限度地提高稳定性。 除了经济实惠(主要成本在于树莓派和摄像头),OpenFlexure显微镜还具有高度适应性。用户可以轻松更换光学器件以获得不同的放大倍数,甚至可以添加打印的滤光块来实现诸如荧光成像等高级技术。详细的文档和学术出版物可供使用,使高质量的显微镜技术能够惠及更广泛的用户和应用。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 工作 | 提交 登录 OpenFlexure 显微镜 (openflexure.org) 8 分,来自 o4c 1小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 gnabgib 1小时前 [–] 热门于: 2024 (189 分,20 评论) https://news.ycombinator.com/item?id=42115243 2021 (113 分,39 评论) https://news.ycombinator.com/item?id=27216452 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

← 返回游戏 🤖 TETRISBENCH AI模型俄罗斯方块性能对比 — 总游戏数 — 测试模型 🤖 模型对战 模型 加载基准数据… 暂无基准数据。运行一些AI对战游戏! W - L - D 胜利 - 失败 - 平局 🏆 查看排行榜 ▶ 玩俄罗斯方块对战

## Gemini Flash 在俄罗斯方块对战中对 Opus 胜率为 66% 一个名为 TetrisBench (tetrisbench.com) 的新项目,让大型语言模型 (LLM) 与人类玩家在俄罗斯方块游戏中对战。Gemini Flash 对 Opus 模型的胜率为 66%(具体对 Opus 为 80%),在五种测试模型中取平均值。 一位技术娴熟的人类玩家的早期反馈指出了改进的领域,包括方块随机化系统(建议使用“7-bag”方法)和方块旋转机制,感觉存在偏差。该玩家还指出,顺时针/逆时针旋转以及可重新映射的按键对于自然的游玩体验至关重要。 评论员讨论了 Gemini 3 Flash 令人感兴趣的性价比,并指出了使用 LLM 执行游戏等任务的固有局限性——LLM *构建* 一个俄罗斯方块机器人可能远胜于直接玩游戏。有人建议将 LLM 构建的国际象棋引擎与 Stockfish 等成熟程序进行比较,作为更相关的测试。

## 针对移民局官员的危险言论 乔纳森·图利的文章强调了一种令人担忧的趋势,即民主党政客煽动反移民局言论,可能煽动针对联邦执法人员的暴力行为。这场争议源于明尼苏达州州长蒂姆·沃尔兹以及亚利桑那州司法部长克里斯·梅耶斯发表的评论,梅耶斯更明确地质疑移民局官员是否为“真正的执法人员”。 梅耶斯进一步表示,亚利桑那州的“正当防卫”法可能为对便衣移民局官员使用致命武力提供理由,图利认为这种说法鲁莽且在法律上具有误导性。他指出该法律包含抵抗合法逮捕的例外情况,并且联邦官员并非免于起诉,但各州的尝试很可能被推翻。 这种言论与针对移民局官员袭击事件的增加同时发生,包括最近一起一名官员手指被咬断的事件。图利认为,像沃尔兹和梅耶斯这样的政客正在将政治利益置于公共安全之上,故意散布虚假信息并鼓励对抗,即使对最近的枪击事件(如亚历克斯·普雷蒂案)的调查仍在进行中且尚未完成。他警告说,这不是捍卫民主,而是拥抱“暴民统治”。

该网站正在使用安全服务来保护自身免受在线攻击。您刚才的操作触发了安全解决方案。 提交特定词语或短语、SQL命令或格式错误的数据等行为可能会触发此阻止。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 当AI“构建浏览器”时,先检查仓库再相信炒作 (theregister.com) 23点 由 CrankyBear 39分钟前 | 隐藏 | 过去 | 收藏 | 讨论 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## Workday年龄歧视诉讼 – 摘要 本通知涉及一起诉讼(Mobley v. Workday, Inc., 案件编号:3:23-0770-RFL),指控Workday, Inc.在其招聘平台中使用人工智能进行年龄歧视。诉讼声称Workday的人工智能可能不公平地筛选掉40岁及以上的申请人,违反了1967年就业年龄歧视法(ADEA)。 **受影响者:** 在2020年9月24日至现在期间,使用Workday平台申请过工作且年龄在40岁或以上的个人可能有资格加入诉讼。 **加入诉讼会怎样?** 您将由原告律师代表(除非案件胜诉,否则您无需支付任何费用),并受任何法院判决的约束。您可能需要提供与您的申请相关的信息。加入诉讼*不会*阻止您自行提起单独诉讼。 **如何加入:** 请在**2026年3月7日**之前完成并提交在线“加入诉讼同意书”。 纸质副本可通过提供的链接或联系原告律师获得。 **重要提示:** 法院尚未确定案件的案情,加入诉讼并不能保证成功。Workday否认这些指控。

已对Workday提起集体诉讼,指控其招聘平台存在年龄歧视。诉讼详情见workdaycase.com,声称Workday的人工智能算法可能正在降低40岁及以上申请人的排名,违反《就业年龄歧视法案》(ADEA)。 初步认证的集体诉讼对象包括2020年9月24日至现在通过Workday申请工作且因人工智能驱动的评分、排名或筛选而未被推荐录用的40岁以上人士。这包括那些被自动拒绝或其较低分数被告知雇主的人。 此案引发了关于人工智能驱动歧视责任的问题,以及Workday是否能够为自己辩护,抵御像ADEA这样已建立的法律。 结果可能对人工智能在招聘实践中的使用产生重大影响。

这项研究分析了所有960种Chess960开局的复杂性,揭示了战略深度和公平性的显著差异。利用Stockfish评估和一种新的信息度量(S(n)),研究表明在所有开局中,白方都存在稳定的先手优势(平均+0.30个兵)。 然而,这种优势的*难度*各不相同。总开局复杂性(S<sub>tot</sub>)在不同开局之间存在三倍差异,并且一种“决策不对称”度量(A)表明某些开局对黑方有利,迫使白方做出更艰难的选择。而标准国际象棋表现出典型的复杂性,但倾向于给白方带来略微困难的开局。 最复杂的开局是#226位置,而#198位置是最平衡的。研究结果表明,即使是对初始棋子布局的微小改变也会对战略博弈产生巨大影响,并且令人惊讶的是,与更广泛的Chess960格局相比,传统的国际象棋开局并非特别平衡。

一篇最近的arXiv论文探讨了国际象棋960(费舍尔随机象棋)中不同开局位置的复杂性。Hacker News的讨论强调,并非所有国际象棋960的布局都同样平衡;经典的布局往往对白方有利,因为其自然发展和对中心的控制。 一位评论员指出,这支持了从优势局面获胜是游戏中最具挑战性的部分这一观点。他们建议从国际象棋960中移除王车易位可能会改善平衡,但可能会潜在地恶化黑方的局面。 讨论还链接到之前Hacker News关于策略在完美博弈在计算上不可行时的博弈论影响的帖子。本质上,对话的中心在于在国际象棋960的变体中寻找最佳平衡和复杂性。

沙特阿美CEO Amin Nasser表示,近期对石油供应过剩的预测可能被夸大了。尽管分析师预测由于预期供应过剩,到2026年油价将跌至每桶60美元以下,但Nasser指出,目前全球石油库存较低,且剩余产能正在减少(目前为2.5%,需要至少3%)。他指出,漂浮储存的大部分石油是受制裁的产品,不易进入市场。 国际能源署(IEA)承认存在供应过剩——这体现在价格下跌上——但他们*上调*了2026年石油需求增长预测至每天93万桶,理由是石化原料需求复苏和经济状况改善。OPEC也持乐观观点,预计由于强劲的需求,市场将保持平衡。不同的观点凸显了对石油市场真实状况的争论:供应过剩与产能受限和需求上升。

根据俄罗斯外交部长谢尔盖·拉夫罗夫的说法,欧洲国家——特别是代表欧盟的英国——正在积极破坏唐纳德·特朗普先前支持的乌克兰和平计划。该计划最初在安克雷奇讨论,涉及与乌克兰的安全保障停火,但俄罗斯担心这只是一个建立永久西方军事存在并继续向乌克兰提供武器的幌子,从而有效地对俄罗斯构成威胁。 拉夫罗夫指责欧洲国家的目标是维护现有的乌克兰政权,并阻止承认俄罗斯的领土收益。他们据称正试图说服特朗普向俄罗斯施压,使其接受这一结果。俄罗斯认为这是一个零和博弈,旨在削弱其战略地位。 尽管担心美国可能试图中和其核能力,但俄罗斯仍然坚决拒绝让步。拉夫罗夫的批评集中在欧洲的行动上,刻意避免直接谴责特朗普,可能是为了避免局势升级并可能危及未来的谈判。然而,俄罗斯明显对特朗普对欧洲干涉的沉默感到不满。

美国财政部最近拍卖了690亿美元的两年期国债,表现异常强劲,尽管市场预计美联储可能会采取鹰派立场,但需求依然强劲。最高收益率3.580%略高于12月,但此次拍卖“穿过”市场预期幅度很大——自8月以来最大的一次。 关键指标显示投资者需求旺盛:投标覆盖率跃升至2024年11月以来的高点,间接竞标者(外国央行)占据了创纪录的份额。交易商的分配极少,表明一级市场需求强劲。 瑞银分析师认为,在拍卖之前两年期国债被低估了,市场对结果反应积极,表明尽管即将出台美联储政策决定,但仍充满信心。总体而言,此次拍卖的成功表明美国债务需求健康。

埃贡·冯·格雷尔茨认为,贵金属市场,特别是白银,已经进入一个新时代,其驱动力是一种根本性的不平衡:不断飙升的实物需求远远超过有限的供应。与过去由投机推动的价格上涨(如70年代的亨特兄弟)不同,当前试图通过纸质合约压低白银价格的努力正在失败。 多年的供应缺口,加上太阳能、电动汽车和国防等行业工业需求的快速增长,造成了真正的实物短缺。实物需求现在占产量的50%,而去年仅为10%。这种向实物市场的转变意味着价格将由稀缺性决定,而非操纵。 冯·格雷尔茨预测价格将大幅上涨,白银有可能达到666美元(基于历史上的15:1金银比率和预计的10,000美元金价)。他强烈建议投资者购买*实物*白银并将其存储在银行系统之外,将其视为一种保值手段,以应对即将到来的经济崩溃和货币贬值,而不是投机性投资。他预计当前纸质市场体系将出现故障,可能会影响伦敦或Comex。

您的请求已被阻止,原因是网络策略。请登录或在此处创建帐户以恢复浏览。如果您正在运行脚本或应用程序,请在此处注册或使用您的开发者凭据登录。此外,请确保您的User-Agent不为空,并且是独特且具有描述性的,然后重试。如果您正在提供替代的User-Agent字符串,请尝试改回默认设置,因为这有时会导致阻止。您可以在此处阅读Reddit的服务条款。如果您认为我们错误地阻止了您,或者想讨论更轻松地获取所需数据的方式,请在此处提交工单。联系我们时,请提供您的Reddit帐户以及以下代码:019bfb9a-c016-7a33-ab73-35370f992e75。

最近的算法更新大幅降低了Google图书搜索结果的质量,导致用户认为这项服务实际上已经“失效”。用户报告称,从1月21日左右开始,搜索结果从有用的全文搜索转向,尤其是在受版权保护的书籍方面。 猜测范围从Google主动阻止抓取,到优先考虑昂贵的AI向量搜索而非传统的文本索引。一些人认为这种改变可能是故意的,以缓解竞争激烈的AI领域的压力。 有人提到了Library Genesis、Anna's Archive和Sci-Hub等替代方案,但指出它们缺乏全文搜索功能,并且面临持续的法律/安全威胁。一个主要担忧是,缺乏强大的搜索功能使得发现*新的*参考文献变得困难,从而促使人们建议构建本地索引。

人工智能代码审查领域正在蓬勃发展,众多参与者涌入市场——从OpenAI和Anthropic等科技巨头到Greptile等专业初创公司。虽然许多公司声称具有卓越的漏洞检测能力,但作者(来自Greptile)认为性能是主观的,最终需要个人测试。 Greptile的差异化之处不在于立竿见影的性能声明,而在于以**独立性、自主性和反馈循环**为中心的长期愿景。他们认为代码*审查*代理应与代码*生成*代理分离——避免利益冲突——并专注于构建实现代码验证(审查、测试、质量保证)的*完全自动化*。 与构建用于辅助人类审查的AI*工具*的竞争对手不同,Greptile设想一个尽可能减少人工干预的未来,作为一种“后台自动化”或“管道”产品。他们已经采取了诸如Claude Code插件等集成措施,从而建立了一个编码代理解决审查反馈的循环,直到自动批准。 选择代码审查工具是一个长期的决定,Greptile旨在为用户准备一个AI处理大部分代码验证的未来,使人类工程师能够专注于创新和高级设计。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 工作 | 提交 登录 存在一个AI代码审查泡沫 (greptile.com) 12 分,由 dakshgupta 1小时前 | 隐藏 | 过去的 | 收藏 | 1 条评论 personjerry 12分钟前 [–] 我不太理解这如何与竞争对手区分开来。> 独立性 任何在代码审查而非代码生成上运行的“代理”都是“独立的”?> 自主性 大多数其他代码审查工具也可以自动化并集成。> 循环 你也可以ping其他代码审查工具以获取更多审查… 我觉得这篇文章实际上适得其反,提出了问题但没有充分解决它们。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

禁止 您没有权限访问此资源。 此外,在尝试使用ErrorDocument处理请求时,遇到了403禁止错误。

英国上议院最近投票禁止儿童使用互联网VPN,引发了在线讨论。核心关切是儿童安全,但许多Hacker News的评论员对此表示怀疑。 多位用户认为,这项禁令效果不佳,因为儿童会简单地找到其他方法绕过限制——将其比作在高速公路上禁止使用滑板车。一个关键点是,这项法律很可能旨在识别*成人* VPN用户,可能预示着更强的监控。 评论员们对政府过度干预表示担忧,将其与极权政权相提并论,并提及过去削弱加密技术的尝试。这场讨论凸显了人们认为,保护儿童的既定目标与隐私和自由的潜在后果之间存在脱节。 之前关于同一主题的讨论也被链接在内。
联系我们 contact @ memedata.com