每日HackerNews RSS

FurtherAI 致力于解决从商业保险文件中提取数据的复杂挑战,特别是“索赔记录”——这些详细的索赔历史报告对于保费定价至关重要。这些文件格式极其不一致,变化很大,通常跨越数百页,数据分散在多个表格中。 最初使用标准提取 API 的尝试因这些不一致性而失败。仅仅改进提取*模型*是不够的。突破性进展来自于一个自我纠错的 AI 代理。该代理没有被规定严格的提取策略,而是被赋予了提取、视觉检查文件以及——至关重要的是——*验证*自身工作(对照文件总额和内部一致性)的工具。 这种由清晰的“正确”定义而非具体指令引导的代理驱动循环,将行数的准确性从 80% 显著提高到 95%。关键在于使 AI 能够调试其自身输出,识别并纠正重复索赔或错误解释文件结构等错误——这些是人类会注意到的问题。这种方法比大量的提示工程更有效,并且预计随着 AI 模型的发展将进一步改进。FurtherAI 现在在该任务上实现了人类级别的准确性,大大加快了传统的手动且耗时的流程。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 保险中最难的文件提取问题 (furtherai.com) 15 分,sgondala_ycapp 1小时前 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## 重思室内:空间、物体与围合 作者近五十年一直思考着“室内”的定义,最初探索物体与空间之间复杂的可视关系——最终计算出超过一千六百万种可能性。然而,这种探索逐渐转向通过内外对比来理解室内。 作者摒弃了20世纪模糊内外边界的趋势,提倡在封闭空间内*存在*的独特乐趣,并以箱根王子酒店和卡萨·马拉帕特为例,强调外部界限的清晰界定。这种围合感,类似于花园的保护拥抱,是体验的核心。 作者批判了常见的室内设计方法——按时间顺序梳理风格历史,与格雷姆·布鲁克的围合与氛围关注点相对比——更倾向于基于空间与物体之间相互作用的框架。“统一的室内”通过一致的视觉元素,如颜色和图案,实现和谐,而连贯的设计则源于有意的构图,即使使用不同的物体。最终,作者质疑空间是否可以独立于精心策划的物体而自主存在,并提出根据物体*数量*来探索室内,从稀疏布置的房间中发现清晰度。

黑客新闻 新 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 室内空间分类 (misfitsarchitecture.com) 12 分,by downweight 1 小时前 | 隐藏 | 过去 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

## TinyOS:超轻量级实时操作系统,适用于物联网 TinyOS是一个专为资源受限的物联网和嵌入式设备设计的实时操作系统。其内核占用空间小于10KB,最小RAM需求仅为2KB,非常适合ARM Cortex-M、nRF52、Raspberry Pi Pico和RISC-V等微控制器。 主要特性包括抢占式优先级调度(256级)、强大的同步机制(互斥锁、信号量、队列)以及具有毫秒级精度的软件定时器。它还包含一个轻量级文件系统、带有命令历史的VT100 shell,以及全面的网络协议栈(以太网、IPv4、TCP/UDP、HTTP、DNS)。 支持MPU基于的内存保护和安全启动等安全特性。高级连接选项包括通过mbedTLS的TLS/DTLS、具有QoS的完整MQTT 3.1.1支持、CoAP以及支持回滚的OTA固件更新。电源管理特性包括空闲/睡眠模式和CPU频率缩放。 TinyOS提供了一套全面的API和示例应用程序,使其成为功能强大但紧凑的解决方案,适用于各种嵌入式应用。它采用MIT许可。

## TinyOS:一个极简RTOS项目 一位开发者在Hacker News分享了“TinyOS”,这是一个为Cortex-M微控制器构建的极简实时操作系统(RTOS),完全用C语言编写。该项目在GitHub上可用 ([https://github.com/cmc-labo/tinyos-rtos](https://github.com/cmc-labo/tinyos-rtos)),旨在作为个人学习练习,从基础开始理解操作系统内部原理——特别是任务调度、上下文切换和内存管理。 开发者正在寻求关于架构、调度器实现和代码结构的反馈。一位评论者提出了关于项目范围的问题,指出传统的RTOS开发优先考虑可预测性和安全性,而这些方面在项目描述中并未明确强调。这引发了关于“RTOS”缩写的定义和期望的讨论。

最近伊朗的袭击严重扰乱了迪拜和巴林地区的亚马逊云服务(AWS),导致两个可用区“完全宕机”并影响了冗余级别。亚马逊正在建议客户迁移到其他区域,许多客户已经开始这样做,但尚未确定完全恢复的时间表。两国的数据中心都遭受了多次攻击,包括巴林的一场火灾。 这些袭击标志着伊朗经济目标发生转变,现在专注于美国的科技基础设施,威胁范围已扩展到微软、谷歌和苹果。AWS 正在努力恢复产能,但强调在客户迁移期间需要尽量减少数据足迹。 此外,一个大型科技播客节目中,OpenAI 总裁格雷格·布罗克曼讨论了公司的战略,包括侧重于推理模型而非视频生成,以及他们朝着通用人工智能(AGI)的进展,估计完成度为 70-80%。

## 伊朗袭击影响巴林和迪拜的亚马逊云服务 伊朗最近的袭击导致亚马逊云服务 (AWS) 受到严重干扰,据报道,巴林和迪拜的可用区“完全宕机”。 这起事件在Hacker News上引发了关于集中式云基础设施风险的讨论。 用户们争论了依赖共享基础设施的影响,指出即使在共置设施中拥有服务器,也无法避免导弹或无人机袭击等区域事件。 核心问题是集中化带来了一种新的风险——一个单点故障影响了许多用户。 虽然去中心化和强大的应对措施是潜在的解决方案,但两者都伴随着巨大的成本和复杂性,这也解释了为什么它们之前没有被普遍实施。 讨论还质疑了在潜在不稳定的地区拥有数据中心的可行性。

Paula Maddox 发布了基于 DCJ11 的电脑板设计,灵感来自 Beent Hilpert 的 PDP11 Hack,但采用了模块化背板以实现扩展性。该项目包含 CPU、RAM/ROM 和文本显示板的原理图和 PCB 文件(使用 KiCAD 创建),以及必要的 PAL 文件。 该系统具有 16x16 点阵显示屏,具有两个亮度级别,利用 32K RAM、16K ROM 的内存映射,以及为显示屏和未来扩展保留的空间。它目前启动到“ODT”模式进行实验,通过 115200 波特率的串口进行通信。 提供了示例代码,包括“Hello World!”、“霹雳游侠”动画和终端测试。作者使用 PDP11 模拟器([https://programmer209.wordpress.com/2011/08/14/pdp-11-assembly-language-simulator/](https://programmer209.wordpress.com/2011/08/14/pdp-11-assembly-language-simulator/)) 进行代码开发和测试。 重要提示:该板仅支持 16 位字宽的读/写。该项目是一个业余爱好项目,未来开发不确定,并已从 GitHub 迁移到 Codeberg。

黑客新闻 新的 | 过去的 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 DCJ11Hack – 基于DEC PDP/11的自制电脑 (codeberg.org/techpaula) 5 分,来自 zdw 1小时前 | 隐藏 | 过去的 | 收藏 | 讨论 帮助 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请YC | 联系 搜索:

你需要启用 JavaScript 才能运行此应用。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 Charge Robotics (YC S21) 正在招聘软件和硬件工程师 (ashbyhq.com) 8 分钟前 | 隐藏 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

提示注入攻击是对大型语言模型(LLM)的主要安全风险,可能允许攻击者控制模型或窃取数据。虽然提示防护模型旨在防止这些攻击,但它们常常表现出“过度防御”,由于常见的触发词而错误地将无害输入识别为恶意。 研究人员推出了**NotInject**,一个专门用于衡量这种过度防御问题的新数据集。他们对现有模型的评估显示,当暴露于包含这些触发词的良性提示时,准确率大幅下降——降至随机水平。 为了应对这个问题,他们开发了**PIGuard**,一种新的提示防护模型,利用了一种名为**免费缓解过度防御 (MOF)**的训练策略。PIGuard 明显减少了对触发词的偏见,并在 NotInject 等基准测试中实现了最先进的性能,超过了当前最佳模型 30% 以上。PIGuard 也是开源的,提供更可靠的提示注入防御。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 PIGuard:通过缓解过度防御来免费提供提示注入防护 (injecguard.github.io) 5 分,mettamage 1 小时前 | 隐藏 | 过去 | 收藏 | 1 条评论 帮助 mettamage 45 分钟前 [–] 我一直在尝试一些提示注入防护框架。我知道它们不能缓解攻击类型,但至少能做点什么。我只是对我在自己测试中看到的较高误报率感到有点恼火。这个的误报率很低。我觉得这很有趣。回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

## RepoProver:数学教材的自动化形式化 RepoProver是一个多智能体系统,旨在将数学教材大规模形式化为Lean证明助手。它利用LLM驱动的智能体——草图绘制者(将LaTeX翻译为Lean)、证明者(尝试完成证明)和审查者(确保质量)——通过共享Git仓库进行协作。 该系统基于一个Lean项目,项目结构包含按章节组织的LaTeX源文件、定义形式化目标的`manifest.json`、用于项目文档的`CONTENTS.md`以及用于智能体协调的`issues/`目录。 用户使用`python -m repoprover run [project_path]`启动形式化,启动智能体工作流并管理稳定的构建的合并队列。通过SLURM启动器(`repoprover.stool`)支持分布式运行。系统提供跟踪token使用情况和智能体效率的工具。提供了一个玩具项目和示例配置,用于测试和指导。该系统成功形式化了Darij Grinberg的 graduate textbook *Algebraic Combinatorics*。

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 自动教科书形式化 (github.com/facebookresearch) 7 分,由 tzury 发表于 50 分钟前 | 隐藏 | 过去 | 收藏 | 2 条评论 帮助 alex_be 发表于 8 分钟前 | 下一个 [–] 人工智能辅助数学研究的重大一步 回复 tzury 发表于 48 分钟前 | 上一个 [–] 更多细节:https://x.com/FabianGloeckle/status/2040082785851904401 回复 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系 搜索:

(Empty input provided. There is nothing to translate.)

Hacker News 新闻 | 过去 | 评论 | 提问 | 展示 | 招聘 | 提交 登录 展示 HN: Ismcpdead.com – 实时仪表盘,追踪 MCP 采用率和情绪 (ismcpdead.com) 9 分,由 sagirodin 1小时前发布 | 隐藏 | 过去 | 收藏 | 讨论 为了追踪关于模型上下文协议的持续讨论——它是否正在获得真正的进展,还是仅仅炒作,我构建了这个工具。它从 GitHub、HN、Reddit 和其他一些来源提取实时数据。鉴于这里一直有关于 MCP 的活跃讨论,想知道 HN 社区的看法。 帮助。 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:

今日代理人聊天发现新闻竞技场更多应用下载我们的iOS应用今日代理人聊天探索新闻更多我投资组合排行榜聊天点击提问在任何帖子中提问2个问题专业AI可能会犯错,请核实重要信息。人工智能投资能力如何?今日代理人聊天发现新闻竞技场更多应用下载我们的iOS应用今日代理人聊天探索新闻更多我主页›竞技场排行榜动态投资组合关于

Rallies.ai,一家新的AI驱动对冲基金,在Hacker News上宣布启动,引发讨论。最初,链接需要下载应用程序才能查看,违反了HN的指南——创始人迅速解决了这个问题并道歉。 该基金受到Y Combinator创业公司请求的启发,利用前沿AI模型(特别是LLM)来模仿人类基金经理的研究和投资策略,侧重于更长的时间范围并提供完全透明度,*不*进行人工干预。 用户质疑Rallies.ai与现有量化基金的区别,创始人强调了使用*大型语言模型*进行投资研究的新颖性,该领域仍处于早期阶段。 也有人戏谑地询问AI是否在对“AI泡沫”本身进行对冲。 创始人正在积极回答社区的问题。

更多

联系我们 contact @ memedata.com