## Reducto 发布 Deep Extract,实现高度精确的文档提取 Reducto 发布了 **Deep Extract**,这是一款全新的基于代理的系统,旨在大幅提高从长篇复杂文档(如发票、财务报表和清单)中提取数据的准确性。与容易在长文档中出错的传统单次提取方法不同,Deep Extract 采用自我验证的迭代流程——类似于人工复核——以确保结果达到 **99-100% 的准确率**,甚至超过专业人工标注员。 该系统将大型文档分解为可管理的部分,将提取的数据与原始文档进行验证,并重新提取,直到达到设定的质量阈值。用户可以在系统提示中定义“正确性”(例如,确保行项目总和等于总计),从而无需进行大量的手动复核。 在 Beta 测试期间,Deep Extract 将客户在使用现有解决方案时遇到的字段准确率从 10-20% 提高到 99-100%。它还提供细粒度的引用(边界框),用于审计跟踪和审查工作流程。虽然处理时间比标准提取更长,但与大规模手动审查相比,它速度更快且更具成本效益。 Deep Extract 现在作为 Reducto 的 Extract 端点的配置提供。
## 量子抗性密码学:紧迫性提升
量子计算领域的最新突破大大加快了开发和部署量子抗性密码学的进程。谷歌和Oratomic的最新研究表明,破解当前加密标准(如用于Web安全 – WebPKI的那些)可能需要的资源远比之前认为的要少——可能在几年内实现,而非几十年。
这种转变促使人们重新评估风险,专家现在认为2029年是一个关键的截止日期。作者此前较为谨慎,现在则提倡立即行动:部署当前可用的后量子密码学解决方案,即使它们并不完美,也至关重要。
具体而言,这意味着优先推广更大的ML-DSA签名和ML-KEM密钥交换,同时逐步淘汰易受攻击的算法,如ECDSA。混合方法现在被认为过于缓慢和复杂。虽然对称加密目前并非直接的担忧,但作者强调了整体的紧迫性,并承认这将给现有系统和库带来 disruption。核心信息很明确:不作为的风险大于潜在的过早过渡带来的不便。