🛡️ 请稍候 我们正在检查您的网络连接,以防止自动化滥用行为 为什么我会看到这个页面? 遇到问题?请联系客服
🛡️ 请稍候 我们正在检查您的网络连接,以防止自动化滥用行为 为什么我会看到这个页面? 遇到问题?请联系客服
美国联邦通信委员会(FCC)正计划以法律强制电信运营商收集新用户及续约用户的政府颁发身份证件号码和居住地址,此举将对包括注重隐私人士及家庭暴力受害者在内的所有人产生影响。“我们从未想过这种情况会在这里发生。”
作者正在将 Biff 框架重构为十二个模块化、独立的库,并以 `biff.core` 的发布作为开端。该基础库负责管理系统组成,简化了应用程序模块与组件的集成方式。 为了简化项目配置,作者引入了“初始化函数”(init functions),允许开发者通过在项目中添加模块来集成功能,从而无需在主命名空间中编写冗长的样板代码。 一项关键的技术挑战是保持“后期绑定”(late binding),即在不重启 Web 服务器的情况下更新应用程序逻辑(如 Ring 处理程序)。其解决方案是向初始化函数传递模块向量的引用(var),确保系统映射能动态获取最新状态。 尽管作者考虑过进一步自动化生命周期管理(启动/停止),但出于简单性和透明度的考虑,他们最终保留了现有的“组件”序列模型。通过优先考虑显式排序而非复杂的依赖解析,系统变得更易于理解和调试。 此次更新标志着 Biff 项目向更简洁、更模块化的架构迈出了重要一步。此外,作者提到他们的团队目前正在招聘一名从事可再生能源建模的高级软件工程师。
亚马逊创始人杰夫·贝佐斯认为,人工智能将带来前所未有的生产力提升,这可能会使食品和住房价格更低,并让双职工家庭决定不再需要两份收入。而在亚马逊内部,员工们对公司的AI工具嗤之以鼻,将其产出称为“劣质内容”(slop),并嘲笑公司在推动员工有效利用AI工具方面的失败尝试。 此文章仅限付费会员阅读。成为付费会员即可享受无广告的无限文章阅读权限、播客奖励内容等。订阅。注册以免费阅读此文章。免费会员可阅读此类文章,并获得我们每周故事的电子邮件汇总。订阅。
请启用 JavaScript 并关闭任何广告拦截器。
arXivLabs 是一个允许合作者直接在我们的网站上开发和共享 arXiv 新功能的框架。与 arXivLabs 合作的个人和组织都认同并接受了我们对开放、社区、卓越和用户数据隐私的价值观。arXiv 致力于这些价值观,并仅与遵守这些价值观的合作伙伴合作。如果您有能为 arXiv 社区增加价值的项目想法,请了解更多关于 arXivLabs 的信息。
通过数据重加权(使用权重 $\beta_i = p(x_i)/q(x_i)$)来校正协变量偏移,虽然消除了偏差,但却显著增加了方差。当权重不均匀时,少数数据点会主导估计结果,导致大部分样本实际上变得无效。这一现象可以通过**基什有效样本量(Kish’s effective sample size)**($n_{\mathrm{eff}} = 1/\sum \alpha_i^2$)来量化,它衡量了加权样本的实际“信息含量”。
无论是通过加权和的方差还是通过尾部概率的霍夫丁不等式(Hoeffding’s inequality)进行分析,结论都是一致的:加权估计量的统计表现等同于样本量为 $n_{\mathrm{eff}}$ 的无加权估计量。
这一概念在离线强化学习等领域至关重要,通过监测 $n_{\mathrm{eff}}$ 可以诊断回放缓冲区(replay buffer)的“陈旧程度”。当当前策略偏离行为策略时,权重会变得集中,$n_{\mathrm{eff}}$ 随之骤降,这表明缓冲区的有效信息已耗尽。将 $n_{\mathrm{eff}}$ 视为一种诊断控制信号,有助于进行更稳健的算法调整,例如在粒子滤波中触发重采样,或在强化学习中校准更新步长。
arXivLabs 是一个允许合作者直接在我们的网站上开发和共享 arXiv 新功能的框架。与 arXivLabs 合作的个人和组织都认同并接受我们关于开放、社区、卓越和用户数据隐私的价值观。arXiv 致力于践行这些价值观,并仅与坚持这些价值观的合作伙伴合作。如果您有能为 arXiv 社区创造价值的项目构想,请了解更多关于 arXivLabs 的信息。
arXivLabs 是一个允许合作者直接在我们的网站上开发并分享 arXiv 新功能的框架。与 arXivLabs 合作的个人和组织都认同并接受我们对开放、社区、卓越和用户数据隐私的重视。arXiv 致力于秉持这些价值观,且仅与遵守这些价值观的合作伙伴开展合作。您是否有能为 arXiv 社区增值的项目构想?了解更多关于 arXivLabs 的信息。
本研究旨在评估大语言模型(LLM)智能体在超参数优化(HPO)任务中是否能够超越 CMA-ES 和 TPE 等经典算法。研究人员利用“autoresearch”框架发现,尽管 LLM 可以修改训练代码,但在追踪优化状态方面表现吃力,在受限情况下始终无法达到经典方法的水平。 为解决这一问题,作者提出了 Centaur,这是一种混合方法,将 CMA-ES 的结构化、可解释状态(均值向量、步长和协方差)与 LLM 的领域知识相结合。Centaur 的表现优于纯 LLM 智能体和经典算法,即便是仅有 0.8B 参数的小型模型也能取得优异结果。 研究结论指出,目前 LLM 最有效的角色是作为经典优化器的补充,而非替代品。尽管无约束的代码编辑是可行的,但若要达到传统 HPO 技术的效率与稳定性,则需要规模显著更大的模型。