## 从零到竞争:优化一个微型解释器 这篇文章详细介绍了为动态语言 Zef 优化一个简单的 AST 遍历解释器的过程,使其性能与 Lua、QuickJS 和 CPython 竞争——速度提升了 16.6 倍(使用 Yolo-C++ 端口则提升了 67 倍)。重点在于在处理 JIT 编译或高级垃圾回收等复杂功能*之前*进行的初始优化。 关键技术包括改进**值表示**(使用标记值避免数字的分配),实现**内联缓存**(使用专门的 AST 节点减少分派开销),以及改进**对象模型**(使用预分配存储和观察点避免哈希表查找)。 显著的收益来自于看似重大的改变,例如将对象模型改进与内联缓存和观察点结合,从而实现了 4.55 倍的速度提升。 作者使用了一个基准测试套件 ScriptBench1(Richards、DeltaBlue、N-Body 和 Splay 的移植版)来跟踪进度。实验在配备 Intel Core Ultra 5 处理器的 Ubuntu 22.04 上进行。最终结果使使用 Fil-C++ 编译的 Zef 能够与成熟的解释器相媲美,而 Yolo-C++ 端口则提供了进一步的 4 倍加速(尽管存在内存管理方面的注意事项)。该项目表明,即使在基本的解释器基础上,通过仔细、有针对性的优化,也可以实现显著的性能提升。
## 语言模型中的“退缩”:所谓的“无审查”模型真的自由吗?
最新研究表明,即使是作为“无审查”销售的语言模型,也表现出一种微妙但普遍的偏见——一种对某些词语和话题的“退缩”。这种退缩不是拒绝回应,而是一种统计上的微调,降低了生成文本中出现“敏感”词语(例如与暴力、政治或侮辱性词语相关的词语)的概率。
研究人员在来自五家实验室的七个预训练模型中测量了这种退缩,包括来自谷歌、阿里巴巴、OpenAI和开源选项的模型。他们发现*所有*模型都表现出这种行为,商业过滤模型比开放数据模型表现出更强的退缩。即使是“拒绝消除”模型——那些被设计用来绕过安全限制的模型——仍然表现出退缩,这表明偏见嵌入在核心预训练数据中,而不仅仅是安全层。
这项研究强调,这不仅仅是关于避免明确的拒绝;而是对语言进行系统性的塑造。这引发了对信息微妙控制以及在大型语言模型背景下“无审查”的真正含义的担忧。该研究提供了一个新的框架来理解和量化这些偏见,为更透明和负责任的AI开发铺平了道路。
向门罗币项目捐款
通过向以下门罗币地址(通用基金)捐款,您将支持门罗币项目。如果您希望向特定提案捐款,请参阅所需资金。
888tNkZrPN6JsEgekjMnABU4TBzc2Dt29EPAvkRxbANsAnjyPbb3iQ1YBRk1UXcdRsiKc9dhwMVgN5S9cQUiyoogDavup3H