马来西亚已正式实施禁令,禁止16岁以下的儿童拥有社交媒体账户,加入全球保护未成年人免受网络欺凌、成瘾功能及有害内容侵害的行列。该规定适用于Facebook、Instagram、TikTok和YouTube等主要平台,这些平台现在必须整合年龄验证系统,否则将面临最高1000万令吉(约250万美元)的罚款。 尽管政府强调这些措施旨在创造一个更安全的数字环境,但该政策也面临严峻审视。包括学者在内的批评者指出,强制身份验证可能带来数据隐私风险。此外,由于对家长没有处罚措施,专家警告称该法律很容易被绕过,从而导致无效。 Meta等行业代表也警告称,全面禁令可能会将青少年推向不受监管、安全性更低的互联网角落,并建议平台自带的安全工具是更好的替代方案。随着马来西亚为实施该政策提供宽限期,这些严格的年龄限制措施的有效性仍是激烈辩论的主题。
浮点运算中的标准“舍入到最近”(RNE)会引入一种随时间累积的持续偏差。在执行大量小规模更新(例如神经网络训练)时,RNE 产生的舍入误差会导致数值停滞,因为每次更新都会被舍入回同一个可表示的数字。相反,随机舍入(SR)产生的误差是无偏的,其均值为零。虽然这些更新包含更多噪声,但它们会在长时间内相互抵消,从而使总和能够按预期增长。
在数学上,有偏误差呈线性增长($O(n)$),而无偏误差则以随机游走的速度增长($O(\sqrt{n})$)。这种差异对训练稳定性至关重要。实验表明,在优化器状态中使用带有 SR 的 BF16 可以达到与 FP32 精度相当的性能,而带有 RNE 的 BF16 则会导致训练损失过早陷入平稳。通过在优化器内核中用 SR 替换 RNE(这无需额外的内存或带宽),从业者可以在获得 FP32 级精度的同时,有效地将每个参数的内存占用从 10 字节降低至 6 字节。简而言之,消除舍入偏差是维持低精度训练收敛性的关键。