## AI碳水计算:糖尿病管理可靠性危机
一项最新研究显示,领先的AI模型(GPT-5.4、Claude和Google Gemini)在分析食物照片时,碳水化合物估算存在显著且危险的不一致性——这是许多糖尿病管理应用程序的核心功能。研究人员使用标准提示,向每个模型提交了13张食物图片,进行了超过500次测试,发现即使对于*同一*张照片和模型,碳水化合物计数也存在很大差异。
这些差异并非微小;估算值相差数十克,可能导致危险的胰岛素过量或不足——其中一个模型的西班牙海鲜饭照片显示范围高达429克。虽然Claude表现出最一致性,但所有模型都存在不准确之处,并且其报告的“置信度”分数与实际准确性之间缺乏令人担忧的相关性。
该研究强调了两个主要风险:**系统性偏差**(持续高估,可能导致低血糖)和**随机变异性**(不可预测的异常值,造成急性危险)。研究结果强烈表明,当前的AI碳水计算工具*不足以*用于无人监督的胰岛素剂量调整,并强调需要多次查询以评估不确定性,以及仔细验证识别出的食物项目。该研究支持了近期对使用通用LLM进行自主胰岛素计算的警告。
这是《泰晤士报》网站的结构概述。它详细介绍了网站为读者提供的广泛版块,涵盖来自英国和世界各地的新闻,以及专门的**评论**、**财经**、**生活与时尚**、**商业**、**体育**和**文化**区域。
该网站还提供丰富的资源,如**旅游**指南、**益智游戏**和各种**杂志**。除了新闻之外,《泰晤士报》还提供补充内容,包括**电视指南**、**播客**、教育资源(**学校指南**、**大学指南**)以及生活方式列表(**最佳居住地**等)。
近期的一篇文章重点报道了婴儿过度使用屏幕的问题,报告发现三分之二的婴儿在观看屏幕,有些甚至每天长达八小时——尽管官方建议两岁以下儿童不要使用屏幕。该网站还推广订阅优惠,以供用户无限制地访问其内容。
开源 2026年4月27日 code.overheid.nl(荷兰语)平台现已上线。它是政府范围内的代码平台,用于发布和开发开源软件。该平台完全自主托管,支持数字主权。目前,这是一个试点项目,使用Forgejo,一个开源、欧洲且主权化的GitHub和GitLab替代方案。并非所有政府机构都可以使用该平台。 开发者受邀贡献代码,目标是最终将其发展成为政府机构共享的Git平台。该代码平台由内政及王国关系部(BZK)的开源项目办公室发起,并与DAWO(SSC-ICT)、Opensourcewerken(荷兰语)和developer.overheid.nl合作。 有兴趣加入?请发送电子邮件至