## 人工智能成本上升:更多Token,价格趋于平稳 近期趋势显示,人工智能推理经济正在发生转变。虽然Token成本正在稳定,但*Token消耗量*却在迅速增加——这不仅仅是由于用户数量增加,而是因为应用程序为了获得更高质量的结果,正在使用*每个请求更多的Token*。 这受到更丰富上下文的需求驱动,通常通过使用LLM来预处理和评估数据来实现(例如,重新排序搜索结果)——这种做法越来越普遍。 需求的增加正在给基础设施带来压力,但成本降低的速度跟不上。为了管理不断上涨的费用,应用程序开发者应优先考虑:为每个任务使用适当大小的模型,多样化模型提供商,仔细评估对昂贵“推理”模型的需求,以及谨慎对待微调,这需要大量高质量的数据。 最终,重点应该从单纯降低成本转向最大化价值。随着人工智能应用程序的成熟并证明明确的投资回报率,可能会出现提高定价能力的机会,特别是对于那些提供卓越质量的应用。 尽管持续努力提高效率,但随着Token使用量的增加,预计将继续密切关注人工智能账单。