数据科学家的复仇
The revenge of the data scientist

原始链接: https://hamel.dev/blog/posts/revenge/

## 大语言模型时代的数据科学家“反击” 尽管大型语言模型(LLM)兴起,并引发了对数据科学家技能过时的担忧,但数据科学的核心技能实际上比以往任何时候都*更*重要,而非更不重要。虽然LLM简化了AI的*部署*,但它们并不能消除对严格测试、调试以及理解AI在现实世界中表现的需求。 最初的炒作集中在模型*创建*上,这现在主要由基础模型API处理。然而,大部分工作在于确保这些模型能够很好地泛化,识别失败点,并建立有意义的指标——所有这些都是传统的数据科学领域。 常见的陷阱包括依赖于通用且未经验证的指标、设计糟糕的实验(使用不具代表性的数据)、存在缺陷的数据/标签以及过度自动化。数据科学家的方法强调**关注数据**:进行探索性数据分析,验证判断者(如分类器),并将合成测试建立在现实世界的观察之上。 最终,工作内容并没有改变——它只是发生了转移。数据探索、实验设计和批判性评估方面的技能对于有效利用LLM的力量至关重要。Python仍然是关键工具,而关注数据驱动的洞察是成功的关键。

对不起。
相关文章

原文
联系我们 contact @ memedata.com