Yi-Coder: A Small but Mighty LLM for Code

原始链接: https://01-ai.github.io/blog.html?post=en/2024-09-05-A-Small-but-Mighty-LLM-for-Code.md

Ollama 的 DeepSeek 是一种拥有 2360 亿个参数的语言模型,与其他模型相比,它可以在单芯片上提供快速的处理速度,并且成本较低。 然而,由于其条款允许公司自由使用、复制和共享用户输入和输出,因此引发了隐私问题。 用户质疑是否可以在不使用提供的 API 的情况下私​​下部署模型。 DeepSeek 的条款表示国际数据传输以及将收集的数据存储在位于中国的安全服务器中。 此外,该模型还出于各种目的与公司附属公司共享数据,例如研究、分析和内容审核。 此外,该模型复制并使用用户输入和输出,授予 Ollama 对这些元素的永久全局权利。 尽管存在潜在的隐私风险,但用户强调该模型提高了大型语言模型的可访问性,使它们成为一种商品。 这个特定模型在 Apple M2 Ultra 上以每秒 25 个令牌的速度运行,在 25.8 万次下载中获得了超过 210 亿个活动参数。 由于培训定价为 14 万美元,因此对于那些寻求可访问且负担得起的解决方案来满足其需求的人来说,它提供了一个有利的选择。 DeepSeek 似乎针对的是旨在通过自然语言处理简化编码任务的开发人员。 相比之下,艺术和音乐生成器迎合了对创建通用内容感兴趣的个人,而不关心原创的人类艺术家。 重点在于简化编程中的重复任务,通常涉及将英语描述翻译成可执行脚本。 因此,与音乐或艺术生成系统不同,理解或抄袭内容对于产生准确的响应并不重要。 然而,批评者认为深度学习算法缺乏艺术创作中的意向性和语境理解。 虽然他们可能会创作出美观的作品,但他们很难创造出具有逻辑一致性、深度或连贯性的艺术品。 此外,这些生成器无法有效地处理委托定制艺术品或准确传达情感所涉及的人类交互的复杂性。 因此,虽然它们提供了便利,但艺术仍然主要是熟练艺术家的领域。
相关文章
联系我们 contact @ memedata.com