原文
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
原始链接: https://github.com/SJTU-IPADS/PowerInfer
尊敬的 PowerInfer 文档网站访客,欢迎来到我们的创新项目,该项目致力于为法学硕士等大型语言模型提供超快速且轻松的本地推理体验。 我们上海交通大学IPADS实验室的团队创建了PowerInfer来解决高效部署LLMS的主要问题之一,即与使用配备多个高端GPU的昂贵服务器相关的严重资源限制。 为了解决这个问题,PowerInfer 提出了一种综合方法,结合了稀疏计算和自适应预测技术,使其在处理繁重的输入负载时非常有效,同时保持对所需计算资源的最低需求。 凭借对 LLaMA (ReLU)、Falcon (ReLU)、LLaMA (ReLU) 等流行的大型语言模型的支持,PowerInfer 在处理涉及海量输入负载的现实场景方面具有出色的功效,即使在低负载情况下也能提供即时输出响应时间。 本地计算基础设施有限的压力。 此外,通过其独特的混合架构,PowerInfer 充分利用现代高端 GPU,同时还提供卓越的资源节约特性。 当您浏览我们的网站时,您将看到详细的指南、安装过程、设置建议以及更多内容,以帮助您入门并充分利用 PowerInfer 的卓越功能。 如有任何问题或反馈,请随时与我们联系。 感谢您访问我们!
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.