IPEX-LLM

Intel 开源的本地 LLM 推理加速库，支持 LLaMA、Mistral、ChatGLM、Qwen、DeepSeek 等主流模型在 Intel CPU/GPU 上高效推理，无需 NVIDIA GPU 即可运行大模型，是低成本 AI 部署的理想方案

🎯适用场景：低成本本地 LLM 推理部署、Intel 硬件上的 AI 服务搭建

#本地推理#Intel GPU#CPU 加速#大语言模型

📥 收录于 2026/6/1

访问工具

📊 仓库数据

Stars8,862

Forks1,429

语言Python

上线2023/11/15

更新2026/7/16

✅ 优点

•无需 NVIDIA GPU，Intel CPU/GPU 即可运行大模型
•支持主流 LLM 生态（LLaMA/Mistral/Qwen/DeepSeek）
•低门槛部署 AI 推理服务

⚠️ 限制

•Intel 生态兼容性受限，非 Intel 硬件无法使用
•推理速度不及顶级 GPU 方案
•社区规模相对较小

🔗 相关工具

LLM Action

开源⭐ 25k

github.com/liguodongiot/llm-action

生成式 AI 指南，4.9K+ stars。生成式 AI 研究更新、工具和资源的一站式资源库，涵盖最新进展和实用工具

🎯生成式 AI 技术学习、LLM 训练/推理/部署实践参考

#大语言模型#llm-inference#llm-serving#llm-training+1

语言HTML

🍴 Forks2,823

📅 上线2023/5/23

🔄 更新2026/7/16

📥 收录2026/5/20

Ml Engineering

开源⭐ 18k↑+3

github.com/stas00/ml-engineering

由 Hugging Face 工程师 Stas Bekman 编写的机器学习工程开源书籍，系统讲解 GPU 调试、大模型推理优化、分布式训练等工程实践，是 AI 工程师从入门到进阶的实用指南。（17K+ stars）

🎯大模型训练调试、GPU 性能优化、分布式系统架构学习、推理引擎选型参考

#ai#调试#gpus#推理+1

语言Python

🍴 Forks1,175

📅 上线2020/9/3

🔄 更新2026/7/16

📥 收录2026/5/21

WebLLM

开源⭐ 18k

github.com/mlc-ai/web-llm

高性能浏览器内 LLM 推理引擎，利用 WebGPU 在浏览器中直接运行 LLM，无需服务器部署

🎯在浏览器中直接运行 LLM 实现零服务器部署

#浏览器#WebGPU#本地推理#边缘计算

语言TypeScript

🍴 Forks1,324

🔄 更新2026/7/16

📥 收录2026/6/11

Mistral Inference

开源⭐ 11k

github.com/mistralai/mistral-inference

Mistral 模型官方推理库，提供优化的模型服务化和推理能力。专为 Mistral 系列大语言模型设计，支持高效推理和部署，是使用 Mistral 模型开发者的核心工具链。

🎯Mistral 模型官方推理库——优化 Mistral 模型的推理和服务，适合使用 Mistral 模型的开发者

#Mistral#推理优化#官方工具#大语言模型

语言Jupyter Notebook

🍴 Forks1,057

🔄 更新2026/7/16

📥 收录2026/5/27

Mooncake

开源⭐ 5.8k↑+4

github.com/kvcache-ai/Mooncake

Mooncake 是月之暗面 Kimi 的推理服务平台，基于 disaggregation 架构设计，通过 KVCache 分离管理实现大规模 LLM 推理服务的高效部署和弹性扩展

🎯大规模 LLM 推理服务部署、KVCache 管理与优化、高并发推理场景

#disaggregation#推理#kvcache#大语言模型

语言C++

🍴 Forks968

🔄 更新2026/7/16

📥 收录2026/6/4

Shimmy

开源⭐ 5.6k↑+3

github.com/Michael-A-Kuykendall/shimmy

纯 Rust 编写的 WebGPU 推理引擎，兼容 OpenAI API，原生支持 GGUF 格式。零 Python 依赖，单二进制文件，可在任意 GPU 上运行

🎯本地 LLM 推理、边缘部署、无需 Python 的推理服务

#Rust#WebGPU#推理引擎#GGUF+1

语言Rust

🍴 Forks543

🔄 更新2026/7/16

📥 收录2026/6/8

← 浏览全部 1299 个工具