IPEX-LLM

开源LLM 运行时9.2k

Intel 开源的本地 LLM 推理加速库,支持 LLaMA、Mistral、ChatGLM、Qwen、DeepSeek 等主流模型在 Intel CPU/GPU 上高效推理,无需 NVIDIA GPU 即可运行大模型,是低成本 AI 部署的理想方案

🎯适用场景:低成本本地 LLM 推理部署、Intel 硬件上的 AI 服务搭建

#本地推理#Intel GPU#CPU 加速#LLM

📥 收录于 2026/6/1

📊 仓库数据

Stars9,181
Forks681
语言Python
上线2023/11/15
更新2026/6/1

优点

  • 无需 NVIDIA GPU,Intel CPU/GPU 即可运行大模型
  • 支持主流 LLM 生态(LLaMA/Mistral/Qwen/DeepSeek)
  • 低门槛部署 AI 推理服务

⚠️ 限制

  • Intel 生态兼容性受限,非 Intel 硬件无法使用
  • 推理速度不及顶级 GPU 方案
  • 社区规模相对较小

🔗 相关工具

omlx

开源16k↑+13

github.com/jundot/omlx

Apple Silicon 专用 LLM 推理服务器,支持连续批处理和 SSD 缓存,从 macOS 菜单栏管理。为 Mac 用户提供了一键式 LLM 本地部署方案,14K+ stars

🎯本地模型运行与推理服务

#Apple Silicon#本地推理#macOS#SSD 缓存
语言Python
🍴 Forks1,327
🔄 更新2026/6/1
📥 收录2026/5/19

MNN

开源15k↑+10

github.com/alibaba/MNN

阿里巴巴端侧 AI 推理引擎,15K+ stars。轻量高效的移动端和边缘端推理引擎,支持 LLM 端侧部署,在 ARM、RISC-V 等平台上提供极致性能

🎯手机、IoT 等设备上的轻量模型与 LLM 端侧推理部署

#端侧 AI#推理引擎#嵌入式#LLM
语言C++
🍴 Forks2,331
🔄 更新2026/6/1
📥 收录2026/5/27

Mistral Inference

开源11k

github.com/mistralai/mistral-inference

Mistral 模型官方推理库,提供优化的模型服务化和推理能力。专为 Mistral 系列大语言模型设计,支持高效推理和部署,是使用 Mistral 模型开发者的核心工具链。

🎯Mistral 模型官方推理库——优化 Mistral 模型的推理和服务,适合使用 Mistral 模型的开发者

#Mistral#推理优化#官方工具#LLM
语言Jupyter Notebook
🍴 Forks1,050
🔄 更新2026/6/1
📥 收录2026/5/27

Ollama

开源173k↑+32

github.com/ollama/ollama

本地运行开源大语言模型的最简方案,支持 Llama、Qwen、DeepSeek 等主流模型,一键安装、自动下载模型、提供 OpenAI 兼容 API,是 AI 开发者本地部署的首选工具

🎯生产环境模型推理服务

#本地部署#开源模型#API
语言Go
🍴 Forks16,372
📅 上线2023/6/26
🔄 更新2026/6/1
📥 收录2026/4/13

gpt4free

开源66k↑+3

github.com/xtekky/gpt4free

多模型免费访问平台,66,037+ stars。提供多种大语言模型的免费访问接口,包括 GPT-4、Claude、Gemini 等主流模型的聚合调用方案

🎯本地模型运行与推理服务

#免费模型#API聚合#多模型#开源
语言Python
🍴 Forks13,584
📅 上线2023/3/29
🔄 更新2026/6/1
📥 收录2026/4/20

LocalAI

开源47k↑+9

github.com/mudler/LocalAI

开源本地 AI 引擎,45,607+ stars。完全兼容 OpenAI API 的本地 AI 推理引擎,支持 LLM、语音识别、图像生成等多种模型,数据完全本地处理保护隐私

🎯生产环境模型推理服务、多模态内容理解与生成

#本地部署#隐私保护#OpenAI 兼容#多模型
语言Go
🍴 Forks4,127
📅 上线2023/3/18
🔄 更新2026/6/1
📥 收录2026/4/20