GPT4All

开源LLM 运行时73k

开源本地 LLM 聊天应用和推理框架,提供一键安装的桌面应用和 Python 生态,支持多种开源模型本地运行

🎯适用场景:本地 AI 聊天、隐私敏感的文档问答、离线 AI 助手

#chat#local-ai#llm#desktop#python

📥 收录于 2026/6/6

📊 仓库数据

Stars73,243
Forks2,100
语言Python
更新2026/6/5

优点

  • 一键安装的桌面应用,零配置
  • Python SDK 易集成
  • 完全离线保护隐私

⚠️ 限制

  • 模型选择受官方生态限制
  • 高级功能需付费版
  • 性能不及 llama.cpp 灵活

🔗 相关工具

llama.cpp

开源90k

github.com/ggml-org/llama.cpp

高性能 C++ LLM 推理引擎,支持在 CPU/GPU 上运行各种开源大语言模型,GGUF 量化格式首创者,本地 AI 生态核心基础设施

🎯本地 LLM 部署、端侧 AI 推理、离线 AI 应用、模型量化和格式转换

#inference#llm#local-ai#gguf+1
语言C++
🍴 Forks16,500
🔄 更新2026/6/6
📥 收录2026/6/6

DeepSeek-V3

开源65k

github.com/deepseek-ai/DeepSeek-V3

深度求索开源 MoE 架构大语言模型,671B 参数但仅激活 37B,推理成本低且性能对标 GPT-4 级别,支持多语言

🎯高性价比 LLM 部署、中文场景优化、MoE 架构研究

#moe#llm#open-weight#chinese+1
语言Python
🍴 Forks6,800
🔄 更新2026/6/1
📥 收录2026/6/6

AirLLM

开源19k↑+24

github.com/lyogavin/airllm

仅需单张 4GB GPU 即可运行 70B 大模型推理。采用层卸载和量化技术,让消费级显卡也能跑超大模型,是资源受限场景下大模型推理的破局方案

🎯消费级 GPU 上的大模型推理、低资源 LLM 部署场景

#edge-inference#quantization#low-vram#llm+1
语言Jupyter Notebook
🍴 Forks2,136
📅 上线2023/9/1
🔄 更新2026/6/6
📥 收录2026/6/4

MTPLX

开源687↑+2

github.com/youssofal/MTPLX

轻量级大语言模型推理引擎,优化 KV cache 和计算效率,适合资源受限场景部署。

🎯LLM 推理加速、边缘部署、资源受限场景

#llm
语言Python
🍴 Forks37
🔄 更新2026/6/6
📥 收录2026/6/4

Mixture of Recursions

开源575↑+1

github.com/raymin0223/mixture_of_recursions

结合自适应计算和早期退出的递归 Transformer 架构,优化 LLM 推理效率和精度。

🎯LLM 架构研究、推理效率优化、Transformer 改进

#llm
语言Python
🍴 Forks83
🔄 更新2026/6/6
📥 收录2026/6/4

Ollama

开源173k↑+5

github.com/ollama/ollama

本地运行开源大语言模型的最简方案,支持 Llama、Qwen、DeepSeek 等主流模型,一键安装、自动下载模型、提供 OpenAI 兼容 API,是 AI 开发者本地部署的首选工具

🎯生产环境模型推理服务

#本地部署#开源模型#API
语言Go
🍴 Forks16,466
📅 上线2023/6/26
🔄 更新2026/6/6
📥 收录2026/4/13