Ollama

开源LLM 运行时 › 本地运行时推理 & 运维 › 推理引擎 › LLM 推理服务⭐ 175k↑+17

本地运行开源大语言模型的最简方案，支持 Llama、Qwen、DeepSeek 等主流模型，一键安装、自动下载模型、提供 OpenAI 兼容 API，是 AI 开发者本地部署的首选工具

🎯适用场景：生产环境模型推理服务

#本地部署#开源模型#API

📥 收录于 2026/4/13

访问工具 📖 官方文档

📊 仓库数据

Stars175,048

Forks16,758

语言Go

上线2023/6/27

更新2026/6/29

📈 Stars 变化 ↑6 小时 +17· 统计区间 6/28 18:12 → 6/29 00:15（6 小时）

✅ 优点

•一键安装极简体验
•支持众多开源模型
•OpenAI 兼容 API
•本地运行数据隐私安全

⚠️ 限制

•需要较好 GPU 才能运行大模型
•显存要求高
•不如云端模型能力强

🔗 相关工具

Surf

开源⭐ 3.5k

github.com/deta/surf

Deta 出品的个人 AI 笔记本——组织文件和网页并自动生成笔记。支持 Claude、Gemini、DeepSeek 和本地 Ollama 模型，数据完全本地或开源存储。3.4K+ stars，是个人知识管理+AI 的新选择

🎯个人知识管理与笔记、网页信息整理、本地 AI 研究工作台

#个人 AI#知识管理#笔记生成#本地部署+1

语言TypeScript

🍴 Forks255

🔄 更新2026/6/28

📥 收录2026/6/2

llama.cpp

开源⭐ 118k↑+38

github.com/ggml-org/llama.cpp

高性能 C++ LLM 推理引擎，支持在 CPU/GPU 上运行各种开源大语言模型，GGUF 量化格式首创者，本地 AI 生态核心基础设施

🎯本地 LLM 部署、端侧 AI 推理、离线 AI 应用、模型量化和格式转换

#推理#大语言模型#本地 AI#gguf+1

语言C++

🍴 Forks20,018

🔄 更新2026/6/28

📥 收录2026/6/6

DeepSeek-V3

开源⭐ 104k↑+6

github.com/deepseek-ai/DeepSeek-V3

深度求索开源 MoE 架构大语言模型，671B 参数但仅激活 37B，推理成本低且性能对标 GPT-4 级别，支持多语言

🎯高性价比 LLM 部署、中文场景优化、MoE 架构研究

#moe#大语言模型#open-weight#chinese+1

语言Python

🍴 Forks16,737

🔄 更新2026/6/28

📥 收录2026/6/6

GPT4All

开源⭐ 77k↓-1

github.com/nomic-ai/gpt4all

开源本地 LLM 聊天应用和推理框架，提供一键安装的桌面应用和 Python 生态，支持多种开源模型本地运行

🎯本地 AI 聊天、隐私敏感的文档问答、离线 AI 助手

#chat#本地 AI#大语言模型#桌面端+1

语言C++

🍴 Forks8,310

🔄 更新2026/6/28

📥 收录2026/6/6

GPT4Free

开源⭐ 66k↓-1

github.com/xtekky/gpt4free

多模型免费访问平台，66,037+ stars。提供多种大语言模型的免费访问接口，包括 GPT-4、Claude、Gemini 等主流模型的聚合调用方案

🎯本地模型运行与推理服务

#免费模型#API聚合#多模型#开源

语言Python

🍴 Forks13,570

📅 上线2023/3/30

🔄 更新2026/6/28

📥 收录2026/4/20

Headroom

开源⭐ 53k↑+146

github.com/chopratejas/headroom

LLM 上下文压缩工具，可自动压缩工具输出、日志、文件和 RAG 分块，在发送到 LLM 前将 token 消耗降低 60%。12K+ stars。

🎯LLM 上下文压缩、Token 成本优化、RAG 系统输出预处理

#context-compression#llm-optimization#token-reduction#rag

语言Python

🍴 Forks3,780

🔄 更新2026/6/29

📥 收录2026/6/5

← 浏览全部 1238 个工具