WebLLM

开源推理 & 运维 › 推理引擎⭐ 18k↑+2

高性能浏览器内 LLM 推理引擎，利用 WebGPU 在浏览器中直接运行 LLM，无需服务器部署

🎯适用场景：在浏览器中直接运行 LLM 实现零服务器部署

#浏览器#WebGPU#本地推理#边缘计算

📥 收录于 2026/6/11

访问工具

📊 仓库数据

Stars18,445

Forks1,333

语言TypeScript

更新2026/7/24

📈 Stars 变化 ↑11 小时 +2· 统计区间 7/24 12:26 → 7/24 23:22（11 小时）

✅ 优点

•浏览器内运行无需服务器
•支持多种 LLM
•隐私友好

⚠️ 限制

•依赖 WebGPU 支持
•性能受硬件限制

🔗 相关工具

Shimmy

开源⭐ 5.7k↑+7

github.com/Michael-A-Kuykendall/shimmy

纯 Rust 编写的 WebGPU 推理引擎，兼容 OpenAI API，原生支持 GGUF 格式。零 Python 依赖，单二进制文件，可在任意 GPU 上运行

🎯本地 LLM 推理、边缘部署、无需 Python 的推理服务

#Rust#WebGPU#推理引擎#GGUF+1

IPEX-LLM

开源⭐ 8.9k

github.com/intel/ipex-llm

Intel 开源的本地 LLM 推理加速库，支持 LLaMA、Mistral、ChatGLM、Qwen、DeepSeek 等主流模型在 Intel CPU/GPU 上高效推理，无需 NVIDIA GPU 即可运行大模型，是低成本 AI 部署的理想方案

🎯低成本本地 LLM 推理部署、Intel 硬件上的 AI 服务搭建

#本地推理#Intel GPU#CPU 加速#大语言模型

Tensorflow

开源⭐ 196k↑+8

github.com/tensorflow/tensorflow

全球最流行的机器学习框架之一，195K+ stars。Google 开源的端到端 ML 平台，支持 TensorFlow、Keras 等多种 API，覆盖深度学习、强化学习、移动端部署等全场景，是 AI 工程师的必备工具

🎯深度学习模型训练、移动端 AI 部署、生产环境 ML 推理服务

#深度学习#deep-neural-networks#分布式#机器学习+1

Prometheus

开源⭐ 65k↑+13

github.com/prometheus/prometheus

开源监控系统和时序数据库，CNCF 毕业项目。采用多维数据模型和 PromQL 查询语言，是云原生和 AI 基础设施监控的事实标准，可与 Grafana 无缝集成。

🎯AI 服务 GPU 使用率监控、模型推理延迟追踪、Kubernetes 集群资源监控

Ray

开源⭐ 43k↑+6

github.com/ray-project/ray

AI 分布式计算引擎，42K+ stars。提供核心分布式运行时和一套 AI 库，加速 ML 工作负载——包括超参数搜索、强化学习、LLM 推理服务等，是大规模 AI 训练和推理的事实标准基础设施

🎯分布式 ML 训练与推理调度、超参数搜索与强化学习

#分布式计算#ML 加速#超参数优化#LLM 服务

LLM Action

开源⭐ 25k↑+6

github.com/liguodongiot/llm-action

生成式 AI 指南，4.9K+ stars。生成式 AI 研究更新、工具和资源的一站式资源库，涵盖最新进展和实用工具

🎯生成式 AI 技术学习、LLM 训练/推理/部署实践参考

#大语言模型#llm-inference#llm-serving#llm-training+1