AngelSlim
AngelSlim 是腾讯开源的模型压缩和蒸馏框架,支持大语言模型的量化、剪枝和知识蒸馏。帮助企业在资源受限环境下部署高效 AI 模型。
🎯适用场景:LLM 模型压缩、知识蒸馏、边缘部署优化
📥 收录于 2026/6/3
📊 仓库数据
✅ 优点
- •腾讯内部验证成熟
- •支持多种压缩技术
- •适合大规模模型部署
⚠️ 限制
- •学习曲线较陡
- •需要深度学习背景知识
🔗 相关工具
lucebox-hub
github.com/Luce-Org/lucebox-hub
面向消费级硬件的快速 LLM 推测推理服务器,利用 DFlash 内核和 CUDA 优化在普通 GPU 上实现高性能推理
🎯消费级 GPU 上的 LLM 推理、本地大模型部署、推理加速
Ollama
github.com/ollama/ollama
本地运行开源大语言模型的最简方案,支持 Llama、Qwen、DeepSeek 等主流模型,一键安装、自动下载模型、提供 OpenAI 兼容 API,是 AI 开发者本地部署的首选工具
🎯生产环境模型推理服务
gpt4free
github.com/xtekky/gpt4free
多模型免费访问平台,66,037+ stars。提供多种大语言模型的免费访问接口,包括 GPT-4、Claude、Gemini 等主流模型的聚合调用方案
🎯本地模型运行与推理服务
LocalAI
github.com/mudler/LocalAI
开源本地 AI 引擎,45,607+ stars。完全兼容 OpenAI API 的本地 AI 推理引擎,支持 LLM、语音识别、图像生成等多种模型,数据完全本地处理保护隐私
🎯生产环境模型推理服务、多模态内容理解与生成
New API
github.com/QuantumNous/new-api
统一的 AI 模型网关,支持聚合和分发各类 LLM API。自动转换为 OpenAI/Claude/Gemini 兼容格式,是 LLM 路由与统一接入的集中式网关方案。36K+ stars。
🎯多 LLM 模型统一接入、API 路由聚合、LLM 服务分发网关
Kronos
github.com/shiyu-coder/Kronos
面向金融市场的 Foundation Model,将金融市场语言建模为序列预测问题。支持金融时间序列分析、市场趋势预测和量化交易策略生成。由 shiyu-coder 团队开发,GitHub 20K+ 星,周增 3200+ 星,是金融 AI 领域增长最快的项目之一。采用类 Transformer 架构处理结构化金融数据,可对接主流交易 API。
🎯金融时间序列预测、量化交易策略生成、市场趋势分析