ONNX Models
ONNX 官方预训练模型集合,涵盖视觉、NLP、音频等多种模态,所有模型以 ONNX 格式提供,可直接用于跨平台部署。
🎯适用场景:预训练 ONNX 模型获取——适合需要将模型部署到多种硬件平台的开发者,一次训练多端部署
📥 收录于 2026/5/28
📊 仓库数据
✅ 优点
- •ONNX 官方维护
- •覆盖多种任务模态
- •跨平台部署友好
- •持续更新
⚠️ 限制
- •仅提供 ONNX 格式
- •部分模型较旧
- •需要自行编写推理代码
🔗 相关工具
Nexa SDK
github.com/qualcomm/nexa-sdk
跨平台 LLM/VLM 推理引擎——在 GPU、NPU 和 CPU 上运行前沿模型。零日模型支持、量化优化、多硬件后端,是端侧 AI 部署的统一推理方案
🎯端侧 LLM/VLM 推理运行时,适用于手机、IoT 设备等边缘部署场景
Ollama
github.com/ollama/ollama
本地运行开源大语言模型的最简方案,支持 Llama、Qwen、DeepSeek 等主流模型,一键安装、自动下载模型、提供 OpenAI 兼容 API,是 AI 开发者本地部署的首选工具
🎯生产环境模型推理服务
gpt4free
github.com/xtekky/gpt4free
多模型免费访问平台,66,037+ stars。提供多种大语言模型的免费访问接口,包括 GPT-4、Claude、Gemini 等主流模型的聚合调用方案
🎯本地模型运行与推理服务
LocalAI
github.com/mudler/LocalAI
开源本地 AI 引擎,45,607+ stars。完全兼容 OpenAI API 的本地 AI 推理引擎,支持 LLM、语音识别、图像生成等多种模型,数据完全本地处理保护隐私
🎯生产环境模型推理服务、多模态内容理解与生成
Kronos
github.com/shiyu-coder/Kronos
面向金融市场的 Foundation Model,将金融市场语言建模为序列预测问题。支持金融时间序列分析、市场趋势预测和量化交易策略生成。由 shiyu-coder 团队开发,GitHub 20K+ 星,周增 3200+ 星,是金融 AI 领域增长最快的项目之一。采用类 Transformer 架构处理结构化金融数据,可对接主流交易 API。
🎯金融时间序列预测、量化交易策略生成、市场趋势分析
omlx
github.com/jundot/omlx
Apple Silicon 专用 LLM 推理服务器,支持连续批处理和 SSD 缓存,从 macOS 菜单栏管理。为 Mac 用户提供了一键式 LLM 本地部署方案,14K+ stars
🎯本地模型运行与推理服务