💡

文章摘要

2026 年上半年,AI 聊天市场经历了有史以来最剧烈的格局变动。ChatGPT 的全球网页流量份额从 2025 年 1 月的 86.7% 暴跌至 2026 年 4 月的 54.7%——15 个月内下滑 32 个百分点。美国移动应用 DAU 份额更是首次跌破 40%。与此同时,Google Gemini 从 5.6% 飙升至 27.4%,Claude 从 1.4% 增长到 8.2%,Perplexity 在 AI 搜索赛道独立成长。本文基于 Similarweb、Apptopia、First Page Sage 和 Sensor Tower 四大数据源的最新数据,深度解析 AI 聊天市场从「一家独大」到「多强并立」的结构性变化,以及企业为何必须从「押注单一模型」转向「多模型编排策略」。

一、数据全景:四个数据源讲述同一个故事

AI 聊天市场的格局变化已经不是趋势,而是事实。 四个独立数据源从不同角度验证了同一个结论:ChatGPT 的绝对主导地位正在瓦解。

网页流量份额(Similarweb,2026 年 4 月)

AI 平台 2025.02 2025.05 2025.08 2025.11 2026.02 2026.04
ChatGPT 76.5% 79.0% 78.2% 70.8% 62.4% 54.7%
Gemini 5.6% 7.6% 9.7% 16.4% 24.6% 27.4%
Claude 1.4% 1.4% 2.0% 2.2% 3.4% 8.2%
DeepSeek 12.0% 6.3% 4.3% 4.2% 3.2% 4.1%
Grok 1.0% 2.6% 2.6% 2.8% 3.5% 2.8%
Perplexity 2.2% 1.8% 2.0% 2.3% 1.8% 1.5%
Copilot 1.3% 1.3% 1.3% 1.3% 1.1% 1.3%

美国移动应用 DAU 份额(Apptopia,2026 年 3 月)

平台 2025.01 2026.01 2026.03
ChatGPT 69.1% 45.3% 38.7%
Gemini 14.7% 25.2% ~25%
Grok 1.6% 15.2% 13.5%
Claude <2% ~1.5% 10%
Copilot ~10% ~10%

关键数据点:

  • ChatGPT 美国移动 DAU 份额首次跌破 40%(38.7%),而 2025 年 9 月还接近 52%
  • Claude 在三个月内从 1.5% 暴涨到 10%——增速最猛的挑战者
  • Gemini 月活突破 7.5 亿,网页月访问量首次超过 20 亿
  • TechCrunch 2026 年 6 月 16 日报道:ChatGPT 份额跌破 50%

四个数据源的口径不同,但结论一致:AI 聊天市场正从「一超独霸」走向「多强并立」。

图表加载中…

二、谁在吃掉 ChatGPT 的份额?四个挑战者的不同路径

ChatGPT 份额下滑不是均匀分布的——四个主要挑战者各自占据了不同的生态位。

2.1 Google Gemini:「渠道为王」的碾压式增长

增长数据: 从 5.6% → 27.4%(网页),从 14.7% → 25.2%(移动),月活突破 7.5 亿。

增长引擎: Gemini 的增长几乎完全来自渠道整合——Gemini 被嵌入 Google Search、Gmail、Google Workspace、Android 系统层。用户不需要主动下载 Gemini 应用,它已经存在于用户的日常工作流中。

关键转折点: 2025 年 12 月 Gemini 2.5 Pro 发布后,网页流量单月暴涨 28%。Gemini 3 和「Nano Banana Pro」图像生成器进一步加速了用户增长。

护城河: Google 的分发渠道是任何竞争对手都无法复制的。当 AI 助手被预装在每一台 Android 手机、每一个 Google 搜索框和每一封 Gmail 邮件中时,用户没有理由去下载另一个应用。

2.2 Claude:「开发者之选」的逆袭

增长数据: 从 1.4% → 8.2%(网页),从 <2% → 10%(移动 DAU),三个月内移动份额翻了近 7 倍。

增长引擎: Claude 的增长来自专业用户和开发者群体。在 25 岁以下的专业人群中,Claude 的采用率尤其高。它被广泛用于:

  • 结构化推理和长文档分析(200K token 上下文窗口
  • 代码生成和审查
  • 需要精确指令跟随的企业工作流

为什么 Claude 增速最快? 因为它在 ChatGPT 最弱的领域做到了最好:准确性、可控性和专业深度。当用户发现 ChatGPT 在复杂推理中「幻觉」太多时,他们转向了 Claude。

2.3 Perplexity:「AI 原生搜索」的独立赛道

增长数据: 网页份额稳定在 1.5-2.3%,月处理约 7.8 亿次查询。

独特定位: Perplexity 不试图做通用聊天——它专注于AI 搜索。当用户需要「带引用来源的实时信息」时,Perplexity 是首选。

商业模式: Pro 版 $20/月,提供无限制的 GPT-4 和 Claude 模型访问。这意味着 Perplexity 本身也在采用「多模型策略」。

风险: Google 的 AI Mode 和 ChatGPT 的 Web Search 功能正在侵蚀 Perplexity 的核心场景。它能否作为独立产品存活,仍是未知数。

2.4 Grok:X 平台的流量红利

增长数据: 从 1.0% → 15.2%(移动),但网页份额仅 2.8%,且近期回落。

增长引擎: Grok 的增长几乎完全来自与 X(前 Twitter)的深度整合。它在 2025 年底的爆发式增长与 X 平台的流量导入直接相关。

问题: Grok 的网页份额远低于移动份额,说明用户更多是在 X 平台内「顺便使用」,而非主动打开 Grok 进行深度对话。这种增长的可持续性存疑。

图表加载中…

三、ChatGPT 为什么在输?三个结构性问题

ChatGPT 的份额下滑不是偶然的——它面临三个竞争对手没有的结构性劣势。

3.1 渠道劣势:没有「原生入口」

Gemini 有 Google Search 和 Android,Copilot 有 Windows 和 Office,Grok 有 X 平台。而 ChatGPT 只有一个独立的应用和网站——用户必须主动打开才能使用。

数据佐证: Gemini 月访问量突破 20 亿,其中大部分来自 Google 生态的自然流量。ChatGPT 虽然仍有 8-9 亿周活用户,但增长依赖用户主动访问。

3.2 定价劣势:免费 vs 付费的鸿沟

ChatGPT Plus 仍然是 $20/月。而 Gemini Advanced 包含在 Google One AI Premium($19.99/月,含 2TB 存储)中,Copilot 对 M365 用户部分免费。当竞品把 AI 能力捆绑进已有订阅时,ChatGPT 的独立定价显得越来越贵。

3.3 功能同质化:「通用助手」的诅咒

ChatGPT 是通用型助手——它什么都能做,但没有一个场景做到最好。而 Claude 在长文档分析上更强,Perplexity 在搜索引用上更准,Gemini 在 Google 工作流中更深。

Apptopia 数据显示: ChatGPT 的用户使用时长自 2025 年 7 月以来下降了 22.5%。用户不是完全离开——他们还在用,但用得更少了。他们把复杂任务分给了 Claude,把搜索任务分给了 Perplexity,把 Google 工作流内的任务分给了 Gemini。

⚠️ 常见踩坑

ChatGPT 仍然是绝对用户量最大的 AI 助手(8-9 亿周活)。份额下降不等于绝对用户减少——市场整体在高速增长,ChatGPT 的用户量也在增长,只是增速远低于竞品。

四、企业启示:为什么「多模型策略」从可选项变成了必选项

市场格局的碎片化对企业 AI 战略产生了深远影响。2025 年的问题是「我们该用 ChatGPT 还是其他?」2026 年的问题是「我们如何同时编排多个模型?」

4.1 单一模型策略的风险

风险类型 描述 实例
供应商锁定 深度集成单一 API,切换成本极高 所有工作流绑定 OpenAI API
能力盲区 单一模型不可能在所有任务上最优 用 ChatGPT 做搜索引用,效果不如 Perplexity
价格风险 供应商提价时无替代方案 OpenAI API 价格调整影响全部业务
合规风险 数据全部流向单一供应商 欧洲企业数据全部存储在 OpenAI 美国服务器

4.2 多模型编排的实操框架

第一层:任务分类

任务类型 推荐模型 原因
通用对话/创意写作 ChatGPT (GPT-4o) 最广泛的通用能力
长文档分析/代码审查 Claude (Sonnet/Opus) 200K 上下文 + 精确跟随
实时搜索/研究 Perplexity / Gemini 引用来源 + 实时数据
Google 工作流自动化 Gemini 原生集成 Workspace
企业内部 Microsoft 场景 Copilot 原生集成 M365

第二层:路由策略

  • 搜索类 → Perplexity API / Gemini Search
  • 分析类 → Claude API(长上下文
  • 创意类 → ChatGPT API(GPT-4o)
  • Google 数据 → Gemini API(Workspace 集成)
  • 简单问答 → 最便宜的可用模型

第三层:成本优化

不是所有请求都需要最贵的模型。Apple 的三层路由架构就是最好的范例——简单任务用设备端模型(零成本),中等任务用标准云端,复杂任务才用最贵的 Pro 模型。

企业应该:

  • 80% 的日常请求用中等价位模型处理
  • 15% 的复杂请求才调用顶级模型
  • 5% 的关键任务使用多个模型交叉验证

4.3 实施路径

Phase 1(1-2 月):评估与试点

  • 审计当前 AI 使用场景和 API 调用分布
  • 选择 2-3 个模型进行 POC 测试
  • 建立质量评估基准(准确率延迟、成本)

Phase 2(3-4 月):路由层建设

  • 构建意图分类器和模型路由
  • 实现基本的故障转移(一个模型不可用时自动切换)
  • 部署成本监控和用量追踪

Phase 3(5-6 月):优化与扩展

  • 基于实际数据优化路由规则
  • 引入缓存层(相同问题不重复调用 API)
  • 考虑本地部署小模型处理高频简单任务
typescript
multi-model-router.ts
/**
 * 多模型路由器 - 概念演示
 * 根据任务类型自动选择最优模型
 */

type TaskType = 'search' | 'analysis' | 'creative' | 'code' | 'simple';
type ModelProvider = 'openai' | 'anthropic' | 'google' | 'perplexity';

interface ModelConfig {
  provider: ModelProvider;
  model: string;
  maxTokens: number;
  costPer1KTokens: number;  // 美元
  avgLatencyMs: number;
}

interface RoutingRule {
  taskType: TaskType;
  primary: ModelConfig;
  fallback: ModelConfig;
  maxCostPerRequest: number;
}

// 路由规则表
const ROUTING_TABLE: RoutingRule[] = [
  {
    taskType: 'search',
    primary: {
      provider: 'perplexity',
      model: 'perplexity-pro',
      maxTokens: 4096,
      costPer1KTokens: 0.003,
      avgLatencyMs: 800,
    },
    fallback: {
      provider: 'google',
      model: 'gemini-2.5-pro',
      maxTokens: 8192,
      costPer1KTokens: 0.002,
      avgLatencyMs: 600,
    },
    maxCostPerRequest: 0.05,
  },
  {
    taskType: 'analysis',
    primary: {
      provider: 'anthropic',
      model: 'claude-sonnet-4',
      maxTokens: 16384,
      costPer1KTokens: 0.003,
      avgLatencyMs: 1200,
    },
    fallback: {
      provider: 'openai',
      model: 'gpt-4o',
      maxTokens: 16384,
      costPer1KTokens: 0.005,
      avgLatencyMs: 1500,
    },
    maxCostPerRequest: 0.10,
  },
  {
    taskType: 'creative',
    primary: {
      provider: 'openai',
      model: 'gpt-4o',
      maxTokens: 8192,
      costPer1KTokens: 0.005,
      avgLatencyMs: 1000,
    },
    fallback: {
      provider: 'anthropic',
      model: 'claude-sonnet-4',
      maxTokens: 8192,
      costPer1KTokens: 0.003,
      avgLatencyMs: 1200,
    },
    maxCostPerRequest: 0.08,
  },
  {
    taskType: 'code',
    primary: {
      provider: 'anthropic',
      model: 'claude-sonnet-4',
      maxTokens: 16384,
      costPer1KTokens: 0.003,
      avgLatencyMs: 1200,
    },
    fallback: {
      provider: 'openai',
      model: 'codex-latest',
      maxTokens: 16384,
      costPer1KTokens: 0.005,
      avgLatencyMs: 1500,
    },
    maxCostPerRequest: 0.10,
  },
  {
    taskType: 'simple',
    primary: {
      provider: 'openai',
      model: 'gpt-4o-mini',
      maxTokens: 2048,
      costPer1KTokens: 0.0005,
      avgLatencyMs: 200,
    },
    fallback: {
      provider: 'google',
      model: 'gemini-flash',
      maxTokens: 2048,
      costPer1KTokens: 0.0003,
      avgLatencyMs: 150,
    },
    maxCostPerRequest: 0.01,
  },
];

// 路由器核心逻辑
async function routeRequest(
  taskType: TaskType,
  prompt: string,
): Promise<{ response: string; model: string; cost: number }> {
  const rule = ROUTING_TABLE.find(r => r.taskType === taskType);
  if (!rule) throw new Error(`No routing rule for task: ${taskType}`);

  try {
    const response = await callModel(rule.primary, prompt);
    const cost = estimateCost(rule.primary, prompt, response);
    return { response, model: rule.primary.model, cost };
  } catch (error) {
    console.warn(`Primary model failed, falling back`);
    const response = await callModel(rule.fallback, prompt);
    const cost = estimateCost(rule.fallback, prompt, response);
    return { response, model: rule.fallback.model, cost };
  }
}

async function callModel(config: ModelConfig, prompt: string): Promise<string> {
  // 实际的 API 调用逻辑
  // switch (config.provider) { ... }
  return '';
}

function estimateCost(config: ModelConfig, input: string, output: string): number {
  const totalTokens = (input.length + output.length) / 4; // 粗略估算
  return (totalTokens / 1000) * config.costPer1KTokens;
}

💡 一句话理解

多模型策略的关键不是「用更多模型」,而是「让每个请求被最合适的模型处理」。这需要一个智能路由层——Apple 的三层查询路由架构就是最好的参考实现。

五、2026 下半年展望:格局还会怎么变?

基于当前数据和趋势,我们对 2026 下半年的市场格局做出以下判断:

5.1 ChatGPT 的反击

OpenAI 不会坐视份额流失。三个可能的反击方向:

  1. Sora 虽然已关闭(2026.04.26),但视频能力会以新形式回归——整合进 ChatGPT 主应用而非独立 App
  2. Codex 的 Agent 能力持续升级——500 万周活用户中 20% 是非开发者,说明「全民构建」赛道有巨大空间
  3. 可能的价格调整——$20/月的定价在竞品捆绑策略下越来越缺乏竞争力

5.2 Gemini 的天花板

Gemini 的增长惊人,但它面临一个根本问题:渠道带来的用户不等于忠实用户。很多 Gemini 用户是「被动使用」——因为被预装在 Google 生态中,而不是主动选择。当 Google 的 AI 整合红利消化完毕后,增长可能放缓。

5.3 Claude 的规模化挑战

Claude 的增速最快(三个月从 1.5% 到 10%),但它面临品牌认知度的挑战。普通消费者仍然不知道 Claude 是什么。Anthropic 需要在保持专业用户忠诚度的同时,找到触达大众市场的方式。

5.4 新变量:Agent 时代的份额重分配

当前所有市场份额统计都基于聊天界面的流量。但随着 AI 从「聊天」走向「Agent」(自主执行任务),份额的衡量标准可能发生根本变化:

  • 未来衡量 AI 影响力的可能不是「聊天流量」,而是「完成的任务数」
  • 一个在聊天中份额只有 5% 的模型,可能在 Agent 任务中占据 30% 的份额
  • ChatGPT 的份额下降可能部分是因为 Agent 工作流的分流——用户不再「聊天」,而是让 AI 直接「做事」

这意味着当前的市场份额数据可能低估了格局变化的剧烈程度

图表加载中…

六、结论:忠诚于结果,而非平台

AI 聊天市场正在经历一场不可逆的结构性变化。ChatGPT 仍然是最大的玩家,但「一家独大」的时代已经结束。

对个人的建议: 不要成为任何一个平台的「忠实用户」。学会在不同场景使用不同的 AI 工具——用 Claude 做结构化推理,用 Perplexity 做研究,用 Gemini 处理 Google 工作流,用 ChatGPT 做通用任务。忠诚于结果,而非平台。

对企业的建议: 多模型策略不再是「锦上添花」,而是风险管理的基本要求。就像企业不会只用一家云服务商一样,也不应该只用一个 AI 模型。构建智能路由层,实现任务到模型的最优匹配,同时保留故障转移和供应商切换的能力。

对行业的判断: AI 市场的碎片化会持续加速。2027 年,我们可能会看到一个完全不同的格局——Agent 平台的崛起可能让当前的「聊天份额」统计变得毫无意义。真正的竞争不在聊天界面里,而在谁能帮用户完成更多、更复杂的任务

这场游戏,才刚刚开始。