什么是语义路由器(Semantic Router)?
语义路由器(Semantic Router) 是一层智能路由:根据从请求中提取的多种信号,为每次查询动态选择最合适的语言模型。
问题
传统 LLM 部署往往对所有任务使用单一模型:
用户查询 → 单一 LLM → 响应
弊端:
- 简单查询成本过高
- 专项任务表现不佳
- 缺少安全与合规控制
- 资源利用率差
方案
语义路由器采用信号驱动决策,智能路由查询:
用户查询 → 信号提取 → 投影协调 → 决策引擎 → 插件 + 模型分发 → 响应
收益:
- 成本更优(简单任务用小模型)
- 质量更好(强项任务用专用模型)
- 内置安全(越狱检测、PII 过滤等)
- 灵活可扩展(投影 + 插件架构)
工作流程
1. 信号提取
路由器从每次请求中提取 16 类维护中的信号族:
| 信号族分组 | 族 | 示例作用 |
|---|---|---|
| 启发式 | authz、context、keyword、language、structure | 低成本策略、请求形态与区域门禁 |
| 学习型 | complexity、domain、embedding、kb、modality、fact-check、jailbreak、pii、preference、reask、user-feedback | 语义、安全与响应质量理解 |
2. 投影协调
投影将原始信号匹配协调为可复用的路由事实:
routing:
projections:
partitions:
- name: support_intents
semantics: exclusive
members: [technical_support, account_management]
default: technical_support
scores:
- name: request_difficulty
method: weighted_sum
inputs:
- type: complexity
name: hard
weight: 0.4
mappings:
- name: difficulty_band
source: request_difficulty
method: threshold_bands
outputs:
- name: balance_reasoning
gte: 0.6