格式转换和智能转发
PipeLLM 网关的核心功能是协议转换和智能转发。使用官方 SDK(Anthropic、OpenAI、Google 等),我们自动将请求转换为不同平台的协议,并将响应转换回您期望的格式。 最大优势:无需学习新 API!使用熟悉的 SDK,我们处理所有协议差异。🔄 工作原理
- 使用原生 SDK(例如 Anthropic)
- 发送标准协议请求
- 我们将请求转换为目标平台格式
- 目标平台处理请求
- 我们将响应转换回您的 SDK 格式
- 您的代码无需更改
📊 支持的协议转换
1. Anthropic SDK ↔ 平台
使用 Anthropic 官方 SDK,我们处理协议转换。 示例:Anthropic SDK → Bedrock| 您的 SDK | 目标平台 | 转换 |
|---|---|---|
| Anthropic SDK | AWS Bedrock | Anthropic → Bedrock 协议 |
| Anthropic SDK | Google Vertex | Anthropic → Vertex 协议 |
| Anthropic SDK | Azure | Anthropic → Azure 协议 |
| Anthropic SDK | Anthropic 官方 | 直接透传 |
2. OpenAI SDK ↔ 平台
使用 OpenAI 官方 SDK。 示例:OpenAI SDK → Azure| 您的 SDK | 目标平台 | 转换 |
|---|---|---|
| OpenAI SDK | Azure OpenAI | OpenAI → Azure 协议 |
| OpenAI SDK | AWS Bedrock | OpenAI → Bedrock 协议 |
| OpenAI SDK | Google Vertex | OpenAI → Vertex 协议 |
| OpenAI SDK | OpenAI 官方 | 直接透传 |
3. Google SDK ↔ 平台
使用 Google 的原生库或标准 Gemini API。 示例:Gemini API → Vertex AI| 您的 SDK | 目标平台 | 转换 |
|---|---|---|
| Gemini SDK | Google Vertex | Gemini → Vertex 协议 |
| Gemini SDK | AWS Bedrock | Gemini → Bedrock 协议 |
| Gemini SDK | 其他平台 | Gemini → 平台协议 |
🎯 智能转发策略
1. 自动负载均衡
基于以下因素选择最佳提供商:- 可用性:实时健康监控
- 延迟:选择最快的响应
- 成本:在保证质量的前提下选择最佳性价比
- 配额:避免单个提供商过载
2. 故障转移
如果主提供商不可用:3. 模型映射
我们维护详细的模型映射:| 您请求的模型 | OpenAI | Anthropic | Gemini | AWS Bedrock |
|---|---|---|---|---|
gpt-4 | ✅ GPT-4 | ❌ | ❌ | ❌ |
gpt-3.5-turbo | ✅ | ❌ | ❌ | ❌ |
claude-3-sonnet | ❌ | ✅ | ❌ | ✅ |
gemini-pro | ❌ | ❌ | ✅ | ❌ |
auto | 智能选择 |
- 如果请求特定模型,使用该模型
- 如果
auto或通用名称,基于当前状态选择最佳模型 - 如果主提供商配额耗尽,自动切换到备用提供商
⚙️ 高级配置
1. 首选提供商
通过请求头指定首选提供商:openai- OpenAIanthropic- Anthropic Claudegoogle- Google Geminiazure- Azure OpenAIaws- AWS Bedrock
2. 强制指定提供商
绕过智能路由:3. 禁用格式转换
直接使用原生格式:⚡ 性能优化
1. 零转换开销
格式转换开销最小:- 请求转换:< 1ms
- 响应转换:< 1ms
- 总延迟增加:< 2ms
2. 智能缓存
自动跨提供商缓存:- 与格式无关的跨提供商缓存
- 智能缓存键生成
- 自动缓存刷新
3. 连接复用
- 长连接
- 连接池管理
- 并发请求优化
🛠️ 开发者工具
1. 调试模式
启用调试模式查看转换详情:2. 性能监控
通过管理仪表板监控:- 提供商使用统计
- 转换时间分析
- 缓存命中率
- 故障转移次数
📝 使用指南
1. 最佳实践
推荐:- 使用标准 OpenAI 格式
- 让网关自动选择提供商
- 适当使用缓存
- 实现重试逻辑
- 频繁切换提供商
- 禁用智能路由(除非必要)
- 忽略错误处理
2. 迁移指南
步骤 1:保持现有代码不变- 根据需要调整模型选择
- 启用批量请求
- 配置监控告警
🤝 支持
如果遇到格式转换问题:- 启用调试模式获取详细信息
- 检查请求日志确认转换
- 联系支持提供调试信息
提示:大多数情况下,您无需关心格式转换细节。我们的网关会自动处理一切!