1、当前接入的模型类似: gemini、gpt等,多家供应商(桥接通道)都进行了对接2、如果想实现: 动态(在线),根据手动维护,以及一些判定机制(异常不稳定),调整模型优先级 比如工作流中调用的是gpt-5.4, 当前使用的是A通道, 需要切换为B,或C通道, 在不改变你们提供的框架代码做扩展的话,是否有什么设计上的建议?
用 One-API / New-API 这类大模型网关处理,可以管理你的所有模型池,自动负载,一个有问题,会立马切换成另外可以用的。
从外部来看,只暴露一个地址和key,把这个网关的地址+key配置到大模型平台当作openai协议的模型来用就行。
扫一扫访问 Blade技术社区 移动端