咨询有关模型优先级的框架应用

Blade 未结 1 20

1、当前接入的模型类似: gemini、gpt等,多家供应商(桥接通道)都进行了对接
2、如果想实现: 动态(在线),根据手动维护,以及一些判定机制(异常不稳定),调整模型优先级
       比如工作流中调用的是gpt-5.4,  当前使用的是A通道, 需要切换为B,或C通道,
       在不改变你们提供的框架代码做扩展的话,是否有什么设计上的建议?

1条回答
  • 用 One-API / New-API 这类大模型网关处理,可以管理你的所有模型池,自动负载,一个有问题,会立马切换成另外可以用的。

    从外部来看,只暴露一个地址和key,把这个网关的地址+key配置到大模型平台当作openai协议的模型来用就行。

    0 讨论(0)
提交回复