一、该问题的重现步骤是什么?
1. 命中测试这个会检索其他的知识库的东西,感觉是全是知识库混在一起的,没办法正常检索和使用,包括工作流中的调用
2. 此外还有在上传文件这个工作流程中文件内容没办法正常传递,包括文件名、内容等都有问题,LLM大模型和文本提取这2个组件都不行。输入显示上看得到内容,输出给模型就是用[object]占位没有和提示词一起给到模型
二、你期待的结果是什么?实际看到的又是什么?
可以让知识库独立分割开,文件内容能正确应用于工作流上
三、你正在使用的是什么产品,什么版本?在什么操作系统上?
bladexaiV1.1.1,部署在liunx服务器上
1. 创建知识库的时候,会绑定一个向量库配置,而命中测试就是搜索的这个知识库绑定向量库内的所有内容。如果要分开,那就是不同的知识库绑定不同的向量库配置
2. 工作流的文件传递你不能直接传递一整个对象,要传递他的对应字段,你这样写不行的,应该用 file.xxx 这样
比如你需要传递url,就直接 ${file.url}就可以了。另外如果你上传的是多个文件,获取的时候file就是个对象数组,再用数组的形式去获取值
这样如果要搞多个知识库,还要配置多个向量库,是否有点不太合理。向量库可以,一个知识库一个命名空间,用于区分这样更方便一点。
你改成milvus就可以了,一个milvus服务,可以创建多个不同的库
另外不建议你使用redis,redis是内存存储,数据常驻内存,如果后续文件大,那么就会占用很多内存了。而milvus是内存+对象存储的架构,当内存达到阈值可以落盘到oss,适合后续超大规模场景。
扫一扫访问 Blade技术社区 移动端