关于 ai 问数的相关思考及建议

Blade 已结 2 137
tiger_ye
tiger_ye 2025-11-15 11:02

一、该问题的重现步骤是什么?

1.  问数过程的各个环节 建议区分不同大模型,有利于降低成本,增强性能  

2. 存在 sql 返回的数据集过大, 模型处理卡顿问题, 建议限制数据集大小,或者通过取前几行通过大模型生成模板,再拼接数据集

3. 只能通过问题生成图表, 无法和模型进行双向沟通, 以通过大模型来校准需求  【例: 提问后大模型可返回建议问题,即通过模型对问题进行优化】

4. 对于大型数据库,数据结构较为庞杂,表关联设计建议放到应用端, 选表后 再进行关联设计

5. 

二、你期待的结果是什么?实际看到的又是什么?


三、你正在使用的是什么产品,什么版本?在什么操作系统上?


四、请提供详细的错误堆栈信息,这很重要。


五、若有更多详细信息,请在下面提供。

2条回答
  •  tiger_ye
    tiger_ye (楼主)
    2025-11-17 10:32

    补充

    1, 关于问题1,目前市面上有垂直领域的相关模型,资源要求低,性能也不错 例: XiYanSQL-QwenCode , 可针对问数的各个环节 提示词生成, sql生成, 图表json生成   使用专用模型,发挥各个模型优势,同时降低成本。

    2, 关于问题4,数据库配置菜单下的关联设计 是基于整库设计,  表多且结构复杂, 建议 智能体问数菜单下,增加 基于选定的表的 关联设计。


    作者追问:2025-11-17 10:32

    1. 问数一共就两个接口用到ai,一个是查询sql,一个是根据sql生成options,没必要分那么多模型调用,而且这俩功能都是同一个细分的功能类型,一个专用模型就够了。

    2. 外部配置了完整的数据库模型后,到问数里还能直接选择需要的表,保存后就会只使用配置的表。而且完整数据库模型保存后会json模式保存在数据库,不会每次去整表扫描。

提交回复