发表新帖

发表新帖

bladexAi大模型平台关于OCR支持

Blade 已结

关注举报

 1  682

836230260 剑圣 2025-09-24 15:58

一、该问题的重现步骤是什么？

1. 上传知识库中我们好多pdf文件都是那种打印版，这个bladex没有ocr导致图片文字识别不了，知识库就构建不起来。

企业截图_17587004212875.png

二、你期待的结果是什么？实际看到的又是什么？

正常解析PDF中的图片，实际看不到图片

三、你正在使用的是什么产品，什么版本？在什么操作系统上？

bladex-ai 4.7.0快照

四、请提供详细的错误堆栈信息，这很重要。

五、若有更多详细信息，请在下面提供。

1条回答

admin (最佳回答者)

2025-09-24 21:13

你的意思是整个pdf是一张扫描件，然后文字和图片都合并在一张大图的情况么？还是说文字和图片是分开的？

如果是分开的，这里的oss配置一下：https://center.javablade.com/blade/BladeX-AI/src/branch/master/src/main/resources/application-dev.yml#L28
pdf里读取到图片会自动解析然后上传到oss里并且返回oss的地址。

如果是全部合并在一起的，目前还没发java层面完全解析，可以先借用下这个中间件：https://mineru.net/ 给他先识别切割后，再把处理完的pdf上传到知识库。

0 讨论(2)
评论:

提交评论
- 加载中...

官方产品

BladeX 企业级开发平台 BladeX 可视化数据大屏

官方新品

BladeX 大模型开发平台 BladeX 物联网开发平台

热议问题: 4.5版本actuator没有被拦截 2; 创建用户后，分配对应角色，通过对角色设置权限好后，登录当前用户后。查看不到当前已分配对应角色权限数据 1; 急需bladex-ai的1.8.0的skills相关功能，具体发布日期是多少号 1; 同一接口请求高频,经常会出现处理失败的情况,怎么修复? 1; router.js 里面的路由如何在菜单显示出来 1; 登录后点击页面切换就会变成没有菜单没有导航的全屏 1; blade-ai的1.8.0什么时候正式发布 2; 新增部门时， 1; 用户登录锁定后如何解锁？ 1; 物联网平台支持串口通信吗 1

扫一扫访问 Blade技术社区移动端