一、该问题的重现步骤是什么?
1. 物联网平台的broker服务中,比如EventPropertyPostFunction里保存数据进入influxdb中,目前看到代码是接收一条数据就保存一条数据进入influxdb。我用jmeter试了下,qps达到1w的时候,会导致连接influxdb连接不上,进而导致broker服务oom。请问这块的接收一条数据就保存一条数据进入influxdb逻辑,是否有考虑过还可以优化下?
deviceDataService.saveDeviceProperty(topicVariables, params);
二、你期待的结果是什么?实际看到的又是什么?
期待的结果:希望能优化下blade-broker服务中接收一条数据就保存一条数据进入influxdb的逻辑性能。
实际看到的:目前blade-broker服务中,接收一条数据就直接保存一条数据进入influxdb。
三、你正在使用的是什么产品,什么版本?在什么操作系统上?
正在使用的产品:BladeX物联网平台
版本:1.1.0
操作系统:Windows11
四、请提供详细的错误堆栈信息,这很重要。
五、若有更多详细信息,请在下面提供。
broker 服务的 jvm 内存配置的多少,批量之后数据会堆在内存队列里。压测比较耗内存,建议用2台机器 jmeter 移到另外一台。
添加 JVM 参数 -Xmn2G -Xms4G -Xmx4G 试试,实际生产可以按需再调大点。
我把broker的内存,分别从8g、16g、32g都试过,最后都出现了oom。下面是当时之前配置的8g的截图(16g和32g的当时没有记截图,效果也是像下面蓝色部分打满,最后oom)
这是当时配置的8g内存,并且使用的是zgc
device-simulator和broker在用的是docker上的2台服务器,jmeter是在本地windows上压测docker上的 device-simulator接口
flush-duration 需要调小,5s 的话相当于平均 1s 只写入 2000条,会导致更多的消息堆积。
实际是压测多久后出现 oom ?
麻烦看下 heapdump.hprof 有没有生成,麻烦压缩一下发我们分析一下,谢谢!
首先是报了很多influxdb连接被重置的异常,是几次压测都出了这个异常么?
jmeter压测大概几千就开始出现连接influxdb失败;出现oom跟broker设置的内存大小有关,比如8g内存,用1w的qps压测,印象里大概在10分钟之后就开始有了。记录过一次hprof,有点大,有邮箱吗,发到你邮箱?
扫一扫访问 Blade技术社区 移动端