由MapTile引发的ResultSet的思考及实践

news/2024/10/22 17:22:20/

其实这篇文章应该是上周末来写的,但是苦逼啊。别人都抱怨工作996,我特么直接9117了,连轴转12天,完全没有个人时间,苦逼啊!

本来周末计划看完龙珠Z(日语)布欧篇 呢,给自己一个过儿童节的仪式感,结果也只看了一点,时间太紧张了。

要写的代码、要总结的东西太多了。至于ResultSet这个,从梳理思路、验证逻辑、查阅资料、理解原理、总结记录,又花了我小一天时间,搞到半夜。

一、背景

我五一的时候,写脚本通过代理爬取osm的栅格瓦片数据(即PNG图片),来将我之前写的wkt在线绘制展示_EPSG4326_致敬开源实现瓦片本地化。

对于瓦片数据来说,整个世界都是正方形的,如下图。

瓦片数据按层级划分如下

zoom leveledge lengthnumber of tiles
011*1
122*2
244*4
388*8
41616*16
53232*32
66464*64
7128128*128
8256256*256
9512512*512
1010241024*1024
1120482048*2048
1240964096*4096
1381928192*8192
141638416384*16384
153276832768*32768
166553665536*65536
17131072131072*131072
18262144262144*262144
19524288524288*524288

想要爬取所有层级的栅格瓦片,数据量还是很大的。我从0层级一直爬取到19层级,需要存储14_3165_5765个瓦片,我存入了PostgreSQL。数据库肯定要有对应的可视化工具才好使呀,对于咱们这种面向SQL编程的码农来说,最常见的数据库可视化工具就两种

  • dbeaver:开源免费
  • navicat:闭源付费

在结合这两个工具进行操作时,偶然发现,navicat和dbeaver中执行相同的SQL语句 select * from tiles 时,navicat会出现卡死无响应的情况,而dbeaver不仅不会卡、还会快速的查出前200条数据来。

怎么会出现这种情况呢,按理来说,navicat是闭源付费的,应该做的比dbeaver更好才对啊。

针对这个问题,我从原生的JDBC展开了探索。

二、ResultSet查询调优

以下调优只针对于PostgreSQL数据库。并不适用其他数据库。

通过自己手撕原生的JDBC查询ResultSet、以及查阅pgJDBC官方文档发现有两种查询方式。

  • 默认参数结果集,驱动程序会一次性收集查询的所有结果行,通俗说是多量少次。这也是我们最常使用的方式了,但是数据量大时,会卡爆程序内存和网络带宽。
  • 参数调优结果集,需要关闭查询时的事务,通俗说是少量多次。对于pg来说,查询时的事务也是默认开启的。这个方式对程序来说是性能最优之选。

pgJDBC文档描述如下图

下面就直接进行实战,源码地址为meethigher/result-set-test: this is a postgresql result-set demo

java">/*** 方案一:* 使用select * from table where order by 进行查询,但是使用默认方式*/
private void plan1(String startTime, String endTime) {StringBuilder queryBuilder = new StringBuilder("select * from ").append(jdbcUtils.getTableName()).append(" where ").append(jdbcUtils.getFieldArray()[2]).append(" >= ? and ").append(jdbcUtils.getFieldArray()[2]).append(" <= ? order by ").append(jdbcUtils.getFieldArray()[2]).append(" asc");long start = System.currentTimeMillis();long startUsedMemory = memoryMonitor.getUsedMemory();try (Connection connection = jdbcUtils.getJdbcTemplate().getDataSource().getConnection()) {PreparedStatement ps = connection.prepareStatement(queryBuilder.toString());ps.setObject(1, startTime);ps.setObject(2, endTime);ResultSet rs = ps.executeQuery();log.info("plan1 consumed {}, {}", TimeUtils.humanizedFormat(System.currentTimeMillis(), start),memoryMonitor.convertBytes(memoryMonitor.getUsedMemory() - startUsedMemory));} catch (Exception ignore) {}
}/*** 方案二:* 使用select * from table where order by 进行查询,但是使用参数调优*/
private void plan2(String startTime, String endTime) {StringBuilder queryBuilder = new StringBuilder("select * from ").append(jdbcUtils.getTableName()).append(" where ").append(jdbcUtils.getFieldArray()[2]).append(" >= ? and ").append(jdbcUtils.getFieldArray()[2]).append(" <= ? order by ").append(jdbcUtils.getFieldArray()[2]).append(" asc");long start = System.currentTimeMillis();long startUsedMemory = memoryMonitor.getUsedMemory();try (Connection connection = jdbcUtils.getJdbcTemplate().getDataSource().getConnection()) {//对于postgresql,只有关闭事务,setFetchSize才会生效connection.setAutoCommit(false);//对于postgresql,后面的两个参数其实也就是默认值时使用的PreparedStatement ps = connection.prepareStatement(queryBuilder.toString(), ResultSet.TYPE_FORWARD_ONLY, ResultSet.CONCUR_READ_ONLY);ps.setFetchSize(1000);ps.setFetchDirection(ResultSet.FETCH_FORWARD);ps.setObject(1, startTime);ps.setObject(2, endTime);ResultSet rs = ps.executeQuery();log.info("plan2 consumed {}, {}", TimeUtils.humanizedFormat(System.currentTimeMillis(), start),memoryMonitor.convertBytes(memoryMonitor.getUsedMemory() - startUsedMemory));} catch (Exception ignore) {}
}

运行结果如下图

综上可知,其实对于这种大数据量来说少量多次的查询远比多量少次的查询要好的多,至少对程序和数据库来说,都是上上只选。这应该也就是navicat会卡死、而dbeaver不仅不会卡死而且查得还很快的原因了吧!

三、参考致谢

How to calculate number of tiles in a bounding box for OpenStreetMaps | by Abhi | Medium

Tiles à la Google Maps: Coordinates, Tile Bounds and Projection | No code | MapTiler

Issuing a Query and Processing the Result | pgJDBC

PostgreSQL: Documentation: 7.4: Issuing a Query and Processing the Result


http://www.ppmy.cn/news/1466346.html

相关文章

【会议征稿,SPIE独立出版】第五届计算机视觉和数据挖掘国际学术会议(ICCVDM 2024)

第五届计算机视觉与数据挖掘国际学术会议&#xff08;ICCVDM 2024&#xff09;将于2024年7月19-21日在中国长春举行。此前&#xff0c;ICCVDM系列会议于2020年在中国西安、2021年在中国长沙&#xff08;线上&#xff09;、2022年在中国呼伦贝尔&#xff08;线上线下&#xff09…

[个人总结]-java常用方法

1.获取项目根路径 user.dir是一个系统属性&#xff0c;表示用户当前的工作目录&#xff0c;大多数情况下&#xff0c;用户的当前工作目录就是java项目的根目录&#xff08;src文件的同级路径&#xff09; System.getProperty("user.dir") 结果&#xff1a;D:\code…

OrangePi AIpro 变身 Android 打包机

主板基本信息介绍 OrangePi AIpro&#xff0c;是香橙派联合华为精心打造&#xff0c;建设人工智能新生态而设计的一款开发板&#xff0c;这次为大家分享下我上手的这款 OrangePi AIpro 8GB&#xff08;算力达8TOPS&#xff09; 的一些小小的经验。 基本参数如下&#xff1a; …

C语言 带头双向循环链表的基本操作

带头双向循环链表的基本操作 结构体定义初始化创建新节点头插头删尾插尾删查找在指定位置之后插入删除指定位置的值打印 结构体定义 typedef int DataType; typedef struct LinkNode {DataType data;struct LinkNode* prev;struct LinkNode* next; }LNode;初始化 有两种初始化…

鸿蒙OS 路由跳转

路由跳转 在鸿蒙开发中&#xff0c;路由跳转是页面之间进行切换的基本方式。以下是一些常见的路由跳转方法&#xff1a; 1. **使用Route装饰器**&#xff1a;在需要跳转的页面上添加Route装饰器&#xff0c;并指定一个唯一的路由路径。例如&#xff1a; java Route(path "…

面试题--this关键字

this 指向是前端面试中的常问题型&#xff0c;简单分析为以下几种&#xff1a; 1. 在全局作用域中&#xff0c;this 关键字固定指向全局对象 window 或者 global。 2. 在函数作用域中&#xff0c;取决于函数是如何被调用的。 1&#xff09;函数直接调用&#xff0c;this 指向…

基于安卓的虫害识别软件设计--(2)模型性能可视化|混淆矩阵、热力图

1.混淆矩阵&#xff08;Confusion Matrix&#xff09; 1.1基础理论 &#xff08;1&#xff09;在机器学习、深度学习领域中&#xff0c;混淆矩阵常用于监督学习&#xff0c;匹配矩阵常用于无监督学习。主要用来比较分类结果和实际预测值。 &#xff08;2&#xff09;图中表达…

golang的http客户端封装

简介 net/http 是 Go 语言标准库的一部分&#xff0c;它提供了创建 HTTP 客户端和服务器的能力。这个包通过简化与 HTTP 协议的交互&#xff0c;让开发者能够方便地构建 HTTP 请求和响应&#xff0c;以及处理路由等任务。 本文以 net/http 包作为底层&#xff0c;封装一个包含…