两种高效计算 两个经纬度之间距离的方法--解决Haversine 公式性能慢的问题

news/2025/2/15 18:10:01/

目录

前言    

Haversine

原理

实现代码

优化后的距离计算

原理

代码

性能及精度对比


前言    

 最新开发的业务中,涉及到计算两个经纬度之间的距离。已知A点和B点的 经纬度,计算A点到B点之间的距离。最开始使用的是Haversine公式来进行计算,但上线后出现严重的性能问题,主要原因是业务数据量太大,每天PB级的数据量。

因此,需要研究一个更高效便捷的计算方法,下面将介绍Haversine公式和实现代码,以及新的计算公式&代码,并对他们的性能及精度进行分析。

Haversine

原理

Haversine 公式是一种用于计算球面上两个坐标点之间距离的数学公式,特别适用于地球上的球面距离计算。该公式基于球面三角学,利用球面上两点间的弧长来计算它们之间的距离。这个公式的形式如下:

总的来说,Haversine 公式通过计算球面上两点间的弧长,提供了一种相对精确的球面距离计算方法。这种方法在小球面(如地球)上非常常见,并在航海、导航等领域广泛应用。

实现代码

public class DistanceCalculator {// 地球半径,单位为千米private static final double EARTH_RADIUS = 6371.0;// 将角度转换为弧度private static double toRadians(double degree) {return degree * Math.PI / 180.0;}// 计算两个经纬度之间的距离,返回结果单位为千米public static double calculateDistance(double lat1, double lon1, double lat2, double lon2) {double dLat = toRadians(lat2 - lat1);double dLon = toRadians(lon2 - lon1);double a = Math.sin(dLat / 2) * Math.sin(dLat / 2) +Math.cos(toRadians(lat1)) * Math.cos(toRadians(lat2)) *Math.sin(dLon / 2) * Math.sin(dLon / 2);double c = 2 * Math.atan2(Math.sqrt(a), Math.sqrt(1 - a));return EARTH_RADIUS * c;}public static void main(String[] args) {// 示例坐标:纬度 Latitude 1: 40.748817, 经度 Longitude 1: -73.985428// 示例坐标:纬度 Latitude 2: 34.052235, 经度 Longitude 2: -118.243683double distance = calculateDistance(40.748817, -73.985428, 34.052235, -118.243683);System.out.println("Distance between the two coordinates: " + distance + " km");}
}

如果对计算性能不是特别严苛,可以优先使用Haversine 公式来进行计算。但是对于TB级或者PB量级的数据业务来说,这个公式由于计算过于复杂,存在比较大的性能问题。

通过火焰图分析,主要是Math.atan2() 函数的计算开销比较大。

优化后的距离计算

原理

使用弧度计算的简单直线距离计算公式:

由于地球的半径很大,在一个很小的区域内(公里级)可以近似成一个平面,这里直接采用勾股定理来计算直线距离。虽然精度可能会略有降低,但是由于计算公式很简单,性能会有极大提升。

代码

public class SimpleDistanceCalculator {// 将角度转换为弧度private static double toRadians(double degree) {return degree * Math.PI / 180.0;}// 计算两个经纬度之间的简易直线距离,返回结果单位为千米public static double calculateSimpleDistance(double lat1, double lon1, double lat2, double lon2) {double dLat = toRadians(lat2 - lat1);double dLon = toRadians(lon2 - lon1);// 使用简化的直线距离公式double distance = Math.sqrt(dLat * dLat + dLon * dLon) * 60 * 1.852;return distance;}public static void main(String[] args) {// 示例坐标:纬度 Latitude 1: 40.748817, 经度 Longitude 1: -73.985428// 示例坐标:纬度 Latitude 2: 34.052235, 经度 Longitude 2: -118.243683double simpleDistance = calculateSimpleDistance(40.748817, -73.985428, 34.052235, -118.243683);System.out.println("Simple distance between the two coordinates: " + simpleDistance + " km");}
}

性能及精度对比

前者计算1千万次使用的时间为:4462ms

优化后计算1千万次使用的时间为:244ms

优化后耗时为原来的 5.4%。

精度上,在短距离(例如 5 公里以内),Haversine 公式和等矩形投影(简化后的方法)之间的精度差异可能不会很大。在这个范围内,球面和平面的差异相对较小,因此简化的方法通常能够提供足够的精度。

然而,具体的精度差异会受到多个因素的影响,包括具体的坐标位置、所使用的地球半径,以及计算时是否考虑了地球的椭球形状等。因此,很难给出一个具体的数字来表示它们之间的精度差异。

为了获取更准确的精度比较,最好的方法是使用实际的测试数据,并比较两种方法得到的结果。你可以选择一些已知距离的坐标点,分别使用 Haversine 公式和等矩形投影计算它们之间的距离,然后比较计算结果。

本人的一个实际路测,在5公里范围内,大约存在5%到15% 之间的差异。


http://www.ppmy.cn/news/1291982.html

相关文章

六、基于Flask、Flasgger、marshmallow的开发调试

基于Flask、Flasgger、marshmallow的开发调试 问题描述调试方法一调试方法二调试方法三 问题描述 现在有一个传入传出为json格式文件的,Flask-restful开发的程序,需要解决如何调试的问题。 #!/usr/bin/python3 # -*- coding: utf-8 -*- # Project :…

15 Linux 按键

一、Linux 按键驱动原理 其实案件驱动和 LED 驱动很相似,只不过区别在于,一个是读取GPIO高低电平,一个是从GPIO输出高低电平。 在驱动程序中使用一个整形变量来表示按键值,应用程序通过 read 函数来读取按键值,判断按键…

【docker】linux部署docker

简介 首先我需要声明的是,我的系统是centos7,下载工具使用的是yum;在linux上部署docker,之前一直看的是这篇文章Linux之Docker部署,基本上功能方面也都可以使用,部署起来也是比较的简单。首先我先讲述这篇…

【Android】如何设置应用程序启动Activity(应用启动时显示的界面)

前言 在Android中&#xff0c;AndroidManifest.xml文件可以通过修改来设置应用启动时显示的界面&#xff0c;即启动Activity。 操作步骤 打开AndroidManifest.xml文件。 在文件中找到想要设置为启动Activity的<activity>元素。该元素通常在<application>元素内部…

阿里云Alibaba Cloud Linux 2镜像操作系统版本大全

Alibaba Cloud Linux阿里云打造的Linux服务器操作系统发行版&#xff0c;Alibaba Cloud Linux完全兼容完全兼容CentOS/RHEL生态和操作方式&#xff0c;目前已经推出Alibaba Cloud Linux 3&#xff0c;阿里云百科aliyunbaike.com分享Alibaba Cloud Linux 2版本特性说明&#xff…

数字IC后端实现之快速获取innovus中drv violation的所有net list

在Innovus中place_opt_design和optDesign阶段&#xff0c;我们经常会看到如下所示的log提示信息&#xff0c;核心关键词是“ Reasons for remaining drv violations”。而且告诉我们总共有819条net存在drv violation&#xff0c;且无法被工具优化掉。 Reasons for remaining dr…

【网络】网络层IP地址和IP数据报的格式

&#x1f984; 个人主页——&#x1f390;开着拖拉机回家_Linux,大数据运维-CSDN博客 &#x1f390;✨&#x1f341; &#x1fa81;&#x1f341;&#x1fa81;&#x1f341;&#x1fa81;&#x1f341;&#x1fa81;&#x1f341; &#x1fa81;&#x1f341;&#x1fa81;&am…

【MATLAB】EEMD_LSTM神经网络时序预测算法

有意向获取代码&#xff0c;请转文末观看代码获取方式~也可转原文链接获取~ 1 基本定义 EEMD-LSTM神经网络时序预测算法是一种结合了扩展经验模态分解&#xff08;EEMD&#xff09;和长短期记忆神经网络&#xff08;LSTM&#xff09;的时间序列预测方法。 EEMD是一种改进的EM…