PostgreSQL 高阶函数详解:全面深入的功能与实用示例

devtools/2024/9/22 20:21:03/

PostgreSQL 高阶函数详解

PostgreSQL 是一款功能强大的开源关系数据库管理系统,以其丰富的功能和高扩展性著称。在数据处理和分析方面,PostgreSQL 提供了一系列高阶函数,可以极大地简化和优化各种复杂操作。本文将详细介绍 PostgreSQL 的高阶函数,涵盖递归查询、数学函数、集合操作符、字符串函数、JSON 函数、时间函数、聚合函数以及地理空间函数。通过全面的示例和详尽的解释,帮助你深入理解和灵活运用这些高阶函数,提高数据处理的效率和效果。

1. 递归查询(Recursive Queries)

递归查询用于处理层次结构数据,如组织结构或目录树。

1.1 WITH RECURSIVE

  • 示例: 计算组织结构的所有下属员工。

    WITH RECURSIVE org_chart AS (SELECTemployee_id,manager_id,employee_nameFROMemployeesWHEREmanager_id IS NULLUNION ALLSELECTe.employee_id,e.manager_id,e.employee_nameFROMemployees eINNER JOINorg_chart oONe.manager_id = o.employee_id
    )
    SELECT*
    FROMorg_chart;
    

    解释:

    • WITH RECURSIVE:定义递归查询
    • UNION ALL:将递归结果与基本结果合并。
    • 第一部分选择顶级员工(没有经理的员工),第二部分递归地选择所有下属员工。

1.2 LATERAL

  • 示例: 使用 LATERAL 展开一个数组。

    SELECTemployee,unnest(departments) AS department
    FROMemployees
    CROSS JOIN LATERALunnest(departments);
    

    解释:

    • CROSS JOIN LATERAL:允许在查询的每一行中引用前面的列。
    • unnest(departments):将数组展开成多行。

2. 数学函数(Mathematical Functions)

数学函数用于执行各种数学计算。

2.1 ABS

  • 示例: 计算工资的绝对值。

    SELECTemployee,salary,ABS(salary) AS abs_salary
    FROMemployees;
    

    解释: ABS(salary) 计算工资的绝对值。

2.2 ROUND

  • 示例: 将工资四舍五入到最近的整数。

    SELECTemployee,salary,ROUND(salary) AS rounded_salary
    FROMemployees;
    

    解释: ROUND(salary) 将工资四舍五入到最近的整数。

2.3 CEILFLOOR

  • 示例: 计算工资的天花板值和地板值。

    SELECTemployee,salary,CEIL(salary) AS ceil_salary,FLOOR(salary) AS floor_salary
    FROMemployees;
    

    解释:

    • CEIL(salary):向上取整工资。
    • FLOOR(salary):向下取整工资。

2.4 POWER

  • 示例: 计算工资的平方。

    SELECTemployee,salary,POWER(salary, 2) AS salary_squared
    FROMemployees;
    

    解释: POWER(salary, 2) 计算工资的平方。

2.5 SQRT

  • 示例: 计算工资的平方根。

    SELECTemployee,salary,SQRT(salary) AS salary_sqrt
    FROMemployees;
    

    解释: SQRT(salary) 计算工资的平方根。

2.6 RANDOM

  • 示例: 生成一个随机数。

    SELECTemployee,salary,RANDOM() AS random_value
    FROMemployees;
    

    解释: RANDOM() 生成一个 0 到 1 之间的随机浮点数。

2.7 TRUNC

  • 示例: 截断工资到小数点后的指定位置。

    SELECTemployee,salary,TRUNC(salary, 2) AS truncated_salary
    FROMemployees;
    

    解释: TRUNC(salary, 2) 将工资截断到小数点后 2 位。

3. 集合操作符(Set Operators)

集合操作符用于处理和组合结果集。

3.1 UNION

  • 示例: 合并两个不同部门的员工列表。

    SELECTemployee_name
    FROMemployees
    WHEREdepartment = 'Sales'
    UNION
    SELECTemployee_name
    FROMemployees
    WHEREdepartment = 'Marketing';
    

    解释: UNION 合并两个结果集,并自动去重。

3.2 UNION ALL

  • 示例: 合并两个部门的员工列表,包括重复的员工。

    SELECTemployee_name
    FROMemployees
    WHEREdepartment = 'Sales'
    UNION ALL
    SELECTemployee_name
    FROMemployees
    WHEREdepartment = 'Marketing';
    

    解释: UNION ALL 合并两个结果集,包括重复的行。

3.3 INTERSECT

  • 示例: 查找两个部门共有的员工。

    SELECTemployee_name
    FROMemployees
    WHEREdepartment = 'Sales'
    INTERSECT
    SELECTemployee_name
    FROMemployees
    WHEREdepartment = 'Marketing';
    

    解释: INTERSECT 返回两个结果集的交集。

3.4 EXCEPT

  • 示例: 查找只在销售部门工作的员工,不在市场部门工作的员工。

    SELECTemployee_name
    FROMemployees
    WHEREdepartment = 'Sales'
    EXCEPT
    SELECTemployee_name
    FROMemployees
    WHEREdepartment = 'Marketing';
    

    解释: EXCEPT 返回第一个结果集中的行,但不在第二个结果集中出现的行。

4. 窗口函数(Window Functions)

窗口函数用于对结果集的一个窗口进行计算,而不会改变结果集的行数。

4.1 ROW_NUMBER

  • 示例: 给每个员工分配一个唯一的序号。

    SELECTemployee_name,salary,ROW_NUMBER() OVER (ORDER BY salary DESC) AS row_num
    FROMemployees;
    

    解释: ROW_NUMBER() OVER (ORDER BY salary DESC) 为员工按工资降序排序并分配一个唯一的序号。

4.2 RANK

  • 示例: 给每个员工分配一个排名,处理重复值时赋相同排名。

    SELECTemployee_name,salary,RANK() OVER (ORDER BY salary DESC) AS rank
    FROMemployees;
    

    解释: RANK() OVER (ORDER BY salary DESC) 为员工按工资降序排序并分配排名,处理重复值时赋相同排名。

4.3 DENSE_RANK

  • 示例: 与 RANK 类似,但没有排名的空缺。

    SELECTemployee_name,salary,DENSE_RANK() OVER (ORDER BY salary DESC) AS dense_rank
    FROMemployees;
    

    解释: DENSE_RANK() OVER (ORDER BY salary DESC) 为员工按工资降序排序并分配排名,处理重复值时不跳过排名。

4.4 NTILE

  • 示例: 将员工分为四组,并为每个组分配一个组号。

    SELECTemployee_name,salary,NTILE(4) OVER (ORDER BY salary DESC) AS quartile
    FROMemployees;
    

    解释: NTILE(4) OVER (ORDER BY salary DESC) 将员工按工资降序排序并分为四组。

4.5 LEADLAG

  • 示例: 比较当前工资与下一个员工工资的差异。

    SELECTemployee_name,salary,LEAD(salary, 1) OVER (ORDER BY salary) AS next_salary,LAG(salary, 1) OVER (ORDER BY salary) AS prev_salary
    FROMemployees;
    

    解释:

    • LEAD(salary, 1):返回当前行之后指定偏移量的值。
    • LAG(salary, 1):返回当前行之前指定偏移量的值。

5. 字符串函数(String Functions)

字符串函数用于处理和操作文本数据。

5.1 CONCAT

  • 示例: 将名字和姓氏连接在一起。

    SELECTCONCAT(first_name, ' ', last_name) AS full_name
    FROMemployees;
    

    解释: CONCAT(first_name, ' ', last_name) 将名字和姓氏连接在一起。

5.2 TRIM

  • 示例: 去掉名字中的多余空格。

    SELECTTRIM(employee_name) AS trimmed_name
    FROMemployees;
    

    解释: TRIM(employee_name) 去掉名字中的前后空格。

5.3 SUBSTRING

  • 示例: 提取员工名字的前两个字符。

    SELECTemployee_name,SUBSTRING(employee_name FROM 1 FOR 2) AS name_prefix
    FROMemployees;
    

    解释: SUBSTRING(employee_name FROM 1 FOR 2) 提取员工名字的前两个字符。

5.4 REPLACE

  • 示例: 替换名字中的中间名。

    SELECTemployee_name,REPLACE(employee_name, 'MiddleName', 'NewMiddleName') AS updated_name
    FROMemployees;
    

    解释: REPLACE(employee_name, 'MiddleName', 'NewMiddleName') 替换名字中的中间名。

6. JSON 函数(JSON Functions)

JSON 函数用于处理 JSON 数据类型。

6.1 JSON_AGG

  • 示例: 聚合员工数据为 JSON 数组。

    SELECTJSON_AGG(employee) AS employees_json
    FROMemployees;
    

    解释: JSON_AGG(employee) 聚合员工数据为 JSON 数组。

6.2 JSON_BUILD_OBJECT

  • 示例: 将员工信息构建为 JSON 对象。

    SELECTJSON_BUILD_OBJECT('employee_name', employee_name,'salary', salary) AS employee_json
    FROMemployees;
    

    解释: JSON_BUILD_OBJECT 将员工信息构建为 JSON 对象。

6.3 JSONB_SET

  • 示例: 更新 JSONB 列中的字段。

    UPDATEemployees
    SETdetails = JSONB_SET(details, '{salary}', '60000')
    WHEREemployee_id = 1;
    

    解释: JSONB_SET(details, '{salary}', '60000') 更新 JSONB 列中的工资字段。

7. 时间函数(Date and Time Functions)

时间函数用于处理日期和时间数据。

7.1 AGE

  • 示例: 计算员工从某日期起的年龄。

    SELECTemployee_name,AGE(hire_date) AS age
    FROMemployees;
    

    解释: AGE(hire_date) 计算员工从雇佣日期起的年龄。

7.2 DATE_TRUNC

  • 示例: 将日期截断到月份级别。

    SELECTDATE_TRUNC('month', hire_date) AS start_of_month
    FROMemployees;
    

    解释: DATE_TRUNC('month', hire_date) 将日期截断到月份的开始。

7.3 NOWCURRENT_TIMESTAMP

  • 示例: 获取当前日期和时间。

    SELECTNOW() AS current_time,CURRENT_TIMESTAMP AS current_timestamp;
    

    解释:

    • NOW():获取当前日期和时间。
    • CURRENT_TIMESTAMP:获取当前日期和时间。

8. 聚合函数(Aggregate Functions)

聚合函数用于对数据集进行汇总。

8.1 SUM

  • 示例: 计算员工的总工资。

    SELECTSUM(salary) AS total_salary
    FROMemployees;
    

    解释: SUM(salary) 计算员工的总工资。

8.2 AVG

  • 示例: 计算员工的平均工资。

    SELECTAVG(salary) AS average_salary
    FROMemployees;
    

    解释: AVG(salary) 计算员工的平均工资。

8.3 COUNT

  • 示例: 计算员工的总数。

    SELECTCOUNT(*) AS employee_count
    FROMemployees;
    

    解释: COUNT(*) 计算员工的总数。

8.4 GROUP_CONCAT

  • 示例: 计算每个部门的员工名字列表。

    SELECTdepartment,STRING_AGG(employee_name, ', ') AS employee_names
    FROMemployees
    GROUP BYdepartment;
    

    解释: STRING_AGG(employee_name, ', ') 连接每个部门的员工名字。

9. 地理空间函数(Geospatial Functions)

地理空间函数用于处理地理数据。

9.1 ST_Distance

  • 示例: 计算两个地理点之间的距离。

    SELECTST_Distance(ST_MakePoint(longitude1, latitude1),ST_MakePoint(longitude2, latitude2)) AS distance
    FROMlocations;
    

    解释: ST_Distance 计算两个地理点之间的距离。

9.2 ST_Within

  • 示例: 查找位于某区域内的点。

    SELECTlocation_name
    FROMlocations
    WHEREST_Within(ST_MakePoint(longitude, latitude),ST_MakePolygon(geometry));
    

    解释: ST_Within 检查点是否在多边形区域内。

总结

本文详细介绍了 PostgreSQL 的各种高阶函数,涵盖了递归查询、数学函数、集合操作符、字符串函数、JSON 函数、时间函数、聚合函数以及地理空间函数。每个类别下的函数都配有详细的示例代码和解释,以帮助你更好地理解和应用这些功能。通过掌握这些高阶函数,你可以更高效地处理和分析数据,满足复杂的数据处理需求。无论是处理层次结构数据、进行数学计算、操作字符串、管理 JSON 数据、处理时间和日期、进行数据汇总,还是处理地理空间数据,PostgreSQL 的高阶函数都能为你提供强大的支持。希望本文能成为你深入了解和使用 PostgreSQL 的重要参考资料。



http://www.ppmy.cn/devtools/90393.html

相关文章

分析为什么在 PyTorch 中,训练好深度神经网络后要使用 model.eval()

🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 训练模式 VS 评估模式。首先,我们需要明确 PyTorch 中的模型存在两种重要模式:训练模式(training mode)与评估模式(evaluation mode&#xff…

荒原之梦考研:考研二战会很难吗?

考研二战是不是很难,其实很大程度上取决于我们自己,我们能否认清自己的优势,能否指定和执行合理的计划,有没有强大的心理支撑等,都是决定考研二战能否成功,或者能否比较轻松的成功的关键。 在本文中&#…

Memcached prepend 命令

Memcached prepend 命令 Memcached 是一种高性能的分布式内存对象缓存系统,通常用于缓存数据库调用、API响应或页面渲染等,以减轻后端数据库的负载,提高应用的响应速度。在 Memcached 中,prepend 命令用于向已存在键的值的开头添加数据。 命令语法 Memcached 的 prepend…

【链表OJ】常见面试题 2

文章目录 1.[链表分割](https://www.nowcoder.com/practice/0e27e0b064de4eacac178676ef9c9d70?tpId8&&tqId11004&rp2&ru/activity/oj&qru/ta/cracking-the-coding-interview/question-ranking)1.1 题目要求1.2 哨兵位法 2.[链表的回文结构](https://www.…

用 Python 编写的 OSINT 工具,用于通过用户名查找个人资料

NExfil是一个用 Python 编写的OSINT工具,用于通过用户名查找个人资料。几秒钟内,提供的用户名会在 350 多个网站上进行检查。该工具的目标是快速获得结果,同时保持较低的误报率。 可用 精选 隐私、安全和 OSINT 秀 https://soundcloud.com/…

Springboot利用大模型实现即时通信

gitee地址:https://gitee.com/myha/Springboot-langchain-chat 版本及工具说明 本项目版本:springboot3.2.8 jdk17 mybatis-plus3.5.7 安装python,可以参考:https://docs.python.org/zh-cn/3/using/windows.html#the-full-in…

抽象代数精解【9】

文章目录 流密码密码体制概述唯吉尼亚密码一、历史与背景二、加密算法三、特点与应用四、破译方法五、原理概述加密过程解密过程注意事项 流密码理论解释一、定义与原理二、特点与优势三、工作原理四、应用实例五、安全性与限制 RC4算法一、算法概述二、算法原理三、算法特点四…

按照指定格式打印pprint()

【小白从小学Python、C、Java】 【考研初试复试毕业设计】 【Python基础AI数据分析】 按照指定格式打印 pprint() [太阳]选择题 根据给定的Python代码,哪个选项是正确的? from pprint import pprint data { name: A, age: 30, hobbies:…