MySQL 的 JSON 查询

news/2025/4/1 0:25:09/

MySQL__JSON__1">MySQL 的 JSON 路径格式

MySQL 使用特定的 JSON 路径表达式语法来导航和提取 JSON 文档中的数据

基本结构

MySQL 中的 JSON 路径遵循以下通用格式

$[路径组件]

路径组件详解

| 操作符       | 描述      | 示例                  |
| ----------- | --------- | --------------------- |
| $           | 根对象     | $                    |
| . 或 []     | 成员访问   | $.name 或 $['name']   |
| [*]         | 数组通配符 | $.items[*]            |
| [n]         | 数组索引   | $[0]                 |
| [m to n]    | 数组范围   | $[1 to 3]            |
| **          | 递归通配符 | $**.price             |

1. 根对象 ($)

  • $ 表示整个 JSON 文档

2. 成员访问 (.[])

  • 点号表示法:$.store.book
  • 括号表示法:$['store']['book']
  • 当键名包含特殊字符或空格时使用括号表示法

3. 数组访问

  • 所有元素:$[*]$.array[*]
  • 指定索引:$[0] 计数是从0开始
  • 范围:$[1 to 3]MySQL 8.0.26+)

4. 通配符

  • * 匹配当前层级所有成员/元素
  • ** 递归搜索所有路径(MySQL 8.0.26+)

特殊语法元素

MySQL_804_50">1. 过滤表达式 (MySQL 8.0.4+)

$.items[?(@.price > 10)]
  • ? 引入过滤表达式
  • @ 表示当前元素

MySQL_8026_58">2. 路径范围 (MySQL 8.0.26+)

$[1 to 3]       // 第1到第3个元素
$[last-1]       // 倒数第二个元素
$[last-2 to last] // 最后三个元素

实际示例

简单路径

-- 提取标量值
SELECT JSON_EXTRACT('{"name": "张三", "age": 30}', '$.name');-- 数组元素, 输出 "b", 注意是带双引号的
SELECT JSON_EXTRACT('["a", "b", "c"]', '$[1]');

复杂路径

-- 嵌套对象
SELECT JSON_EXTRACT('{"store": {"book": {"title": "MySQL指南"}}}', '$.store.book.title');-- 对象数组
SELECT JSON_EXTRACT('{"items": [{"id": 1}, {"id": 2}]}', '$.items[*].id');

简写操作符

MySQL 提供常用操作的简写形式

  • -> : 等同于 JSON_EXTRACT()
  • ->> : 等同于 JSON_UNQUOTE(JSON_EXTRACT())
-- 以下两种写法等价:
SELECT json_column->'$.name';
SELECT JSON_EXTRACT(json_column, '$.name');-- 以下两种写法等价(返回去除引号的字符串):
SELECT json_column->>'$.name';
SELECT JSON_UNQUOTE(JSON_EXTRACT(json_column, '$.name'));

注意

  1. 路径表达式区分大小写
  2. 不存在的路径返回 NULL(不会报错)
  3. ** 递归操作符可能影响性能
  4. 过滤表达式支持比较运算符:=!=<>

MySQL__JSON_TABLE__117">MySQLJSON_TABLE 函数

使用过 JSON_EXTRACT 函数都知道, 这样获取的结果还不是真正的行列结构, MySQL 8.0 引入的 JSON_TABLE 函数可以将 JSON 数据转换为关系型表格格式, 将数组中的每个元素转换成表格中的一行数据.

JSON_TABLE 的功能

  1. 将 JSON 数组展开为多行记录
  2. 提取嵌套的 JSON 对象属性
  3. 将半结构化数据转为结构化数据

JSON_TABLE__127">JSON_TABLE 用法

JSON_TABLE(json_doc,       -- JSON 类型的字段或值path_expression -- JSON 路径表达式COLUMNS(        -- 新表的列定义column_name column_type PATH json_path [on_empty] [on_error],...)
) [AS] alias

参数说明

  1. json_doc:可以是 JSON 字符串字面量, 或者表中的 JSON 类型列
  2. path_expression:指向要展开的 JSON 数组的路径
  3. COLUMNS:定义输出列的结构
    • column_name:生成的列名
    • column_type:数据类型(如 VARCHAR, INT, JSON 等)
    • PATH:指定数据提取路径
  4. alias:必须提供的表别名

实际案例

将整数数组展开为一列多行

SELECT *
FROM JSON_TABLE('[1, 2, 3]','$[*]' COLUMNS(rowid FOR ORDINALITY,value INT PATH '$')
) AS t;

输出

rowid | value
------+-------
1     | 1
2     | 2
3     | 3

将对象数组展开为多列多行

SELECT *
FROM JSON_TABLE('[{"name":"张三","age":25},{"name":"李四","age":30}]','$[*]' COLUMNS(name VARCHAR(20) PATH '$.name',age INT PATH '$.age',adult VARCHAR(3) PATH '$.age' DEFAULT '否' ON EMPTY)
) AS t;

输出

name | age | adult
-----+-----+------
张三 | 25  | 否
李四 | 30  | 否

在数据表中展开

如果JSON是表中的一个字段, 可以使用 table_1 CROSS JOIN JSON_TABLE(...) 展开, 例如一个表 v_video 的字段 result 为 JSON 字段, 需要展开 result 中的一个成员 sequences, 写成SQL如下

SELECT e.id,e.match_id,e.result->>'$.id' AS json_id,j.tag->>'$.sf' AS sf_value,j.tag->>'$.ef' AS ef_value,j.tag->>'$.ef' - j.tag->>'$.sf'AS duration
FROM v_video eCROSS JOIN JSON_TABLE(e.result->'$.sequences','$[*]' COLUMNS (tag JSON PATH '$')) AS j ON e.match_id = 294

上面的SQL, 通过 CROSS JOIN JSON_TABLE 将每一行 e.result 字段下的 sequences 数组展开, 每个数组元素成为新字段 tag, 这时候还是一个 JSON, 然后在SELECT 中通过->>抽取其中的值, 得到完全展开的一个新表.

高级用法

FOR ORDINALITY 子句

生成自增的行号列

COLUMNS(id FOR ORDINALITY,...
)

嵌套路径处理

COLUMNS(NESTED PATH '$.nested_obj' COLUMNS(sub_col1 INT PATH '$.prop1',sub_col2 VARCHAR(10) PATH '$.prop2')
)

上面的例子用嵌套可以改写为

SELECT j.id,j.sf,j.ef,j.ef - j.sf AS duration
FROM v_video e
CROSS JOIN JSON_TABLE(e.result->'$.sequences','$[*]' COLUMNS (id FOR ORDINALITY,NESTED PATH '$' COLUMNS(ef INT PATH '$.ef',sf INT PATH '$.sf'))) AS j ON e.match_id = 294

上面的SQL, 通过 NESTED PATH ... COLUMNS(...) 将展开后数组中的一个JSON元素进一步展开为多个字段.

错误处理

COLUMNS(ef INT PATH '$.ef' NULL ON EMPTY NULL ON ERROR,sf INT PATH '$.sf' DEFAULT '0' ON EMPTY NULL ON ERROR
)

格式是

on_empty:{NULL | DEFAULT json_string | ERROR} ON EMPTYon_error:{NULL | DEFAULT json_string | ERROR} ON ERROR

注意事项

  1. MySQL 版本要高于8.0
  2. 路径表达式必须指向 JSON 数组, 注意是数组
  3. 必须为结果集指定别名
  4. 在 FROM 子句和 JOIN 子句中都可以使用
  5. 在性能上, 对大数据集使用 JSON_TABLE 可能较慢, 可以为 JSON 列创建函数索引提高查询性能

http://www.ppmy.cn/news/1584016.html

相关文章

HarmonyOS WebSocket全场景应用开发深度解析

注&#xff1a;适用版本&#xff08;Harmony OS NEXT / 5.0 / API 12 &#xff09; 一、最终效果预览 二、基础代码结构 Entry Component struct ChatApp {State messages: Message[] [] // 所有聊天记录State inputText: string "" // 输入框内容State isCon…

【NLP 48、大语言模型的神秘力量 —— ICL:in context learning】

目录 一、ICL的优势 1.传统做法 2.ICL做法 二、ICL的发展 三、ICL成因的两种看法 1.meta learning 2.Bayesian Inference 四、ICL要点 ① 语言模型的规模 ② 提示词prompt中提供的examples数量和顺序 ③ 提示词prompt的形式&#xff08;format&#xff09; 五、fine-tune VS I…

Go语言中html/template模块详细功能介绍与示例

Go语言的 html/template 模块是专门用于生成安全 HTML 输出的模板引擎&#xff0c;支持自动转义以防止 XSS 攻击。以下是该模块的核心方法及用法示例&#xff1a; 1. 基础模板解析与渲染 template.Parse 和 template.Execute 解析模板字符串并渲染数据。 package mainimport…

小林coding-12道Spring面试题

1.说一下你对 Spring 的理解?spring的核心思想说说你的理解&#xff1f; 2.Spring IoC和AOP 介绍一下?Spring的aop介绍一下?IOC和AOP是通过什么机制来实现的?怎么理解SpringIoc&#xff1f;依赖倒置&#xff0c;依赖注入&#xff0c;控制反转分别是什么&#xff1f;依赖注…

隐匿视角:七款局域网屏幕监控软件对企业数字神经系统架构的重塑效应探究

在当今竞争激烈的商业环境中&#xff0c;企业管理者对于全面掌握公司运营状况&#xff0c;尤其是员工在工作时间的状态有着强烈需求。局域网屏幕监控技术作为一种有效的管理手段&#xff0c;能够使管理者实时洞察员工的计算机操作行为&#xff0c;从而提升管理效率&#xff0c;…

Web Services 简介

Web Services 简介 概述 Web Services 是一种网络服务技术,允许不同的应用程序通过互联网进行交互和数据交换。随着互联网的普及和发展,Web Services 已经成为企业级应用中不可或缺的一部分。本文将详细介绍 Web Services 的概念、特点、应用场景以及相关的技术架构。 什么…

【C++标准IO库】输出缓冲区的管理

目录 一、输出缓冲区的基本概念 1.1 什么是输出缓冲区 1.2 输出缓冲区的工作原理 1.3 输出缓冲区的优点 1.4 与缓冲区管理相关的函数和类 二、刷新输出缓冲区的方法 2.1 使用操纵符刷新缓冲区 2.2 程序正常结束时刷新缓冲区 2.3 缓冲区满时自动刷新 2.4 使用 setbuf …

数据不互通、审批慢?如何实现多系统智能协同

在企业信息化建设的过程中&#xff0c;数据孤岛和复杂的审批流程常常成为实现高效协同的巨大障碍。对于许多组织来说&#xff0c;面对越来越复杂的业务需求&#xff0c;如何实现多系统智能协同不仅关乎效率&#xff0c;更直接影响企业的竞争力。 数据不互通和审批流程慢的痛点…