【SQL】筛选某一列字段中,截取含有关键词“XX”字段位置的前4个字段,去重后查看字段

devtools/2024/12/28 15:32:44/

最近在查询数据库的一些数据,想要统计表格里有多少公司,发现表格里没有公司这一列,只能从但是有一些标题字段,只能从中筛选。

假设关键词是[公司],我们要在数据库的表格中,找到名为title的列,列里面所有含有【公司】的名称,且因为公司名称不定,则直接公司前6位的字符,直接整理出一个名单出来

要清洗的数据格式类似这样:
在这里插入图片描述
想要实现的效果:
在这里插入图片描述

要实现这个需求,我们需要编写一个SQL查询,该查询要包含下面的条件:

  1. 需要从文本中筛选包含“公司”关键词的字段

  2. 需要找到“公司”关键词在字段中的位置,然后截取“公司”关键词位置前的X个字符(X 代表多少个,这个需要自己按照现实情况决定)

  3. 需要对重复数据做去重

以下是一个SQL查询的示例,假设你的表名为your_table,列名为title,我们将使用MySQL的函数作为示例:

sql">SELECT DISTINCT SUBSTRING(title, 1, CHAR_LENGTH(title) - CHAR_LENGTH(REPLACE(title, '公司', '')) + 6) AS company_name
FROM your_table
WHERE title LIKE '%公司%';

如果想要计算数值,在distinct前面加一个count就可以了

这个查询会做以下事情:

  1. REPLACE:替换掉字段中的所有关键词,替换为空字符串。

  2. CHAR_LENGTH(title) - CHAR_LENGTH(REPLACE(title, 'XX', ''))
    计算整体的关键词的总长度。

  3. CHAR_LENGTH(title) - CHAR_LENGTH(REPLACE(title, 'XX', '')) + 4
    计算“公司”关键词前4个字符的位置。

  4. SUBSTRING(title, 1, CHAR_LENGTH(title) - CHAR_LENGTH(REPLACE(title, '公司', '')) + 4)
    根据上一步计算的位置,截取“公司”关键词前的4个字符。

  5. DISTINCT:去除结果中的重复项。

  6. WHERE title LIKE '%公司%':筛选出title列中包含“公司”关键词的字段。

如果没有用CHAR_LENGTH 来计算长度的话,使用LEFT 也可以查询,但是会获取到标题的前N个字符:

SELECT COUNT(DISTINCT LEFT(your_column, 4)) AS unique_count
FROM your_table
WHERE your_column LIKE '%医院%';

http://www.ppmy.cn/devtools/146147.html

相关文章

OCR实践-问卷表格统计

前言 书接上文 OCR实践—PaddleOCROCR实践-Table-Transformer 本项目代码已开源 放在 Github上,欢迎参考使用,Star https://github.com/caibucai22/TableAnalysisTool 主要功能说明:对手动拍照的问卷图片进行统计分数(对应分数…

STM32 IAP技术 bootloader设计

介绍 IAP,即在应用程序内编程,就是在Flash中预留一套升级固件的boot程序,以实现通过串口/CAN总线实现 “程序升级”。 为什么要做这个boot程序?SWD接口不够用吗? 工程师在程序开发调试阶段肯定是用SWD接口,…

IPv6的报头

IPv6报文格式 整个IPv6包包括:基本报头、拓展包头、上层协议 基本报头: 基本报头一共8个字段,固定大小为40字节,每一个IPv6数据包都必须包含包头 Traffic Class:区分服务代码点,和v4的一样用于标识服务类…

无人机巡检大疆智图测绘技术详解

无人机巡检结合大疆智图测绘技术,为巡检工作带来了革命性的变化。以下是对这一技术的详细解析: 一、无人机巡检技术概述 无人机巡检是利用无人机对目标对象或区域进行巡检和监测的一种技术。通过无人机搭载的传感器,如高清相机、红外热像仪…

运算符 - 算术、关系、逻辑运算符

引言 在编程中,运算符是用于执行特定操作的符号。C 提供了多种类型的运算符,包括算术运算符、关系运算符和逻辑运算符等。理解这些运算符及其用法对于编写高效且无误的代码至关重要。本文将详细介绍 C 中的这三种基本运算符,并通过实例帮助读…

常见的限流算法

常见的限流算法 限流的定义固定窗口算法滑动窗口算法漏桶算法(推荐)令牌桶算法(推荐)限流粒度本地限流(单机限流)分布式限流(多机限流)分布式限流的实现 限流的定义 限流,也称流量控制。是指系统…

JavaScript 前端开发 是什么?

一、引言 JavaScript 作为前端开发领域的核心语言,在构建现代 Web 应用程序中发挥着至关重要的作用。从创建交互性网页元素到构建复杂的单页应用(SPA)和 Progressive Web App(PWA),JavaScript 的应用无处不…

AIGC与娱乐产业:颠覆创意与生产的新力量

个人主页:云边有个稻草人-CSDN博客 目录 引言 第一部分:AIGC技术概述 1.1 AIGC的基本原理 1.2 AIGC在娱乐产业中的应用 第二部分:AIGC在娱乐产业的实际应用案例 2.1 自动生成音乐:AIGC如何创作旋律 示例代码:使…