对于Oracle,MySQL,SQL Server重复数据删除

news/2024/12/2 15:58:42/

问题前提

之前做过数据入湖,建表的时候匆忙,没有做主键,导致入湖出现了重复数据。举个例子:

idnameagesex
1用户121
1用户121
1用户121

存在了如上两条及两条数据,目的是要去除重复数据,只保留一条,从而设置id为主键。

Oracle

Oracle如果存在重复数据,id设置主键时,会有02437报错。

对于Oracle去处重复数据是最简单的,每行自带rowid。

DELETE 
FROMuser 
WHEREid IN ( SELECT id FROM user GROUP BY id HAVING count( id ) > 1 ) AND rowid NOT IN (SELECTmin( rowid ) FROMuser  GROUP BYid 
HAVINGcount( id )> 1)

执行如上语句即可删除重复数据。

因为本地没有Oracle数据库,就不做演示了。

MySQL

MySQL没有rowid,那么MySQL解决办法只有一种,把A表的数据去重添加到B表中,在B表中设置id为主键,最后把B表重命名为A表。

INSERT INTO user1 ( SELECT DISTINCT * FROM user );

暂不清楚,数据量大的情况下会不会出现崩溃,可以通过limit截取。

如果不确定A表的数据是否全部添加到B表,可以添加完成后,执行

DELETE FROM user WHERE user.id IN (SELECT user1.id FROM user1)

这种方式当然也适用于其他数据库。

当然MySQL还有另外一种方式,就是新增一个字段为自增字段且不为null,让其自动填充,类似充当Orcal中的rowid。

填充完成后。

DELETE 
FROMuser 
WHEREuser.rowid NOT IN (SELECTdt.minid FROM( SELECT MIN( user.rowid ) AS minid FROM user GROUP BY name ) dt )

有多种方式,可参考【mysql】mysql删除重复记录并且只保留一条_mysql删除完全重复数据只保留一条_千g的博客-CSDN博客

SQL Server

SQL Server 和MySQL逻辑是一样的,但语法上稍有变化

SELECT DISTINCT * INTO [dbo].[user1] FROM [dbo].[user]

SQL Server是不需要创建user1表的,会自动创建,数据导入到新表后再设置主键即可。

另外一种设置自增rowid,执行:

DELETE 
FROM[dbo].[user] 
WHERE[dbo].[user].rowid NOT IN (SELECTdt.minid FROM( SELECT MIN( [dbo].[user].rowid ) AS minid FROM [dbo].[user] GROUP BY name ) dt )

后续

后续研究其他数据库,mongo等其他用到的数据库再做更新,


http://www.ppmy.cn/news/1116648.html

相关文章

【IntelliJ IDEA】切换jdk版本配置

需求描述 idea 2020.3.1 原来idea使用的是jdk8的版本,想换成jdk7的版本,该怎么配置呢?配置哪些地方呢? 解决方法 local1 先在Project Structure中,添加上刚安装的jdk7(它的安装目录) local…

双指针算法(超详细)

题目1-最长连续不重复子序列 给定一个长度为 n 的整数序列,请找出最长的不包含重复的数的连续区间,输出它的长度。 输入格式 第一行包含整数 n。 第二行包含 n 个整数(均在 0∼105 范围内),表示整数序列。 输出格式…

java用easyexcel按模版导出

首先在项目的resources下面建一个template包,之后在下面创建一个模版,模版格式如下: 名称为 financeReportBillStandardTemplateExcel.xlsx: {.fee}类型的属性值,是下面实体类的属性,要注意这里面的格式&a…

开源日报 0824 | 构建UI组件和页面的前端工作坊

Storybook 是一个用于构建 UI 组件和页面的前端工作坊,支持多种主流框架,提供丰富的插件,具有可配置性强和扩展性好的特点。 storybookjs/storybook Stars: 79.9k License: MIT Storybook 是一个用于构建 UI 组件和页面的前端工作坊&#x…

Laravel Swagger 使用完整教程

Swagger 使用 一、Swagger 基础1、 什么是Swagger2、 安装过程1 、composer安装2、添加服务提供者,引导框架运行时加载,在 app 配置文件,providers 选项中添加(laravel 5以上忽略此步骤)3、配置完成后,通过输入命令 **php artisan…

mac使用指南

新公司给配备了mac,可惜土鳖的我不会用,所以特地写了一篇文章记录学习mac的过程 快捷键 删除:commanddelete 光标移至最右/左:command右/左箭头 截图:commandshift3/4/5,3代表截全屏,4代表选…

TCP/IP客户端和服务器端建立通信过程

客户端和服务器端建立通信过程 客户端 connectToHost(const QString &, quint16 , QIODevice::OpenMode , QAbstractSocket::NetworkLayerProtocol )服务器端

在vscode中做实验出现的bug......

1、python如何调用opencv中的saliency模块 如果你已经安装了opencv-python的库,但是调用cv2.saliency方法时出现了如下的报错: module ‘cv2.saliency’ has no attribute ‘StaticSaliencySpectralResidual_create’ 这时你只需要卸载opencv-python库&a…