技术周总结 2024.04.29-05.05

devtools/2024/10/22 16:27:20/

python_0">一、python的数据表处理

python">"""
删除 Doris库中某些表中无效的数据
"""
import mysql.connector
import socket
import socks
import pandas as pd
import pymysql
from sqlalchemy import create_engine, text
import csv
from datetime import datetime# Tidb数据库
def DorisTableInfo(databaseName, env):if env == "online":# Dorisdb = pymysql.connect(host="yourHost",port=6666,user="yourUser",password="yourPwd",database=databaseName)cursor = db.cursor()cursor.execute("set names utf8")cursor.execute("SET character_set_connection=utf8;")dbName = "MY_DB.tableName"sql="select id from %s where status = 'InValid' order by id asc limit 500000;" % (dbName)print("查询要删除的数据语句:", sql)cursor.execute(sql)data = cursor.fetchall()print("查询 %s 需要物理删除的数据量: " % (dbName), len(data))list = []for i in range(0, len(data)):list.append(data[i][0])# print(list)# 1000个一拆分listItem=group_list(list, 1000)for i in range(len(listItem)):deleteIds = ','.join(str(item) for item in listItem[i])deleteSql = "delete from %s where  id in (%s)" % (dbName, deleteIds)print("[%s/%s]" % (i, len(listItem)), deleteSql)cursor.execute(deleteSql)def group_list(lst, group_size):groups = {}for i, item in enumerate(lst):group_number = i // group_sizeif group_number not in groups:groups[group_number] = []groups[group_number].append(item)return [group for _, group in sorted(groups.items())]# Doris 数据库
databaseName = "MY_DB"env = "online"
print("start-------")
DorisTableInfo(databaseName, env)
print("done-------")

http://www.ppmy.cn/devtools/31638.html

相关文章

华为校招机试 - 满二叉搜索树查找(20240424)

在线OJ测试 题目详情 - 满二叉搜索树查找 - HydroOJ 题目描述 给定 (2^n) - 1 个不同的整数(1 ≤ n ≤ 10,n 为整数),构建一棵平衡满二叉搜索树。 二叉搜索树定义如下: 节点的左子树只包含小于当前节点的数节点的右子树只包含大于当前节点的数所有左子树和右子树自身必…

有限单元法-编程与软件应用(崔济东、沈雪龙)【PDF下载】

专栏导读 作者简介:工学博士,高级工程师,专注于工业软件算法研究本文已收录于专栏:《有限元编程从入门到精通》本专栏旨在提供 1.以案例的形式讲解各类有限元问题的程序实现,并提供所有案例完整源码;2.单元…

【stomp 实战】Spring websocket 用户订阅和会话的管理源码分析

通过Spring websocket 用户校验和业务会话绑定我们学会了如何将业务会话绑定到spring websocket会话上。通过这一节,我们来分析一下会话和订阅的实现 用户会话的数据结构 SessionInfo 用户会话 用户会话定义如下: private static final class Sessio…

Element-UI库:Web前端开发的强大助力

Element-UI库:Web前端开发的强大助力 一、引言二、Element-UI概述三、Element-UI的使用场景四、Element-UI的最佳实践五、Element-UI的未来发展趋势六、Element-UI的进阶应用七、Element-UI的性能优化八、结语使用Element-UI框架的代码示例示例1:基本按钮…

Linux服务器开发:C/S文件传输,整包,拆包,粘包问题

C/S文件传输 本文教你如何使用C语言在Linux服务器上教你传输文件。 三个概念 首先理解三个概念: 整包拆包粘包 整包: 整包是指一个完整的数据包,它在传输过程中没有被拆分或合并。在网络通信中,我们希望数据按照预定的格式被发…

Git-flow分支管理与Aone-flow分支管理对比

Git-flow分支管理与Aone-flow分支管理对比 git-flow分支管理: master: 主分支,主要用来版本发布。 hotfix:线上 bug 紧急修复用到的临时分支。这个分支用来修复主线master的BUG release(预发布分支):rel…

引领农业新质生产力,鸿道(Intewell®)操作系统助力农业机器人创新发展

4月27日至29日,2024耒耜国际会议在江苏大学召开。科东软件作为特邀嘉宾出席此次盛会,并为江苏大学-科东软件“农业机器人操作系统”联合实验室揭牌。 校企联合实验室揭牌 在开幕式上,江苏大学、科东软件、上交碳中和动力研究院、遨博智能研究…

代码随想录算法训练营Day29 | 491.递增子序列、46.全排列、47.全排列 II | Python | 个人记录向

注:5.1—5.3放假。 本文目录 491.递增子序列做题看文章 46.全排列做题看文章 47.全排列 II做题看文章 以往忽略的知识点小结个人体会 491.递增子序列 代码随想录:491.递增子序列 Leetcode:491.递增子序列 做题 写了一会,但捋不…