hive表格统计信息不准确

news/2024/9/22 20:57:25/

问题描述

有个hive分区表,orc存储格式,有个分区,查询 select count(1) from table where dt='yyyyMMdd' 结果是0, 但查询 select * from table where dt='yyyyMMdd'又能查到数据,去hdfs对应目录下查看,也能看到有数据文件

解决

执行如下sql

ANALYZE TABLE db.table1 PARTITION(dt='20240908') COMPUTE STATISTICS

然后,重新查询count(1),结果恢复正确

参考

https://blog.51cto.com/u_16213353/7719891
https://imperio-wxm.github.io/2019/02/21/Hive-Table-Statistics/


http://www.ppmy.cn/news/1523821.html

相关文章

【JavaEE初阶】多线程(1)

欢迎关注个人主页:逸狼 创造不易,可以点点赞吗~ 如有错误,欢迎指出~ 目录 并发编程 线程 与 进程 创建线程 写法1 写法2 写法3 写法4 写法5 Thread类的常见构造方法 前台/后台 线程 并发编程 并发编程: 通过写特殊的代码 把多个cpu的核心…

Java——踩坑Arrays.asList()

坑1:不能直接使用 Arrsys.asList() 来转换基本类型数据 public static void test1(){// 1、不能直接使用asList来转换基本类型数组int[] arr {1, 2, 3};List list Arrays.asList(arr);System.out.printf("list:%s size:%s class:%s", list, list.size(…

理解 RabbitMQ:生产者、连接、通道、交换机、队列与消费者的消息流

在分布式消息系统中,RabbitMQ 是一个非常流行的消息代理。它的核心理念是解耦应用程序的生产者和消费者,使得消息能够可靠地从一方传递到另一方。本文将带你深入了解 RabbitMQ 中 生产者、连接、通道、交换机、队列 和 消费者 之间的消息流,并…

Agent探索之OpenAI方式调用本地模型(one-api)

介绍 https://github.com/songquanpeng/one-api OpenAI 接口管理 & 分发系统,支持 Azure、Anthropic Claude、Google PaLM 2 & Gemini、智谱 ChatGLM、百度文心一言、讯飞星火认知、阿里通义千问、360 智脑以及腾讯混元,可用于二次分发管理 key&…

0910作业+思维导图

一、作业(实现一个闹钟) 1、代码 #include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this);//调整标签页大小this->resize(800,400);//lab:显示系统时间…

《C++》解密--算法复杂度

要正式开通C博客之路啦!! 一、数据结构 1、数据结构定义 数据结构 是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元 素的集合。 2、算法定义 算法 就是定义良好的计算过程,他取一个或一组的值为…

2024年录屏神器大盘点,轻松捕捉屏幕精彩

现在讲解一些操作越来越便捷了,我 一般都是用录屏工具来边录制操作边讲解,这样可以更方便对方了解操作步骤。这次我就分享几款免费录屏工具一起来试试吧。 1.福晰录屏软件 链接:www.foxitsoftware.cn/REC/ 对于初次尝试录屏的新手来说&…

JavaScript进阶day2

目录 1.深入对象 1.1 创建对象三种方式 1.2 构造函数 1.2.1 基本语法 1.2.2 实例化执行过程 1.3 实例成员&静态成员 1.4 小结 2.内置构造函数 2.1 Object 2.1.1 Object.keys 2.1.2 Object.values 2.1.3 Object. assign对象拷贝 2.2 Array 2.2.1 Array.reduce 2.2.2 案例 2.…