大数据第六天

news/2024/10/18 12:20:03/

这里写目录标题

  • 问题
    • 解决问题
    • 查询插入(时间慢)
    • 练习sql
    • 数据清理

问题

FAILED: ParseException line 1:16 mismatched input ‘input’ expecting INPATH near ‘local’ in load statement
MismatchedTokenException(24!=155)

加载数据的时候出现了这个错误,我们解释一个这个错误是什么,具体说的是语法有问题,需要我们修改语法问题

失败:ParseException行1:16输入“input”不匹配,在load语句中应为靠近“local”的INPATH
MismatchedTokenException(24!=155)

这个翻译的原文

我导入的文件
在这里插入图片描述
这个才是正确的数据格式
在这里插入图片描述

解决问题

发现解决不了

这里写的就是有问题
错误的写法是 Input
正确的是 inpath
在这里插入图片描述

总是出现这个错误,我不知道怎么了

在这里插入图片描述
我就是在这个服务器上面还是还是没有成功

在这里插入图片描述
使用这个方式突然成功了

在这里插入图片描述
数据也没有问题

在这里插入图片描述

创建数据集表
在这里插入图片描述
数据
在这里插入图片描述
上传
在这里插入图片描述
结果

查询插入(时间慢)

INSERT INTO table student04 select id,name from student01 ;

在这里插入图片描述
这个时间大概有一个1分钟了把

练习sql

选择库

use test;

创建数据表的方式

CREATE table student04(
id int,
namet string
)
row format delimited
fields terminated by ',';

数据格式

在这里插入图片描述

加载本地数据库

load data local input '/root/hivedata/student.txt' into table student;

数据清理

有一些数据为空我们不需要如何进行处理的方式
在这里插入图片描述

我们只想要获取时间数据的方式
在这里插入图片描述

经纬度是一个数据如何分成俩个数据的方式
在这里插入图片描述

清理为空的数据
LENGTH(sender_gps) = 0

SELECT msg_time,sender_name,sender_gps from 
tb_msg_source 
WHERE  LENGTH(sender_gps) = 0
limit 10

获取时间段的数据
SUBSTR(msg_time,12,16)

select SUBSTR(msg_time,12,16) from tb_msg_source limit 10; 

分割数据的方式
split(sender_gps,“,”)[1]

SELECT split(sender_gps,",")[1] from tb_msg_source 

http://www.ppmy.cn/news/1440759.html

相关文章

上海计算机学会2022年9月月赛C++丙组T3阶乘尾零

题目描述 给定一个整数 n,n 的阶乘定义为 n!12⋯n 请计算在 n! 的十进制表示中,末尾有多少个连续的 00? 例如 n5,则n!120,末尾有 11 个 00,又12!47900160012!479001600,末尾有 22 个 00。 …

【k8s】(八)kubernetes1.29.4离线部署之-测试验证

(一)kubernetes1.29.4离线部署之-安装文件准备 (二)kubernetes1.29.4离线部署之-镜像文件准备 (三)kubernetes1.29.4离线部署之-环境初始化 (四)kubernetes1.29.4离线部署之-组件安装…

谷歌收录工具有什么好用的?

如果是想促进谷歌的收录,其实能用的手段无非就两个,谷歌GSC以及爬虫池 谷歌gsc就不用说了,作为谷歌官方提供的工具,他能提供最准确的数据,并且可以提交每天更新的链接,进而促进收录,只要你的页面…

网上打印店哪家比较好?网上打印店推荐

随着互联网的快速发展,网上打印店逐渐成为了现代人解决打印需求的新选择。然而,面对众多网上打印店,很多用户会感到困惑:哪家打印店比较好?哪家打印店能提供优质的服务和实惠的价格?今天,我们就…

【AI导师写作】毕业论文答辩PPT生成

无论是大专、本科或者硕博,撰写毕业论文、开题报告、文献综述、任务书、课程论文、调研报告等都是必不可少的一件事。而这些任务重往往都需要我们花费大量的时间和精力,而“AI导师写作”在这一方面无疑提供了高效和便捷。可毕业季的论文答辩也是每个学者…

Check the `candidate.safety_ratings` to see if the respoe was blocked.

ValueError:“response.text”快速访问器仅适用于简单(单“部分”)文本响应。此响应不是简单的文本。请改用“result.parts”访问器或完整的“result.candidates[index].content.parts”查找。期号 #170 谷歌-双子座/生成-人工智能-python Gi…

基于深度学习的车牌识别

如果你认为车牌只是车子的‘名字’,那么是时候让你见识一下,当科技赋予它‘超能力’时会发生什么? 上效果图; 这就是车牌识别的力量,下面是主函数代码: # -*- coding: UTF-8 -*- import argparse import …

kafka学习1 - 线程、进程消息通信方式、JMS模型、Kafka原理图

1、线程和线程之间的数据交互 两个不同的线程之间是可以通过堆内存的方式进行数据交互的; T1线程的数据发送得到堆内存,T2线程就可以共享堆内存的数据。 存在的问题: T1线程发送数据的速率是50/s,T2线程消费的速率是30/s&#…