Java基础知识(11)

ops/2024/10/10 18:46:30/

Java基础知识(11)

(包括:IO流高级流,网络爬虫基础,Commons-i0工具包和Hutool工具包)

目录

Java基础知识(11)

一.IO流高级流

1.缓冲流

【1】字节缓冲流

(1)基础知识

(2)方法

[2] 字符缓冲流(其实基本流里已经有缓冲区了,速度提升不大)

(1)构造方法

(2)字符缓冲流特有方法

2.转换流

【1】转换流是字符流和字节流之间的桥梁

【2】作用

(1)作用1:

(2)作用2:

3.序列化流/对象操作输出流

(1)可以把Java中的对象写到本地文件中

(2)构造方法

(3)成员方法

(4)案例

(5)序列化流的小细节

4. 反序列化流 /对象操作输入流

(1)可以把序列化到本地文件中的对象,读取到程序中来

(2)构造方法

(3)成员方法

(4)序列化流/反序列化流的细节汇总

5. 打印流

【1】分类:打印流一般是指:PrintStream,PrintWriter两个类

【2】字节打印流(字节流底层没有缓冲区,开不开自动刷新都一样)

(1)构造方法

(2)成员方法

【3】字符打印流(字符流底层有缓冲区,想要自动刷新需要开启)

(1)构造方法

(2)成员方法

6. 解压缩流

(1)解压本质:把每一个ZipEntry按照层级拷贝到本地另一个文件夹中

(2)例子:

7. 压缩流

(1)压缩本质:把每一个(文件/文件夹)看成ZipEntry对象放到压缩包中

(2)例子:

8. Commons-i0

9. Hutool工具包

10.网络爬虫

(1)前置知识案例

(2)网络爬虫案例

1)

2)

3)Hutool中有类似的方法,上面仅供理解!!!!


一.IO流高级流

1.缓冲流

【1】字节缓冲流
(1)基础知识

BufferedinputStream 字节缓冲输入流

BufferedOutputStream字节缓冲输出流

原理:底层自带了长度为8192的缓冲区提高性能

(2)方法

1)public BufferedInputStream(InputStream is)把基本流包装成高级流,提高读取数据的性能

2)public BufferedOutputStream(0utputStream os) 把基本流包装成高级流,提高写出数据的性能

3)案例

BufferedInputStream bis = new BufferedInputStream(new FileInputstream( name: "myio\\a.txt"));

BufferedoutputStream bos = new BufferedoutputStream(new File0utputstream( name: "myio\\copy.txt"));

[2] 字符缓冲流(其实基本流里已经有缓冲区了,速度提升不大)
(1)构造方法

public BufferedReader(Reader r) 把基本流变成高级流

public Bufferedwriter(Writer r) 把基本流变成高级流

(2)字符缓冲流特有方法

字符缓冲输入流特有方法:

public string readLine() 读取一行数据,如果没有数据可读了,会返回null

字符缓冲输出流特有方法:

public void newLine() 跨平台的换行

2.转换流

【1】转换流是字符流和字节流之间的桥梁
【2】作用
(1)作用1:

1)指定字符集读写

2)案例

//创建对象并指定字符编码

InputStreamReader isr = new InputStreamReader(new FileInputStream(mvio\lgbkfile.txt"),“GBK”);

(在JDK11有更好的方法:FileReader fr=new FileReader("myio\\gbkfile,txt",charset.forName("GBK"));)

(2)作用2:

1)字节流想要使用字符流中的方法

2)案例

FileInputStream fis = new FileInputStream( name: "myio\la.txt");

InputStreamReader isr=new InputStreamReader(fis);

BufferedReader br =new BufferedReader(isr);

string str= br.readLine();

即:BufferedReader br = new BufferedReader(new InputstreamReader(new fileInputstream( name: "myio\\a.txt")));

3.序列化流/对象操作输出流

(1)可以把Java中的对象写到本地文件中
(2)构造方法

public ObjectOutputStream(0utputStream out)  把基本流包装成高级流

(3)成员方法

public final void write0bject(object obj)把对象序列化(写出)到文件中去

Student stu = new student( name:"zhangsan",age: 23);

(4)案例

ObjectOutputstream oos = new objectoutputstream(new File0utputstream( name: "myio\la.txt"));

oos.writeobject(stu);

(5)序列化流的小细节

使用对象输出流将对象保存到文件时会出现NotserializableException异常

解决方案:需要让Javabean类实现Serializable接口(标记性接口)

4. 反序列化流 /对象操作输入流

(1)可以把序列化到本地文件中的对象,读取到程序中来
(2)构造方法

public objectInputstream(Inputstream out) 把基本流变成高级流

(3)成员方法

public object readobject()把序列化到本地文件中的对象,读取到程序中来(需要进行强转)

(4)序列化流/反序列化流的细节汇总

① 使用序列化流将对象写到文件时,需要让Javabean类实现Serializable接口,否则,会出现NotSerializableException异常

② 序列化流写到文件中的数据是不能修改的,一旦修改就无法再次读回来了

③ 序列化对象后,修改了Javabean类,再次反序列化,会不会有问题?

会出问题,会抛出InvalidclassException异常

解决方案:给lavabean类添加serialVersionUID(列号、版本号)

private static final long serialVersionUID = -6357601841666449654L;

可用idea自动生成。

④如果一个对象中的某个成员变量的值不想被序列化,又该如何实现呢?

解决方案:给该成员变量加transient关键字修饰,该关键字标记的成员变量不参与序列化过程

⑤如果需要将多个对象进行序列化,一般规定将其放入一个集合中,序列化集合

5. 打印流

【1】分类:打印流一般是指:PrintStream,PrintWriter两个类

特点1:打印流只操作文件目的地,不操作数据源

特点2:特有的写出方法可以实现,数据原样写出

例如:打印:97 文件中:97

特点3:特有的写出方法,可以实现自动刷新,自动换行

打印一次数据=写出+换行+刷新

【2】字节打印流(字节流底层没有缓冲区,开不开自动刷新都一样)
(1)构造方法

public Printstream(0utputStream/File/string) 关联字节输出流/文件/文件路径(重要)

public PrintStream(String fileName,Charset charset) 指定字符编码(重要)

public PrintStream(OutputStream out,boolean autoFlush) 自动刷新

public PrintStream(0utputStream out,boolean autoFlush, String encoding) 指定字符编码且自动刷新

(2)成员方法

public void write(int b) 常规方法:规则跟之前一样,将指定的字节写出

public void println(Xxx xx) 特有方法:打印任意数据,自动刷新,自动换行

public void print(Xxx xx) 特有方法:打印任意数据,不换行

public void printf(String format,Object... args)特有方法:带有占位符的打印语句,不换行

【3】字符打印流(字符流底层有缓冲区,想要自动刷新需要开启)
(1)构造方法

public PrintWriter(Write/File/String) 关联字节输出流/文件/文件路径

public PrintWriter(String fileName, charset charset) 指定字符编码

public PrintWriter(Write w,boolean autoFlush) 自动刷新

public PrintWriter(0utputStream out, boolean autoFlush, charset charset) 指定字符编码且自动刷新

(2)成员方法

public void write(int b) 常规方法:规则跟之前一样,写出字节或者字符串

public void println(Xxx xx) 特有方法:打印任意数据,自动刷新,自动换行

public void print(Xxx xx) 特有方法:打印任意数据,不换行

public void printf(String format,Object... args)特有方法:带有占位符的打印语句,不换行

6. 解压缩流

(1)解压本质:把每一个ZipEntry按照层级拷贝到本地另一个文件夹中
(2)例子:

//创建一个解压缩流用来读取压缩包中的数据

ZipInputstream zip = new ZipInputstream(new FileInputstream(src));

//要先获取到压缩包里面的每一个zipentry对象

//表示当前在压缩包中获取到的文件或者文件夹

ZipEntry entry;

while((entry= zip.getNextEntry())!= nu11){

System.out.println(entry);

}

7. 压缩流

(1)压缩本质:把每一个(文件/文件夹)看成ZipEntry对象放到压缩包中
(2)例子:

public static void tozip(File src,File dest)throws IoException {

//1.创建压缩流关联压缩包

Zipoutputstream zos = new zipoutputstream(new File0utputstream(new File(dest, child: "a.zip")));

//2.创建zipEntry对象,表示压缩包里面的每一个文件和文件夹

ZipEntry entry = new zipEntry( name:"a.txt");

//3.把ZipEntry对象放到压缩包当中

zos.putNextEntry(entry);

//4.把src文件中的数据写到压缩包当中

FileInputstream fis = new FileInputstream(src);

int b;

while((b=fis.read())!=-1){

zos.write(b);

zos.closeEntry();

zos.close();

}

8. Commons-i0

(1)简介

Commons-io是apache开源基金组织提供的一组有关I0操作的开源工具包。

作用:提高I0流的开发效率,

(2)Commons-io使用步骤

1)在项目中创建一个文件夹:lib

2)将jar包复制粘贴到lib文件夹

3)右键点击jar包,选择 Add as Library ->点击OK

4)在类中导包使用

5)文档在仅我可见中。

9. Hutool工具包

官网:
    https://hutool.cn/
API文档:
    https://apidoc.gitee.com/dromara/hutool/

中文使用文档:
    https://hutool.cn/docs/#/

10.网络爬虫

(1)前置知识案例

//Pattern:表示正则表达式

//Matcher:文本匹配器,作用按照正则表达式的规则去读取字符串,从头开始读取,在大串中去找符合匹配规则的子串。

//获取正则表达式的对象

Pattern p=Pattern.compile("Java\\d{0,2}");

//获取文本匹配器的对象

//m:文本匹配器的对象

//str:大串

//p:规则

//m:要在str中找符合p规则的小串

Matcher m=p.matcher(str);

//拿着文本匹配器从头开始读取,寻找是否有满足规则的子串

//如果没有,方法返回false

//如果有,返回true。在底层记录子串的起始索引和结束索引+1

//如:0,4

boolean b=m.find();

//方法底层会根据find方法记录的索引进行字符串的截取

//substring(起始索引,结束索引);包头不包尾

//(0,4)但是不包含4索引

//会把截取的小串进行返回。

string s1 = m.group();

System.out.println(s1);

//第二次在调用find的时候,会继续读取后面的内容

//读取到第二个满足要求的子串,方法会继续返回true

//并把第二个子串的起始索引和结束索引+1,进行记录

b = m.find();

//第二次调用group方法的时候,会根据find方法记录的索引再次截取子串

string s2 = m.group();

System.out.println(s2);

}

(2)网络爬虫案例
1)

public static string webcrawler(string net)throws Ioxception {

//1.定义stringBuilder拼接爬取到的数据

StringBuilder sb=new stringBuilder();

//2.创建一个URL对象

URL url = new URL(net);

//3.链接上这个网址

//细节:保证网络是畅通的,而且这个网址是可以链接上的。

URLConnection conn =url.openconnection();

//4.读取数据

InputstreamReader isr = new InputStreamReader(conn.getInputstream());

int ch;

while((ch=isr.read())!=-1){

sb.append((char)ch);

//5.释放资源

isr.close();

//6.把读取到的数据返回

return sb.tostring();

}

2)

//通过正则表达式,把其中符合要求的数据获取出来

private static Arraylist<string> getData(string str, string regex){

//1.创建集合存放数据

ArrayList<string>list = new ArrayList<>();

//2.按照正则表达式的规则,去获取数据

Pattern pattern = Pattern.compile(regex);

//3.按照pattern的规则,到str当中获取数据

Matcher matcher =pattern.matcher(str);

while(matcher.find()){

list.add(matcher.group(index));

}

return list;

}

3)Hutool中有类似的方法,上面仅供理解!!!!

http://www.ppmy.cn/ops/39096.html

相关文章

分布式锁之RedissonLock

什么是Redisson&#xff1f; 俗话说他就是看门狗&#xff0c;看门狗机制是一种用于保持Redis连接活跃性的方法&#xff0c;通常用于分布式锁的场景。看门狗的工作原理是&#xff1a;当客户端获取到锁之后&#xff0c;会对Redis中的一个特定的键设置一个有限的过期时间&#xff…

AI 大模型训练平台

涉及重点技术内容包括&#xff1a; 数据预处理技术 利用数据挖掘、自然语言处理中的正则匹配、文本去重等技术&#xff0c;对收集的专家知识库、专业标准、知识、逻辑机理、运维经验与运行数据等资料进行冗余字符过滤、重复值删除等处理&#xff0c;提升整体预料质量。 2.指令…

机器学习的一些知识点分享

下面数据集中&#xff0c;第2个样本的第4个属性的值是&#xff08; &#xff09;。 A 52 B 男 C 50 D 49 本题得分&#xff1a; 2分 正确答案&#xff1a; D 2.单选题 (2分) 10-折交叉验证是把数据集分成&#xff08; &#xff09;个子集&#xff0c;将其中&#xff…

爬虫-无限debug场景 解决方式

解决无限debug 场景1 1. 鼠标右键 选择 continue to here&#xff08;此处不停留&#xff09;2. 鼠标右键 选择 edite breakpoint 设置 10 保证条件不成立 这行永远不执行3.方法置空 1. 方法调用加断点2. 控制台 setInterval function name() {}4. 替换文件 5. hoo…

【JVM】了解JVM规范中的虚拟机结构

目录 JVM规范的主要内容 1&#xff09;字节码指令集(相当于中央处理器CPU) JVM指令分类 2&#xff09;Class文件的格式 3&#xff09;数据类型和值 4&#xff09;运行时数据区 5&#xff09;栈帧 6&#xff09;特殊方法 7&#xff09;类库 JVM规范的主要内容 1&#…

C++常用库函数——strcmp、strchr

1、strcmp&#xff1a;比较两个字符串的值是否相等 例如 char a1[6] "AbDeG",*s1 a1;char a2[6] "AbdEg",* s2 a2;s1 2;s2 2;printf("%d \n", strcmp(s1, s2));return(0); s1指向a1&#xff0c;s2指向a2&#xff0c;strcmp表示比较s1和s…

从 Servlet 到 SpringMvc

从 Servlet 到 SpringMvc 下图为 SpringMvc 的 DispatcherServlet 到 Servlet 的继承体系结构&#xff0c;从 HttpServletBean 开始的子类&#xff0c;便属于 Spring 的体系结构&#xff0c;Spring 框架中类似这种以 XXXBean 结尾是用于和其它框架进行整合的 JavaBean 对象&am…

SQL-Server数据库--视图

1.创建视图 create view as 子查询 子查询可以是任意发杂的select语句&#xff0c;但通常不允许含有order by和distinct短语 --使用T-SQL语句创建新视图view_score, 要求只显示学生的学号、姓名、课号、课程名称及成绩。 create view view_score as select from tb_stude…