JAVA基础 - 如何使用split方法?

news/2025/1/15 6:32:52/

写在前面

在工作中一直使用split进行字串的分隔,但是始终没有认真研究过该方法,今天在使用该方法时遇到了一些问题,特进行学习记录。

遇到的问题

在使用“|”作为字串的分隔符的时候,分隔结果和预期不一样。

方法定义

// 从方法的实现上, 可以了解split的参数可以是正则表达式、任意字符、符号、数字、字符串等。

public String[] split(String regex) {
}

重点关注

因为split方法也支持正则表达式,而正则表达式存在特殊字符串的情况,这样就出现了上述问题,所以需要注意下表中的特殊字符。

特殊字符

特殊字符说明
$匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 ‘\n’ 或 ‘\r’。要匹配 $ 字符本身,请使用 \$。
( )标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符,请使用 \( 和 \)。
*匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 \*。
+匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 \+。
.匹配除换行符 \n之外的任何单字符。要匹配 .,请使用 \.。
[标记一个中括号表达式的开始。要匹配 [,请使用 \[。
?匹配前面的子表达式零次或一次,或指明一个非贪婪限定符。要匹配 ? 字符,请使用 \?。
\将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如, ‘n’ 匹配字符 ‘n’。‘\n’ 匹配换行符。序列 ‘\\’ 匹配 ‘\’,而 ‘\(’ 则匹配 ‘(’。
^匹配输入字符串的开始位置,除非在方括号表达式中使用,此时它表示不接受该字符集合。要匹配 ^ 字符本身,请使用 \^。
{标记限定符表达式的开始。要匹配 {,请使用 \{。
|指明两项之间的一个选择。要匹配 |,请使用 \|。

示例代码

// 1.如何使用|进行分隔?
String[] a = "a|b|c".split("\\|"); // 执行结果: [a, b, c]
// 2.如何使用.进行分隔?
String[] b = "a.b.c".split("\\."); // 执行结果: [a, b, c]
// 3.如何使用正则表达式进行分隔?
// 正则表达式:\d+表示一个或多个数字
String[] c = "a11b222c3333d".split("\\d+"); // 执行结果: [a, b, c, d]
// 4.如何使用多个不同的分隔符进行分隔?
// 分隔符可以有多个字符, 它们使用|分隔成左右两部分, 左右两边表达式之间是"或"的关系, 匹配左边或者右边.
String[] d = "a,b#c@d%%e".split(",|#|@|%%"); // 执行结果: [a, b, c, d, e]

高级进阶

// limit默认是0,regex表示正则表达式,limit用来参数控制分隔的次数。

public String[] split(String regex, int limit) {
}String[] e = "a@b@c@d@e@".split("@", -1);  // 执行结果: [a, b, c, d, e, ]
String[] f = "a@b@c@d@e@".split("@", 0);   // 执行结果: [a, b, c, d, e]
String[] g = "a@b@c@d@e@".split("@", 1);   // 执行结果: [a@b@c@d@e@]
String[] h = "a@b@c@d@e@".split("@", 2);   // 执行结果: [a, b@c@d@e@]
String[] i = "a@b@c@d@e@".split("@", 100); // 执行结果: [a, b, c, d, e, ]
String[] j = "@@@".split("@", 100); // 执行结果: [, , , ]
String[] k = "bo:and:fo".split("o", 100); // 执行结果: [b, :and:f, ]
String[] l = "boo:and:foo".split("o", 100); // 执行结果: [b, , :and:f, , ]
String[] m = "booo:and:fooo".split("o", 0); // 执行结果: [b, , , :and:f]

// 1. 字符串开头出现分隔符,其余部分正常分隔,开头会分隔出一个空字符串。
// 2. 分隔符紧挨着,其余部分正常分隔,分隔符之间也会分隔出一个空字符串。
// 3. 字符串末尾出现分隔符,其余部分正常分隔,末尾会分隔出一个空字符串,是否丢弃末尾的空格需要判断limit的值:
A. 如果 limit < 0,匹配到多少次,就分隔多少次,数组可以是任何长度,结尾的空字符串不会丢弃;
B. 如果 limit = 0,匹配到多少次,就分隔多少次,数组可以是任何长度,并且结尾空字符串将被丢弃;
C. 如果 limit = 1,不进行分隔,直接将字串变成长度为1的数组;
D. 如果 limit > 1,(从左到右)最多分隔 n - 1 次,数组的长度将不会大于n, 结尾的空字符串不会丢弃。


http://www.ppmy.cn/news/104270.html

相关文章

Android使用多模块+MVI+Koin+Flow构建项目框架

Android使用多模块MVIKoinFlow构建项目框架 前言模块路由核心接口&#xff0c;用于在模块中绑定路由对应关系使用建造者模式定义传递的参数创建路由加载核心类, 本质上包含了一个全局路由表跳转类使用 MVI封装介绍&#xff0c;本质上使用flow作为核心定义数据类型&#xff0c;该…

I2C通信协议MPU6050

目录 I2C通信协议 硬件 软件 I2C时序 MPU6050 I2C通信协议 硬件 为了避免总线没协调好导致电源短路&#xff0c;配置为开漏输出&#xff0c;所有设备输出低电平不输出高电平&#xff0c;即右图。又为了避免高电平造成的引浮空&#xff0c;&#xff08;第三点&#xff09;总…

浏览器兼容性:CSS 回退属性

一个 CSS 类可以由许多声明组成&#xff0c;每个声明都具有property: value语法的语法&#xff1a; .cls {property: value; } 可以为同一个属性设置不同的值。稍后出现的值会覆盖它之前的值。浏览器将尝试使用最后的声明。在无法识别声明的情况下&#xff0c;它将回退到以前…

MapReduce【数据压缩】

目录 概述 压缩的优缺点 优点 缺点 压缩的原则 MapReduce支持的压缩编码 压缩算法对比 压缩性能比较 压缩方式的选择 Gzip 压缩 Bzip2 压缩 Lzo 压缩 Snappy 压缩 压缩位置选择 压缩位置选择 1、输入端采用压缩 2、Mapper输出采用压缩 3、Reducer输出采用压缩…

SpringBoot框架面试专题(初级-中级)-第一节

欢迎大家一起探讨相关问题&#xff0c;我们共同进步&#xff0c;喜欢的话可以关注点赞&#xff0c;后续会持续更新&#xff0c;谢谢&#xff5e; 问题&#xff1a; 1.Spring Boot是什么&#xff1f;它与Spring Framework有什么区别&#xff1f; 解析&#xff1a; Spring Bo…

Rust 笔记:WebAssembly 的 JavaScript API

WebAssembly WebAssembly 的 JavaScript API 作者&#xff1a;李俊才 &#xff08;jcLee95&#xff09;&#xff1a;https://blog.csdn.net/qq_28550263?spm1001.2101.3001.5343 邮箱 &#xff1a;291148484163.com 本文地址&#xff1a;https://blog.csdn.net/qq_28550263/ar…

【研究生学术英语读写教程翻译 中国科学院大学Unit10】

研究生学术英语读写教程翻译 中国科学院大学Unit10 Unit 10 The Doctors Dilemma: ls lt Ever Good to Do Harm?医生的困境:伤害永远是好事吗?Unit 10 The Doctor’s Dilemma: ls lt Ever Good to Do Harm? 医生的困境:伤害永远是好事吗? Gwen Adshead Medical knowled…

Clion开发STM32之OTA升级模块(最新完整版)

前言 程序分为上位机部分、BootLoader、App程序上位机程序使用的是C#进行开发&#xff0c;目前只做成控制台部分开发环境依然选择Clion芯片采用的是stm32f103vet6升级模块已和驱动层逻辑进行分离 BootLoader程序 Flash分区定义 头文件 #ifndef STM32F103VET6_PROJECT_APP_FL…