C# 字符串与正则表达式介绍

news/2025/2/11 21:07:50/

.NET学习资料

.NET学习资料

.NET学习资料


在 C# 编程中,字符串和正则表达式是处理文本数据时不可或缺的工具。深入理解它们的特性和用法,能够显著提升开发效率和代码质量。

一、C# 字符串

(一)字符串的不可变性

在 C# 中,字符串类型string是不可变的。这意味着一旦创建了一个字符串对象,其内容就无法直接更改。当对字符串进行诸如拼接、裁剪或替换等操作时,实际上会创建一个新的字符串对象,而非修改原有的对象。

这种不可变性设计基于多方面的考量:

性能优化:.NET 运行时可以对字符串进行缓存和共享。相同内容的字符串在字符串池(String Intern Pool)中可以共用内存,从而减少内存占用。例如:

string str1 = "Hello";
string str2 = "Hello";
Console.WriteLine(object.ReferenceEquals(str1, str2)); // 输出True,表明str1和str2指向同一个内存地址

安全性:在多线程环境下,不可变的字符串是安全的。多个线程可以同时读取相同的字符串对象,而无需担心数据被意外修改。

易于调试:不可变对象减少了意外更改的风险,使得代码调试和追踪更加容易。

(二)常用字符串操作方法

查找方法

IndexOf():查找某字符或字符串在目标字符串中第一次出现的下标,索引从 0 开始。若未找到对应数据,则返回 - 1。例如:

string text = "Hello, World!";
int index = text.IndexOf("World");
Console.WriteLine(index); // 输出7

LastIndexOf():查找某字符或字符串在目标字符串中最后一次出现的下标,若未找到则返回 - 1。例如:

string text = "Hello, World! World";
int lastIndex = text.LastIndexOf("World");
Console.WriteLine(lastIndex); // 输出13

Contains():检测字符串中是否包含指定的数据,返回布尔值。例如:

string text = "Hello, World!";
bool contains = text.Contains("Hello");
Console.WriteLine(contains); // 输出True
截取方法

Substring():从目标字符串中截取数据,有两种重载形式。一种是从指定位置截取到字符串末尾,另一种是从指定位置开始截取指定长度的字符。例如:

string text = "Hello, World!";
string sub1 = text.Substring(7);
string sub2 = text.Substring(0, 5);
Console.WriteLine(sub1); // 输出World!
Console.WriteLine(sub2); // 输出Hello
分割与连接方法

Split():根据指定的字符分割字符串,返回字符串数组。例如:

string text = "apple,banana,orange";
string[] fruits = text.Split(',');
foreach (string fruit in fruits)
{Console.WriteLine(fruit);
}

Join():使用指定字符串连接一些字符串,组成新的字符串。这是string的静态方法。例如:

string[] fruits = { "apple", "banana", "orange" };
string joined = string.Join(", ", fruits);
Console.WriteLine(joined); // 输出apple, banana, orange
替换方法

Replace():使用指定字符或字符串替换目标字符串中的数据,常用于敏感词替换等场景。例如:

string text = "Hello, World!";
string replaced = text.Replace("World", "C#");
Console.WriteLine(replaced); // 输出Hello, C#!
格式化方法

Format():用于格式化字符串,通过占位符将不同类型的数据插入到字符串中。例如:

string name = "Alice";
int age = 30;
string message = string.Format("My name is {0}, and I'm {1} years old.", name, age);
Console.WriteLine(message); // 输出My name is Alice, and I'm 30 years old.

(三)StringBuilder 类

由于string的不可变性,在需要频繁修改字符串的场景下,会产生大量临时对象,影响性能。此时,StringBuilder类应运而生。StringBuilder是可变的,适用于高性能的字符串操作。

例如,当进行大量字符串拼接时:

// 使用string
string result1 = "";
for (int i = 0; i < 1000; i++)
{result1 += i.ToString();
}// 使用StringBuilder
StringBuilder sb = new StringBuilder();
for (int i = 0; i < 1000; i++)
{sb.Append(i.ToString());
}
string result2 = sb.ToString();

可以明显看出,使用StringBuilder在性能上更具优势,因为它直接在原对象上进行修改,避免了大量临时字符串对象的创建。

二、C# 正则表达式

(一)正则表达式基础语法

正则表达式是一种用于匹配和操作文本的强大工具,它通过特定的字符模式来描述文本的特征。

字符匹配

.:匹配除换行符之外的任何单个字符。例如,模式a.c可以匹配abc、a1c等。

[字符集合]:匹配字符集合中的任意一个字符。例如,[aeiou]可以匹配任何一个元音字母。

[^字符集合]:匹配不在字符集合中的任意一个字符。例如,[^0-9]可以匹配任何非数字字符。

数量限定符

*:匹配前面的子表达式零次或多次。例如,a*可以匹配空字符串、a、aa等。

+:匹配前面的子表达式一次或多次。例如,a+可以匹配a、aa等,但不能匹配空字符串。

?:匹配前面的子表达式零次或一次。例如,a?可以匹配空字符串或a。

{n}:匹配前面的子表达式恰好n次。例如,a{3}只能匹配aaa。

{n,}:匹配前面的子表达式至少n次。例如,a{3,}可以匹配aaa、aaaa等。

{n,m}:匹配前面的子表达式至少n次,最多m次。例如,a{3,5}可以匹配aaa、aaaa、aaaaa。

边界匹配

^:匹配输入字符串的开始位置。例如,^Hello表示以Hello开头的字符串。

$:匹配输入字符串的结束位置。例如,World$表示以World结尾的字符串。

(二)常用正则表达式示例

验证数字

只能输入数字:^(0-9)*$

只能输入 n 位的数字:^\d{n}$

只能输入至少 n 位的数字:^\d{n,}$

只能输入 m~n 位的数字:^\d{m,n}$

只能输入零和非零开头的数字:^(0|(1-9)\d*)$

验证邮箱地址
^\w+((-\w+)|(\.\w+))*\@\w+((\.|-)\w+)*\.\w+$
验证 URL 地址
^http(s)?://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$

(三)在 C# 中使用正则表达式

在 C# 中,使用System.Text.RegularExpressions命名空间来操作正则表达式。主要涉及的类有Regex和Match、MatchCollection。

例如,验证一个字符串是否为有效的邮箱地址:

using System;
using System.Text.RegularExpressions;class Program
{static void Main(){string email = "test@example.com";string pattern = @"^\w+((-\w+)|(\.\w+))*\@\w+((\.|-)\w+)*\.\w+$";bool isMatch = Regex.IsMatch(email, pattern);if (isMatch){Console.WriteLine("Valid email address.");}else{Console.WriteLine("Invalid email address.");}}
}

如果需要获取匹配的具体内容,可以使用Regex.Match方法返回Match对象,或使用Regex.Matches方法返回MatchCollection对象。例如:

string text = "The quick brown fox jumps over the lazy dog. The dog is cute.";
string pattern = @"dog";
MatchCollection matches = Regex.Matches(text, pattern);
foreach (Match match in matches)
{Console.WriteLine("Match found at index {0}: {1}", match.Index, match.Value);
}

C# 字符串和正则表达式在文本处理中各有其独特的作用。字符串提供了基本的文本操作功能,而正则表达式则能实现更复杂的模式匹配和文本验证。在实际编程中,应根据具体需求灵活运用它们,以实现高效、准确的文本处理。


http://www.ppmy.cn/news/1571240.html

相关文章

centOS8安装MySQL8设置开机自动启动失败

提供一个终极解决方案虽然systemctl 更符合管理预期但是不能用 使用一下命令 修改配置文件、修改mysql.service全是问题 systemctl start mysqld systemctl enable mysqld systemctl daemon-reload完全不生效各种报错 提示配置文件内容有问题 Main process exited, codeexite…

go并发和并行

进程和线程 进程&#xff08;Process&#xff09;就是程序在操作系统中的一次执行过程&#xff0c;是系统进行资源分配和调度的基本单位&#xff0c;进程是一个动态概念&#xff0c;是程序在执行过程中分配和管理资源的基本单位&#xff0c;每一个进程都有一个自己的地址空间。…

WordPress博客在fnOS环境下的极简搭建与公网地址配置指南

文章目录 前言1. Docker下载源设置2. Docker下载WordPress3. Docker部署Mysql数据库4. WordPress 参数设置5. 飞牛云安装Cpolar工具6. 固定Cpolar公网地址7. 修改WordPress配置文件8. 公网域名访问WordPress 前言 你是否曾经为搭建自己的网站而头疼不已&#xff1f;是不是觉得…

React 中的 useMemo 和 useCallback 有什么区别?

useMemo 和 useCallback 是 React 中的两个 Hook,主要用于性能优化,但它们的用途和工作方式有所不同。以下是它们之间的主要区别: 1. useMemo 用途:用于记忆计算值。它可以避免在每次组件渲染时重新计算一个值,只有当依赖项发生变化时,才会重新计算。 返回值:返回缓存的…

【计算机网络基础】fa地址

Forwarding-Address 如果引入到OSPF中的外部路由的下一跳在一个OSPF路由域内&#xff0c;则在描述该外部路由的AS-External-LSA中&#xff0c;Forwarding Address应当被设置为ASBR路由表中该路由的下一跳。 PS&#xff1a;要是文章对你有用的话别忘了一键三连噢~

网络安全--边界安全

现在人们生活依赖互联网程度越来越高&#xff0c;网络安全也逐步进入人们日常视野&#xff0c;信用卡信息泄漏、开房记录被查询、商业机密泄漏等等&#xff1b;无不牵动着一个人、一个公司、甚至一个国家的神经。随着技术的发展&#xff0c;网络边界变得也越来越复杂&#xff0…

操作系统|ARM和X86的区别,存储,指令集

文章目录 主频寄存器寄存器在硬件中的体现是什么寄存器的基本特性硬件实现寄存器类型 内存和寄存器的区别内存&#xff08;Memory&#xff09;和磁盘&#xff08;Disk&#xff09;指令的执行ARM Cortex-M3与Thumb-2指令集Thumb-2 与流水线虚拟地址指令的执行 多核CPU芯片间的通…

自有服务与软件包

—— 小 峰 编 程 目录 ​编辑 一、自有服务概述 二、systemctl管理服务命令 1、显示服务 2、查看启动和停止服务 3、服务持久化 三、常用自有服务&#xff08;ntp,firewalld,crond) 1、ntp时间同步服务 1&#xff09;NTP同步服务器原理 2&#xff09;到哪里去找NPT服务…