C# 字符串与正则表达式介绍

server/2025/2/7 18:24:34/

.NET学习资料

.NET学习资料

.NET学习资料


在 C# 编程中,字符串和正则表达式是处理文本数据时不可或缺的工具。深入理解它们的特性和用法,能够显著提升开发效率和代码质量。

一、C# 字符串

(一)字符串的不可变性

在 C# 中,字符串类型string是不可变的。这意味着一旦创建了一个字符串对象,其内容就无法直接更改。当对字符串进行诸如拼接、裁剪或替换等操作时,实际上会创建一个新的字符串对象,而非修改原有的对象。

这种不可变性设计基于多方面的考量:

性能优化:.NET 运行时可以对字符串进行缓存和共享。相同内容的字符串在字符串池(String Intern Pool)中可以共用内存,从而减少内存占用。例如:

string str1 = "Hello";
string str2 = "Hello";
Console.WriteLine(object.ReferenceEquals(str1, str2)); // 输出True,表明str1和str2指向同一个内存地址

安全性:在多线程环境下,不可变的字符串是安全的。多个线程可以同时读取相同的字符串对象,而无需担心数据被意外修改。

易于调试:不可变对象减少了意外更改的风险,使得代码调试和追踪更加容易。

(二)常用字符串操作方法

查找方法

IndexOf():查找某字符或字符串在目标字符串中第一次出现的下标,索引从 0 开始。若未找到对应数据,则返回 - 1。例如:

string text = "Hello, World!";
int index = text.IndexOf("World");
Console.WriteLine(index); // 输出7

LastIndexOf():查找某字符或字符串在目标字符串中最后一次出现的下标,若未找到则返回 - 1。例如:

string text = "Hello, World! World";
int lastIndex = text.LastIndexOf("World");
Console.WriteLine(lastIndex); // 输出13

Contains():检测字符串中是否包含指定的数据,返回布尔值。例如:

string text = "Hello, World!";
bool contains = text.Contains("Hello");
Console.WriteLine(contains); // 输出True
截取方法

Substring():从目标字符串中截取数据,有两种重载形式。一种是从指定位置截取到字符串末尾,另一种是从指定位置开始截取指定长度的字符。例如:

string text = "Hello, World!";
string sub1 = text.Substring(7);
string sub2 = text.Substring(0, 5);
Console.WriteLine(sub1); // 输出World!
Console.WriteLine(sub2); // 输出Hello
分割与连接方法

Split():根据指定的字符分割字符串,返回字符串数组。例如:

string text = "apple,banana,orange";
string[] fruits = text.Split(',');
foreach (string fruit in fruits)
{Console.WriteLine(fruit);
}

Join():使用指定字符串连接一些字符串,组成新的字符串。这是string的静态方法。例如:

string[] fruits = { "apple", "banana", "orange" };
string joined = string.Join(", ", fruits);
Console.WriteLine(joined); // 输出apple, banana, orange
替换方法

Replace():使用指定字符或字符串替换目标字符串中的数据,常用于敏感词替换等场景。例如:

string text = "Hello, World!";
string replaced = text.Replace("World", "C#");
Console.WriteLine(replaced); // 输出Hello, C#!
格式化方法

Format():用于格式化字符串,通过占位符将不同类型的数据插入到字符串中。例如:

string name = "Alice";
int age = 30;
string message = string.Format("My name is {0}, and I'm {1} years old.", name, age);
Console.WriteLine(message); // 输出My name is Alice, and I'm 30 years old.

(三)StringBuilder 类

由于string的不可变性,在需要频繁修改字符串的场景下,会产生大量临时对象,影响性能。此时,StringBuilder类应运而生。StringBuilder是可变的,适用于高性能的字符串操作。

例如,当进行大量字符串拼接时:

// 使用string
string result1 = "";
for (int i = 0; i < 1000; i++)
{result1 += i.ToString();
}// 使用StringBuilder
StringBuilder sb = new StringBuilder();
for (int i = 0; i < 1000; i++)
{sb.Append(i.ToString());
}
string result2 = sb.ToString();

可以明显看出,使用StringBuilder在性能上更具优势,因为它直接在原对象上进行修改,避免了大量临时字符串对象的创建。

二、C# 正则表达式

(一)正则表达式基础语法

正则表达式是一种用于匹配和操作文本的强大工具,它通过特定的字符模式来描述文本的特征。

字符匹配

.:匹配除换行符之外的任何单个字符。例如,模式a.c可以匹配abc、a1c等。

[字符集合]:匹配字符集合中的任意一个字符。例如,[aeiou]可以匹配任何一个元音字母。

[^字符集合]:匹配不在字符集合中的任意一个字符。例如,[^0-9]可以匹配任何非数字字符。

数量限定符

*:匹配前面的子表达式零次或多次。例如,a*可以匹配空字符串、a、aa等。

+:匹配前面的子表达式一次或多次。例如,a+可以匹配a、aa等,但不能匹配空字符串。

?:匹配前面的子表达式零次或一次。例如,a?可以匹配空字符串或a。

{n}:匹配前面的子表达式恰好n次。例如,a{3}只能匹配aaa。

{n,}:匹配前面的子表达式至少n次。例如,a{3,}可以匹配aaa、aaaa等。

{n,m}:匹配前面的子表达式至少n次,最多m次。例如,a{3,5}可以匹配aaa、aaaa、aaaaa。

边界匹配

^:匹配输入字符串的开始位置。例如,^Hello表示以Hello开头的字符串。

$:匹配输入字符串的结束位置。例如,World$表示以World结尾的字符串。

(二)常用正则表达式示例

验证数字

只能输入数字:^(0-9)*$

只能输入 n 位的数字:^\d{n}$

只能输入至少 n 位的数字:^\d{n,}$

只能输入 m~n 位的数字:^\d{m,n}$

只能输入零和非零开头的数字:^(0|(1-9)\d*)$

验证邮箱地址
^\w+((-\w+)|(\.\w+))*\@\w+((\.|-)\w+)*\.\w+$
验证 URL 地址
^http(s)?://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$

(三)在 C# 中使用正则表达式

在 C# 中,使用System.Text.RegularExpressions命名空间来操作正则表达式。主要涉及的类有Regex和Match、MatchCollection。

例如,验证一个字符串是否为有效的邮箱地址:

using System;
using System.Text.RegularExpressions;class Program
{static void Main(){string email = "test@example.com";string pattern = @"^\w+((-\w+)|(\.\w+))*\@\w+((\.|-)\w+)*\.\w+$";bool isMatch = Regex.IsMatch(email, pattern);if (isMatch){Console.WriteLine("Valid email address.");}else{Console.WriteLine("Invalid email address.");}}
}

如果需要获取匹配的具体内容,可以使用Regex.Match方法返回Match对象,或使用Regex.Matches方法返回MatchCollection对象。例如:

string text = "The quick brown fox jumps over the lazy dog. The dog is cute.";
string pattern = @"dog";
MatchCollection matches = Regex.Matches(text, pattern);
foreach (Match match in matches)
{Console.WriteLine("Match found at index {0}: {1}", match.Index, match.Value);
}

C# 字符串和正则表达式在文本处理中各有其独特的作用。字符串提供了基本的文本操作功能,而正则表达式则能实现更复杂的模式匹配和文本验证。在实际编程中,应根据具体需求灵活运用它们,以实现高效、准确的文本处理。


http://www.ppmy.cn/server/165731.html

相关文章

Three.js 实现海面效果

Three.js 实现海面效果 https://threehub.cn/#/codeMirror?navigationThreeJS&classifyshader&idoceanShader import * as THREE from three import { OrbitControls } from three/examples/jsm/controls/OrbitControls.js import { Water } from three/examples/js…

Vue - shallowRef 和 shallowReactive

一、shallowRef 和 shallowReactive &#xff08;一&#xff09;shallowRef 在 Vue 3 中&#xff0c;shallowRef 是一个用于创建响应式引用的 API&#xff0c;它与 ref 相似&#xff0c;但它只会使引用的基本类型&#xff08;如对象、数组等&#xff09;表现为响应式&#xf…

IM 即时通讯系统-43-简单的仿QQ聊天安卓APP

IM 开源系列 IM 即时通讯系统-41-开源 野火IM 专注于即时通讯实时音视频技术&#xff0c;提供优质可控的IMRTC能力 IM 即时通讯系统-42-基于netty实现的IM服务端,提供客户端jar包,可集成自己的登录系统 IM 即时通讯系统-43-简单的仿QQ聊天安卓APP IM 即时通讯系统-44-仿QQ即…

1.1 学习代理(Agent)分为几步?

文章目录 前言一、什么是UVM中的代理&#xff08;Agent&#xff09;二、如何理解Agent三、如何使用Agent1、创建Agent类2、实例化组件3、配置Agent4、连接组件 四、示例代码分析 前言 从Agent的概念入手&#xff0c;这个应该比较容易解释&#xff0c;就是把Driver、Monitor和S…

MS SQL Server partition by 函数实战二 编排考场人员

目录 需求 输出效果 范例运行环境 表及视图样本设计 功能实现 生成考场数据 生成重复的SQL语句 封装为统计视图 编写存储过程实现统计 小结 需求 假设有若干已分配准考证号的考生&#xff0c;准考证号示例&#xff08;01010001&#xff09;共计8位&#xff0c;前4位…

【C++】B2115 密码翻译

博客主页&#xff1a; [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: C 文章目录 &#x1f4af;前言&#x1f4af;题目解析&#x1f4af;1. 老师的做法代码实现&#xff1a;思路解析&#xff1a; &#x1f4af;2. 我的做法代码实现&#xff1a;思路分析&#xff1a; &#x1f4af;3. 老师…

Linux权限大揭秘:深入理解系统安全

W...Y的主页 &#x1f60a; 代码仓库分享&#x1f495; &#x1f354;前言&#xff1a; 在之前的内容中&#xff0c;我们了解了Linux中的一些简单权限&#xff0c;如root超级账号与普通账户的区别、Linux文件权限管理、文件类型和访问权限以及许多关于修改权限的指令及其规则…

深入解析 Chrome 浏览器的多进程架构:标签页是进程还是线程?(中英双语)

深入解析 Chrome 浏览器的多进程架构&#xff1a;标签页是进程还是线程&#xff1f; 1. 引言 Google Chrome 作为全球最流行的浏览器之一&#xff0c;以其稳定性、安全性和多任务处理能力而闻名。而其高效的表现&#xff0c;很大程度上归功于其独特的多进程架构&#xff08;M…