- 作者:老汪软件技巧
- 发表时间:2024-12-18 10:05
- 浏览量:
前言
正则表达式(Regular Expression)是一个强大的文本处理工具,主要用于字符串的搜索、替换、验证和分割等操作。通过定义特定的模式,正则表达式可以高效地匹配、查找或替换符合该模式的文本内容。今天大姚将和大家一起来快速了解学习正则表达式,并且在C#中快速应用。
正则表达式的优势
与传统方法相比,正则表达式在处理字符串时具有以下显著优势:
注意事项常用元字符
元字符是正则表达式中具有特殊意义的字符,以下是一些常用的元字符及其作用:
验证邮箱地址
///
/// 验证邮箱地址
///
public static void VerifyEmailAddress()
{
string email = "edwin.doe@qq.com";
string pattern = @"^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}$";
var regex = new Regex(pattern);
bool isValid = regex.IsMatch(email);
Console.WriteLine($"{email} is valid email address: {isValid}");
}
验证手机号码
///
/// 验证手机号码
///
public static void VerifyMobilePhone()
{
string mobile = "13812345678";
string pattern = @"^1[3-9]\d{9}$";
var regex = new Regex(pattern);
bool isValid = regex.IsMatch(mobile);
Console.WriteLine($"{mobile} is valid mobile phone number: {isValid}");
}
提取URL
///
/// 提取URL
///
public static void ExtractUrl()
{
string url = "https://github.com/YSGStudyHards/DotNetGuide";
string pattern = @"^https?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*(),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+$";
var regex = new Regex(pattern);
Match match = regex.Match(url);
if (match.Success)
{
Console.WriteLine($"Found URL: {match.Value}"); //Output:https://github.com/YSGStudyHards/DotNetGuide
}
else
{
Console.WriteLine("No URL found.");
}
}
替换文本
///
/// 替换文本
///
public static void ReplaceText()
{
string input = "The date is 2024/12/16.";
string pattern = @"(\d{4})/(\d{2})/(\d{2})";
string replacement = "$1-$2-$3";
var regex = new Regex(pattern);
string result = regex.Replace(input, replacement);
Console.WriteLine(result);//Output:The date is 2024-12-16.
}
分割字符串
///
/// 分割字符串
///
public static void SplitString()
{
string pattern = @"[;,]";
string input = "apple;banana,orange;grape";
var regex = new Regex(pattern);
string[] substrings = regex.Split(input);
foreach (string substring in substrings)
{
Console.WriteLine(substring);
//Output:
//apple
//banana
//orange
//grape
}
}
C#正则性能提升技巧使用编译选项
使用 RegexOptions.Compiled 选项可以提高正则表达式的执行性能。此选项会在运行时编译正则表达式,从而加快匹配速度。
string pattern = @"(\d{4})/(\d{2})/(\d{2})";
Regex regex = new Regex(pattern, RegexOptions.Compiled);
避免过度回溯
复杂的正则表达式可能会导致大量的回溯,从而增加匹配时间。通过优化正则表达式,减少不必要的回溯,可以提高性能。例如,尽量避免使用过多的重复限定符(如 *, +, ?),并使用非贪婪匹配(*?, +?, ??)来减少回溯。
// 贪婪匹配
string pattern = @"<.*>";
// 非贪婪匹配
string pattern = @"<.*?>";
合理设置超时时间
为了防止正则表达式在极端情况下耗费过多的时间,可以设置匹配操作的超时时间。
string pattern = @"(\d{4})/(\d{2})/(\d{2})";
TimeSpan timeout = TimeSpan.FromSeconds(1); // 设置1秒的超时时间
Regex regex = new Regex(pattern, RegexOptions.None, timeout);
在线正则表达式大全
对于我们而言正则表达式用的不是很频繁,记一下等到用的时候又忘记了。所以我们主要了解一下常用元字符和基本用法,当遇到需要做正则表达式拼接的时候可以到网上查阅现有资料,这里大姚分享一个比较全面的在线正则表达式大全。