正则表达式 – 简要

2017-01-06 10:05:23来源:oschina作者:离未罔两人点击

第七城市

正则表达式 – 简要

正则表达式在文本的模式匹配和替换处理方面是强有力的,一个正则表达式就是由普通的字符(例如字符 a 到 z)以及特殊字符(称为元字符)组成的文字模式,它描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。


真的么?举个和正则表达式无关的例子,在命令行里,可以使用 ? 和 * 通配符来查找硬盘上的文件。? 通配符匹配文件名中的单个字符,而 * 通配符匹配零个或多个字符。和通配符相似,但正则表达式功能更强大,而且更加灵活。

什么是正则表达式?

简单地说,正则表达式是一些用来匹配和处理文本的字符串。

为什么使用正则表达式?

典型的搜索和替换操作要求提供与预期的搜索结果匹配的确切文本。虽然这种技术对于对静态文本执行简单搜索和替换任务可能已经足够了,但它缺乏灵活性,若采用这种方法搜索动态文本,即使不是不可能,至少也会变得很困难。

通过使用正则表达式,可以:


查找文本,基于模式匹配从字符串中提取子字符串。可以查找文档内或输入域内特定的文本。


替换文本,可以使用正则表达式来识别文档中的特定文本,完全删除该文本或者用其他文本替换它。


数据验证,测试字符串内的模式。例如,可以测试输入字符串,以查看字符串内是否出现电话号码模式或信用卡号码模式。

发展历史

正则表达式的"祖先"可以一直上溯至对人类神经系统如何工作的早期研究。1940年, Warren McCulloch 和 Walter Pitts 这两位神经生理学家研究出一种数学方式来描述这些神经网络,即将神经系统中的神经元描述成小而简单的自动控制元。。


1956 年, 一位叫 Stephen Kleene 的数学家在 McCulloch 和 Pitts 早期工作的基础上,发表了一篇标题为"神经网事件的表示法"的论文,引入了正则表达式的概念。正则表达式就是用来描述他称为"正则集的代数"的表达式,因此采用"正则表达式"这个术语。


随后,发现可以将这一工作应用于使用 Ken Thompson 的计算搜索算法的一些早期研究,Ken Thompson 是 Unix 的主要发明人。正则表达式的第一个实用应用程序就是 Unix 中的 qed 编辑器,随后是Unix上的编辑器ed,并最终引入grep。自此以后,正则表达式被广泛地应用于各种Unix或类Unix系统的工具中。


从那时起直至现在正则表达式都是基于文本的编辑器和搜索工具中的一个重要部分。

应用领域

目前,正则表达式已经在很多软件中得到广泛的应用,包括 *nix(Linux, Unix等)、HP 等操作系统,PHP、C#、Java、JavaScript、Python、Ruby 等开发环境,以及很多的应用软件中,都可以看到正则表达式的影子。


更多精彩--->正则表达式 - 语法之普通字符

第七城市

最新文章

123

最新摄影

微信扫一扫

第七城市微信公众平台