EditPlus常用正则表达式
Sun 13 December 2015
EditPlus常用正则表达式
作者: 月光 编程开发
正则表达式(Regular Expression,在代码中常简写为regex、regexp或RE)是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。许多程序设计语言都支持利用正则表达式进行字符串操作。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。
正则表达式是一个查询的字符串,它包含一般的字符和一些特殊的字符,特殊字符可以扩展查找字符串的能力,正则表达式在查找和替换字符串的作用不可忽视,它能很好提高工作效率。
正则表达式用于字符串处理、表单验证等场合,实用高效。开发人员或运维人员很得力的文本编辑器要数editplus了,这个软件支持正则表达式,使用正则表达式进行编辑文本经常可以帮助你完成很多工作。这里我就给大家介绍几种editplus常用正则表达式的使用方法,以备不时之需。

【1】正则表达式应用------替换指定内容到行尾
① 在替换对话框,查找内容里输入"abc.*"
② 同时勾选"正则表达式"复选框,然后点击"全部替换"按钮
其中,符号的含义如下:
"." =匹配任意字符
"*" =匹配0次或更多
注意:其实就是正则表达式替换,这里只是把一些曾经提出的问题加以整理,单纯从正则表达式本身来说,就可以引申出成千上万种特例。
【2】正则表达式应用------数字替换
希望把
asdadas123asdasdas456asdasdasd789asdasd
替换为:
asdadas[123]asdasdas[456]asdasdasd[789]asdasd
解决:
[0-9][0-9][0-9] → [\0\1\2]
如果是任意数字串,则"[0-9]*[0-9]"
【3】正则表达式应用------删除每一行行尾的指定字符
比如
12345 1265345
2345
需要删除每行末尾的"345"
解决:
345\$ → 空
如果是行首,则前面加"\^"
【4】正则表达式应用------替换带有半角括号的多行
几百个网页中都有下面一段代码,我想把它们都去掉,可是找了很多search & replace的软件,都是只能对"一行"进行操作。
EditPlus 打开几百个网页文件还是比较顺畅的,所以完全可以胜任这个工作。
解决
在 Editplus 中使用正则表达式,由于"("、")"被用做预设表达式(或者可以称作子表达式)的标志,所以需要使用 \ 转义。
【5】正则表达式应用------删除空行
\^[ \t]*\n → 空
注意\t前有空格符。空格符是空行的一个组成成分。
另一种方法:[\n]+ → \n
【6】正则表达式应用------中间包含文字替换
如果要替换中间包含某文字的一行,例如包含yahoo,则可使用如下表达式匹配一行内容
\^.*yahoo.*
【7】正则表达式应用------中间不包含文字替换
如果要替换中间不包含某文字的一行,例如不包含yahoo,则可使用如下表达式匹配一行内容
\^(?!.*yahoo).*
【8】查找url并提取
www.baidu.com\">http://www.baidu.com
解决:
() → \1
(http://.*) →\1
【9】查找IP地址并提取
匹配文本中的IP地址 \d+\.\d+\.\d+\.\d+
匹配文本中的非IP地址的其他文字 \^(?!\d+\.\d+\.\d+\.\d+).*
【10】特定字符串左右调换
将 >abc|def\< 的abc和def互换。
匹配文本中的 >(.+)|(.+)\<
替换为 >\2|\1\<
总结
EditPlus对正则表达式的支持有限,不支持 重复频度 的定义,如:{3}、{3,}、{3,6}...
下面列出EditPlus查找或替换时支持的元字符:
表达式 说明
\t 制表符.
\n 新行.
. 匹配任意字符.
| 匹配表达式左边和右边的字符. 例如, \"ab|bc\" 匹配 \"ab\" 或者 \"bc\".
[] 匹配列表之中的任何单个字符. 例如, \"[ab]\" 匹配 \"a\" 或者 \"b\". \"[0-9]\" 匹配任意数字.
[\^] 匹配列表之外的任何单个字符.例如, \"[\^ab]\" 匹配 \"a\" 和 \"b\" 以外的字符. \"[\^0-9]\" 匹配任意非数字字符.
* 其左边的字符被匹配任意次(0次,或者多次). 例如 \"be*\" 匹配 \"b\", \"be\" 或者 \"bee\".
+ 其左边的字符被匹配至少一次(1次,或者多次). 例如 \"be+\" 匹配 \"be\" 或者 \"bee\" 但是不匹配 \"b\".
? 其左边的字符被匹配0次或者1次. 例如 \"be?\" 匹配 \"b\" 或者 \"be\" 但是不匹配 \"bee\".
\^ 其右边的表达式被匹配在一行的开始.例如 \"\^A\" 仅仅匹配以 \"A\" 开头的行.
\$ 其左边的表达式被匹配在一行的结尾. 例如 \"e\$\" 仅仅匹配以 \"e\" 结尾的行.
() 影响表达式匹配的顺序,并且用作表达式的分组标记.
\ 转义字符. 如果你要使用 \"\\" 本身, 则应该使用 \"\\\".

::: {.previous_content} « 上一篇 亚马逊中国发布2015图书排行榜 :::
::: {.next_content} 下一篇 » 微软公布2015年度Bing最热搜索榜单 :::
相关文章
Category: 月光博客2015