分类:RegularExpression

Home / 分类:RegularExpression

正则表达式修改文本

2015-2-7 02:34:05 | RegularExpression | 没有评论

文本处理最强大的应该是perl和sed,对于正则表达式支持得也完备,比如下面是一个匿名人士写给我的感谢信:

lihui@2015 ~$ cat lihui.txt
Hello, lihui
Thanks
Goodbye

可是后来这人发现,谢错人了,需要把lihui修改成lilei,当然此刻我是十分伤悲,顺其自然,能够做到的最简单的方法是用sed

lihui@2015 ~
$ sed -i 's/lih[......]

Read more

正则表达式匹配字符串

2015-2-3 00:40:52 | RegularExpression | 没有评论

尽管eprep命令看上去挺简洁,但是对于比较复杂的文本处理,数据挖掘,甚至要进行二次处理来说,就只有不停借助管道,可读性和灵活性就相对不好维护,而其它比如perl,python之类的脚本语言对于正则表达式支持得更加完备

匹配字符串

假如想确认一个字符串里是否全部是数字,其实perl的松散和python的优美在正则表达式里也能体现出来,perl的规矩是根据上下文来确认变量的类型,这样就导致明明是整型[……]

Read more

正则表达式的结构

2015-2-1 23:05:00 | RegularExpression | 没有评论

完整的正则表达式是由很多小的模块组成的,而每个小的模块都很简单,但是这些符号如果是随意结合的话,可以有无穷无尽的组合

正则表达式除了信手拈来的\d,\w+,\s+,.*等等,有些规则用的比较少容易被遗忘,这里基本都是linux命令行上的正则表达式容易被忽略的几点,熟练了之后,对于编写shell脚本会有很大的帮助,操作命令行也会更舒畅,对于脚本语言正则表达式一脉相承,只要掌握了思想方法,其它就只需要[……]

Read more

正则表达式小述

2014-11-29 18:05:26 | RegularExpression | 没有评论

正则表达式这词看上去高大上,逼格满满的,但有句俗话叫“滥用正则表达式是PERL程序员令人反感的重要原因”,这么看来逼格高有时候也不一定是一件好事,开个玩笑,这句话其实有两层含义,第一层说明PERL对正则表达式的支持是非常完美的,内建了一个正则表达式引擎,另一层意思就是PERL中容易使用,使得处理问题立马想起来正则表达式,结果有些没必要用导致一些性能问题或者是造成可读性不太好,当然仁者见仁,智者见智[……]

Read more