站长百科 | 数字化技能提升教程 数字化时代生存宝典
首页
数字化百科
电子书
建站程序
开发
服务器
办公软件
开发教程
服务器教程
软件使用教程
运营教程
热门电子书
WordPress教程
宝塔面板教程
CSS教程
Shopify教程
导航
程序频道
推广频道
网赚频道
人物频道
网站程序
网页制作
云计算
服务器
CMS
论坛
网店
虚拟主机
cPanel
网址导航
WIKI使用导航
WIKI首页
最新资讯
网站程序
站长人物
页面分类
使用帮助
编辑测试
创建条目
网站地图
站长百科导航
站长百科
主机侦探
IDCtalk云说
跨境电商导航
WordPress啦
站长专题
网站推广
网站程序
网站赚钱
虚拟主机
cPanel
网址导航专题
云计算
微博营销
虚拟主机管理系统
开放平台
WIKI程序与应用
美国十大主机
编辑“
Debian/类Unix文本处理
”
人物百科
|
营销百科
|
网赚百科
|
站长工具
|
网站程序
|
域名主机
|
互联网公司
|
分类索引
跳转至:
导航
、
搜索
警告:
您没有登录。如果您做出任意编辑,您的IP地址将会公开可见。如果您
登录
或
创建
一个账户,您的编辑将归属于您的用户名,且将享受其他好处。
反垃圾检查。
不要
加入这个!
{{Debian top}} 在类 [[Unix]] 的系统中,有几个文本处理工具经常用到。 ==文本处理== 非[[正则表达式]]的方法有: *head 显示文件的开始部分。 *tail 显示文件的结尾部分。 *sort 给文件中的每一行排序。 *uniq 删除文件中重复的行。 *tr 转换或者删除字符。 *diff 把文件中的内容一行一行的比较。 基本的正则表达式 Basic regular expression (BRE) : *grep 按模式匹配文本。 *ed 一个原始的行[[编辑器]]。 *sed 一个流编辑器。 *[[vi]] 一个屏幕编辑器。 *[[Emacs]] 一个屏幕编辑器。 扩展的正则表达式 Extended regular expression (ERE) is used: *egrep 按模式匹配文本。 *awk 进行简单的文本处理。 *[[perl]] 做非常难以想像的文本处理。 ==正则表达式== 正则表达式用在很多文本处理工具里面。它们和 shell 的通配符比较相似,但是它们更复杂也更强大。 正则表达式是由文本字符和元字符组成的,用来描述匹配模式。元字符是有特殊意义的字符。它们有两种主要的形式 BRE 和 ERE,主要取决于类 Unix 文本处理。 在扩展的正则表达式(EREs)里面元字符包括"\ . [ ] ^ $ * + ? ( ) { } |"。正则表达式表示: *c 这个用来匹配非元字符 "c". *\c 这个用来匹配原本的字符"c". *. 这个用来匹配任意字符包括换行符。 *^ 这个用来匹配字符串的开始。 *$ 这个用来匹配字符串的结尾。 *\< 这个用来匹配一个单词的开始。 *\> 这个用来匹配一个单词的结尾。 *[abc...] 这个字符序列用来匹配 "abc..."中的任意字符。 *[^abc...] 这个否定的字符序列匹配所有的字符除了 "abc...". *r* 这个匹配以"r" 开始的后面有 0 个或者多个字符的[[字符串]]。 *r+ 这个匹配以"r" 开始的后面有一个或者多个字符的表达式。 *r? 以"r" 开始后面有 0 个或者 1 个其他的字符。 *r1|r2 匹配"r1"或者"r2"。 *(r1|r2) 匹配"r1"或者 "r2"并且把它当作一个分类正则表达式。 在BREs里面元字符"+ ? ( ) { } |"不再具有它们特殊的含义,而是使用的有反斜杠的版本"\+ \? \( \) \{ \} \|"。因此分组(r1|r2)需要被表示成\(r1|r2\)。 因为emacs,虽然基本上是 BRE,但是它把"+ ?"当作元字符。因此不需要特别表示它们。 举个例子,grep 可以用正则表达式来搜索文本: <pre> $ egrep 'GNU.*LICENSE|Yoyodyne' /usr/share/common-licenses/GPL GNU GENERAL PUBLIC LICENSE GNU GENERAL PUBLIC LICENSE Yoyodyne, Inc., hereby disclaims all copyright interest in the program </pre> ==替换表达式== 在替换表达式里面,下面的字符有特殊的含义: *& 这个会替换正则表达式所匹配的部分。(在 emacs 里面用 \&) *\n 这个会替换 n-th括号正则表达式所匹配的内容。 *在 Perl 里面,$n 替换了 \n,& 也没有特殊的含义。 举个例子: <pre> $ echo zzz1abc2efg3hij4 | \ sed -e 's/\(1[a-z]*\)[0-9]*\(.*\)$/=&=/' zzz=1abc2efg3hij4= $ echo zzz1abc2efg3hij4 | \ sed -e 's/\(1[a-z]*\)[0-9]*\(.*\)$/\2===\1/' zzzefg3hij4===1abc $ echo zzz1abc2efg3hij4 | \ perl -pe 's/(1[a-z]*)[0-9]*(.*)$/$2===$1/' zzzefg3hij4===1abc $ echo zzz1abc2efg3hij4 | \ perl -pe 's/(1[a-z]*)[0-9]*(.*)$/=&=/' zzz=&= </pre> 请特别注意这些括号正则表达式的格式,以及这些被匹配的文本在文本处理工具里面是如何使用的。 这些正则表达式可以用来控制光标的运动和编辑器里面的文本替换。 {{Debian}} ==参考来源== http://www.debian.org/doc/manuals/debian-reference/ch-tutorial.zh-cn.html#s-text-process [[category:Debian|L]]
摘要:
请注意,您对站长百科的所有贡献都可能被其他贡献者编辑,修改或删除。如果您不希望您的文字被任意修改和再散布,请不要提交。
您同时也要向我们保证您所提交的内容是您自己所作,或得自一个不受版权保护或相似自由的来源(参阅
Wordpress-mediawiki:版权
的细节)。
未经许可,请勿提交受版权保护的作品!
取消
编辑帮助
(在新窗口中打开)
本页使用的模板:
模板:Debian
(
编辑
)
模板:Debian top
(
编辑
)