注册本站  论坛  繁體中文

电脑技巧
手机 | MP3 | MP4 | 显卡 | 主板 | 显示器 | 光存储 | 笔记本 | 网络设备 | 移动存储 | 数码相机
键鼠 | CPU | 音箱 | GPS | 电视 | 服务器 | 投影机 | 机箱电源 | 品牌电脑 | 办公打印 |
| 网站首页 | Cisco | Windows | Linux | Java | Dotnet | Oracle | 网页设计 | 平面设计 | 安全 | 软件应用 | 电脑维修 | 办公维修 |
您现在的位置: 电脑技巧 >> Linux >> Unix >> Linux正文

使用Unix命令行模式高效地进行文本编辑

文章来源:中国IT实验室收集整理 作者:佚名 更新时间:2007-8-29 【 】 【加入收藏

简单研究一下可节省时间和精力的一些基本命令行文本编辑程序。文本编辑操作通常在文本编辑器应用程序中交互式地进行。然而,有些任务可以直接从 UNIX® 命令行方便快捷地完成。此外,还可以在脚本中使用这些单命令行程序来自动化各种编辑过程。

大多数 UNIX® 开发人员都选择 Emacs、vi 或这两个文本编辑应用程序的众多变种、分支和克隆之一。操作员通常在所选的文本编辑器中打开文件,并交互式地对文件指定和应用更改。

但是与在文本编辑器中打开文件相比,您通常可以在命令行更快地完成编辑工作。复杂的编辑过程可以从命令行进行编程和指定,并跨多个文件执行,从而消除所有不必要的屏幕显示、光标移动和与文件的人工交互。一种很好的策略是在手边保留一些相关的命令行程序,以完成常见的编辑工作。它们不仅可以为您节省时间(尤其是在涉及到多个文件的批处理操作中),而且您还可以在脚本中使用它们。

用于编辑和处理文本的单命令行程序是 Perl 和 AWK(以及最近的 Ruby)语言(当然还包括 Shell)中有名的传统功能。本文使用在所有系统上都随时可用的三个最主要的命令行编辑工具来演示基本的文本编辑技术:cat、ed 和 sed。下面的编辑示例首先从最简单和最常见的构造开始,并逐步过渡到较复杂的构造。

使用 cat 进行编辑

使用 cat(其名称表示“连接”)来连接文件和标准输入流,如清单 1 所示。世界上的懒鬼们还将它用作通用分页程序 (cat file) 和完整的文本编辑环境 (cat > file)。其语法的简单性无与伦比,而且对于文本编辑单命令行程序,它还为您提供了无需编辑器即可追加或插入文本的快捷方法。

清单 1. 使用 cat 来连接文件和标准输入流

$ (cat - input1 - input2 - input3 - input4) | mailx ted

Ted,

Take a look at these example files.

This is the first file ...

Ctrl-D

This is the second file ...

Ctrl-D

This is the third file -- note the fourth paragraph below ...

Ctrl-D

And here's the last file ...

Ctrl-D

$

将文本添加到文件结尾

然而,懒鬼也是讲策略的。当您需要将文本追加到文件结尾时,再没有比使用 cat 更快的方法了:

$ cat >> file

> line

> line

> line

Ctrl-D

$

当您在添加行时,按 Ctrl-U 可以删除当前行,按 Ctrl-Z 可以挂起该过程,按 Ctrl-C 可以中止所有操作。当您完成编辑时,可以在各行上按 Ctrl-D。(存在一些缺省的 Korn Shell 控制键,但它们适用于大多数 Shell 和编辑模式。)

使用 ed 进行编辑

顾名思义,行编辑器 ed 对输入文件的行执行编辑。它将整个文件读入自己的缓冲区,对该副本执行指定的操作,并可选地将缓冲区写到磁盘。您可以在编辑操作中指定任何数量的行,并且这些操作可以在一个序列中进行组合和指定。这些事实使得 ed 成为在脚本中使用的理想选择。以如下格式指定操作:

[address]command [text]

address 指定要处理的一行或多行(缺省为当前行),并且可以通过多种方式进行指定。单字符的 command 是要对指定行执行的操作。对于脚本中的特别单命令行程序,可以使用 echo 将一组命令和文本管道传输给 ed,从而以非交互式的方式使用它。

( echo 'OPERATION'; echo 'OPERATION';

... echo 'wq' ) | ed -s FILENAME

如果在操作中输入文本,应该回显一个句点 (.) 来指示输入结束。最后的 wq 写入文件并退出。-s 选项使 ed 静默地操作,并禁止所有正常输出。

幸运的是,ed 的基本寻址方法和命令是相当标准化的。表 2 描述了主要的寻址形式。表 3 给出了命令。

表 2. 在 ed 中对行寻址

选项 描述

. 此选项对当前行寻址(缺省地址)。

number 此选项对第 number 行寻址。可以按逗号分隔的范围 (first,last) 对行寻址。0 代表缓冲区的开头(第一行之前)。

-number 此选项对当前行之前的第 number 行寻址。如果没有 number,则减号对紧跟在当前行之前的行寻址。

+number 此选项对当前行之后的第 number 行寻址。如果没有 number,则加号对紧跟在当前行之后的行寻址。

$ 此选项对最后一行寻址。

, 此选项对第一至最后一行寻址,包括第一行和最后一行(与 1,$ 相同)。

; 此选项对当前行至最后一行寻址。

/pattern/ 此选项对下一个包含与 pattern 匹配的文本的行寻址。

?pattern? 此选项对上一个包含与 pattern 匹配的文本的行寻址。

表 3. 主要的 ed 命令

命令 描述

a 此命令在指定的地址之后追加文本。

c 此命令将指定的地址更改为给定的文本。

d 此命令删除指定地址处的行。

i 此命令在指定的地址之前插入文本。

q 此命令在将缓冲区保存到磁盘后终止程序并退出。

r file 此命令读取 filespec 的内容并将其插入指定的地址之后。

s/pattern/replacement/ 此命令将匹配 pattern 的文本替换为指定地址中的 replacement 文本。

w file 此命令将指定的地址写到 file。如果没有 address,则此命令缺省使用整个缓冲区。

在文件开头插入文本,第二部分

通过可在脚本中使用的 ed 单命令行程序,您可以容易地在文件开头插入文本。插入操作是使用 ed 并通过 a 命令将给定文本追加到第 0 行(文件开头)来完成的:

$ cat file

This is the end.

$ (echo '0a'; echo 'This is the beginning.'; echo '.'; echo 'wq') | ed -s file

$ cat file

This is the beginning.

This is the end.

$

您可以交互式地完成同样的任务:

$ cat file

This is the end.

$ ed -s file

> 0a

> This is the beginning.

> .

> wq

$ cat file

This is the beginning.

This is the end.

$

若要在文件开头插入另一个文件的内容,可以使用 r 命令:

$ (echo '0r headnotes'; echo 'wq') | ed file

在给定字符串之后插入文本

您可以使用 ed 将任何数量的文本行插入文件中任意行之前或之后。若要在第一个包含给定字符串的行之后插入,可以将该字符串包括在斜杠中,并在后面跟着 a 命令以追加随后的文本。与前面一样,各个行使用一个句点结束,并使用 wq 写入文件并退出。

当您希望在文件中的特定位置追加文本块时,此项技术就会派上用场:

$ ( echo '/begin/a'; echo 'This is the middle.'; \

> echo '.'; echo 'wq') | ed -s file

$ cat file

This is the beginning.

This is the middle.

This is the end.

$

当您对一组文件执行多行文本插入时,此项技术也非常有用。如果要插入大量的行,可以使用 here document,这是使用 << 和一个限制字符串以内联方式指定的文档,用于重定向其后直至到达限制字符串的所有输入(请参见参考资料):

$ for i in *.xml

> { ed -s $i << EOF

> //a \

> \

> johnnycomelately \

> 10 \

> 4 \

> \

> .

> wq

> EOF

> }

$

您可以在给定字符串之后插入一个文件:

$ (echo '/END OF PART I/r footnotes.txt'; echo 'wq') | ed file

删除行

使用 d 命令来删除文件中的行。与本文讨论的所有命令一样,您可以指定任何类型的有效地址,例如特定的行或行范围。在实践中,此单命令行程序最适合于与至少一个匹配的模式结合使用,例如删除从第一个匹配某模式的行到文件结尾的所有行:

$ ( echo '/FOOTNOTES/,$/d'; echo 'wq' ) | ed -s file

也可以按相反方向执行此操作,并删除从该文件的第一行到第一个匹配某模式的行的所有内容:

$ ( echo '1,/\.\.\./d'; echo 'wq' ) | ed -s file

删除尾随空格

通过使用 s 命令并替换一个空替换字符,您可以删除尾随空格:

$ cat -vet input.txt

This line has trailing blanks. $

This line does not.$

$ (echo ',s/ *$//'; echo 'wq') | ed -s input.txt

$ cat -vet input.txt

This line has trailing blanks.$

This line does not.$

$

使用 sed 进行编辑

本文讨论的最复杂和最强大的编辑工具是 sed(流编辑器)。它是一个文本编辑器,但是与诸如 ed 等文本编辑器不同,它编辑输入流并写到输出流。因此,它对于编辑命令输出或对于使用其他工具对文件进行预处理非常有用——然后您可以将该文本通过管道直接输出给 sed,以进行快速编辑。但是 sed 还可以操作文件,并且其脚本语言具有高级模式匹配功能,因此它是用于执行任何类型的快速文本编辑的理想选择——例如对一组文件进行快速搜索和替换。事实上,它是现有用于文本编辑的最流行命令行工具之一。

sed 接受包含任何数量命令的脚本,后面跟着可选的指定输入文件的选项;缺省情况下,它读取标准输入。某些版本的 sed 有一个 -i 选项,此选项指定应该编辑的输入文件。(如果没有此选项,则读取输入文件,而不对其执行写入。)如果您安装的版本支持此选项,则应该使用它——它允许您使用单个命令对任何指定的文件执行快速编辑操作。

sed -i script filespec

以下示例假设您的 sed 支持 -i 选项。否则,您必须使用 Shell 重定向将输出保存到新文件,并在另一个步骤将新文件重命名为旧文件,从而执行临时文件中转:

sed script file > newfile; mv newfile file

对于多个文件,您必须执行循环:

for i in *; { sed script $i > $i.new; mv $i.new $i; }

替换文件中的文本

您可以使用 s/searchstring/replacestring/ 构造将给定字符串替换为另一个字符串。若要替换某个文件中每行上的第一个 old 实例,可以使用以下命令:

$ sed -i 's/old/new/' file

若要替换每个实例,可以对该搜索追加 g 选项。此项技术对于修复输入错误或替换一个或一组文件中的重复单词、短语或其他内容非常理想。

$ sed -i 's/Esclipse/Eclipse/g' *.xml

您可以在输入表达式中将字符包括在方括号中,但是,如果您在替换文本中使用方括号,则会将它们视为普通字符:

$ cat file

This is the beginning.

This is the middle.

This is the end.

$ sed 's/[Tt]h/[Tt]h/g' file

[Tt]his is [Tt]he beginning.

[Tt]his is [Tt]he middle.

[Tt]his is [Tt]he end.

当要搜索或替换的短语包括斜杠字符时,应使用它来定义新的分隔符:

$ sed -i 's,/usr/local/websphere,/usr/websphere,' file

您还可以将包含某个模式的整个行替换为某些新文本:

$ sed -i 's/.*pattern.*/LINE DELETED/' file

编辑匹配的模式

回想一下在模式中将字符分组在一起的方括号示例,以及如何在替换文本中将它们视为普通字符。如果您希望在替换文本中包括字面匹配的模式,该怎么办呢?可以使用“和”号 (&) 来实现。此方法对于通过在匹配模式之前或之后放置文本来编辑匹配模式是非常有用的:

$ cat file

This is the beginning.

This is the middle.

This is the end.

$ sed 's/[Tt]h/>&>Thth>Thth>Thth

在匹配模式之后插入文本

使用 a 命令在给定的匹配模式后面添加一行文本:

$ sed -i '/pattern/a text' file

这并不替换与模式匹配的文本——它只是在第一个包含该模式的行后面添加文本。

在行开头插入文本

若要在每行开头插入文本,可以匹配脱字号元字符并提供要插入的文本。下面显示了如何向文件中的所有行添加电子邮件样式引用:

$ sed 's/^/> /' input.txt

> This line has trailing blanks.

> This line does not.

$

在行尾插入文本

同样的原理也适用于在每行结尾插入文本——匹配美元符号元字符并提供要插入的文本。下面演示了如何模拟 AIX cat 的 -vet 选项来标记尾随空格:

$ sed 's/$/$/' file

This line has trailing blanks. $

This line does not.$

$

删除文件中的行

d 命令删除给定的行。您可以在它前面附加行号、范围、要匹配或包括在斜杠中的模式。

若要删除文件中的第一行,可以使用以下命令:

$ sed -i 1d file

若要删除第 1 至第 10 行,可以使用以下命令:

$ sed -i 1,10d file

若要删除“BEGIN QUOTE”字符串的第一个实例到“END QUOTE”字符串的第一个实例之间的所有行,可以使用以下命令:

$ sed -i '/BEGIN QUOTE/,/END QUOTE/d' file

若要删除当前目录中扩展名为 .xml 的所有文件中第一行包含“”并且最后一行包含“""”的所有文本部分,可以使用以下命令:

$ sed -i '//,/<\/record>/d' *.xml

若要删除从第一行直到第一个空白行的所有内容,可以使用以下命令:

$ sed -i '/^> /d' file

(当在电子邮件消息或 Usenet 文章中使用时,前述单命令行程序将除去所有标头。)

若要删除所有以电子邮件样式引用开头的行,可以使用以下命令:

$ sed -i /^$/d file

若要删除文件的最后一行,可以使用以下命令:

$ sed -i '$d' file

删除尾随空格

如果文件中的行包含需要清除的尾随空格字符,在文本编辑器中人工查找并删除它们会非常麻烦,但是使用 sed 完成此任务将成为一个快速的单行操作。您可以搜索行尾之前出现一次或多次的字面空格字符,并将其替换为空字符:

$ cat -vet input.txt

This line has trailing blanks. $

This line does not.$

$ sed -i 's/ *$//' input.txt

$ cat -vet input.txt

This line has trailing blanks.$

This line does not.$

$

总结

通过从 UNIX 命令行运行单命令行程序,可以利用多种有意义和复合的方式(无需编辑器)对文本文件进行编辑。您这样做有许多很好的理由:为了提高速度和方便性,在无法或不适合使用交互式编辑的情况下可编写脚本,有时为了对单个文件或一组文件执行复杂编辑,这些编辑操作难于甚至无法在交互式应用程序中完成。本文使用三个普遍存在的编辑工具,通过许多简单文本编辑单命令行程序阐述了这一概念:cat、ed 和 sed。

  • 上一篇Linux:

  • 下一篇Linux:
  • 最 新 热 门
     VMware下Linux与真实主机共享上网
     Linux系统安全隐患及加强安全管理方法
     各类Unix和Linux密码丢失解决方法
     配置Linux操作系统的环境变量
     在Linux系统下刷新主板BIOS的好方法
     删除文件提示:Operation not permitted
     Linux系统下硬盘挂载详细说明
     Linux文本模式下如何发送带附件的Email
     在Linux自动生成一个保险密码的方法
     Linux商业电影动画制作软件列表
    最 新 推 荐
     在Fedora Core系统中共享Windows打印机
     不同的类UNIX操作系统密码破解方法介绍
     UNIX的分支 服务器上的FreeBSD操作系统
     UNIX操作系统的加锁解锁:等待事件及唤醒
     Solaris TELNET ftp时间超长的解决方法
     SCO UNIX到Linux操作系统的程序移植问题
     使用Unix命令行模式高效地进行文本编辑
     Solaris第一次亲密接触
     Unix学习方法-高手之路
     FreeBSD下3D功能的实现
    相 关 文 章

    各类Unix和Linux密码丢失解决方法
    Ubuntu Linux系统下TP-link无线上网方法
    Ubuntu Linux系统中如何使用Samba客户端
    Kubuntu 8.04 系统确认用KDE4取代LTS
    Linux Shell脚本Ldd命令原理使用方法
    Ubuntu 7.10 Linux建立C与GTK的开发环境
    Ubuntu中Vsftp的配置和使用
    在Ubuntu Linux中配置虚拟主机
    Ubuntu系统下Trac+Subversion+Apache安装
    使用Smartmontools工具来检测硬盘的状态

    | 设为首页 | 加入收藏 | 联系站长 | 友情链接 | 版权申明 | 网站公告

     

    Copyright 2006-2008 pcjx.com All Rights Reserved
    电脑技巧 版权所有 粤ICP备06059145号 地图
    本网站所有内容未经许可不得转载或做其他使用