exec
是 Bash 内部命令。内部命令是由特殊的文件格式(.def)所实现,如 cd
, history
, exec
等。
1 fork 的概念
说明 exec
和 source
的区别之前,先说明一下 fork 的概念。
fork 是 linux 的系统调用,用来创建子进程(child process)。子进程是父进程(parent process)的一个副本,从父进程那里获得一定的资源分配以及继承父进程的环境。子进程与父进程唯一不同的地方在于 pid(process id)。
环境变量(传给子进程的变量,遗传性是本地变量和环境变量的根本区别)只能单向从父进程传给子进程。不管子进程的环境变量如何变化,都不会影响父进程的环境变量。
1.1 shell 脚本
有两种方法执行 shell scripts,一种是新产生一个 shell,然后执行相应的 shell scripts;一种是在当前 shell 下执行,不再启用其他 shell。
新产生一个 shell 然后再执行 scripts 的方法是在 scripts 文件开头加入以下语句:#!/bin/sh
一般的 script 文件(.sh)即是这种用法。这种方法先启用新的 sub-shell(新的子进程),然后在其下执行命令。
另外一种方法就是上面说过的 source
命令,不再产生新的 shell,而在当前 shell 下执行一切命令。
1.2 source
source 命令即点(.)命令。
在 bash 下输入 man source,找到 source 命令解释处,可以看到解释”Read and execute commands from filename in the current shell environment and ……”。从中可以知道,source 命令是在当前进程中执行参数文件中的各个命令,而不是另起子进程(或 sub-shell)。
1.3 exec
在 bash 下输入 man exec
,找到 exec
命令解释处,可以看到有”No new process is created.”这样的解释,这就是说 exec 命令不产生新的子进程。那么 exec 与 source 的区别是什么呢?
exec
命令在执行时会把当前的 shell process 关闭,然后换到后面的命令继续执行。
系统调用 exec
是以新的进程去代替原来的进程,但进程的 PID 保持不变。因此,可以这样认为,exec
系统调用并没有创建新的进程,只是替换了原来进程上下文的内容。原进程的代码段,数据段,堆栈段被新的进程所代替。
一个进程主要包括以下几个方面的内容:
- 一个可以执行的程序
- 与进程相关联的全部数据(包括变量,内存,缓冲区)
- 程序上下文(程序计数器 PC,保存程序执行的位置)
exec
是一个函数簇,由 6 个函数组成,分别是以 excl
和 execv
打头的。
执行 exec
系统调用,一般都是这样,用 fork()
函数新建立一个进程,然后让进程去执行 exec
调用。我们知道,在 fork()
建立新进程之后,父进程与各子进程共享代码段,但数据空间是分开的,但父进程会把自己数据空间的内容 copy 到子进程中去,还有上下文也会 copy 到子进程中去。而为了提高效率,采用一种写时 copy 的策略,即创建子进程的时候,并不 copy 父进程的地址空间,父子进程拥有共同的地址空间,只有当子进程需要写入数据时(如向缓冲区写入数据),这时候会复制地址空间,复制缓冲区到子进程中去。从而父子进程拥有独立的地址空间。而对于 fork()
之后执行 exec
后,这种策略能够很好的提高效率,如果一开始就 copy
,那么 exec
之后,子进程的数据会被放弃,被新的进程所代替。
1.4 exec 与 system 的区别
exec
是直接用新的进程去代替原来的程序运行,运行完毕之后不回到原先的程序中去。
system
是调用 shell 执行你的命令,system=fork+exec+waitpid
,执行完毕之后,回到原先的程序中去。继续执行下面的部分。
总之,如果你用 exec 调用,首先应该 fork 一个新的进程,然后 exec. 而 system 不需要你 fork 新进程,已经封装好了。
2 详解及应用实例
2.1 基本概念
(这是理解后面的知识的前提,请务必理解)
- I/O 重定向通常与 FD 有关,shell 的 FD 通常为 10 个,即 0~9;
- 三个常用 FD(默认与 keyboard、monitor、monitor 有关):
FD | 说明 |
---|---|
0 | stdin, 标准输入 |
1 | stdout, 标准输出 |
2 | stderr, 标准错误输出 |
FD 用来改变送出的数据信道(stdout, stderr),使之输出到指定的档案;0
是 与 1>
是一样的;
在 IO 重定向中,stdout 与 stderr 的管道会先准备好,才会从 stdin 读进资料;
管道 |
(pipe line): 上一个命令的 stdout 接到下一个命令的 stdin;
tee
命令是在不影响原本 I/O 的情况下,将 stdout 复制一份到档案去;
bash(ksh)执行命令的过程:分析命令-变量求值-命令替代(``和$( )
)-重定向-通配符展开-确定路径-执行命令;
( )
将 command group 置于 sub-shell 去执行,也称 nested sub-shell,它有一点非常重要的特性是:继承父 shell 的 Standard input, output, and error plus any other open file descriptors。
exec 命令:常用来替代当前 shell 并重新启动一个 shell,换句话说,并没有启动子 shell。使用这一命令时任何现有环境都将会被清除。 exec 在对文件描述符进行操作的时候,也只有在这时,exec 不会覆盖你当前的 shell 环境。
2.2 常用重定向
cmd &n
使用系统调用 dup (2)
复制文件描述符 n 并把结果用作标准输出
&
关闭标准输出n&
表示将 n 号输出关闭
上述所有形式都可以前导一个数字,此时建立的文件描述符由这个数字指定而不是缺省的 0 或 1。如:
... 2>file
运行一个命令并把错误输出(文件描述符 2)定向到 file。... 2>&1
运行一个命令并把它的标准输出和输出合并。(严格的说是通过复制文件描述符 1 来建立文件描述符 2 ,但效果通常是合并了两个流。)
我们对 2>&1
详细说明一下:2>&1
也就是 FD2=FD1 ,这里并不是说 FD2 的值等于 FD1 的值,因为 > 是改变送出的数据信道,也就是说把 FD2 的 “数据输出通道” 改为 FD1 的 “数据输出通道”。
如果仅仅这样,这个改变好像没有什么作用,因为 FD2 的默认输出和 FD1 的默认输出本来都是 monitor,一样的!但是,当 FD1 是其他文件,甚至是其他 FD 时,这个就具有特殊的用途了。请大家务必理解这一点。
2.3 重定向恢复
如果 stdin, stdout, stderr 进行了重定向或关闭, 但没有保存原来的 FD, 可以将其恢复到 default 状态吗?
如果关闭了 stdin,因为会导致退出,那肯定不能恢复。
如果重定向或关闭 stdout 和 stderr 其中之一,可以恢复,因为他们默认均是送往 monitor(但不知会否有其他影响)。
如恢复重定向或关闭的 stdout: exec 1>&2 ,恢复重定向或关闭的 stderr:exec 2>&1。
如果 stdout 和 stderr 全部都关闭了,又没有保存原来的 FD,可以用:exec 1>/dev/tty 恢复。
cmd >a 2>a 和 cmd >a 2>&1 为什么不同? cmd >a 2>a :stdout 和 stderr 都直接送往文件 a ,a 文件会被打开两遍,由此导致 stdout 和 stderr 互相覆盖。
cmd >a 2>&1 :stdout 直接送往文件 a ,stderr 是继承了 FD1 的管道之后,再被送往文件 a 。a 文件只被打开一遍,就是 FD1 将其打开。
我想:他们的不同点在于:
cmd >a 2>a 相当于使用了两个互相竞争使用文件 a 的管道;
而 cmd >a 2>&1 只使用了一个管道,但在其源头已经包括了 stdout 和 stderr。
从 IO 效率上来讲,cmd >a 2>&1 的效率应该更高!