公司的机房设置了一个5分钟执行一次的数据同步脚本。一般每次同步只需要花费不到20秒即可完成,但网络出现问题时,就可能五分钟无法完成同步。脚本第二次启动可能干扰仍在运行的第一次脚本,需要有一个办法确保只有一个实例在运行。
Ubuntu系统提供了一个软件包叫 run-one ,可能实现这一功能,让我们来试试。首先安装软件包,以root权限运行:
# apt-get install run-one 安装好之后,运行 run-one <要单实例运行的命令> ,就可以确保只有一个实例运行了。比如:
# run-one tail -f /var/log/syslog 我们可以看到syslog的最后几行,并随着日志输出而滚动。此时如果打开另一个terminal,再次输入上述命令,会直接退出,并且exit code是1:
# run-one tail -f /var/log/syslog # echo $? 1 除了 run-one 命令, run-one 软件包中还提供了几个实用的命令:
run-one 只运行一个进程实例,如果实例已存在,直接退出 run-this-one 只运行一个进程实例,如果实例已存在,kill掉它并重新运行 run-one-constantly 和 run-one 一样,只运行一个进程实例,当进程退出时自动重新启动 keep-one-running run-one-constantly 的别名 run-one-until-success 和 run-one-constantly 相似,但只有当进程退出码不为0时才重新启动进程 run-one-until-failure 和 run-one-constantly 相似,但只有当进程退出码为0时才重新启动进程 在CentOS系统中,并没有 run-one 软件包可供使用。不过我们可以利用 flock 锁定的机制自己实现只有一个进程运行。
可以写一个脚本:
#!/bin/bash TODAY=`date +%Y%m%d` ( flock -xn 100 || exit 1 scp root@myhost:/data/backups/$TODAY.log.gz /data/backups/myhost/ gzip -d /data/backups/myhost/$TODAY.log.gz | xz -9 -e > /data/backups/myhost/$TODAY.log.xz && / rm /data/backups/myhost/$TODAY.log.gz ) 100>/tmp/backup_data.lock 上面的脚本中, flock 命令会对 /tmp/sync_data.lock 文件加上写入锁(排它锁),分别在两个terminal中运行这个命令,会看到一个开始scp拷贝数据,另一个直接退出,退出状态码为1。
flock 命令有三种写法:
我们前面用的是第一种,定义一个文件描述符,这种方法适合用于多行命令需要排它运行的场景。后两种flock的用法适合只有一条命令要运行的场景。 flock 的 -s 选项表示要获取读取锁(共享锁); -x 选项表示要获取写入锁(排它锁); -o 选项表示在运行命令前关闭已取得锁定的文件,如果后面的命令可能产生不该取得锁定的子进程,这个选项会很有用; -n 选项表示不要阻塞,如果无法取得锁,不要等待其它进程释放锁定,直接退出; -w 10 表示等待10秒,如果10秒仍无法取得锁,就退出。
run-one 是一个Bash脚本,通过查看 run-one 命令的源码得知,它也是利用 flock 实现的唯一化处理。如果不想自己编写带 flock 的程序,又想使用 run-one 提供的完整功能,可以去 Github 上下载 run-one 项目的代码。