跳到主要内容

linux crontab 入门

crontab 的作用是,执行 linux 上的定时任务。当我们需要运行一些诸如 日志采集心跳检查 这种任务的时候,需要用到。

最近在做 linux 脚本检查 python 爬虫脚本 是否健康运行,故采用这个方法。

只要是常驻的程序,对于程序的要求比较高,必须有很好的稳健性,可以面对各种情况。

一个程序很难考虑到各种极端情况(死机,内存爆,网络问题等),这时候我们必须要实时监控这些进程的方法。

这里我准备采用的方法一:日记采集+监控, 方法二:定期检查并唤起。日志采集的东西准备放在下一篇讲。

当安装完成操作系统之后,默认便会启动此任务调度命令。crond 命令每分锺会定期检查是否有要执行的工作,如果有要执行的工作便会自动执行该工作

而 linux 任务调度的工作主要分为以下两类:

  • 1、系统执行的工作:系统周期性所要执行的工作,如备份系统数据、清理缓存
  • 2、个人执行的工作:某个用户定期要做的工作,例如每隔10分钟检查邮件服务器是否有新信,这些工作可由每个用户自行设置

安装

yum install crontabs

对于 crontabs 服务的操作

systemctl status crond // systemctl 和 service 也是一样
service crond start //启动服务
service crond stop //关闭服务
service crond restart //重启服务
service crond reload //重新载入配置
service crond status //查看服务是否启动

基础语法

crontab [ -u user ] file
crontab [ -u user ] { -l | -r | -e }
-l 列出目前用户的时程表
-r 删除目前用户的时程表
-e 编辑目前用户的时程表(默认采用VI) 等价于运行 vi /var/spool/cron/root [注:假如你是root用户(文件名与用户名一样)]

使用方法

f1 f2 f3 f4 f5 program
  • 其中 f1 是表示分钟,f2 表示小时,f3 表示一个月份中的第几日,f4 表示月份,f5 表示一个星期中的第几天。program 表示要执行的程序。
  • 当 f1 为 * 时表示每分钟都要执行 program,f2 为 * 时表示每小时都要执行程序,其馀类推
  • 当 f1 为 a-b 时表示从第 a 分钟到第 b 分钟这段时间内要执行,f2 为 a-b 时表示从第 a 到第 b 小时都要执行,其馀类推
  • 当 f1 为 */n 时表示每 n 分钟个时间间隔执行一次,f2 为 */n 表示每 n 小时个时间间隔执行一次,其馀类推
  • 当 f1 为 a, b, c,... 时表示第 a, b, c,... 分钟要执行,f2 为 a, b, c,... 时表示第 a, b, c...个小时要执行,其馀类推
*    *    *    *    *
- - - - -
| | | | |
| | | | +----- 星期中星期几 (0 - 7) (星期天 为0)
| | | +---------- 月份 (1 - 12)
| | +--------------- 一个月中的第几天 (1 - 31)
| +-------------------- 小时 (0 - 23)
+------------------------- 分钟 (0 - 59)

实例

0 */2 * * * /sbin/service httpd restart  意思是每两个小时重启一次apache 
50 7 * * * /sbin/service sshd start 意思是每天7:50开启ssh服务
50 22 * * * /sbin/service sshd stop 意思是每天22:50关闭ssh服务
0 0 1,15 * * fsck /home 每月1号和15号检查/home 磁盘
1 * * * * /home/bruce/backup 每小时的第一分执行 /home/bruce/backup这个文件
00 03 * * 1-5 find /home "*.xxx" -mtime +4 -exec rm {} \; 每周一至周五3点钟,在目录/home中,查找文件名为*.xxx的文件,并删除4天前的文件。
30 6 */10 * * ls 意思是每月的1、11、21、31日是的6:30执行一次ls命令

配置文件

crontab 是系统任务调度的配置文件

# /etc/crontab
SHELL=/bin/bash # 记录使用的 shell
PATH=/sbin:/bin:/usr/sbin:/usr/bin # 记录 crontab 的环境变量
MAILTO=root # 发送邮件的用户

常见问题

如何查看日志

执行日志 存储地址 /var/log/cron*

执行日志按天排列:croncron-20171119 ...

tail -f /var/log/cron 

运行日志 存储地址 /var/spool/mail/root

mail/root 中的root 是文件名,与用户保持一致

发邮件的功能,我没有尝试成功 // TODO

如何查看/备份任务

# 编辑任务
crontab -e
# 实际上所有的配置都存放在 /var/spool/cron/*下,文件名与用户名一致
/var/spool/conf/root :root 用户任务
/var/spool/conf/mysql :mysql 用户任务
# 备份任务
crontab -l > $HOME/mycrontab
cp /var/spool/conf/root $HOME/YOURPLACE/root

注意事项

crontab 有很多的注意实现,新手很容易翻车

建议不输出日志

原因是任务运行太频繁,日志会累积的非常大,不留意会撑爆你的硬盘

> /dev/null 2>&1

环境变量问题

crontab 的环境变量是一个大问题,crontab运行的时候不是以交互式的方式运行我们的程序,这样的话,我们常规的用来配置 linux 环境变量 的方法。如 .bashrc.bash_profile 等都不会起作用。

官方给的建议是,不要假定 cron 知道所需要的特殊环境,所以要保证 shell 脚本中提供所有必要的路径和环境变量。

  1. 脚本中涉及文件路径时写全局路径;

  2. 脚本执行要用到java或其他环境变量时,通过source命令引入环境变量,如:

    cat start_cbp.sh
    #!/bin/sh
    # shell 脚本中写入所需引入的环境变量
    source /etc/profile
    export RUN_CONF=/home/d139/conf/platform/cbp/cbp_jboss.conf
    /usr/local/jboss-4.0.5/bin/run.sh -c mev &
  3. 当手动执行脚本OK,但是crontab死活不执行时,很可能是环境变量惹的祸,可尝试在crontab中直接引入环境变量解决问题。如:

    0 * * * * . /etc/profile;/bin/sh /var/www/java/audit_no_count/bin/restart_audit.sh

Crontab 时区

系统时间可能和中国时区不一致,修改如下地方

# vim /etc/crontab
CRON_TZ=Asia/Shanghai
TZ=Asia/Shanghai

重启服务

service crond restart

参考资料

菜鸟教程:Linux crontab 命令

小a玖拾柒:Linux crontab命令详解