systemd详解

张彤 2021年10月26日 1,057次浏览

在运维过程中,我们常常需要将程序部署在后台运行,常见的方式是nohup命令,今天介绍一种使运维管理更方便的systemctl命令

systemd介绍

  • Systemd 就是为了解决这些问题而诞生的。它的设计目标是,为系统的启动和管理提供一套完整的解决方案。

  • 在systemd之前,centos6以及之前版本,启动命令都需要使用SystemV初始化(service 和chkconfig命令)来启动服务,这样的作法有不少缺点,比如,启动时间长,启动的脚本依赖关系复杂,运维难度高等等。

  • systemd中的字母d代表(daemon)守护进程

  • 在Linux生态系统中,Systemd被部署到了大多数的标准Linux发行版中,只有为数不多的几个发行版尚未部署。Systemd通常是所有其它守护进程的父进程,但并非总是如此。

systemd常用命令

systemctl

  • systemctl是 Systemd 的主命令,用于管理系统。
# 重启系统
sudo systemctl reboot

# 关闭系统,切断电源
sudo systemctl poweroff

# CPU停止工作
sudo systemctl halt

# 暂停系统
sudo systemctl suspend

# 让系统进入冬眠状态
sudo systemctl hibernate

# 让系统进入交互式休眠状态
sudo systemctl hybrid-sleep

# 启动进入救援状态(单用户状态)
sudo systemctl rescue

systemd-analyze

  • systemd-analyze命令用于查看启动耗时。
# 查看启动耗时
systemd-analyze

# 查看每个服务的启动耗时
systemd-analyze blame

# 显示瀑布状的启动过程流
systemd-analyze critical-chain

# 显示指定服务的启动流
systemd-analyze critical-chain atd.service

hostnamectl

  • hostnamectl命令用于查看当前主机的信息。
# 显示当前主机的信息
hostnamectl

# 设置主机名。
sudo hostnamectl set-hostname rhel7

localectl

  • localectl命令用于查看本地化设置。
# 查看本地化设置
localectl

# 设置本地化参数。
sudo localectl set-locale LANG=en_GB.utf8
sudo localectl set-keymap en_GB

timedatectl

  • timedatectl命令用于查看当前时区设置。
# 查看当前时区设置
timedatectl

# 显示所有可用的时区
timedatectl list-timezones

# 设置当前时区
sudo timedatectl set-timezone America/New_York
sudo timedatectl set-time YYYY-MM-DD
sudo timedatectl set-time HH:MM:SS

loginctl

  • loginctl命令用于查看当前登录的用户
# 列出当前session
loginctl list-sessions

# 列出当前登录用户
loginctl list-users

# 列出显示指定用户的信息
loginctl show-user ruanyf

unit

Systemd 可以管理所有系统资源。不同的资源统称为 Unit(单元)

systemd unit types

单元功能扩展
service unit启动并控制守护进程及其子进程.service
target unit代替sysV初始化运行.target
mount unit在文件系统中控制挂载点.mount
device unit公开系统的核心驱动.device
Snapshot unit可用于暂时保存系统单元集的状态,可以通过激活已保存的快照单元来恢复。.snapshot
swap unit封装Memory Swap分区或交换文件。.swap
slice unit进程组.slice
socket unit进程间通信的 socket.socket
timer unit定时器.timer
path unit文件或路径.path
scope unit不是由 Systemd 启动的外部进程.scope

unit 路径

  • systemd units 的配置及安装文件路径:
  1. RPM 安装包位置
/usr/lib/systemd/system
  1. 在运行时创建的系统单元。此目录优先于具有已安装服务单元的目录。
/run/systemd/system
  1. 由系统管理员创建和管理的系统单元。此目录优先于具有运行时单元的目录。
/etc/systemd/system

unit 列表

  • systemctl list-units命令可以查看当前系统的所有 Unit 。
# 列出正在运行的 Unit
systemctl list-units

# 列出所有Unit,包括没有找到配置文件的或者启动失败的
systemctl list-units --all

# 列出所有没有运行的 Unit
systemctl list-units --all --state=inactive

# 列出所有加载失败的 Unit
systemctl list-units --failed

# 列出所有正在运行的、类型为 service 的 Unit
systemctl list-units --type=service

unit 状态

  • systemctl status命令用于查看系统状态和单个 Unit 的状态
# 显示系统状态,树状显示
systemctl status

# 显示单个 Unit 的状态
sysystemctl status bluetooth.service

# 显示远程主机的某个 Unit 的状态
systemctl -H root@rhel7.example.com status httpd.service
  • 除了status命令,systemctl还提供了三个查询状态的简单方法,主要供脚本内部的判断语句使用。
# 显示某个 Unit 是否正在运行
systemctl is-active application.service

# 显示某个 Unit 是否处于启动失败状态
systemctl is-failed application.service

# 显示某个 Unit 服务是否建立了启动链接
systemctl is-enabled application.service

unit 状态查看

  • 以nginx状态为例,说明各个项的意思
# 键入
systemctl status nginx.service

nginx.service - nginx - high performance web server
Loaded: loaded (/usr/lib/systemd/system/nginx.service; enabled; vendor preset: disabled)
Active: active (running) since Tue 2021-10-19 00:10:16 CST; 1 weeks 1 days ago
Docs: http://nginx.org/en/docs/
Process: 22816 ExecStop=/bin/sh -c /bin/kill -s TERM $(/bin/cat /var/run/nginx.pid) (code=exited, status=0/SUCCESS)
Process: 22820 ExecStart=/usr/sbin/nginx -c /etc/nginx/nginx.conf (code=exited, status=0/SUCCESS)
Main PID: 22821 (nginx)
CGroup: /system.slice/nginx.service
├─22821 nginx: master process /usr/sbin/nginx -c /etc/nginx/nginx.conf
└─22822 nginx: worker process

Oct 19 00:10:16 VM-0-15-centos systemd[1]: Stopped nginx - high performance web server.
Oct 19 00:10:16 VM-0-15-centos systemd[1]: Starting nginx - high performance web server...
Oct 19 00:10:16 VM-0-15-centos systemd[1]: Can't open PID file /var/run/nginx.pid (yet?) after start: No such file or...ectory
Oct 19 00:10:16 VM-0-15-centos systemd[1]: Started nginx - high performance web server.
Hint: Some lines were ellipsized, use -l to show in full.

点()在支持的终端上使用颜色来概括地总结单位状态。

  1. 白色颜色表示“无效”或“取消激活”状态。
  2. 红颜色表示“失败”或“错误”状态。
  3. 绿色表示“活动”,“重新加载”或“激活”状态。
Loaded

开头的行显示了单元的加载状态

  • 同时还包含了单元文件的路径、启用状态、预设的启用状态
Loaded项状态含义
loaded已经被载到内存中
error表示加载失败
not-found未找到unit文件
bad-setting无法解析unit文件中的关键设置
masked表示已被屏蔽
Active
Active项状态含义
running服务或守护进程在后台运行中
exited服务从配置文件成功启动。 通常在退出服务之前读取一次服务配置。 例如,AppArmor 或防火墙服务。
waiting服务启动,但是在等待状态。
inactive服务器没启动成功
enabled服务在服务器启动的时候被设置为enable
disabled服务不允许启动,而且在服务器启动的时候也不会启动
staticLinux无法启用服务,但主要由另一个系统单位自动启动。换句话说,unit文件未生效,并且unit文件中没有有效的[Install]部分的配置。
masked服务完全禁用,并且它始终失败的任何开始操作。
alias它意味着服务与另一个单元文件的符号链接。
linked有一个或多个符号连接到unit file
Docs
  • 服务的官方文档地址,有些也可能会指导你去使用帮助命令,比如man bloothd
Process
  • 进程号,包括服务的启动和结束进程号
status
  • 服务状态
Main PID
  • 主进程号
CGroup
  • 进程组号

unit 管理

  • 这部分是运维中最常用到的部分,主要是用于管理service

基本语法格式

systemctl subcommand service_name
# 立即启动一个服务
sudo systemctl start apache.service

# 立即停止一个服务
sudo systemctl stop apache.service

# 重启一个服务
sudo systemctl restart apache.service

# 杀死一个服务的所有子进程
sudo systemctl kill apache.service

# 重新加载一个服务的配置文件
sudo systemctl reload apache.service

# 重载所有修改过的配置文件
sudo systemctl daemon-reload

# 显示某个 Unit 的所有底层参数
systemctl show httpd.service

# 显示某个 Unit 的指定属性的值
systemctl show -p CPUShares httpd.service

# 设置某个 Unit 的指定属性
sudo systemctl set-property httpd.service CPUShares=500

unit 依赖关系

  • 非常重要的一节,运维中排错需要常常用到的。
  • Unit 之间存在依赖关系:A 依赖于 B,就意味着 Systemd 在启动 A 的时候,同时会去启动 B。
  • systemctl list-dependencies命令列出一个 Unit 的所有依赖。
systemctl list-dependencies sshd
  • 上面的语句,返回的结果中有许多是Target类型,如果需要展开,使用以下语句
systemctl list-dependencies --all sshd

systemd unit配置文件

  • 每个unit都有一个配置文件,告诉systemd如何启动和管理,位置就在/etc/systemd/system/

配置文件的状态

  • 可以使用以下命令查看配置文件的状态
# 列出所有配置文件
systemctl list-unit-files

# 列出指定类型的配置文件
systemctl list-unit-files --type=service

文件状态有4种分别是:

  1. enabled:已建立启动链接
  2. disabled:没建立启动链接
  3. static:该配置文件没有[Install]部分(无法执行),只能作为其他配置文件的依赖
  4. masked:该配置文件被禁止建立启动链接
  • 注意,从配置文件的状态无法看出,该 Unit 是否正在运行

配置文件的格式

  • systemctl cat命令可以查看配置文件的内容。
  • 注意,配置文件的区块名和字段名,都是大小写敏感的。

配置文件的区块

[Unit]区块

  • [Unit]区块通常是配置文件的第一个区块,用来定义 Unit 的元数据,以及配置与其他 Unit 的关系
参数意思
Description简短描述
Documentation文档地址
Requires当前 Unit 依赖的其他 Unit,如果它们没有运行,当前 Unit 会启动失败
Wants与当前 Unit 配合的其他 Unit,如果它们没有运行,当前 Unit 不会启动失败
BindsTo与Requires类似,它指定的 Unit 如果退出,会导致当前 Unit 停止运行
BeforeBefore:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之后启动
After如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之前启动
Conflicts这里指定的 Unit 不能与当前 Unit 同时运行
Condition当前 Unit 运行必须满足的条件,否则不会运行
Assert当前 Unit 运行必须满足的条件,否则会报启动失败

[Install]区块

  • [Install]通常是配置文件的最后一个区块,用来定义如何启动,以及是否开机启动。
参数意思
WantedBy它的值是一个或多个 Target,当前 Unit 激活时(enable)符号链接会放入/etc/systemd/system目录下面以 Target 名 + .wants后缀构成的子目录中
RequiredBy它的值是一个或多个 Target,当前 Unit 激活时,符号链接会放入/etc/systemd/system目录下面以 Target 名 + .required后缀构成的子目录中
Alias当前 Unit 可用于启动的别名
Also当前 Unit 激活(enable)时,会被同时激活的其他 Unit

[Service]区块

  • [Service]区块用来 Service 的配置,只有 Service 类型的 Unit 才有这个区块。它的主要字段如下。
参数意思
Type定义启动时的进程行为。它有以下几种值。
Type=simple:默认值,执行ExecStart指定的命令,启动主进程
Type=forking:以 fork 方式从父进程创建子进程,创建后父进程会立即退出
Type=oneshot:一次性进程,Systemd 会等当前服务退出,再继续往下执行
Type=dbus:当前服务通过D-Bus启动
Type=notify:当前服务启动完毕,会通知Systemd,再继续往下执行
Type=idle:若有其他任务执行完毕,当前服务才会运行
ExecStart启动当前服务的命令
ExecStartPre启动当前服务之前执行的命令
ExecStartPost启动当前服务之后执行的命令
ExecReload重启当前服务时执行的命令
ExecStop停止当前服务时执行的命令
ExecStopPost停止当其服务之后执行的命令
RestartSec自动重启当前服务间隔的秒数
Restart定义何种情况 Systemd 会自动重启当前服务,可能的值包括always(总是重启)、on-success、on-failure、on-abnormal、on-abort、on-watchdog
TimeoutSec定义 Systemd 停止当前服务之前等待的秒数
Environment指定环境变量

Target

  • 启动计算机的时候,需要启动大量的 Unit。如果每一次启动,都要一一写明本次启动需要哪些 Unit,显然非常不方便。Systemd 的解决方案就是 Target。

  • 简单说,Target 就是一个 Unit 组,包含许多相关的 Unit 。启动某个 Target 的时候,Systemd 就会启动里面所有的 Unit。从这个意义上说,Target 这个概念类似于"状态点",启动某个 Target 就好比启动到某种状态。

  • 传统的init启动模式里面,有 RunLevel 的概念,跟 Target 的作用很类似。不同的是,RunLevel 是互斥的,不可能多个 RunLevel 同时启动,但是多个 Target 可以同时启动。

# 查看当前系统的所有 Target
systemctl list-unit-files --type=target

# 查看一个 Target 包含的所有 Unit
systemctl list-dependencies multi-user.target

# 查看启动时的默认 Target
systemctl get-default

# 设置启动时的默认 Target
sudo systemctl set-default multi-user.target

# 切换 Target 时,默认不关闭前一个 Target 启动的进程,
# systemctl isolate 命令改变这种行为,
# 关闭前一个 Target 里面所有不属于后一个 Target 的进程
sudo systemctl isolate multi-user.target
  • 它与init进程的主要差别如下。
  1. 默认的 RunLevel(在/etc/inittab文件设置)现在被默认的 Target 取代,
    位置是/etc/systemd/system/default.target,
    通常符号链接到graphical.target(图形界面)或者multi-user.target(多用户命令行)。
  2. 启动脚本的位置,以前是/etc/init.d目录,符号链接到不同的 RunLevel 目录 (比如/etc/rc3.d、/etc/rc5.d等),现在则存放在/lib/systemd/system和/etc/systemd/system目录。
  3. 配置文件的位置,以前init进程的配置文件是/etc/inittab,各种服务的配置文件存放在/etc/sysconfig目录。现在的配置文件主要存放在/lib/systemd目录,在/etc/systemd目录里面的修改可以覆盖原始设置。

日志管理

  • Systemd 统一管理所有 Unit 的启动日志。带来的好处就是,可以只用journalctl一个命令,查看所有日志(内核日志和应用日志)。日志的配置文件是/etc/systemd/journald.conf。
# 查看所有日志(默认情况下 ,只保存本次启动的日志)
$ sudo journalctl

# 查看内核日志(不显示应用日志)
$ sudo journalctl -k

# 查看系统本次启动的日志
$ sudo journalctl -b
$ sudo journalctl -b -0

# 查看上一次启动的日志(需更改设置)
$ sudo journalctl -b -1

# 查看指定时间的日志
$ sudo journalctl --since="2012-10-30 18:17:16"
$ sudo journalctl --since "20 min ago"
$ sudo journalctl --since yesterday
$ sudo journalctl --since "2015-01-10" --until "2015-01-11 03:00"
$ sudo journalctl --since 09:00 --until "1 hour ago"

# 显示尾部的最新10行日志
$ sudo journalctl -n

# 显示尾部指定行数的日志
$ sudo journalctl -n 20

# 实时滚动显示最新日志
$ sudo journalctl -f

# 查看指定服务的日志
$ sudo journalctl /usr/lib/systemd/systemd

# 查看指定进程的日志
$ sudo journalctl _PID=1

# 查看某个路径的脚本的日志
$ sudo journalctl /usr/bin/bash

# 查看指定用户的日志
$ sudo journalctl _UID=33 --since today

# 查看某个 Unit 的日志
$ sudo journalctl -u nginx.service
$ sudo journalctl -u nginx.service --since today

# 实时滚动显示某个 Unit 的最新日志
$ sudo journalctl -u nginx.service -f

# 合并显示多个 Unit 的日志
$ journalctl -u nginx.service -u php-fpm.service --since today

# 查看指定优先级(及其以上级别)的日志,共有8级
# 0: emerg
# 1: alert
# 2: crit
# 3: err
# 4: warning
# 5: notice
# 6: info
# 7: debug
$ sudo journalctl -p err -b

# 日志默认分页输出,--no-pager 改为正常的标准输出
sudo journalctl --no-pager

# 以 JSON 格式(单行)输出
sudo journalctl -b -u nginx.service -o json

# 以 JSON 格式(多行)输出,可读性更好
sudo journalctl -b -u nginx.serviceqq
 -o json-pretty

# 显示日志占据的硬盘空间
sudo journalctl --disk-usage

# 指定日志文件占据的最大空间
sudo journalctl --vacuum-size=1G

# 指定日志文件保存多久
sudo journalctl --vacuum-time=1years

本文引用:
Systemd 入门教程:命令篇