文本文件处理命令
grep
命令描述:grep命令用于查找文件里符合条件的字符串。
grep全称是Global Regular Expression Print,表示全局正则表达式版本,它能使用正则表达式搜索文本,并把匹配的行打印出来。文章源自国外主机测评-https://www.zjcp.org/13951.html
在Shell脚本中,grep通过返回一个状态值来表示搜索的状态:文章源自国外主机测评-https://www.zjcp.org/13951.html
- 0:匹配成功。
- 1:匹配失败。
- 2:搜索的文件不存在。
命令格式:grep [参数] [正则表达式] [文件]
。文章源自国外主机测评-https://www.zjcp.org/13951.html
命令常用参数说明:文章源自国外主机测评-https://www.zjcp.org/13951.html
参数 | 说明 |
---|---|
-c或–count | 计算符合样式的列数 |
-d recurse或-r | 指定要查找的是目录而非文件 |
-e [范本样式] | 指定字符串做为查找文件内容的样式 |
-E 或 –extended-regexp | 将样式为延伸的正则表达式来使用 |
-F 或 –fixed-regexp | 将样式视为固定字符串的列表 |
-G 或 –basic-regexp | 将样式视为普通的表示法来使用 |
-i 或 –ignore-case | 忽略字符大小写的差别 |
-n 或 –line-number | 在显示符合样式的那一行之前,标示出该行的列数编号 |
-v 或 –revert-match | 显示不包含匹配文本的所有行 |
命令使用示例:文章源自国外主机测评-https://www.zjcp.org/13951.html
- 查看sshd服务配置文件中监听端口配置所在行编号。
grep -n Port /etc/ssh/ssh_config
命令输出结果:文章源自国外主机测评-https://www.zjcp.org/13951.html
- 查询字符串在文本中出现的行数。
grep -c localhost /etc/hosts
命令输出结果:文章源自国外主机测评-https://www.zjcp.org/13951.html
- 反向查找,不显示符合条件的行。
ps -ef | grep sshd
ps -ef | grep -v grep | grep sshd
文章源自国外主机测评-https://www.zjcp.org/13951.html
命令输出结果:文章源自国外主机测评-https://www.zjcp.org/13951.html
命令输出结果:文章源自国外主机测评-https://www.zjcp.org/13951.html
命令描述:sed是一种流编辑器,它是文本处理中非常中的工具,能够完美的配合正则表达式使用。
1. 处理时,把当前处理的行存储在临时缓冲区中,称为模式空间(pattern space)。 注意:
命令格式: 参数说明:
动作说明:
命令使用示例:
命令输出结果:
命令输出结果:
命令输出结果:
命令输出结果:
命令描述:和 sed 命令类似,awk 命令也是逐行扫描文件(从第 1 行到最后一行),寻找含有目标文本的行,如果匹配成功,则会在该行上执行用户想要的操作;反之,则不对行做任何处理。
命令格式: 参数说明:
内置变量:
awk中还可以指定脚本命令的运行时机。默认情况下,awk会从输入中读取一行文本,然后针对该行的数据执行程序脚本,但有时可能需要在处理数据前运行一些脚本命令,这就需要使用BEGIN关键字,BEGIN会在awsk读取数据前强制执行该关键字后指定的脚本命令。
和BEGIN关键字相对应,END关键字允许我们指定一些脚本命令,awk会在读完数据后执行它们。
命令使用示例:
命令输出结果:
命令输出结果:
命令输出结果:
命令输出结果:
命令输出结果:
命令输出结果:
命令描述:cut命令主要用来切割字符串,可以对输入的数据进行切割然后输出。
命令格式: 参数说明:
命令使用示例:
命令描述:tr命令用于对来自标准输入的字符进行替换、压缩和删除。
命令格式: 参数说明:
命令使用示例:
命令输出结果:
命令输出结果:
命令输出结果:
命令输出结果:
grep -r *.sh /etc
grep /'ntp[0-9].aliyun.com/' /etc/ntp.conf
sed
2. 接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。
3. 接着处理下一行,这样不断重复,直到文件末尾。
sed [参数] [动作] [文件]
。
参数
说明
-e [script]
执行多个script
-f [script文件]
执行指定script文件
-n
仅显示script处理后的结果
-i
输出到原文件,静默执行(修改原文件)
动作
说明
a
在行后面增加内容
c
替换行
d
删除行
i
在行前面插入
p
打印相关的行
s
替换内容
sed /'3,$d/' /etc/passwd
sed /'$a admin:x:1000:1000:admin:/home/admin:/bin/bash/' /etc/passwd
sed /'s/SELINUX=disabled/SELINUX=enforcing//' /etc/selinux/config
sed /'1c abcdefg/' /etc/passwd
awk
awk [参数] [脚本] [文件]
。
参数
说明
-F fs
指定以fs作为输入行的分隔符,awk 命令默认分隔符为空格或制表符
-f file
读取awk脚本
-v val=val
在执行处理过程之前,设置一个变量var,并给其设置初始值为val
变量
用途
FS
字段分隔符
$n
指定分隔的第n个字段,如$1、$3分别表示第1、第三列
$0
当前读入的整行文本内容
NF
记录当前处理行的字段个数(列数)
NR
记录当前已读入的行数
FNR
当前行在源文件中的行号
ifconfig eth0 |awk /'/inet/{print $2}/'
df -h |awk /'///$/{print $4}/'
awk -F: /'$3<1000{x } END{print x}/' /etc/passwd
awk -F: /'$7!~/nologin$/{print $1,$7}/' /etc/passwd
head -3 /etc/passwd | awk /'BEGIN{FS=":";print "name/tuid"}{print $1,"/t"$3}END{print "sum lines "NR}/'
netstat -na | awk /'/^tcp/ { S[$NF]} END {for(a in S) print a, S[a]}/'
ps -ef | grep httpd | awk {/'print $2/'} | xargs kill -9
cut
cut [参数] [文件]
。
参数
说明
-b
以字节为单位进行分割
-c
以字符为单位进行分割
-d
自定义分隔符,默认为制表符
tr
tr [参数] [文本]
。
参数
说明
-c
反选指定字符
-d
删除指定字符
-s
将重复的字符缩减成一个字符
-t [第一字符集] [第二字符集]
删除第一字符集较第二字符集多出的字符,使两个字符集长度相等
echo "HELLO WORLD" | tr /'A-Z/' /'a-z/'
echo "hello 123 world 456" | tr -d /'0-9/'
echo "thissss is a text linnnnnnne." | tr -s /' sn/'
cat /dev/urandom | tr -dc a-zA-Z0-9 | head -c 13