10、文本处理工具
创始人
2024-03-13 06:59:05
0

文章目录

  • 10、文本处理工具
    • 10.1 cut
    • 10.2 awk


尚硅谷2022版Linux扩展篇Shell教程-讲师:武晟然

壁立千仞 无欲则刚

10、文本处理工具

10.1 cut

cut 的工作就是“剪”,具体的说就是在文件中负责剪切数据用的。

cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段输出。

1)基本用法

cut [选项参数] filename
说明:默认分隔符是制表符

2)选项参数说明

选项参数功能
-f列号,提取第几列
-d分隔符,按照指定分隔符分割列,默认是制表符“\t”
-c按字符进行切割 后加加 n 表示取第几列 比如 -c 1

3)案例实操

(1)数据准备

[root@centos7-101 ~]# touch cut.txt
[root@centos7-101 ~]# vim cut.txt
dong shen
guan zhen
wo wo
lai lai
le le

(2)切割 cut.txt 第一列

[root@centos7-101 ~]# cut -d " " -f 1 cut.txt 
dong
guan
wo
lai
le

(3)切割 cut.txt 第二、三列

[root@centos7-101 ~]# cut -d " " -f 2 cut.txt 
shen
zhen
wo
lai
le

(4)对登录用户按:剪切提取

# 原始数据
[root@centos7-101 ~]# cat /etc/passwd | grep bash$
root:x:0:0:root:/root:/bin/bash
user:x:1000:1000:user:/home/user:/bin/bash
tianyu:x:1001:1001::/home/tianyu:/bin/bash
qiqi:x:1002:1002::/home/qiqi:/bin/bash
# 截取后数据
[root@centos7-101 ~]# cat /etc/passwd | grep bash$ | cut -d ":" -f 1,6,7
root:/root:/bin/bash
user:/home/user:/bin/bash
tianyu:/home/tianyu:/bin/bash
qiqi:/home/qiqi:/bin/bash
# 截取1到4列
[root@centos7-101 ~]# cat /etc/passwd | grep bash$ | cut -d ":" -f 1-4
root:x:0:0
user:x:1000:1000
tianyu:x:1001:1001
qiqi:x:1002:1002

(5)在 cut.txt 文件中切割出 guan

[root@centos7-101 ~]# cat cut.txt |grep guan | cut -d " " -f 1
guan

(6)选取系统 PATH 变量值,第 2 个“:”开始后的所有路径:

# 截取原始数据
[root@centos7-101 ~]# echo $PATH
/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin
# 截取第3列到最后
[root@centos7-101 ~]# echo $PATH | cut -d ":" -f 3-
/usr/sbin:/usr/bin:/root/bin
# 截取第2列
[root@centos7-101 ~]# echo $PATH | cut -d ":" -f 2
/usr/local/bin
# 截取第2列到5列
[root@centos7-101 ~]# echo $PATH | cut -d ":" -f 2-5
/usr/local/bin:/usr/sbin:/usr/bin:/root/bin

(7)切割 ifconfig 后打印的 IP 地址

[root@centos7-101 ~]# ifconfig ens33 | grep netmask | cut -d " " -f 10
192.168.0.101

10.2 awk

一个强大的文本分析工具,把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行分析处理。

1)基本用法
awk [选项参数] ‘/pattern1/{action1} /pattern2/{action2}…’ filename
pattern:表示 awk 在数据中查找的内容,就是匹配模式
action:在找到匹配内容时所执行的一系列命令

2)选项参数说明

选项参数功能
-F指定输入文件分隔符
-v赋值一个用户定义变量

3)案例实操

(1)数据

[root@centos7-101 ~]# cat /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
...

passwd 数据的含义
用户名:密码(加密过后的):用户 id:组 id:注释:用户家目录:shell 解析器

(2)搜索 passwd 文件以 root 关键字开头的所有行,并输出该行的第 7 列。

[root@centos7-101 ~]# cat /etc/passwd | awk -F ":" '/^root/ {print $7}'
/bin/bash

(3)搜索 passwd 文件以 root 关键字开头的所有行,并输出该行的第 1 列和第 7 列,中间以“,”号分割。

[root@centos7-101 ~]# cat /etc/passwd | awk -F ":" '/^root/ {print $1","$7}'
root,/bin/bash

注意:只有匹配了 pattern 的行才会执行 action。

(4)只显示/etc/passwd 的第一列和第七列,以逗号分割,且在所有行前面添加列名 user,shell 在最后一行添加"dahaige,/bin/zuishuai"。

[root@centos7-101 ~]# cat /etc/passwd | awk -F ":" 'BEGIN{print "user,shell"} {print $1","$7} END{print "end"}'
user,shell
root,/bin/bash
...
user,/bin/bash
tianyu,/bin/bash
qiqi,/bin/bash
end

注意:BEGIN 在所有数据读取行之前执行;END 在所有数据执行之后执行。

(5)将 passwd 文件中的用户 id 增加数值 1 并输出

[root@centos7-101 ~]# cat /etc/passwd | awk -v i=1 -F ":" '{print $3+i}'
1
2
3
...

4)awk 的内置变量

变量说明
FILENAME文件名
NR已读的记录数(行号)
NF浏览记录的域的个数(切割后,列的个数)

5)案例实操

(1)统计 passwd 文件名,每行的行号,每行的列数

[root@centos7-101 ~]# awk -F ":" '{print "文件名:" FILENAME "行:" NR "列:" NF }' /etc/passwd
文件名:/etc/passwd行:1列:7
文件名:/etc/passwd行:2列:7
文件名:/etc/passwd行:3列:7
... 

(2)查询 ifconfig 命令输出结果中的空行所在的行号

[root@centos7-101 ~]# ifconfig | awk '/^$/{print "空行:" NR}'
空行:12
空行:21
空行:29

(3)切割指定 IP

[root@centos7-101 ~]# ifconfig ens33 | awk '/netmask/ {print $2}'
192.168.0.101

(4)切割所有 IP

[root@centos7-101 ~]# ifconfig | awk '/netmask/ {print $2}'
192.168.0.101
127.0.0.1
192.168.122.1

相关内容

热门资讯

Linux查看log日志命令总... 目录1,动态实时查看日志1.1 tail -f filename1.2 追踪特定内容日...
Elasticsearch 索... 1、创建\更新索引模板 PUT _template/logging_template {   "in...
语义分割------FCN、d... 一、个人理解 语义分割,其实就是为图片中的每个像素打上相应的标签,即将其所代表的语义具现化,呈现出的...
C++标准模版库中线程的使用 文章目录线程的基本使用最基础的使用方法在创建线程时传参再看看join线程与线程之间的同步 线程是程序...
CMMI之度量与分析(MA) 目的度量与分析(Measurement and Analysis, MA...
TII投稿时间线 IEEE论文审稿状态由awaiting ae recommendation变为AwaitingRev...
C++11中的完美转发 C++11中的完美转发 在讨论引用折叠这个话题之前,先回顾一下C...
Python调用lua 可以使用 Python 的第三方库 pylua 来调用 Lua 代码。 首先,需要在 ...
【手写 Promise 源码】... 一,前言 目前,以下专栏已完结(初版完结,持...
利用Golang可选参数实现可... 本文讨论Golang函数可选参数及函数类型,以及如何利用可选函数类型实现可选模式。同时...