
️ 标签Linux数据处理排序搜索压缩归档运维Shell 适用人群Linux 初学者、后端开发、运维人员、学生、数据处理实训 核心亮点覆盖数据排序、数据搜索、数据压缩、数据归档四大高频场景命令实用、示例可直接复制一、前言在 Linux 环境下处理日志文件、导出数据、备份文件、清理磁盘是非常高频的工作。 熟练掌握数据排序、数据搜索、数据压缩、数据归档这四类操作可以大幅提升数据处理效率。本文按照企业最常用场景分为四大部分数据排序sort数据搜索grep数据压缩gzip、bzip2、xz、zip数据归档tar所有命令均为实战示例看完即可上手工作。二、数据排序sortsort用于对文本文件内容按行排序。2.1 基础排序sort file.txt2.2 按数字排序sort -n file.txt2.3 逆序降序sort -r file.txt2.4 去重排序sort -u file.txt2.5 将结果保存到文件sort file.txt -o sorted.txt2.6 按指定列排序sort -k 2 file.txt2.7 综合示例按第二列数字降序sort -k 2nr file.txt三、数据搜索grepgrep是 Linux 最强大的文本搜索工具用于过滤、查找关键字。3.1 基础查找grep error log.txt3.2 忽略大小写grep -i error log.txt3.3 显示行号grep -n error log.txt3.4 反向匹配排除grep -v error log.txt3.5 统计匹配行数grep -c error log.txt3.6 递归搜索目录中所有文件grep -r TODO /root/code3.7 正则匹配grep -E warn|error log.txt四、数据压缩gzip /bzip2 /xz/zip用于减小文件体积节省磁盘与传输时间。4.1 gzip最快、最常用gzip file.txt # 压缩 gunzip file.txt.gz # 解压4.2 bzip2压缩率更高bzip2 file.txt bunzip2 file.txt.bz24.3 xz压缩率最高xz file.txt unxz file.txt.xz4.4 zip通用跨平台zip data.zip file1.txt file2.txt unzip data.zip五、数据归档tartar用于将多个文件 / 目录打包成一个文件归档常与压缩结合使用。5.1 打包 gzip 压缩最常用tar -zcvf archive.tar.gz dir/5.2 解压 tar.gztar -zxvf archive.tar.gz5.3 打包 bzip2 压缩tar -jcvf archive.tar.bz2 dir/5.4 解压 tar.bz2tar -jxvf archive.tar.bz25.5 打包 xz 最高压缩tar -Jcvf archive.tar.xz dir/5.6 查看归档文件内容不解压tar -tvf archive.tar.gz六、企业高频组合命令必备6.1 日志排序统计访问量 Top10awk {print $1} access.log | sort | uniq -c | sort -nr | head -106.2 搜索错误日志并保存grep -n ERROR app.log error.log6.3 备份目录归档 压缩tar -zcvf /backup/www_$(date %Y%m%d).tar.gz /var/www6.4 批量解压当前目录所有 zipfor f in *.zip; do unzip $f; done七、命令总结表功能命令典型示例数据排序sortsort -n file.txt数据搜索grepgrep -n key file压缩gzipgzip file.txt解压gunzipgunzip file.gz归档压缩tartar -zcvf a.tar.gz dir解压归档tartar -zxvf a.tar.gz八、总结Linux 处理数据文件核心四大技能排序sort搜索grep压缩gzip/bzip2/xz/zip归档tar掌握它们你就可以高效处理日志、数据、备份、归档等日常工作。版权声明本文为原创 Linux 技术文章CSDN 首发专注 Linux 数据文件处理禁止未经授权转载、抄袭、搬运侵权必究