【linux】(2)文件内容排序sort

devtools/2024/12/22 13:11:04/

sort 是一个用于排序文件内容的命令行工具,在 Linux 和 Unix 系统中非常常用。

基本用法

sort [OPTION]... [FILE]...

常用选项

  1. 按数值排序 -n
sort -n filename

例子:对包含数值的文件进行排序。

  1. 按字典顺序排序 -d
sort -d filename

例子:仅考虑字母和数字字符进行排序。

  1. 按月份排序 -M
sort -M filename

例子:对包含月份名称的文件进行排序。

  1. 忽略大小写 -f
sort -f filename

例子:忽略大小写进行排序。

  1. 逆序排序 -r
sort -r filename

例子:逆序排序。

  1. 指定分隔符 -t
   sort -t',' -k2 filename

例子:使用逗号作为字段分隔符,并按第二个字段排序。

  1. 按指定键排序 -k
sort -k2 filename

例子:按第二个字段排序。

  1. 唯一排序 -u
sort -u filename

例子:去除重复行并排序。

示例文件

假设有一个文件 example.txt,内容如下:

banana
apple
Orange
grape
pear
Lemon

按字母顺序排序

默认情况下,sort 按字母顺序排序:

sort example.txt

输出:

Lemon
Orange
apple
banana
grape
pear

按数值排序

假设有一个文件 numbers.txt,内容如下:

10
2
33
21
5

按数值排序:

sort -n numbers.txt

输出:

2
5
10
21
33

忽略大小写排序

sort -f example.txt

输出:

apple
banana
grape
Lemon
Orange
pear

逆序排序

sort -r example.txt

输出:

pear
grape
banana
apple
Orange
Lemon

按字段排序

假设有一个文件 data.txt,内容如下:

1,apple
2,banana
3,grape
4,pear
5,orange

按第二个字段排序(使用逗号作为分隔符):

sort -t',' -k2 data.txt

输出:

1,apple
2,banana
3,grape
5,orange
4,pear

唯一排序

假设有一个文件 duplicates.txt,内容如下:

apple
banana
apple
orange
banana

去除重复行并排序:

sort -u duplicates.txt

输出:

apple
banana
orange

稳定排序

使用 -s 选项可以保证稳定排序,即保持原始相等元素的顺序。

sort -s -k1,1 data.txt

按指定字符范围排序

可以使用 -k 选项指定排序的起始和结束字符位置。例如,按每行的第2到第3个字符排序:

sort -k1.2,1.3 filename

综合示例

假设有一个更复杂的文件 complex.txt,内容如下:

3,John,5000
1,Jane,7000
2,Bob,6000
4,Alice,5500

按第二个字段(名字)排序,然后按第三个字段(工资)排序:

sort -t',' -k2,2 -k3,3n complex.txt

输出:

4,Alice,5500
2,Bob,6000
1,Jane,7000
3,John,5000

排序带空格的字段

对于带有空格的字段,可以使用 -b 选项忽略前导空格进行排序:

sort -b -k2,2 filename

排序文件内容并保存到新文件

可以将排序结果重定向到新文件:

sort example.txt > sorted_example.txt

http://www.ppmy.cn/devtools/45984.html

相关文章

Flutter 中的 SliverAppBar 小部件:全面指南

Flutter 中的 SliverAppBar 小部件:全面指南 Flutter 是一个现代的 UI 框架,它允许开发者使用 Dart 语言来构建跨平台的移动、Web 和桌面应用。在 Flutter 的丰富组件库中,SliverAppBar 是一个强大的滚动效果组件,它为应用栏&…

性能飙升50%,react-virtualized-list如何优化大数据集滚动渲染

在处理大规模数据集渲染时,前端性能常常面临巨大的挑战。本文将探讨 react-virtualized-list 库如何通过虚拟化技术和 Intersection Observer API,实现前端渲染性能飙升 50% 的突破!除此之外,我们一同探究下该库还支持哪些新的特性…

12.Redis之补充类型渐进式遍历

1.stream 官方文档的意思, 就是 stream 类型就可以用来模拟实现这种事件传播的机制~~stream 就是一个队列(阻塞队列)redis 作为一个消息队列的重要支撑属于是 List blpop/brpop 升级版本.用于做消息队列 2.geospatial 用来存储坐标 (经纬度)存储一些点之后,就可以让用户给定…

实验室原始记录电子化管理的发展及应用

实验室原始记录电子化管理的发展及应用,主要体现在以下几个方面: 一、发展背景与意义 随着科技的进步和实验室管理的现代化,实验室原始记录电子化发展已成为必然趋势。传统的实验室原始记录方式主要依赖于纸质文档,这种方式存在诸…

【小梦C嘎嘎——启航篇】C++特殊类设计

【小梦C嘎嘎——启航篇】C特殊类设计😎 前言🙌1.请设计一个类,该类不能被继承2.请设计一个类,只能在堆上创建对象3.请设计一个类,只能在栈上创建对象4.请设计一个类,该类不能发生拷贝5.请设计一个类&#x…

【Elasticsearch】IK分词器的下载及使用

安装IK分词器 网址:https://github.com/infinilabs/analysis-ik 3.1.在线安装ik插件(较慢,不推荐) # 进入容器内部 es为容器名称 docker exec -it es /bin/bash# 在线下载并安装 7.17.21为镜像版本要与之前保持一致 ./bin/elasticsearch-pl…

重构观看记录模块——全量拉取直播录播观看记录并统计时长

需求 学员购买课程并开课之后会生成一个课表,学员根据课表去上课。目前存在转班的功能,转班的时候会把原来的课表作废掉,然后按照新转的班型去生成新的课表。而这样存在一个问题,新的课表和原来的课表一般会存在相同的课节&#…

美国RAKsmart海外大带宽服务器的显著特点

美国RAKsmart海外大带宽服务器在当前的互联网服务领域中备受瞩目,其显著特点主要体现在以下几个方面: 高带宽资源:RAKsmart服务器拥有充足的带宽资源,最低提供100M独享带宽,并支持升级至G口、10G口大带宽方案。这种高带…