TSV(Tab Separated Values)和CSV(Comma Separated Values)都是常见的文本文件格式,用于存储表格数据。它们之间的主要区别在于字段之间的分隔符。
-
CSV(逗号分隔值):
- 使用逗号作为字段之间的分隔符。
- 由于某些数据中可能包含逗号,因此CSV文件可能需要使用引号来表示包含逗号的数据。
- 通常使用
.csv
作为文件扩展名。
-
TSV(制表符分隔值):
- 使用制表符(
\t
)作为字段之间的分隔符。 - 由于制表符在文本中不太常见,因此TSV文件相对较少受到特殊字符的影响。
- 通常使用
.tsv
作为文件扩展名。
- 使用制表符(
因此,虽然这两种格式都用于存储表格数据,但在分隔符方面有所不同。选择使用哪种格式通常取决于数据中是否包含逗号以及对数据中特殊字符的容忍程度。
Python 读取代码
import pandas as pd# 读取.tsv文件
df = pd.read_csv('your_file.tsv', sep='\t')# 显示读取的数据
print(df)