pandas读取csv文件的数据数目（pandas.readcsv）

愿不离 2023-08-08 07:55:39

收藏赞

Pandas.read_CSV 有很多有用的参数，你都知道吗？本文将介绍一些 pandas.read_csv()有用的参数，这些参数在我们日常处理CSV文件的时候是非常有用的。

pandas.read_csv() 是最流行的数据分析框架 pandas 中的一个方法。我们日常使用的时候这个函数也是我们用的最多的，但是pandas.read_csv() 有很多输入参数，其中 filepath或buffer 参数是必不可少的，其余的都是可选的。所以我们一般也不会太关注，但是这些可选参数可以帮我们解决大问题。以下是read_csv完整的参数列表：

pandas.read_csv(filepath_or_buffer, sep=NoDefault.no_default, delimiter=None, header=infer, names=NoDefault.no_default, index_col=None, usecols=None, squeeze=None, prefix=NoDefault.no_default, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=None, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, cache_dates=True, iterator=False, chunksize=None, compression=infer, thousands=None, decimal=., lineterminator=None, quotechar=", quoting=0, doublequote=True, escapechar=None, comment=None, encoding=None, encoding_errors=strict, dialect=None, error_bad_lines=None, warn_bad_lines=None, on_bad_lines=None, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None, storage_options=None)

我们用以下的CSV 文件作为样例。你可以将此数据复制到文本文件中并将其保存为 dummy.csv 文件。

#1.###############################################################, #2. some metadata #, #3. Last updated: 2022-06-23 05:49:15 UTC #, #4. #, #5. Terms Of Use: #, #6. For questions please contact #, #7. #############################################################, #8. , date,name 2022-06-23 05:49:15,a1 2022-06-22 14:52:16,a2 2022-06-22 06:45:16,a3 2022-06-21 15:02:34,a4 2022-06-21 09:00:17,a5 2022-06-21 08:59:59,a6 2022-06-20 13:57:09,a7 2022-06-20 09:06:59,a8 2022-06-20 09:06:54,a9 2022-06-19 17:26:45,a10 2022-06-19 17:26:32,a11 2022-06-19 09:26:13,a12 2022-06-19 09:25:57,a13 2022-06-18 07:09:55,a14 2022-06-17 08:14:21,a15

1、skiprows

skiprows 接收一个正整数。在读取 CSV 文件时，如果使用了 skiprows，Pandas 将从头开始删除指定的行。我们想从开头跳过 8 行，因此将 skiprows 设置为 8。如下所示：

pandas读取csv文件的数据数目（pandas.readcsv）(1)

2、comment

comment接收一个字符。如果该字符在行首出现，则将跳过该行。我们想跳过上面显示的 CSV 文件中包含一些额外信息的行，所以 CSV 文件读入 pandas 时指定 comment = ‘#’：

pandas读取csv文件的数据数目（pandas.readcsv）(2)

3、nrows

nrows 表示从顶部开始读取的行数，这是在处理 skiprows 和comment参数后计算的。如果希望从大文件中提取加载一部分数据，就需要这个参数。

例如，只读取在删除任何以数字“#”开头的行之后剩下的前 5 行。

pandas读取csv文件的数据数目（pandas.readcsv）(3)

4、dtype

在读取数据时可以直接定义某些列的 dtype。我们将name定义为string。

pandas读取csv文件的数据数目（pandas.readcsv）(4)

5、parse_dates

如果数据包含日期列，还可以在读取时使用 parse_dates 定义日期列。 Pandas 将自动从指定的“日期”列推断日期格式。我们将date传入parse_dates ， pandas 自动会将“date”列推断为日期 dtype。

pandas读取csv文件的数据数目（pandas.readcsv）(5)

6、skipfooter

与skiprows类似，它将跳过文件底部的行数。（这个参数不支持engine=c，所以需要指定engine=“python”，可以看下面截图中的提示）。 CSV 文件中，如果想删除最后一行，那么可以指定 skipfooter =1：

pandas读取csv文件的数据数目（pandas.readcsv）(6)

以上就是6个非常简单但是有用的参数，在读取CSV时使用它们可以最大限度地减少数据加载所需的工作量并加快数据分析。

作者：R. Gupta

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。

猜您喜欢

轰炸机手游高画质推荐（亡灵诡计实机展示刺激2D动作闯关体验）

Adult Swim Games日前为《亡灵诡计》公布了全新的实机内容视频，这是一款典型的2D动作闯关ARPG游戏，作品...

多情小男人 2023-08-08 07:08:11
Z-Library复活了网站和软件均可使用（Z-Library复活了网站和软件均可使用）

Z-Library，有“世界上最大的电子图书馆”之称资源众多，品类之丰是穷学生们读书的福音也是众多爱好读书人...

嗄迗颩 2023-08-08 07:19:55
骗子用我手机号注册东西怎么办（骗子现在是怎么操作的）

最近因为连续接到了几个国外的微信添加好友申请后，末科技小编小沫搜索了下，发现了骗子用的部分黑科技手法。使用国外免费虚...

紅顏為君醉 2023-08-08 06:07:41
rpg游戏开发有哪个软件是最简单的（游戏开发软件RPGMakerUnite延期至2023年春季）

《RPG Maker Unite》官方宣布，软件将从原定的 2022 年年内发售，延期至 2023 年春季发售，主要是为...

毙命爵士 2023-08-08 06:17:39
tl打印服务器设置教程（连接打印服务器TL-PS110U进行打印机安装步骤）

1、将TL-PS110U连接至本地局域网中，设置固定IP为192.168.1.216 2、将HP LaserJet...

高冷娇学姐 2023-08-08 06:14:17
长城46号抗磨液压油参数对照表（中石化长城牌抗磨液压油型号选择说明）

长城卓力L -H M抗磨液压油（高压高清）：2018年6月升级版上市是以深度精制的高品质基础油和添加剂，采用国际先...

五指姑娘 2023-08-08 06:21:31
液压油的型号与选用（液压油型号如何选择）

大家对于液压油应该相对比较熟悉些，也知道液压油型号众多，那么液压油型号如何选择呢？下面就来介绍一下。液压油型号分类 ...

莪是草一根 2023-08-08 06:47:50

秒懂生活

pandas读取csv文件的数据数目（pandas.readcsv）

猜您喜欢

轰炸机手游高画质推荐（亡灵诡计实机展示刺激2D动作闯关体验）

Z-Library复活了网站和软件均可使用（Z-Library复活了网站和软件均可使用）

骗子用我手机号注册东西怎么办（骗子现在是怎么操作的）

rpg游戏开发有哪个软件是最简单的（游戏开发软件RPGMakerUnite延期至2023年春季）

tl打印服务器设置教程（连接打印服务器TL-PS110U进行打印机安装步骤）

长城46号抗磨液压油参数对照表（中石化长城牌抗磨液压油型号选择说明）

液压油的型号与选用（液压油型号如何选择）

热门推荐

排行榜