Pandas是一个Python数据分析库。
按照标准约定,我们在使用Pandas时,最好遵循如下格式:
1 | import pandas as pd |
DataFrame
数据帧:二维表格型数据结构。
构造函数:
1 | DataFrame(data=None, index=None, columns=None, dtype=None, copy=False) |
常用属性
values:返回一个DataFrame的NumPy表示
shape:返回一个表示DataFrame维度的元组
访问元素
- at:通过行名和列名来访问某一个元素。
1 | import pandas as pd |
输出:
1 | A B C |
- iat:通过行和列的索引来访问某一个元素。
1 | import pandas as pd |
输出:
1 | 2 |
- head
函数原型:
1 | head(n=5) |
返回DataFrame的前n行,n的默认值为5。
- tail
函数原型:
1 | tail(n=5) |
返回DataFrame的最后n行,n的默认值为5。
遍历
- iterrows():按照行进行迭代,每次返回一个(index, Series)对
1 | import pandas as pd |
输出:
1 | 0 |
- iteritems()和items():按照列进行迭代,每次返回一个(column name, Series)对
1 | import pandas as pd |
输出:
1 | A |
添加行
添加行可以使用DataFrame的append()方法,该方法将返回一个新的DataFrame对象。
1 | import pandas as pd |
输出:
1 | A B |
删除行/列
删除行/列,可以使用DataFrame的drop()方法,该方法将返回一个新的DataFrame对象。
drop()包含一个叫axis的参数:
axis : {0 or ‘index’, 1 or ‘columns’}, default 0
Whether to drop labels from the index (0 or ‘index’) or columns (1 or ‘columns’).
读取CSV文件
使用read_csv()方法,可以读取CSV文件,并返回一个DataFrame对象。
1 | import pandas as pd |
生成CSV文件
使用DataFrame对象的to_csv()方法,可以方便地生成CSV文件。
1 | import pandas as pd |
读取Excel文件
读取Excel可以使用read_excel()(使用前需要先安装xlrd)。
1 | import pandas as pd |
生成Excel文件
使用DataFrame对象的to_excel()方法,可以方便地生成Excel文件(使用前需要先安装xlwt)。
1 | import pandas as pd |