DataFrame
DataFrame是Pandas的一种数据类型可以理解为n乘n的表格结构;下面是它的部分常用用法
1.创建DataFrame
import pandas as pd
import numpy as np
# dict
pd.DataFrame(data={'id':['a','b','c'],'values':[1,3,5]})
# list
pd.DataFrame(data=[[1,3,5],[2,4,6],[9,8,7]])
# tuple
pd.DataFrame(data=((1,3,5),(2,4,6),(9,8,7)))
# ndarray
pd.DataFrame(data=np.array([[1,3,5],[2,4,6],[9,8,7]]))
# Series
pd.DataFrame(data=pd.Series([1,3,5,2,4,6,9,8,7]))
2.DataFrame属性
df = pd.DataFrame(data=[[1,3,5],[2,4,6],[9,8,7]])
df.shape # 形状
df.ndim # 维度、轴
df.iloc[0] # 按索引位置
df.loc[1] # 按索引值
df.dtypes # 元素类型
df.T # 转置
df.size # 元素个数
df.index # 索引值
df.values # 元素值
df.columns # 列名
3.DataFrame方法
df.keys() # 获取索引
df.head() # 获取前五行(默认)
df.sort_values() # 按元素值升序排序
df.sort_index(ascending=False) # 按索引值降序排序
df.describe() # 查看详细描述
df.mean() # 求平均
df.drop() # 返回删除某列的DataFrame
df.drop_duplicates() # 去重
df.value_counts() # 统计某列不同值出现的次数
df.reset_index() # 重置索引
df.astype() # 转换类型
df.dropna() # 去除NaN值