Pandas-DataFrame

桥蕤
• 阅读 199

DataFrame

DataFrame是Pandas的一种数据类型可以理解为n乘n的表格结构;下面是它的部分常用用法

1.创建DataFrame

import pandas as pd
import numpy as np

# dict
pd.DataFrame(data={'id':['a','b','c'],'values':[1,3,5]})
# list
pd.DataFrame(data=[[1,3,5],[2,4,6],[9,8,7]])
# tuple
pd.DataFrame(data=((1,3,5),(2,4,6),(9,8,7)))
# ndarray
pd.DataFrame(data=np.array([[1,3,5],[2,4,6],[9,8,7]]))
# Series
pd.DataFrame(data=pd.Series([1,3,5,2,4,6,9,8,7]))

2.DataFrame属性

df = pd.DataFrame(data=[[1,3,5],[2,4,6],[9,8,7]])
df.shape        # 形状
df.ndim         # 维度、轴
df.iloc[0]      # 按索引位置
df.loc[1]       # 按索引值
df.dtypes       # 元素类型
df.T            # 转置
df.size         # 元素个数
df.index        # 索引值
df.values       # 元素值
df.columns      # 列名

3.DataFrame方法

df.keys()                        # 获取索引
df.head()                        # 获取前五行(默认)
df.sort_values()                 # 按元素值升序排序
df.sort_index(ascending=False)   # 按索引值降序排序
df.describe()                    # 查看详细描述
df.mean()                        # 求平均
df.drop()                        # 返回删除某列的DataFrame
df.drop_duplicates()             # 去重
df.value_counts()                # 统计某列不同值出现的次数
df.reset_index()                 # 重置索引
df.astype()                      # 转换类型  
df.dropna()                      # 去除NaN值
点赞
收藏
评论区
推荐文章
CuterCorley CuterCorley
3年前
Python数据分析实战(2)使用Pandas进行数据分析
一、Pandas的使用1.Pandas介绍Pandas的主要应用包括:数据读取数据集成透视表数据聚合与分组运算分段统计数据可视化Pandas的使用很灵活,最重要的两个数据类型是DataFrame和Series。对DataFrame最直观的理解是把它当成一个Excel表格文件,如下:索引是从0开始的,也
数据同步gossip协议原理与应用场景介绍
Gossip是一种p2p的分布式协议。它的核心是在去中心化结构下,通过将信息部分传递,达到全集群的状态信息传播,传播的时间收敛在O(Log(N))以内,其中N是节点的数量。基于gossip协议,可以构建出状态一致的各种解决方案。
Wesley13 Wesley13
3年前
FLV文件格式
1.        FLV文件对齐方式FLV文件以大端对齐方式存放多字节整型。如存放数字无符号16位的数字300(0x012C),那么在FLV文件中存放的顺序是:|0x01|0x2C|。如果是无符号32位数字300(0x0000012C),那么在FLV文件中的存放顺序是:|0x00|0x00|0x00|0x01|0x2C。2.  
Wesley13 Wesley13
3年前
PHP创建多级树型结构
<!lang:php<?php$areaarray(array('id'1,'pid'0,'name''中国'),array('id'5,'pid'0,'name''美国'),array('id'2,'pid'1,'name''吉林'),array('id'4,'pid'2,'n
Wesley13 Wesley13
3年前
Java数据结构和算法(十五)——无权无向图
前面我们介绍了树这种数据结构,树是由n(n0)个有限节点通过连接它们的边组成一个具有层次关系的集合,把它叫做“树”是因为它看起来像一棵倒挂的树,包括二叉树、红黑树、234树、堆等各种不同的树,有对这几种树不了解的可以参考我前面几篇博客。而本篇博客我们将介绍另外一种数据结构——图,图也是计算机程序设计中最常用的数据结构之一,从数学意义上讲
Stella981 Stella981
3年前
Python基础(一)
1.基础类型python的数据类型可以分为两种,一种是内置的,一种是其他包中的,内置的数据类型可以分为10种:(1)整数用int表示,强制转换函数为int():x10print(x)int(10.88)输出都是10.!在这里插入图片描述(https://img
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
9个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这
桥蕤 桥蕤
5个月前
Pandas-Series
Series是Pandas的一种数据类型可以理解为1乘n的表格结构;下面是它的部分常用用法1.创建Seriespythonimportnumpyasnpimportpandasaspdlistpd.Series(1,2,3)pd.Series(ifo
曹训 曹训
2个月前
2:Python字符串与数字
字符串(引号):只有四种情况如下name"我是编程高手"name'我是编程高手'name"""我是编程高手"""name'''我是编程高手'''加法:n1"alex"n2"sb"n3"df"n4n1n2n3print(n4)"alexsbdf"乘法:n