pandas读取excel文件
pandas怎么读取excel文件呢?不知道的小伙伴来看看小编今天的分享吧!
pandas读取excel文件,输入代码如下:
import pandas as pd
#使用pandas读取excel文件
xls_file=pd.ExcelFile('./data/workbook.xls')
xls_file.sheet_names#显示出读入excel文件中的表名字
table1=xls_file.parse('first_sheet')
table2=xls_file.parse('second_sheet')
xlsx_file=pd.ExcelFile("./demo.xlsx")
x1=xlsx_file.parse(0)
x2=xlsx_file.parse(1)
#excel文件的写出
#data.to_excel("abc.xlsx",sheet_name="abc",index=False,header=True) #该条语句会运行失败,原因在于写入的对象是np数组而不是DataFrame对象,只有DataFrame对象才能使用to_excel方法。
DataFrame(data).to_excel("abc.xlsx",sheet_name="123",index=False,header=True)
#excel文件和pandas的交互读写,主要使用到pandas中的两个函数,一个是pd.ExcelFile函数,一个是to_excel函数
拓展资料:
pandas
Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。
pandas数据结构
Series:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构List也很相近。Series如今能保存不同种数据类型,字符串、boolean值、数字等都能保存在Series中。
Time- Series:以时间为索引的Series。
DataFrame:二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。
Panel :三维的数组,可以理解为DataFrame的容器。
Panel4D:是像Panel一样的4维数据容器。
PanelND:拥有factory集合,可以创建像Panel4D一样N维命名容器的模块。
以上就是小编今天的分享了,希望可以帮助到大家。
pandas读取excel文件中的数据
Pandas Excel教程:如何读写excel文件
大家好,这是近期学习的data analysis 那本书的总结,发表这些东西的主要目的就是督促自己,希望大家关注评论指出不足,一起进步。
一如往常,在使用Pandas时,我们必须从导入模块开始:
导入之后就可以用read_excel从Excel文件中读取数据了。最简单方法是将文件名作为字符串传递。如果我们不传递任何其他参数(例如工作表名称,它将默认读取第一张工作表。在第一个示例中,我将不使用任何参数,如图,我直接用以下代码打开了桌面上的一个名字为“attention of tweets.xlsx”的文件:
预览文件内容如下图:
在这里,默认情况下,使用read_excel时,Pandas将为数据框分配一个数字索引或行标签。
如果您有一列数据可以用作更好的索引列,我们可以通过将index_col参数设置新的索引列。在下面的示例中,我们使用“日期”列作为索引。
得到如下图:
使用read_excel读取特定列
使用Pandas read_excel时,我们将自动从Excel文件中获取所有列。如果由于某种原因我们不想解析Excel文件中的所有列,则可以使用参数 usecols。假设我们只想创建一个具有转发和评论列的数据框。我们可以通过参数usecols做到这一点:
得到如下结果:
读取Excel文件时如何跳过行
现在,复习一下在使用Pandas加载Excel文件时如何跳过行。对于这个读取的上面的excel示例
通过上面的代就可以直接跳过头两行,得到如图所示的结果:
这个操作应该不常用。
将Pandas数据框写入Excel
使用Pandas to_excel方法可以在Python中创建Excel文件。首先,我们将创建一个包含一些变量的数据框,我们将使用字典创建数据框。键将是列名,值将是包含我们的数据的列表:
然后,我们使用to_excel方法将数据框写入Excel文件。值得注意的是,在下面的代码块中使用Pandas to_excel时,我们不用任何参数。
这个时候在目录中就生成了一个名叫“NamesAndAges.xlsx"的文件,打开它,得到如下图:
可以看到我们在Excel文件中获得了一个包含数字的新列。这些是数据框的索引。
如果我们希望将工作表命名为其他名称,并且也不希望引入索引列,那么在使用Pandas写入Excel时可以添加以下参数:
这样就会得到一个叫“Names and Ages”的工作表,并且不含自动加的索引列。
好了,今天就是这些,希望看完的朋友可以留言建议,一起交流成长!
- 01-11教育
2022年员工个人辞职报告范文
- 04-05生活
续弦和填房的区别
- 07-11生活
鲜虾和冻虾的营养差别大吗
- 06-01生活
松花蛋可以和虾一起吃吗
- 07-23生活
黑人后代一定是黑人吗
- 02-27生活
酱花生米怎么做好吃
- 01-20教育
2022年海底两万里读后心得
- 12-11生活
婴儿充气游泳池漏气怎么办
推荐
- 1傅雷家书读后感作文1000字精选103
- 2乐不思蜀的意思341
- 3情商是什么386
- 4荣耀9a怎么设置微信分身130
- 5php语言怎么学473
- 6逐梦蓝天讲的是哪个厂499