• 作者:老汪软件技巧
  • 发表时间:2023-12-31 02:00
  • 浏览量:

简介

是基于Numpy创建的包,内置了大量标准函数,能够高效地解决数据分析数据处理和分析任务,支持多种文件的操作,比如Excel,csv,json,txt 文件等,读取文件之后,就可以对数据进行各种清洗、分析操作了。

padas和excel中数据结构的对应关系

工作表()

列()

index

行号(row index)

Row

行(Row)

NaN

空单元格(empty cell)

中的 类似于 Excel 工作表,虽然 Excel 工作簿可以包含多个工作表,但 独立存在的。

序列是表示 的一列的数据结构,类似于引用电子表格的列。

Index

每个 和 都有一个索引,它们是数据行上的标签。在 中,如果未指定索引,则默认使用 (第一行 = 0,第二行 = 1,依此类推),类似于电子表格中的每行开始的数字。 在 中,索引可以设置为一个(或多个)唯一值,这就像在工作表中有一列用作行标识符一样,这些索引值可用于引用行。索引值是持久的,所以对 中的行重新排序,特定行的标签不会改变。

读取excel

读取文件之后,将内容存储为,然后就可以调用内置的各种函数进行分析处理。

对xlrd等模块进行了封装,可以很方便的处理excel文件,支持xls和xlsx等格式,需要提前安装模块pip

pandas.read_excel(filename, sep, header,encoding)

参数解释

()

可以读取Excel中的数据表,并指定分隔符(如制表符或逗号)。

pd.read_table('data.xlsx', sheet_name='Sheet1', delimiter='\t', header=0)

例子

panads操作excel

import pandas as pd
result = pd.read_excel(r"E:\2021竞赛题目列表(本科).xlsx")
print(result)

创建Excel

import pandas as pd
# 创建数据框
data = {'Name': ['Tom', 'Jerry', 'Mickey', 'Donald'],
        'Age': [20, 25, 22, 28],
        'Gender': ['M', 'M', 'M', 'M']}
df = pd.DataFrame(data)
# 保存数据框到 Excel 文件
df.to_excel('example.xlsx', index=False)

效果

panads操作excel

常用操作合集

panads操作excel