如何使用Pandas将Excel文件导入Python?

2021年9月19日16:13:18 发表评论 1,955 次浏览

Pandas如何导入Excel文件?你可以使用Pandas轻松地将 Excel 文件导入 Python 。为了实现这一目标,你需要使用read_excel

在这个简短的Pandas将Excel文件导入Python的指南中,你将看到使用一个简单示例将 Excel 文件导入 Python 的步骤。

但在我们开始之前,这里有一个模板,你可以在 Python 中使用它来导入 Excel 文件:

import pandas as pd

df = pd.read_excel (r'Path where the Excel file is stored\File name.xlsx')
print (df)

请注意,对于早期版本的 Excel,你可能需要使用“xls”的文件扩展名

如果你有要导入的特定Excel 工作表,如下Pandas导入Excel文件代码示例

import pandas as pd

df = pd.read_excel (r'Path where the Excel file is stored\File name.xlsx', sheet_name='your Excel sheet name')
print (df)

现在让我们回顾一个包含要导入 Python 的数据的示例。

Python Pandas导入Excel文件:要导入 Python 的数据

假设你将下表存储在 Excel 中(其中 Excel 文件名为“产品列表”):

ProductPrice
Desktop Computer700
Tablet250
Printer120
Laptop1200

那么如何将上述数据导入 Python 中呢?

你可以按照以下步骤将 Excel 文件导入 Python。

使用Pandas将Excel文件导入Python的步骤

第 1 步:捕获文件路径

Pandas如何导入Excel文件?首先,你需要捕获 Excel 文件在你的计算机上存储的完整路径。

例如,假设一个 Excel 文件存储在以下路径下:

C:\Users\Ron\Desktop\Product List.xlsx

在下面提供的 Python 代码中,你需要修改路径名以反映 Excel 文件在你的计算机上存储位置。

不要忘记包含文件名(在我们的示例中,它是“产品列表”,以蓝色突出显示)。你还需要包含 Excel 文件扩展名(在我们的例子中,它是“ .xlsx ”,以绿色突出显示)。

第 2 步:应用 Python 代码

这是为我们的示例量身定制的 Python 代码。代码中包含其他注释以阐明一些使用的组件。

import pandas as pd

df = pd.read_excel (r'C:\Users\Ron\Desktop\Product List.xlsx') #place "r" before the path string to address special character, such as '\'. Don't forget to put the file name at the end of the path + '.xlsx'
print (df)

第 3 步:运行 Python 代码以导入 Excel 文件

运行 Python 代码(根据你的路径进行调整),你将获得以下数据集:

            Product  Price
0  Desktop Computer    700
1            Tablet    250
2           Printer    120
3            Laptop   1200

请注意,我们得到的结果与存储在 Excel 文件中的结果相同。

注意:如果在运行代码时出现以下错误,则必须安装额外的包:

导入错误:缺少可选依赖项“xlrd”

然后,你可以使用PIP 安装方法为 . xlsx文件:

pip install openpyxl

Pandas将Excel文件导入Python可选步骤:选择列子集

现在,如果你想从 Excel 文件中选择一个或多个特定的列怎么办?

例如,如果你只想选择Product列怎么办?如果是这种情况,你可以指定此列名称,如下Pandas导入Excel文件代码示例:

import pandas as pd

data = pd.read_excel (r'C:\Users\Ron\Desktop\Product List.xlsx') 
df = pd.DataFrame(data, columns= ['Product'])
print (df)

运行代码(调整文件路径后),你将只得到 Product 列:

            Product
0  Desktop Computer
1            Tablet
2           Printer
3            Laptop

你可以通过使用逗号分隔名称来指定其他列,因此如果你想同时包含 Product 和 Price 列,你可以使用以下语法:

import pandas as pd

data = pd.read_excel (r'C:\Users\Ron\Desktop\Product List.xlsx') 
df = pd.DataFrame(data, columns= ['Product','Price'])
print (df)

你需要确保代码中指定的列名与 Excel 文件中的列名完全匹配。否则,你将获得NaN values。

Python Pandas导入Excel文件总结

你刚刚看到了如何使用Pandas将Excel文件导入Python。

Pandas如何导入Excel文件?有时,你可能需要将 CSV 文件导入 Python。如果是这种情况,你可能需要查看以下教程,该教程解释了如何使用 Pandas将CSV文件导入 Python。

你还可以查看Pandas 文档 以了解更多关于你可以在 read_excel 中应用的不同选项的信息。

木子山

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: