python如何读取xlsx文件?所述的.xlsx是能够存储大量的以表格形式的数据,和许多类型的算术和逻辑计算的可以在Excel电子表格容易地进行Excel文档的延伸。有时出于编程目的,需要使用 Python 脚本从 excel 文档中读取数据。python如何读取excel文件?Python中存在许多模块来读取excel文档。一些有用的模块是xlrd、openpyxl和pandas。本教程中展示了使用这些模块在python读取excel文件的方法。
先决条件:
需要一个扩展名为 .xlsx 的虚拟 excel 文件来检查本教程的示例。你可以使用任何现有的 excel 文件或创建一个新文件。在这里,使用以下数据创建了一个名为sales.xlsx的新 Excel 文件。在本教程的下一部分中,该文件已用于通过使用不同的 Python 模块进行读取。
sales.xlsx
Sales Date | Sales Person | Amount |
---|---|---|
12/05/18 | Sila Ahmed | 60000 |
06/12/19 | Mir Hossain | 50000 |
09/08/20 | Sarmin Jahan | 45000 |
07/04/21 | Mahmudul Hasan | 30000 |
示例 1:使用 xlrd 读取 excel 文件
python如何读取xlsx文件?默认情况下,xlrd 模块未随 Python 安装。因此,你必须在使用该模块之前安装该模块。此模块的最新版本不支持扩展名为 .xlsx 的 excel 文件。因此,你必须安装此模块的 1.2.0 版本才能读取 xlsx 文件。从终端运行以下命令以安装所需版本的xlrd。
$ pip install xlrd==1.2.0
python如何读取excel文件?完成安装过程后,使用以下脚本创建一个 python 文件,以使用xlrd模块读取sales.xlsx文件。open_workbook()函数用于脚本中打开 xlsx 文件进行读取。这个 excel 文件只包含一张纸。因此,在脚本中使用了workbook.sheet_by_index()函数,参数值为 0。接下来,嵌套的“for”循环使用行和列值读取工作表的单元格值。脚本中使用了两个 range() 函数来定义基于工作表数据的行和列大小。该CELL_VALUE()函数用于在循环的每次迭代中读取工作表的特定单元格值。输出中的每个字段将由一个制表符空间分隔。
# Import the xlrd module
import xlrd
# Open the Workbook
workbook = xlrd.open_workbook("sales.xlsx")
# Open the worksheet
worksheet = workbook.sheet_by_index(0)
# Iterate the rows and columns
for i in range(0, 5):
for j in range(0, 3):
# Print the cell values with tab space
print(worksheet.cell_value(i, j), end='\t')
print('')
输出:
执行上述脚本后将出现以下输出。
示例 2:使用 openpyxl 读取 excel 文件
该openpyxl是另一个Python模块读取XLSX文件,它也不会被默认安装了Python。在使用它之前,从终端运行以下命令以安装此模块。
$ pip install openpyxl
完成安装过程后,使用以下脚本创建一个 python 文件来读取sales.xlsx文件。和xlrd模块一样,openpyxl模块有load_workbook()函数可以打开xlsx文件进行读取。该sales.xlsx文件被用作该函数的参数值。wookbook.active的对象已在脚本中创建以读取max_row和max_column属性的值。这些属性已在嵌套的 for 循环中用于读取sales.xlsx的内容文件。range() 函数用于读取工作表的行,而 iter_cols() 函数已用于读取工作表的列。输出中的每个字段将由两个制表符分隔。
# Import openyxl module
import openpyxl
# Define variable to load the wookbook
wookbook = openpyxl.load_workbook("sales.xlsx")
# Define variable to read the active sheet:
worksheet = wookbook.active
# Iterate the loop to read the cell values
for i in range(0, worksheet.max_row):
for col in worksheet.iter_cols(1, worksheet.max_column):
print(col[i].value, end="\t\t")
print('')
输出:
执行上述脚本后将出现以下输出。
示例 3:使用 Pandas 读取 excel 文件
python如何读取excel文件?pandas 模块没有像之前的模块那样安装 python。所以,如果你之前没有安装它,那么你必须安装它。运行以下命令从终端安装Pandas。
$ pip install pandas
python如何读取xlsx文件?完成安装过程后,使用以下脚本创建一个 python 文件来读取sales.xlsx文件。所述read_excel()大熊猫功能用于读取xlsx档案。此函数已在脚本中用于读取sales.xlsx文件。所述DataFrame()函数在这里用来读取在所述数据帧中的XLSX文件的内容和所述值存储在变量中命名的数据。数据的值已在稍后打印。
python读取excel文件示例如下:
# Import pandas
import pandas as pd
# Load the xlsx file
excel_data = pd.read_excel('sales.xlsx')
# Read the values of the file in the dataframe
data = pd.DataFrame(excel_data, columns=['Sales Date', 'Sales Person', 'Amount'])
# Print the content
print("The content of the file is:\n", data)
输出:
python读取excel文件的方法:执行上述脚本后将出现以下输出。此脚本的输出与前两个示例不同。行号打印在第一列中,其中行值从 0 开始计数。日期值居中对齐。销售人员的姓名对齐。金额左对齐。
结论:
为了不同的编程目的,python 用户需要使用 xlsx 文件。python如何读取excel文件?本教程使用三个 python 模块展示了三种不同的读取 xlsx 文件的方法。每个模块都有不同的函数和属性来读取 xlsx 文件。本教程将帮助python用户在阅读本教程后使用python脚本轻松读取xlsx文件。