Python处理Excel

Python处理Excel经常会用到第三方库有xlrd、xlwt、openpyxl;下面介绍这三个第三方库常用的方法。

xlrd/xlwt与openpyxl的区别和效率

区别 :python中xlrd/xlwt与openpyxl处理Excel的主要区别在于写入操作,其中 xlwt 针对Ecxec2007之前的版本,(.xls文件),其要求单个sheet不超过65535行,而 openpyxl 则主要针对Excel2007之后的版本(.xlsx文件),它对文件大小没有限制。

效率 :整体而言,两种包对小文件的读写速度差别不大,而面对较大文件, xlrd/xlwt 速度明显优于 openpyxl ,但因为 xlwt 无法生成xlsx是个硬伤,所以想要尽量提高效率又不影响结果时,可以考虑用 xlrd 读取,用 openpyxl 写入。

xlrd模块

# 导入模块
import xlrd
# 打开Excel文件
workbook = xlrd.open_workbook("filename")  
# sheet相关操作
workbook.sheet_names()                     获取所有sheet的名字,返回列表
workbook.sheet_by_index()                  根据索引获取sheet对象
workbook.sheets()                          获取所以sheet对象,返回列表
sheet = workbook.sheet_by_name()           根据名字获取sheet对象
sheet.name                                 获取sheet对象的名字
sheet.nrows                                获取sheet对象的行数
sheet.ncols                                获取sheet对象的列数
# cell相关操作
sheet.cell(row,col)                        获取指定行和列的cell对象
sheet.row_slice(row,start_col,end_col)     获取指定行的某几列的cell对象
sheet.col_slice(col,start_row,end_row)     获取指定列的某几行的cell对象
sheet.cell_value(row, col)                 获取指定行和列的值
sheet.row_values(row,start_col,end_col)    获取指定行的某几列的值
sheet.col_values(col,start_row,end_row)    获取指定列的某几行的值
sheet.put_cell(row,col,ctype,value,xf_index)
										   在原有表的基础上增减新的内容,xf_index参数是去控制样式,写None即可
cell.ctype                                 cell的数据类型
# cell的数据类型
xlrd.XL_CELL_TEXT                          文本类型
xlrd.XL_CELL_NUMBER                        数值类型
xlrd.XL_CELL_DATE                          日期时间类型
xlrd.XL_CELL_BOOLEAN                       布尔类型
xlrd.XL_CELL_EMPTY                         空白数据类型

xlwt模块

# 导入模块
import xlwt
# 创建workbook对象
workbook = xlwt.Workbook()
#创建一个sheet
sheet = workbook.add_sheet("sheetname")
#写入单元格中,参数1:某行,参数2:某列,参数3:写入的值
sheet.write(row, col, value)
#保存表格
workbook.save('new_filename.xlsx')

openpyxl模块

# 导入模块
from openpyxl import load_workbook
# 打开Excel文件
workbook = load_workbook('filename.xlsx')
# 找到相应的表单
sheet = workbook['sheetname']
# 修改单元格的数据
sheet.cell(row,col).value = new_value
# 总行数
sheet.max_row
# 总列数
sheet.max_colum
# 该表单的所有行的数据的可迭代对象
sheet.rows
# 保存数据
workbook.save('filepath')
# 关闭文件,释放资源
workbook.close
filename = "test.xlsx"
# Workbook代表整个电子表格文件,并且存储在磁盘上。filename为字符串类型,表示创建的excel文件存储路径;
wb = xlsxwriter.Workbook(filename)
创建一个sheet表:add_worksheet
add_worksheet([sheetname])方法,用于添加一个新的工作表,sheetna
      首先在线搜索并下载你需要的第三方库:网址https://pypi.org/project/
  安装whl包: pip install  **.whl(前提是要安装好pip和wheel)
  安装tar.gz包:cd到解压后路径,python setup.py install(安装pip和wheel都可以参照这种方法)
 命令窗口cd到指定目录的小技巧:
  (2)在线安装
       pip install [packages]        packages:代表你想要安装的第三方库
       示例:pip install 
				
xlrd、xlwtopenpyxl模块的比较: 1)xlrd:对xls、xlsx、xlsm文件进行读操作–读操作效率较高,推荐 2)xlwt:对xls文件进行写操作–写操作效率较高,但是不能执行xlsx文件 3)openpyxl:对xlsx、xlsm文件进行读、写操作–xlsx写操作推荐使用 一、xlrd:对xls、xlsx文件进行读操作 1.获取工作簿对象:xlrd.open_workbook...
Python 是一门优雅的语言,简洁的语法,强大的功能。当然丰富的第三方库,更能加速开发。那么问题来了,如何安装这些第三方库(包)呢? 安装第三方库的方式其实不多。下面就介绍一些技巧。 很多第三方库都是开源的,几乎都可以在github 或者 pypi上找到源码。找到源码格式大概都是 zip 、 tar.zip、 tar.bz2格式的压缩包。解压这些包,进入解压好的文件夹,通常会看见一个 setup.py 的文件。打开命令行,进入该文件夹。运行 python setup.py install 这个命令,就能把这个第三库安装到系统里,也就是你的 Python 路径,windows大概
Python中有很多第三方库可以用于编辑xlsx文件,其中比较常用的有openpyxl、xlrd、xlwt、pandas等。 openpyxl是一个功能强大的库,可以读取、写入和修改xlsx文件。它支持多种类型的数据,如字符串、数字、日期等,并且可以设置单元格样式、合并单元格等。使用openpyxl,我们可以轻松地创建、修改和保存xlsx文件。 xlrd和xlwt是两个常用的库,用于读取和写入xls格式的Excel文件。使用xlrd,我们可以读取xls文件中的数据,并对其进行处理。使用xlwt,我们可以创建并写入xls文件,并设置单元格的格式、样式等。 pandas是一个数据处理库,它也支持读写Excel文件。通过pandas,我们可以将Excel文件读取为数据帧(DataFrame),并对数据进行处理、转换、过滤等操作。同时,pandas也提供了将数据帧写入Excel文件的功能。 通过这些第三方库,我们可以方便地编辑xlsx文件。无论是读取、写入还是修改Excel文件,都可以根据具体需求选择合适的库进行操作。这些库都有详细的文档和丰富的功能,可以满足各种编辑xlsx文件的需要。