当前位置:首页 > 文章列表 > 文章 > php教程 > PHP读写Excel教程:轻松操作数据

PHP读写Excel教程:轻松操作数据

2025-09-03 14:12:49 0浏览 收藏

文章不知道大家是否熟悉?今天我将给大家介绍《PHP操作Excel文件:读取与写入数据教程》,这篇文章主要会讲到等等知识点,如果你在看完本篇文章后,有更好的建议或者发现哪里有问题,希望大家都能积极评论指出,谢谢!希望我们能一起加油进步!

使用PhpSpreadsheet库可高效实现PHP对Excel的读写操作,支持XLS、XLSX、CSV等格式,通过IOFactory加载文件并遍历单元格读取数据,利用Spreadsheet对象和fromArray批量写入数据,同时可通过分块读取、只读模式、异步处理等方式优化内存与性能,避免超时和格式问题。

php如何操作excel文件_php读取和写入excel数据

PHP操作Excel文件,通常我们会借助强大的第三方库来实现数据的读取和写入。这并非PHP内置功能,而是通过社区贡献的工具来扩展其能力,尤其以PhpSpreadsheet库最为流行和高效。它能让你轻松处理各种Excel格式,无论是老旧的XLS还是现代的XLSX,甚至CSV文件也不在话下。

解决方案

要实现PHP对Excel文件的读写,最直接且推荐的方案就是使用PhpSpreadsheet库。它提供了一套全面的API,让你能够像操作数组一样操作Excel工作簿和单元格。

安装PhpSpreadsheet:

首先,你需要通过Composer来安装它。在你的项目根目录运行:

composer require phpoffice/phpspreadsheet

读取Excel数据:

读取数据通常涉及创建一个Reader对象,加载文件,然后遍历工作表和单元格。

<?php
require 'vendor/autoload.php';

use PhpOffice\PhpSpreadsheet\IOFactory;

try {
    $spreadsheet = IOFactory::load('path/to/your/excel_file.xlsx'); // 替换为你的文件路径
    $worksheet = $spreadsheet->getActiveSheet();
    $data = [];

    foreach ($worksheet->getRowIterator() as $row) {
        $rowData = [];
        $cellIterator = $row->getCellIterator();
        $cellIterator->setIterateOnlyExistingCells(false); // 遍历所有单元格,包括空的

        foreach ($cellIterator as $cell) {
            $rowData[] = $cell->getValue();
        }
        $data[] = $rowData;
    }

    // 现在 $data 数组包含了Excel文件的所有内容
    // print_r($data);

} catch (\PhpOffice\PhpSpreadsheet\Reader\Exception $e) {
    die('加载文件时出错: ' . $e->getMessage());
} catch (\Exception $e) {
    die('发生未知错误: ' . $e->getMessage());
}
?>

写入Excel数据:

写入数据则需要创建一个新的Spreadsheet对象,添加工作表,填充数据,然后通过Writer对象保存。

<?php
require 'vendor/autoload.php';

use PhpOffice\PhpSpreadsheet\Spreadsheet;
use PhpOffice\PhpSpreadsheet\Writer\Xlsx;

$spreadsheet = new Spreadsheet();
$sheet = $spreadsheet->getActiveSheet();

// 设置标题
$sheet->setCellValue('A1', '姓名');
$sheet->setCellValue('B1', '年龄');
$sheet->setCellValue('C1', '城市');

// 写入数据
$data = [
    ['张三', 30, '北京'],
    ['李四', 25, '上海'],
    ['王五', 35, '广州'],
];

$rowCounter = 2; // 从第二行开始写入数据
foreach ($data as $rowData) {
    $sheet->setCellValue('A' . $rowCounter, $rowData[0]);
    $sheet->setCellValue('B' . $rowCounter, $rowData[1]);
    $sheet->setCellValue('C' . $rowCounter, $rowData[2]);
    $rowCounter++;
}

// 保存文件
$writer = new Xlsx($spreadsheet); // 也可以是 Csv, Xls 等
$filename = 'output_data.xlsx';
$writer->save($filename);

// 强制下载(可选)
/*
header('Content-Type: application/vnd.openxmlformats-officedocument.spreadsheetml.sheet');
header('Content-Disposition: attachment;filename="' . $filename . '"');
header('Cache-Control: max-age=0');
$writer->save('php://output');
exit;
*/

echo "Excel文件 '{$filename}' 已成功生成。";
?>

PHP读取Excel文件有哪些常用方法?

依我看,PHP读取Excel文件最主流、最稳妥的方法就是使用PhpSpreadsheet。它支持多种文件格式的读取,包括.xlsx (Office Open XML)、.xls (BIFF8/BIFF5)、.csv以及一些其他的如.ods等。

具体来说,当你需要读取文件时,PhpSpreadsheet会根据文件扩展名自动选择合适的Reader。比如,IOFactory::load('file.xlsx') 会自动使用Xlsx Reader,而IOFactory::load('file.xls')则会使用Xls Reader。这省去了我们手动判断和选择Reader的麻烦,非常方便。

不过,话说回来,在实际操作中,我们经常会遇到一些挑战。比如,读取大型Excel文件时,可能会因为内存消耗过大而导致PHP脚本崩溃。这时候,我们可以考虑使用setReadDataOnly(true)方法,它会告诉PhpSpreadsheet只读取单元格的值,忽略格式信息,从而显著减少内存占用。另外,对于超大型文件,或者说那些动辄几十万上百万行的数据,分块读取(chunk reading)也是一个非常实用的策略,虽然实现起来会稍微复杂一点,但能有效避免内存溢出。

有时候,Excel文件可能包含合并单元格,或者日期格式不统一。读取时,你需要注意这些细节,PhpSpreadsheet在处理日期时,通常会将其转换为Unix时间戳或Excel内部的数字格式,你需要自行转换回可读的日期格式。至于合并单元格,读取时通常只会返回合并区域左上角单元格的值,其他合并单元格则为空,这在使用时需要特别留意数据的完整性。

如何使用PHP高效写入Excel数据?

高效写入Excel数据,核心在于减少不必要的资源消耗和优化数据处理流程。同样,PhpSpreadsheet是我们的主力工具。

首先,避免反复操作同一个单元格。批量设置单元格值,或者一次性设置一个区域的值,效率会高很多。例如,你可以通过循环填充数据,但如果数据量巨大,考虑使用fromArray()方法,它能将一个二维数组直接写入到工作表的一个区域中,这比逐个setCellValue()要快得多。

// 示例:使用fromArray()高效写入
$data = [
    ['Header A', 'Header B', 'Header C'],
    [1, 2, 3],
    [4, 5, 6],
];
$sheet->fromArray(
    $data,           // 写入的数据
    NULL,            // 空值处理
    'A1'             // 起始单元格
);

其次,对于样式设置,如果你需要对大量单元格应用相同的样式,尽量避免在每个单元格上单独设置。而是应该先定义好样式数组,然后一次性应用到某个区域,或者利用PhpSpreadsheet的样式缓存机制。过度复杂的样式,尤其是条件格式和数据验证,也会增加文件生成的时间和大小。

再者,选择合适的Writer也很重要。通常我们生成.xlsx格式,因为它支持更多的特性和更大的行数。但如果你只是需要一个纯粹的数据文件,并且对文件大小有严格要求,或者目标系统对.csv有偏好,那么生成CSV文件会更快,文件也更小。当然,CSV文件本身不包含任何格式信息。

最后,当生成的文件非常大时,直接通过$writer->save('php://output')将文件流式传输给浏览器,而不是先保存到服务器磁盘再读取,可以减少一次磁盘I/O操作,对于用户体验来说,下载也会更快。不过,这要求你的脚本在文件生成过程中不能有任何其他输出,否则会导致文件损坏。

PHP操作Excel时常见的挑战与优化策略是什么?

在PHP操作Excel的过程中,我个人遇到过不少“坑”,其中最让人头疼的莫过于内存溢出执行超时

1. 内存溢出 (Memory Exhaustion): 这是处理大型Excel文件时最常见的噩梦。一个包含数十万行、几十列数据的Excel文件,加载到内存中可能会消耗数百兆甚至上G的内存,轻松突破PHP的memory_limit

  • 优化策略:
    • 分块读取 (Chunk Reading): 对于读取,PhpSpreadsheet提供了IReadFilter接口。你可以实现这个接口,定义一个过滤器,每次只读取文件中的一部分行,处理完后再读取下一部分。这就像“细水长流”,大大降低了内存峰值。
    • 只读数据 (Read Data Only): IOFactory::load()之前,设置$reader->setReadDataOnly(true);。这会告诉PhpSpreadsheet只关心单元格的值,忽略所有格式信息,显著减少内存占用。
    • 生成CSV替代: 如果你只是需要导出数据,并且不需要复杂的格式,直接生成CSV文件会比生成Excel文件快得多,内存占用也小得多。毕竟CSV只是纯文本。

2. 执行超时 (Execution Timeout): 生成或处理一个非常大的Excel文件,可能需要几分钟甚至更长时间,这很容易触及PHP的max_execution_time限制。

  • 优化策略:
    • 调整PHP配置: 临时提高脚本的max_execution_timememory_limit。这通常通过set_time_limit(0);(设置为不限制)和ini_set('memory_limit', '512M');(根据需要调整)来实现。但请注意,这只是治标不治本,对于生产环境,应该寻求更健壮的解决方案。
    • 异步处理/队列: 对于耗时操作,最佳实践是将其放入消息队列(如RabbitMQ, Redis Queue)中异步处理。用户提交请求后,立即返回一个“正在处理”的提示,后台脚本再慢慢生成文件。文件生成完毕后,再通知用户下载或通过邮件发送。
    • 优化数据源查询: 在将数据写入Excel之前,确保从数据库或其他数据源获取数据的查询是高效的。慢查询会直接影响到Excel生成的速度。

3. 数据格式不一致/兼容性问题: 不同的Excel版本、不同的操作系统,甚至用户输入习惯,都可能导致数据格式的混乱。

  • 优化策略:
    • 严格数据校验: 在读取数据时,对关键字段进行严格的类型转换和校验,确保数据符合预期。例如,日期字段统一解析为标准格式。
    • 明确输出格式: 在写入时,明确设置单元格的数据类型(例如,文本、数字、日期),避免Excel自动判断出错。setCellValueExplicit()方法可以帮助你强制指定数据类型。

总的来说,处理Excel文件,尤其是大数据量时,需要我们有足够的耐心和细致的规划。很多时候,技术上的优化固然重要,但更重要的是理解业务需求,选择最适合的工具和策略,而不是一味地追求“万能”方案。

终于介绍完啦!小伙伴们,这篇关于《PHP读写Excel教程:轻松操作数据》的介绍应该让你收获多多了吧!欢迎大家收藏或分享给更多需要学习的朋友吧~golang学习网公众号也会发布文章相关知识,快来关注吧!

PHP在线执行安全指南:代码编写实用技巧PHP在线执行安全指南:代码编写实用技巧
上一篇
PHP在线执行安全指南:代码编写实用技巧
Photoshop图层批量重命名技巧分享
下一篇
Photoshop图层批量重命名技巧分享
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    512次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    499次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    795次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    755次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    786次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    802次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    780次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码