博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
poi读取word2003(.doc文档)中的表格
阅读量:6342 次
发布时间:2019-06-22

本文共 2067 字,大约阅读时间需要 6 分钟。

poi读取word2003(.doc文档)中的表格

Jakarta POI 是apache的子项目,目标是处理ole2对象。它提供了一组操纵Windows文档的Java API。在网上见到好多通过poi读取excel的文章,读写也很方便,和jxl有的一比。在这里,主要是poi对word中的表格数据读取。

具体见代码

1 import java.io.File;   2 import java.io.FileInputStream;   3 import java.io.FileNotFoundException;   4    5 import org.apache.poi.hwpf.HWPFDocument;   6 import org.apache.poi.hwpf.usermodel.Paragraph;   7 import org.apache.poi.hwpf.usermodel.Range;   8 import org.apache.poi.hwpf.usermodel.Table;   9 import org.apache.poi.hwpf.usermodel.TableCell;  10 import org.apache.poi.hwpf.usermodel.TableIterator;  11 import org.apache.poi.hwpf.usermodel.TableRow;  12   13 import java.io.File;     14 import java.io.FileInputStream;     15 import java.io.InputStream;     16     17 import org.apache.poi.POIXMLDocument;     18 import org.apache.poi.POIXMLTextExtractor;     19 import org.apache.poi.hwpf.extractor.WordExtractor;     20 import org.apache.poi.openxml4j.opc.OPCPackage;     21 import org.apache.poi.xwpf.extractor.XWPFWordExtractor;    22   23   24 import org.apache.poi.poifs.filesystem.POIFSFileSystem;  25   26 public class ExportDocImpl  27 {  28     public void testWord(){  29         try{  30             FileInputStream in = new FileInputStream("D:\\sinye.doc");//载入文档  31            POIFSFileSystem pfs = new POIFSFileSystem(in);     32             HWPFDocument hwpf = new HWPFDocument(pfs);     33             Range range = hwpf.getRange();//得到文档的读取范围  34             TableIterator it = new TableIterator(range);  35            //迭代文档中的表格  36             while (it.hasNext()) {     37                 Table tb = (Table) it.next();     38                 //迭代行,默认从0开始  39                 for (int i = 0; i < tb.numRows(); i++) {     40                     TableRow tr = tb.getRow(i);     41                     //迭代列,默认从0开始  42                     for (int j = 0; j < tr.numCells(); j++) {     43                         TableCell td = tr.getCell(j);//取得单元格  44                         //取得单元格的内容  45                         for(int k=0;k

 

转载于:https://www.cnblogs.com/Renyi-Fan/p/8157111.html

你可能感兴趣的文章
《网页美工设计Photoshop+Flash+Dreamweaver从入门到精通》——2.6 图层与图层样式...
查看>>
今天的学习
查看>>
面试必问之JVM原理
查看>>
mysql主主同步+Keepalived
查看>>
研究音频编解码要看什么书
查看>>
tomcat远程调试配置
查看>>
QuartZ Cron表达式
查看>>
性能测试工具VTune的功能和用法介绍
查看>>
音频视频组件Audio DJ Studio for .NET更新至v10.0.0.0丨附下载
查看>>
RMAN Complete Recovery
查看>>
[ CodeForces 1064 B ] Equations of Mathematical Magic
查看>>
NYOJ-15:括号匹配(二)
查看>>
首次记录在案的
查看>>
C#进阶系列——WebApi 跨域问题解决方案:CORS
查看>>
错误:“产品订单的调度参数没有被定义”
查看>>
机器视觉在带钢针孔检测中的应用
查看>>
ASP.NET WEB API 调试
查看>>
使用wget命令进行整站下载
查看>>
解读volatile
查看>>
zookeeper安装部署
查看>>