以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 WORD to XML, HTML to XML 』  (http://bbs.xml.org.cn/list.asp?boardid=13)
----  使用Java将Word转为Html或txt!  (http://bbs.xml.org.cn/dispbbs.asp?boardid=13&rootid=&id=14741)


--  作者:admin
--  发布时间:2/24/2005 12:02:00 AM

--  使用Java将Word转为Html或txt!
http://www.webjx.com/program/2004121115.htm


--------------------------------------------------------------------------------

http://www.csdn.net 2004年12月11日 CSDN

  使用Java将Word转为Html或txt。前一段时间为这个问题头疼的不得了,后来查阅了资料终于解决了;现将程序放出,以便以后参考。


  //-------------------------------------------------------
  //版权所有 (C) 浪潮集团商用系统有限公司  保留所有权利
  //文件名称: wordtohtml           文件版本: 1.00.00
  //作    者: 郭铸     作者邮箱: guozhu@langchao.com  完成日期: 2004-10-20
  //文件描述:
  //其它描述:
  //类 列 表:
  //  wordtohtml: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
  //修改历史:
  //  #   版本     修改日期    作者                 修改内容
  //  -------------------------------------------
  //  1   1.00.01  2004-10-14  作者姓名             修改内容描述
  //  ----------------------------------------------------------
  //-------------------------------------------------------
  import com.jacob.com.*;
  import com.jacob.activeX.*;
  import java.io.*;
  //取得指定目录下面所有的doc文件名称
  public class wordtohtml
  {
  //-------------------------------------------------
  //方法原型: change(String paths)
  //功能描述: 将指定目录下面所有的doc文件转化为HTML并存储在相同目录下
  //输入参数: String
  //输出参数: 无
  //返 回 值: 无
  //其它说明: 递归
  //--------------------------------------------
  public static void change(String paths, String savepaths)
  {
  
  File d = new File(paths);
  //取得当前文件夹下所有文件和目录的列表
  File lists[] = d.listFiles();
  String pathss = new String("");

  //对当前目录下面所有文件进行检索
  for(int i = 0; i < lists.length; i ++)
  {
  if(lists[i].isFile())
  {
  String filename = lists[i].getName();
  String filetype = new String("");
  //取得文件类型
  filetype = filename.substring((filename.length() - 3), filename.length());
  
  //判断是否为doc文件
  if(filetype.equals("doc"))
  {
  System.out.println("当前正在转换......");
  //打印当前目录路径
  System.out.println(paths);
  //打印doc文件名
  System.out.println(filename.substring(0, (filename.length() - 4)));
  
  ActiveXComponent app = new ActiveXComponent("Word.Application");//启动word
  
  String docpath = paths + filename;
  String htmlpath = savepaths + filename.substring(0, (filename.length() - 4));
  
  String inFile = docpath;
  //要转换的word文件
  String tpFile = htmlpath;
  //HTML文件

  boolean flag = false;
  
  try
  {
  app.setProperty("Visible", new Variant(false));
  //设置word不可见


  Object docs = app.getProperty("Documents").toDispatch();
  Object doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{inFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();
  //打开word文件
  Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
  //作为html格式保存到临时文件
  Variant f = new Variant(false);
  Dispatch.call(doc, "Close", f);
  flag = true;
  }
  catch (Exception e)
  {
  e.printStackTrace();
  }
  finally
  {
  app.invoke("Quit", new Variant[] {});
  }
  System.out.println("转化完毕!");
  }
  }
  else
  {
  pathss = paths;
  //进入下一级目录
  pathss = pathss + lists[i].getName() + "\\";    
  //递归遍历所有目录
  change(pathss, savepaths);
  }
  }
  
  }
  //---------------------------------------------------------
  //方法原型: main(String[] args)
  //功能描述: main文件
  //输入参数: 无
  //输出参数: 无
  //返 回 值: 无
  //其它说明: 无
  //----------------------------------------------------------  
  public static void main(String[] args)
  {
  
  String paths = new String("D:\\Work\\2004.10.8\\test system\\test01\\word\\");
  String savepaths = new String ("D:\\Work\\2004.10.8\\test system\\test01\\html\\");
  change(paths, savepaths);

  }
  }


  其中import的jar包是一个开源的东东,网上搜索即得。
  Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{ tpFile,new Variant(8)}, new int[1]);
  修改Variant(8)},里面得参数即可将Word转化为各种类型。


--  作者:kofuya
--  发布时间:3/20/2005 12:22:00 PM

--  
有参考价值
//取得文件类型 这种方法不好
filetype = filename.substring(lastIndexOf('.')+1,filename.length());

--  作者:jimmyvk
--  发布时间:4/4/2005 5:59:00 PM

--  
jacob的包操作word一直没有能成功过,我在使用这句:
Object docs = app.getProperty("Documents").toDispatch();
一直报下面的错误,请问是应该整样解决呀,高手们请指导,谢谢!
com.jacob.com.ComFailException: A COM exception has been encountered:
At Invoke of: Documents
Description: An unknown COM error has occured.
 at com.jacob.com.Dispatch.invokev(Native Method)
 at com.jacob.activeX.ActiveXComponent.getProperty(ActiveXComponent.java)
 at jimmy.java.win32Class.CreateWordDocJacob.open(CreateWordDocJacob.java:31)
 at jimmy.java.win32Class.CreateWordDocJacob.main(CreateWordDocJacob.java:46)
--  作者:wadjsn
--  发布时间:4/5/2005 9:29:00 AM

--  不会啊
我日~!老子也不会啊~!怎么办啊 !~
--  作者:大志若鱼
--  发布时间:4/21/2005 5:58:00 PM

--  
楼主

这个问题不懂的人还很多(包括我,嘿嘿)

能不能先从Jacob的配置开始说(根据网上的资料,我怎么配置都配不好)

Jacob是不是跟操作系统以及JDK的版本和Office的版本都有关系?


--  作者:小兽
--  发布时间:4/25/2005 12:32:00 PM

--  
关于如何配置,请参考我的另一篇东西``
http://blog.csdn.net/guoxiaoshou2000/archive/2005/04/23/359829.aspx
希望大家指教~
--  作者:realiory
--  发布时间:5/11/2005 3:20:00 PM

--  
hao

--  作者:菜籽
--  发布时间:5/21/2005 3:55:00 PM

--  
hao
--  作者:micky
--  发布时间:9/28/2005 3:43:00 PM

--  
直接使用Word2003提供的文档转换功能就可以了。可以批量地转换。

http://www.cfan.com.cn/pages/20050510/1590.htm

将需要转换的文件放入同一个文件夹中,然后打开Word 2003,选择执行“文件→新建”菜单命令,点选“本机上的模板”链接,在“其他文档”选项卡中选择“转换向导”图标,单击“确定”按钮,出现“转换向导”窗口,按照向导提示就可以进行文件转换了。选择“下一步”按钮,可以看到将其他文件格式转换为Word文档格式,也可以将Word文档转为其他文件格式选项,你可以根据情况选择。如我们选择“将其他文件格式转换为Word文档格式”,单击“下一步”,通过“源文件夹”的“浏览”按钮,选定存放源文件的文件夹,再通过“目标文件夹”的“浏览”按钮,确定转换后的文件存放目的地。单击“下一步”,出现窗口,在“文件类型”中选“*.*”,单击“全选”按钮选中源文件夹中所有要转换的文件,再单击“下一步”,单击“完成”按钮,出现“文件转换过程”对话框,对话框中会显示转换进度。文件转换完成后,转换向导结束,此时会询问是否还要转换其他文件,选择“否”结束即可完成文件转换过程。


--  作者:iafs
--  发布时间:10/25/2005 7:16:00 PM

--  
看了还是蒙,谁知道xml和数据库打交道的一些问题,我想知道,可是不知道从哪里下手,大家帮帮忙,指点一下,小女子有礼了!!
--  作者:xifeng_2002
--  发布时间:11/24/2005 8:20:00 PM

--  
高手啊,受益匪浅!
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
78.125ms