我尝试使用WordTo
HtmlConverter将.doc转换为HTML,它运行得很好.
但是当我试图将.docx转换为HTML时,我就陷入了困境.
我尝试了什么:
我使用下面的代码将.docx转换为HTML:
InputStream input = (new File("C:\Users\Downloads\filename.docx"));
Parser parser = new AutoDetectParser();
StringWriter sw = new StringWriter();
SAXTransformerFactory factory = (SAXTransformerFactory)
TransformerHandler handler = wTransformerHandler();
handler.setResult(new StreamResult(sw));
try {
Metadata metadata = new Metadata();
parser.parse(input, handler, metadata, new ParseContext());
String xml = sw.toString();
System.out.print("tika : "+xml);
} finally {
input.close();
}
我得到的输出是,
本文发布于:2024-02-01 14:20:09,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170676840937208.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |