用JAVA实现对PDF内容的搜索以及提取相关内容_其他语言_编程问答

用JAVA实现对PDF内容的搜索以及提取相关内容

来源:互联网  时间:2016/5/18 4:27:14

关于网友提出的“用JAVA实现对PDF内容的搜索以及提取相关内容”问题疑问,本网通过在网上对“用JAVA实现对PDF内容的搜索以及提取相关内容”有关的相关答案进行了整理,供用户进行参考,详细问题解答如下:

问题:用JAVA实现对PDF内容的搜索以及提取相关内容
描述:

我想要实现用java对一系列pdf文档进行搜索,同时把包含Keyword的相应上下文内容都显示出来。
目前,我用PDFBOX把内容提取出来进行搜索(只提取了文本用于lucene索引和搜索)
问题是:把搜索出来的Keyword上下文内容做成PDF显示出来(格式就跟原有文档一样,但只有关键字的上下文,可以含有图片等)。怎么实现???pdfbox能实现么?还是要用到其他api?
希望知道的朋友给点建议。相关的代码或者思路都行。如果说要用PDF的格式规范的话,请给我一个很简单的例子。
拜谢!!

上一篇nginx+fastdfs多线程下载
下一篇用iTextSharp读取PDF文档中文本内容
明星图片
相关文章
《用JAVA实现对PDF内容的搜索以及提取相关内容》由码蚁之家搜集整理于网络,
联系邮箱:mxgf168#qq.com(#改为@)