Csharp/C#教程:我如何使用Lucene.Net索引PDF文件?分享


我如何使用Lucene.Net索引PDF文件?

我正在寻找一些示例代码,演示如何使用Lucene.Net和C#索引PDF文档。 谷歌出现了几个,但没有一个,我觉得有帮助。

根据我的理解,Lucene仅限于创建索引并搜索该索引。 由应用程序来处理打开文件并提取索引的内容。 因此,如果您要搜索PDF文档,您将需要使用类似iTextSharp的内容来打开文件,请提取内容,然后将其传递给Lucene进行索引。 在Dimecasts.net网站上有一些很好的使用Lucene的例子 。

StringBuilder stringBuilder = new StringBuilder(); PdfReader pdfReader = new PdfReader(byte[] of the .pdf); for (int page = 1; page <= pdfReader.NumberOfPages; page++) { stringBuilder.Append(PdfTextExtractor.GetTextFromPage(pdfReader, page) + " "); } 

(使用iTextSharp)

其余部分并未简洁明了。

我网站上的产品演示中有代码显示了如何使用lucene.net代码,但这里发布的时间有点长。

以下是与我的产品相关的代码: https : //svn.arachnode.net/svn/arachnodenet/trunk/Plugins/CrawlActions/ManageLuceneDotNetIndexes.cs用户名/密码:公开

上述就是C#学习教程:我如何使用Lucene.Net索引PDF文件?分享的全部内容,如果对大家有所用处且需要了解更多关于C#学习教程,希望大家多多关注---计算机技术网(www.ctvol.com)!

本文来自网络收集,不代表计算机技术网立场,如涉及侵权请联系管理员删除。

ctvol管理联系方式QQ:251552304

本文章地址:https://www.ctvol.com/cdevelopment/1007760.html

(0)
上一篇 2021年12月29日
下一篇 2021年12月29日

精彩推荐