第一个类Searcher,主要负责遍历指定的文件系统并且索引文件中包含.txt文件
package com.biaoqi.ibs.util;
import java.io.File;
import java.io.FileReader;
import java.io.IOException;
import java.io.Reader;
import java.util.Date;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexWriter;
/**
* 遍历文件系统并且索引.txt文件
*
* @author XIEWEI
*
*/
public class Indexer {
public static void main(String[] args) throws Exception {
File indexDir = new File("D:\\luceneIndex");
File dataDir = new File("D:\\luceneData");
long start = new Date().getTime();
int numIndexed = index(indexDir, dataDir);
long end = new Date().getTime();
System.out.println("Indexing " + numIndexed + " files took"
+ (end - start) + " milliseconds");
}
// open an index and start file directory traversal
public static int index(File indexDir, File dataDir) throws IOException {
if (!dataDir.exists() || !dataDir.isDirectory()) {
throw new IOException(dataDir
+ " does not exist or is not a directory");
}
IndexWriter writer = new IndexWriter(indexDir,// ① 创建Lucene索引
new StandardAnalyzer(), true);
writer.setUseCompoundFile(false);
//writer.setMergeFactor(50*10);//提高写入索引的速度
indexDirectory(writer, dataDir);
int numIndexed = writer.docCount();
writer.optimize();
writer.close();
return numIndexed;
}
// recursive method that calls itself when it finds a directory
private static void indexDirectory(IndexWriter writer, File dir)
throws IOException {
File[] files = dir.listFiles();
for (int i = 0; i < files.length; i++) {
File f = files[i];
if (f.isDirectory()) {
indexDirectory(writer, f);// ② 递归
} else if (f.getName().endsWith(".txt")) {
indexFile(writer, f);
}
}
}
// method to actually index file using Lucene
private static void indexFile(IndexWriter writer, File f)
throws IOException {
if (f.isHidden() || !f.exists() || !f.canRead()) {
return;
}
System.out.println("Indexing " + f.getCanonicalPath());
Document doc = new Document();
Reader txtReader = new FileReader(f);
doc.add(new Field("path", f.getCanonicalPath(), Field.Store.YES,
Field.Index.TOKENIZED));
doc.add(new Field("contents", txtReader, Field.TermVector.YES));
writer.addDocument(doc);// ⑤ 添加片段到Lucene索引
}
}
第二个类Searcher负责为查询搜索Lucene索引
package com.biaoqi.ibs.util;
import java.io.File;
import java.util.Date;
import org.apache.lucene.document.Document;
import org.apache.lucene.index.Term;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.TermQuery;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
/**
* 查询搜索Lucene索引
*
* @author XIEWEI
*
*/
public class Searcher {
public static void main(String[] args) throws Exception {
File indexDir = new File("D:\\luceneIndex");
String q = "lucene";
if (!indexDir.exists() || !indexDir.isDirectory()) {
throw new Exception(indexDir
+ "does not exist or is not a directory.");
}
search(indexDir, q);
}
public static void search(File indexDir, String q) throws Exception {
FSDirectory directory = FSDirectory.getDirectory(indexDir);
Directory fsDir = directory;
IndexSearcher is = new IndexSearcher(fsDir); // ① 打开索引
Term term = new Term("contents", q.toLowerCase());
TermQuery luceneQuery = new TermQuery(term);
long start = new Date().getTime();
Hits hits = is.search(luceneQuery);// ③ 搜索索引
long end = new Date().getTime();
System.err.println("Found " + hits.length() + " document(s) (in "
+ (end - start) + " milliseconds) that matched query ‘" + q
+ "’:");
for (int i = 0; i < hits.length(); i++) {
Document doc = hits.doc(i);// ④得到匹配的文档
System.out.println(doc.get("path"));
}
}
}
分享到:
相关推荐
全文检索工具包Lucene,比较新的版本!
lucene全文检索需要的三个jar包:lucene-analyzers-3.6.1.jar lucene-core-3.6.1.jar lucene-highlighter-3.6.1.jar
lucenetest.rar,lucene,全文检索,lucene例子 lucenetest.rar,lucene,全文检索,lucene例子lucenetest.rar,lucene,全文检索,lucene例子
lucene全文搜索ajax例子,集成高亮显示。多次搜索等功能了,解压就可以运行了
Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文...
一个基于LUCENE搜索引擎项目例子一个基于LUCENE搜索引擎项目例子一个基于LUCENE搜索引擎项目例子
视频详细讲解,需要的小伙伴自行网盘下载,链接见附件,永久有效。 目前业界流行的ElasticSearch和Solr搜索...系统的学习Lucene全文检索技术,全面掌握搜索原理和底层知识,为学习其他应用层面搜索技术打下坚实的基础。
Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放...Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
lucene全文检索工具包 包含lucenne 包含IKAnalyzer 包含commons-io
lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习...
Lucene全文检索案例Lucene全文检索案例Lucene全文检索案例Lucene全文检索案例
IKAnalyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包,将一段文字进行IK分词处理一般经过:词典加载、预处理、分词器分词、歧义处理、善后结尾 五个部分
lucene3.6 搜索例子
B/S架构下采用LUCENE开发的一个搜索引擎的小例子
Lucene实现全文搜索,支持英文、模糊和智能查询
全文检索:将非结构化数据中的⼀部分信息提取出来,重新组织,使其变得具有⼀定结构,然后对此有⼀定结构的数据进行搜索,从而达到搜索相对较快的⽬的。这部分从非结构化数据中提取出的然后重新组织的信息,我们称之...
Lucene操作数据库例子,通过JDBC程序+Lucene
lucene quartz 例子lucene quartz 例子lucene quartz 例子lucene quartz 例子lucene quartz 例子lucene quartz 例子lucene quartz 例子lucene quartz 例子lucene quartz 例子lucene quartz 例子
NULL 博文链接:https://1151461406.iteye.com/blog/2388343
Lucene 7.1 RMI远程搜索例子 Lucene 7.1 RMI远程搜索例子 Lucene 7.1 RMI远程搜索例子