- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Lucene4.3入门

香菜聊游戏发表于 2021/07/15 02:46:50 2021/07/15

5.4k+ 0 0

【摘要】       辞职交接期间无聊看了一下搜索引擎，java社区比较火的当然是Lucene,想写一个简单的小例子，在网上找了些资料，不过都不是4.3的，自己看了一下。下载地址：http://lucene.apache.org/core/ 项目结构 constans.java 是常量类 LuceneIndex.java 建立索引类 ...

辞职交接期间无聊看了一下搜索引擎，java社区比较火的当然是Lucene,想写一个简单的小例子，在网上找了些资料，不过都不是4.3的，自己看了一下。

下载地址：http://lucene.apache.org/core/

项目结构

constans.java 是常量类

LuceneIndex.java 建立索引类

LuceneSearch.java 搜索类

数据文件：


      package com.xin;
      public class Constants {
      public final static String INDEX_FILE_PATH = "e:\\lucene\\test"; //索引的文件的存放路径 
      public final static String INDEX_STORE_PATH = "e:\\lucene\\index"; //索引的存放位置 
      }


      package com.xin;
      import java.io.BufferedReader;
      import java.io.File;
      import java.io.FileInputStream;
      import java.io.InputStreamReader;
      import java.io.Reader;
      import java.util.Date;
      import org.apache.lucene.analysis.Analyzer;
      import org.apache.lucene.analysis.standard.StandardAnalyzer;
      import org.apache.lucene.document.Document;
      import org.apache.lucene.document.Field;
      import org.apache.lucene.document.StringField;
      import org.apache.lucene.document.TextField;
      import org.apache.lucene.index.IndexWriter;
      import org.apache.lucene.index.IndexWriterConfig;
      import org.apache.lucene.index.IndexWriterConfig.OpenMode;
      import org.apache.lucene.store.Directory;
      import org.apache.lucene.store.FSDirectory;
      import org.apache.lucene.util.Version;
      /**
       * @author chongxin
       * @since 2013/6/19
       * @version Lucene 4.3.1
       * */
      public class LuceneIndex {
     	// 索引器
     	private IndexWriter writer = null;
     	public LuceneIndex() {
     		try {
     			//索引文件的保存位置
      			Directory dir = FSDirectory.open(new File(Constants.INDEX_STORE_PATH));
     			//分析器
      			Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_40);
     			//配置类
      			IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_40,analyzer);
      			iwc.setOpenMode(OpenMode.CREATE);//创建模式 OpenMode.CREATE_OR_APPEND 添加模式
      			writer = new IndexWriter(dir, iwc);
      		} catch (Exception e) {
      			e.printStackTrace();
      		}
      	}
     	// 将要建立索引的文件构造成一个Document对象，并添加一个域"content"
     	private Document getDocument(File f) throws Exception {
      		Document doc = new Document();
      		FileInputStream is = new FileInputStream(f);
      		Reader reader = new BufferedReader(new InputStreamReader(is));
     		//字符串 StringField LongField TextField
      		Field pathField = new StringField("path", f.getAbsolutePath(),Field.Store.YES);
      		Field contenField = new TextField("contents", reader);
     		//添加字段
      		doc.add(contenField);
      		doc.add(pathField);
     		return doc;
      	}
     	public void writeToIndex() throws Exception {
      		File folder = new File(Constants.INDEX_FILE_PATH);
     		if (folder.isDirectory()) {
      			String[] files = folder.list();
     			for (int i = 0; i < files.length; i++) {
       File file = new File(folder, files[i]);
       Document doc = getDocument(file);
       System.out.println("正在建立索引 : " + file + "");
       writer.addDocument(doc);
      			}
      		}
      	}
     	public void close() throws Exception {
      		writer.close();
      	}
     	public static void main(String[] args) throws Exception {
     		// 声明一个对象
      		LuceneIndex indexer = new LuceneIndex();
     		// 建立索引
      		Date start = new Date();
      		indexer.writeToIndex();
      		Date end = new Date();
      		System.out.println("建立索引用时" + (end.getTime() - start.getTime()) + "毫秒");
      		indexer.close();
      	}
      }


      正在建立索引 : e:\lucene\test\a.txt
      正在建立索引 : e:\lucene\test\b.txt
      正在建立索引 : e:\lucene\test\c.txt
      正在建立索引 : e:\lucene\test\d.txt
      建立索引用时109毫秒

生成的索引文件：

查找：


      package com.xin;
      import java.io.File;
      import java.util.Date;
      import org.apache.lucene.analysis.Analyzer;
      import org.apache.lucene.analysis.standard.StandardAnalyzer;
      import org.apache.lucene.document.Document;
      import org.apache.lucene.index.DirectoryReader;
      import org.apache.lucene.index.IndexReader;
      import org.apache.lucene.queryparser.classic.QueryParser;
      import org.apache.lucene.search.IndexSearcher;
      import org.apache.lucene.search.Query;
      import org.apache.lucene.search.ScoreDoc;
      import org.apache.lucene.search.TopDocs;
      import org.apache.lucene.store.FSDirectory;
      import org.apache.lucene.util.Version;
      /**
       * @author chongxin
       * @since 2013/6/19
       * @version Lucene 4.3.1
       * */
      public class LuceneSearch {
     	// 声明一个IndexSearcher对象
     	private IndexSearcher searcher = null;
     	// 声明一个Query对象
     	private Query query = null;
     	private String field = "contents";
     	public LuceneSearch() {
     		try {
      			IndexReader reader = DirectoryReader.open(FSDirectory.open(new File(Constants.INDEX_STORE_PATH)));
      			searcher = new IndexSearcher(reader);
      		} catch (Exception e) {
      			e.printStackTrace();
      		}
      	}
      //返回查询结果 
     	public final TopDocs search(String keyword) {
      		System.out.println("正在检索关键字 : " + keyword);
     		try {
      			Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_40);
      			QueryParser parser = new QueryParser(Version.LUCENE_40, field,analyzer);
     			// 将关键字包装成Query对象
      			query = parser.parse(keyword);
      			Date start = new Date();
      			TopDocs results = searcher.search(query, 5 * 2);
      			Date end = new Date();
      			System.out.println("检索完成，用时" + (end.getTime() - start.getTime())
       + "毫秒");
     			return results;
      		} catch (Exception e) {
      			e.printStackTrace();
     			return null;
      		}
      	}
      //打印结果
     	public void printResult(TopDocs results) {
      		ScoreDoc[] h = results.scoreDocs;
     		if (h.length == 0) {
      			System.out.println("对不起，没有找到您要的结果。");
      		} else {
     			for (int i = 0; i < h.length; i++) {
      try {
       Document doc = searcher.doc(h[i].doc);
       System.out.print("这是第" + i + "个检索到的结果，文件名为：");
       System.out.println(doc.get("path"));
       } catch (Exception e) {
       e.printStackTrace();
       }
      			}
      		}
      		System.out.println("--------------------------");
      	}
     	public static void main(String[] args) throws Exception {
      		LuceneSearch test = new LuceneSearch();
      		TopDocs h = null;
      		h = test.search("中国");
      		test.printResult(h);
      		h = test.search("人民");
      		test.printResult(h);
      		h = test.search("共和国");
      		test.printResult(h);
      	}
      }

文章来源: gamwatcher.blog.csdn.net，作者：香菜聊游戏，版权归原作者所有，如需转载，请联系作者。

原文链接：gamwatcher.blog.csdn.net/article/details/9128323

点赞
收藏
关注作者

作者其他文章

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

开发者空间

了解空间

工作台

开发平台

实战案例

空间活动

空间论坛

开发平台

软件开发生产线 CodeArts

AI平台ModelArts

数据治理中心 DataArts Studio

数字内容生产线 MetaStudio

精选服务

云数据库 GaussDB

云数据库 RDS for MySQL

MapReduce服务 MRS

数据仓库服务 DWS

分布式缓存服务Redis版

分布式消息服务 DMS

华为云实时音视频 SparkRTC

媒体处理 MPC

主机迁移服务 SMS

对象存储迁移服务 OMS

云消息服务 KooMessage

云手机服务 KooPhone

企业搜索服务 KooSearch

云地图服务 KooMap

更多开放能力

开发工具

API生态

CodeArts API

API Explorer

Terraform Explorer

KooCLI

API 中心

SDK 中心

开发服务

Codelabs

DevStar

低代码平台Astro

CodeArts IDE

Huawei Cloud Toolkit

Classroom

开发资源

开源镜像站

开源资源

开发语言

开发实践

入门精选

分发资源

企业应用中心

企业通用专区

教育专区

华为应用专区

政务云专区

硬件云服务商城

医疗健康专区

跳蚤市场

华为云开发者日

直播专区

开发者精品活动

DTSE Tech Talk

加入HCDE

加入HCDG

加入HCSD

加入HCWD

鲁班会

沃土云创计划·企业

沃土云创计划·高校

沃土云创计划·个人

沃土云创计划·开源共创

博客

论坛

专题

开发者榜单

学习路径

在线课程

动手实验

考试认证

培训服务