Category:垂直搜索’

Lucene3.0的主要变化

 - by Hector

一、概述   Lucene3.0(以下简称3.0)已于2009-11-25发布,3.0版本是重大的版本,改动很大。在API上做了很多的调整,已经删除了很多之前废弃的方法以及类,并支持了很多Java5 的新特性:包括泛型、可变参数、枚举和autoboxing等。   因此,此版本和2.x版本不能兼容,如要使用3.0版本,最好是在新项目中去使用,而不是去升级2.

Heritrix-1.14.3的MyEclipse开发环境配置

 - by Hector

 Heritrix一、基本配置原则:1、需要引入Heritrix的系列jar包。2、需要引入相应的执行源文件。3、需要配置Heritrix的执行参数。二、配置方法1.新建一个工程后,将工程目录下的src包删掉。将源代码包(即heritrix-1.14.3-src.zip,可到官网去下载)中的src和lib文件夹复制到工程目录中,则此时工程目录下有bin、src、lib三个文件夹还有.classpath和

Lucene3.0学习笔记3(给数据库建立索引)

 - by Hector

 给数据库字段建立索引的方法和给文件建立索引的方法类似。(可见这篇文章:) [Lucene3.0学习笔记1(建立索引)]只是需要将待索引的源换为从数据库里面读取的字段值就可以了。代码中用到的数据库操作类在这里:[java通用数据库操作类]请对照 [Lucene3.0学习笔记1(建立索引)]加以理解。代码如下:

Lucene3.0学习笔记2(查询索引)

 - by Hector

Lucene3d:\lucene\index是上一篇学习笔记([Lucene3.0学习笔记1(建立索引)] )中生成的索引文件的存放地址。具体步骤简介如下:
1、创建Directory对象,索引文件夹
2、创建IndexSearch对象,建立查询(参数是Directory对象)
3、创建QueryParser对象(lucene版本,查询Field

Lucene3.0包详细介绍

 - by Hector

lucene1、analysisAnalysis包含一些内建的分析器,例如按空白字符分词的WhitespaceAnalyzer,添加了stopwrod过滤的StopAnalyzer,最常用的是StandardAnalyzer。2、documentDocument包含文档的数据结构,例如Document类定义了存储文档的数据结构,Field类定义了Document的一个域。3、indexIndex包含了索引的读