一、基本配置原则:
二、配置方法
- 1.新建一个工程后,将工程目录下的src包删掉。将源代码包(即heritrix-1.14.3-src.zip,可到官网去下载)中的src和lib文件夹复制到工程目录中,则此时工程目录下有bin、src、lib三个文件夹还有.classpath和.project两种工程配置文件(工程建立时生成的)。
- 2.将 项目名称/src/conf 文件夹中modules、profiles、selftest三个文件夹以及heritrix.properties、jndi.properties剪切到上一层文件夹,即 项目名称/src 中,将原来的conf文件夹删除掉。
- 3.将 项目名称/src/java 文件夹中的com、org、st、meta-INF四个文件夹剪切到上一层文件夹中,即 项目名称/src 中,将原来的java文件夹删除掉。
- 4.通过Build Path将 项目名称/lib 中的jar包引用到工程项目中。
- 5.找到heritrix.properties,然后在heritrix.cmdline.admin = admin:admin中随便设置个密码,设置方式是 用户名:密码;将heritrix.version改成1.14.3
- 6.在MyEclipse中,刷新你的工程,在src\org.archive.crawler中找到Heritrix.java类,点右键找到启动配置(Run As–>Open Run Dialog),在VM arguments添加-Dheritrix.development,在Program arguments添加–admin=admin:admin,然后选择Heritrix类启动程序。
- 7.运行Heritrix类,如果没有错误提示,在浏览器中输入http://127.0.0.1:8080,出现用户名登陆界面则表示成功了。
三、相关说明
- 1.如果你用的MyEclipse版本不同,可能Eclipse自带的JDK版本太低或者太高,在浏览器输入地址后会出现HTTP ERROR: 500 Bad+version+number+in+%2Eclass+file的提示。此时需要修改MyEclipse的jdk版本。
- 2、如果有 Failed to start: SocketListener@127.0.0.1:8080这样的提示说明你的端口8080被占用,你可以到heritrix.properties中修改端口。
- 3、如果有not find webapps floder错误提示,说明是配置路径有问题,或者没有将新建工程里面最初的一个src文件夹没有删掉。
- 4、VM arguments参数(-Dheritrix.development)是用来区别开发模式和非开发模式的。
- 5、如果有弹出来的Can not find the main class. Program will exit.说明是JDK版本和EClipse版本不兼容或者没有正确引入jdk。
Tags: Heritrix, MyEclipse
In: 垂直搜索 |