LUNCENE1–创建索引库

步骤一：jar导入

lucene-core-3.0.2.jar【Lucene核心】
lucene-analyzers-3.0.2.jar【分词器】
lucene-highlighter-3.0.2.jar【Lucene会将搜索出来的字，高亮显示，提示用户】
lucene-memory-3.0.2.jar【索引库优化策略】
步骤二：
创建索引库的步骤：
1）创建JavaBean对象
2）创建Docment对象
3）将JavaBean对象所有的属性值，均放到Document对象中去，属性名可以和JavaBean相同或不同
4）创建IndexWriter对象
5）将Document对象通过IndexWriter对象写入索引库中
6）关闭IndexWriter对象

@Test
public void createIndexDB() throws Exception {
    //把数据填充到JavaBean对象中
    User user = new User(“1”, “钟福成”, “未来的程序员”);
    //创建Document对象【导入的是Lucene包下的Document对象】
    Document document = new Document();
    //将JavaBean对象所有的属性值，均放到Document对象中去，属性名可以和JavaBean相同或不同
    /**
     * 向Document对象加入一个字段
     * 参数一：字段的关键字
     * 参数二：字符的值
     * 参数三：是否要存储到原始记录表中
     *      YES表示是
     *      NO表示否
     * 参数四：是否需要将存储的数据拆分到词汇表中
     *      ANALYZED表示拆分
     *      NOT_ANALYZED表示不拆分
     *
     * */
    document.add(new Field(“id”, user.getId(), Field.Store.YES, Field.Index.ANALYZED));
    document.add(new Field(“userName”, user.getUserName(), Field.Store.YES, Field.Index.ANALYZED));
    document.add(new Field(“sal”, user.getSal(), Field.Store.YES, Field.Index.ANALYZED));
    //创建IndexWriter对象
    //目录指定为E:/createIndexDB
    Directory directory = FSDirectory.open(new File(“E:/createIndexDB”));
    //使用标准的分词算法对原始记录表进行拆分
    Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_30);
    //LIMITED默认是1W个
    IndexWriter.MaxFieldLength maxFieldLength = IndexWriter.MaxFieldLength.LIMITED;
    /**
     * IndexWriter将我们的document对象写到硬盘中
     *
     * 参数一：Directory d,写到硬盘中的目录路径是什么
     * 参数二：Analyzer a, 以何种算法来对document中的原始记录表数据进行拆分成词汇表
     * 参数三：MaxFieldLength mfl 最多将文本拆分出多少个词汇
     *
     * */
    IndexWriter indexWriter = new IndexWriter(directory, analyzer, maxFieldLength);
    //将Document对象通过IndexWriter对象写入索引库中
    indexWriter.addDocument(document);
    //关闭IndexWriter对象
    indexWriter.close();
}