信息检索课程作业

Preview:

DESCRIPTION

信息检索课程作业. 2014.04.24. 作业内容. Lucene 是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。即它提供了数据导入(索引)和导出(查询)两个服务 。 将给定的微博数据导入到 Lucene 中建立索引并能利用索引根据关键词查询微博内容 。 微 博数据 数据格式:消息 id \t 用户名 \t 时间 \t 内容(时间格式: YYYY-MM-DD HH:MM:SS ) 数据编码: utf8 下载地址: http:// pan.baidu.com/s/1i3oQG1f. 示例. 将微博数据插入 Lucene 建立索引:. 示例. - PowerPoint PPT Presentation

Citation preview

信息检索课程作业2014.04.24

作业内容

Lucene 是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。即它提供了数据导入(索引)和导出(查询)两个服务。

将给定的微博数据导入到 Lucene 中建立索引并能利用索引根据关键词查询微博内容。

微博数据 数据格式:消息 id \t 用户名 \t 时间 \t 内容(时间格式: YYYY-MM-DD

HH:MM:SS ) 数据编码: utf8

下载地址: http://pan.baidu.com/s/1i3oQG1f

示例

将微博数据插入 Lucene 建立索引:

示例

查询“周一见 文章”结果:

Recommended