4
信信信信信信信信 2014.04.24

信息检索课程作业

Embed Size (px)

DESCRIPTION

信息检索课程作业. 2014.04.24. 作业内容. Lucene 是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。即它提供了数据导入(索引)和导出(查询)两个服务 。 将给定的微博数据导入到 Lucene 中建立索引并能利用索引根据关键词查询微博内容 。 微 博数据 数据格式:消息 id \t 用户名 \t 时间 \t 内容(时间格式: YYYY-MM-DD HH:MM:SS ) 数据编码: utf8 下载地址: http:// pan.baidu.com/s/1i3oQG1f. 示例. 将微博数据插入 Lucene 建立索引:. 示例. - PowerPoint PPT Presentation

Citation preview

Page 1: 信息检索课程作业

信息检索课程作业2014.04.24

Page 2: 信息检索课程作业

作业内容

Lucene 是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。即它提供了数据导入(索引)和导出(查询)两个服务。

将给定的微博数据导入到 Lucene 中建立索引并能利用索引根据关键词查询微博内容。

微博数据 数据格式:消息 id \t 用户名 \t 时间 \t 内容(时间格式: YYYY-MM-DD

HH:MM:SS ) 数据编码: utf8

下载地址: http://pan.baidu.com/s/1i3oQG1f

Page 3: 信息检索课程作业

示例

将微博数据插入 Lucene 建立索引:

Page 4: 信息检索课程作业

示例

查询“周一见 文章”结果: