网站地图| 免费获取|
毕业论文网
  • 网站首页|
  • 论文范文|
  • 论文降重|
  • 职称论文发表|
  • 合作期刊|
  • 论文下载|
  • 计算机论文|
  • 外文翻译|
  • 免费论文|
  • 论文资料|
  • 论文开题报告
搜索

当前位置:毕业论文网 -> 论文下载 -> 理工科论文 -> 网页信息抽取模块研制-微机应用专业文档
自动化论文范文| 电子机电论文| 测控技术论文| 通信专业论文| 电气工程论文| 通信工程论文| 电子信息工程论文| 免费自动化论文| 免费电子论文| 免费电气论文| 免费通信论文

网页信息抽取模块研制-微机应用专业文档

本文ID:LW13564 字数:8911,页数:24 价格:¥50.00 → 信用说明

以下为论文简介,扫一扫付款马上可获取全文,付款金额见标题右下角。付款后请把付款结果截图及本篇论文的网址或者论文ID发给客服,客服核实后,马上将论文发到您的邮箱或者在线传送给您。客服QQ:17304545 点击这里给我发消息   微信:17304545 扫一扫 扫一扫
本站会员可自行下载:下载地址 网页信息抽取模块研制-微机应用专业论文 (收费:5000 积分)  如何获取积分?
网页信息抽取模块研制-微机应用专业文档

微机应用专业文档,文档字数:8911,页数:24

摘  要

 垂直搜索引擎和普通的网页搜索引擎的最大区别是垂直搜索引擎对网页信息进行了结构化信息抽取,因此信息抽取技术成为了构建垂直搜索引擎的核心技术。本文首先简介4种Web的信息抽取技术,然后结合Jtree和Xpath技术来实现动态网页信息抽取系统.
关键字:信息抽取;垂直搜索引擎;结构化信息提取;JTree;XPath

Abstract

 The difference between  search engine and simple search engine is that Plumb search engine structed the file that catch,and the search information become the core technology to build the Plumb search engine.This article talk about four different technology for web search first,and then combine the Jtree with xpath to build this search system.
 
Keywords: Information search;Plumb search engine;structed information extraction;Jtree;xpath;

目  录

引 言 5
第一章 开发概述 6
1.1 研究背景和意义 6
第二章 Web信息抽取相关技术 7
2.1垂直搜索引擎中的信息抽取技术的选用 7
2.2 几种Web的信息抽取技术简介 7
2.3 JTidy简介 10
2.4 XHTML简介 11
第三章 系统分析与设计 12
3.1需求分析 12
3.2系统设计 12
3.2.1网页抓取功能 12
3.2.2 样本页转换成XHTML功能 12
3.2.3 XHTML转换成XML功能 13
3.2.4  XpathViewer解析器 13
3.2.5 XSLT解析器文件 13
3.2.6 提取信息 13
第四章 信息抽取系统的实现 14
4.1 解析页面并生成Jtree 14
4.2 抽取规则的生成算法生成 15
4.3 根据Xpath生成XSLT文件 17
第五章 试验 18
5.1 获取抽取页面并测试 18
总结 21
致谢 23
参考资料

网页信息抽取模块研制-微机应用专业文档由毕业论文网(www.huoyuandh.com)会员上传。
原创论文资料流程 相关论文
上一篇:新闻发布系统-微机应用专业文档 下一篇:浅谈龙门吊的纠偏系统
推荐论文 本专业最新论文
Tags:网页 信息 抽取 模块 研制 微机 应用 专业文档 2011-01-07 17:08:55【返回顶部】
发表论文

联系方式 | 论文说明 | 网站地图 | 免费获取 | 钻石会员 | 硕士论文资料


毕业论文网提供论文范文,论文代发,原创论文资料

本站部分文章来自网友投稿上传,如发现侵犯了您的版权,请联系指出,本站及时确认并删除  E-mail: 17304545@qq.com

Copyright@ 2009-2020 毕业论文网 版权所有