基于区域分块的微内容类网页正文提取技术

Natural Science Journal of Hainan University(2013)

引用 0|浏览3
暂无评分
摘要
通过对微内容类网页正文内容块自动填充的研究,利用网页区域分块技术与HTML的结构特征,提出了一种基于区域分块和内容块自动填充(RAF)的正文提取方法,可用于微内容类网页正文的自动提取,同时运用编程实现提取工具进行实验.结果表明,该方法能够有效、准确地提取微内容类网页的正文信息.
更多
查看译文
关键词
auto fill,content extracting,micro-content,region block,HTML page
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要