支持DOM模板可视化配置的网页抽取方法

Modern Computer(2018)

引用 2|浏览1
暂无评分
摘要
为提高网页采集的效率和精准度,提出一种支持可视化模板配置的抽取方法.此方法通过在目标网页中点选元素的方式,自动生成基于DOM路径的抽取模板.将详细介绍基于DOM路径的抽取原理;研究可视化模板配置的关键技术;并将此方法应用于新闻采集系统,以测试其实用效果.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要