基于多维语义的互联网药品信息提取方法

Computer Systems & Applications(2011)

引用 0|浏览5
暂无评分
摘要
提出了基于多维语义的互联网药品信息提取方法,构建语义词典通过从多个维度对互联网药品知识进行描述,克服了不同来源网页之间的异构性并找出了其隐藏的共性。同时,采用了基于结构语义熵的方法对目标网页信息聚集区域进行定位,从中提取感兴趣的药品信息。最后再通过语义词典对提取的信息进行验证并自动生成XPath提取规则进行补充。该方法能够自动有效地从互联网的多个信息来源获取药品信息,实验证明其具有较高的准确性与召回率,可以为政府相关部门加强互联网药品市场监管提供足够的信息依据。
更多
查看译文
关键词
Structural-semantic entropy,Web medicine information,Web information extraction,XPath,multidimensional semantic dictionary
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要