首页| 行业标准| 论文文档| 电子资料| 图纸模型
购买积分 购买会员 激活码充值

您现在的位置是:团子下载站 > 通信网络 > 如何使用本体语义实现灾害主题爬虫的策略

如何使用本体语义实现灾害主题爬虫的策略

  • 资源大小:1.06 MB
  • 上传时间:2021-11-13
  • 下载次数:0次
  • 浏览次数:32次
  • 资源积分:1积分
  • 标      签: URL HTML 互联网

资 源 简 介

为高效精确地提取存在于互联网中的灾害主题网页文本信息,引入本体语义,提出一种新的灾害主题爬虫策略。给出本体语义支持的灾害主题爬虫框架和流程,改进本体概念语义相似度计算方法,利用语义相似度计算主题语义向量,通过HTML位置加权获取网页文本特征向量,并进行主题相关度计算。设计URL锚文本主题相关度计算方法,分析URL链接优先度,优化爬行队列。选取地震灾害和气象灾害2个主题进行测试与分析,实验结果表明,该策略能有效提高稳定性和爬准率。
VIP VIP