您的当前位置:首页 >> 期刊文献 >> 正文
基于改进Single-pass算法的新闻话题演化跟踪算法
摘 要:
随着信息技术发展,每天都有大量的新闻文本在互联网上发布、转发,在这样的海量信息环境下,如何快速定位自己感兴趣的话题、追踪其发展趋势已成了近年来的研究热点。面向互联网上新闻文本,提出聚类阈值的估计方法对已有的Single-pass算法进行优化,进而基于时间片设计一个新闻文本演化算法。在新华网等四个网站上采集新闻数据并进行实验,实验表明所提算法可有效跟踪新闻话题的演化过程。
作 者:
  • 李天怡;应文豪;
单 位:
    常熟理工学院计算机科学与工程学院
关键字:
  • Single-pass算法;网络爬虫;聚类;演化;跟踪;
页 码:
    26-29
出 处:
HTML阅读PDF文献下载您还没有登陆会员账号,请先登陆,在进行阅读或下载!
返回顶部 关注公众号