您的当前位置:首页 >> 期刊文献 >> 正文
基于Spark的分布式网络日志处理系统的设计与实现
摘 要:
通过用户浏览网页时的网络日志分析,可发现用户的一些浏览习惯,从而有针对性的对网站进行改进,给用户带来更好的体验。本文通过搭建多个虚拟机对Web日志进行离线分析,通过flume系统收集日志,利用Hadoop文件系统存储,SparkSQL进行离线分析,按照需求进行相应业务的统计的分析。
作 者:
  • 芦成刚;王桂荣;
单 位:
    延边大学工学院
关键字:
  • Web日志;flume系统;Hadoop文件系统;SparkSQl;
页 码:
    82-83
出 处:
HTML阅读PDF文献下载您还没有登陆会员账号,请先登陆,在进行阅读或下载!
返回顶部 关注公众号