首页
期刊大全
万向问答
期刊动态
学术会议
科研项目
帮助中心
免费注册
|
会员登录
文献检索:
文献标题
文献标题
关键词
摘要
作者
单位
搜索
您的当前位置:
首页
>>
期刊文献
>> 正文
基于Spark的分布式网络日志处理系统的设计与实现
摘 要:
通过用户浏览网页时的网络日志分析,可发现用户的一些浏览习惯,从而有针对性的对网站进行改进,给用户带来更好的体验。本文通过搭建多个虚拟机对Web日志进行离线分析,通过flume系统收集日志,利用Hadoop文件系统存储,SparkSQL进行离线分析,按照需求进行相应业务的统计的分析。
作 者:
芦成刚;王桂荣;
单 位:
延边大学工学院
关键字:
Web日志;flume系统;Hadoop文件系统;SparkSQl;
页 码:
82-83
出 处:
科学技术创新
-
2021年15期
您还没有登陆会员账号,请先登陆,在进行阅读或下载!