您的当前位置:首页 >> 期刊文献 >> 正文
基于Selenium的网络爬虫的设计与实现
摘 要:
在互联网高速发展的时代,各大网站对网页元素的数据有着各自的加密方式,使得程序员在数据爬取时遇到的问题越来越多。文章以某文档网站为例,在此文档网站中使用Selenium——一种基于Web的自动化测试工具来模拟浏览器行为,通过其提供的一些方法在画布上查询出图像数据,进而将HTML5的canvas元素进行解析,成功将该网站中的文档图片爬取了出来。
作 者:
  • 忽爱平;范伊红;李阳;李坤;
单 位:
    河南科技大学软件学院
关键字:
  • Selenium技术;网络爬虫;JavaScript脚本语言;
页 码:
    39-40
出 处:
HTML阅读PDF文献下载您还没有登陆会员账号,请先登陆,在进行阅读或下载!
返回顶部 关注公众号