«

»

Python中安装使用Selenium及PhantomJS

selenium phantomjs pythonSelenium是一种流行的Web测试工具,但也常用于数据采集方面。Selenium常用的是WebDriver,顾名思义就是应用与Web浏览器间的一个接口。虽然Selenium可以使用许多浏览器,包括移动平台上的一些产品,但由于要启动浏览器进程,所以效率是十分低下的。相比起来,一些无界面的浏览器由于不需页面显示渲染,速度会更快一些。今天就尝试下在Python中安装selenium模块。PhantomJS由于先前已经安装,就可以直接使用了。

首先在python中安装selenium模块:

那么需不需要安装Selenium本体呢?看文档去。。。经群里大神指导,原来安装了这个pip install selenium,就搞定了。

只要系统上如Win7里安装有相应浏览器,比如Chrome ,Firefox,PhantomJS等等,就可以开始工作了。

测试代码:

由于本人win7上安装过PhantomJS且加入过系统路径,所以运行后:

出结果了,速度还是比较快的。一会儿可以试试抓京东数据。

如果换成Firefox接口,上述代码会自动打开Firefox浏览器,加载yahoo主页,并打印出title,然后关闭Firefox。

1 星2 星3 星4 星5 星 (尚无评分)
Loading...Loading...

相关文章

CasperJS中querySelector使用的一些问题 CasperJS是PhantomJS(一个Webkit内核的无界面浏览器)和SlimerJS(对应于Gecko内核)的一个封装,用于...
百度分享的微信二维码显示错位问题 网站推广的社交因素很重要,如果你的读者在你的网站发现了篇精采的文章,或者一幅有趣的图片,他很可能...
如何用robots.txt提升WordPress的SEO效果 你是否希望优化你的WordPress站点上的robots.txt文件?你还不确定robots.txt文件对SEO的重要性?我们会...
WordPress中Robots.txt的使用问题 Robots.txt文件是一种用来告诉搜索引擎哪些页面能够被搜索引擎蜘蛛看到,哪些不可见的手段。因此,Robot...
如何优化WordPress的Robots.txt? 当我们谈及WordPress的SEO时,WP的Robots.txt在搜索引擎评级中扮演着重要角色。它能阻止搜索引擎机器人...
Nginx的Proxy Cache的命中机制 Nginx是著名的HTTP服务器,也常用作反向代理服务器,所谓反向代理,意指代理的不是客户端,而是服务端。...
WordPress的URL设置在Nginx上的404冲突 404是什么?除了是方校长在武汉大学讲课时的教室门牌号码,还是网站返回的一个HTTP状态码。这个状态码告...
WordPress的基本安全设置 一个博客站点身处互联网的浩瀚海洋里,如果有些流量的话,每天不知道要经受多少有意无意的攻击。WordPre...

发表评论

电子邮件地址不会被公开。