1. 苏葳的备忘录首页
  2. 软件

Python中安装使用Selenium及PhantomJS

selenium phantomjs pythonSelenium是一种流行的Web测试工具,但也常用于数据采集方面。Selenium常用的是WebDriver,顾名思义就是应用与Web浏览器间的一个接口。虽然Selenium可以使用许多浏览器,包括移动平台上的一些产品,但由于要启动浏览器进程,所以效率是十分低下的。相比起来,一些无界面的浏览器由于不需页面显示渲染,速度会更快一些。今天就尝试下在Python中安装selenium模块。PhantomJS由于先前已经安装,就可以直接使用了。

首先在python中安装selenium模块:

D:\py\swscrapy>pip install selenium
You are using pip version 7.0.1, however version 7.1.0 is available.
You should consider upgrading via the 'pip install --upgrade pip' command.
Collecting selenium
Downloading selenium-2.46.1.tar.gz (2.6MB)
100% |████████████████████████████████| 2.6MB 155kB/s
Installing collected packages: selenium
Running setup.py install for selenium
Successfully installed selenium-2.46.1

那么需不需要安装Selenium本体呢?看文档去。。。经群里大神指导,原来安装了这个pip install selenium,就搞定了。

只要系统上如Win7里安装有相应浏览器,比如Chrome ,Firefox,PhantomJS等等,就可以开始工作了。

测试代码:

from selenium import webdriver
browser = webdriver.PhantomJS()
browser.get("http://www.yahoo.com")
print browser.title
browser.close()

由于本人win7上安装过PhantomJS且加入过系统路径,所以运行后:

D:\py>python testt.py
Yahoo

出结果了,速度还是比较快的。一会儿可以试试抓京东数据。

如果换成Firefox接口,上述代码会自动打开Firefox浏览器,加载yahoo主页,并打印出title,然后关闭Firefox。

原创文章,作者:苏葳,如需转载,请注明出处:https://www.swmemo.com/2152.html

发表评论

邮箱地址不会被公开。 必填项已用*标注