标签存档: Python

Python中安装使用Selenium及PhantomJS

selenium phantomjs pythonSelenium是一种流行的Web测试工具,但也常用于数据采集方面。Selenium常用的是WebDriver,顾名思义就是应用与Web浏览器间的一个接口。虽然Selenium可以使用许多浏览器,包括移动平台上的一些产品,但由于要启动浏览器进程,所以效率是十分低下的。相比起来,一些无界面的浏览器由于不需页面显示渲染,速度会更快一些。今天就尝试下在Python中安装selenium模块。PhantomJS由于先前已经安装,就可以直接使用了。

继续阅读 »

Python获取当前版本的函数

python 版本Python2.x和3.x的区别之大,几乎可以作为一个变种语言存在。在实际开发中,Python的版本选择是很让人纠结的一个问题。3.x在设计上更现代,更规范,提供了一些崭新的特点。但从应用角度,原来2.x留下的大量软件包却又难以割舍。并且经测试,2.x版本的性能仍比3.x有明显优势。看来当前Python 3.x版本仍有很大优化的潜力。由于语言的演进,在2.x中,不同版本也会有些区别,那么对语言版本的判断也是非常有用的。

继续阅读 »

获取虚拟空间的系统版本和Python版本

python 虚拟主机vps虽好,但配置相对较低,成本相对较高。对于一个无限流量,无限空间的虚拟主机,其实可以更充分的利用资源潜能。比如有无可能在上面放置运行一个抓取图片或网页的爬虫?或者做网页代理?许多Linux虚拟主机,除了提供php支持以外,还会支持一些与Linux亲密度高的其它脚本语言比如Python或者Perl等。那么我们就可以将这些语言编写的程序上传,通过一些方法使它们可以在虚拟主机上运行。

继续阅读 »

h-sphere面板中用crontab执行定时任务的尝试

crontab h-sphere python虚拟空间的h-sphere类似于cpanel面板,在ftp管理中,能打开crontab功能,这就为虚拟空间在后台执行任务提供了可能。在crontab编辑中定制一个任务,现在问题是,中美时间不同,如何知道本地时间与服务器时间差几个小时?用ftp上传一个文件,然后在h-sphere的文件管理中查看上传的文件的时间,发现该系统时间比中国本地时间晚13个小时。

继续阅读 »

php和python求阶乘

python phpPython和php比较,php更象一种专用Web开发语言。而Python的应用面更广泛一些,更偏向于一种通用语言。虽然从外表上看起来Python比php更象是脚本语言,拥有逐条解释能力,但实质上两者正好相反。Python正象它的名字:蟒蛇一样,有许多堪称“怪异”的特点。比如人们为了更自由的书写,抛弃了Fortran语言的代码位置限制,然而在Python里却又以另外一个理由被重新捡起来。下面例子就是Python特色语法的一个例子:

继续阅读 »

Python的三元条件表达式与列表解析表达式

python 解表解析表达式Python作为一种非典型语言,天生就带有一些高级数据结构,如列表、元组、字典、集合、队列等,无需进一步编程就可以使用这些数据类型的操作。这些数据类型使得实现抽象的数学概念非常简单。Python语言处理和操作文本文件非常简单,非常易于处理非数值型数据。在代码书写上,除了代码强制缩进之外,Python开发者也是脑洞大开,给Python带来许多极富特色的语法。比如三元条件表达式与列表解析表达式:

继续阅读 »

AIX5.2下编译安装Python2.5.6

aix python make操作系统是aix 5.2。开始先下载了python-2.7.6.tgz,用gzip及tar解压缩后,进入Python-2.7.6目录: 执行./configure,最后报错误: Fatal: You must get working getaddrinfo() function.or you can specify “–disable-ipv6″. 加–disable-ipv6参数重新configure后,产生Makefile。执行make,报错,大约是Makefile格式不对之类。失去耐心了。因先前一台aix 5.3机子上安装过python 2.5.4。所以重新从python官网下载了一个 Python-2.5.6版本源码。

继续阅读 »

查找统计Python列表中的重复元素

python 列表 字典有一个xml配置文件,里面配置了许多关键词,由于许多人维护这个配置文件,导致关键词有可能重复,引发一些问题。现在用正则将所有关键词提取到一个pyhton的list 里面,那么如何快速的统计出那些是重复的呢?形如aa=[1,2,2,3,2,4]的一个list,其中有重复元素,由于集合中重复元素无意义,所以bb=list(set(aa))可很容易得到去除重复的列表[1,2,3,4]。若比较aa和bb的长度,很容易发现有重复,但无法指出重复的元素是哪些。

继续阅读 »

用Python的正则去除xml文件中的注释

python 正则表达式手头有一个xml配置文件,里面加了许多大块的注释,严重影响阅读。现在考虑一下,如何用Python中的正则表达式去除这个xml文件中的注释,也就是形如<!– 注释内容–>的这种注释代码块?Python的re模块中,dot(.)可用于代表任意字符,newline字符除外,而<!—和–>有可能在一行,也有可能含多行,所以需考虑这一点。re.sub及subn两个方法可用于替换掉匹配内容。让我们来试试:

继续阅读 »

Python 中日期类型的运算

python datetimePython提供了多个内置模块用于操作日期时间,像calendar,time,datetime。time模块提供 的接口与C标准库time.h基本一致。相比于time模块,datetime模块的接口则更直观、更容易调用。比如datetime模块中的date类定义有常用的属性date.max、date.min,表示date对象所能表示的最大、最小日期。date.resolution指出当前日期的最小单位。当前日期则可以用date.today()方法取得。下面是个日期运算的例子:

继续阅读 »

第 1 页,共 7 页12345...最旧 »