python队列模块

创建一个“队列”对象

import Queue
myqueue = Queue.Queue(maxsize = 10)

Queue.Queue类即是一个队列的同步实现。队列长度可为无限或者有限。可通过Queue的构造函数的可选参数maxsize来设定队列长度。如果maxsize小于1就表示队列长度无限。

python多线程编程

实现模块

  1. thread:多线程的底层支持模块,一般不建议使用;
  2. threading:对thread进行了封装,将一些线程的操作对象化

python 启动一个线程有两种方式

  1. thread.start_new_thread( print_time, (“Thread-1”, 2, ) )
  2. thread1 = myThread(1, “Thread-1”, 1)

利用python解析html代码

常用的用来解析html的库有 BeautifulSouplxml。bs比较重,语法比较全面,lxml比较轻量,用xpath的语法。下面就来分别介绍下这两个库的用法

首先,我们准备一段html代码

1
2
3
4
5
6
<book>
<title>Harry Potter</title>
<author>J K. Rowling</author>
<year>2005</year>
<price>29.99</price>
</book>

利用python发起http请求的方法

在python的世界里,有很多库被设计用来发起http访问。

以下列举常用的方法:

  • urllib,有urlencode方法,在urllib2中没有
  • urllib2,可以接受Request对象,可以伪装agent,但是urllib不行
  • urllib3,还没研究过
  • httplib, 据说是urllib是在这个上面封装的
  • httplib2
  • requests

据说以上最好用的还是Requests,Requests使用文档 传送门