elasticsearch API实战
python队列模块
创建一个“队列”对象
import Queue
myqueue = Queue.Queue(maxsize = 10)
Queue.Queue类即是一个队列的同步实现。队列长度可为无限或者有限。可通过Queue的构造函数的可选参数maxsize来设定队列长度。如果maxsize小于1就表示队列长度无限。
python多线程编程
实现模块
- thread:多线程的底层支持模块,一般不建议使用;
- threading:对thread进行了封装,将一些线程的操作对象化
python 启动一个线程有两种方式
- thread.start_new_thread( print_time, (“Thread-1”, 2, ) )
- thread1 = myThread(1, “Thread-1”, 1)
利用python解析html代码
常用的用来解析html的库有 BeautifulSoup 和 lxml。bs比较重,语法比较全面,lxml比较轻量,用xpath的语法。下面就来分别介绍下这两个库的用法
首先,我们准备一段html代码
1 | <book> |
利用python发起http请求的方法
在python的世界里,有很多库被设计用来发起http访问。
以下列举常用的方法:
- urllib,有urlencode方法,在urllib2中没有
- urllib2,可以接受Request对象,可以伪装agent,但是urllib不行
- urllib3,还没研究过
- httplib, 据说是urllib是在这个上面封装的
- httplib2
- requests
据说以上最好用的还是Requests,Requests使用文档 传送门
开源许可证
一张图让你了解git
一分钟git指引