利用python解析html代码
常用的用来解析html的库有 BeautifulSoup 和 lxml。bs比较重,语法比较全面,lxml比较轻量,用xpath的语法。下面就来分别介绍下这两个库的用法
首先,我们准备一段html代码
1 | <book> |
lxml
xpath语法 传送门
1 | from lxml import etree |
常用的用来解析html的库有 BeautifulSoup 和 lxml。bs比较重,语法比较全面,lxml比较轻量,用xpath的语法。下面就来分别介绍下这两个库的用法
首先,我们准备一段html代码
1 | <book> |
xpath语法 传送门
1 | from lxml import etree |