lxml是Python中與XML及HTML相關(guān)功能中最豐富和最容易使用的庫(kù)。lxml并不是Python自帶的包,而是為libxml2和libxslt庫(kù)的一個(gè)Python化的綁定。它與眾不同的地方是它兼顧了這些庫(kù)的速度和功能完整性,以及純Python API的簡(jiǎn)潔性,與大家熟知的ElementTree API兼容但比之更優(yōu)越!但安裝lxml卻又有點(diǎn)麻煩,因?yàn)榇嬖谝蕾嚕苯影惭b的話用easy_install, pip都不能成功,會(huì)報(bào)gcc錯(cuò)誤。
爬蟲(chóng)時(shí)通常要安裝LXML,對(duì)于通過(guò)一下命令行
1
|
pip install lxml |
出現(xiàn)如下錯(cuò)誤的解決方法
1
|
lxml Unable to find vcvarsall.bat |
1. 安裝wheel,命令行運(yùn)行:
1
|
pip install wheel |
2.在這里下載對(duì)應(yīng)的.whl文件(打開(kāi)網(wǎng)址后ctrl+F,搜索LXML,選擇對(duì)應(yīng)版本,一般是win32,而不選win_arm64,即使電腦是win64)
http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml
3. 進(jìn)入.whl所在的文件夾->shift+鼠標(biāo)右鍵->在此處打開(kāi)命令窗口
4.執(zhí)行命令即可完成安裝:
1
|
pip install lxml-3.6.0-cp35-cp35m-win32.whl |
另外附上Linux系統(tǒng)中安裝LXML的教程
因?yàn)閘xml依賴的包如下:
libxml2, libxml2-devel, libxlst, libxlst-devel, python-libxml2, python-libxslt
所以安裝步驟如下:
第一步: 安裝 libxml2
1
|
$ sudo apt-get install libxml2 libxml2-dev |
第二步: 安裝 libxslt
1
|
$ sudo apt-get install libxlst libxslt-dev |
第三步: 安裝 python-libxml2 和 python-libxslt
1
|
$ sudo apt-get install python-libxml2 python-libxslt |
第四步: 安裝 lxml
1
|
$ sudo easy_install lxml |