Beautiful Soup是一款非常強大的HTML/XML解析軟件。軟件中提供了部分簡單的方法和Python術語,用于檢索和修改語法樹:一個用于解析文檔并提取相關信息的工具包。讓用戶能夠更加靈活的抓取網站數據,大大提高了工作的效率。有需要的小伙伴快來下載吧!
軟件特色
1.Beautiful Soup最新版提供了一些簡單的方法和Python術語,用于檢索和修改語法樹:一個用于解析文檔并提取相關信息的工具包。這樣你寫一個應用不需要寫很多代碼。
2.Beautiful Soup自動將輸入文檔轉換為Unicode編碼,并將輸出文檔轉化為UTF-8編碼。你不需要考慮編碼,除非輸入文檔沒有指出其編碼并且Beautiful Soup無法自動檢測到,這時你需要指出原來的編碼方式。
3.Beautiful Soup位于一些流行的Python解析器比如lxml和html5lib的上層,這允許你使用不同的解析策略或者犧牲速度來換取靈活性。
使用方法
1、解壓Beautiful Soup最新版文件
將下載得到的壓縮包解壓到任意文件夾,路徑不含中文
2、打開cmd命令提示符
win+r,輸入cmd,回車
進入解壓后的目錄,我這里是C:Python27bs4beautifulsoup4-4.3.2
所以使用
cd C:Python27bs4beautifulsoup4-4.3.2
然后
setup.py build
接著
setup.py install
完成安裝
3、測試
python
import bs4
沒有提示錯誤,成功!
常見問題
如何遍歷樹?
使用find_all 函數
復制代碼 代碼如下:
find_all(name, attrs, recursive, text, limit, **kwargs)
舉例說明:
代碼如下:
print soup.find_all('title')
print soup.find_all('p','title')
print soup.find_all('a')
print soup.find_all(id="link2")
print soup.find_all(id=True)
返回值為:
標簽: 編程工具
精品推薦
-
IntelliJ IDEA 2019
詳情 -
Microsoft VC++6.0安裝包
詳情 -
Microsoft VC++2015版運行庫
詳情 -
VC++2019運行庫
詳情 -
RobotStudio
詳情 -
Intel Visual Fortran
詳情 -
Microsoft Visual Studio 2022
詳情 -
Microsoft VC++2010運行庫安裝包
詳情 -
源碼編輯器4.0
詳情 -
博途V18破解授權軟件
詳情 -
GX Works2
詳情 -
microsoft visual studio 2019免費版
詳情 -
hypermill2021超級加密狗破解版
詳情 -
西門子博途v17破解版
詳情 -
星三好圖形化編程軟件官方最新版
詳情 -
VBSEdit9
詳情
-
6 源碼智造編輯器
裝機必備軟件
網友評論