python爬蟲框架有哪些
1、Django
Django是一個開源的Web應用框架,由Python寫成,支持許多數據庫引擎,可以讓Web開發變得迅速和可擴展,并會不斷的版本更新以匹配Python最新版本,如果是新手程序員,可以從這個框架入手。
2、CherryPy
CherryPy是一種用于Python的、簡單而非常有用的Web框架,其主要作用是以盡可能少的操作將Web服務器與Python代碼連接,其功能包括內置的分析功能、靈活的插件系統以及一次運行多個HTTP服務器的功能,可與運行在最新版本的Python、Jython、Android上。
3、Web2py
web2py是一個為Python語言提供的全功能Web應用框架,旨在敏捷快速的開發Web應用,具有快速、安全以及可移植的數據庫驅動的應用,兼容GoogleAppEngine。
4、TurboGears
TurboGears可以快速實現Web應用程序開發,富含豐富的特殊性能,可以解決更多的框架領域問題,從簡單到復雜的項目都可以開發,并具有實時的多數據庫支持和靈活的ORM,簡單的文檔和最小的設置使它成為一個理想的使用框架。
5、Pylons
Pylons是一個開源的Web應用框架,使用Python語言編寫,它對WSGI標準進行了擴展應用,提升了重用性且將功能分割到獨立的模塊中,而且提供了在線調試器,易于錯誤跟蹤!
6、Grab
Grab是一個用于構建Web刮板的Python框架。借助Grab,您可以構建各種復雜的網頁抓取工具,從簡單的5行腳本到處理數百萬個網頁的復雜異步網站抓取工具。Grab提供一個API用于執行網絡請求和處理接收到的內容,例如與HTML文檔的DOM樹進行交互。
7、BeautifulSoup
BeautifulSoup是一個可以從HTML或XML文件中提取數據的Python庫。它能夠通過你喜歡的轉換器實現慣用的文檔導航,查找,修改文檔的方式.BeautifulSoup會幫你節省數小時甚至數天的工作時間。
8、Cola
Cola是一個分布式的爬蟲框架,對于用戶來說,只需編寫幾個特定的函數,而無需關注分布式運行的細節。任務會自動分配到多臺機器上,整個過程對用戶是透明的。
-
python
+關注
關注
56文章
4801瀏覽量
84857 -
爬蟲
+關注
關注
0文章
82瀏覽量
6949
發布評論請先 登錄
相關推薦
評論