在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

新一代爬蟲工具katana

jf_hKIAo4na ? 來源:菜鳥學安全 ? 2023-04-20 10:43 ? 次閱讀
91efbea4-df24-11ed-bfe3-dac502259ad0.png
  • 快速且完全可配置的網絡爬行

  • 標準和無外設模式支持

  • JavaScript 解析/爬網

  • 可定制的自動表單填寫

  • 范圍控制 - 預配置字段/正則表達式

  • 可自定義的輸出 - 預配置字段

  • 輸入 - 標準輸入、URL 和列表

  • 輸出 - 標準輸出、文件和 JSON

0x01 工具安裝

Katana需要Go 1.18才能成功安裝。要安裝,只需運行以下命令或從發布頁面下載預編譯的二進制文件。

go install github.com/projectdiscovery/katana/cmd/katana@latest

Docker安裝:

docker pull projectdiscovery/katana:latest
docker run projectdiscovery/katana:latest -u https://tesla.com
docker run projectdiscovery/katana:latest -u https://tesla.com -system-chrome -headless

Ubuntu安裝:

sudo apt update
sudo snap refresh
sudo apt install zip curl wget git
sudo snap install golang --classic
wget -q -O - https://dl-ssl.google.com/linux/linux_signing_key.pub | sudo apt-key add - 
sudo sh -c 'echo "deb http://dl.google.com/linux/chrome/deb/ stable main" >> /etc/apt/sources.list.d/google.list'
sudo apt update 
sudo apt install google-chrome-stable
go install github.com/projectdiscovery/katana/cmd/katana@latest

0x02 工具使用

Katana需要URL或端點進行爬網,并接受單個或多個輸入。

可以使用-u 選項提供輸入 URL,可以使用逗號分隔的輸入提供多個值,同樣使用-list 選項支持文件輸入,并且還支持額外的管道輸入 (stdin)。

katana -u https://tesla.com

多個 URL 輸入(逗號分隔):

katana -u https://tesla.com,https://google.com

文件輸入:

$ cat url_list.txt


https://tesla.com
https://google.com
katana -list url_list.txt

管道輸入:

echo https://tesla.com | katana
cat domains | httpx | katana

運行實例:

katana -u https://youtube.com


  __    __        
 / /_____ _/ /____ ____ ___ _
 / '_/ _ / __/ _ / _ / _ /
/_/\_\_,_/\__/\_,_/_//_/\_,_/ v0.0.1           


   projectdiscovery.io


[WRN] Use with caution. You are responsible for your actions.
[WRN] Developers assume no liability and are not responsible for any misuse or damage.
https://www.youtube.com/
https://www.youtube.com/about/
https://www.youtube.com/about/press/
https://www.youtube.com/about/copyright/
https://www.youtube.com/t/contact_us/
https://www.youtube.com/creators/
https://www.youtube.com/ads/
https://www.youtube.com/t/terms
https://www.youtube.com/t/privacy
https://www.youtube.com/about/policies/
https://www.youtube.com/howyoutubeworks?utm_campaign=ytgen&utm_source=ythp&utm_medium=LeftNav&utm_content=txt&u=https%3A%2F%2Fwww.youtube.com%2Fhowyoutubeworks%3Futm_source%3Dythp%26utm_medium%3DLeftNav%26utm_campaign%3Dytgen
https://www.youtube.com/new
https://m.youtube.com/
https://www.youtube.com/s/desktop/4965577f/jsbin/desktop_polymer.vflset/desktop_polymer.js
https://www.youtube.com/s/desktop/4965577f/cssbin/www-main-desktop-home-page-skeleton.css
https://www.youtube.com/s/desktop/4965577f/cssbin/www-onepick.css
https://www.youtube.com/s/_/ytmainappweb/_/ss/k=ytmainappweb.kevlar_base.0Zo5FUcPkCg.L.B1.O/am=gAE/d=0/rs=AGKMywG5nh5Qp-BGPbOaI1evhF5BVGRZGA
https://www.youtube.com/opensearch?locale=en_GB
https://www.youtube.com/manifest.webmanifest
https://www.youtube.com/s/desktop/4965577f/cssbin/www-main-desktop-watch-page-skeleton.css
https://www.youtube.com/s/desktop/4965577f/jsbin/web-animations-next-lite.min.vflset/web-animations-next-lite.min.js
https://www.youtube.com/s/desktop/4965577f/jsbin/custom-elements-es5-adapter.vflset/custom-elements-es5-adapter.js
https://www.youtube.com/s/desktop/4965577f/jsbin/webcomponents-sd.vflset/webcomponents-sd.js
https://www.youtube.com/s/desktop/4965577f/jsbin/intersection-observer.min.vflset/intersection-observer.min.js
https://www.youtube.com/s/desktop/4965577f/jsbin/scheduler.vflset/scheduler.js
https://www.youtube.com/s/desktop/4965577f/jsbin/www-i18n-constants-en_GB.vflset/www-i18n-constants.js
https://www.youtube.com/s/desktop/4965577f/jsbin/www-tampering.vflset/www-tampering.js
https://www.youtube.com/s/desktop/4965577f/jsbin/spf.vflset/spf.js
https://www.youtube.com/s/desktop/4965577f/jsbin/network.vflset/network.js
https://www.youtube.com/howyoutubeworks/
https://www.youtube.com/trends/
https://www.youtube.com/jobs/
https://www.youtube.com/kids/

0x03 爬蟲模式

標準模式:

標準爬網模式使用底層的標準 go http 庫來處理 HTTP 請求/響應。這種模式要快得多,因為它沒有瀏覽器開銷。盡管如此,它仍然按原樣分析 HTTP 響應正文,沒有任何 javascript 或 DOM 渲染,可能會缺少 dom 渲染后的端點或異步端點調用,這些調用可能發生在復雜的 Web 應用程序中,例如,依賴于特定于瀏覽器的事件。

無頭模式:

無頭模式掛鉤內部無頭調用,以直接在瀏覽器上下文中處理 HTTP 請求/響應。這有兩個優點:

  • HTTP 指紋(TLS 和用戶代理)將客戶端完全標識為合法瀏覽器

  • 更好的覆蓋范圍,因為端點是分析標準原始響應的,就像在前面的模式中一樣,以及啟用了javascript的瀏覽器渲染的響應。

無頭爬網是可選的,可以使用-headless 選項啟用。

以下是其他無頭 CLI 選項 -

katana -h headless


Flags:
HEADLESS:
  -hl, -headless          enable headless hybrid crawling (experimental)
  -sc, -system-chrome        use local installed chrome browser instead of katana installed
  -sb, -show-browser        show the browser on the screen with headless mode
  -ho, -headless-options string[]  start headless chrome with additional options
  -nos, -no-sandbox         start headless chrome in --no-sandbox mode
  -cdd, -chrome-data-dir string   path to store chrome browser data
  -scp, -system-chrome-path string use specified chrome browser for headless crawling
  -noi, -no-incognito        start headless chrome without incognito mode

無沙盒模式:

使用無沙盒選項運行無頭 chrome 瀏覽器,在以 root 用戶身份運行時很有用。

katana -u https://tesla.com -headless -no-sandbox

無運行頭模式:

在沒有隱身模式的情況下運行無頭 chrome 瀏覽器,這在使用本地瀏覽器時很有用。

katana -u https://tesla.com -headless -no-incognito
工具下載:
https://github.com/projectdiscovery/katana

審核編輯 :李倩
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • HTTP
    +關注

    關注

    0

    文章

    510

    瀏覽量

    31358
  • URL
    URL
    +關注

    關注

    0

    文章

    139

    瀏覽量

    15392
  • 爬蟲
    +關注

    關注

    0

    文章

    82

    瀏覽量

    6949

原文標題:新一代爬蟲工具 katana

文章出處:【微信號:菜鳥學安全,微信公眾號:菜鳥學安全】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于4G和Beyond 3G的新一代移動通信系統討論

    1、引言隨著科學技術的發展和社會的進步,移動通信技術正在經歷著日新月異的變化。當人們還在研究和部署第三移動通信系統的同時,為了適應將來通信的要求,國際通信界已經開始著手研究新一代的移動通信系統
    發表于 07-17 06:47

    新一代音頻DAC的架構介紹

    本文介紹了歐勝微電子公司最新一代音頻數字-模擬轉換器(DAC)的架構,專注于設計用于消費電子應用中提供高電壓線驅動器輸出的新器件系列。
    發表于 07-22 06:45

    LXI新一代測試自動化平臺

    LXI新一代測試自動化平臺
    發表于 10-12 15:01

    爬蟲可以采集哪些數據

    。   2.驗證碼識別工具-OCR   現在驗證碼幾乎在任何個網站的交互界面中都存在,目的當然是為了防止惡意程序的攻擊。   在使用爬蟲時,如果獲取速度過快,通常會出現驗證碼驗證當前訪問的是人還是
    發表于 10-15 17:25

    PLC新一代超小型控制器怎么編程?

    PLC新一代超小型控制器(LOGO!)的編程方法與操作
    發表于 04-07 09:00

    MIMO之新一代移動通信核心技術

    MIMO:新一代移動通信核心技術
    發表于 07-17 16:38

    斯巴魯新一代安全系統搶先看

    斯巴魯近日宣布將從明年起運用其新一代EyeSight安全系統,并在10月2日首先透露了新一代產品的細節。
    發表于 08-26 07:28

    新一代納秒級高帶寬仿真工具平臺HAC Express的優勢

    新一代納秒級高帶寬仿真工具平臺——HAC Express
    發表于 01-11 06:47

    新一代軍用通信系統的挑戰

    新一代軍用通信系統挑戰
    發表于 03-02 06:21

    如何去設計新一代自動化測試系統?

    自動化測試系統的設計挑戰有哪些?如何去設計新一代自動化測試系統?
    發表于 05-11 06:52

    如何去推進新一代數據中心的發展?

    新一代數據中心有哪些實踐操作范例?如何去推進新一代數據中心的發展? 
    發表于 05-25 06:16

    新一代視頻編碼器怎么樣?

    新一代視頻編碼器怎么樣?
    發表于 06-02 06:39

    新一代PON以及云數據中心的未來

    新一代PON以及云數據中心的未來
    發表于 06-07 06:30

    爬蟲是如何實現數據的獲取爬蟲程序如何實現

    進入大數據時代,爬蟲技術越來越重要,因為它是獲取數據的個重要手段,是大數據和云計算的基礎。那么,爬蟲到底是如何實現數據的獲取的呢?今天和大家分享的就是個系統學習
    發表于 01-02 16:30 ?10次下載
    <b class='flag-5'>爬蟲</b>是如何實現數據的獲取<b class='flag-5'>爬蟲</b>程序如何實現

    Cloud Katana云環境安全評估工具

    Cloud-Katana.zip
    發表于 05-06 09:35 ?0次下載
    Cloud <b class='flag-5'>Katana</b>云環境安全評估<b class='flag-5'>工具</b>
    主站蜘蛛池模板: 亚洲爱爱网| 五月天停婷基地| 黄网站色成年片大免费软件| 日韩精品网址| 求网址你懂的手机在线观看网站| 欧美性free免费| 婷婷丁香在线| 四虎精品免费国产成人| 欧美日韩一区在线观看| 韩国免费特一级毛片| 99色在线观看| 人人天天夜夜| 国产精品久久精品福利网站| 欧美xxxx日本| 久久久久久免费播放一级毛片| 伊人久久大香线蕉电影院| 四虎国产精品永久在线播放| 农村三级毛片| 97综合视频| 久久精品国产福利| 俄罗斯美女69xxxxxx| 精品成人毛片一区二区视| 性欧美bbbbbb动漫| hdhdhd69日本xxx| 久久精品国产免费中文| 婷婷色网| 就要爱综合| 亚洲精品美女久久久久网站| 久久久久女人精品毛片九一| 黄色刺激网站| 伊人久久大香线蕉综合亚洲| 日本精品一卡二卡≡卡四卡| 狠狠狠色丁香婷婷综合久久五月 | 在线网站你懂| 日本免费a级片| 成人女人a毛片在线看| 国产美女精品三级在线观看| 在线天天干| 国产美女亚洲精品久久久久久| 亚洲a成人| 日韩一级免费视频|