Photon是一個(gè)由s0md3v開源的情報(bào)搜集爬蟲,其主要功能有:
1.爬取鏈接(內(nèi)鏈、外鏈)。
2.爬取帶參數(shù)的鏈接,如(pythondict.com/test?id=2)。
3.文件(pdf, png, xml)。
4.密鑰(在前端代碼中不小心被釋放出來(lái)的)。
5.js文件和Endpoint(spring中比較重要的監(jiān)視器)
6.匹配自定義正則表達(dá)式的字符串。
7.子域名和DNS相關(guān)數(shù)據(jù)。
你可以用它來(lái)干很多事,比如爬圖片、找漏洞、找子域名、爬數(shù)據(jù)等等。
不僅如此,它甚至支持json格式 ,僅需要在輸入命令的時(shí)候加上json參數(shù):
python photon.py -u "http://example.com" --export=json
1、下載安裝
https://github.com/s0md3v/Photon/archive/refs/heads/master.zip
2、簡(jiǎn)單使用
注意,使用的時(shí)候要在Photon文件夾下。比如我們隨便提取一個(gè)網(wǎng)站的URL試一下,在終端輸入以下命令:
python photon.py -u https://bk.tencent.com/
它會(huì)在當(dāng)前目錄下產(chǎn)生一個(gè)你測(cè)試的域名的文件夾,比如在我這里是 bk.tencent.com:
結(jié)果如下:

嘻嘻,讓我們看看里面有什么東西,有沒(méi)有程序員留下的小彩蛋,打開external.txt,這是該網(wǎng)站的外鏈的存放位置。可以看到,這里不僅僅是只有網(wǎng)站頁(yè)面,連CDN文件地址都會(huì)放在這里,所以external可能是個(gè)藏寶庫(kù)哦。
3、擴(kuò)展
這個(gè)項(xiàng)目的價(jià)值,不僅在于能夠快速拉取你想要得到的數(shù)據(jù),還在于能夠構(gòu)建一個(gè)牛逼轟轟的情報(bào)系統(tǒng)(如果你技術(shù)夠強(qiáng)的話)。因?yàn)樗悄懿粩嘌由煜氯サ模热鐝耐怄湷霭l(fā),你能找到很多和這個(gè)網(wǎng)站相關(guān)的訊息。
相比于搜索引擎搜索的結(jié)果,實(shí)際上這些信息更符合情報(bào)的要求。因?yàn)榇嬖诮顾阉饕媾廊〉?robot.txt, 所以不是網(wǎng)站的所有信息都能在搜索引擎搜索得到,而通過(guò)這個(gè)Photon,你可以順藤摸瓜找到那些隱藏在互聯(lián)網(wǎng)世界的它們。
審核編輯:湯梓紅
-
開源
+關(guān)注
關(guān)注
3文章
4207瀏覽量
46145 -
python
+關(guān)注
關(guān)注
57文章
4876瀏覽量
90038 -
爬蟲
+關(guān)注
關(guān)注
0文章
87瀏覽量
8092 -
photon
+關(guān)注
關(guān)注
0文章
33瀏覽量
3896
發(fā)布評(píng)論請(qǐng)先 登錄
NVMe高速傳輸之?dāng)[脫XDMA設(shè)計(jì)49:主要功能測(cè)試結(jié)果與分析1
綜合配電柜主要功能喝應(yīng)用場(chǎng)景是什么
醫(yī)院專用數(shù)據(jù)記錄儀主要功能有哪些
RFID手持機(jī)的主要功能
手持采集器是干什么用的 PDA采集器的主要功能與應(yīng)用場(chǎng)景
PLC遠(yuǎn)程監(jiān)控解決方案的主要功能與場(chǎng)景應(yīng)用
PLC溫度控制系統(tǒng)的主要功能
一維二維碼條碼識(shí)讀器的主要功能有哪些
圖像采集卡的主要功能與應(yīng)用
電力智慧場(chǎng)站核心功能與應(yīng)用場(chǎng)景詳解
直流負(fù)載箱的主要功能有哪些?
ADW300無(wú)線計(jì)量?jī)x表安裝使用說(shuō)明書V1.2
Aigtek:功率放大器的主要功能有哪些
Photon情報(bào)搜集爬蟲的主要功能與安裝使用說(shuō)明
評(píng)論