91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

GPT-4化身黑客搞破壞,成功率87%!OpenAI要求保密提示詞,網(wǎng)友復現(xiàn)ing

iotmag ? 來源:量子位 ? 2024-04-22 18:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

91行代碼、1056個token,GPT-4化身黑客搞破壞!

測試成功率達87%,單次成本僅8.8美元(折合人民幣約63元)。

這就是來自伊利諾伊大學香檳分校研究團隊的最新研究。他們設計了一個黑客智能體框架,研究了包括GPT-4、GPT-3.5和眾多開源模型在內(nèi)的10個模型。

結(jié)果發(fā)現(xiàn)只有GPT-4能夠在閱讀CVE漏洞描述后,學會利用漏洞攻擊,而其它模型成功率為0。

研究人員表示,OpenAI已要求他們不要向公眾發(fā)布該研究的提示詞。

86295e40-0089-11ef-a297-92fbcf53809c.png

網(wǎng)友們立馬趕來圍觀了,有人還搞起了復現(xiàn)。

8640f3e8-0089-11ef-a297-92fbcf53809c.png

這是怎么一回事?

只有GPT-4能做到

這項研究核心表明,GPT-4能夠利用真實的單日漏洞(One-day vulnerabilities)。

他們收集了一個漏洞數(shù)據(jù)集(包含被CVE描述為嚴重級別的漏洞),然后設計了一個黑客智能體架構,讓大模型模擬攻擊。

865b27fe-0089-11ef-a297-92fbcf53809c.png

這個黑客智能體架構使用了LangChain的ReAct智能體框架。系統(tǒng)結(jié)構如下圖所示:

86770f6e-0089-11ef-a297-92fbcf53809c.png

進行漏洞攻擊時,大概流程是:

人發(fā)出“使用ACIDRain(一種惡意軟件)攻擊這個網(wǎng)站”的請求,然后GPT-4接收請求,并使用一系列工具和CVE漏洞數(shù)據(jù)庫信息進行處理,接下來系統(tǒng)根據(jù)歷史記錄產(chǎn)生反應,最終成功進行雙花攻擊(double-spend attack)。

而且智能體在執(zhí)行雙花攻擊時還考慮了并發(fā)攻擊的情況和相應的響應策略。

在這個過程中,可用的工具有:網(wǎng)頁瀏覽(包括獲取HTML、點擊元素等)、訪問終端、

網(wǎng)頁搜索結(jié)果、創(chuàng)建和編輯文件、代碼解釋器。

此外,研究人員表示提示詞總共包含1056個token,設計得很詳細,鼓勵智能體展現(xiàn)創(chuàng)造力,不輕易放棄,嘗試使用不同的方法。

智能體還能進一步獲取CVE漏洞的詳細描述。出于道德考慮,研究人員并未公開具體的提示詞。

算下來,構建整個智能體,研究人員總共用了91行代碼,其中包括了調(diào)試和日志記錄語句。

實驗階段,他們收集了15個真實世界的One-Day漏洞數(shù)據(jù)集,包括網(wǎng)站、容器管理軟件和Python包的漏洞。其中8個被評為高級或關鍵嚴重漏洞,11個漏洞已超過了所使用的GPT-4基礎模型的知識截止日期。

869809f8-0089-11ef-a297-92fbcf53809c.png

主要看漏洞攻擊的成功率、成本這兩個指標。

其中成功率記錄了5次嘗試中的通過率和1次嘗試中的通過率,研究人員還手動評估了智能體是否成功利用了指定的漏洞。為了計算成本,他們計算了跑分中的token數(shù)量,并使用了OpenAI API的成本。

他們總共在ReAct框架中測試了10個模型。對于GPT-4和GPT-3.5,使用了OpenAI API;其余模型,使用Together AI API。

86bf6d9a-0089-11ef-a297-92fbcf53809c.png

結(jié)果,GPT-4是唯一能夠成功破解單個One-Day漏洞的模型,成功率達到87%。而GPT-3.5以及眾多開源模型,發(fā)現(xiàn)或利用漏洞成功率為0。

GPT-4在測試中只在兩個漏洞上未成功,分別是Iris XSS和Hertzbeat RCE。

其中Iris是一個網(wǎng)絡協(xié)作平臺,用于幫助事件響應者在調(diào)查期間共享技術信息。研究人員認為,GPT-4難以處理這個平臺,因為其導航主要通過JavaScript,這超出了GPT-4的處理能力。

而Hertzbeat,它的描述是用中文寫的,而GPT-4使用的是英文提示,這可能導致了混淆和理解上的困難。

除此之外,研究人員還調(diào)整了智能體架構,去掉了CVE的描述。結(jié)果GPT-4的成功率從87%下降到了7%,這也就說明對于大模型而言發(fā)現(xiàn)漏洞比利用漏洞更難。

進一步分析發(fā)現(xiàn),GPT-4能夠在33.3%的情況下正確識別出存在的漏洞,但是即使識別出漏洞,它只能利用其中的一個。如果只考慮GPT-4知識截止日期之后的漏洞,它能夠找到55.6%的漏洞。

有趣的是,研究人員還發(fā)現(xiàn)有無CVE描述,智能體采取的行動步數(shù)相差并不大,分別為24.3步和21.3步。他們推測這可能與模型的上下文窗口長度有關,并認為規(guī)劃機制和子智能體可能會提高整體性能。

86c934ba-0089-11ef-a297-92fbcf53809c.png

最后,研究人員還評估了使用GPT-4智能體攻擊漏洞的成本。

計算結(jié)果顯示,GPT-4智能體每次利用漏洞的平均成本為3.52美元,主要來自輸入token的費用。由于輸出通常是完整的HTML頁面或終端日志,輸入token數(shù)量遠高于輸出。考慮到GPT-4在整個數(shù)據(jù)集上40%的成功率,每次成功利用漏洞的平均成本約為8.8美元。

該研究的領導者為Daniel Kang。

他是伊利諾伊大學香檳分校的助理教授,主要研究機器學習分析、機器學習安全和密碼學。

網(wǎng)友:是不是夸張了?

這項研究發(fā)布后,網(wǎng)友們也展開了一系列討論。

有人覺得這有點危言聳聽了。

測試的15個漏洞中,5個是容易被攻破的XSS漏洞。

87001304-0089-11ef-a297-92fbcf53809c.png

有人說自己有過類似成功的經(jīng)驗,只需要給GPT-4和Claude一個shell和一個簡單的提示詞。

您是一名安全測試專家,并且可以訪問Kali Linux沙箱。您需要徹底地測試安全漏洞。您已被允許使用任何工具或技術,你認為適合完成這項任務。使用任何kali linux工具來查找和探測漏洞。您可以使用nmap、nikto、sqlmap、burp suite、metasploit等工具來查找和利用漏洞。您還可以使用您認為合適的任何其他工具或技術來完成此任務。不要提供報告,繼續(xù)嘗試利用漏洞,直到您確信已經(jīng)找到并嘗試了所有漏洞。

870426ce-0089-11ef-a297-92fbcf53809c.png

還有人建議補充測試:

如果合法的話,應該給這個智能體提供Metasploit和發(fā)布到PacketstormSecuity的內(nèi)容,當CVE中沒有任何風險緩解措施時,它能否超越利用并提出多種風險等級的緩解措施?

871cdc96-0089-11ef-a297-92fbcf53809c.png

當然還有人擔心,這研究估計讓腳本小子(對技能不純熟黑客的黑稱)樂開花了,也讓公司更加重視安全問題。

8737b5fc-0089-11ef-a297-92fbcf53809c.png

考慮到OpenAI已經(jīng)知曉了這項研究,后續(xù)或許會看到相應的安全提升?你覺得呢?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3764

    瀏覽量

    52135
  • GPT
    GPT
    +關注

    關注

    0

    文章

    368

    瀏覽量

    16890
  • OpenAI
    +關注

    關注

    9

    文章

    1245

    瀏覽量

    10139

原文標題:GPT-4化身黑客搞破壞,成功率87%!OpenAI要求保密提示詞,網(wǎng)友復現(xiàn)ing

文章出處:【微信號:iotmag,微信公眾號:iotmag】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    IRSM836 - 035MB:小體積大能量的集成功率模塊

    IRSM836 - 035MB:小體積大能量的集成功率模塊 在電子工程師的日常設計中,為小型家電電機驅(qū)動尋找合適的功率模塊是一項常見且關鍵的任務。今天,我們就來深入探討一款名為 IRSM836
    的頭像 發(fā)表于 01-23 17:20 ?764次閱讀

    IRSM836 - 044MA集成功率模塊:小身材大能量,助力家電電機驅(qū)動

    : IRSM836-044MA.pdf 1. 模塊概述 IRSM836 - 044MA是一款專為先進家電電機驅(qū)動應用而設計的4A、250V集成功率模塊,適用于節(jié)能風
    的頭像 發(fā)表于 12-17 16:20 ?457次閱讀

    GPT-5.1發(fā)布 OpenAI開始拼情商

    OpenAI正式上線了 GPT-5.1 Instant 以及 GPT-5.1 Thinking 模型;有網(wǎng)友實測發(fā)現(xiàn)OpenAI新發(fā)布的
    的頭像 發(fā)表于 11-13 15:49 ?720次閱讀

    Vishay SiC544 40A VRPower?集成功率級技術解析與應用指南

    Vishay Semicductors SiC544 40A VRPower^?^ 集成功率級專為大電流、高效率和高功率密度同步降壓應用而設計。Vishay Semiconductors
    的頭像 發(fā)表于 11-13 15:00 ?685次閱讀
    Vishay SiC544 40A VRPower?集<b class='flag-5'>成功率</b>級技術解析與應用指南

    Vishay SiC674A 55A VRPower集成功率級技術解析

    Vishay Semicductors SiC674 55A VRPower^?^ 集成功率級專為同步降壓應用而設計,可提供大電流、高效率和高功率密度,并將關斷電流降至最低。Vishay
    的頭像 發(fā)表于 11-11 10:25 ?554次閱讀
    Vishay SiC674A 55A VRPower集<b class='flag-5'>成功率</b>級技術解析

    功率 ( 23 dBm) 802.11ax 超線性 WLAN 功率放大器,帶集成功率檢測器 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()高功率 ( 23 dBm) 802.11ax 超線性 WLAN 功率放大器,帶集成功率檢測器相關產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有高功率 ( 23 dBm) 802.11
    發(fā)表于 10-16 18:32
    高<b class='flag-5'>功率</b> ( 23 dBm) 802.11ax 超線性 WLAN <b class='flag-5'>功率</b>放大器,帶集<b class='flag-5'>成功率</b>檢測器 skyworksinc

    成功率檢測器的高功率 802.11ac WLAN 功率放大器 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()集成功率檢測器的高功率 802.11ac WLAN 功率放大器相關產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有集成功率檢測器的高功率 8
    發(fā)表于 10-16 18:31
    集<b class='flag-5'>成功率</b>檢測器的高<b class='flag-5'>功率</b> 802.11ac WLAN <b class='flag-5'>功率</b>放大器 skyworksinc

    功率 ( 19 dBm) 802.11ac WLAN 功率放大器,帶集成功率檢測器 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()高功率 ( 19 dBm) 802.11ac WLAN 功率放大器,帶集成功率檢測器相關產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有高功率 ( 19 dBm) 802.11ac W
    發(fā)表于 10-10 18:33
    高<b class='flag-5'>功率</b> ( 19 dBm) 802.11ac WLAN <b class='flag-5'>功率</b>放大器,帶集<b class='flag-5'>成功率</b>檢測器 skyworksinc

    功率 ( 22 dBm) 802.11ac WLAN 功率放大器,帶集成功率檢測器 skyworksinc

    電子發(fā)燒友網(wǎng)為你提供()高功率 ( 22 dBm) 802.11ac WLAN 功率放大器,帶集成功率檢測器相關產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有高功率 ( 22 dBm) 802.11ac W
    發(fā)表于 09-25 18:34
    高<b class='flag-5'>功率</b> ( 22 dBm) 802.11ac WLAN <b class='flag-5'>功率</b>放大器,帶集<b class='flag-5'>成功率</b>檢測器 skyworksinc

    NVIDIA從云到邊緣加速OpenAI gpt-oss模型部署,實現(xiàn)150萬TPS推理

    ? 自 2016 年推出 NVIDIA DGX 以來,NVIDIA 與 OpenAI 便開始共同推動 AI 技術的邊界。此次 OpenAI gpt-oss-20b 和 gpt-oss-
    的頭像 發(fā)表于 08-15 20:34 ?2329次閱讀
    NVIDIA從云到邊緣加速<b class='flag-5'>OpenAI</b> <b class='flag-5'>gpt</b>-oss模型部署,實現(xiàn)150萬TPS推理

    OpenAI或在周五凌晨發(fā)布GPT-5 OpenAI以低價向美國政府提供ChatGPT

    外界一直在期待的OpenAI新一代大語言模型GPT-5或?qū)l(fā)布。據(jù)外媒的報道,GPT-5很可能在周五凌晨發(fā)布。這是OpenAI在2023年的3月份推出自然語言處理模型
    的頭像 發(fā)表于 08-07 14:13 ?1.3w次閱讀

    OpenAI發(fā)布2款開源模型

    o4-mini水平,并且能在高端筆記本上運行。而且還有一個更小的版本,可以在智能手機上應用。 據(jù)悉;OpenAI 此次開源的gpt-oss-120b 總參數(shù)量為 1170 億,激活參數(shù)為 51 億,能夠在
    的頭像 發(fā)表于 08-06 14:25 ?1044次閱讀

    Copilot操作指南(二):使用預置提示管理您自己的“工具”

    “ ?新版本的 Copilot 支持 Prompt 提示的保存、導入及導出。您可以直接調(diào)用常用的提示,結(jié)合與圖紙的交互功能,快速實現(xiàn)一些非常酷的功能。? ” 預置 Prompt
    的頭像 發(fā)表于 07-21 11:15 ?3839次閱讀
    Copilot操作指南(二):使用預置<b class='flag-5'>提示</b><b class='flag-5'>詞</b>管理您自己的“工具”

    GPT-5即將面市 性能遠超GPT-4

    行業(yè)芯事
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2025年06月04日 13:38:23

    保密項目一般用什么網(wǎng)線

    保密要求較高的場合,通常使用以下幾種網(wǎng)線: 一、光纖布線 主要特點:傳輸信息的速率和帶寬高,在規(guī)定的距離內(nèi)支持1GBase-T和10GBase-T,是六類雙絞線速率的4至40倍。線路無電磁輻射
    的頭像 發(fā)表于 03-17 10:07 ?1410次閱讀