91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

第二屆大會回顧第12期 | ClarifyGPT: 基于交互式需求澄清的大模型代碼生成框架

OpenHarmony TSC ? 來源:OpenHarmony TSC ? 作者:OpenHarmony TSC ? 2024-02-25 17:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

演講嘉賓 | 石 琳

回顧整理 | 廖 濤

排版校對 | 李萍萍

嘉賓介紹

開發(fā)者工具分論壇

石琳,北京航空航天大學(xué)軟件學(xué)院教授,CCF高級會員,2022年度中國科學(xué)院軟件研究所杰出青年科技人才。研究方向為智能軟件工程,包括代碼智能、智能需求工程、經(jīng)驗軟件工程、開源軟件、可信AI等。曾在軟件工程、人工智能領(lǐng)域的高水平國際會議發(fā)表論文50余篇,三次獲得杰出論文獎;主持參與多項國家自然科學(xué)基金項目、國家重點研發(fā)項目等;擔(dān)任多個國際知名會議期刊審稿人。

視頻回顧

打開嗶哩嗶哩APP,觀看更清晰視頻

正文內(nèi)容

隨著AI大模型能力的大幅提升,軟件開發(fā)已經(jīng)逐步走向新智能化時代。然而,目前代碼大模型在可靠性、隱私和合規(guī)以及用戶意圖識別等方面仍存在一定局限性。如何基于交互式需求澄清方法,讓大模型更好地理解用戶意圖,并給出更準(zhǔn)確的答案?北京航空航天大學(xué)教授石琳在第二屆OpenHarmony技術(shù)大會上進行了精彩分享。

72dbb404-cf89-11ee-b759-92fbcf53809c.png

2022年11月,OpenAI發(fā)布ChatGPT,利用GitHub數(shù)據(jù)與RLFH強化學(xué)習(xí)技術(shù),在輔助編程取得進展;2023年1月,微軟Copilot平臺用戶超過1億,CEO表示Copilot很快就會替代程序員完成80%的代碼開發(fā)。在GitHub的報告中,使用Copilot的開發(fā)者的開發(fā)效率幾乎提升了一倍,一個用Copilot的初學(xué)者就能夠像專業(yè)程序員一樣,從零開始開發(fā)出最小可行產(chǎn)品程序。此外,清華大學(xué)推出的ChatDev項目,支持多個智能體分工合作,能夠根據(jù)用戶指令生成休閑小游戲、效率管理工具、繪畫板、數(shù)學(xué)計算器、網(wǎng)絡(luò)爬蟲等軟件。

通過前文可知,代碼大模型在軟件開發(fā)方面“一鳴驚人”,給開發(fā)者們帶來了極大的便利。但是,代碼大模型的快速發(fā)展同時也帶來了新的問題,如:

模型問題:可靠性、幻覺、更新、形式重于內(nèi)容

數(shù)據(jù)問題:數(shù)據(jù)演化、質(zhì)量問題、安全問題、隱私和合規(guī)

應(yīng)用問題:用戶意圖不明確、復(fù)雜問題抽象和分解、項目上下文、領(lǐng)域?qū)I(yè)知識、遺留系統(tǒng)維護

7302e79a-cf89-11ee-b759-92fbcf53809c.png

其中,用戶的意圖表述不明確是代碼大模型在實踐中遇到的巨大阻礙。開發(fā)者想寫出一個清晰明確且全面的Prompt并不容易。既然開發(fā)者寫的Prompt不清晰,有沒有辦法讓大模型幫開發(fā)者改寫?目前,業(yè)界已經(jīng)有一些嘗試,例如GPT Engineer。GPT Engineer是一個基于需求描述自動生成項目源碼的開源項目,主打輕量,靈活生成項目源碼,可以在AI生成與人工生成之間進行切換。在接收到Prompt時,GPT Engineer不會直接生成代碼,而是先梳理有哪些事項需要用戶進一步澄清,然后讓用戶把需要澄清的事項輸入后,再進一步生成代碼。然而,GPT Engineer經(jīng)常會問一些在Prompt中已經(jīng)提供了答案的問題,對用戶造成困擾。

如何找到Prompt中“不清楚”的地方,從而進行精準(zhǔn)提問?石琳教授所在團隊提出了ClarifyGPT工具。ClarifyGPT會先識別是否應(yīng)該提問,再利用大模型生成問題。

ClarifyGPT的模塊1:基于測試結(jié)果的代碼多樣性評價模塊

如何判斷是否應(yīng)該向用戶做Prompt澄清呢?這里我們從代碼大模型的輸出結(jié)果出發(fā),提出一個基本假設(shè):如果Prompt清晰,大模型生成的代碼應(yīng)該行為一致;如果Prompt模糊,大模型生成的代碼可能五花八門。因此,ClarifyGPT會先通過種子輸入進行代碼多樣性測試,并基于測試結(jié)果判斷是否要做向用戶做Prompt的澄清。

具體而言,(1)先進行種子測試輸入初始化。構(gòu)建prompt用于生成種子輸入,Prompt包含三部分:Instruction,Demonstrations,Query。將Prompt輸入LLM中生成一些測試輸入,并用它們初始化一個種子池;(2)再進行類型感知的測試輸入變異(采用了標(biāo)準(zhǔn)的基于變異的模糊流程)。在每次迭代時,從種子池中隨機選擇一個輸入;對于選定的輸入,我們檢查其數(shù)據(jù)類型并執(zhí)行與其類型一致的單個變異操作以創(chuàng)建新的測試用例;完成一輪突變后,我們將新生成的輸入添加到種子池中,并重復(fù)上述過程,直到獲得所需的生成輸入數(shù)量。

7318fa44-cf89-11ee-b759-92fbcf53809c.png

ClarifyGPT的模塊2:基于推理的LLM問題生成模塊

在確定了需要向用戶做Prompt澄清后,應(yīng)該問什么內(nèi)容呢?為了解決這個以問題,ClarifyGPT會進一步分析代碼的細(xì)節(jié)差異,區(qū)分不一致的代碼,比較solution的不同點,再基于推理進行LLM問題生成。

具體而言,首先生成中間推理步驟(分析導(dǎo)致歧義的因素),然后基于這些中間推理步驟產(chǎn)生最終結(jié)果(有針對性的澄清問題)。此外,ClarifyGPT鼓勵LLM進行“超前規(guī)劃”,使他們能夠更好地利用他們的推理和理解能力來提高生成問題的質(zhì)量。

73279cca-cf89-11ee-b759-92fbcf53809c.png

經(jīng)過評測,ClarifyGPT將GPT-4在MBPP-sanitized上的表現(xiàn)(Pass@1)從70.96%提高到80.8%;將MBPP-ET的性能從51.52%提高到60.19%。相對改善平均為15.35%,優(yōu)于基線。且增加Prompt中示例的數(shù)量會帶來ClarifyGPT性能提升。

ClarifyGPT是一個交互式代碼生成框架,會引導(dǎo)用戶先澄清意圖,再利用大模型幫助用戶生成代碼。后續(xù),ClarifyGPT也會在其他生成類任務(wù)上進行進一步的研究和探索。

大模型加速了研發(fā)人員的工作效率,但同時也提出了新的挑戰(zhàn)。我們必須大膽嘗試LLM在改進軟件開發(fā)方面的潛力,但同時也要謹(jǐn)慎行事,不要忘記工程思維、嚴(yán)謹(jǐn)性和經(jīng)驗驗證的基本原則。 【材料分享】 [1] 論文原文下載 http://arxiv.org/abs/2310.10996 [2] 開源原型工具 https://github.com/ClarifyGPT/ClarifyGPT(點擊閱讀原文可跳轉(zhuǎn))

E N D

關(guān)注我們,獲取更多精彩。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    40115

    瀏覽量

    301743
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4971

    瀏覽量

    74069
  • OpenHarmony
    +關(guān)注

    關(guān)注

    33

    文章

    3960

    瀏覽量

    21168
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3677

    瀏覽量

    5201
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Faraday Future即將參加Cantor第二屆全球科技與工業(yè)增長大會

    “公司”)今日宣布,公司將參加Cantor 第二屆全球科技與工業(yè)增長大會(Cantor Global Technology & Industrial Growth Conference)。本次大會
    的頭像 發(fā)表于 03-11 14:42 ?232次閱讀

    普強榮登畢馬威第二屆智能制造科技50榜單

    普強榮登畢馬威“第二屆智能制造科技50"榜單,憑借深厚的技術(shù)沉淀、創(chuàng)新實踐及行業(yè)影響力,成功躋身榜單,與眾多優(yōu)秀企業(yè)共同彰顯中國制造的強勁活力。
    的頭像 發(fā)表于 02-28 15:28 ?898次閱讀

    導(dǎo)遠(yuǎn)科技入選畢馬威第二屆智能制造科技50榜單

    1月16日,畢馬威發(fā)布《第二屆智能制造科技50》報告,并公開“未來行業(yè)50榜單——智能制造科技50榜單”。導(dǎo)遠(yuǎn)科技憑借卓越的智能制造能力,連續(xù)兩年蟬聯(lián)該榜單。
    的頭像 發(fā)表于 01-22 13:40 ?367次閱讀

    沐曦受邀出席第二屆開源產(chǎn)業(yè)生態(tài)大會

    以“開源筑基·數(shù)實維新”為主題的第二屆開源產(chǎn)業(yè)生態(tài)大會將于1月13日在上海舉行。沐曦受邀出席本次行業(yè)盛會,聯(lián)合創(chuàng)始人、CTO兼首席軟件架構(gòu)師楊建將發(fā)表主題演講并參與圓桌論壇環(huán)節(jié),分享沐曦在開源生態(tài)體系建設(shè)方面的實踐經(jīng)驗與思考的同時,共探開源生態(tài)賦能可持續(xù)發(fā)展的路徑。
    的頭像 發(fā)表于 01-14 13:51 ?330次閱讀

    見合八方亮相第二屆分布光纖傳感技術(shù)及應(yīng)用大會

    2025年11月22日至23日,第二屆分布光纖傳感技術(shù)及應(yīng)用大會(DOFS2025)在珠海圓滿舉辦,大會以“學(xué)術(shù)引領(lǐng)·技術(shù)破壁”為使命,聚焦“從實驗室到產(chǎn)業(yè)閉環(huán)”核心命題,匯聚全球頂
    的頭像 發(fā)表于 11-30 14:17 ?617次閱讀

    云天勵飛出席湛江市第二屆企業(yè)家大會

    近日,湛江市第二屆企業(yè)家大會隆重舉行。本屆大會以“聚合力 興產(chǎn)業(yè) 謀發(fā)展 創(chuàng)未來”為主題,吸引了央企、國企、外企、民企、僑商以及在外創(chuàng)業(yè)的湛江籍企業(yè)家齊聚湛江,共同探討城市高質(zhì)量發(fā)展的新路徑。湛江市委書記余鋼出席
    的頭像 發(fā)表于 11-25 11:25 ?755次閱讀

    夢芯科技出席第二屆中國測繪地理信息大會主題論壇

    11月5-7日,以“科技融智創(chuàng)新,產(chǎn)業(yè)新質(zhì)發(fā)展,北斗服務(wù)全球”為主題的第二屆中國測繪地理信息大會在浙江湖州德清舉行。大會圍繞地理信息產(chǎn)業(yè)新質(zhì)發(fā)展、北斗導(dǎo)航系統(tǒng)全球應(yīng)用和測繪地理信息科技創(chuàng)新開展深入交流。
    的頭像 發(fā)表于 11-11 16:40 ?657次閱讀

    南方測繪亮相第二屆中國測繪地理信息大會

    11月6日,第二屆中國測繪地理信息大會在浙江省湖州市的德清國際展覽中心開幕。本屆大會由中國地理信息產(chǎn)業(yè)協(xié)會、中國測繪學(xué)會、中國衛(wèi)星導(dǎo)航定位協(xié)會共同主辦。
    的頭像 發(fā)表于 11-11 16:12 ?1071次閱讀

    北斗星通亮相第二屆中國測繪地理信息大會

    11月6日,第二屆中國測繪地理信息大會在浙江德清盛大開幕。本屆大會以“科技融智創(chuàng)新 產(chǎn)業(yè)新質(zhì)發(fā)展 北斗服務(wù)全球”為主題,旨在進一步打造測繪地理信息行業(yè)大會品牌,助力測繪地理信息科技創(chuàng)新
    的頭像 發(fā)表于 11-06 17:46 ?1313次閱讀

    易靈思與思特威第二屆機器視覺方案大會圓滿收官

    近日,由易靈思與思特威聯(lián)合舉辦的第二屆機器視覺方案大會在深圳福田會展中心成功舉行。本次大會以技術(shù)驅(qū)動與應(yīng)用落地為核心,匯聚了行業(yè)專家、合作伙伴與資深工程師,共同探討了機器視覺領(lǐng)域的前沿技術(shù)與未來趨勢。
    的頭像 發(fā)表于 09-02 12:51 ?941次閱讀

    第二屆Vector中國技術(shù)日即將舉辦

    第二屆Vector中國技術(shù)日將于9月16日-17日在上海國家會展中心舉辦。
    的頭像 發(fā)表于 08-21 11:30 ?1103次閱讀

    龍芯中科亮相第二屆算力之都開發(fā)者大會

    近日,以“開源·開放 融合·服務(wù)”為主題的第二屆算力之都開發(fā)者大會暨天翼云AI生態(tài)合作大會在銀川召開。大會由中國電信寧夏公司攜手龍芯中科等業(yè)界領(lǐng)軍企業(yè)與頂尖科研院所共同主辦,旨在深度激
    的頭像 發(fā)表于 08-16 13:52 ?1654次閱讀

    海格通信亮相第二屆中國移動產(chǎn)業(yè)投資生態(tài)合作大會

    2025年7月9日,第二屆中國移動產(chǎn)業(yè)投資生態(tài)合作大會在四川成都召開。中國移動與參股及投資生態(tài)企業(yè)、投資機構(gòu)齊聚探討產(chǎn)業(yè)投資趨勢,共謀產(chǎn)業(yè)合作發(fā)展。
    的頭像 發(fā)表于 07-09 18:18 ?1889次閱讀

    主線科技亮相第二屆中國具身智能大會

    此前,2025年3月29日至30日,由中國人工智能學(xué)會(以下簡稱CAAI)主辦的第二屆中國具身智能大會(CEAI 2025)在北京召開。
    的頭像 發(fā)表于 04-01 17:48 ?1034次閱讀

    華為智能光伏第二屆全球安裝商大會圓滿落幕

    近日,華為智能光伏第二屆全球安裝商大會在中國深圳&東莞盛大召開。來自歐洲、亞太、拉美等全球各地的500多位伙伴和安裝商齊聚一堂,圍繞智能光伏產(chǎn)業(yè)趨勢、安裝商戰(zhàn)略、前沿的戶用和工商業(yè)解決方案、安裝商拓展成功案例以及營銷策略等議題展開精彩而熱烈的探討。
    的頭像 發(fā)表于 03-28 16:42 ?1153次閱讀