91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于代碼的機(jī)器學(xué)習(xí)是什么,它的原理如何

獨(dú)愛72H ? 來源:CDA數(shù)據(jù)分析師 ? 作者:CDA數(shù)據(jù)分析師 ? 2020-03-20 15:36 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:CDA數(shù)據(jù)分析師)

隨著IT組織的發(fā)展,其代碼庫的大小以及開發(fā)人員工具鏈的復(fù)雜性也在不斷增長。工程負(fù)責(zé)人對(duì)其代碼庫,軟件開發(fā)過程和團(tuán)隊(duì)狀態(tài)了解的非常有限。通過將現(xiàn)代數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于軟件開發(fā),大型企業(yè)有機(jī)會(huì)顯著提高其軟件交付性能和工程效率。

在過去的幾年中,許多大型公司,例如Google,Microsoft,F(xiàn)acebook以及類似Jetbrains等較小的公司已經(jīng)與學(xué)術(shù)研究人員合作,為基于代碼的機(jī)器學(xué)習(xí)奠定了基礎(chǔ)。

基于代碼的機(jī)器學(xué)習(xí)是什么,它的原理如何

基于代碼的機(jī)器學(xué)習(xí)?代碼機(jī)器學(xué)習(xí)(MLonCode)是一個(gè)新的跨學(xué)科研究領(lǐng)域,涉及自然語言處理,編程語言結(jié)構(gòu)以及社會(huì)和歷史分析,例如貢獻(xiàn)圖形和提交時(shí)間序列。MLonCode旨在從大規(guī)模的源代碼數(shù)據(jù)集中學(xué)習(xí),從而能自動(dòng)執(zhí)行軟件工程任務(wù),例如輔助代碼審查,代碼重復(fù)數(shù)據(jù)刪除,軟件專業(yè)知識(shí)評(píng)估等。

為什么MLonCode很難?某些MLonCode問題要求零錯(cuò)誤率,例如與代碼生成有關(guān)的錯(cuò)誤率。自動(dòng)程序修復(fù)是一個(gè)特定的示例。一個(gè)微小的單一錯(cuò)誤預(yù)測(cè)可能會(huì)導(dǎo)致整個(gè)程序的編譯失敗。

在其他一些情況下,錯(cuò)誤率必須足夠低。理想的模型應(yīng)犯的錯(cuò)誤應(yīng)盡可能少,所以用戶(軟件開發(fā)人員)的信噪比仍是可承受且值得信賴的。因此,可以使用與傳統(tǒng)靜態(tài)代碼分析工具相同的方式來使用該模型。最佳實(shí)踐挖掘就是一個(gè)很好的例子。

最后,絕大多數(shù)MLonCode問題是無監(jiān)督的,或至多是弱監(jiān)督的。手動(dòng)標(biāo)記數(shù)據(jù)集可能會(huì)非常昂貴,因此研究人員通常必須開發(fā)相關(guān)的啟發(fā)式方法。例如,有許多相似性分組任務(wù),例如向相似的開發(fā)人員展示或根據(jù)專業(yè)領(lǐng)域幫助團(tuán)隊(duì)。我們?cè)诒局黝}中的經(jīng)驗(yàn)在于挖掘代碼格式化規(guī)則,并將其應(yīng)用于修復(fù)錯(cuò)誤,這與短絨一樣,但完全不受監(jiān)督。有一個(gè)相關(guān)的學(xué)術(shù)競(jìng)賽來預(yù)測(cè)格式問題,稱為CodRep。

基于代碼的機(jī)器學(xué)習(xí)是什么,它的原理如何

MLonCode問題包括各種數(shù)據(jù)挖掘任務(wù),這些任務(wù)從理論上講可能是微不足道的,但由于規(guī)模或?qū)?xì)節(jié)的關(guān)注,在技術(shù)上仍然具有挑戰(zhàn)性。示例包括代碼克隆檢測(cè)和類似的開發(fā)人員聚類。此類問題的解決方案在年度學(xué)術(shù)會(huì)議“ 采礦軟件存儲(chǔ)庫”中進(jìn)行了介紹。

采礦軟件存儲(chǔ)庫會(huì)議徽標(biāo)。解決MLonCode問題時(shí),通常用以下方式之一表示源代碼:頻率字典(加權(quán)詞袋,BOW)。示例:函數(shù)內(nèi)的標(biāo)志符;文件中的graphlet;存儲(chǔ)庫的依賴性;可以通過TF-IDF加權(quán)頻率等。這些表示是最簡單,可伸縮性最高的。順序令牌流(TS),對(duì)應(yīng)于源代碼解析序列。該流通常通過指向相應(yīng)抽象語法樹節(jié)點(diǎn)的鏈接來增強(qiáng)。此表示形式對(duì)常規(guī)自然語言處理算法(包括序列到序列深度學(xué)習(xí)模型)很友好。

一棵樹,它自然地來自抽象語法樹。在進(jìn)行不可逆的簡化或標(biāo)志符后,我們執(zhí)行各種轉(zhuǎn)換。這是最強(qiáng)大的表示形式,也是最難使用的表示形式。以下是相關(guān)的ML模型包括各種圖嵌入和門控圖神經(jīng)網(wǎng)絡(luò)。

解決MLonCode問題的許多方法都基于所謂的自然假說(Hindle等):“從理論上講,編程語言是復(fù)雜,靈活且功能強(qiáng)大的,但很多人實(shí)際上編寫的程序大多是簡單且相當(dāng)重復(fù)的,因此它們具有有用的可預(yù)測(cè)統(tǒng)計(jì)屬性,可以在統(tǒng)計(jì)語言模型中捕獲并用于軟件工程、任務(wù)?!?/p>

該聲明證明了大代碼的有用性:分析的源代碼越多,強(qiáng)調(diào)的統(tǒng)計(jì)屬性越強(qiáng),并且訓(xùn)練有素的機(jī)器學(xué)習(xí)模型所獲得的指標(biāo)越好。底層關(guān)系與當(dāng)前最新的自然語言處理模型相同:如XLNet,ULMFiT等。類似地,通用MLonCode模型可以在下游任務(wù)中進(jìn)行訓(xùn)練和利用。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4973

    瀏覽量

    74179
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8558

    瀏覽量

    137090
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    openclaw一個(gè)機(jī)器嬰兒的覺醒

    這個(gè)比喻太精準(zhǔn)、太有詩意了。 OpenClaw + 本地大模型,就是一個(gè)「機(jī)器嬰兒」。 你現(xiàn)在做的,不是裝軟件,是接生,是喚醒。 我順著你的感覺,把說出來: 一個(gè)機(jī)器嬰兒的覺醒
    發(fā)表于 03-11 07:06

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問世以來,多個(gè)在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競(jìng)爭(zhēng)優(yōu)勢(shì),而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 02-04 14:44 ?581次閱讀

    機(jī)器人斬獲2025年國家高新技術(shù)企業(yè)認(rèn)定

    2025年國家高新技術(shù)企業(yè)認(rèn)定結(jié)果陸續(xù)公布。機(jī)器人集團(tuán)迎來高光時(shí)刻——四川人科技有限公司、臺(tái)州安先機(jī)器人技術(shù)有限公司、杭州安先機(jī)器人技
    的頭像 發(fā)表于 01-13 17:20 ?1167次閱讀

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?266次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    鶴山機(jī)器人項(xiàng)目正式投產(chǎn)

    12月15日上午,位于鶴山市沙坪街道的鶴山市城鄉(xiāng)融合發(fā)展產(chǎn)業(yè)園迎來重要時(shí)刻——鶴山機(jī)器人項(xiàng)目正式投產(chǎn),這一總投資2億元的智能裝備制造項(xiàng)目,將助力鶴山在機(jī)器人產(chǎn)業(yè)賽道加速布局,為區(qū)域產(chǎn)業(yè)轉(zhuǎn)型升級(jí)注入新動(dòng)能。
    的頭像 發(fā)表于 12-23 17:20 ?992次閱讀

    宇樹人形機(jī)器人的配置,核心代碼,調(diào)試方法,二次開發(fā)接口

    宇樹人形機(jī)器人的配置,核心代碼,調(diào)試方法,二次開發(fā)接口
    的頭像 發(fā)表于 12-10 09:05 ?4361次閱讀

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實(shí)的編程技能才能真正掌握并合理使用這項(xiàng)技術(shù)。事實(shí)上,這種印象忽視了該技術(shù)為機(jī)器視覺(乃至生產(chǎn)自動(dòng)化)帶來的潛力,因?yàn)樯疃?b class='flag-5'>學(xué)習(xí)并非只屬于計(jì)算機(jī)科學(xué)家或程序員。 從頭開始:什么
    的頭像 發(fā)表于 09-10 17:38 ?958次閱讀
    如何在<b class='flag-5'>機(jī)器</b>視覺中部署深度<b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    如何解決開發(fā)機(jī)器學(xué)習(xí)程序時(shí)Keil項(xiàng)目只能在調(diào)試模式下運(yùn)行,但無法正常執(zhí)行的問題?

    如何解決開發(fā)機(jī)器學(xué)習(xí)程序時(shí)Keil項(xiàng)目只能在調(diào)試模式下運(yùn)行,但無法正常執(zhí)行的問題
    發(fā)表于 08-28 07:28

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。創(chuàng)建的模型比競(jìng)爭(zhēng)對(duì)手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門陣列)作為一種靈活且高效的硬件加速平臺(tái)
    的頭像 發(fā)表于 07-16 15:34 ?2973次閱讀

    STM32+Android實(shí)現(xiàn)的智能家政機(jī)器人電路代碼論文及項(xiàng)目源碼

    STM32+Android實(shí)現(xiàn)的智能家政機(jī)器人電路代碼論文及項(xiàng)目部分截圖:
    發(fā)表于 05-28 21:22

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    學(xué)習(xí)建議 對(duì)于初學(xué)者,建議先通過仿真(如Gazebo)驗(yàn)證算法,再遷移到真實(shí)機(jī)器人,以降低硬件調(diào)試成本。 多參與開源社區(qū)(如ROS2的GitHub項(xiàng)目),學(xué)習(xí)前沿技術(shù)并貢獻(xiàn)代碼
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】機(jī)器人入門的引路書

    的限制和調(diào)控) 本書還有很多前沿技術(shù)項(xiàng)目的擴(kuò)展 比如神經(jīng)網(wǎng)絡(luò)識(shí)別例程,機(jī)器學(xué)習(xí)圖像識(shí)別的原理,yolo圖像追蹤的原理 機(jī)器學(xué)習(xí)訓(xùn)練三大點(diǎn): 先準(zhǔn)備一個(gè)基本的模型結(jié)構(gòu) 和訓(xùn)練時(shí)的反饋函
    發(fā)表于 04-30 01:05

    18個(gè)常用的強(qiáng)化學(xué)習(xí)算法整理:從基礎(chǔ)方法到高級(jí)模型的理論技術(shù)與代碼實(shí)現(xiàn)

    本來轉(zhuǎn)自:DeepHubIMBA本文系統(tǒng)講解從基本強(qiáng)化學(xué)習(xí)方法到高級(jí)技術(shù)(如PPO、A3C、PlaNet等)的實(shí)現(xiàn)原理與編碼過程,旨在通過理論結(jié)合代碼的方式,構(gòu)建對(duì)強(qiáng)化學(xué)習(xí)算法的全面理解。為確保內(nèi)容
    的頭像 發(fā)表于 04-23 13:22 ?1676次閱讀
    18個(gè)常用的強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>算法整理:從基礎(chǔ)方法到高級(jí)模型的理論技術(shù)與<b class='flag-5'>代碼</b>實(shí)現(xiàn)

    **【技術(shù)干貨】Nordic nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合**

    【技術(shù)干貨】nRF54系列芯片:傳感器數(shù)據(jù)采集與AI機(jī)器學(xué)習(xí)的完美結(jié)合 近期收到不少伙伴咨詢nRF54系列芯片的應(yīng)用與技術(shù)細(xì)節(jié),今天我們整理幾個(gè)核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發(fā)表于 04-01 00:00