91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

互聯(lián)網(wǎng)反欺詐問題提出的必要性及重要性、通用技術(shù)手段及應用場景

芯盾時代 ? 來源:芯盾時代 ? 作者:芯盾時代 ? 2020-09-25 14:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI加持下的互聯(lián)網(wǎng)反欺詐
本文將從問題提出的必要性及重要性、通用技術(shù)手段及應用場景角度,對專家經(jīng)驗規(guī)則自學習機制,風評模型可解釋性問題作系統(tǒng)全面的介紹,歡迎大家討論交流。

01

專家經(jīng)驗規(guī)則自學習機制

在大數(shù)據(jù)時代背景下,金融犯罪和金融欺詐的新手段層出不窮,日漸趨于科技化、專業(yè)化、規(guī)?;?,也更具有隱蔽性,由過去的單兵作戰(zhàn)演變成有規(guī)模、有組織的團伙欺詐,嚴重制約了傳統(tǒng)的專家知識庫、專家經(jīng)驗規(guī)則持續(xù)有效地發(fā)揮作用,亟需解決兩方面問題:

基于數(shù)據(jù)算法驅(qū)動,自動化調(diào)整的場景規(guī)則集中的閾值和權(quán)重,以保障規(guī)則持續(xù)有效性;

從不同維度發(fā)掘時效性強的新風控規(guī)則,以持續(xù)豐富完善反欺詐規(guī)則集。

規(guī)則閾值、權(quán)重

規(guī)則閾值、權(quán)重學習涉及特征離散化、特征選擇、特征降維、權(quán)重參數(shù)回歸等流程。

信息熵:用來評估樣本集合的純度的一個參數(shù),是系統(tǒng)的不確定性、隨機性度量指標。

卡方分箱原理:特征離散化算法,根據(jù)樣本數(shù)據(jù)推斷總體的分布與期望分布是否有顯著性差異, 或者推斷兩個分類變量是否相關(guān)或者獨立。

最小熵分箱:特征離散化算法,最小熵分箱是典型的自頂向下分箱方法。最小熵分箱將待分箱特征的所有取值都放到一個箱體里,然后依據(jù)最小熵原則進行箱體分裂。

基尼(gini)系數(shù):特征離散化算法,總體內(nèi)部包含越混亂,基尼系數(shù)越大;內(nèi)部純度越高,基尼系數(shù)越小。

特征選擇:特征選擇在于選取對訓練數(shù)據(jù)具有分類能力的特征,提升模型整體預測能力,常用到技術(shù)包括lasso回歸、Feature Importance、特征共線性驗證等。

Lasso回歸:使用少量觀測值就能夠完全恢復出非零的系數(shù)。其中不同的是,樣本的數(shù)量需要“足夠大”,否則L1模型的表現(xiàn)會充滿隨機性。

新風控規(guī)則

新欺詐規(guī)則挖掘,根據(jù)規(guī)則中所處理的值類型分為兩類:

如果規(guī)則考慮的關(guān)聯(lián)是項的存在與不存在,則它是布爾關(guān)聯(lián)規(guī)則;

如果規(guī)則描述的是量化的項或?qū)傩灾g的關(guān)聯(lián),則它是量化關(guān)聯(lián)規(guī)則。

本質(zhì)是頻繁項集挖掘,常用到算法包括Apriori、FpGrowth。

Apriori算法利用頻繁集的兩個特性,過濾了很多無關(guān)的集合,效率提高不少,但是Apriori算法是一個候選消除算法,每一次消除都需要掃描一次所有數(shù)據(jù)記錄,造成整個算法在面臨大數(shù)據(jù)集時顯得無能為力。

FpGrowth算法通過構(gòu)造一個樹結(jié)構(gòu)來壓縮數(shù)據(jù)記錄,使得挖掘頻繁項集只需要掃描兩次數(shù)據(jù)記錄,而且該算法不需要生成候選集合,所以效率會比較高。

02

風評模型可解釋性問題

人工智能算法模型正在對金融行業(yè)產(chǎn)生重大影響,前提是要了解AI算法的優(yōu)勢和局限性,以及適合在金融領(lǐng)域發(fā)揮作用的場景。當我們在金融業(yè)務中使用AI算法,期望通過可度量的方法對模型結(jié)果進行分析、解釋,以期對算法進行優(yōu)化,對業(yè)務進行方向性的指導,確保模型與要解決的業(yè)務問題保持一致,即模型解釋性分析問題。模型的解釋性分析可幫助模型開發(fā)人員及業(yè)務運營人員了解并解釋模型中包含和未包含的特征因素,及特征如何影響模型結(jié)果。

廣義上,模型的解釋性分析目的是全局定義特征對模型的影響,同時定義單個特征對模型的個性化影響;更好的理解模型行為,更好的進行相應的業(yè)務決策;通常對機器學習模型分為“白盒”模型和“黑盒”模型:

“白盒”模型

“白盒”模型如線性、Logistic回歸模型,預測能力較弱,但是簡單易理解。線性關(guān)系如信貸欺詐與人口統(tǒng)計學特征、經(jīng)濟收入等的相關(guān)性。決策樹模型(RandomForest vs XGBoost vs LightGBM)是目前業(yè)內(nèi)公認可解釋性較好的非線性機器學習算法,模型每作出一個決策都會通過一個決策序列來向我們展示模型的決策依據(jù),決策樹模型自帶的基于信息理論的篩選變量標準也有助于幫助我們理解在模型決策產(chǎn)生的過程中哪些變量起到了顯著的作用;白盒模型特征明確,邏輯簡單,本身具備可解釋性。

針對“白盒”模型,我們可以從數(shù)據(jù)分布圖、特征重要度、Embedding可視化、獨立特征分析(PDP)、全局性分析(SHAP)、局部特征信息(LIME)、特征相關(guān)性(相關(guān)系數(shù))等維度提供分析技術(shù)。

特征重要度:從兩個角度分析“特征收益重要性”和“特征分裂重要性”;特征收益重要性指特征分類的平均訓練損失的減少量,意味著相應的特征對模型的相對貢獻值;特征分裂重要性是指訓練樣本決策分裂的次數(shù),兩者從不同維度度量不同特征在模型訓練中的重要性。

獨立特征分析:我們通過特征重要度得知某個特征對模型的影響度,以及用SHAP來評估全局特征重要性;但如何評估某個單獨的特征,嘗試通過PDP來評估獨立特征,展示單個特征對于模型預測的邊際效益,單個特征是如何影響預測的,通過繪制特征和預測目標之間的一維關(guān)系圖或二維關(guān)系圖來了解特征與目標之間的關(guān)系。多個特征的復雜性,通過單個特征分析,進一步驗證單個特征對模型的影響度。

“黑盒”模型

“黑盒”模型使用復雜的機器學習算法(深度網(wǎng)絡學習)訓練數(shù)據(jù),輸入特征經(jīng)過組合變換,維度變換等特征工程步驟,需要分析及調(diào)整數(shù)據(jù)與模型,確保模型結(jié)果與要解決的問題保持一致;然而這些模型的內(nèi)部機制難以理解,也無法估計每個特征對模型預測結(jié)果的重要性以解釋模型結(jié)果與輸入的特征屬性潛在的關(guān)聯(lián)關(guān)系,更無法直接理解不同特征之間如何相互工作(數(shù)據(jù)的相關(guān)性不等價于因果關(guān)系)。

針對“黑盒”模型,我們可以從深度網(wǎng)絡結(jié)構(gòu)分析,風評結(jié)果命中團伙關(guān)聯(lián)圖譜角度去解釋模型有效性。

關(guān)聯(lián)圖譜提供豐富的圖構(gòu)建、圖查詢、圖分析、圖嵌入、圖挖掘技術(shù),通過社區(qū)檢測、關(guān)鍵節(jié)點分析、關(guān)聯(lián)分析、異常網(wǎng)絡結(jié)構(gòu)發(fā)現(xiàn)等場景化算法和模型,提供風控和營銷等場景化輔助決策服務。如信用卡養(yǎng)卡套現(xiàn)識別,養(yǎng)卡套現(xiàn)團伙往往都與黑商戶溝通,正常養(yǎng)卡階段,消費的商戶相對固定,而通過遍歷關(guān)聯(lián)圖譜的方式,能夠基于上述行為特征建立欺詐關(guān)聯(lián)圖譜,識別養(yǎng)卡套現(xiàn)團伙。

風控場景對于數(shù)據(jù)、模型、特征的可解釋性,穩(wěn)定性要求是重點,可解釋性和穩(wěn)定性仍然需要結(jié)合業(yè)務和專家經(jīng)驗進行判斷。
責任編輯:xj

原文標題:AI加持下的互聯(lián)網(wǎng)反欺詐 | 反欺詐AI全域治理三部曲(中)

文章出處:【微信公眾號:芯盾時代】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    55

    文章

    11337

    瀏覽量

    109962
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39805

    瀏覽量

    301479

原文標題:AI加持下的互聯(lián)網(wǎng)反欺詐 | 反欺詐AI全域治理三部曲(中)

文章出處:【微信號:trusfort,微信公眾號:芯盾時代】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    嵌入式軟件單元測試必要性與專業(yè)工具重要性的系統(tǒng)專業(yè)研究報告

    。?單元測試?作為在代碼編寫階段對最小功能單元(函數(shù)、模塊)進行驗證的實踐,成為突破這一困境的核心手段。 ?2. 必要性:實證數(shù)據(jù)與行業(yè)強制要求 ?2.1 缺陷修復成本的指數(shù)級差異 表格 階段 缺陷修復成本
    發(fā)表于 03-05 10:41

    國產(chǎn)工控主板與工業(yè)互聯(lián)網(wǎng)的核心關(guān)聯(lián)

    工業(yè)互聯(lián)網(wǎng)指的是新一代信息通信技術(shù)與傳統(tǒng)工業(yè)的深度融合,通過物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)等現(xiàn)代信息技術(shù)手段,實現(xiàn)工業(yè)系統(tǒng)的智能化和優(yōu)化升級。
    的頭像 發(fā)表于 02-10 09:46 ?142次閱讀

    電機線圈絕緣處理的必要性分析

    。本文將深入剖析電機線圈絕緣處理的必要性,從材料特性、工藝原理到實際應用場景,系統(tǒng)闡述這一看似簡單卻蘊含復雜技術(shù)內(nèi)涵的環(huán)節(jié)如何成為電機可靠的守護屏障。 一、絕緣失效的代價 從微觀損傷
    的頭像 發(fā)表于 01-22 17:42 ?1169次閱讀
    電機線圈絕緣處理的<b class='flag-5'>必要性</b>分析

    電纜隧道在線監(jiān)測的必要性

    電纜隧道在線監(jiān)測是一種通過多維度感知、高效傳輸、智能分析與自動化決策,來構(gòu)建針對電纜隧道“預防-監(jiān)測-響應-優(yōu)化”全鏈條管理體系的一種技術(shù)手段。這不僅是保障電力供應安全的核心手段,更是推動電網(wǎng)智能化
    的頭像 發(fā)表于 12-31 14:24 ?202次閱讀
    電纜隧道在線監(jiān)測的<b class='flag-5'>必要性</b>

    藍牙網(wǎng)關(guān)是什么?都有哪些功能?應用場景有哪些?

    在物聯(lián)網(wǎng)技術(shù)飛速迭代的今天,藍牙網(wǎng)關(guān)作為連接海量藍牙智能設備與互聯(lián)網(wǎng)的關(guān)鍵樞紐,正憑借低功耗、高兼容、靈活部署的優(yōu)勢,深度滲透到工業(yè)生產(chǎn)、健康醫(yī)療等多個領(lǐng)域。它不僅解決了藍牙設備“局域網(wǎng)局限”的痛
    發(fā)表于 12-11 15:21

    Lora基站在物聯(lián)網(wǎng)應用的重要性

    對物聯(lián)網(wǎng)設備的遠程監(jiān)測和控制,提供可靠的網(wǎng)絡連接和管理,保障物聯(lián)網(wǎng)設備的數(shù)據(jù)安全。隨著物聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,Lora基站的作用將越來越重要,為物聯(lián)網(wǎng)
    發(fā)表于 12-03 07:09

    RDMA設計1:開發(fā)必要性1之設計考慮

    。 一. 選擇 RDMA IP 開發(fā)必要性 為了滿足大批量數(shù)據(jù)的采集、 存儲與傳輸需求, 如機器學習、 雷達、 ?融?控、 航空航天等, 如何在 FPGA 上實現(xiàn)高帶寬、 低延時的數(shù)據(jù)傳輸以
    發(fā)表于 11-19 14:30

    嵌入式軟件測試與專業(yè)測試工具的必要性深度解析

    系統(tǒng)化解決方案,其必要性體現(xiàn)在多個維度:滿足行業(yè)合規(guī)要求汽車電子ISO 26262、航空DO-178C等標準強制要求代碼覆蓋率指標達到C1(分支覆蓋)≥100%、MC/DC(修正條件判定覆蓋)≥100
    發(fā)表于 09-28 17:42

    如何確定電能質(zhì)量在線監(jiān)測裝置的重要性等級?

    ?微機消諧裝置 確定電能質(zhì)量在線監(jiān)測裝置的重要性等級需從 應用場景、數(shù)據(jù)用途、業(yè)務影響、法規(guī)要求、技術(shù)指標 五個維度綜合評估,核心目標是通過分級管理實現(xiàn)資源優(yōu)化配置(如校準頻率、維護優(yōu)先級)。以下
    的頭像 發(fā)表于 09-02 17:45 ?812次閱讀

    電纜局部放電監(jiān)測技術(shù)應用及其必要性分析

    類型的特性,實現(xiàn)絕緣狀態(tài)的實時評估與故障預警,為電纜安全運行提供堅實保障。 電纜局部放電監(jiān)測技術(shù)手段較多,使用場景覆蓋范圍廣泛,因此在實際應用中,多會采用一種或多種技術(shù)手段,來進行相互補充,從而保障監(jiān)測效果的全面
    的頭像 發(fā)表于 08-22 09:16 ?664次閱讀
    電纜局部放電監(jiān)測<b class='flag-5'>技術(shù)</b>應用及其<b class='flag-5'>必要性</b>分析

    AS32S601 芯片在衛(wèi)星互聯(lián)網(wǎng)推進系統(tǒng)中的技術(shù)適配研究

    AS32S601芯片在衛(wèi)星互聯(lián)網(wǎng)推進系統(tǒng)中的技術(shù)適配。通過對芯片抗單粒子效應能力的分析、功能特性與系統(tǒng)需求的匹配研究,以及具體應用場景的詳細探討,揭示了AS32S601芯片在該領(lǐng)域的
    的頭像 發(fā)表于 07-04 09:36 ?843次閱讀

    RDMA簡介1之RDMA開發(fā)必要性

    ,提供高通量、低延遲、遠距離的零拷貝網(wǎng)絡數(shù)據(jù)傳輸?;谌诤弦蕴W(wǎng)的遠程直接內(nèi)存訪問(RoCE)提供了一種基于以太網(wǎng)的RDMA技術(shù)實現(xiàn)方法,相較于IB(InfiniBand)、互聯(lián)網(wǎng)廣域遠程直接內(nèi)存訪問
    發(fā)表于 06-03 14:38

    在晶圓襯底上生長外延層的必要性

    本文從多個角度分析了在晶圓襯底上生長外延層的必要性。
    的頭像 發(fā)表于 04-17 10:06 ?1133次閱讀

    晶體管柵極多晶硅摻雜的原理和必要性

    本文介紹了多晶硅作為晶體管的柵極摻雜的原理和必要性
    的頭像 發(fā)表于 04-02 09:22 ?2799次閱讀
    晶體管柵極多晶硅摻雜的原理和<b class='flag-5'>必要性</b>

    取樣示波器的技術(shù)原理和應用場景

    取樣示波器,也稱為采樣示波器,是一種重要的電子測量儀器,其技術(shù)原理和應用場景可以歸納如下:技術(shù)原理取樣示波器的根本原理是利用等效取樣技術(shù),將
    發(fā)表于 03-12 14:34