作為數(shù)據(jù)挖掘研究領(lǐng)域最具影響力的國際頂級賽事,素有“數(shù)據(jù)世界杯“之譽的KDD Cup日前正式公布了KDD Cup 2019三項重大賽事,包括Auto-ML Track、Regular ML Track及Humanity RL Track三場比賽,其中開賽22年以來首次引入的AutoML Competition挑戰(zhàn)賽受到不少學術(shù)及工業(yè)界專業(yè)人士的關(guān)注。

AutoML(Automated/Automatic Machine Learning,自動機器學習)旨在研究在沒有專業(yè)知識的情況下、使用的低門檻甚至零門檻的機器學習算法,在AI人才緊缺的情況下,AutoML可以降低AI落地過程中對科學家的依賴,是2014年以來機器學習領(lǐng)域最炙手可熱的研究對象之一。2018年1月,谷歌高調(diào)推出自動機器學習產(chǎn)品Cloud AutoML,再次將這項技術(shù)推向更多人的視野中,目前AutoML已成為國內(nèi)外科技巨頭關(guān)注的焦點。
由于日益受到學術(shù)界、工業(yè)界的廣泛關(guān)注,NeurIPS、IJCAI等學術(shù)頂會從去年開始將AutoML視為重點。
本次KDD Cup選擇將其納入比賽內(nèi)容,并為此打破歷來數(shù)據(jù)挖掘方向賽事的傳統(tǒng),也是基于對AutoML技術(shù)發(fā)展趨勢和落地價值的認可。對此,KDD Cup主席Taposh Dutta-Roy表示,AutoML是今年KDD關(guān)注的重點,也是一項AI落地的關(guān)鍵技術(shù)。
據(jù)了解,本次KDD Cup AutoML挑戰(zhàn)賽由第四范式主辦,微軟、AutoML領(lǐng)域最權(quán)威的學術(shù)組織ChaLearn協(xié)辦,并為此次比賽設(shè)置了“史上”難度最高的比賽項目——基于時序關(guān)系型數(shù)據(jù)的AutoML。
時序關(guān)系型數(shù)據(jù)在在線廣告、推薦系統(tǒng)、金融市場分析、醫(yī)療等應(yīng)用場景中非常常見,人們往往需要利用這樣的數(shù)據(jù)去構(gòu)建機器學習模型,并應(yīng)用機器學習模型提升對應(yīng)業(yè)務(wù)的效果。
賽事主要負責人、第四范式資深算法科學家涂威威表示這是AutoML比賽歷史上首次考慮時序關(guān)系型多表數(shù)據(jù),會重點考察AutoML在實際應(yīng)用場景中的能力,應(yīng)對關(guān)系型、時序等多表類型數(shù)據(jù)的挑戰(zhàn),探索AutoML解決實際問題的價值。競賽已于4月1日正式拉開帷幕,挑戰(zhàn)賽分Feedback(反饋)、Check(校驗)、AutoML(盲測)3個階段,最終根據(jù)AUC排名選出冠軍團隊,并在7月20日公布比賽結(jié)果。
值得一提的是,KDD Cup比賽向來由具備深厚學術(shù)積累和行業(yè)實踐的頂級企業(yè)或高校承辦,競爭極為激烈,歷屆承辦方包括微軟、阿里等巨頭公司和卡耐基·梅隆大學等知名高校。
大數(shù)據(jù)文摘據(jù)大賽的主辦資質(zhì)等問題采訪了本次的主辦方之一——第四范式資深算法科學家、也是本次AutoML主委會成員涂威威,他表示KDD Cup每年賽事需要大家提案,組委會會根據(jù)賽事挑戰(zhàn)性、實際應(yīng)用性、賽程規(guī)劃等多維度標準來篩選賽事方案。
第四范式作為首屆KDD CUP AutoML大賽的主辦方,將會肩負起賽事提案、數(shù)據(jù)提供、平臺搭建、賽事報名招募、競賽以及評選等全部流程重任。
“具體審核流程并不清楚,我們在KDD Cup賽事提案獲得了組委會及主席的認可和信任,KDD Cup的Chair也充分表明了對AutoML應(yīng)用價值的肯定?!?/p>
AI技術(shù)的發(fā)展,興起于比賽,成功于行業(yè),此前ImageNet賽事推動了一大批CV公司的成長,并且極大地促進了行業(yè)爆發(fā)。AutoML的產(chǎn)業(yè)發(fā)展延續(xù)了這個路徑,此次首登“數(shù)據(jù)世界杯”的比賽舞臺,KDD平臺將有望吸引更多“全球最聰明的大腦”參與到AutoML進程中,AutoML或?qū)⒙涞赜诟鼜V泛的行業(yè)和場景,迎來新的發(fā)展高峰。
對于這次新增賽題AutoML,涂威威也表示,反映了整個大行業(yè)的AI自動化趨勢。因為AI人才緊缺始終是AI落地的核心痛點,自動化工具就是試圖解決這樣的痛點,正在成為改變目前AI科學家瓶頸以及行業(yè)應(yīng)用門檻的關(guān)鍵技術(shù),近年來AutoML已成為國內(nèi)外科技巨頭關(guān)注的焦點。
“AutoML是機器學習國際研究的前沿,需要更多的研究者參與到基礎(chǔ)算法研究和實際落地中來,我們深知需要整個學術(shù)界和工業(yè)界一起來推動技術(shù)的進步,因此我們做了很多實際的推動,KDD Cup最終選擇重點關(guān)注AutoML比賽,并引用我們的比賽作為AutoML大賽的示例與首秀,也從側(cè)面證明了我們這幾年推動的正向效果?!?/p>
最后,對于本次“史上最難比賽項目”,第四范式也為參賽者提供了一些小tip:
首先,歡迎更多對AutoML關(guān)注和有興趣的同學參加比賽,甚至加入我們一起推動AutoML的發(fā)展,共同探索AutoML無限可能。
需要提醒參賽者提交AutoML方案是需要注意的幾個關(guān)鍵點:
如何自動生成有效的時序信息?
如何將多個相關(guān)表信息有效整合?
如何解決數(shù)據(jù)分布隨時序緩慢變化的問題?
如何自動捕獲有意義的表間聯(lián)系?
如何自動高效地選擇合適的機器學習模型和超參數(shù)?
如何讓方案更通用,即如何使其適用于未知的任務(wù)?
如何保持計算和內(nèi)存成本可接受?
希望所有參賽者能在本次挑戰(zhàn)賽中,充分展示自己的能力和風采,取得更好的成績。當然,AutoML技術(shù)的發(fā)展還有很多更具挑戰(zhàn)性的難題在前面等著我們,在今后比賽中我們會繼續(xù)與大家一起挑戰(zhàn)更高難度的問題,讓AutoML真正大幅降低了機器學習的應(yīng)用門檻,賦能非機器學習背景的人可以輕松使用。
目前,KDD2019官網(wǎng)已經(jīng)放出了大賽的三個賽題,其中,AutoML比賽詳情頁面已經(jīng)發(fā)布。SIGKDD-2019將于2019年8月4日至8日在美國阿拉斯加州安克雷奇舉行。比賽預計將持續(xù)2-4個月,獲勝者將在2019年7月中旬被通知,并在KDD會議開幕式上接受頒獎,最終在會議期間在KDD杯研討會上展示他們的解決方案。
-
數(shù)據(jù)挖掘
+關(guān)注
關(guān)注
1文章
406瀏覽量
25098 -
機器學習
+關(guān)注
關(guān)注
66文章
8558瀏覽量
137074 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1313瀏覽量
25778
原文標題:“數(shù)據(jù)世界杯”KDD Cup 2019賽題正式公布,首次挑戰(zhàn)AutoML產(chǎn)業(yè)落地最大難題
文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
海信世界杯定制產(chǎn)品矩陣亮相AWE 2026
中興通訊斬獲GTI Awards 2026三項大獎
上汽集團成為第48屆世界技能大賽國家戰(zhàn)略合作伙伴
聯(lián)想天禧AI足球智能體正式上線
共達電聲牽頭起草的三項團體標準獲批發(fā)布
格科微電子榮膺三項權(quán)威認可
【賽事公告】關(guān)于“第三屆開放原子大賽”賽程延長公告
廣汽集團榮膺三項權(quán)威大獎
華為IntelligentRAN解決方案助力重大賽事通信保障
翼輝信息助力第十四屆“中國軟件杯”大賽圓滿落幕
第六屆TE Connectivity AI Cup全球競賽圓滿收官
中國兩大高校團隊斬獲第六屆TE Connectivity AI Cup全球競賽桂冠
素有“數(shù)據(jù)世界杯“之譽的KDD Cup日前正式公布了KDD Cup 2019三項重大賽事
評論