91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一些數(shù)據(jù)科學家在工作中最常遇到的“奇葩”需求

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-07-08 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:數(shù)據(jù)科學家是21世紀“最性感”的工作,幾乎所有人都為之瘋狂——無論什么產(chǎn)品,只要在醒目位置標上“人工智能”,它就不僅賣得掉,還賣得火。但是,這也產(chǎn)生了不少問題。以往我們談及設(shè)計人員工作時,總會拿不懂PS是Photoshop的甲方作為笑談,現(xiàn)在這樣的事也同樣發(fā)生在數(shù)據(jù)科學家身上,縱然有心解釋,社會刻板印象還是會讓他們百口莫辯。

如果說現(xiàn)代設(shè)計已經(jīng)在人們生活中存在了幾十年,許多甲方客戶還對它了解甚少;那機器學習才剛剛嶄露頭角,人們對它還僅限于眼熟,或是只讀過幾篇吹得天花亂墜的軟文。常言道,隔行如隔山。很多時候,雖然專業(yè)人士眼里的常識別人不一定懂,但其他行業(yè)起碼還有銷售幫襯,可以很好地充當對接橋梁。而數(shù)據(jù)科學家就不一定有這個待遇了。

現(xiàn)在,人們對機器學習、人工智能的偏見是社會性的,這里面包括公司銷售。舉個不靠譜的例子,當銷售們和客戶宣傳時,他們會把實際效果吹成“占領(lǐng)月球”,客戶一聽非常滿意,超出自己預期,于是要求立即啟動“占月”項目。歸根結(jié)底,數(shù)據(jù)科學家能做的頂多是把他們送到月球,然后把他們丟在那片荒無人煙的地方。至于開發(fā)占領(lǐng)?不可能的。

下面列出了一些數(shù)據(jù)科學家在工作中最常遇到的“奇葩”需求,雖然看起來有些滑稽,但它們都是真實經(jīng)歷。如果你想成為數(shù)據(jù)科學家,你可以先熟悉一下它們,提前鍛煉一顆強健的心臟;如果你是客戶,你也可以通過它們規(guī)避不少麻煩,至少談判時,坐在對面的數(shù)據(jù)科學家不會一臉了無生趣。

1.“我們想要一個AI模型……它可以解決‘這個’問題”

現(xiàn)如今,我們通過簡單的探索性數(shù)據(jù)分析,就能解決80%的產(chǎn)業(yè)分析問題。既然如此,為什么你們還想用機器學習呢?對于這樣精確到目標的需求,構(gòu)建任何機器學習模型都是矯枉過正,在這些問題上用AI是徒勞的,企業(yè)也沒法從中看到新技術(shù)帶來的改變。從某種程度上來說,殺雞焉用牛刀?

誠然,高級分析看起來很拉風,通過投資這項技術(shù),企業(yè)可以在技術(shù)上“引領(lǐng)”行業(yè),試問有那家公司不喜歡塑造自己先進、光彩的創(chuàng)新形象?但是每一個數(shù)據(jù)科學家都有義務(wù)引導客戶正確使用技術(shù),而不是濫用,以保證機器學習這把牛刀不會誤傷他人。所以,大家在做數(shù)據(jù)分析時,請用美觀的分析工具說服自己的客戶,讓他們看到數(shù)據(jù)背后的完整價值。

到目前為止,人工智能最大的危險在于人們覺得自己理解它,而這個結(jié)論下得太早了。——MIRI創(chuàng)始人 Eliezer Yudkowsky

2.“這些數(shù)據(jù)給你……你給我出一些商業(yè)洞見”

通??蛻魰J為自己的責任只是移交數(shù)據(jù),他們中的有些人甚至連需求都不提,丟下一堆數(shù)據(jù)就走,然后期待數(shù)據(jù)科學家能總結(jié)出一些零零散散的、非常有見地的建議。最好這些建議還能“擲地有聲”,讓公司一夜間就改頭換面。

不幸的是,數(shù)據(jù)科學家的工作不是文學寫作,一個人憑空想是想不出什么操作性強的業(yè)務(wù)建議的。他們需要和公司業(yè)務(wù)人員保持長期的、富有成效的交流對話,以了解這家公司能做什么,不能做什么。在整個項目期間,雙方要安排一個“驗收”期,共同評判建議的具體效果。

如果你連提出一個正確的問題都不會,那你將一無所獲?!绹y(tǒng)計學家 W. Edward Deming

3.“造個模型,能跳過不必要的分析,節(jié)約時間那種”

數(shù)據(jù)預處理和探索性分析的重要性毋庸置疑,但很多數(shù)據(jù)分析師同仁可能在處理數(shù)據(jù)前就把它們忘了。鑒于此,一些客戶就希望機器學習能刪除其中“不必要的分析”,在保證結(jié)果準確的同時縮短分析時間,提高效率。

其實數(shù)據(jù)分析是機器學習和所有高級分析的必要步驟,它們同根同源。如果不了解數(shù)據(jù),無法從數(shù)據(jù)中找出異常值和潛在模式,那機器學習模型就是兩眼一抹黑,什么都干不了。所以客戶應該給數(shù)據(jù)分析預留足夠的時間,并指定討論時間,方便數(shù)據(jù)分析師或數(shù)據(jù)科學家能發(fā)現(xiàn)有趣的的東西和及時分享。

一個煉金師在找尋黃金時,會發(fā)現(xiàn)許多更具價值的其他物品。——叔本華

4.“我們有上周的數(shù)據(jù),你能預測未來6個月的情況嗎?”

這個問題幾乎是所有數(shù)據(jù)科學家都沒法避免的??傆心敲匆恍┤耍雌礈悳悗仔袛?shù)據(jù),就指望AI能像巫女的水晶球一樣給個“預兆”。也總有那么一些人,一點數(shù)據(jù)都沒有,還想讓AI去填補這些空白。

對機器學習來說,數(shù)據(jù)的數(shù)量和質(zhì)量至關(guān)重要,如果客戶不在乎“廢料進,廢品出”,做數(shù)據(jù)分析就可以了。一些有用的統(tǒng)計技術(shù)確實可以四兩撥千斤地處理這類問題,從少量數(shù)據(jù)中提煉盡可能多的信息,比如插入缺失值(impute)、人工合成數(shù)據(jù)(SMOTE算法)和使用面向小數(shù)據(jù)的簡單模型。為了避免客戶失望,記得定義一些界限來解釋為什么結(jié)果會那么差。

數(shù)據(jù)量和分析技術(shù)性能之間的關(guān)系

5.“你去建個模,兩禮拜夠不夠?”

突然推翻原定計劃,卻還要求成果保質(zhì)保量——這是所有項目都可能出現(xiàn)的問題。其他行業(yè)是怎么補救的,我們暫且不提,反正機器學習建模不可以。它的時間一旦計劃好了,就改不了了,尤其是在原定時間就捉襟見肘的情況下。也許客戶會有疑問:現(xiàn)在GPU算力大幅提高了,各種API也都有了,你們這群數(shù)據(jù)科學家到底在磨蹭啥?

事實上,盡管行業(yè)內(nèi)出現(xiàn)了像Auto-ML這樣的進展,但建模過程還是得依賴大量手動操作。數(shù)據(jù)科學家必須要痛苦地在一輪又一輪的迭代中檢查統(tǒng)計結(jié)果、比較模型和檢查成因。這些是沒法自動化的,至少現(xiàn)在還沒有自動化。如果客戶實在不理解,建議給個例子讓他直接體驗一下。

建模既是實驗,也是藝術(shù)創(chuàng)作,里程碑驅(qū)動的項目計劃并不總是現(xiàn)實的。

6.“能不能把這個變量換了,重新跑下模型?”

當數(shù)據(jù)科學家終于把建好的商業(yè)模型交給客戶看時,后者也會習慣性地提一些“調(diào)試”要求,其中最常見的是:“你能不能替換這個變量,然后重新運行模型”?表面上看這只是個小改動,但事實上,這個小改動卻意味著把在世界杯上踢足球改成在NBA打籃球。

雖然機器學習是高度迭代的,但它的核心目標是為給定變量篩選正確的影響因子,并映射它們的關(guān)系。這個要替換的變量是模型的重要組成部分,不能說改就改。所以如果客戶想投資AI技術(shù),他們應該努力學習一些基本工作原理。如果遇到這樣完全不懂的客戶,數(shù)據(jù)科學家也有必要給出預警,防止他們事后處處不滿。

7.“我們模型的準確率可以達到100%嗎?”

看到“錯誤率”就宛如看到“瘟神”,這是很多人的誤區(qū)。人們都喜歡盲目追求等級,客戶也總覺得越靠近100%,模型就越好。然而當準確率超越其他因素成為唯一焦點后,數(shù)據(jù)科學家就又該頭疼了:你們要這么一個精度很高,但沒法實際應用的復雜模型有什么用?

2009年,BellKor's Pragmatic Chaos拿下Netflix Prize百萬美金競賽冠軍,雖然Netflix到現(xiàn)在還一直夸這個模型有多好,但它從沒上線過。為什么?因為這個高精度復雜模型背后的工程成本太高了。如果一個模型只有精度卻不能實際應用,它對普通企業(yè)的意義又在哪兒?一個好的工程模型應該兼具準確率、穩(wěn)定性、簡單性和業(yè)務(wù)可解釋性,并在之中達到平衡。

工程模型:實現(xiàn)精細平衡和權(quán)衡

8.“這模型訓練好了,以后能一直保持高性能嗎?”

虛擬產(chǎn)品也是產(chǎn)品,當模型訓練完,客戶自然還要關(guān)心一下它的使用壽命。因此他們常問的問題還有:“這個模型是不是會一直這么聰明啊?”“未來我們業(yè)務(wù)發(fā)展了,它跟不跟得上變化???”

很不幸,機器學習模型不會自動貫徹終身學習。它還只是個孩子,你們千萬要不斷耐心教導它!通常情況下,模型需要每隔幾周或幾個月進行一次快速復習,就像學校里為了考試苦苦掙扎的學生。更重要的是,如果公司業(yè)務(wù)發(fā)生明顯變化,這個復習頻率要加快,模型可能還要回爐學習點新東西。

盡管發(fā)展很快,但這就是當今分析行業(yè)的情況,所以如果想投資AI技術(shù),做好模型維護和更新的時間、金錢預算吧!

小結(jié)

到現(xiàn)在為止,我們已經(jīng)介紹了數(shù)據(jù)科學家工作生活中可能會遇到的8個關(guān)鍵誤解,它們隱藏在機器學習建模的6個步驟中:

導致這些誤解產(chǎn)生的原因有兩個,一是客戶對行業(yè)基礎(chǔ)知識缺乏了解,二是雙方對具體效果的預期錯位。了解這些內(nèi)容有助于數(shù)據(jù)科學家在遇到麻煩時溫和、友善地向客戶說明情況,而不是一臉無奈或是一肚子火氣,最后被迫向客戶屈服。

如果你在生活中也遇到過類似的困擾,歡迎留言指出,幫助更多同行總結(jié)經(jīng)驗,也讓客戶和銷售更了解自己的工作。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7342

    瀏覽量

    94909
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50170

    瀏覽量

    266057
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8558

    瀏覽量

    137079

原文標題:是什么讓數(shù)據(jù)科學家頻頻受挫?機器學習的甲方&乙方

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    微電子科學家吳德馨院士逝世,在國內(nèi)率先提出利用MEMS結(jié)構(gòu)實現(xiàn)激光器和光纖的無源耦合

    3月24日,中國科學院微電子研究所官方賬號發(fā)布訃告,中國科學院院士,我國杰出的微電子科學家,中國科學院微電子研究所研究員,原中國科學院微電子
    的頭像 發(fā)表于 03-25 18:23 ?35次閱讀
    微電子<b class='flag-5'>科學家</b>吳德馨院士逝世,在國內(nèi)率先提出利用MEMS結(jié)構(gòu)實現(xiàn)激光器和光纖的無源耦合

    了解全國產(chǎn)轉(zhuǎn)速地磁測量模塊的應用前景

    。在一些科研和工業(yè)應用中,這類模塊的作用不可小覷。 你可能會問,為什么我們需要如此精密的測量工具?其實,地磁測量在地球科學、環(huán)境監(jiān)測、航天航空等領(lǐng)域都具有重要價值。比如,科學家們可以通過這些數(shù)
    發(fā)表于 03-23 10:35

    中國科學家重大突破:智能手表未來有望靠體溫供電

    長久以來,“續(xù)航焦慮”困擾著可穿戴消費電子、植入式醫(yī)療領(lǐng)域。但現(xiàn)在,中國科學家項重磅研究,正在讓“人體自帶充電寶”從科幻走進現(xiàn)實——只需利用體溫與環(huán)境的微小溫差,就能為智能設(shè)備持續(xù)供電。2026
    的頭像 發(fā)表于 03-10 18:09 ?69次閱讀

    機器學習和深度學習中需避免的 7 個常見錯誤與局限性

    ,并驗證輸出結(jié)果,就能不斷提升專業(yè)技能,養(yǎng)成優(yōu)秀數(shù)據(jù)科學家工作習慣。需避免的機器學習和深度學習數(shù)據(jù)錯誤在訓練數(shù)據(jù)驅(qū)動的人工智能模型時,我們
    的頭像 發(fā)表于 01-07 15:37 ?256次閱讀
    機器學習和深度學習中需避免的 7 個常見錯誤與局限性

    思必馳首席科學家俞凱教授當選2026年度IEEE Fellow

    日前,全球最大的專業(yè)技術(shù)組織國際電氣電子工程師協(xié)會(The Institute of Electrical and Electronics Engineers, IEEE)公布了2026年度IEEE Fellow(會士)名單,上海交通大學特聘教授、思必馳聯(lián)合創(chuàng)始人、首席科學家俞凱教授當選。
    的頭像 發(fā)表于 12-12 11:36 ?867次閱讀

    中興通訊崔麗受邀出席2025騰沖科學家論壇

    近日,“2025騰沖科學家論壇”在云南啟幕。本屆論壇以“科學·AI改變世界”為主題,匯聚包括諾貝爾獎、圖靈獎、菲爾茲獎得主在內(nèi)的國際頂尖科學家,以及百余位兩院院士、高校校長、科技精英與產(chǎn)業(yè)領(lǐng)袖,共話
    的頭像 發(fā)表于 12-09 11:36 ?647次閱讀

    科學家利用微波激光照射鉆石,制造出時間準晶體

    科學家利用微波激光照射鉆石,制造出時間準晶體。 美國華盛頓大學、麻省理工學院和哈佛大學科學家攜手,成功在鉆石上“雕刻”出種全新的物質(zhì)形態(tài):時間準晶體。這項突破有望為量子計算、精確計時等領(lǐng)域帶來
    的頭像 發(fā)表于 11-19 07:35 ?221次閱讀
    <b class='flag-5'>科學家</b>利用微波激光照射鉆石,制造出時間準晶體

    國際類腦計算科學家Yulia Sandamirskaya教授加盟時識科技

    近日,國際類腦計算與神經(jīng)形態(tài)機器人領(lǐng)域知名科學家Yulia Sandamirskaya 教授,作為科學家顧問正式加入時識科技(SynSense)。
    的頭像 發(fā)表于 10-13 13:50 ?820次閱讀

    科技感拉滿!鯨啟智能機器人與無人機聯(lián)動,閃耀服務(wù)世界青年科學家論壇

    9 月 20 日,以 “青年,世界科學的未來” 為主題的世界青年科學家論壇(南京)在江北新區(qū)啟幕。20 余位諾貝爾獎得主、海內(nèi)外院士,超百位國際國內(nèi)青年科學家及產(chǎn)業(yè)代表齊聚,圍繞前沿科技展
    的頭像 發(fā)表于 10-11 16:54 ?321次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    AI被賦予了人的智能,科學家們希望在沒有人類的引導下,AI自主的提出科學假設(shè),諾貝爾獎級別的假設(shè)哦。 AI驅(qū)動科學被認為是科學發(fā)現(xiàn)的第五個范式了,與實驗
    發(fā)表于 09-17 11:45

    復星醫(yī)藥使用亞馬遜云科技生成式AI技術(shù)賦能醫(yī)療撰寫場景 助力科學家效率躍升

    進程。通過“臨床試驗報告致性檢查”和“研發(fā)文獻翻譯”兩大功能,復星醫(yī)藥可解放科學家生產(chǎn)力,使其專注于創(chuàng)新藥研發(fā)的核心工作。在亞馬遜云科技的加持下,“臨床試驗報告致性檢查”可覆蓋研究
    發(fā)表于 07-14 14:16 ?1163次閱讀

    地物光譜儀如何幫助科學家研究植被和土壤?

    在遙感、生態(tài)、農(nóng)業(yè)等研究領(lǐng)域,科學家們常常會提到個工具: 地物光譜儀 。它看起來像臺“測光的槍”,卻能揭示土壤和植被的“隱藏信息”。那么,地物光譜儀到底是怎么工作的?它又是如何在
    的頭像 發(fā)表于 05-20 15:46 ?684次閱讀
    地物光譜儀如何幫助<b class='flag-5'>科學家</b>研究植被和土壤?

    滾珠絲桿在工作中損耗會影響什么?

    滾珠絲桿在工作中的損耗會對設(shè)備的性能、精度、壽命和運行穩(wěn)定性產(chǎn)生多方面的影響。
    的頭像 發(fā)表于 05-10 17:54 ?566次閱讀
    滾珠絲桿<b class='flag-5'>在工作中</b>損耗會影響什么?

    在FX2LP USB上配置GPIF中斷時遇到一些問題,求解決

    你好,我在 FX2LP USB 上配置 GPIF 中斷時遇到一些問題。 我啟用了 INT4 中斷并從 GPIF 中選擇了源 INT4,然后啟用了 GPIF 完成中斷,但我看不到中斷 4 工作。 我該如何做呢?
    發(fā)表于 05-06 08:00

    云天勵飛董事長陳寧當選深圳市青年科學家協(xié)會第十屆會長

    ? 2025年3月29日,深圳市青年科學家協(xié)會十屆次會員大會在深圳市青少年活動中心南廳隆重舉行。百余位青年才俊齊聚堂,共同見證協(xié)會換屆選舉,共話科技創(chuàng)新未來。共青團深圳市委員會書記胡火明出席了
    的頭像 發(fā)表于 03-31 19:15 ?1295次閱讀
    云天勵飛董事長陳寧當選深圳市青年<b class='flag-5'>科學家</b>協(xié)會第十屆會長