91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么說數學知識是數據科學家的先決條件?

DPVg_AI_era ? 來源:lq ? 2019-01-29 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI機器學習的火熱讓數據科學家成為近幾年熱門職業(yè)之一。但對于試圖從事這一職業(yè)的新人來說,數學可能最大的攔路虎之一。不過本文作者認為,當數據科學家并不一定需要堅實的數學基礎,并給出了9類無需數學基礎的數據科學任務。

在當今世界上,數據科學和機器學習已成為最令人向往的職業(yè)方向之一,從大學生到職業(yè)生涯中期的專業(yè)人士,很多人都希望進入數據科學領域。但是,在追求數據科學或機器學習領域時想到的第一個先決條件是,要具備深入研究復雜數學問題的能力,才能走進數據科學的大門。

但是那些數學基礎薄弱,不具備扎實數學背景的人怎么辦?他們就沒有希望進入數據科學領域了嗎?

當然不是。本文將提供踏入數據科學和機器學習世界之前,是否強制要求數學背景知識的真實情況。

為什么說數學知識是數據科學家的先決條件?

與大學其他專業(yè)相比,數據科學更多地是關于如何快速準確地學習。通過嚴格的數學運算,快速準確地掌握技術,并且通??梢员却蠖鄶等烁菀椎貙W習。

數據科學家基本上都是統計學家,大多數人擁有研究生水平的數學和統計學知識。這是從事實際項目所必需的知識,對于正確使用算法和假設檢驗至關重要。

掌握邏輯回歸、決策樹、置信區(qū)間等標準數學工具也很重要。大多數企業(yè)都會使用這些標準工具。因此,招聘人員也傾向于尋找具備扎實數學背景的求職者,這主要是出于歷史原因。

堅持使用標準的數學訓練和標準工具,對有興趣成為硬核數據科學家的人是非常有用的。

數據科學家需要掌握哪些知識呢?

一位優(yōu)秀的數據科學家或工程師必須具備豐富的數據庫知識和工程實踐知識。包括處理和記錄錯誤、監(jiān)控系統,構建人為錯誤容錯渠道,了解擴展項目所需的條件、處理持續(xù)整合問題、掌握數據庫管理知識,維護數據清理以及確保確定性處理流程等。

凡事有例外,高中數學水平的人也有機會

實際上,在機器學習的所有方面的技術中,數據科學背后的統計引擎并不涉及高中以后的任何數學或統計理論。

如果具備強大的數據和編程背景,任何人都可以非??焖俚貙W習數據科學。

不過,由硬核數學導向的數據科學家開發(fā)的一些技術并不使用數學或統計學,這些技術同樣有效,其中一些技術已經被證明不輸于使用數學的同類技術,而且性能通常更加強大。此外,這些技術更易于理解,并且可解釋性更強。

數據科學家的實際工作有多少和數學有關?

打破神話,揭示現實。

從入門級數據科學家到中級數據科學家,一般花在數學上的時間不到5%,機器學習也是如此,尤其是建立模型時,很少有時間做任何數學上的工作。對于機器學習,需要學習的真正的必要技能是數據分析,以便建立能夠進行準確預測的模型。初學者其實不需過多掌握微積分和線性代數。

只有參與學術上的機器學習研究或者少數先進的數據科學家團隊時,數學的作用才顯得特別重要。高水平的業(yè)內人士也經常使用高等數學。一些人正在拓展機器學習研究人員的研究邊界。

像谷歌和Facebook這樣的公司中,人們只會在工作中經常使用微積分、線性代數和更高級的數學工具。

最重要的是,在產業(yè)界中,數據科學家只是沒有將太多時間花在數學上,但花了大量時間來獲取數據、清理數據、探索數據。實際上,80%的人所做的是數據整理和數據的可視化。

9類無需數學技術的數據科學任務

1、使用基本的Excel進行高級機器學習:此方法是一種輕量級的技術實現,包括非常簡單易懂的基本Excel實現。目前可用于Python、Perl,Julia和R。未來預計還將支持SQL實現。

2、使用HDT進行自動化的機器學習:此方法融合了名為“決策樹”和“回歸”的兩種傳統技術。但是這種實現不涉及任何節(jié)點分割或任何傳統的回歸模型,回歸部分是與數學無關的Jack-knife回歸。早期版本使用邏輯回歸,但由于數據轉換過程比較簡單,使用的參數較少,導致邏輯回歸被Jack-knife回歸所取代。

3、無模型置信區(qū)間:需要對隨機變量和概率分布有基本的了解才能知道置信區(qū)間的概念。這類置信區(qū)間方法基于百分位數,非常易于理解,無需數學知識且可靠性高,可用于預測分析。

4、假設檢驗:這是學生在統計課程中的難題之一。這里已被置信區(qū)間的簡單變體所取代,便于直觀理解。

5、使用Excel的Jack-knife回歸:這些回歸技術非常簡單高效,可以在Excel或SQL中輕松實現。

6、Jack-knife回歸:理論 – 無須統計理論的回歸,甚至不涉及線性代數。不過帶有置信區(qū)間。在該方法中,即使使用少量元參數,與經典回歸相比,也能實現最低限度的精度損失。該方法在存在異常值、高度相關的特征或其他違反假設的情況下性能良好,這些假設條件在使用傳統回歸時必須通過一個數據集滿足。

7、索引,編目和NLP:無需數學知識的監(jiān)督聚類方法。

8、快速組合特征選擇:這種方法通常需要理解隨機變量的概念。

9、方差,聚類和密度估計:這些方法中也不大涉及數學。

要成為高效的數據科學家,還是要懂點數學的

其實,這里的關鍵點是,對于初出茅廬的數據科學家和機器學習從業(yè)者來說,數據專業(yè)知識的重要性要優(yōu)于數學專業(yè)知識,因此,如果你的目標是獲得一份工作,進入數據科學領域,那么最重要的任務是必須掌握數據分析,而不是掌握微積分。數據科學家要做的不是做證明題或研究數學問題,能夠分析數據才是最重要的。

初學者需要盡快掌握如何收集數據、探索和準備數據。全面掌握數據可視化和數據處理(包括聚合)是關鍵環(huán)節(jié),這樣才可以同時使用它們來執(zhí)行探索性數據分析任務。

盡管這些無需數學知識的工具和方法,確實凸顯了在不具備堅實數學基礎的情況下從事數據科學的可能性,但并一定能夠滿足行業(yè)的期望,因為能否獲得數據科學家的職位,完全取決于你從事的工作內容,以及你心儀的公司究竟從事什么業(yè)務。

在不具備數學背景知識的情況下,確實有可能成為一名數據科學家。但按以往經驗來看,如果沒有一定程度的數學素養(yǎng),從長期而言,很難成為一個高效的數據科學家,而高效這一點無疑是更為重要的。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8553

    瀏覽量

    136957
  • 數據科學
    +關注

    關注

    0

    文章

    168

    瀏覽量

    10794

原文標題:不懂數學,照樣做數據科學家

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    巨霖科技孫家鑫亮相ICCM 2025世界華人數學家大會

    2026年1月3日,以“數學新前沿:改造科學與人類的推動力”為主題的第十屆世界華人數學家大會在滬開幕。上海市委書記陳吉寧出席開幕式并致辭,上海市委副書記、市長龔正出席。
    的頭像 發(fā)表于 01-07 16:35 ?397次閱讀
    巨霖科技孫家鑫亮相ICCM 2025世界華人<b class='flag-5'>數學家</b>大會

    思必馳首席科學家俞凱教授當選2026年度IEEE Fellow

    日前,全球最大的專業(yè)技術組織國際電氣電子工程師協會(The Institute of Electrical and Electronics Engineers, IEEE)公布了2026年度IEEE Fellow(會士)名單,上海交通大學特聘教授、思必馳聯合創(chuàng)始人、首席科學家俞凱教授當選。
    的頭像 發(fā)表于 12-12 11:36 ?817次閱讀

    中興通訊崔麗受邀出席2025騰沖科學家論壇

    近日,“2025騰沖科學家論壇”在云南啟幕。本屆論壇以“科學·AI改變世界”為主題,匯聚包括諾貝爾獎、圖靈獎、菲爾茲獎得主在內的國際頂尖科學家,以及百余位兩院院士、高校校長、科技精英與產業(yè)領袖,共話
    的頭像 發(fā)表于 12-09 11:36 ?600次閱讀

    技術感知世界!昊衡科技在第四屆飛行器健康管理技術國際高端論壇暨青年科學家論壇等您!

    今日是第四屆飛行器健康管理技術國際高端論壇暨青年科學家論壇在廈門國際會展酒店(會展二路199號)的會議日,現場學術氛圍持續(xù)高漲。武漢昊衡科技作為國產先進光學測量與傳感測量儀器制造商,此次攜兩款創(chuàng)新
    的頭像 發(fā)表于 11-20 17:15 ?1701次閱讀
    技術感知世界!昊衡科技在第四屆飛行器健康管理技術國際高端論壇暨青年<b class='flag-5'>科學家</b>論壇等您!

    科學家利用微波激光照射鉆石,制造出時間準晶體

    科學家利用微波激光照射鉆石,制造出時間準晶體。 美國華盛頓大學、麻省理工學院和哈佛大學科學家攜手,成功在鉆石上“雕刻”出一種全新的物質形態(tài):時間準晶體。這項突破有望為量子計算、精確計時等領域帶來
    的頭像 發(fā)表于 11-19 07:35 ?195次閱讀
    <b class='flag-5'>科學家</b>利用微波激光照射鉆石,制造出時間準晶體

    第四屆飛行器健康管理技術國際高端論壇暨青年科學家論壇:昊衡科技,歡迎您來!

    大會介紹第四屆飛行器健康管理技術國際高端論壇暨青年科學家論壇將于2025年11月19-21日在中國廈門舉行。會議由廈門大學和江南大學聯合主辦,圍繞飛行器健康管理與智能運維,以“數字時代、智領運維
    的頭像 發(fā)表于 11-14 17:36 ?3064次閱讀
    第四屆飛行器健康管理技術國際高端論壇暨青年<b class='flag-5'>科學家</b>論壇:昊衡科技,歡迎您來!

    國際類腦計算科學家Yulia Sandamirskaya教授加盟時識科技

    近日,國際類腦計算與神經形態(tài)機器人領域知名科學家Yulia Sandamirskaya 教授,作為科學家顧問正式加入時識科技(SynSense)。
    的頭像 發(fā)表于 10-13 13:50 ?743次閱讀

    科技感拉滿!鯨啟智能機器人與無人機聯動,閃耀服務世界青年科學家論壇

    9 月 20 日,以 “青年,世界科學的未來” 為主題的世界青年科學家論壇(南京)在江北新區(qū)啟幕。20 余位諾貝爾獎得主、海內外院士,超百位國際國內青年科學家及產業(yè)代表齊聚,圍繞前沿科技展
    的頭像 發(fā)表于 10-11 16:54 ?280次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    AI被賦予了人的智能,科學家們希望在沒有人類的引導下,AI自主的提出科學假設,諾貝爾獎級別的假設哦。 AI驅動科學被認為是科學發(fā)現的第五個范式了,與實驗
    發(fā)表于 09-17 11:45

    復星醫(yī)藥使用亞馬遜云科技生成式AI技術賦能醫(yī)療撰寫場景 助力科學家效率躍升

    進程。通過“臨床試驗報告一致性檢查”和“研發(fā)文獻翻譯”兩大功能,復星醫(yī)藥可解放科學家生產力,使其專注于創(chuàng)新藥研發(fā)的核心工作。在亞馬遜云科技的加持下,“臨床試驗報告一致性檢查”可覆蓋研究人員90%的撰寫場景,工作效率提升70%;而在“研發(fā)文
    發(fā)表于 07-14 14:16 ?1128次閱讀

    PCB層疊結構設計的先決條件

    )出發(fā),深入探討PCB多層板的層疊結構設計的先決條件。 一、Core和PP的簡要介紹 Core是PCB多層板的核心組成部分,它的兩個表層都鋪有銅箔,可作為信號層、電源層、地層等導電層。Core的上、下表層之間填充的是固態(tài)材料,具有良好的機械強度和電氣性能。而PP則是一種半固態(tài)的樹脂
    的頭像 發(fā)表于 06-06 15:37 ?1291次閱讀
    PCB層疊結構設計的<b class='flag-5'>先決條件</b>

    地物光譜儀如何幫助科學家研究植被和土壤?

    在遙感、生態(tài)、農業(yè)等研究領域,科學家們常常會提到一個工具: 地物光譜儀 。它看起來像一臺“測光的槍”,卻能揭示土壤和植被的“隱藏信息”。那么,地物光譜儀到底是怎么工作的?它又是如何在科學研究中
    的頭像 發(fā)表于 05-20 15:46 ?622次閱讀
    地物光譜儀如何幫助<b class='flag-5'>科學家</b>研究植被和土壤?

    在任何平臺上使用PetaLinux的先決條件

    本篇文章介紹了在任何平臺上使用 PetaLinux 的先決條件。PetaLinux 是一種嵌入式 Linux 軟件開發(fā)套件 (SDK),主要用于基于 FPGA 的系統級芯片 (SoC) 設計或 FPGA 設計。
    的頭像 發(fā)表于 04-24 10:40 ?1555次閱讀
    在任何平臺上使用PetaLinux的<b class='flag-5'>先決條件</b>

    云天勵飛董事長陳寧當選深圳市青年科學家協會第十屆會長

    ? 2025年3月29日,深圳市青年科學家協會十屆一次會員大會在深圳市青少年活動中心南廳隆重舉行。百余位青年才俊齊聚一堂,共同見證協會換屆選舉,共話科技創(chuàng)新未來。共青團深圳市委員會書記胡火明出席了
    的頭像 發(fā)表于 03-31 19:15 ?1249次閱讀
    云天勵飛董事長陳寧當選深圳市青年<b class='flag-5'>科學家</b>協會第十屆會長

    如何在Mac上下載并安裝SPSDK?

    有人有下載和安裝 SPSDK 的說明嗎?先決條件文檔僅適用于 Windows。
    發(fā)表于 03-31 07:49