91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹10個(gè)常見機(jī)器學(xué)習(xí)案例

深度學(xué)習(xí)自然語言處理 ? 來源:機(jī)器之心 ? 作者:Jason Brownlee ? 2020-10-10 10:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文介紹了 10 個(gè)常見機(jī)器學(xué)習(xí)案例,這些案例需要用線性代數(shù)才能得到最好的理解。

線性代數(shù)是數(shù)學(xué)的分支學(xué)科,涉及矢量、矩陣和線性變換。

它是機(jī)器學(xué)習(xí)的重要基礎(chǔ),從描述算法操作的符號到代碼中算法的實(shí)現(xiàn),都屬于該學(xué)科的研究范圍。

雖然線性代數(shù)是機(jī)器學(xué)習(xí)領(lǐng)域不可或缺的一部分,但二者的緊密關(guān)系往往無法解釋,或只能用抽象概念(如向量空間或特定矩陣運(yùn)算)解釋。

閱讀這篇文章后,你將會了解到:

如何在處理數(shù)據(jù)時(shí)使用線性代數(shù)結(jié)構(gòu),如表格數(shù)據(jù)集和圖像。

數(shù)據(jù)準(zhǔn)備過程中用到的線性代數(shù)概念,例如 one-hot 編碼和降維。

深度學(xué)習(xí)、自然語言處理和推薦系統(tǒng)等子領(lǐng)域中線性代數(shù)符號和方法的深入使用。

讓我們開始吧。

這 10 個(gè)機(jī)器學(xué)習(xí)案例分別是:

1. Dataset and Data Files 數(shù)據(jù)集和數(shù)據(jù)文件2. Images and Photographs 圖像和照片3. One-Hot Encoding one-hot 編碼4. Linear Regression 線性回歸5. Regularization 正則化6. Principal Component Analysis 主成分分析7. Singular-Value Decomposition 奇異值分解8. Latent Semantic Analysis 潛在語義分析9. Recommender Systems 推薦系統(tǒng)10. Deep Learning 深度學(xué)習(xí)

1. 數(shù)據(jù)集和數(shù)據(jù)文件

在機(jī)器學(xué)習(xí)中,你可以在數(shù)據(jù)集上擬合一個(gè)模型。

這是表格式的一組數(shù)字,其中每行代表一組觀察值,每列代表觀測的一個(gè)特征。

例如,下面這組數(shù)據(jù)是鳶尾花數(shù)據(jù)集的一部分

數(shù)據(jù)集:http://archive.ics.uci.edu/ml/datasets/Iris

5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-setosa 4.7,3.2,1.3,0.2,Iris-setosa 4.6,3.1,1.5,0.2,Iris-setosa 5.0,3.6,1.4,0.2,Iris-setosa

這些數(shù)據(jù)實(shí)際上是一個(gè)矩陣:線性代數(shù)中的一個(gè)關(guān)鍵數(shù)據(jù)結(jié)構(gòu)。

接下來,將數(shù)據(jù)分解為輸入數(shù)據(jù)和輸出數(shù)據(jù),來擬合一個(gè)監(jiān)督機(jī)器學(xué)習(xí)模型(如測量值和花卉品種),得到矩陣(X)和矢量(y)。矢量是線性代數(shù)中的另一個(gè)關(guān)鍵數(shù)據(jù)結(jié)構(gòu)。

每行長度相同,即每行的數(shù)據(jù)個(gè)數(shù)相同,因此我們可以說數(shù)據(jù)是矢量化的。這些行數(shù)據(jù)可以一次性或成批地提供給模型,并且可以預(yù)先配置模型,以得到固定寬度的行數(shù)據(jù)。

2. 圖像和照片

也許你更習(xí)慣于在計(jì)算機(jī)視覺應(yīng)用中處理圖像或照片。

你使用的每個(gè)圖像本身都是一個(gè)固定寬度和高度的表格結(jié)構(gòu),每個(gè)單元格有用于表示黑白圖像的 1 個(gè)像素值或表示彩色圖像的 3 個(gè)像素值。

照片也是線性代數(shù)矩陣的一種。

與圖像相關(guān)的操作,如裁剪、縮放、剪切等,都是使用線性代數(shù)的符號和運(yùn)算來描述的。

3. one-hot 編碼

有時(shí)機(jī)器學(xué)習(xí)中要用到分類數(shù)據(jù)。

可能是用于解決分類問題的類別標(biāo)簽,也可能是分類輸入變量。

對分類變量進(jìn)行編碼以使它們更易于使用并通過某些技術(shù)進(jìn)行學(xué)習(xí)是很常見的。one-hot 編碼是一種常見的分類變量編碼。

one-hot 編碼可以理解為:創(chuàng)建一個(gè)表格,用列表示每個(gè)類別,用行表示數(shù)據(jù)集中每個(gè)例子。在列中為給定行的分類值添加一個(gè)檢查或「1」值,并將「0」值添加到所有其他列。

例如,共計(jì) 3 行的顏色變量:

red green blue 。..

這些變量可能被編碼為:

red, green, blue 1, 0, 0 0, 1, 0 0, 0, 1 。..

每一行都被編碼為一個(gè)二進(jìn)制矢量,一個(gè)被賦予「0」或「1」值的矢量。這是一個(gè)稀疏表征的例子,線性代數(shù)的一個(gè)完整子域。

4. 線性回歸

線性回歸是一種用于描述變量之間關(guān)系的統(tǒng)計(jì)學(xué)傳統(tǒng)方法。

該方法通常在機(jī)器學(xué)習(xí)中用于預(yù)測較簡單的回歸問題的數(shù)值。

描述和解決線性回歸問題有很多種方法,即找到一組系數(shù),用這些系數(shù)與每個(gè)輸入變量相乘并將結(jié)果相加,得出最佳的輸出變量預(yù)測。

如果您使用過機(jī)器學(xué)習(xí)工具或機(jī)器學(xué)習(xí)庫,解決線性回歸問題的最常用方法是通過最小二乘優(yōu)化,這一方法是使用線性回歸的矩陣分解方法解決的(例如 LU 分解或奇異值分解)。

即使是線性回歸方程的常用總結(jié)方法也使用線性代數(shù)符號:

y = A 。 b

其中,y 是輸出變量,A 是數(shù)據(jù)集,b 是模型系數(shù)。

5. 正則化

在應(yīng)用機(jī)器學(xué)習(xí)時(shí),我們往往尋求最簡單可行的模型來發(fā)揮解決問題的最佳技能。

較簡單的模型通常更擅長從具體示例泛化到未見過的數(shù)據(jù)。

在涉及系數(shù)的許多方法中,例如回歸方法和人工神經(jīng)網(wǎng)絡(luò),較簡單的模型通常具有較小的系數(shù)值。

一種常用于模型在數(shù)據(jù)擬合時(shí)盡量減小系數(shù)值的技術(shù)稱為正則化,常見的實(shí)現(xiàn)包括正則化的 L2 和 L1 形式。

這兩種正則化形式實(shí)際上是系數(shù)矢量的大小或長度的度量,是直接脫胎于名為矢量范數(shù)的線性代數(shù)方法。

6. 主成分分析

通常,數(shù)據(jù)集有許多列,列數(shù)可能達(dá)到數(shù)十、數(shù)百、數(shù)千或更多。

對具有許多特征的數(shù)據(jù)進(jìn)行建模具有一定的挑戰(zhàn)性。而且,從包含不相關(guān)特征的數(shù)據(jù)構(gòu)建的模型通常不如用最相關(guān)的數(shù)據(jù)訓(xùn)練的模型。

我們很難知道數(shù)據(jù)的哪些特征是相關(guān)的,而哪些特征又不相關(guān)。

自動(dòng)減少數(shù)據(jù)集列數(shù)的方法稱為降維,其中也許最流行的方法是主成分分析法(簡稱 PCA)。

該方法在機(jī)器學(xué)習(xí)中,為可視化和模型創(chuàng)建高維數(shù)據(jù)的投影。

PCA 方法的核心是線性代數(shù)的矩陣分解方法,可能會用到特征分解,更廣義的實(shí)現(xiàn)可以使用奇異值分解(SVD)。

7. 奇異值分解

另一種流行的降維方法是奇異值分解方法,簡稱 SVD。

如上所述,正如該方法名稱所示,它是源自線性代數(shù)領(lǐng)域的矩陣分解方法。

該方法在線性代數(shù)中有廣泛的用途,可直接應(yīng)用于特征選擇、可視化、降噪等方面。

在機(jī)器學(xué)習(xí)中我們會看到以下兩個(gè)使用 SVD 的情況。

8. 潛在語義分析

在用于處理文本數(shù)據(jù)的機(jī)器學(xué)習(xí)子領(lǐng)域(稱為自然語言處理),通常將文檔表示為詞出現(xiàn)的大矩陣。

例如,矩陣的列可以是詞匯表中的已知詞,行可以是文本的句子、段落、頁面或文檔,矩陣中的單元格標(biāo)記為單詞出現(xiàn)的次數(shù)或頻率。

這是文本的稀疏矩陣表示。矩陣分解方法(如奇異值分解)可以應(yīng)用于此稀疏矩陣,該分解方法可以提煉出矩陣表示中相關(guān)性最強(qiáng)的部分。以這種方式處理的文檔比較容易用來比較、查詢,并作為監(jiān)督機(jī)器學(xué)習(xí)模型的基礎(chǔ)。

這種形式的數(shù)據(jù)準(zhǔn)備稱為潛在語義分析(簡稱 LSA),也稱為潛在語義索引(LSI)。

9. 推薦系統(tǒng)

涉及產(chǎn)品推薦的預(yù)測建模問題被稱為推薦系統(tǒng),這是機(jī)器學(xué)習(xí)的一個(gè)子領(lǐng)域。

例如,基于你在亞馬遜上的購買記錄和與你類似的客戶的購買記錄向你推薦書籍,或根據(jù)你或與你相似的用戶在 Netflix 上的觀看歷史向你推薦電影或電視節(jié)目。

推薦系統(tǒng)的開發(fā)主要涉及線性代數(shù)方法。一個(gè)簡單的例子就是使用歐式距離或點(diǎn)積之類的距離度量來計(jì)算稀疏顧客行為向量之間的相似度。

像奇異值分解這樣的矩陣分解方法在推薦系統(tǒng)中被廣泛使用,以提取項(xiàng)目和用戶數(shù)據(jù)的有用部分,以備查詢、檢索及比較。

10. 深度學(xué)習(xí)

人工神經(jīng)網(wǎng)絡(luò)是一種非線性機(jī)器學(xué)習(xí)算法,它受大腦中信息處理元素的啟發(fā),其有效性已經(jīng)在一系列問題中得到驗(yàn)證,其中最重要的是預(yù)測建模。

深度學(xué)習(xí)是近期出現(xiàn)的、使用最新方法和更快硬件的人工神經(jīng)網(wǎng)絡(luò)的復(fù)興,這一方法使得在非常大的數(shù)據(jù)集上開發(fā)和訓(xùn)練更大更深的(更多層)網(wǎng)絡(luò)成為可能。深度學(xué)習(xí)方法通常會在機(jī)器翻譯、照片字幕、語音識別等一系列具有挑戰(zhàn)性的領(lǐng)域取得最新成果。

神經(jīng)網(wǎng)絡(luò)的執(zhí)行涉及線性代數(shù)數(shù)據(jù)結(jié)構(gòu)的相乘和相加。如果擴(kuò)展到多個(gè)維度,深度學(xué)習(xí)方法可以處理向量、矩陣,甚至輸入和系數(shù)的張量,此處的張量是一個(gè)兩維以上的矩陣。

線性代數(shù)是描述深度學(xué)習(xí)方法的核心,它通過矩陣表示法來實(shí)現(xiàn)深度學(xué)習(xí)方法,例如 Google 的 TensorFlow Python 庫,其名稱中包含「tensor」一詞。

責(zé)任編輯:lq
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:【初學(xué)者】10個(gè)例子帶你了解機(jī)器學(xué)習(xí)中的線性代數(shù)

文章出處:【微信號:zenRRan,微信公眾號:深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問世以來,多個(gè)在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競爭優(yōu)勢,而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 02-04 14:44 ?568次閱讀

    學(xué)習(xí)電子電路中常見的問題

    電子電路作為現(xiàn)代科技的基礎(chǔ),其學(xué)習(xí)過程中常會遇到各種理論和實(shí)踐問題。無論是初學(xué)者還是有一定經(jīng)驗(yàn)的工程師,都可能面臨電路設(shè)計(jì)、元器件選型、信號處理等方面的困惑。本文將系統(tǒng)梳理電子電路學(xué)習(xí)常見的典型
    的頭像 發(fā)表于 01-20 07:38 ?294次閱讀

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見錯(cuò)誤。如果對這些錯(cuò)誤置之不理,日后可能會引發(fā)諸多麻煩!只要我們密切關(guān)注
    的頭像 發(fā)表于 01-07 15:37 ?254次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 <b class='flag-5'>個(gè)</b><b class='flag-5'>常見</b>錯(cuò)誤與局限性

    時(shí)鐘周期、機(jī)器周期、指令周期介紹

    的描述里也叫節(jié)拍,即將一個(gè)機(jī)器周期劃分成若干個(gè)相等的時(shí)間段,每一段僅完成一個(gè)基本操作,用一個(gè)電平信號寬度對應(yīng)。 個(gè)人理解:時(shí)鐘周期取決于晶振頻率,它是
    發(fā)表于 11-17 07:54

    自動(dòng)駕駛中常提的“強(qiáng)化學(xué)習(xí)”是個(gè)啥?

    [首發(fā)于智駕最前沿微信公眾號]在談及自動(dòng)駕駛時(shí),有些方案中會提到“強(qiáng)化學(xué)習(xí)(Reinforcement Learning,簡稱RL)”,強(qiáng)化學(xué)習(xí)是一類讓機(jī)器通過試錯(cuò)來學(xué)會做決策的技術(shù)。簡單理解
    的頭像 發(fā)表于 10-23 09:00 ?748次閱讀
    自動(dòng)駕駛中常提的“強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>”是<b class='flag-5'>個(gè)</b>啥?

    一文讀懂大模型常見10個(gè)核心概念

    如今高效智能的AI大模型,正如雨后春筍般破土而出,人們對于AI大模型的學(xué)習(xí)與探索之路,也愈發(fā)寬闊平坦。雖然AI工具已不再陌生,但其中關(guān)于AIPrompt、大模型的吞吐量、蒸餾與量化、私有化知識庫等
    的頭像 發(fā)表于 09-22 17:02 ?1308次閱讀
    一文讀懂大模型<b class='flag-5'>常見</b>的<b class='flag-5'>10</b><b class='flag-5'>個(gè)</b>核心概念

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文
    發(fā)表于 07-31 11:38

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發(fā)表于 07-16 15:34 ?2967次閱讀

    盤點(diǎn)#機(jī)器人開發(fā)平臺

    地瓜機(jī)器人RDK X5開發(fā)套件地瓜機(jī)器人RDK X5開發(fā)套件產(chǎn)品介紹 旭日5芯片10TOPs算力-電子發(fā)燒友網(wǎng)機(jī)器人開發(fā)套件 Kria KR
    發(fā)表于 05-13 15:02

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用

    : 一、機(jī)器人視覺:從理論到實(shí)踐 第7章詳細(xì)介紹了ROS2在機(jī)器視覺領(lǐng)域的應(yīng)用,涵蓋了相機(jī)標(biāo)定、OpenCV集成、視覺巡線、二維碼識別以及深度學(xué)習(xí)目標(biāo)檢測等內(nèi)容。通過
    發(fā)表于 05-03 19:41

    【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】+ROS2應(yīng)用案例

    整書的內(nèi)容非常多有476頁。非常厚,像本厚厚的工具書 拿出文章中的小節(jié)加以書寫吧 視覺應(yīng)用:二維碼識別 二維碼識別是視覺應(yīng)用中的一個(gè)重要部分,它在機(jī)器人導(dǎo)航、物品追蹤和信息交互等方面有著廣泛
    發(fā)表于 04-27 11:42

    ESD防護(hù)設(shè)計(jì)中的10個(gè)常見誤區(qū),你中招了嗎?

    在現(xiàn)代電子產(chǎn)品中,ESD(靜電放電)防護(hù)已成為設(shè)計(jì)中不可忽視的一環(huán)。然而,即便是經(jīng)驗(yàn)豐富的工程師,也常會在ESD設(shè)計(jì)中掉進(jìn)一些看似“理所當(dāng)然”的誤區(qū)。以下總結(jié)了10個(gè)在實(shí)際設(shè)計(jì)中最常見的陷阱,看看
    的頭像 發(fā)表于 04-24 09:51 ?1105次閱讀
    ESD防護(hù)設(shè)計(jì)中的<b class='flag-5'>10</b><b class='flag-5'>個(gè)</b><b class='flag-5'>常見</b>誤區(qū),你中招了嗎?

    面向AI與機(jī)器學(xué)習(xí)應(yīng)用的開發(fā)平臺 AMD/Xilinx Versal? AI Edge VEK280

    AMD/Xilinx Versal? AI Edge VEK280評估套件是一款面向AI與機(jī)器學(xué)習(xí)應(yīng)用的開發(fā)平臺,專為邊緣計(jì)算場景優(yōu)化設(shè)計(jì)。以下從核心配置、技術(shù)特性、應(yīng)用場景及開發(fā)支持等方面進(jìn)行詳細(xì)
    的頭像 發(fā)表于 04-11 18:33 ?2599次閱讀
    面向AI與<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>應(yīng)用的開發(fā)平臺 AMD/Xilinx Versal? AI Edge VEK280

    函數(shù)指針的六個(gè)常見應(yīng)用場景

    函數(shù)指針在嵌入式開發(fā)中有著廣泛的應(yīng)用,它讓代碼更加靈活,減少冗余,提高可擴(kuò)展性。很多時(shí)候,我們需要根據(jù)不同的情況動(dòng)態(tài)調(diào)用不同的函數(shù),而函數(shù)指針正是實(shí)現(xiàn)這一需求的重要工具。本文將介紹個(gè)常見的函數(shù)指針
    的頭像 發(fā)表于 04-07 11:58 ?1540次閱讀
    函數(shù)指針的六<b class='flag-5'>個(gè)</b><b class='flag-5'>常見</b>應(yīng)用場景

    十大鮮為人知卻功能強(qiáng)大的機(jī)器學(xué)習(xí)模型

    本文轉(zhuǎn)自:QuantML當(dāng)我們談?wù)?b class='flag-5'>機(jī)器學(xué)習(xí)時(shí),線性回歸、決策樹和神經(jīng)網(wǎng)絡(luò)這些常見的算法往往占據(jù)了主導(dǎo)地位。然而,除了這些眾所周知的模型之外,還存在一些鮮為人知但功能強(qiáng)大的算法,它們能夠以驚人的效率
    的頭像 發(fā)表于 04-02 14:10 ?1128次閱讀
    十大鮮為人知卻功能強(qiáng)大的<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>模型