本科物理、博士電子工程,還研究過一年藏藥的李飛飛最終卻一頭扎進(jìn)了人工智能的浪潮。在 ACM 的一次訪談中,斯坦福大學(xué)教授李飛飛談到了自己在計(jì)算機(jī)視覺和神經(jīng)科學(xué)之路上的探索歷程以及未來的目標(biāo)。
斯坦福大學(xué)的教授李飛飛在距今最近的一次人工智能寒冬期間開始了她的職業(yè)生涯,但是她提供了一個(gè)幫助寒冬解凍的想法。通過創(chuàng)建包含一千五百萬張圖像的層級組織圖像數(shù)據(jù)庫 Image-Net,她證明了豐富的數(shù)據(jù)集在開發(fā)算法方面的重要性——并發(fā)布了一項(xiàng)競賽,使得 Geoffrey Hinton、Ilya Sutskever 和 Alex Krizhevsky 在深度卷積神經(jīng)網(wǎng)絡(luò)方面的工作得到了廣泛關(guān)注。最近被評為ACM fellow的李飛飛如今主管著斯坦福人工智能實(shí)驗(yàn)室(Stanford Artificial Intelligence Lab)和斯坦福視覺與學(xué)習(xí)實(shí)驗(yàn)室(Stanford Vision and Learning Lab),致力于開發(fā)能夠使計(jì)算機(jī)和機(jī)器人會看、會思考的智能算法。在本次采訪中,她談到了計(jì)算機(jī)視覺和神經(jīng)科學(xué),以及如何增加這一領(lǐng)域的多樣性。
記者:您的本科專業(yè)是物理學(xué),您的博士研究方向是電子工程。是什么吸引您進(jìn)入計(jì)算機(jī)視覺和人工智能領(lǐng)域的呢?
李飛飛:在普林斯頓讀本科的時(shí)候,我有很大的學(xué)術(shù)自由。上大二那一年,我就為 20 世紀(jì)早期物理學(xué)家的著作而著迷——薛定諤、愛因斯坦等人在職業(yè)生涯的后期都對生命和智能有很強(qiáng)的好奇心。然后我做了幾個(gè)關(guān)于神經(jīng)科學(xué)和建模的研究項(xiàng)目;我被迷住了。我決定攻讀結(jié)合認(rèn)知神經(jīng)科學(xué)和計(jì)算機(jī)視覺的博士學(xué)位——我們那時(shí)還不管它叫 AI。
那是在所謂的 AI 寒冬時(shí)期,當(dāng)時(shí)的人們意識到技術(shù)沒有達(dá)到他們炒作的高度,于是對 AI 的興趣和投資都冷卻下去。
那時(shí)候我正在博士學(xué)習(xí)階段,確實(shí)是一段有趣的時(shí)間。機(jī)器學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域成為了一個(gè)非常重要的工具,所以我也屬于那一代在這個(gè)學(xué)科領(lǐng)域接受了大量訓(xùn)練的學(xué)生。
記者:那種訓(xùn)練有助于明確一個(gè)后來被證明對人工智能領(lǐng)域非常關(guān)鍵的思想,即創(chuàng)建更好的數(shù)據(jù)集能夠幫助計(jì)算機(jī)做出更好的決策。這促使您建立了 ImageNet 這個(gè)層級組織的圖像數(shù)據(jù)庫,其中每一個(gè)節(jié)點(diǎn)都由成百上千張圖片描述。
李飛飛:在人工智能領(lǐng)域,有一些每個(gè)人都會遇到的重要問題;我們稱其為「圣杯問題」。其中之一就是目標(biāo)理解,它是視覺智能的構(gòu)造模塊。人類特別擅長識別成千上萬甚至上百萬的目標(biāo),而且依據(jù)常識就能不費(fèi)吹灰之力地做到。所以我在博士階段以及作為助理教授的前幾年和領(lǐng)域內(nèi)的很多人一起研究過這個(gè)問題。那個(gè)時(shí)期,人們付出了巨大的努力來設(shè)計(jì)能夠識別物體的機(jī)器學(xué)習(xí)算法。我們也必須尋找合理的方式來測試它們的性能。那時(shí)候也有一些很好的數(shù)據(jù)集,但是通常都比較小,只有一二十種不同的物體。
那時(shí)候數(shù)據(jù)集很小,限制了能夠開發(fā)的模型類別,因?yàn)闆]辦法訓(xùn)練出能夠識別多樣性的算法,即使是像「貓」這樣的單個(gè)對象。
盡管人們在那個(gè)年代一直在取得進(jìn)步,但是這個(gè)領(lǐng)域似乎陷入了困境,因?yàn)樗惴o法令人滿意。所以大約在 2006 年左右,我的學(xué)生和我開始思考解決目標(biāo)識別問題的不同方式。我們認(rèn)為,與其設(shè)計(jì)出在小規(guī)模數(shù)據(jù)集上過擬合的模型,我們更愿意考慮規(guī)模非常大的數(shù)據(jù)集,例如上百萬個(gè)對象,這將推動機(jī)器學(xué)習(xí)模型朝著完全不同的方向發(fā)展。
記者:所以您開始了 ImageNet 的工作,這在那個(gè)時(shí)候看上去很瘋狂。
李飛飛:我們的目標(biāo)是整理出英語語言中的所有名詞,然后采集成百上千張圖片來描述每一個(gè)對象的變化,例如蘋果或德國牧羊犬。我們最后下載并篩選了至少十億張圖片,最終通過眾包將 ImageNet 整合在一起。這個(gè)數(shù)據(jù)集有 1500 萬張圖片,22000 個(gè)物體類別。
記者:在斯坦福視覺和學(xué)習(xí)實(shí)驗(yàn)室的研究中,您不僅僅與技術(shù)專家密切合作,與神經(jīng)科學(xué)家也有合作。您能談一談這種合作是如何進(jìn)行的嗎?
李飛飛:從根本上來說,AI 是一個(gè)技術(shù)領(lǐng)域。它的最終目標(biāo)是賦予機(jī)器以智能。但是由于人類的智能與這個(gè)領(lǐng)域有如此緊密的關(guān)聯(lián),因此擁有神經(jīng)科學(xué)和認(rèn)知科學(xué)的背景和合作者非常有幫助。以今天的深度學(xué)習(xí)革命為例,我們今天在神經(jīng)網(wǎng)絡(luò)中所用的算法正是受到了上世紀(jì)五六十年代關(guān)于神經(jīng)科學(xué)的經(jīng)典研究的啟發(fā),那個(gè)時(shí)候科學(xué)家發(fā)現(xiàn)神經(jīng)元是以分層的方式連在一起的,并且以這種方式發(fā)送信息。同時(shí),認(rèn)知科學(xué)一直是指引 AI 尋求不同種類的任務(wù)的重要組成部分。例如,很多計(jì)算機(jī)科學(xué)家都在其啟發(fā)之下進(jìn)行目標(biāo)識別的研究,因?yàn)檎J(rèn)知科學(xué)家已經(jīng)在這方面做了一些工作。
「我們的目標(biāo)是整理出英語語言中的所有名詞,然后采集...... 圖片來描述每一個(gè)對象的變化,例如蘋果和德國牧羊犬。」
記者:您目前的交叉學(xué)科合作之一就是一個(gè)實(shí)現(xiàn)了好奇心驅(qū)動學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)。
李飛飛:人類的小孩通過對世界的探索進(jìn)行學(xué)習(xí)。我們嘗試創(chuàng)建具有這些功能的算法——計(jì)算機(jī)由好奇心來驅(qū)動,而不是在類似于有標(biāo)簽的圖像一樣的傳統(tǒng)任務(wù)進(jìn)行訓(xùn)練。
記者:您之前講過需要從人文角度來思考人工智能,而不是僅僅從技術(shù)角度去思考,而且您也幫助啟動了斯坦福大學(xué)以人為本的人工智能倡議(HAI)。您能否談?wù)勛约旱哪繕?biāo)呢?
李飛飛:我們希望建立一個(gè)致力于增強(qiáng)人類能力的技術(shù)的研究所。以機(jī)器人為例,機(jī)器能夠做人類不能做的事情。機(jī)器可以去危險(xiǎn)的地方。它們可以潛入到深水區(qū),去拆除爆炸設(shè)備。機(jī)器也擁有人類沒有的精確度和力量。但是人類有更多的穩(wěn)定性和理解力,并且能夠更容易地與彼此合作。
我們可以想象未來很多潛在的場景,在這些場景中,機(jī)器人在輔助或者增強(qiáng)人類的工作,而并非取代他們。
記者:您也一直在談?wù)撔枰谟?jì)算機(jī)科學(xué)和人工智能研究中加入更加多元的聲音。
李飛飛:如果我們相信機(jī)器的價(jià)值代表了人類的價(jià)值,我們就需要相信我們完全代表了人類,因?yàn)槲覀冮_發(fā)并部署了我們的技術(shù)。所以鼓勵具有不同背景的學(xué)生參與到這個(gè)領(lǐng)域是很重要的。此刻,意識到技術(shù)的社會影響力在提升同樣重要。此時(shí)的風(fēng)險(xiǎn)高于以往任何時(shí)候,因此我們也需要邀請具有不同背景的未來商業(yè)領(lǐng)袖、政策制定者、人本主義者、社會科學(xué)家,使他們具備技術(shù)背景,與科技界進(jìn)行互動,將多元的思想引入這個(gè)過程中。
記者:您能給我講講斯坦福大學(xué)為高中生開設(shè)的 AI4All 項(xiàng)目嗎?聽說它來源于斯坦福大學(xué)人工智能實(shí)驗(yàn)室的早期外展暑期計(jì)劃(SAILORS)?
李飛飛:AI4ALL 的目標(biāo)是通過針對來自各種經(jīng)濟(jì)和文化背景的學(xué)生來增加人工智能領(lǐng)域的多樣性。這是一個(gè)我們感到非常自豪并且非常樂意支持的社區(qū)。名叫 Amy Jin 的高中生是我們最早的 SAILORS 學(xué)生之一,她在我的實(shí)驗(yàn)室持續(xù)做關(guān)于手術(shù)培訓(xùn)視頻的工作。然后,她就和我的團(tuán)隊(duì)一起撰寫了一篇論文,并最終被 NIPS2017 選中。更重要的是,她在 150 篇論文中獲得了最佳論文獎。我們還有學(xué)生在他們的學(xué)校啟動了機(jī)器人實(shí)驗(yàn)室,舉辦以女孩為中心的黑客馬拉松。他們中的很多人正在專注于將 AI 用于良好的社會用途的應(yīng)用,從優(yōu)化救護(hù)車部署到癌癥研究和網(wǎng)絡(luò)欺凌。
-
人工智能
+關(guān)注
關(guān)注
1819文章
50134瀏覽量
265756 -
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
9文章
1715瀏覽量
47654 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8556瀏覽量
137049
原文標(biāo)題:李飛飛ACM訪談:機(jī)器在輔助并增強(qiáng)人類的工作,而并非取代人類
文章出處:【微信號:aicapital,微信公眾號:全球人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
十進(jìn)制計(jì)算機(jī)硬件體系結(jié)構(gòu)及“獨(dú)值”量化邏輯運(yùn)算革命(一)
上海計(jì)算機(jī)視覺企業(yè)行學(xué)術(shù)沙龍走進(jìn)西井科技
工控機(jī)與普通計(jì)算機(jī)的核心差異解析
曦智科技亮相2025多樣性算力產(chǎn)業(yè)發(fā)展大會
奇異摩爾受邀出席2025多樣性算力產(chǎn)業(yè)發(fā)展大會
新一代神經(jīng)擬態(tài)類腦計(jì)算機(jī)“悟空”發(fā)布,神經(jīng)元數(shù)量超20億
易控智駕榮獲計(jì)算機(jī)視覺頂會CVPR 2025認(rèn)可
工業(yè)計(jì)算機(jī)的重要性
自動化計(jì)算機(jī)的功能與用途
工業(yè)計(jì)算機(jī)與商用計(jì)算機(jī)的區(qū)別有哪些
NVIDIA驅(qū)動的現(xiàn)代超級計(jì)算機(jī)如何突破速度極限并推動科學(xué)發(fā)展
??低暱萍贾κ刈o(hù)生物多樣性之美
中國科學(xué)院西安光機(jī)所在計(jì)算成像可解釋性深度學(xué)習(xí)重建方法取得進(jìn)展
利用邊緣計(jì)算和工業(yè)計(jì)算機(jī)實(shí)現(xiàn)智能視頻分析
一文帶你了解工業(yè)計(jì)算機(jī)尺寸
李飛飛ACM訪談:計(jì)算機(jī)視覺和神經(jīng)科學(xué),以及如何增加這一領(lǐng)域的多樣性
評論