1. 自從來(lái)到阿里做自然語(yǔ)言理解的工程師,睡眠時(shí)間還能保證嗎?
在阿里挺多年了,已經(jīng)習(xí)慣了這種工作節(jié)奏,一般我們?cè)陧?xiàng)目關(guān)鍵節(jié)點(diǎn)的時(shí)候會(huì)比較忙,別的時(shí)候其實(shí)還好的,所以正常情況下每天的睡眠時(shí)間還是有保證的。
2. 每天睜開(kāi)眼后,最大的壓力是什么?
現(xiàn)在線上每天有非常多的用戶在使用我們的nlp服務(wù),第一在阿里的技術(shù)體系里,服務(wù)的可用性是底線,所以一部分壓力來(lái)自擔(dān)心我們服務(wù)會(huì)不會(huì)出故障,第二用戶對(duì)自然語(yǔ)言理解的要求是比較高的,我們每天都會(huì)收到用戶的反饋,然后我們讓機(jī)器去優(yōu)化語(yǔ)言理解的能力。
3. 作為一個(gè)阿里人工智能實(shí)驗(yàn)室的高級(jí)算法專家,您每天的工作日程,包括休息日,您會(huì)做些什么呢?
我們每天早上會(huì)開(kāi)一個(gè)晨會(huì),匯總下過(guò)去24小時(shí)收集到的用戶反饋,然后討論下解決的方案,接下來(lái)就會(huì)安排相應(yīng)同學(xué)去解決這些問(wèn)題。同時(shí)我們自然語(yǔ)言理解模型的優(yōu)化也是一個(gè)持續(xù)的過(guò)程,這里面涉及到我們對(duì)深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的調(diào)整還有訓(xùn)練方法的優(yōu)化,所以我們每天會(huì)有一定的時(shí)間去跟蹤最新的技術(shù)動(dòng)態(tài)和論文,同時(shí)我們也會(huì)按照制定的研發(fā)計(jì)劃做實(shí)驗(yàn),逐步推進(jìn)技術(shù)的進(jìn)步。
4. 您喜歡阿里實(shí)驗(yàn)室里面的工作氛圍嗎?跟您一起在實(shí)驗(yàn)室工作的有多少人呢?都有哪些方向?
目前人工智能實(shí)驗(yàn)室研究的方向包括了自然語(yǔ)言理解、知識(shí)圖譜、語(yǔ)音識(shí)別、聲音信號(hào)處理、計(jì)算機(jī)視覺(jué)、機(jī)器人控制、硬件研發(fā)、云端技術(shù)研發(fā)。同時(shí)我們還有市場(chǎng)部和產(chǎn)品部門(mén)的同學(xué),來(lái)自各種背景的同學(xué)聚集在一起,有很多可以彼此分享的內(nèi)容,對(duì)大家的知識(shí)和閱歷都是一個(gè)很好的擴(kuò)展。
5. 有人說(shuō),自然語(yǔ)言理解是AI領(lǐng)域排名第一的難題和挑戰(zhàn),您認(rèn)同嗎?
確實(shí)自然語(yǔ)言理解是目前非常難的問(wèn)題,相比語(yǔ)音和圖像的感知智能,語(yǔ)言是認(rèn)知智能,人類的知識(shí)乃至我們的文明都是通過(guò)文字來(lái)記載的,所以如果機(jī)器可以實(shí)現(xiàn)完善的自然語(yǔ)言理解,那么這個(gè)和科幻片中的人工智能就很接近了。
所以我認(rèn)為自然語(yǔ)言理解也是可以分層來(lái)看的,目前我們?cè)谔熵埦`里做的大量的任務(wù)型的理解,是第一個(gè)層次的理解能力,我們認(rèn)為基于目前的技術(shù),這部分已經(jīng)可以做得比較好了,換句話說(shuō),接下來(lái)大量的任務(wù)可以通過(guò)語(yǔ)言來(lái)指揮機(jī)器去完成。再往深入一點(diǎn),就是信息獲取和問(wèn)答的能力,這涉及到對(duì)人類知識(shí)的大規(guī)模建模,以及對(duì)用戶問(wèn)題的深度理解,所以還是目前非常有挑戰(zhàn)的問(wèn)題。第三個(gè)層面,就是讓機(jī)器和人進(jìn)行自然的交流,機(jī)器能有情商,可以感知到用戶的情緒,機(jī)器也能有一定的性格,目前來(lái)看,這是非常困難的工作,目前有挺多類似的demo,但是往往做出來(lái)都給人一種智障的感覺(jué)。
所以總結(jié)來(lái)講,對(duì)機(jī)器自然語(yǔ)言理解能力的提升,還有非常漫長(zhǎng)的路要走,甚至需要基礎(chǔ)科學(xué)的突破。
6. 在自然語(yǔ)言理解這個(gè)領(lǐng)域,您最欣賞和佩服的人是誰(shuí)?
在這里領(lǐng)域我最佩服和欣賞的是深度學(xué)習(xí)四大天王之一的Prof. Yoshua Bengio。Bengio教授帶領(lǐng)的團(tuán)隊(duì)在自然語(yǔ)言理解領(lǐng)域的深度網(wǎng)絡(luò)上做了很多大膽的創(chuàng)新,也取得了很不錯(cuò)的成果,始終走在自然語(yǔ)言理解探索的最前沿。
7. 在天貓精靈這款產(chǎn)品的開(kāi)發(fā)中,您在里面具體會(huì)承擔(dān)哪些方面的工作呢?
我及我的團(tuán)隊(duì)主要負(fù)責(zé)天貓精靈的自然語(yǔ)言理解技術(shù),在這里我主要承擔(dān)三部分的工作,第一個(gè)是模型的設(shè)計(jì)及優(yōu)化,選擇合適的算法方案來(lái)實(shí)現(xiàn)最優(yōu)的效果,第二個(gè)是設(shè)計(jì)這套自然語(yǔ)言理解系統(tǒng),從無(wú)到有,經(jīng)歷了多代的演進(jìn),我們搭建了這套我們認(rèn)為是比較適合目前的語(yǔ)音交互的自然語(yǔ)言理解系統(tǒng),第三個(gè)是解決問(wèn)題,當(dāng)遇到具體的問(wèn)題時(shí),我需要去分析這個(gè)問(wèn)題在哪個(gè)模塊去解決是最合適的。同時(shí)我也會(huì)跟進(jìn)團(tuán)隊(duì)同學(xué)的工作,并且review code。
8. 您來(lái)實(shí)驗(yàn)室之前,以及工作了這么久之后,對(duì)自然語(yǔ)言理解用于解決實(shí)際問(wèn)題上,會(huì)不會(huì)有一些不同的新的認(rèn)知和感悟?
我是人工智能實(shí)驗(yàn)室創(chuàng)始團(tuán)隊(duì)成員,之前一直在阿里集團(tuán)大數(shù)據(jù)部門(mén)從事圖像識(shí)別、推薦系統(tǒng)等算法工作。
在人工智能實(shí)驗(yàn)室一直從事自然語(yǔ)言理解領(lǐng)域的工作,在解決實(shí)際問(wèn)題的時(shí)候,可以分享下最大的感悟吧,就是細(xì)節(jié)是魔鬼,整個(gè)算法系統(tǒng)涉及到大量的算法子模塊,我們?cè)谶M(jìn)行效果優(yōu)化的過(guò)程中,發(fā)現(xiàn)一些容易被我們忽略的細(xì)節(jié),如果進(jìn)行了優(yōu)化,會(huì)對(duì)整體效果帶來(lái)明顯的提升,感悟就是要嚴(yán)謹(jǐn)?shù)姆治鰡?wèn)題然后要去懷疑細(xì)節(jié)。
9. 在您解決實(shí)際問(wèn)題中,會(huì)綜合用到其他哪些技能呢?比如,知識(shí)圖譜?
在解決實(shí)際問(wèn)題的時(shí)候,我們會(huì)去嘗試各種文本的技術(shù),當(dāng)然知識(shí)圖譜對(duì)我們的自然語(yǔ)言理解是非常重要的。知識(shí)圖譜可以給我們很多先驗(yàn)知識(shí),它包含了對(duì)這個(gè)世界的認(rèn)知信息,是我們進(jìn)行意圖判斷很重要的參考。
10. 對(duì)于對(duì)自然語(yǔ)言處理非常感興趣的,正在努力學(xué)習(xí),希望未來(lái)從事這個(gè)領(lǐng)域相關(guān)工作的同學(xué),從您自身出發(fā),有沒(méi)有想要分享的一些心得感悟?
自然語(yǔ)言理解需要兩方面的能力,機(jī)器學(xué)習(xí)的能力,當(dāng)然也包括目前炙手可熱的深度學(xué)習(xí)方法,和對(duì)語(yǔ)言本身特點(diǎn)的理解,所以我覺(jué)得這兩部分的內(nèi)容的學(xué)習(xí)和實(shí)踐都很重要。
11.如果讓您給未來(lái)會(huì)從事自然語(yǔ)言理解實(shí)戰(zhàn)相關(guān)工作的同學(xué)提三個(gè)中肯的建議,您覺(jué)得是什么?
第一個(gè),對(duì)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法能有很扎實(shí)的掌握,更深入一點(diǎn),比如凸優(yōu)化等數(shù)學(xué)理論能有所掌握。
第二個(gè),語(yǔ)音本身是很有魅力的,是一種人類創(chuàng)造出來(lái)的符號(hào)語(yǔ)言,所以對(duì)語(yǔ)言本身的理解,是我們目前發(fā)現(xiàn)自然語(yǔ)言理解技術(shù)進(jìn)一步前進(jìn)很需要去思考的。
第三個(gè),其實(shí)和所有的算法工作是一樣的,就是要養(yǎng)成思辨的思維習(xí)慣(critical thinking)和獨(dú)立的思考能力(independent thinking)。
12. 目前NLP領(lǐng)域,大致會(huì)分為哪些具體的工作,一般來(lái)說(shuō),不同的工種,不同的工作年限,不同的學(xué)歷,工資待遇大致會(huì)是什么范圍?
我們這邊,大致會(huì)有三種類型的工作,一種是做算法模型的,包括深度學(xué)習(xí)模型還是傳統(tǒng)的模型,第二種是做自然語(yǔ)言理解系統(tǒng)的搭建的,第三種是利用自然語(yǔ)言理解技術(shù)去實(shí)現(xiàn)業(yè)務(wù)邏輯和產(chǎn)品功能的。目前來(lái)講這部分工程師的待遇還是相當(dāng)有競(jìng)爭(zhēng)力的。
13. 如果想加入您的團(tuán)隊(duì),您會(huì)有哪些要求呢?
對(duì)技術(shù)的熱愛(ài),也就是對(duì)做的技術(shù)有熱情,會(huì)用心去思考所做技術(shù)的每個(gè)細(xì)節(jié)。有扎實(shí)的技術(shù)基礎(chǔ),算法的基礎(chǔ)和代碼的基礎(chǔ)。
14. 如果重新選擇,還會(huì)選擇NLP嗎?
是的,還會(huì)選擇nlp,因?yàn)檫@部分的技術(shù)是我們走向真正的智能所需要去突破的核心技術(shù)。這是這幾年發(fā)展速度會(huì)非??斓念I(lǐng)域。
15. 從技術(shù)上,以及個(gè)人理解上,您會(huì)將NLP的發(fā)展分為幾個(gè)階段?下一個(gè)階段NLP將會(huì)是一個(gè)怎樣的趨勢(shì)?
我其實(shí)在回答第5個(gè)問(wèn)題的時(shí)候已經(jīng)回答了這個(gè)問(wèn)題:
我認(rèn)為自然語(yǔ)言理解也是可以分層來(lái)看的,目前我們?cè)谔熵埦`里做的大量的任務(wù)型的理解,是第一個(gè)層次的理解能力,我們認(rèn)為基于目前的技術(shù),這部分已經(jīng)可以做得比較好了,換句話說(shuō),接下來(lái)大量的任務(wù)可以通過(guò)語(yǔ)言來(lái)指揮機(jī)器去完成。再往深入一點(diǎn),就是信息獲取和問(wèn)答的能力,這涉及到對(duì)人類知識(shí)的大規(guī)模建模,以及對(duì)用戶問(wèn)題的深度理解,所以還是目前非常有挑戰(zhàn)的問(wèn)題。第三個(gè)層面,就是讓機(jī)器和人進(jìn)行自然的連續(xù)交流,機(jī)器能有情商,可以感知到用戶的情緒,機(jī)器也能有一定的性格,目前來(lái)看,這是非常困難的工作,目前有挺多類似的demo,但是往往做出來(lái)都給人一種智障的感覺(jué)。
目前來(lái)看,第一個(gè)階段,任務(wù)型的nlp已經(jīng)可以比較好的達(dá)成了,第二個(gè)階段,知識(shí)庫(kù)的建設(shè)和知識(shí)應(yīng)用于自然語(yǔ)言交互,會(huì)是接下來(lái)很重要的趨勢(shì)。
16. 如果用一句話總結(jié)您所做的工作,用一句非常走心的話,別太套路,您覺(jué)得是什么?
用最前沿的技術(shù),讓人可以直接用語(yǔ)言與機(jī)器進(jìn)行自然交流,讓內(nèi)容和服務(wù)變得隨口既來(lái),讓更多的人能享受到智能時(shí)代所帶來(lái)的便捷。
-
工程師
+關(guān)注
關(guān)注
59文章
1603瀏覽量
71126 -
阿里
+關(guān)注
關(guān)注
6文章
466瀏覽量
34218
發(fā)布評(píng)論請(qǐng)先 登錄
電子工程師的雙標(biāo)瞬間 #電子 #電子愛(ài)好者 #電子工程師 #揚(yáng)興科技 #雙標(biāo)
自然語(yǔ)言處理NLP的概念和工作原理
什么是BSP工程師
云知聲論文入選自然語(yǔ)言處理頂會(huì)EMNLP 2025
想成為硬件工程師?我教你??!你得先學(xué)會(huì)這些...... #硬件工程師 #電子工程師 #電子愛(ài)好者 #電子行業(yè)
硬件工程師面試必會(huì):10個(gè)核心考點(diǎn)#硬件設(shè)計(jì) #硬件工程師 #電路設(shè)計(jì) #電路設(shè)計(jì)
硬件工程師看了只會(huì)找個(gè)角落默默哭泣#硬件工程師 #MDD #MDD辰達(dá)半導(dǎo)體 #產(chǎn)品經(jīng)理 #軟件工程師
如何成為一名合格的KaihongOS北向應(yīng)用開(kāi)發(fā)工程師
如何成為一名嵌入式軟件工程師?
自然語(yǔ)言提示原型在英特爾Vision大會(huì)上首次亮相
在阿里做自然語(yǔ)言理解工程師是一種什么樣的體驗(yàn)
評(píng)論