91精品国产一区二区无码,91视频网站日韩97,亚洲成人精品一区在线观看

谷歌在不久前的I/O大會(huì)上推出了輔助人們高效撰寫(xiě)郵件的智能寫(xiě)作助手。在深度神經(jīng)網(wǎng)絡(luò)的幫助下，它可以根據(jù)用戶很少的輸入信息就推斷出接下來(lái)想要寫(xiě)入文本，就如知心好友一般默契無(wú)間了！我們先來(lái)感受一下在它的幫助下寫(xiě)郵件多么暢快：

智能寫(xiě)作是基于一年前谷歌發(fā)布的智能回復(fù)功能進(jìn)一步研發(fā)而成的。先前的智能回復(fù)功能通過(guò)分析郵件內(nèi)容來(lái)幫助用戶快速撰寫(xiě)回復(fù)郵件使用戶在移動(dòng)端處理郵件的效率有了大幅的提升。

它基于人類(lèi)語(yǔ)言中的層級(jí)結(jié)構(gòu)，從字母到單詞、從短語(yǔ)到句子、從段落到章節(jié)和整篇完整表達(dá)的內(nèi)容。研究人員們訓(xùn)練出了了一系列層級(jí)模塊用于學(xué)習(xí)、記憶和識(shí)別一種特定的模式。在足夠多樣本的訓(xùn)練下層級(jí)模型取得了比LSTM更好的效果，并具有了一定的語(yǔ)音表達(dá)能力。下圖中藍(lán)色字體就是模型分析郵件后為用戶生成出備選的恢復(fù)內(nèi)容。

但從智能回復(fù)到智能寫(xiě)作助手的研發(fā)過(guò)程中，除了迅速響應(yīng)大規(guī)模用戶的需求、還需要兼顧公平和用戶的隱私。

首先在用戶撰寫(xiě)郵件時(shí)，為了不使用戶感受到明顯的延遲，其響應(yīng)需要在100ms以內(nèi)，這要求在模型的效率和復(fù)雜度上做有效的權(quán)衡；目前Gmail擁有14億以上的用戶，所以模型需要有足夠的容量滿足各種不同用戶的個(gè)性化需求；除了速度和規(guī)模外，還需要防止這一功能由于訓(xùn)練數(shù)據(jù)產(chǎn)生偏見(jiàn)，并且也要符合嚴(yán)格的隱私規(guī)定，防止用戶的隱私信息泄露。由于研究人員不可以進(jìn)入email中，所以所有的機(jī)器學(xué)習(xí)系統(tǒng)都是運(yùn)行在他們不可讀的數(shù)據(jù)集上的。

尋找合適的模型

典型的語(yǔ)言生成模型包括N-Gram、神經(jīng)詞袋和循環(huán)神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型，它們通過(guò)先前詞匯預(yù)測(cè)后續(xù)詞匯或者句子。然而在郵件中，模型只有當(dāng)前郵件對(duì)話這一單一的信號(hào)來(lái)預(yù)測(cè)后續(xù)的詞匯。為了更好的理解用戶想要表達(dá)的內(nèi)容，模型同時(shí)還會(huì)分析郵件標(biāo)題和之前郵件的內(nèi)容。

這種需要疊加上下文的文本分析會(huì)帶來(lái)一個(gè)seq2seq機(jī)器翻譯同樣的問(wèn)題，其中源序列是主題和先前郵件內(nèi)容的組合、目標(biāo)序列則是目前用戶正在撰寫(xiě)的郵件。它雖然在但是卻無(wú)法滿足嚴(yán)格的時(shí)間要求。為了改進(jìn)這一點(diǎn)，研究人員們將詞袋模型和循環(huán)神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型結(jié)合起來(lái)，實(shí)現(xiàn)了比seq2seq更快的的速度，但只在預(yù)測(cè)質(zhì)量上做出了輕微的犧牲。

如上圖所示，在這一混合模型中標(biāo)題和先前的郵件先用詞向量平均處理，而后將他們輸入到接下來(lái)的循環(huán)神經(jīng)網(wǎng)絡(luò)中去解碼。

加速模型訓(xùn)練和服務(wù)

為了加速模型的訓(xùn)練和調(diào)參，研究人員們使用了自家的大殺器TPU,只需要不到一年就能在幾十億的樣本上實(shí)現(xiàn)收斂。

雖然訓(xùn)練速度提高了，但在實(shí)際使用時(shí)候的速度才是用戶最為關(guān)心的指標(biāo)。通過(guò)將CPU的計(jì)算請(qǐng)求分配到TPU上得到了迅速的推理結(jié)果，同時(shí)由于CPU的算力得到了釋放，使得單機(jī)可以提供服務(wù)的用戶數(shù)量大幅增加。

公平性和隱私

對(duì)于機(jī)器學(xué)習(xí)來(lái)說(shuō)，公平性和隱私是至關(guān)重要的問(wèn)題。語(yǔ)言模型可以折射出人類(lèi)的認(rèn)知偏見(jiàn)，這樣會(huì)生成一系列不希望的句子補(bǔ)全。這些偏見(jiàn)和聯(lián)系主要來(lái)自于語(yǔ)言數(shù)據(jù)，這對(duì)于構(gòu)建一個(gè)無(wú)偏模式是巨大的挑戰(zhàn)。于是研究人員們通過(guò)各種方式不斷減弱訓(xùn)練過(guò)程中潛在的偏見(jiàn)。同時(shí)智能寫(xiě)作助手是構(gòu)建于數(shù)十一個(gè)樣本上的訓(xùn)練結(jié)果，只有同時(shí)被多個(gè)用戶確認(rèn)的通用結(jié)果才會(huì)被模型記住。

語(yǔ)言模型中一種常見(jiàn)的性別偏見(jiàn)

在未來(lái)這一模型會(huì)被持續(xù)改進(jìn)，并嘗試著加入一些先進(jìn)的模型架構(gòu)（例如transformer和RNMT+等）和先進(jìn)的訓(xùn)練技術(shù)，同時(shí)在生產(chǎn)中部署更多的先進(jìn)模型來(lái)滿足實(shí)時(shí)性和要求。個(gè)人語(yǔ)言模型會(huì)在隨后加入以更精確的滿足個(gè)人的寫(xiě)作風(fēng)格和表達(dá)習(xí)慣。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6255

瀏覽量
111729
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5600

瀏覽量
124527

原文標(biāo)題：谷歌如何利用深度學(xué)習(xí)來(lái)實(shí)現(xiàn)智能郵件助手，知你所想想你所寫(xiě)？

文章出處：【微信號(hào)：thejiangmen，微信公眾號(hào)：將門(mén)創(chuàng)投】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲日韩欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

搜索歷史

谷歌如何利用深度學(xué)習(xí)來(lái)實(shí)現(xiàn)智能郵件助手

評(píng)論