91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌推出電話AI系統(tǒng)Google Duplex

zhKF_jqr_AI ? 來源:未知 ? 作者:胡薇 ? 2018-05-22 10:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌I/O 2018正如火如荼地進行著。今年大會吸引了超過6000人前來現(xiàn)場,除了提前幾小時就排好的長隊,會場外的交通也早早陷入癱瘓。據(jù)不少勤奮早起的自媒體同行的凌晨報道,谷歌I/O 2018的亮點主要有以下幾個:

深度學(xué)習(xí)在醫(yī)療領(lǐng)域的應(yīng)用;

Google Assistant:看得見、聽得到、會對話、會打電話的新一代谷歌個人助理;

TPU 3.0:性能是TPU 2.0的8倍;

Android P:智能化的手機操作系統(tǒng),能利用機器學(xué)習(xí)節(jié)電、調(diào)節(jié)亮度,更大程度貼合用戶使用習(xí)慣。

其中,Google Assistant電話功能背后的技術(shù)是Google Duplex,在大會上發(fā)布完畢后,Google AI(原Google Research官博)就發(fā)表了Google工程副總裁兼首席工程師Yaniv Leviathan的一篇介紹文章。

Gmail已成“精”

以下是論智對博客的編譯。

人類與計算機互動的一個長期目標(biāo)是使人們能與計算機自然對話,就像普通人之間的對話一樣。近年來,特別是隨著深度神經(jīng)網(wǎng)絡(luò)的廣泛應(yīng)用,我們目睹了計算機在理解、生成自然語言上的“革命性”能力提升。但盡管如此,即便是當(dāng)今最先進的AI系統(tǒng),它還是不能很好地理解自然語言。舉個例子,如今自動電話客服系統(tǒng)所使用的技術(shù)還停留在努力識別簡單的單詞和命令上,它們不參與對話流程,如果聽不懂客戶說話內(nèi)容,它們會強制要求對方調(diào)整表述,而不是進行自我調(diào)整。

所以今天,谷歌宣布推出Google Duplex,一種能在電話中用自然語言完成“現(xiàn)實世界”任務(wù)的技術(shù)。它目前已經(jīng)能完成一些特定任務(wù),如安排某些類型的預(yù)約。這類工作要求系統(tǒng)能做到自然對話,就像人與人正常溝通一樣,而無需強制對方適應(yīng)機器。

Google Duplex的適用空間非常狹窄,這也使它能起作用的一大原因。研究人員提出的一個關(guān)鍵思路就是把它限制在一些狹窄的封閉域中,讓AI進行有限地廣泛探索。當(dāng)Duplex深度某領(lǐng)域后,它才能學(xué)會自然對話,也就是說,它不能進行一般對話。

聽起來都很自然,它們都是發(fā)生在計算機和真人店家之間的對話。

Google Duplex技術(shù)的自然性可以讓人們的對話體驗更加舒適。考慮到谷歌向來很重視用戶和企業(yè)對服務(wù)的良好體驗,因此產(chǎn)品的透明度非常關(guān)鍵。這也是本文反復(fù)強調(diào)Google Duplex目前只適用于部分預(yù)約場景的原因。

進行自然對話

AI在自然對話方面有幾個難點:一是自然語言難以理解,二是難以模仿自然行為,三是用戶期待更快的回應(yīng),四則是用合適的語調(diào)生成自然的聲音很困難。

當(dāng)人們彼此交談時,他們說出的話比人和計算機的對話要復(fù)雜得多。他們會經(jīng)常在話說到一半的時候糾正表述,而且往往表達得啰嗦、語法不嚴謹、嚴重依賴上下文。他們還喜歡用寬泛的表述,有時在一個句子里就能連用一大串:

所以……額……星期二到星期四,我們的開門時間是11點到14點,然后16點到19點。然后星期五、星期六、星期天,我們……星期五和星期六我們11點到21點開門,星期天我們13點到21點開門。

比起機器,人類在用自然語言對話時語速非???,再加上口齒不清、錯詞率更高,因此常規(guī)的語音識別也會識別困難。在電話通話中,由于背景噪聲大,音質(zhì)不佳,這樣的問題就更嚴重了。

而在較長的談話中,相同的句子可以根據(jù)上下文具有非常不同的含義。例如在預(yù)約場景下,“Ok for 4”可以同時表示時間(4點)和人數(shù)(4人)。如果AI要理解這一點,它必須上溯幾個句子找根據(jù),但這一過程會因為電話通話高水平的字錯誤率而變得相當(dāng)復(fù)雜。

決定要說什么是一個關(guān)于對話任務(wù)和對話狀態(tài)的函數(shù)。此外,圍繞自然對話,Google Duplex也參考了一些常見的做法——其中包括闡述(elaboration,“下周五?!薄吧稌r候?”“下個禮拜五,18號!”)、同步(sync,“你聽得清嗎?”)、中斷(interruption,“號碼是212……”“你能再說一遍嗎?”)、暫停(pause,“你能等一會兒嗎?”[等待]“謝謝!”——等待1秒和等待2分鐘含義不同)。

認識Duplex

Google Duplex在對話上的自然表現(xiàn)主要歸功于這4方面的進步:理解、交互、時機和交流。

它的核心是一個專用于解決自然對話問題的遞歸神經(jīng)網(wǎng)絡(luò)(RNN),在TensorFlow Extended (TFX)平臺上完成構(gòu)建,使用的訓(xùn)練數(shù)據(jù)來自匿名電話會話數(shù)據(jù)語料庫。該網(wǎng)絡(luò)有多個輸入,包括原音頻特征、把原音頻輸入Google自動語音識別(ASR)技術(shù)后的輸出、上下文、對話的參數(shù)(例如預(yù)約的所需服務(wù)或當(dāng)前時間)等,研究人員為每種任務(wù)分別訓(xùn)練了一些模型,但語料庫是跨任務(wù)共享的。最后,他們又用TFX中的超參數(shù)優(yōu)化進一步改進了模型。

原音頻經(jīng)ASR系統(tǒng)處理后輸入網(wǎng)絡(luò),網(wǎng)絡(luò)最終的輸出經(jīng)TTS系統(tǒng)轉(zhuǎn)為音頻

Duplex處理“中斷”、“闡述”以及對“同步”的回應(yīng):

聽起來很自然

Google Duplex組合使用文本到語音(TTS)引擎和綜合TTS引擎(使用Tacotron和WaveNet)控制語調(diào)。

由于在對話中加入了“嗯”“呃”等詞匯,系統(tǒng)的回應(yīng)聽起來更自然。但這其實是TTS連接兩個音調(diào)不同的聲音或正在等待合成時使用的小障眼法,是一種自然的表示問題正在受理中的狀態(tài)(人們也經(jīng)常這么做)。經(jīng)過用戶研究,研究人員發(fā)現(xiàn)這種反應(yīng)能在不利的對話情景下給對方帶來熟悉、自然的感覺。

此外,Google Duplex在回應(yīng)速度方面也比較符合用戶期望。當(dāng)人們說完一件簡單的事后,比如“hello?”,他們希望得到及時的回復(fù),對回復(fù)延遲也比較敏感。如果系統(tǒng)檢測到這種情況,它會馬上切換成更快、精度更低的模型來工作。在極端情況下,Google Duplex甚至都不會調(diào)用RNN,而至直接使用最快的近似值(通常會帶各種表示猶豫的詞匯,人類面對這種事情也會有類似的反應(yīng))。這種做法使系統(tǒng)的響應(yīng)延遲能小于100毫秒。

有趣的是,研究人員發(fā)現(xiàn),這種表達上的拖延有利于使對話更自然——例如在回復(fù)一個非常復(fù)雜的句子時,這種“呃呃啊啊”的做法有奇效。

系統(tǒng)操作

Google Duplex系統(tǒng)能夠應(yīng)對復(fù)雜對話,并且能完全自主地完成絕大部分任務(wù),無需人工干預(yù)。該系統(tǒng)具有自我監(jiān)控功能,可以識別無法自動完成的任務(wù)(例如,安排異常復(fù)雜的預(yù)約)。面對這種情況時,它會主動向施令者發(fā)出信號。

為了在新領(lǐng)域訓(xùn)練系統(tǒng),研究人員使用的是實時監(jiān)督訓(xùn)練。和其他訓(xùn)練任務(wù)一樣,在這些實驗中,Google Duplex也會有一個充當(dāng)“教師”的經(jīng)驗豐富的模型為充當(dāng)“學(xué)生”的模型提供指導(dǎo),確保后者執(zhí)行任務(wù)的的水平最終能和自己一致。通過監(jiān)督“學(xué)生”在新場景通話中的表現(xiàn),“教師”能根據(jù)需要實時影響“學(xué)生”的行為,直到它的行為滿足系統(tǒng)預(yù)期。

對于企業(yè)和用戶

經(jīng)常需要預(yù)約的企業(yè)可以從Google Duplex身上獲益,有了這樣一個智能助理,企業(yè)就無需額外安排指導(dǎo)人員,也不用為培訓(xùn)員工煞費苦心。Google Duplex還能提醒即將到期的預(yù)約項目,方便他們參加、取消或重新安排。

此外,一些用戶會經(jīng)常致電企業(yè)查詢網(wǎng)上無法獲得的信息(假期營業(yè)時間)。Google Duplex可以幫助企業(yè)應(yīng)付這些同類電話,并在網(wǎng)上及時更新信息。

對于個人用戶,Google Duplex可以讓生活更方便。如果想打預(yù)約電話,他們只需給智能助理下指令就能安心處理其他事情,通話過程在后臺進行,安靜無聲,無需參與。

它的另一個好處是Duplex能夠以異步方式與服務(wù)提供商進行授權(quán)通信,例如,在非工作時間和對方聯(lián)絡(luò)。它還可以幫助解決殘障人士的不便和語言障礙問題,例如聽力障礙的用戶或不會說當(dāng)?shù)卣Z言的用戶可以把通話任務(wù)交給Duplex,讓它幫忙執(zhí)行任務(wù)。

今年夏季,谷歌將在Google Assistant中測試Google Duplex,屆時它的功能包括預(yù)約餐廳、預(yù)約美發(fā)和跟老板請假。

Google Duplex負責(zé)人Yaniv Leviathan和該項目的工程經(jīng)理Matan Kalman通過Duplex打電話預(yù)訂了一頓飯

讓人們和技術(shù)能自然而然地互動,這是谷歌長久以來的承諾,而Google Duplex向這個方向邁出了第一步。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6254

    瀏覽量

    111407
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39793

    瀏覽量

    301441

原文標(biāo)題:Google Duplex:真假難辨的電話AI系統(tǒng)(附音頻)

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    當(dāng)谷歌自己發(fā)電,AI 系統(tǒng)會回到基礎(chǔ)工程嗎?

    2026年,谷歌開始自己發(fā)電。這不是能源布局,這是系統(tǒng)焦慮。當(dāng)全球算力頂端的公司,把注意力轉(zhuǎn)向電力,意味著一個信號——AI的瓶頸,正在下沉。 不再只是芯片,不再只是參數(shù)。而是系統(tǒng)能否
    的頭像 發(fā)表于 02-12 15:59 ?2347次閱讀
    當(dāng)<b class='flag-5'>谷歌</b>自己發(fā)電,<b class='flag-5'>AI</b> <b class='flag-5'>系統(tǒng)</b>會回到基礎(chǔ)工程嗎?

    谷歌評論卡,碰一碰即可完成谷歌評論 #谷歌評論卡 #NFC標(biāo)簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    泰凌微:布局端側(cè)AI,產(chǎn)品支持谷歌LiteRT、TVM開源模型

    ?電子發(fā)燒友網(wǎng)報道(文/李彎彎)泰凌微近日表示,公司與谷歌在智能家居、音頻等多個領(lǐng)域開展具體項目合作。其與谷歌已從單一的遙控器芯片供應(yīng),發(fā)展為涵蓋音頻、智能家居、端側(cè)AI等多領(lǐng)域的深度合作關(guān)系
    的頭像 發(fā)表于 12-15 08:21 ?1w次閱讀

    vivo攜手Google Cloud推動智能手機邁入AI新時代

    在人們期待更智能、更前瞻手機的時代,vivo 攜手 Google Cloud,迅速推出更安全、更前沿的 AI 功能,共同加速創(chuàng)新,推動智能手機邁入智能、無縫、以人為本的 AI 新時代。
    的頭像 發(fā)表于 09-23 16:54 ?1459次閱讀

    華曦達亮相谷歌AI亞洲峰會,AI Home業(yè)務(wù)高增長引領(lǐng)發(fā)展新征程

    AI亞洲峰會現(xiàn)場 華曦達基于谷歌云技術(shù)底座打造的AIHome解決方案及其自主研發(fā)的HomeAIAgent——Cedar成為關(guān)注焦點。該系統(tǒng)通過AI驅(qū)動的學(xué)習(xí)與自適應(yīng),實時理解并預(yù)測用戶
    的頭像 發(fā)表于 09-10 10:22 ?546次閱讀

    谷歌查找我的設(shè)備配件(Google Find My Device Accessory)詳解和應(yīng)用

    谷歌查找我的設(shè)備配件(Google Find My Device Accessory)介紹 谷歌查找我的設(shè)備配件是與谷歌 “查找我的設(shè)備” 應(yīng)用程序配合使用的配件,旨在幫助用戶更方便地
    發(fā)表于 08-31 21:10

    AI賦能谷歌Chrome與Web工具全面升級

    2025 Google 谷歌開發(fā)者大會帶來了最新 Web 工具,包括全面升級的 Chrome 開發(fā)體驗、極大簡化的 UI 開發(fā),到云端兩側(cè)的 AI 部署。這些強大的工具為出海開發(fā)者提供了前所未有的加速,幫助他們更高效地打造面向全
    的頭像 發(fā)表于 08-29 09:33 ?1159次閱讀

    谷歌AI模型點亮開發(fā)無限可能

    在 2025 年的 Google 谷歌開發(fā)者大會上,AI 不是一門“技術(shù)”,更是一股徹底改變開發(fā)范式的“力量”,助力開發(fā)者們在海外市場更上一層樓。AI 已經(jīng)不僅僅是生成幾行代碼,它正在
    的頭像 發(fā)表于 08-29 09:29 ?1139次閱讀

    Google Fast Pair服務(wù)簡介

    谷歌賬號,并嘗試配對已保存到其谷歌賬號的設(shè)備時所發(fā)生的一系列事件。在此過程中,新手機會識別出廣播里的Model ID ,它已保存到用戶的 Google 帳號中,并提供一條通知,以加快將該設(shè)備與這部
    發(fā)表于 06-29 19:28

    Google推出第七代TPU芯片Ironwood

    Google Cloud Next 25 大會上,我們隆重推出第 7 代 Tensor Processing Unit (TPU) — Ironwood。這不僅是我們迄今為止性能最高、擴展性最佳的定制 AI 加速器,更是第一
    的頭像 發(fā)表于 04-16 11:20 ?1773次閱讀
    <b class='flag-5'>Google</b><b class='flag-5'>推出</b>第七代TPU芯片Ironwood

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命 Google 發(fā)布了 Ironwood,這是其第七代張量處理單元 (TPU),專為推理而設(shè)計。這款功能強大的 AI
    的頭像 發(fā)表于 04-12 11:10 ?3743次閱讀
    <b class='flag-5'>谷歌</b>第七代TPU Ironwood深度解讀:<b class='flag-5'>AI</b>推理時代的硬件革命

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計于今年晚些時候面向 Google
    的頭像 發(fā)表于 04-12 00:57 ?3725次閱讀

    NVIDIA攜手谷歌云助力企業(yè)引入代理式AI

    谷歌 Gemini 模型即將支持本地部署,可通過搭載 NVIDIA Blackwell 架構(gòu)的基礎(chǔ)設(shè)施,在 Google 分布式云上運行 NVIDIA 機密計算。
    的頭像 發(fā)表于 04-11 16:32 ?1211次閱讀

    英偉達GTC2025亮點:NVIDIA、Alphabet 和谷歌攜手開啟代理式與物理AI的未來

    聯(lián)合計劃涵蓋基礎(chǔ)設(shè)施和開源模型優(yōu)化,在機器人、藥物研發(fā)等領(lǐng)域取得巨大進展 具有長期合作伙伴關(guān)系的 NVIDIA、Alphabet 和谷歌宣布了多項新計劃,旨在推動 AI 發(fā)展、普及 AI 工具
    的頭像 發(fā)表于 03-21 15:10 ?2036次閱讀
    英偉達GTC2025亮點:NVIDIA、Alphabet 和<b class='flag-5'>谷歌</b>攜手開啟代理式與物理<b class='flag-5'>AI</b>的未來