91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

你知道屏幕后是誰在和你對話嗎?新研究開發(fā)仿真面對面對話系統(tǒng)

Hf1h_BigDataDig ? 來源:TW ? 2019-09-02 15:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

基于深度神經(jīng)網(wǎng)絡仿真面對面對話系統(tǒng)

近日,CloudMinds和北京航空航天大學的研究人員基于深度學習提出了一種新的仿真面對面對話系統(tǒng)。CloudMinds是一家在機器人和云服務領域的領軍企業(yè),致力于成為針對各種機器人模型需求的供應商。

該會話系統(tǒng)包括用于收聽和說話的兩個序列到序列模型以及基于虛擬代理合成器的生成性對抗網(wǎng)絡(GAN)模型。

當虛擬代理與人通信時,語音音頻和面部圖像被輸入到系統(tǒng)中。面部圖像由面部解析模塊處理,產(chǎn)生面部動作和姿勢。然后將生成的信息傳遞到基于序列到序列的收聽模型中。當虛擬代理在收聽時,輸出被饋送到合成器中以產(chǎn)生逼真的面部圖像作為非語言反應。

語音識別模型將語音音頻變換為文本,然后傳遞到會話模塊中以生成響應語句,該響應語句被傳遞到文本到語音(TTS)模塊以合成語音。響應語句被傳遞到序列到序列的說話模型,其輸出也被輸入到虛擬合成器中以產(chǎn)生逼真的面部圖像,從而呼應語音內(nèi)容。頭像合成器則用于在整個對話期間收聽和說話。

本文顯著改進了傳統(tǒng)的基于3D模型的成果。為了訓練模型,研究人員收集了大約700個ESPN視頻,其中包含來自YouTube的面對面對話場景。

與傳統(tǒng)3D模型的生成結(jié)果相比,該模型所生成的面部圖像更接近現(xiàn)實。毋庸置疑的是,在使得會話更加逼真自然的領域上,該系統(tǒng)還有很大的潛力可供挖掘,未來它還可用于實現(xiàn)個性化表情會話。

原文:

https://arxiv.org/abs/1908.07750

使用DISCo方法改進鈣成像分析

本文中,德國海德堡大學跨學科科學計算中心(IWR)的研究人員介紹了DISCo方法,這是一種使用深度學習,實例分割和相關性研究的新方法,可用于鈣成像分析中的細胞分割步驟。

DISCo將深度學習網(wǎng)絡的優(yōu)勢與最先進的實例分割程序相結(jié)合,允許直接提取單元實例而無需任何復雜的后處理步驟。他們還以非常有效的方式利用鈣成像視頻的時間背景來計算像素之間的分段相關性。然后以摘要圖像的形式將此時間信息與基于形狀的信息相結(jié)合。

DISCo的最大優(yōu)勢在于能夠結(jié)合相關性和圖像特征,而不只依賴于其中一種方法。因此,DISCo可以通過在Neurofinder數(shù)據(jù)集上僅使用單個模型來使神經(jīng)研究人員獲得良好的整體性能。此外,當在幾個數(shù)據(jù)集系列上訓練單個網(wǎng)絡時,研究人員能夠超越在Neurofinder數(shù)據(jù)集上訓練的所有其他方法。

原文:

https://arxiv.org/abs/1908.07957

用于科研教育的低成本開源機器人賽車平臺

華盛頓大學保羅G.艾倫計算機科學與工程學院的研究人員最近介紹了MuSHR,即多代理的非完整賽車系統(tǒng)。MuSHR是一個低成本、開源的機器人賽車平臺,致力于教育和研究,由MuSHR的個人機器人實驗室開發(fā),旨在促進機器人領域的公民化。作為一個低成本的平臺,參與者可以通過說明,開源文檔和動手教程參與其中。

賽車的硬件設計基于一系列現(xiàn)成的組件,這些組件可以從世界各地的線上和線下硬件商店中輕松地找到,而軟件架構(gòu)則是在個人機器人實驗室中開發(fā)的。該平臺為華盛頓大學的移動機器人課程開發(fā)了一套演示系統(tǒng)和許多寶貴的實踐經(jīng)驗,是機器人平臺開發(fā)的里程碑。

MuSHR的低成本開發(fā)模式和綜合的文檔記錄是寶貴的機器人研究資源。該平臺向?qū)W術(shù)研究實驗室,機器人研究者及機器人愛好者等展示各種機器人研究項目提供了一個出色的測試平臺。

MuSHR具有開源指令和教程帶領用戶完成硬件開發(fā)。文檔托管在Github上,免費供一般公眾下載使用。

代碼:

https://github.com/prl-mushr

原文:

https://arxiv.org/abs/1908.08031

三維掃描與CAD對象的聯(lián)合嵌入

近日,慕尼黑工業(yè)大學、斯坦福大學以及 Facebook 人工智能研究所共同提出了一種學習三維掃描和CAD之間的聯(lián)合嵌入空間的技術(shù)。而在這兩者中有很多聯(lián)系緊密且十分相似的事物。這一學習方法基于一種全新的3D CNN 技術(shù),通過學習聯(lián)合嵌入空間中事物的相似性來實現(xiàn)嵌入。

為了學習一個掃描對象和CAD模型可以相互交織的共享空間,研究人員提出使用堆疊沙漏的方式將前景、背景與掃描對象分開,并將其轉(zhuǎn)換為完整的類CAD表示,以此將它整合到共享嵌入空間中。這樣操作得到的嵌入空間可以用于CAD模型檢索。為了更好地完成這一任務,研究人員引入了一個全新數(shù)據(jù)集,其中包括了掃描CAD相似性注釋。在這一數(shù)據(jù)集的幫助下,他們能夠?qū)AD模型檢索進行細粒度的評估,并對雜亂、嘈雜部分進行掃描。

這一新型學習方式比現(xiàn)有的CAD模型在實例檢索上的準確率高出10% 以上。

因此,它在CAD模型檢索方面的表現(xiàn)比原有模型更好。學習這樣的聯(lián)合掃描- CAD嵌入空間不僅為CAD模型檢索提供了新的解決方案,也為這兩個領域之間的知識映射提供了新的可能性。

當然,雖然這個技術(shù)在掃描與學習CAD對象空間方面非常有效,但它仍然有很多局限性——目前研究人員僅考慮了掃描和CAD對象領域中對象的幾何形狀;而這篇論文中未提及的顏色信息可能是聯(lián)合嵌入或CAD模型檢索的另一強大信號。

原文:

https://arxiv.org/abs/1908.06989

Google發(fā)布Turbo,可視化工具的里程碑式突破

Turbo 是由Google研究人員提出的一種著色工具,它既有Jet的優(yōu)勢功能,同時也解決了Jet的一些短板,例如細節(jié)錯誤、條帶、和顏色混淆等。

在開發(fā)人員的精心調(diào)試下,Turbo的強大性能能夠勝任各種可視化任務。在開發(fā)過程中,研究人員們制作了一個簡單的交互界面,在其中他們能夠使用7節(jié)立方條來調(diào)整RGB曲線,同時將樣本結(jié)果與其他知名彩繪程序的結(jié)果進行比較。

Turbo可以作為順序和發(fā)散的可視化工具,因此它很適合開發(fā)人員保存在自己的“工具箱”中。它用于解決均勻性不那么重要的數(shù)據(jù)可視化任務非常有效,尤其是在需要展現(xiàn)強烈對比的情況下。

Google的團隊將這個工具用于實現(xiàn)視差貼圖、誤差貼圖以及許多其他標量的可視化中。您可以在下方鏈接中找到在Python和C/C++ 中的使用這幾技術(shù)的方法,以及多項式逼近的方法——用于可能查表查詢不太方便的情況中。

Python:

https://gist.github.com/mikhailov-work/ee72ba4191942acecc03fe6da94fc73f

C/C++:

https://gist.github.com/mikhailov-work/6a308c20e494d9e0ccc29036b28faa7a

Polynomial approximation:

https://gist.github.com/mikhailov-work/0d177465a8151eb6ede1768d51d476c7

原文:

https://ai.googleblog.com/2019/08/turbo-improved-rainbow-colormap-for.html

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4838

    瀏覽量

    107790
  • AI
    AI
    +關注

    關注

    91

    文章

    39793

    瀏覽量

    301438

原文標題:狗還是機器人?誰在屏幕后和你對話?新研究開發(fā)仿真面對面對話系統(tǒng) | 一周AI最火論文

文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI教父Hinton對話云天勵飛陳寧

    ,圍繞算力效率、AI 向善與普惠未來展開了一場高密度對話對話由硅谷著名計算機科學家、硅谷高創(chuàng)會大會主席吳軍博士主持。
    的頭像 發(fā)表于 12-03 14:04 ?697次閱讀

    思必馳任務型對話算法通過國家備案

    近日,國家網(wǎng)信辦公開發(fā)布第十四批境內(nèi)深度合成服務算法備案信息,思必馳任務型對話算法正式通過備案。這是思必馳第八項通過備案的算法,進一步鞏固了在對話式人工智能領域的技術(shù)與合規(guī)優(yōu)勢。
    的頭像 發(fā)表于 11-20 10:33 ?889次閱讀

    2025年RT-Thread開發(fā)者巡回培訓報名正式啟動!

    與RT-Thread技術(shù)專家面對面答疑解惑的絕佳機會。在這里將體驗豐富的理論課程、精彩Demo演示與動手實踐!歡迎報名參加,與我們攜手探索技術(shù)的更多可能!日期城市10月
    的頭像 發(fā)表于 09-27 10:39 ?1975次閱讀
    2025年RT-Thread<b class='flag-5'>開發(fā)</b>者巡回培訓報名正式啟動!

    system view 不能recorder是怎么回事?

    點擊recorder按鈕彈出下面對話框,不曉得配置問題還是操作問題
    發(fā)表于 09-22 06:02

    與作者面對面丨英飛凌IPAC直播間即將亮相PCIM Asia 2025

    PCIMAsia展會現(xiàn)場!直播主題:與作者面對面,深度解讀2025PCIMAsia論文直播時間:2025年9月24日1500掃碼立即報名將可以看到英飛凌資深“攻城獅
    的頭像 發(fā)表于 09-16 17:06 ?1214次閱讀
    與作者<b class='flag-5'>面對面</b>丨英飛凌IPAC直播間即將亮相PCIM Asia 2025

    【應用方案】“會呼吸”的洗衣機:艾為燈語?讓光與對話

    是否想過,洗衣機會用光的語言與您對話?當科技被賦予溫度,最日常的洗衣時刻也開始有了詩意。艾為燈語助力智能家電系列,讓洗衣機從冰冷的金屬外殼中蘇醒,用光的語言與溫柔對話。這不是一次簡
    的頭像 發(fā)表于 09-11 18:56 ?842次閱讀
    【應用方案】“會呼吸”的洗衣機:艾為燈語?讓光與<b class='flag-5'>你</b>“<b class='flag-5'>對話</b>”

    時空壺W4Pro:商務跨語言場景的高效溝通解決方案

    在全球化商務交流日益頻繁的當下,跨語言溝通的效率與準確性直接影響合作推進節(jié)奏。時空壺W4ProAI同傳耳機憑借針對性的技術(shù)優(yōu)化與功能設計,在面對面商務洽談、跨國行業(yè)展會等核心商務場景中,為用戶提供
    的頭像 發(fā)表于 09-08 16:53 ?1325次閱讀
    時空壺W4Pro:商務跨語言場景的高效溝通解決方案

    米爾RK3576部署端側(cè)多模態(tài)多輪對話,6TOPS算力驅(qū)動30億參數(shù)LLM

    ]。 RK3576 工作狀態(tài) 本文目錄 本文目錄 一、引言 1.1 什么是多輪對話? 1.2 多輪對話系統(tǒng)鳥瞰:三顆“核心”協(xié)同驅(qū)動 1.3 核心邏輯:多輪對話的處理流程 二、工程化
    發(fā)表于 09-05 17:25

    廣和通發(fā)布自研端側(cè)語音識別大模型FiboASR

    7月,全球領先的無線通信模組及AI解決方案提供商廣和通,發(fā)布其自主研發(fā)的語音識別大模型FiboASR。該模型專為端側(cè)設備上面臨的面對面實時對話及多人會議場景深度優(yōu)化,在低延遲語音交互、實時語音轉(zhuǎn)錄
    的頭像 發(fā)表于 08-04 11:43 ?1598次閱讀

    對話電網(wǎng)、指揮儲能的雙向計量電能表

    對話電網(wǎng)、指揮儲能的雙向計量電能表
    的頭像 發(fā)表于 04-27 17:35 ?820次閱讀
    能<b class='flag-5'>對話</b>電網(wǎng)、指揮儲能的雙向計量電能表

    FAE的職責、能力及職業(yè)規(guī)劃

    的“技術(shù)外交官”,負責把公司的芯片產(chǎn)品帶入客戶項目中,并負責各類技術(shù)支持和溝通協(xié)調(diào)。二、FAE核心職責1.技術(shù)支持前線FAEs主要任務就是和客戶面對面交流,理解客戶的
    的頭像 發(fā)表于 04-25 10:02 ?2.3w次閱讀
    FAE的職責、能力及職業(yè)規(guī)劃

    直播預告|與往屆紫光同創(chuàng)國一選手面對面交流參賽經(jīng)驗

    再說一遍:2025年3月17日周一晚1900B站UP主“小眼睛半導體”直播間與2024集創(chuàng)賽紫光同創(chuàng)杯國一選手面對面交流參賽及獲獎經(jīng)驗哦有任何疑問聯(lián)系微信客服:17665247134原文標題:直播
    的頭像 發(fā)表于 04-14 09:53 ?486次閱讀
    直播預告|與往屆紫光同創(chuàng)國一選手<b class='flag-5'>面對面</b>交流參賽經(jīng)驗

    單次、多次對話與RTC對話AI交互模式,如何各顯神通?

    在這個充滿無限可能的AI時代,這些奇妙場景正逐步走進我們的生活。可曾想象過,有一天家里的智能設備會化身相聲演員,和你幽默對答?或者,的玩具能像知心好友一樣,陪你暢聊心事?單次對話、
    的頭像 發(fā)表于 04-02 18:18 ?2327次閱讀
    單次、多次<b class='flag-5'>對話</b>與RTC<b class='flag-5'>對話</b>AI交互模式,如何各顯神通?

    能和Ai-M61模組對話了?手搓一個ChatGPT 語音助手

    起猛了, 安信可的Ai-M61模組能說話了! 超低延遲實時秒回 ,對話超絲滑的那種,先來看一段VCR: 小安派+ChatGPT語音實測:對話絲滑到忘記對面是AI_ 人工智能的應用日益廣泛。 各家模型
    的頭像 發(fā)表于 03-12 11:57 ?1.2w次閱讀
    能和Ai-M61模組<b class='flag-5'>對話</b>了?手搓一個ChatGPT 語音助手

    科技云報到:從鸚鵡學舌到靈魂對話,AI的「人話革命」

    科技云報到:從鸚鵡學舌到靈魂對話,AI的「人話革命」
    的頭像 發(fā)表于 03-11 14:26 ?701次閱讀