91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MIT推新型機器算法,可破譯消失已久的古語言

如意 ? 來源:開源中國 ? 作者:白開水不加糖 ? 2020-10-28 14:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

麻省理工學院計算機科學與人工智能實驗室(Computer Science and Artificial Intelligence Laboratory,CSAIL)的研究人員最近開發(fā)出了一種新的計算機算法,可以幫助語言學家自動破譯歷史上消失已久失的古語言。

官方指出,該系統(tǒng)能夠自動破譯已消失的語言,且無需對這一語言與其他語言的關系有深入的了解。他們還表明,該系統(tǒng)自身就可以確定語言之間的關系,并可以用它來證實最近的一項表明 Iberian 語言實際上與 Basque 語言無關的學術研究。

CSAIL 方面稱,最近的研究表明,大多數(shù)曾經存在過的語言已經不再被使用。其中有數(shù)十種已滅絕語言也已被認為是“未破譯”的語言。這就意味著,大眾對它們的語法(grammar)、詞匯(vocabulary)或句法(syntax)都了解不足,也無法理解其文本的意思。

而研究這些“未破譯”的語言,除了是出于學術上的好奇心。還在于,不理解語言我們就會錯過與講這些語言的人有關的一整套知識體系。然而不幸的是,大多數(shù)滅絕語言的相關記錄都非常的少,導致科學家無法使用谷歌翻譯之類的機器翻譯工具或 AI 算法來對其進行解密。

因此,此次 CSAIL 團隊推出這一新算法的最終目的就是,旨在只用幾千個單詞,就可以破譯語言學家?guī)资陙黼y以理解的失傳語言。

本次研究由 MIT 教授 Regina Barzilay 牽頭,依賴于基于歷史語言學(historical linguistics)見解的幾項原則。例如,語言通常僅以某些可預測的方式發(fā)展。具體表現(xiàn)為:一種給定的語言很少會直接添加或刪除整個音節(jié),但是很可能會發(fā)生某些近似發(fā)音的替換。像母語中帶有“p”發(fā)音的單詞就可能會在其后代演變中變?yōu)椤癰”,但是由于明顯的發(fā)音差異,變?yōu)椤発”的可能性則較小。

通過整合這些原則和其他語言學約束,Barzilay 和 MIT 博士生 Jiaming Luo 開發(fā)了一種解密算法,該算法可以處理可能的轉換的巨大空間以及輸入中引導信號的稀缺性。該算法學習將語言聲音嵌入多維空間,在該多維空間中,相應矢量之間的距離反映了不同發(fā)音的差異。這種設計使他們能夠捕獲語言變化的相關模式,并將其表達為計算約束(computational constraints)。生成的模型可以將古代語言中的單詞進行細分,并將其映射到相關語言中的對應單詞。

該項目建立在 Barzilay 和 Luo 去年寫的一篇論文的基礎上, 這篇論文解密了已滅絕的 Ugaritic 和 Linear B 語言,后者以前需要數(shù)十年的時間才能被人類解碼。但是,兩個項目之間的主要區(qū)別在于,該團隊此前就已經知道這些語言分別與希伯來語和希臘語的早期形式有關。

新算法可以推斷語言之間的關系,這是語言解密中的最大挑戰(zhàn)之一。該算法可以評估兩種語言之間的相似度,當對已知語言進行測試時,它甚至可以準確地識別出該語言屬于哪個語系(language families)。不僅如此,算法生成的模型可以將古語言中的單詞進行細分,并將其一一映射到“相關”語言中的對應單詞上去。

在未來的工作中,該團隊希望擴展到將文本與已知語言的相關單詞相關聯(lián)的范圍之外,這種方法被稱為“基于同源的破譯方法”。其表示,“例如,我們可以識別文本中涉及到的所有人或地點的信息,然后可以根據(jù)已知的歷史證據(jù)對其進行進一步的調查。這些實體識別(entity recognition)方法如今已廣泛用于各種文本處理應用程序中,并且具有很高的準確性。但是關鍵的研究問題在于,在沒有任何古代語言訓練數(shù)據(jù)的情況下,這項任務是否可行? ”
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4784

    瀏覽量

    98038
  • MIT
    MIT
    +關注

    關注

    3

    文章

    254

    瀏覽量

    24996
  • 機器翻譯
    +關注

    關注

    0

    文章

    141

    瀏覽量

    15526
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    C語言的PID算法

    C語言PID算法#include \"stdio.h\" #include //定義PID結構體 struct _pid{ float SetSpeed; float
    發(fā)表于 01-16 08:13

    C語言增量式PID的通用算法

    C語言增量式PID通用算法控制算法中PID使用的非常廣泛,但是在網上找代碼的時候發(fā)現(xiàn)好多代碼都不夠通用,需要自己改好多東西,而且當一個項目需要使用多個PID控制器時也頗為麻煩,這里設計一個通用的增量
    發(fā)表于 01-14 08:28

    用于單片機幾種C語言算法

    : 數(shù)字濾波無需其他的硬件成本,只有一個計算過程,可靠性高,不存在阻抗匹配問題。尤其是數(shù)字濾波可以對頻率很低的信號進行濾波,這是模擬濾波器做不到的。 數(shù)字濾波使用軟件算法實現(xiàn),多輸入通道共用一個濾波程序
    發(fā)表于 11-27 06:00

    C語言的常見算法

    # C語言常見算法 C語言中常用的算法可以分為以下幾大類: ## 1. 排序算法 ### 冒泡排序 (Bubble Sort) ```
    發(fā)表于 11-24 08:29

    C語言和單片機C語言有什么差異

    匯編語言機器才能讀懂,所以每個平臺的編譯器編譯成對應平臺匯編的程序,每個平臺的匯編不一樣,當然編譯器也不一樣。 DOS上的TC2 TC3 WINDOWS上的VC 8051的C51都有自已的編譯器。具體
    發(fā)表于 11-14 07:55

    復雜的軟件算法硬件IP核的實現(xiàn)

    具體方法與步驟 通過 C 語言實現(xiàn)軟件算法,并驗證了算法的有效性以后,就可以進行算法的 HDL 轉化工作了。通過使用 Altium Designer 的 CHC 編譯器(C to H
    發(fā)表于 10-30 07:02

    巡檢機器人落地攻略:RK3576驅動12路低延遲視覺

    場景化 · 可執(zhí)行 · 指標清晰 · 調優(yōu)復用01|從“人巡”到“機巡”:電力站一周上線紀實周一,項目組進場。需求很直接:變電站夜間值守薄弱、盲區(qū)多、報警后回看取證慢;希望一臺巡檢機器人替代夜巡
    發(fā)表于 10-24 16:53

    AES和SM4算法重構分析

    一、AES和SM4算法特點分析 基于前面幾篇分享,我們對AES和SM4的算法流程有了較為清晰的認識,接下來對AES和SM4算法的共同點進行分析,得出二者的重構設計思路。 首先,這里
    發(fā)表于 10-23 07:26

    花椒直播首次開源流器組件 為鴻蒙開發(fā)者提供高性能流解決方案

    器。該工具基于花椒直播自主通用多媒體框架HJMedia打造而來,采用創(chuàng)新的通用多媒體框架設計,以高度模塊化、擴展的插件化架構,極大提升了音視頻功能開發(fā)效率與整體的資源利用率,為開發(fā)者提供高性能、低耦合的流解決方案。 在直播、短視頻等高頻多媒體場景
    的頭像 發(fā)表于 09-04 09:52 ?684次閱讀
    花椒直播首次開源<b class='flag-5'>推</b>流器組件 為鴻蒙開發(fā)者提供高性能<b class='flag-5'>推</b>流解決方案

    現(xiàn)在rtsp流還是只能向局域網流嗎?

    現(xiàn)在rtsp流還是只能向局域網流嗎
    發(fā)表于 08-08 06:07

    智能復合機器人:糾偏算法如何重塑工業(yè)精度與效率?

    在智能制造領域,復合機器人正成為柔性生產與高精度作業(yè)的核心載體。面對“復合機器人有糾偏算法嗎?”這一行業(yè)高頻問題,富唯智能以多模態(tài)糾偏技術體系給出了答案——通過自研的AI驅動糾偏算法
    的頭像 發(fā)表于 05-29 17:01 ?1049次閱讀
    智能復合<b class='flag-5'>機器</b>人:糾偏<b class='flag-5'>算法</b>如何重塑工業(yè)精度與效率?

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎算法的應用

    的本質是解決“雞與蛋”問題:機器人需要地圖來定位,又需要準確定位來構建地圖。書中從前端(傳感器數(shù)據(jù)處理)和后端(位姿優(yōu)化)兩個層面解析了SLAM的算法邏輯。 激光雷達和視覺SLAM各有優(yōu)劣,例如激光
    發(fā)表于 05-03 19:41

    復合機器人為什么要使用單點糾偏算法

    復合機器人單點糾偏算法
    的頭像 發(fā)表于 04-20 14:59 ?687次閱讀
    復合<b class='flag-5'>機器</b>人為什么要使用單點糾偏<b class='flag-5'>算法</b>?

    機場智能指路機器人支持那些語言

    指路機器人作為提升旅客出行體驗的關鍵一環(huán),其支持的語言種類成為衡量服務質量的重要指標。那么,這些叁仟智能指路機器人究竟能夠跨越多少語言的界限,為旅客提供精準、便捷的服務呢?接下來,我們
    的頭像 發(fā)表于 04-07 10:49 ?647次閱讀

    請問STM32部署機器學習算法硬件至少要使用哪個系列的芯片?

    STM32部署機器學習算法硬件至少要使用哪個系列的芯片?
    發(fā)表于 03-13 07:34