91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能破譯三千年前的古文字

Hf1h_BigDataDig ? 來(lái)源:YXQ ? 2019-07-16 10:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1886年,英國(guó)考古學(xué)家亞瑟·伊萬(wàn)斯偶然間發(fā)現(xiàn)了一塊刻印著未知語(yǔ)言的石頭。得知這塊石頭來(lái)源于地中海的克里特島后,伊萬(wàn)斯立馬動(dòng)身前往此處以搜尋更多證據(jù)。在那里,他馬上就發(fā)現(xiàn)了許多筆跡相似的石碑,這些石碑能追溯到公元前1400年左右,這些刻字也就成為目前發(fā)現(xiàn)的最早的書(shū)寫(xiě)形式之一。伊萬(wàn)斯表示,這種線形形式是從早期藝術(shù)中粗糙的線條畫(huà)演變而來(lái),在語(yǔ)言史上占有重要地位。

伊萬(wàn)斯等人后來(lái)證實(shí),石碑上的刻字是兩種不同的文字系統(tǒng)。稍古老的一種稱為A類(lèi)線形文字,可以追溯到公元前1800年至1400年,此時(shí)克里特島還處于青銅時(shí)代的米諾文明階段。時(shí)間上更近一點(diǎn)的文字系統(tǒng)稱為B類(lèi)線形文字,公元前1400年后才出現(xiàn),此時(shí)的克里特島正被希臘大陸的邁錫尼人統(tǒng)治著。

許多年來(lái),伊萬(wàn)斯等人一直試圖翻譯這些古老的文字,但都無(wú)疾而終。

這個(gè)問(wèn)題直到1953年,一個(gè)名叫邁克爾·文特里斯的業(yè)余語(yǔ)言學(xué)家成功翻譯B類(lèi)線形文字之后,才得到解決。

兩個(gè)假設(shè)

文特里斯的成功建立在兩個(gè)決定性突破上。第一,他假設(shè)B類(lèi)線形文字中重復(fù)出現(xiàn)的詞語(yǔ)是克里特島的地名——這在其后被證明是正確的。第二,他假設(shè)這些刻字是古希臘語(yǔ)的早期形式——這讓他能夠立即翻譯出B類(lèi)線形文字的其他部分。在翻譯過(guò)程中,文特里斯表示,古希臘語(yǔ)的書(shū)面表達(dá)形式比之前預(yù)想的還要早幾個(gè)世紀(jì)。

文特里斯的工作成果是一項(xiàng)巨大的成就。但像A類(lèi)線形文字這樣的更為古老的文字系統(tǒng),到今天為止仍然是語(yǔ)言學(xué)上一個(gè)亟需解決的難題。

通過(guò)機(jī)器學(xué)習(xí)繪制特定語(yǔ)言的聯(lián)結(jié)

不難想象,近年來(lái)機(jī)器翻譯的最新進(jìn)展對(duì)此有所幫助。

短短幾年內(nèi),注釋數(shù)據(jù)庫(kù)和讓機(jī)器從中學(xué)習(xí)的技術(shù)讓語(yǔ)言學(xué)習(xí)發(fā)生了革命性變化,這使得機(jī)器翻譯變得越來(lái)越普遍。盡管翻譯質(zhì)量有待提高,但這也提供了思考語(yǔ)言的一個(gè)全新角度。

來(lái)自麻省理工學(xué)院的羅家明(音譯)和雷吉納·巴爾齊萊,以及來(lái)自加州山景城谷歌人工智能實(shí)驗(yàn)室的曹源(音譯),由他們組成的團(tuán)隊(duì)研發(fā)出了能夠翻譯失傳語(yǔ)言的機(jī)器學(xué)習(xí)系統(tǒng),并且使其翻譯B類(lèi)線形文字——第一次完全自動(dòng)翻譯——證明了系統(tǒng)可行性。

他們所利用的方法與標(biāo)準(zhǔn)機(jī)器翻譯技術(shù)有著顯著區(qū)別。首先需要知道,不管哪種語(yǔ)言,機(jī)器翻譯的關(guān)鍵都在于認(rèn)識(shí)到文字間聯(lián)結(jié)的相似性。因此整個(gè)過(guò)程是從繪制特定語(yǔ)言的聯(lián)結(jié)開(kāi)始,這需要龐大的文本數(shù)據(jù)庫(kù),機(jī)器在這個(gè)文本數(shù)據(jù)庫(kù)中查驗(yàn)每個(gè)字符與其他字符在多大頻率上聯(lián)結(jié)在一起。這種表現(xiàn)非常獨(dú)特,它在多重參數(shù)空間上定義了這個(gè)詞語(yǔ)。實(shí)際上,這個(gè)詞語(yǔ)可以視為空間內(nèi)一個(gè)向量,這個(gè)向量在機(jī)器對(duì)任何語(yǔ)言的翻譯結(jié)果中都起到重要的約束作用。

這些向量遵循著簡(jiǎn)單的數(shù)學(xué)規(guī)則,舉例而言,國(guó)王(king)-男性(man)+女性(woman)=王后(queen)。所以,一句話可以認(rèn)為是由一系列向量排列形成的一條跨越空間的軌跡。

完全對(duì)應(yīng)地翻譯

機(jī)器翻譯的關(guān)鍵洞見(jiàn)在于,不同語(yǔ)言中的詞語(yǔ)在各自的參數(shù)空間內(nèi)占據(jù)著相同位置。這使得一種語(yǔ)言能夠完全對(duì)應(yīng)地被翻譯成另一種語(yǔ)言。在這個(gè)意義上,翻譯句子就變成尋找那些跨越空間的相似軌跡的過(guò)程,機(jī)器甚至不需要“知道”句子的具體含義。

這個(gè)過(guò)程需要依賴大數(shù)據(jù)集。但幾年前,德國(guó)的一個(gè)研究者團(tuán)隊(duì)利用小型數(shù)據(jù)庫(kù)協(xié)助翻譯缺少大型文本數(shù)據(jù)庫(kù)的稀有語(yǔ)言,其中的竅門(mén)在于找到一種除數(shù)據(jù)庫(kù)之外能夠約束機(jī)器的方法。

利用語(yǔ)言進(jìn)化的約束

羅家明團(tuán)隊(duì)已經(jīng)進(jìn)一步展示了機(jī)器是怎樣翻譯一門(mén)失傳語(yǔ)言的,他們使用的約束與語(yǔ)言隨時(shí)間的變化相關(guān)。任何語(yǔ)言都是以某種方式變化的,比如,親屬語(yǔ)言中的符號(hào)以相似的分布出現(xiàn),相關(guān)詞語(yǔ)有相同順序的字符,等等。有了這些規(guī)則的約束,如果已知某種古老的語(yǔ)言形式,那么翻譯就會(huì)輕松許多。

羅家明團(tuán)隊(duì)利用這項(xiàng)技術(shù)測(cè)試了兩種失傳語(yǔ)言,B類(lèi)線形文字和烏加里特語(yǔ)。語(yǔ)言學(xué)家已經(jīng)知道,古希臘語(yǔ)的早期形式是由B類(lèi)線形文字編碼得到,而在1929年發(fā)現(xiàn)的烏加里特語(yǔ)則是希伯來(lái)語(yǔ)的早期形式。

利用這些信息和語(yǔ)言進(jìn)化的約束,羅家明團(tuán)隊(duì)研發(fā)的機(jī)器能夠以相當(dāng)高的準(zhǔn)確度完成上述兩種語(yǔ)言的翻譯?!拔覀兡軌蛘_地將67.3%的B類(lèi)線形文字中的同源詞翻譯成對(duì)應(yīng)的希臘語(yǔ)”,他們說(shuō),“據(jù)我們所知,本次實(shí)驗(yàn)是最早嘗試自動(dòng)翻譯B類(lèi)線形文字的?!倍錾墓ぷ鞒晒麑C(jī)器翻譯提高到新的水平。但這也引發(fā)了關(guān)于其它失傳語(yǔ)言的疑問(wèn)——尤其是從未被翻譯過(guò)的語(yǔ)言,如A類(lèi)線形文字。

在這篇文章中,A類(lèi)線形文字的缺席顯而易見(jiàn),羅家明團(tuán)隊(duì)甚至沒(méi)有提及A類(lèi)線形文字,但和所有語(yǔ)言學(xué)家一樣,它肯定在他們心中揮之不去。不過(guò)可以確定的是,在A類(lèi)線形文字能夠被機(jī)器準(zhǔn)確翻譯之前,我們還需要一些重要的突破。舉個(gè)例子,沒(méi)人知道A類(lèi)線形文字編碼了哪種語(yǔ)言,將它翻譯成古希臘語(yǔ)的嘗試都失敗了。如果不知道祖語(yǔ)言,新技術(shù)也起不了作用。

但是基于機(jī)器的方法存在一個(gè)明顯的優(yōu)勢(shì),機(jī)器可以快速而不知疲倦地對(duì)每種語(yǔ)言進(jìn)行測(cè)試。因此羅家明團(tuán)隊(duì)或許可以用一種粗暴的方法攻克A類(lèi)線形文字的翻譯難關(guān)——嘗試將它翻譯成機(jī)器已經(jīng)掌握的每種語(yǔ)言。如果最終成功,那一定是一項(xiàng)偉大的成就,一項(xiàng)足以另邁克爾·文特里斯贊嘆不已的成就。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50223

    瀏覽量

    266540
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8560

    瀏覽量

    137153

原文標(biāo)題:三千年前的古文字被AI破譯,MIT和谷歌開(kāi)發(fā)失傳語(yǔ)言的機(jī)器翻譯系統(tǒng)

文章出處:【微信號(hào):BigDataDigest,微信公眾號(hào):大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    淺談人工智能(2)

    接前文《淺談人工智能(1)》。 (5)什么是弱人工智能、強(qiáng)人工智能以及超人工智能? 弱人工智能(Weak AI),也稱限制領(lǐng)域
    的頭像 發(fā)表于 02-22 08:24 ?275次閱讀
    淺談<b class='flag-5'>人工智能</b>(2)

    開(kāi)發(fā)智能體配置-內(nèi)容合規(guī)

    智能體上架,需完成“人工智能生成合成內(nèi)容標(biāo)識(shí)”和“大模型備案信息”填寫(xiě) ,以供平臺(tái)審核;可在智能體【配置】-【內(nèi)容合規(guī)】中填寫(xiě)。 人工智能
    發(fā)表于 02-07 11:44

    微軟與新思科技分享智能人工智能技術(shù)的行業(yè)影響

    在2025世界移動(dòng)通信大會(huì)(MWC 2025)上,微軟(Microsoft)與新思科技(Synopsys)兩家科技巨頭攜手登臺(tái),分享了他們對(duì)人工智能(AI)發(fā)展的最新洞見(jiàn)、智能人工智能
    的頭像 發(fā)表于 11-30 09:48 ?482次閱讀

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對(duì)開(kāi)發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開(kāi)發(fā)和終端
    發(fā)表于 08-31 20:54

    人工智能+”,走老路難賺到新錢(qián)

    昨天的“人工智能+”刷屏了,這算是官方第一次對(duì)“人工智能+”這個(gè)名稱定性吧?今年年初到現(xiàn)在,涌現(xiàn)出了一大批基于人工智能的創(chuàng)業(yè)者,這已經(jīng)算是AI2.0時(shí)代的第三波創(chuàng)業(yè)潮了,第一波是基礎(chǔ)大模型,第二波
    的頭像 發(fā)表于 08-27 13:21 ?839次閱讀
    “<b class='flag-5'>人工智能</b>+”,走老路難賺到新錢(qián)

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來(lái)給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開(kāi)箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來(lái)給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開(kāi)箱即學(xué),便捷拉滿 這個(gè)實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:23

    迅為RK3588開(kāi)發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能

    迅為RK3588開(kāi)發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門(mén)學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無(wú)論是探索未來(lái)職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    高光譜成像技術(shù):解鎖墨書(shū)古文字的“科技密鑰”

    引言: 4 月20日谷雨節(jié)氣之際,我們迎來(lái)了第十六個(gè)聯(lián)合國(guó)中文日;緊隨其后的4月23日世界 讀書(shū)日,則進(jìn)一步凸顯了文字與閱讀對(duì)人類(lèi)文明的意義。近年來(lái),隨著“中文熱”在全球的持 續(xù)升溫,國(guó)家主席多次
    的頭像 發(fā)表于 06-26 15:53 ?1214次閱讀
    高光譜成像技術(shù):解鎖墨書(shū)<b class='flag-5'>古文字</b>的“科技密鑰”

    墨芯人工智能深圳總部喬遷新址

    近日,墨芯人工智能公司總部正式遷入新址深圳海弘毅大廈。此次喬遷標(biāo)志著墨芯人工智能邁入加速發(fā)展的快車(chē)道,為打造新一代AI算力平臺(tái)提供更強(qiáng)大的支撐。
    的頭像 發(fā)表于 06-26 14:56 ?1117次閱讀

    小米智能插座評(píng)測(cè)拆解 10年前的小米智能插座 用料比現(xiàn)在99%的同類(lèi)產(chǎn)品都能打

    小米智能插座評(píng)測(cè)拆解 10年前的小米智能插座 用料比現(xiàn)在99%的同類(lèi)產(chǎn)品都能打
    的頭像 發(fā)表于 06-12 09:28 ?4367次閱讀
    小米<b class='flag-5'>智能</b>插座評(píng)測(cè)拆解 10<b class='flag-5'>年前</b>的小米<b class='flag-5'>智能</b>插座 用料比現(xiàn)在99%的同類(lèi)產(chǎn)品都能打

    華礪智行榮登2025度武漢市人工智能新銳企業(yè)TOP50榜單

    近日,以“同心賦能?科創(chuàng)融鏈”為主題的科創(chuàng)供應(yīng)鏈人工智能專(zhuān)場(chǎng)對(duì)接活動(dòng)順利召開(kāi)?;顒?dòng)現(xiàn)場(chǎng),《2025武漢市人工智能企業(yè)庫(kù)報(bào)告》、 《2025度武漢市
    的頭像 發(fā)表于 05-26 17:55 ?1279次閱讀

    開(kāi)售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴(kuò)展/重力感應(yīng)/RS232/RS485/IO 擴(kuò)展/I2C 擴(kuò)展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個(gè)全新八核擁有超強(qiáng)性能的人工智能
    發(fā)表于 04-23 10:55

    斯坦福大學(xué)發(fā)布《2025 人工智能指數(shù)報(bào)告》

    20254月,斯坦福2025HAI報(bào)告重磅發(fā)布。由李飛飛聯(lián)合領(lǐng)導(dǎo)的斯坦福大學(xué)以人為本人工智能研究所(StanfordHAI)發(fā)布了《2025人工智能指數(shù)報(bào)告
    的頭像 發(fā)表于 04-11 11:08 ?1803次閱讀
    斯坦福大學(xué)發(fā)布《2025 <b class='flag-5'>年</b><b class='flag-5'>人工智能</b>指數(shù)報(bào)告》