91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器學(xué)習(xí)如何破譯早已消亡的古老語言?

jmiy_worldofai ? 來源:YXQ ? 2019-04-08 11:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在大英博物館(British Museum)的柔光照射下,人們只能勉強(qiáng)看到鐫刻在這些古老泥板上的密密麻麻的楔形標(biāo)記。這些細(xì)小的標(biāo)記是世界上最古老的書寫系統(tǒng)——楔形文字的遺跡。

楔形文字起源于5000多年前的美索不達(dá)米亞,位于底格里斯河和幼發(fā)拉底河之間,也就是現(xiàn)在的伊拉克。楔形文字捕捉了一個(gè)長達(dá)3000年之久的、復(fù)雜而迷人的文明。從王室兄弟姐妹之間憤怒內(nèi)斗的信件,到安撫一個(gè)任性嬰兒的儀式,這些石碑讓人們可以從另一個(gè)獨(dú)特的視角了解歷史初期的社會(huì)。

它們記錄了阿卡德、亞述和巴比倫帝國的興衰,這是世界上第一個(gè)帝國。據(jù)估計(jì),人們已經(jīng)挖掘出了約50萬塊楔形文字板,但還有很多仍深埋地下。

約150年前,學(xué)者首次破譯楔形文字。然而,只有一小部分能讀懂這種文字的人才了解其中的秘密。目前,仍有約90%的楔形文字未被翻譯出來。

但是,這種情況可能會(huì)有所改變,這都要?dú)w功于現(xiàn)代工具——機(jī)器翻譯。

"人們并不了解美索不達(dá)米亞文明對(duì)自身文化的影響,"多倫多大學(xué)亞述學(xué)研究員佩龍(Emilie Page-Perron)說。美索不達(dá)米亞文明孕育了車輪、天文學(xué)、一小時(shí)60分鐘的計(jì)時(shí)制、地圖、洪水和方舟的故事、以及第一部文學(xué)作品——《吉爾伽美什史詩》。這本詩集主要是用蘇美爾語和阿卡德語寫成的,能讀懂這些語言的學(xué)者少之又少。

佩龍現(xiàn)在正在進(jìn)行的一個(gè)項(xiàng)目,是用機(jī)器翻譯公元前21世紀(jì)以來美索不達(dá)米亞文明的行政記錄,數(shù)量多達(dá)69000份,其目的之一是為新的研究發(fā)掘過去。

佩龍說:"我們雖然已經(jīng)獲得了關(guān)于美索不達(dá)米亞人生活的信息,但卻沒有真正從(美索不達(dá)米亞)不同領(lǐng)域?qū)I(yè)人士的知識(shí)中獲益,比如經(jīng)濟(jì)和政治領(lǐng)域。如果有渠道(了解這些知識(shí)),我們能更好地了解那些古老的社會(huì)。"

除了石碑,還有5萬多枚美索不達(dá)米亞雕刻印章散落在世界各地。幾千年來,美索不達(dá)米亞人使用由雕刻石頭制成的印章,這些印章被壓入潮濕的粘土中,用來標(biāo)記門、罐子、石板和其他物品。這些刻章中只有十分之一被編入目錄,更不用說翻譯了。

牛津大學(xué)亞述學(xué)教授達(dá)爾(Jacob Dahl)表示:"我們所獲得的關(guān)于美索不達(dá)米亞文明的資料比希臘、羅馬和古埃及的加起來還要多,但真正的挑戰(zhàn)在于找到能讀懂它們的人。"

佩龍和她的團(tuán)隊(duì)正在對(duì)一個(gè)數(shù)字化數(shù)據(jù)庫中的4000個(gè)古代行政文本樣本編寫算法。這些行政文本包括交易和運(yùn)輸記錄,比如把羊、蘆葦束或啤酒運(yùn)到寺廟或個(gè)人手中的記錄。這些文字最初是用蘆葦筆刻在粘土上的,現(xiàn)在,學(xué)者已經(jīng)把它們音譯成了我們的字母表。例如,蘇美爾語中表示"大"的詞可以寫成楔形文字,也可以寫成英文字母表中的"gal"。

這些行政文書的措辭很簡(jiǎn)單。例如,"第15天,廚房有11只母山羊"。這種特點(diǎn)使得它們特別適合被自動(dòng)化處理。一旦算法學(xué)會(huì)了將樣本文本翻譯成英語,它們就能自動(dòng)翻譯其他經(jīng)過音譯的石碑。

佩龍表示:"如果單獨(dú)看我們正在研究的文本,它并沒有那么有趣。但如果你把它們當(dāng)作一組文本來看,就有意思多了。"她預(yù)計(jì)英文版平臺(tái)將在明年內(nèi)上線。這些記錄向我們展示了古代美索不達(dá)米亞人的日常生活,包括權(quán)力結(jié)構(gòu)和貿(mào)易網(wǎng)絡(luò),同時(shí)還展示了社會(huì)歷史的其他方面,如女工的角色。平臺(tái)上可被檢索的翻譯,將使不同地方的研究人員都能探索到古代生活的豐富面向。

佩龍解釋說:"這些人與我們是如此不同,但他們也面對(duì)著和我們一樣的基本問題。理解美索不達(dá)米亞文明,能夠幫助我們理解生而為人的意義。"

她希望機(jī)器分析也能弄清蘇美爾人的一些特征,這是至今仍困擾著現(xiàn)代學(xué)術(shù)界的難題。這種已經(jīng)滅絕的語言與任何現(xiàn)代語言都沒有聯(lián)系,但卻保存在以楔形文字書寫的碑文中。這可能是我們與更古老,甚至沒有歷史記載的社會(huì)之間最后的聯(lián)系。

"蘇美爾語可能是數(shù)千年前的語言大家庭中的最后一個(gè)成員,"芬克爾(Irving Finkel)說。"文字及時(shí)地出現(xiàn)在這個(gè)世界上,拯救了蘇美爾語……幸運(yùn)的是,在蘇美爾語與其他文字一起消失之前,我們及時(shí)地開始學(xué)習(xí)這種語言。"

Image caption能夠識(shí)別古代石碑文字的算法能夠幫助研究人員將它們與制造它們的原始石印進(jìn)行匹配。

芬克爾是世界上頂尖的楔形文字專家之一。他在大英博物館堆滿書的辦公室里講解了手稿是如何慢慢被破譯的,這多虧了一位國王的多語種銘文,就像羅塞塔石碑幫助研究人員理解了埃及象形文字一樣。

他說:"當(dāng)你與千年前的靈魂進(jìn)行交談時(shí)你會(huì)驚訝地發(fā)現(xiàn),這簡(jiǎn)直太有趣了,仿佛在和他們打電話。認(rèn)識(shí)他們是世界上最令人興奮的事情。"

觸碰古老寶藏

只有少數(shù)人能接觸到擁有5000年歷史的石碑,但多虧了先進(jìn)的成像技術(shù),現(xiàn)在任何人只要能上網(wǎng)就能接觸到這些寶藏。比如,世界上現(xiàn)存最古老的皇家圖書館,人們正在將它數(shù)字化。這座圖書館位于尼尼微,由亞述國王亞述巴尼帕(Ashurbanipal)建造。大英博物館展出了圖書館里幸存的一些碑文,是亞述巴尼帕專題展覽的一部分。雖然早在公元前612年,尼尼微遭遇洗劫時(shí),這些碑文被火烤得又黑又硬,但上面得文字仍可辨認(rèn)。

新的成像技術(shù)讓人們?cè)谔幚磉@些古老且破損嚴(yán)重的文本時(shí)更加輕松。有了精細(xì)的圖像,人們就有可能找出那些肉眼看不見的模糊標(biāo)記。

達(dá)爾和他的同事一直在進(jìn)行一個(gè)名為"楔形文字?jǐn)?shù)字圖書館倡議"(Cuneiform Digital Library Initiative)的項(xiàng)目,將儲(chǔ)存在德黑蘭、巴黎和牛津館藏中的碑文及印章進(jìn)行數(shù)字化處理。這個(gè)龐大的在線數(shù)據(jù)庫已經(jīng)包含了世界上約三分之一的楔形文字,以及一些未被破譯的書面語言,如古伊朗的原始埃蘭語。如果沒有這樣龐大的數(shù)字資源,讓機(jī)器進(jìn)行翻譯幾乎是不可能的。

Image caption人們?cè)谙冗M(jìn)的成像技術(shù)及機(jī)器視覺工具的幫助下破譯古代語言,如原始埃蘭語。

數(shù)字化還幫助研究者們將散落在世界各地的文本拼湊起來。達(dá)爾與南安普頓大學(xué)及巴黎南泰爾大學(xué)的研究者一同對(duì)美索不達(dá)米亞的200多枚石印的3D圖像進(jìn)行了數(shù)字化處理。在試點(diǎn)項(xiàng)目中,他們使用了人工智能算法校驗(yàn)了6塊碑文,并識(shí)別出在世界其他地方發(fā)現(xiàn)的與之匹配的石印。算法準(zhǔn)確地挑選出了兩塊現(xiàn)存于意大利和美國的石碑,這兩塊石碑上蓋的石印是一樣的。

在過去,想要將石印和印痕匹配起來困難重重,因?yàn)樵S多石印儲(chǔ)存在數(shù)千英里之外的地方。達(dá)爾預(yù)計(jì),五年內(nèi)可以將所有的印章進(jìn)行數(shù)字化處理,這樣就可以追蹤其他方面的信息。比如說,有跡象表明,某種石頭更受到女性的青睞。

達(dá)爾說:"要得出這種結(jié)論必須擁有大量經(jīng)過處理的石印圖像,并運(yùn)用算法和機(jī)器學(xué)習(xí)等技術(shù)。"他希望,人工智能的發(fā)展能幫助探索世界各地收藏品中蘊(yùn)藏的豐富信息。

"亞述研究涵蓋了人類歷史的一半,是一種瀕臨滅絕的文化遺產(chǎn)。我希望亞述學(xué)能走在這方面的前沿。"

破譯古人的語言

成像技術(shù)也改變了對(duì)于未破譯文本的研究。對(duì)于數(shù)量少、具創(chuàng)造性文本的破譯,人類往往比機(jī)器做得更好,人類有著對(duì)生活和組織方式的深入理解,以及高度的靈活性。

Image caption三維成像技術(shù)能夠詳細(xì)檢測(cè)青金石石印這樣的圓柱形石印。

例如,早期的楔形文字符號(hào)并不是線性排布的,而是簡(jiǎn)單地與畫在周圍的方框排在一起。原始埃蘭語是三維立體的,一個(gè)圓印的深淺不同意義也不同。但是,技術(shù)可以放大、分享和比較圖片的細(xì)節(jié),加快了破譯進(jìn)程。

一直致力于破譯神秘文本的達(dá)爾說:"獲得正確的圖像是問題的核心。原始埃蘭語研究缺乏的正是這個(gè)。"

這些進(jìn)步已經(jīng)超越了亞述學(xué)領(lǐng)域。劍橋大學(xué)高級(jí)研究員斯蒂爾(Philippa Steele)是研究古克里特和希臘早期文字系統(tǒng)的專家。其中包括"線形文字A"(一種未破譯的文字)和"線形文字B"(一種古代希臘語的書寫形式)。

歸功于成熟的成像技術(shù),古代石碑上的文字被很好第呈現(xiàn),斯蒂爾才在其中發(fā)現(xiàn)了新的細(xì)節(jié)。

她說:"你可以辨認(rèn)出肉眼很難辨認(rèn)的特征。"這些特征通常與撰寫文本的人與文本交互的方式相對(duì)應(yīng)。例如,對(duì)于線性B,你可以分辨出更改的痕跡。有時(shí)你可以判斷出撰寫這份文件的人是什么時(shí)候想出來了什么,然后又在上面寫了什么。

Image caption伊拉克考古學(xué)家發(fā)掘出數(shù)千塊刻有世界上最古老文字的石碑。

佩龍希望機(jī)器最終能夠翻譯更復(fù)雜的蘇美爾語石碑和其他語言,比如阿卡德語。她說:"關(guān)于古代文化,還有很多東西有待發(fā)現(xiàn)。"

也許有一天,我們將能夠閱讀所有古老文字的翻譯版本,盡管當(dāng)我們?nèi)ナ罆r(shí),美索不達(dá)米亞的許多未解之謎還未解開,尤其是現(xiàn)在許多缺失的楔形文字碎片仍深埋地下,等待挖掘。

古代美索不達(dá)米亞的國王們深深地思考著過去和未來。他們崇敬前朝的楔形文字,將記錄著他們的名字和成就的銘文埋藏地下,寄望后世的統(tǒng)治者會(huì)將榮耀歸于自己。

在某種程度上,他們的愿望已經(jīng)實(shí)現(xiàn)。他們的經(jīng)歷過的戰(zhàn)爭(zhēng)和征服可能已經(jīng)被大多數(shù)人遺忘,但是他們最強(qiáng)大的發(fā)明——文字——在過去的幾千年里助力了人類思想和技術(shù)的發(fā)展。而現(xiàn)在,人類開始訓(xùn)練機(jī)器從過去中學(xué)習(xí)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50223

    瀏覽量

    266544
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8560

    瀏覽量

    137155

原文標(biāo)題:機(jī)器學(xué)習(xí)如何破譯早已消亡的古老語言?

文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    手把手教你學(xué)51單片機(jī)-C語言

    更多信息),手把手地帶領(lǐng)大家來學(xué)習(xí)單片機(jī)技術(shù),給單片機(jī)初學(xué)者帶來福音,讓大家一步一個(gè)腳印的掌握單片機(jī)技術(shù)。 《手把手教你學(xué)51單片機(jī)-C語言版》(第3版)這本書除了講解簡(jiǎn)單的實(shí)驗(yàn)和編程語法、由淺入深
    發(fā)表于 03-05 11:47

    面向視覺語言導(dǎo)航的任務(wù)驅(qū)動(dòng)式地圖學(xué)習(xí)框架MapDream介紹

    在視覺語言導(dǎo)航(VLN)中,地圖長期作為獨(dú)立模塊構(gòu)建,并通過固定接口交由導(dǎo)航策略使用。無論是BEV網(wǎng)格、拓?fù)鋱D還是語義記憶模塊,這些表示大多脫離策略學(xué)習(xí)而設(shè)計(jì)。結(jié)果是,機(jī)器人即使掌握?qǐng)鼍暗男畔?,也仍可能繞行甚至偏離目標(biāo),因?yàn)榈貓D
    的頭像 發(fā)表于 03-02 10:40 ?542次閱讀
    面向視覺<b class='flag-5'>語言</b>導(dǎo)航的任務(wù)驅(qū)動(dòng)式地圖<b class='flag-5'>學(xué)習(xí)</b>框架MapDream介紹

    人工智能與機(jī)器學(xué)習(xí)在這些行業(yè)的深度應(yīng)用

    自人工智能和機(jī)器學(xué)習(xí)問世以來,多個(gè)在線領(lǐng)域的數(shù)字化格局迎來了翻天覆地的變化。這些技術(shù)從誕生之初就為企業(yè)賦予了競(jìng)爭(zhēng)優(yōu)勢(shì),而在線行業(yè)正是受其影響最為顯著的領(lǐng)域。人工智能(AI)與機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 02-04 14:44 ?623次閱讀

    強(qiáng)化學(xué)習(xí)會(huì)讓自動(dòng)駕駛模型學(xué)習(xí)更快嗎?

    是一種讓機(jī)器通過“試錯(cuò)”學(xué)會(huì)決策的辦法。與監(jiān)督學(xué)習(xí)不同,監(jiān)督學(xué)習(xí)是有人提供示范答案,讓模型去模仿;而強(qiáng)化學(xué)習(xí)不會(huì)把每一步的“正確答案”都告訴你,而是把環(huán)境、動(dòng)作和結(jié)果連起來,讓
    的頭像 發(fā)表于 01-31 09:34 ?786次閱讀
    強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>會(huì)讓自動(dòng)駕駛模型<b class='flag-5'>學(xué)習(xí)</b>更快嗎?

    自然語言處理NLP的概念和工作原理

    自然語言處理 (NLP) 是人工智能 (AI) 的一個(gè)分支,它會(huì)教計(jì)算機(jī)如何理解口頭和書面形式的人類語言。自然語言處理將計(jì)算語言學(xué)與機(jī)器
    的頭像 發(fā)表于 01-29 14:01 ?535次閱讀
    自然<b class='flag-5'>語言</b>處理NLP的概念和工作原理

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    無論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注數(shù)據(jù)、模型架構(gòu)
    的頭像 發(fā)表于 01-07 15:37 ?301次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見錯(cuò)誤與局限性

    匯編語言還有必要學(xué)習(xí)

    1、嵌入式操作系統(tǒng)需要匯編語言 2、實(shí)時(shí)性要求非常高的地方,需要匯編語言,比如FFT算法。 3、匯編語言做運(yùn)算那叫一個(gè)痛苦,下面是一段雙字節(jié)乘法,浮點(diǎn)數(shù)就更難搞
    的頭像 發(fā)表于 11-25 11:46 ?741次閱讀
    匯編<b class='flag-5'>語言</b>還有必要<b class='flag-5'>學(xué)習(xí)</b>嗎

    匯編語言的起源

    (opcode),比如加法指令就是00000011。編譯器的作用,就是將高級(jí)語言寫好的程序,翻譯成一條條操作碼。 對(duì)于人類來說,二進(jìn)制程序是不可讀的,根本看不出來機(jī)器干了什么。為了解決可讀性的問題,以及偶爾
    發(fā)表于 11-20 07:19

    C語言和單片機(jī)C語言有什么差異

    匯編語言機(jī)器才能讀懂,所以每個(gè)平臺(tái)的編譯器編譯成對(duì)應(yīng)平臺(tái)匯編的程序,每個(gè)平臺(tái)的匯編不一樣,當(dāng)然編譯器也不一樣。 DOS上的TC2 TC3 WINDOWS上的VC 8051的C51都有自已的編譯器。具體
    發(fā)表于 11-14 07:55

    一文了解Mojo編程語言

    Mojo 語言的具體介紹: 核心特點(diǎn) Python 兼容性 Mojo 支持大部分 Python 語法和標(biāo)準(zhǔn)庫,可直接調(diào)用 Python 生態(tài)系統(tǒng)中的庫,降低了學(xué)習(xí)成本。 極致性能優(yōu)化 通過靜態(tài)編譯
    發(fā)表于 11-07 05:59

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實(shí)的編程技能才能真正掌握并合理使用這項(xiàng)技術(shù)。事實(shí)上,這種印象忽視了該技術(shù)為機(jī)器視覺(乃至生產(chǎn)自動(dòng)化)帶來的潛力,因?yàn)樯疃?b class='flag-5'>學(xué)習(xí)并非只屬于計(jì)算機(jī)科學(xué)家或程序員。 從頭開始:什么
    的頭像 發(fā)表于 09-10 17:38 ?1000次閱讀
    如何在<b class='flag-5'>機(jī)器</b>視覺中部署深度<b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    如何解決開發(fā)機(jī)器學(xué)習(xí)程序時(shí)Keil項(xiàng)目只能在調(diào)試模式下運(yùn)行,但無法正常執(zhí)行的問題?

    如何解決開發(fā)機(jī)器學(xué)習(xí)程序時(shí)Keil項(xiàng)目只能在調(diào)試模式下運(yùn)行,但無法正常執(zhí)行的問題
    發(fā)表于 08-28 07:28

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門陣列)作為一種靈活且高效的硬件加速平臺(tái)
    的頭像 發(fā)表于 07-16 15:34 ?3025次閱讀

    通過NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)

    通用機(jī)器人的時(shí)代已經(jīng)到來,這得益于機(jī)械電子技術(shù)和機(jī)器人 AI 基礎(chǔ)模型的進(jìn)步。但目前機(jī)器人技術(shù)的發(fā)展仍面臨一個(gè)關(guān)鍵挑戰(zhàn):機(jī)器人需要大量的訓(xùn)練數(shù)據(jù)來掌握諸如組裝和檢查之類的技能,而手動(dòng)演
    的頭像 發(fā)表于 07-14 11:49 ?1222次閱讀
    通過NVIDIA Cosmos模型增強(qiáng)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    Arm技術(shù)賦能機(jī)器人行業(yè)變革

    機(jī)器早已不再局限于工廠車間或科幻電影,它們已經(jīng)融入人們的日常生活,或許是客廳里默默工作的掃地機(jī)器人,又或是在超市里引導(dǎo)顧客完成購物的自助收銀機(jī),這些早已不是新奇事物,而是廣泛技術(shù)變革
    的頭像 發(fā)表于 06-26 09:35 ?1386次閱讀