91欧美超碰AV自拍|国产成年人性爱视频免费看|亚洲 日韩 欧美一厂二区入|人人看人人爽人人操aV|丝袜美腿视频一区二区在线看|人人操人人爽人人爱|婷婷五月天超碰|97色色欧美亚州A√|另类A√无码精品一级av|欧美特级日韩特级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

英文勝在口語,中文勝在書面語,誰能成為AI的母語?

如意 ? 來源:今日頭條 ? 作者:猴軍集 ? 2020-10-19 14:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能是當前很熱門的技術,各國都在投入資金和人力進行研究。誰錯過了人工智能,誰就丟掉了未來。

語言文字在人工智能中占有非常重要的地位,它是人和人工智能交互的工具,人工智能只有準確理解語言文字才能做出準確應對,才能表現(xiàn)出高智商。今天就談談中文和英文是不是優(yōu)秀的人工智能語言,以及未來前景。

一、語音識別

雖然我不想承認,但英文語音識別確實比中文更準確、高效。

英文由26個字母構(gòu)成,邏輯結(jié)構(gòu)更簡單,發(fā)音以字母為基礎,音標和音標區(qū)之間區(qū)分比較明顯,只要說的不是很快,AI能比較容易、準確識別每一個字母,加上同音單詞比較少,所以英文的語音識別效率領先中文許多。

中文發(fā)音則要復雜的多。漢語拼音有23個聲母,6個單韻母,18個復韻母,還有16個整體認讀音節(jié),整套方案共63個發(fā)音元素。除此之外,漢語還有四種音調(diào),加上種類繁多的方言,發(fā)音不準的話,非常影響AI識別。

AI在進行中文識別的時候,需要先進行發(fā)音識別,再根據(jù)單詞進行漢字判斷,識別效率低于英文,識別錯誤率也高于英文。

語音識別,英文勝。

二、文字識別

到文字識別環(huán)節(jié),我們終于可以揚眉吐氣了,中文文字識別的效率和準確度比英文更勝一籌。

中文有幾個特點,讓AI識別更高效:

1、漢字信息密度高,更少的字數(shù)可以承載更多的信息,中文文章永遠比英文短,綜合來看,中文信息密度比英文高37.5%。

2、中文以漢字為單位,可以靈活排列,橫豎都可以,而英文是線性文字,只能橫排,豎排、錯亂排列的識別效率會驟降!

3、漢字獨立表意能力強。比如“他去吃早飯”,你看一個字就能多明白一個字的意思。而英文“He went to have breakfast”,你即使看到“have”這個詞,你依然不明大概的意思,只有到“breakfast”你才知道原來have是吃,went to是去,整句是去吃早飯。英文表意比較依賴“短語”,甚至整句,不看完整句話,你往往不能知道句意。這就給AI識別造成了難度,因為AI跳躍識別能力較差。

文字識別,中文勝。

三、同音字詞

中文發(fā)展人工智能比較大的障礙就是同音字詞現(xiàn)象!比如,他姓zhang,到底是“張”還是“章”呢?如果是口語的話,還要補一句弓長張,或立早章。中文里有多少同音字、同音詞,很難準確的統(tǒng)計。同音字詞也是英語使用者攻擊中文表意不清比較大的借口。

英語雖然也有同音字,如right正確的、write寫字;meet遇見、meat 肉;hole 洞穴、whole 全部的;pear梨子、pair雙;flower花、flour面粉等,但英語同音字詞數(shù)量遠比中文同音詞數(shù)量少。英語是通過造更多單詞的方法,來減少同音詞現(xiàn)象的。

AI現(xiàn)在不能準確處理多音字,出錯在所難免。難道為了AI準確,人類只能通過語言文字改革消滅多音字詞?這工程也太大了,人類也很難適應這么大的改革!

同音字詞,英文勝。

四、多義字詞

一詞多義,是每種成熟語言都難免的,世間萬事萬物這么多,情感這復雜,如果每個詞匯只表達一個準確的意思,那幾百萬字詞都收不住。無論是中文還是英文,一個字詞不會只表達一個意思,通常有很多意思,有時候區(qū)別還很大!

比如“close”,其意思非常多:關閉、合攏、合上、不開放、(使)關門、關閉(一段時間)、結(jié)束、終結(jié)、接近、幾乎(處于某種狀態(tài))、可能(快要做某事)、親密的、密切的、接近、靠近、不遠地、死胡同、斷頭路、大教堂所屬的周圍場地及建筑物等。

現(xiàn)在人工智通過上下文識別詞義的能力還比較弱,遇到多義詞的時候經(jīng)常出錯,這也是人工智能發(fā)展的難關。

多義字詞,中文和英文彼此彼此。

五、整段識別

讓人工智能翻譯一個短句,一句話,其實沒多大意義,實用價值也不高,只有具備整段文字識別,才有實用價值。讓我們以中英文互譯來考察AI對中文和英文的識別能力了!

原文如下:

“Things that trend in these two countries are insanely different. For example: knowledge-basedcontent is extremely popular in China, and less so in the U.S. Also, this was wild to me: thosecreators that did the most dance videos in China are users born in the 60s (?。。?, whereas in theUS, it seems that it‘s mostly teenagers who are creating the dances,” she wrote.

她寫道:“這兩個國家的趨勢截然不同,比如:知識性內(nèi)容在中國很流行,但在美國稍差一些。而且,這一點對我來說很瘋狂:中國最喜歡拍舞蹈視頻的是60后(?。。诿绹?,好像是年輕人最喜歡拍舞蹈視頻?!?/p>

AI將“英文原文”翻譯成中文如下:

“這兩個國家的趨勢截然不同。例如:以知識為基礎的內(nèi)容在中國非常受歡迎,而在美國卻很少。此外,這對我來說很瘋狂:在中國制作舞蹈視頻最多的創(chuàng)作者是 她出生于60年代(?。。┑挠脩?,而在美國,似乎是大多數(shù)年輕人在創(chuàng)作舞蹈?!彼龑懙馈?/p>

有一句失真比較嚴重:“在中國制作舞蹈視頻最多的創(chuàng)作者是 她出生于60年代(!?。┑挠脩??!?/p>

這句話的英文原文是: “those creators that did the most dance videos in China are users born in the 60s ”。這是一句英語長句,詞序比較復雜,又夾雜了亂七八糟的介詞,導致人工智能的大腦錯亂,沒能準確識別!

這個英文識別錯誤很有典型性,暴露了英文在語法上、詞序上太過復雜的弊端。如果是翻譯更復雜的英語長句,AI將束手無策!這也是每個表音文字的弱點!

AI將“中文原文”翻譯成英文如下:

“The trends in these two countries are quite different. For example, intellectual content is very popular in China, but a bit worse in the United States. Moreover, this is crazy to me: China’s favorite dance video is born in the 60s (! ?。?, but in the United States, it seems that young people like to shoot dance videos the most,” she wrote.

中文翻譯非常精準,和原文在表意上幾乎沒有任何差別,如實還原了原文的意思!可見,在整段話、整篇文章的識別上,中文比英文更有優(yōu)勢!

中文是由一個個漢字構(gòu)成,長句很少,語法簡單,詞序簡單,在語句結(jié)構(gòu)上比線性的英語簡單的多,更有利于AI識別。

六、誰才是人工智能的未來?

在人工智能領域,英文勝在口語,中文勝在書面語,各有所長,誰能成為AI的母語還言之過早。但在比較復雜的內(nèi)容表達上,AI對中文的識別領先英文,所以我更看好中文的未來。
責編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    91

    文章

    40179

    瀏覽量

    301785
  • 語音識別
    +關注

    關注

    39

    文章

    1812

    瀏覽量

    116119
  • 語言
    +關注

    關注

    1

    文章

    97

    瀏覽量

    24853
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    廣州唯創(chuàng)電子WT2605C-24SS音頻藍牙語音芯片:為何它能成為標準藍牙與多樣化存儲播放的理想選擇?

    在無線音頻技術飛速發(fā)展的今天,一款功能全面、性能卓越的語音芯片往往能成為眾多智能設備的核心競爭力。作為國內(nèi)知名的語音IC廠家,廣州唯創(chuàng)電子推出的WT2605C-24SS音頻藍牙錄放語音芯片,憑借其
    的頭像 發(fā)表于 03-06 08:55 ?109次閱讀
    廣州唯創(chuàng)電子WT2605C-24SS音頻藍牙語音芯片:為何它<b class='flag-5'>能成為</b>標準藍牙與多樣化存儲播放的理想選擇?

    AI人機協(xié)同 雙芯智能丨瑞聲達至境·臻(ReSound Vivia)系列助聽器震撼上市

    ” 為核心理念,依托嵌入式360及DNN深度神經(jīng)網(wǎng)絡芯片,對環(huán)境聲音進行智能分析與處理,為用戶實現(xiàn)噪聲環(huán)境下言語聚焦、長時續(xù)航及多場景智能連接的高品質(zhì)生活。 智能內(nèi)核:雙芯協(xié)同,讓AI“聽懂”環(huán)境,更“理解”人心 至境·臻(ReSound Vivia)系列的
    的頭像 發(fā)表于 02-04 14:34 ?6542次閱讀

    技術破局,黑馬突圍!GPMI技術重構(gòu)投影行業(yè)格局

    在投影行業(yè)深陷連接復雜、體驗割裂的當下,誰能成為打破僵局、重塑標準的破局者?
    的頭像 發(fā)表于 02-01 11:06 ?763次閱讀

    從直接接入到互感器配合:三相電能表最大功率分級與場景適配解析

    直接接入式勝在便捷經(jīng)濟,外接 CT 式贏在量程靈活,VT+CT 組合式強在高壓大功率適配。
    的頭像 發(fā)表于 12-11 11:36 ?2109次閱讀
    從直接接入到互感器配合:三相電能表最大功率分級與場景適配解析

    稀土為何能成為中國反制的關鍵籌碼?#國產(chǎn)芯片

    行業(yè)資訊
    芯廣場
    發(fā)布于 :2025年11月25日 17:00:01

    kconfig里寫的英文,setting里面顯示的是中文,這是什么原因?qū)е碌模?/a>

    最近在學習artpi2,發(fā)現(xiàn)圖片顯示的這里 這里用的是英文,但是setting這里是中文 gpio的setting上也有類似的現(xiàn)象,請問這是什么原因?qū)е碌?/div>
    發(fā)表于 09-22 06:10

    AIDC如何成為AI發(fā)展的關鍵一棒?

    AI
    腦極體
    發(fā)布于 :2025年09月21日 12:21:23

    IBM研究報告:體育粉絲對AI助力的動態(tài)數(shù)字內(nèi)容的需求增長

    IBM(紐約證券交易所代碼:IBM)委托開展的一項新的全球研究顯示,體育愛好者正轉(zhuǎn)向更具互動性的數(shù)字內(nèi)容體驗,其中AI、個性化服務及實時功能成為他們參與體育活動的核心要素。
    的頭像 發(fā)表于 08-26 17:33 ?724次閱讀

    芯??萍级麻L盧國建:破解健康測量難題,芯海構(gòu)建芯片+AI診斷新方案

    近日,在上海舉辦的人工智能大會上,AI賦能智慧醫(yī)療,為健康賦能成為行業(yè)關注的焦點。如何應對慢病預防,肥胖診斷這一挑戰(zhàn)?芯海科技董事長盧國建表示:“場景驅(qū)動創(chuàng)新,但創(chuàng)新需要什么,需要芯片和算法給予賦能,我們通過垂直的AI技術,能夠
    的頭像 發(fā)表于 08-15 11:03 ?9604次閱讀
    芯??萍级麻L盧國建:破解健康測量難題,芯海構(gòu)建芯片+<b class='flag-5'>AI</b>診斷新方案

    騰視科技TS-SG-SM7系列AI算力模組:32TOPS算力引擎,開啟邊緣智能新紀元

    從城市管理到工業(yè)生產(chǎn),從物流運輸?shù)较M終端,TS-SG-SM7系列AI算力模組以 “超強算力、超低功耗、靈活擴展” 的特性,成為邊緣智能落地的關鍵支點。騰視科技正通過持續(xù)的技術創(chuàng)新,推動AI算力從云端下沉至場景一線,讓每一個邊緣
    的頭像 發(fā)表于 07-07 16:44 ?1989次閱讀
    騰視科技TS-SG-SM7系列<b class='flag-5'>AI</b>算力模組:32TOPS算力引擎,開啟邊緣智能新紀元

    AI時代研華如何領跑智慧醫(yī)療長賽道

    AI時代,如何讓影像診斷更快速、手術操作更精準?面對多元化場景與高壁壘挑戰(zhàn),哪些技術路徑能成為破局關鍵?近期,研華嵌入式物聯(lián)網(wǎng)平臺事業(yè)群資深業(yè)務總監(jiān)肖健萍女士接受了數(shù)智銳角記者劉敏專訪,分享了研華在智能醫(yī)療的規(guī)劃,看研華如何領跑智慧醫(yī)療長賽道。
    的頭像 發(fā)表于 05-14 16:10 ?1628次閱讀

    小智AI語音助手調(diào)試成功,母親節(jié)祝福演示來啦

    、OLED 屏幕、麥克風模塊、喇叭驅(qū)動模塊、小喇叭、以及電源連接線、面包板。 因為有面包板,所以搭建就非常的容易,不需要焊接電路板,就十分的方便,體驗感也是很不錯的。 整體體驗感很不錯的,這個套件也是非常的安逸,可以很容易的搭建小智AI助手,非常的有趣。 演示視頻來啦,讓小智寫一段母親節(jié)祝福
    發(fā)表于 05-12 22:02

    新生態(tài) 智未來「飛凌嵌入式2025嵌入式及邊緣AI技術論壇」開啟報名!

    在這個技術日新月異的時代,每一場思想的碰撞都可能成為推動行業(yè)前行的力量,每一次深度對話都可能迸發(fā)出改變時代的強光——2025年4月22日,飛凌嵌入式將在深圳舉辦“2025嵌入式及邊緣AI技術論壇”,本次論壇以“新生態(tài),智未來”為主題,旨在匯聚行業(yè)智慧,探討嵌入式技術與邊緣
    的頭像 發(fā)表于 03-28 08:05 ?1290次閱讀
    新生態(tài) 智未來「飛凌嵌入式2025嵌入式及邊緣<b class='flag-5'>AI</b>技術論壇」開啟報名!

    2.5D封裝為何成為AI芯片的“寵兒”?

    2.5D封裝領域,英特爾的EMIB和臺積電的CoWoS是兩大明星技術。眾所周知,臺積電的CoWoS產(chǎn)能緊缺嚴重制約了AI芯片的發(fā)展,這正是英特爾EMIB技術可以彌補的地方。本文我們將以英特爾EMIB為例,深入解析2.5D封裝之所以能成為
    的頭像 發(fā)表于 03-27 18:12 ?937次閱讀
    2.5D封裝為何<b class='flag-5'>成為</b><b class='flag-5'>AI</b>芯片的“寵兒”?

    中科創(chuàng)達受邀出席ICDT 2025 AI能成像與顯示專題論壇

    近日,ICDT 2025—“AI能成像與顯示專題論壇”在廈門佰翔會展中心成功召開。本次論壇聚焦AI技術在成像與顯示領域的創(chuàng)新應用,匯聚了行業(yè)專家、企業(yè)領袖及技術精英,共同探索AI賦能
    的頭像 發(fā)表于 03-27 10:51 ?1258次閱讀