近日,最新一期的《自然-人類行為》雜志發(fā)表了一項(xiàng)AI研究成果。該研究顯示,在一組實(shí)驗(yàn)中,兩款A(yù)I大語(yǔ)言模型在某些情境下展現(xiàn)出與人類相似甚至勝過(guò)人類的心理狀態(tài)感知能力。
心理狀態(tài)感知能力,又稱心智理論,對(duì)于人類社交至關(guān)重要。來(lái)自德國(guó)漢堡-埃彭多夫大學(xué)醫(yī)學(xué)中心的James W. A. Strachan及其團(tuán)隊(duì)設(shè)計(jì)了一系列測(cè)試,以評(píng)估AI模型在發(fā)現(xiàn)錯(cuò)誤觀念、理解間接言辭以及辨識(shí)不敬等多個(gè)維度的表現(xiàn)。
值得注意的是,他們使用了GPT和LLaMA2這兩款模型進(jìn)行實(shí)驗(yàn),并將其與1907名參與者進(jìn)行比較。
實(shí)驗(yàn)結(jié)果表明,GPT在識(shí)別間接請(qǐng)求、錯(cuò)誤觀念和誤導(dǎo)信息時(shí),有時(shí)甚至超過(guò)了人類的平均水平;然而,在辨識(shí)不敬信息方面,LLaMA2優(yōu)于人類,而GPT表現(xiàn)欠佳。
對(duì)此,Strachan解釋說(shuō),LLaMA2的成功可能源于其較低的偏見(jiàn)程度,而非真正對(duì)不敬信息敏感;至于GPT的表現(xiàn)不佳,他認(rèn)為主要原因在于它過(guò)于保守地堅(jiān)持自己的結(jié)論,而非推理出錯(cuò)。
-
AI
+關(guān)注
關(guān)注
91文章
39793瀏覽量
301441 -
模型
+關(guān)注
關(guān)注
1文章
3752瀏覽量
52111 -
GPT
+關(guān)注
關(guān)注
0文章
368瀏覽量
16873
發(fā)布評(píng)論請(qǐng)先 登錄
使用NORDIC AI的好處
嵌入式軟件單元測(cè)試中AI自動(dòng)化與人工檢查的協(xié)同機(jī)制研究:基于專業(yè)工具的實(shí)證分析
行業(yè)特定的生成式 AI 能力如何形成:面向中國(guó)企業(yè)的場(chǎng)景化解決方案模型
AI賦能6G與衛(wèi)星通信:開(kāi)啟智能天網(wǎng)新時(shí)代
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的未來(lái):提升算力還是智力
【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件
AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?
【「DeepSeek 核心技術(shù)揭秘」閱讀體驗(yàn)】+混合專家
信而泰×DeepSeek:AI推理引擎驅(qū)動(dòng)網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代
AI時(shí)代:不可替代的“人類+”職業(yè)技能
【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】+ 入門(mén)篇學(xué)習(xí)
NVIDIA發(fā)布連接AI智能體的AI-Q Blueprint
AI具備特定任務(wù)中接近甚至超越人類的心理狀態(tài)能力
評(píng)論