首頁(yè) > 健康 >

領(lǐng)先的人工智能聊天機(jī)器人在測(cè)試中表現(xiàn)出類似癡呆癥的認(rèn)知能力下降

發(fā)布時(shí)間:2024-12-19 14:32:21來(lái)源:

《英國(guó)醫(yī)學(xué)雜志》圣誕刊的一項(xiàng)研究發(fā)現(xiàn),在廣泛用于發(fā)現(xiàn)癡呆癥早期跡象的測(cè)試中,幾乎所有領(lǐng)先的大型語(yǔ)言模型或“聊天機(jī)器人”都表現(xiàn)出輕度認(rèn)知障礙的跡象。

研究結(jié)果還顯示,“老”版本的聊天機(jī)器人,如老年患者,在測(cè)試中表現(xiàn)更差。作者表示,這些發(fā)現(xiàn)“挑戰(zhàn)了人工智能將很快取代人類醫(yī)生的假設(shè)”。

人工智能領(lǐng)域的巨大進(jìn)步引發(fā)了人們對(duì)聊天機(jī)器人是否能超越人類醫(yī)生的一系列興奮和恐懼的猜測(cè)。

多項(xiàng)研究表明,大型語(yǔ)言模型(LLM) 在一系列醫(yī)學(xué)診斷任務(wù)上表現(xiàn)非常出色,但它們對(duì)認(rèn)知能力下降等人類缺陷的敏感性尚未得到檢驗(yàn)。

為了填補(bǔ)這一知識(shí)空白,研究人員使用蒙特利爾認(rèn)知評(píng)估 (MoCA) 測(cè)試評(píng)估了領(lǐng)先的、公開(kāi)的 LLM 的認(rèn)知能力——ChatGPT 版本 4 和 4o(由 OpenAI 開(kāi)發(fā))、Claude 3.5“Sonnet”(由 Anthropic 開(kāi)發(fā))以及 Gemini 版本 1 和 1.5(由 Alphabet 開(kāi)發(fā))。

MoCA 測(cè)試被廣泛用于檢測(cè)認(rèn)知障礙和癡呆癥的早期跡象,通常用于老年人。通過(guò)一系列簡(jiǎn)短的任務(wù)和問(wèn)題,它評(píng)估注意力、記憶力、語(yǔ)言、視覺(jué)空間技能和執(zhí)行功能等能力。最高分為 30 分,26 分或以上通常被認(rèn)為是正常的。

免責(zé)聲明:本文為轉(zhuǎn)載,非本網(wǎng)原創(chuàng)內(nèi)容,不代表本網(wǎng)觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

精品国产不卡一区二区三区,无码午夜福利在线,久久精品国产四虎,狼狼综合久久久久综合网