發布時間:2023-04-29 23:02:58 來源:本站 作者:admin
猶他州楊百翰大學 (BYU) 的研究人員與數百所高等教育機構合作,看看 ChatGPT 是否能在會計考試中比實際大學生表現得更好,而人工智能聊天機器人未能做到這一點。
學生在考試中的平均得分為 76.7%,而 ChatGPT 的得分僅為 47.4%。
這項經過同行評審的研究發表在《會計教育問題》雜志上,來自 14 個不同國家的 180 多個機構的 327 名合著者參與了這項研究。
合作者的大量招募歸功于楊百翰大學教授大衛伍德,他是該研究的主要作者。 伍德通過社交媒體招募了大量學者。
ChatGPT 的失敗
該研究將學生在考試中的表現與 AI 聊天機器人進行了比較。 研究人員為這項研究貢獻了超過 25,000 個試題。 這些問題涵蓋了各種主題,包括會計信息系統、審計、稅務和財務會計,采用真/假和多項選擇等不同格式。
在這張 2023 年 2 月 23 日拍攝的插圖中,帶有顯示 ChatGPT 徽標的智能手機被放置在計算機主板上。(圖片來源:DADO RUVIC/REUTERS)
人工智能特別難以解決與稅收、財務和管理評估相關的問題,這被認為是由于它難以處理所需的數學過程。 有時該技術使用加法而不是減法,這意味著它不能始終遵循基本的數學公式。
ChatGPT 也在簡答題上苦苦掙扎(在 28.7% 和 39.1% 之間)。 此外,ChatGPT 有時會為錯誤答案提供權威描述,或以不同方式回答同一問題。 在某些情況下,程序會簡單地編造一個參考來捍衛它的答案。
該技術能夠比學生更成功地完成判斷題(68.7% 正確)和多項選擇題(59.5%)。
“當這項技術剛問世時,每個人都擔心學生現在可以用它來作弊,”伍德說。 “但作弊的機會一直存在。所以對我們來說,我們正努力專注于我們現在可以用這項技術做些什么,而我們以前無法做到這一點,以改善教師的教學過程和學生的學習過程?!?/p>
“它并不完美;你不會將它用于所有事情,”目前是楊百翰大學新生的杰西卡伍德說?!霸噲D僅通過使用 ChatGPT 來學習是徒勞的?!?/p>