發布時間:2023-04-24 23:47:11 來源:本站 作者:admin
一項針對教育機構的全球研究發現,與 ChatGPT 相比,會計專業學生正確回答考試問題的能力要強得多。
該研究由美國會計協會 (AAA) 進行,通過向 ChatGPT 提供來自全球 187 家機構的 25,000 多個評估問題并將結果與會計專業學生的表現交叉參考,評估了 ChatGPT 在會計特定內容上的表現。
在所有評估中,包括審計、財務會計、管理會計和稅務等主題,學生的平均得分為 76.7%,而 ChatGPT 得分僅為 47.4%。
該研究總結道:“與特定會計環境中的人類表現相比,這項研究提供了關于人工智能當前能力的重要見解?!?“它突出了在一般材料上訓練的 AI 聊天機器人的局限性?!?/p>
會計技術人員協會的技術官員 Emma Rawson 認為,研究結果說明了會計考試所需的細微差別,雖然人工智能聊天機器人擁有在考試中表現良好的知識,但它們缺乏實際應用 出類拔萃的技能。
“我認為結果非常有希望,并且說明了專業考試的穩健性。 一份寫得很好的試題要求考生不僅要重復規則或引用立法和指導,還要將他們的知識應用于具體的事實和情況,并找出潛在的問題?!?/p>
人類與人工智能辯論“多方面”
但是,雖然人類總體上比 Chat GPT 表現更好,但也有幾個例外。 例如,聊天機器人在 11.3% 的評估中超過了學生的平均水平。
除了是非題和多項選擇題外,Chat GPT 在某些主題領域(如審計)的表現也優于學生。 相比之下,它在回答簡答題和需要鍛煉的問題時表現不佳。
這與 Rawson 的觀點相吻合,即在許多學科中“人腦優于人工智能”。
“就我個人所見,Chat GPT 也可能非常擅長得出結論,但不一定會像你期望的強大候選人那樣詳細地闡述他們的推理,”她說。
根據這項研究,結果的范圍還表明,正在進行的人類與聊天機器人之間的爭論是“多方面的”,而且聊天機器人顯然可以“在某些主題領域接近人類的平均表現”。