登入 直接訂購 教學視頻

AI診症丨哈佛研究:80%初步診斷都是錯

人工智能(AI)大模型發展一日千里,部分人出現病徵時會第一時間求助AI聊天機械人。

美國哈佛醫學院一個研究團隊評估20多種最先進的AI大型語言模型(LLM)的診斷能力,其中包括ChatGPT、DeepSeek、Gemini和Claude。結果顯示,基於患者的初步症狀和體徵進行「鑑別診斷」,即識別可能的疾病的錯誤率高達80%。

研究進一步顯示,在患者提供更多檢測結果後,大模型可以將「最終診斷」的失敗率降至40%左右。研究人員表示,這意味着AI聊天機械人需要通過充分的患者訊息,才能對疾病作出更為精準的診斷,患者無法提供完整的健康檢測訊息時,AI提供的結果並不可靠。

研究人員強調,AI尚未達到毋須醫療專業人員干預即可為患者做出診斷決策的水平。

股票及指數資料由天滙財經有限公司,泓滙財經資訊有限公司及財經智珠網有限公司提供。外滙及黃金報價由路透社提供。