AI診症丨哈佛研究:80%初步診斷都是錯

2026年4月15日

人工智能(AI)大模型發展一日千里，部分人出現病徵時會第一時間求助AI聊天機械人。

美國哈佛醫學院一個研究團隊評估20多種最先進的AI大型語言模型(LLM)的診斷能力，其中包括ChatGPT、DeepSeek、Gemini和Claude。結果顯示，基於患者的初步症狀和體徵進行「鑑別診斷」，即識別可能的疾病的錯誤率高達80%。

研究進一步顯示，在患者提供更多檢測結果後，大模型可以將「最終診斷」的失敗率降至40%左右。研究人員表示，這意味着AI聊天機械人需要通過充分的患者訊息，才能對疾病作出更為精準的診斷，患者無法提供完整的健康檢測訊息時，AI提供的結果並不可靠。

研究人員強調，AI尚未達到毋須醫療專業人員干預即可為患者做出診斷決策的水平。

返回即時財訊

股票及指數資料由天滙財經有限公司

，泓滙財經資訊有限公司及財經智珠網有限公司提供。外滙及黃金報價由路透社提供。

EJFQ服務條款 | EJFQ私隱條款 | EJFQ免責聲明 | 聯絡EJFQ:[email protected]

本網站的內容概不構成任何投資意見，本網站內容亦並非就任何個別投資者的特定投資目標、財務狀況及個別需要而編製。投資者不應只按本網站內容進行投資。在作出任何投資決定前，投資者應考慮產品的特點、其本身的投資目標、可承受的風險程度及其他因素，並適當地尋求獨立的財務及專業意見。
信報財經新聞有限公司、香港交易所資訊服務有限公司、其控股公司及／或該等控股公司的任何附屬公司、或其資訊來源及／或其他第三方數據供應商均竭力提供準確而可靠的資料，但不能保證資料絕對無誤，且亦不會承擔因任何不準確或遺漏而引起的任何損失或損害的責任。