AI vượt trội bác sĩ trong chẩn đoán: Bước tiến đáng kinh ngạc của OpenAI

link

Theo báo cáo mới nhất của OpenAI, mô hình o1-preview vượt trội hơn hẳn các bác sĩ trong các nhiệm vụ suy luận, và khoảng cách này là rất lớn. AI đạt khoảng 80% so với 30% của bác sĩ trong 143 ca chẩn đoán CPC khó từ NEJM. Hiện nay, việc chỉ tin tưởng vào bác sĩ mà không tham khảo ý kiến của mô hình AI có thể là nguy hiểm. Dưới đây là một số ví dụ cụ thể:

Ví dụ về chẩn đoán phức tạp

Trường hợp mất phosphate và tăng FGF23

Trong một trường hợp liên quan đến mất phosphate và tăng FGF23, sau đó tiến hành chụp ảnh để xác định vị trí khối u tiềm ẩn, o1-preview đề xuất kế hoạch xét nghiệm toàn diện và có hệ thống hơn:

Mô hình AI đề xuất một cách tiếp cận rộng hơn và có phương pháp hơn, loại trừ một cách có hệ thống các nguyên nhân khác gây ra tình trạng giảm phosphate máu (hypophosphatemia).

Trường hợp tăng amoniac máu dai dẳng không rõ nguyên nhân

Đối với trường hợp tăng amoniac máu (hyperammonemia) dai dẳng không rõ nguyên nhân, o1-preview đề xuất mở rộng các xét nghiệm theo thứ tự ưu tiên:

Từ các xét nghiệm cơ bản như immunoglobulin và điện giải đến chụp ảnh nâng cao, xét nghiệm hơi thở để kiểm tra SIBO (Small Intestinal Bacterial Overgrowth – Hội chứng tăng sinh vi khuẩn đường ruột) và sinh thiết đường tiêu hóa chuyên biệt – đảm bảo kiểm tra các nguyên nhân phổ biến trước.

Ý nghĩa của sự phát triển này

Người viết bày tỏ sự tôn trọng đối với các bác sĩ, nhưng trong nhiều trường hợp, công việc của họ là suy luận cơ bản trên một cơ sở kiến thức chuyên ngành rộng lớn. May mắn thay, đây chính xác là điều mà các mô hình ngôn ngữ lớn (LLM) rất giỏi. Điều này có nghĩa là sẽ có nhiều dịch vụ chăm sóc sức khỏe chất lượng cao hơn cho mọi người.