أعلنت جامعتا ستانفورد وهارفارد، نتائج دراسة تحليلية مفصلة خاضها فريق من العلماء والبحث العلمي للكشف عن قدرة الأطباء وأجهزة الذكاء الاصطناعي على التشخيص ورصد الفوارق بينهما.
كشفت الدراسة، تفوق قدرة نموذج الذكاء الاصطناعي o1 preview على تشخيص الأطباء خلال وضعه التجريبي مع دقة النتائج التشخيصية الخاصة بنماذج الذكاء الاصطناعي، وتقدمها على التشخيصات الواردة عن الأطباء في الحالات الطبية المعقدة.
وأثبتت نتائج الدراسات المفصلة عن قدرة نموذج الذكاء الاصطناعي o1 preview الخارقة على التشخيصات والتي أثبتت خلالها دقة فائقة في تشخيص الحالات الطبية وتفوق بصورة كبيرة على نماذج الذكاء الاصطناعي السابقة بنسبة تخطت الـ 78.3% في تحليل الحالات الطبية المعقدة.
وضع مجموعة من الأطباء المتخصصين نموذج اختبار عبارة عن عدد كبير من الحالات الطبية المعقدة واستطاع نموذج الذكاء الاصطناعي، التفوق ببراعة في تشخيصها وإثبات جدارة هائلة في التشخيص.
وبالرغم من ذلك، أعلن الكثير من الباحثين عن نتائج هذه الدراسة غير المجدية بسبب استخدام المعايير الذهبية المصممة خصيصاً لتقييم أداء الذكاء الاصطناعي في تشخيص الحالات الطبية.
وأشار بعض أعضاء الدراسة إلى أن نتائج تقييم نماذج الذكاء الاصطناعي التي تقدم من خلاله بصورة تفصيلية، دون النظر إلى الأداء الفعلي للذكاء الاصطناعي في بيئة العمل بشكل تكاملي مع الأطباء كأداة مساعدة في العملية الطبية.