اشترك مجانا بقناة الديار على يوتيوب

كشفت دراسة علمية حديثة عن مخاطر محتملة لاستخدام برامج الدردشة المعتمدة على الذكاء الاصطناعي في المجال الطبي، بعد أن أظهرت قدرتها على تقديم معلومات مضللة أو غير دقيقة في قضايا صحية حساسة.

وبحسب الدراسة المنشورة في BMJ Open، اختبر فريق من الباحثين خمسة من أبرز أدوات الدردشة، وهي ChatGPT وGemini وGrok وMeta AI وDeepSeek، من خلال طرح 50 سؤالًا صحيًا شملت موضوعات مثل السرطان واللقاحات والتغذية.

وأظهرت النتائج أن نحو 20% من الإجابات كانت “إشكالية للغاية”، فيما صُنّف قرابة نصفها ضمن الفئة “الإشكالية”، بينما جاءت 30% “إشكالية إلى حد ما”. كما فشلت جميع البرامج في تقديم مراجع علمية دقيقة بشكل كامل، ولم ترفض الإجابة إلا على سؤالين فقط من أصل 250.

وسجل برنامج Grok أسوأ أداء، إذ اعتُبرت 58% من إجاباته إشكالية، تلاه ChatGPT بنسبة 52%، ثم Meta AI بنسبة 50%، مع تقارب عام في الأداء بين الأدوات الخمس.

وأشارت الدراسة، التي نقلت نتائجها صحيفة The Independent، إلى أن دقة الإجابات تختلف بحسب الموضوع، حيث كان الأداء أفضل نسبيًا في مجالي السرطان واللقاحات، بينما تراجع في موضوعات التغذية والأداء الرياضي. كما تبين أن الأسئلة المفتوحة تزيد من احتمالات الحصول على إجابات غير دقيقة.

وفي سياق متصل، أظهرت دراسة منشورة في Nature Medicine أن هذه الأنظمة قد تصل دقتها النظرية إلى 95%، إلا أن المستخدمين لا ينجحون عمليًا في الوصول إلى الإجابة الصحيحة إلا بنسبة تقل عن 35%.

وتخلص هذه النتائج إلى أن أدوات الذكاء الاصطناعي يمكن أن تكون مفيدة في تبسيط المعلومات الطبية، لكنها لا تصلح كمصدر مستقل للتشخيص أو العلاج، ما يستدعي التحقق من المعلومات واستشارة مختصين قبل اتخاذ أي قرارات صحية.

الكلمات الدالة

الأكثر قراءة

ليلة القبض على دونالد ترامب