مقالات بیومدیکال کم‌کیفیت

انفجار مقالات بیومدیکال کم‌کیفیت با هوش مصنوعی

اخیرا مقاله‌ای در PLoS Biology منتشر شد که با بررسی بیش از ۳۰۰ مطالعه مبتنی بر داده‌های NHANES نشان داد پژوهش‌های بیومدیکال در حال غرق شدن در حجم انبوهی از مقالات کم‌کیفیت هستند. این مقالات که اغلب الگوی تکراری و فرمولیک دارند، با استفاده از ابزارهای هوش مصنوعی و دسترسی آزاد به داده‌های سلامت عمومی، ادعاهای گمراه‌کننده‌ای ارائه می‌دهند. پژوهشگران هشدار می‌دهند این روند نه‌تنها اعتبار داده‌های ارزشمند NHANES را خدشه‌دار می‌کند، بلکه خوانندگان و متخصصان حوزه سلامت را از مسیر یافته‌های واقعی منحرف می‌سازد.

چرا NHANES هدف جذابی برای تولید مقالات کم‌کیفیت است؟

مجموعه داده‌های US National Health and Nutrition Examination Survey یا NHANES به دلیل رایگان و آماده‌تحلیل بودن، به سرعت به گزینه‌ای مطلوب برای بسیاری از پژوهشگران از جمله کسانی تبدیل شده که فقط به دنبال انتشار زیاد مقالات هستند. با هزاران متغیر مختلف از وضعیت سلامت تا رژیم غذایی و سبک زندگی شرکت‌کنندگان، امکان آزمون رابطه یک متغیر ساده (مثلا سطح ویتامین D یا نشانگرهای التهابی) با یک بیماری پیچیده فراهم می‌شود. این سادگی و دسترسی بی‌دردسر باعث شده تا برخی تنها یک همبستگی سطحی را گزارش کنند و عوامل مخدوش‌کننده و طراحی مطالعه اصولی را نادیده بگیرند.

آسیب‌های استفاده نامناسب از هوش مصنوعی در تحقیقات پزشکی

از زمان ظهور مدل‌های زبان بزرگ، رشد سرسام‌آور ابزارهای هوش مصنوعی این امکان را به پژوهشگران داده تا در زمان کوتاهی الگوهای همبستگی بسازند. اما بررسی ۲۸ مقاله درباره افسردگی نشان داد که پس از اعمال اصلاحات آماری مناسب، فقط نیمی از این مطالعات هنوز معنادار باقی می‌مانند. بسیاری از مقاله‌ها به‌صورت هدفمند داده‌های نامطلوب را حذف کرده یا سال‌های خاصی را انتخاب کرده‌اند تا به نتایج مثبت برسند؛ مساله‌ای که با اصطلاح «Cherry-Picking» شناخته می‌شود و اعتبار یافته‌ها را کاملا زیر سوال می‌برد.

چه اتفاقی از سال ۲۰۲۲ افتاد؟

با همه‌گیر شدن مدل‌های پیشرفته هوش مصنوعی در سال ۲۰۲۲، نرخ انتشار مقاله‌های مبتنی بر NHANES به‌طور مشهودی افزایش یافت. در سال ۲۰۲۴ بیش از نیمی از ۳۴۱ مطالعه بررسی‌شده منتشر شده‌اند و این اتفاق هم‌زمان با عمومی شدن ابزارهای LLM بود. به این ترتیب، دوره اخیر تبدیل به دوره‌ای شده که مقالاتی با کیفیت پایین، اما تعداد بالا، فضای علمی را اشباع کرده و رقبای جدی برای تحقیقات دقیق و معتبر ایجاد می‌کنند.

راهکارهایی برای بازگرداندن اعتبار به تحقیقات NHANES

برای مقابله با این بحران، ثبت پیش‌طرح تحقیق (Pre-registration) پیش از دسترسی به داده‌ها ضروری است تا پژوهشگران ملزم شوند سوال‌ها و روش‌شناسی پژوهش خود را از ابتدا شفاف کنند. علاوه بر این، انتشار کدهای تحلیل و توضیح کامل معیارهای انتخاب یا حذف داده‌ها می‌تواند امکان بازتولید نتایج را فراهم سازد. مجلات علمی نیز باید فرآیند داوری را با بررسی دقیق‌تر روش‌های آماری و پوشش کامل داده‌های NHANES سخت‌گیرانه‌تر کنند. در نهایت، آموزش اصول صحیح آماری و آگاهی از خطرات Overfitting و Multiple testing برای پژوهشگران ضروری است تا از انتشار نتایج گمراه‌کننده جلوگیری شود.

چگونه معتبرترین تحقیقات بیومدیکال را تشخیص دهیم؟

برای یافتن پژوهش‌های معتبر، ابتدا به دنبال مقالات Preregistered باشید که در پایگاه‌هایی مثل ClinicalTrials.gov یا OSF ثبت شده‌اند. سپس بررسی کنید آیا کد تحلیل و داده‌های استفاده‌شده به‌صورت شفاف منتشر شده‌اند یا خیر. همچنین توجه کنید که مدل آماری مقاله چندین متغیر مخدوش‌کننده را کنترل کرده باشد. مرور سیستماتیک و متاآنالیزهای مستقل نیز ابزاری مناسب برای سنجش کیفیت و پایایی یافته‌های یک حوزه خاص است.

مجله دایامگ

دریچه‌ای به علوم نوین با تمرکز تخصصی بر دنیای زیستی و پزشکی
مقالات مرتبط

هوش مصنوعی در تحقیقات علمی نوآورانه

در سال‌های اخیر، شرکت OpenAI به‌ویژه از طریق محصول ChatGPT به شهرت…

23 اردیبهشت 1404

دستیار هوش مصنوعی گوگل (AMIE) برای تشخیص ضایعات پوستی با دقت بالاتر از پزشکان

گوگل نسخه آزمایشی جدیدی از چت‌بات پزشکی خود را معرفی کرد. Articulate…

21 اردیبهشت 1404

آیا هوش مصنوعی زندگی شما را بهبود می بخشد؟ چیزی که 4000 محقق در مورد آینده هوش مصنوعی فکر می کنند

آیا هوش مصنوعی واقعا می‌تواند زندگی ما را بهبود بخشد؟ این سؤالی…

23 فروردین 1404

دیدگاهتان را بنویسید