در سالهای اخیر، متن تولیدشده با هوش مصنوعی به یکی از مباحث پرجستجو و مهم در دنیای پژوهشهای زیستپزشکی تبدیل شده است. بر اساس تازهترین تحلیلها، حدود ۱۴ درصد از چکیدههای پژوهشهای زیستپزشکی که در سال گذشته میلادی منتشر شدهاند، دارای نشانههایی هستند که نشان میدهد با کمک ابزارهای هوش مصنوعی نوشته شدهاند. این موضوع، زنگ خطری جدی برای شفافیت و یکپارچگی علمی است و باید به آن توجه ویژهای داشت.
رشد بیسابقه استفاده از هوش مصنوعی در تولید متن پژوهشی
مطالعات اخیر نشان دادهاند که متن تولیدشده با هوش مصنوعی در چکیدههای مقالات زیستپزشکی به طور چشمگیری افزایش یافته است. طبق پژوهشی که در سال ۲۰۲۴ منتشر شده، بیش از ۲۰۰ هزار چکیده از مجموع ۱.۵ میلیون چکیده نمایهشده در PubMed حاوی واژههایی بودند که معمولا توسط مدلهای زبانی بزرگ (LLMs) پیشنهاد میشوند.
به گفته محققان، تعداد مقالاتی که با ویرایش یا تولید هوش مصنوعی منتشر میشوند به طور پیوسته در حال افزایش است، اما بسیاری از پژوهشگران هنوز از ابعاد گسترده این مسئله آگاهی ندارند.
چگونه نشانههای متن تولیدشده با هوش مصنوعی شناسایی میشود؟
روشهای مختلفی برای شناسایی متن تولیدشده با هوش مصنوعی وجود دارد. در اکثر موارد، مدلهایی آموزش داده میشوند تا تفاوتهای ظریف میان متن انسانی و متن تولیدشده با هوش مصنوعی را تشخیص دهند. اما تیمی از دانشمندان، رویکرد متفاوتی را در پیش گرفتند: آنها به جستجوی «واژههای اضافی» (Excess Words) پرداختند؛ واژههایی که پس از عمومی شدن ابزارهایی مانند ChatGPT از نوامبر ۲۰۲۲، به طور ناگهانی و غیرمنتظرهای در متون علمی ظاهر شدهاند.
در این مطالعه، ۴۵۴ واژه شناسایی شد که در سال ۲۰۲۴ نسبت به هر سال دیگری از ۲۰۱۰ تاکنون بیشتر استفاده شدهاند. این واژهها معمولا از نوع افعال و صفات بودند و بیشتر جنبه سبک و نگارشی داشتند تا محتوایی. از جمله این واژهها میتوان به «findings»، «crucial» و «potential» اشاره کرد که استفاده از آنها نسبت به سالهای گذشته رشد قابل توجهی داشته است.
تفاوتهای جغرافیایی و حوزهای در متن تولیدشده با هوش مصنوعی
تحلیلهای صورت گرفته نشان میدهد که در برخی کشورها، مانند چین و کره جنوبی، بیش از ۲۰ درصد چکیدهها دارای متن تولیدشده با هوش مصنوعی هستند. همچنین در حوزههایی مانند بیوانفورماتیک و علوم رایانشی، کاربرد این مدلها شایعتر است. این رقم به صورت سالانه در حال افزایش است و به گفته محققان، احتمالا امسال هم شاهد افزایش چشمگیرتری خواهیم بود.
چالشهای شناسایی و پیامدهای اخلاقی
با توجه به اینکه پژوهشگران روزبهروز بیشتر به استفاده از مدلهای زبانی بزرگ عادت میکنند و نسبت به نشانههای شناساییشده حساستر میشوند، شناسایی متن تولیدشده با هوش مصنوعی نیز دشوارتر شده است. برخی نویسندگان حتی به گونهای نگارش خود را تغییر دادهاند تا از واژههایی که به عنوان نشانه شناسایی میشوند، پرهیز کنند.

از طرفی، تعیین اینکه هوش مصنوعی دقیقا برای چه منظوری به کار رفته (ویرایش سبک، ترجمه یا تولید کامل متن) نیز کاری بسیار دشوار است. این مسئله باعث نگرانیهایی درباره یکپارچگی پژوهشی و رعایت اصول اخلاقی شده است.
متن تولیدشده با هوش مصنوعی به سرعت در حال افزایش در متون پژوهشی، به ویژه در علوم زیستپزشکی است. این موضوع نهتنها موجب تغییر سبک نگارش متون علمی شده، بلکه چالشهای جدی برای داوری علمی و اعتبار پژوهشها به وجود آورده است. آگاهی از این نشانهها و پیامدهای احتمالی آنها، برای پژوهشگران و جامعه علمی اهمیت فراوانی دارد.