در دنیای امروز، بیوانفورماتیک به یکی از مهمترین حوزههای پژوهشی تبدیل شده است که دادههای عظیم زیستی را تحلیل و تفسیر میکند. از آنالیز ساختار و عملکرد ژنها تا کشف الگوهای پنهان در دادههای اُمیکس (ژنومیکس، ترنسکریپتومیکس و …)، هر روز نیاز به ابزارهای نرمافزاری دقیق و مقیاسپذیر افزایش مییابد. اما پرسش جالب اینجاست:
آیا پیشینه و تخصص آکادمیک فرد توسعهدهندهٔ ابزار (مثلاً ژنتیک، علوم رایانه یا بیوانفورماتیک) در کیفیت و دقت نرمافزار تأثیری دارد؟
این نوشته خلاصهای است از یک مطالعه پژوهشی که به بررسی تأثیرات زمینهٔ دانشگاهی (رشته و دپارتمان محل کار نویسندگان مسئول) بر دقت ابزارهای بیوانفورماتیکی میپردازد.
سؤال پژوهشی و هدف مطالعه
پژوهشگران در این مطالعه یک پرسش اساسی را مطرح کردند:
- آیا تخصص آکادمیک توسعهدهندگان در دقت نهایی ابزارهای بیوانفورماتیکی تفاوتی ایجاد میکند؟ (بهعنوان مثال، زیستشناس یا ژنتیکدان که «متخصص حوزۀ زیستی» بهشمار میرود، یا مهندس نرمافزار یا دانشمند علوم رایانه که «متخصص نرمافزار و الگوریتم» است، یا متخصصان میانرشتهای مثل بیوانفورماتیک یا آمار زیستی)
- آنها میخواستند بدانند آیا واقعاً میتوان فقط بر اساس عنوان دپارتمان یا رشتهٔ دانشگاهیِ توسعهدهندگان، دربارهٔ دقت یک ابزار قضاوت کرد، یا اینکه عوامل دیگری (مانند فعالیت مستمر در توسعه و بهروزرسانی ابزار) تعیینکننده هستند؟
پیشینه و اهمیت موضوع
- بیوانفورماتیک از ترکیب علوم زیستی و علوم محاسباتی شکل گرفته و برای پیشبرد آن، دیدگاههای میانرشتهای اهمیت بسیار دارد.
- پیشتر مشاهده شده بود که حفظ و نگهداری مداوم از نرمافزار نقش مهمی در بالابردن دقت ابزارهای بیوانفورماتیکی ایفا میکند، در حالی که عواملی نظیر سن نرمافزار، سرعت اجرا یا شاخصهای مرسوم علمی (مانند تعداد ارجاعات یا اعتبار مجله) لزوماً با دقت ابزار رابطهٔ معناداری ندارند.
- بااینحال، ممکن است برخی ارزیابان و داوران، ارزش کار را صرفاً بر اساس جایگاه علمی و دپارتمان نویسندگان مسئول بسنجند. این مطالعه سعی کرد نشان دهد که آیا این نگاه سنتی مبنی بر «رشته و دپارتمان» واقعا میتواند شاخص قابل اعتمادی باشد یا خیر.
روش مطالعه (مروری کوتاه بر متدولوژی)
- جمعآوری دادههای مربوط به دقت ابزارها
در این مطالعه مجموعهای از نتایج بنچمارک ابزارهای بیوانفورماتیکی (از ۶۸ مقاله و ۱۲۸ بنچمارک مختلف که ۴۹۸ نرمافزار گوناگون را پوشش میداد) گردآوری شد. در این بنچمارکها، جایگاه هر ابزار در مقایسه با سایر ابزارها بر اساس معیارهایی مانند حساسیت، ویژگی، میزان خطا و … بررسی شده است. - شناسایی دپارتمان نویسندگان
آدرس نویسندگان مسئول (Corresponding Authors) استخراج شد و بر اساس نام دپارتمان، دستهبندیهایی در سطوح “حوزهٔ کلی” (مانند علوم زیستی، علوم رایانه، ریاضیات/آمار) و “حوزهٔ تخصصی” (مانند ژنتیک، بیوانفورماتیک، آمار زیستی و …) صورت گرفت. سپس، این حوزهها در سه گروه اصلی تعریف شدند:- دامین (Domain): شاخههایی نظیر زیستشناسی، پزشکی، ژنتیک و …
- توسعه (Development): شاخههایی مثل علوم رایانه، مهندسی، ریاضی و …
- میانرشتهای (Interdisciplinary): بیوانفورماتیک، بیواستاتیک، یا مواردی که نویسنده هم دپارتمان زیستی دارد و هم دپارتمان محاسباتی.
- تحلیل دقت بر اساس “برد-باخت” در مقایسههای دو به دو
برای هر ابزار در هر بنچمارک، تعداد دفعاتی که آن ابزار ابزارهای دیگر را پشت سر گذاشته یا از آنها بهتر عمل کرده است، به عنوان “برد” و کل مقایسهها به عنوان “تعداد مسابقات” در نظر گرفته شد. سپس با روش آماری بوتاسترپ، میانگین نسبت برد برای هر دپارتمان یا گروه تخصصی محاسبه شد و Z-Score به دست آمد. مقدار ۰٫۵ برای نسبت برد، بهعنوان “انتظار تصادفی” (یا عدم تفاوت معنادار) در نظر گرفته شد.
نتایج کلیدی
- در سطح جزئی (Specific Fields)، دپارتمان “Medical Informatics” با داشتن میانگین نسبت برد ۰٫۷۰ در رأس قرار گرفت؛ اما پس از اعمال اصلاحات آماری (تصحیح چندگانه)، مقدار P قابلتوجهی به دست نیامد و تفاوت معناداری ثابت نشد.
- بیوانفورماتیک و مهندسی در انتهای جدول قرار گرفتند (بهترتیب با نسبت برد ۰٫۴۳ و ۰٫۳۴)، اما باز هم این اختلاف از لحاظ آماری معنادار نبود.
- در سطح کلیتر:
- گروه تخصص دامین (زیستشناسی، ژنتیک و …) با نسبت برد حدود ۰٫۴۹.
- گروه توسعه (علوم رایانه، ریاضیات و …) با نسبت برد حدود ۰٫۵۱.
- گروه میانرشتهای با نسبت برد حدود ۰٫۴۶.
هیچکدام از این ارقام به سطح معنیداری آماری نرسیدند.
به بیان دیگر، گرچه بعضی گروهها ظاهراً بهتر بهنظر میرسند، اما نتیجهٔ مهم این است که هیچ تفاوت معنیدار آماری در دقت ابزارها بر اساس دپارتمان یا تخصص آکادمیک نویسندگان مشاهده نشد.
بحث و تفسیر نتایج
- عدم ارتباط دپارتمان با دقت ابزار
نتایج نشان میدهد که نمیتوان تنها بر اساس “نام رشته یا دپارتمان” حکم کرد که کدام گروه ابزار دقیقتری تولید میکند. این یعنی برخلاف آنچه گاهی تصور میشود، فقط “کامپیوتری” یا “زیستی” بودن گروه توسعهدهنده معیار تعیینکنندهٔ کیفیت نهایی نیست. - اهمیت نگهداری و توسعه مداوم
طبق پژوهشهای پیشین، “سطح مداخلهٔ فعال” در توسعهٔ یک ابزار (نظیر بهروزرسانی نسخهها، فعالیت در مخازن گیتهاب یا دیگر سامانههای کنترل نسخه) با دقت ابزار همبستگی مثبت نشان میدهد. به بیان دیگر، این که ابزار تا چه حد زنده و فعال نگهداری شود، از عوامل کلیدی در موفقیت آن است. - ضرورت توجه به جنبههای میانرشتهای
اگرچه میانرشتهایها ممکن است از منظر تئوری “تلفیقی از مهارتهای دامین و توسعه” باشند، اما دادهها نشان داد که پیوند دادن حوزههای گوناگون لزوماً به معنای تضمین دقت بالاتر نیست. این شاید ناشی از پیچیدگی پروژههای میانرشتهای باشد یا محدودیت منابع و چالشهای سازمانی. - سوگیریهای احتمالی
سنتاً برخی از داوران و ارزیابان تصور میکنند که دپارتمانهای معتبرتر (مثلاً دانشگاههای بزرگ علوم رایانه یا مهندسی) ابزارهای بهتری میسازند، در حالی که دادهها در این پژوهش چنین چیزی را تأیید نمیکند. از طرفی، در مواردی هم ممکن است گروهی با پشتوانهٔ زیستشناسی عمیق ابزارهای قدرتمندی ارائه دهند.
محدودیتهای مطالعه
- تعداد کم ابزار در برخی رشتهها ممکن است آمار را دستخوش نوسان کند.
- برخی ابزارها نسخههای گوناگون دارند که ممکن است بهطور مستقل در بنچمارک لحاظ شده باشد و در نتیجه، از یک گروه چند نمونه در دادهها وجود داشته باشد.
- متغیرهای پنهان دیگری (مانند بودجه، همکاریهای چندسازمانی و زیرساختهای فنی) میتواند اثر داشته باشد که در این پژوهش کنترل نشده است.
- دپارتمان نویسندهٔ مسئول همواره منعکسکنندهٔ تمام مهارتهای تیم پژوهشی نیست؛ ممکن است افراد تیم در رشتههای گوناگون فعالیت داشته باشند و نام دپارتمان تنها به یکی از آنها اشاره کند.
نتیجهگیری نهایی
بر پایهٔ تحلیلهای آماری دقیق در این پژوهش:
- هیچ تفاوت معنیداری در دقت ابزارهای بیوانفورماتیکی براساس وابستگی دانشگاهی توسعهدهندگان مشاهده نشد.
- نگهداری مداوم، بهروزرسانی و توسعه ابزار همچنان کلید اصلی ارتقای دقت آن معرفی میشود.
- پیشنهاد میشود برای ارزیابی کیفیت یک ابزار بیوانفورماتیکی، به جای تمرکز بر نام دپارتمان یا رشتهٔ تحصیلی توسعهدهندگان، روی سابقهٔ عملکرد، مستندات، شیوهٔ بنچمارک و نرخ بهروزرسانی ابزار متمرکز شویم.
کاربردهای نتایج و چشمانداز آینده
- سیاستگذاری تحقیقاتی و داوری: نتیجهٔ این پژوهش میتواند به داوران و ارزیابان کمک کند تا کمتر تحت تأثیر کلیشههای مربوط به دپارتمان قرار بگیرند و بیشتر به ماهیت و کیفیت خود ابزار توجه کنند.
- راهکار برای دانشگاهها: این پژوهش پیام مهمی برای دانشگاهها دارد: تقویت همکاریهای واقعی میان دپارتمانها و فراهمآوردن شرایطی که تخصصهای مختلف (دامین، توسعه و میانرشتهای) بتوانند در کنار هم رشد کنند.
- تمرکز بر آموزش و مهارت: پیشنهاد میشود که در برنامههای آموزشی و کارگاههای بیوانفورماتیک، هر دو بُعد بیولوژی و علوم رایانه به طور متوازن تقویت شود و مهارتهای برنامهنویسی و نگهداری نرمافزار به شکل جدی آموزش داده شوند.