محققان موسسه فناوری ماساچوست با استفاده از هوش مصنوعی، مدلی ارائه کردند که با استفاده از آن میتوان برهمکنش میان پروتئینها را مطالعه کرد.
در حالی که بسیاری از محققان در سراسر جهان به دنبال مقابله با ویروس کرونا هستند، یکی از سلاحهای احتمالی برای مقابله با این ویروس، آنتیبادی مصنوعی است که به پروتئینهای اسپیک ویروس متصل میشود تا از ورود ویروس به سلول انسانی جلوگیری کند. برای ایجاد یک آنتیبادی مصنوعی موفق، محققان باید دقیقاً بفهمند که این اتصال چگونه اتفاق میافتد. پروتئینها، با ساختارهای سهبعدی تودهای که حاوی چینهای زیادی هستند، میتوانند در میلیونها ترکیب به هم بچسبند، بنابراین یافتن کمپلکس پروتئینی مناسب در میان نامزدهای تقریباً بیشماری بسیار زمانبر است. برای سادهسازی این فرآیند، محققان موسسه فناوری ماساچوست (MIT) یک مدل یادگیری ماشینی ایجاد کردند که میتواند بهطور مستقیم مجموعهای را که هنگام اتصال دو پروتئین به یکدیگر تشکیل میشود، پیشبینی کند. روش آنها بین ۸۰ تا ۵۰۰ برابر سریعتر از روشهای نرمافزاری پیشرفته است و اغلب ساختارهای پروتئینی را پیشبینی میکند که به ساختارهای واقعی نزدیکتر هستند.
این روش میتواند به دانشمندان کمک کند تا برخی از فرآیندهای زیستی را که شامل فعل و انفعالات پروتئینی هستند، مانند همانندسازی و ترمیم DNA، بهتر درک کنند. همچنین میتواند روند توسعه داروهای جدید را سرعت بخشد. اکتاویان-اوگن گانیا میگوید: «یادگیری عمیق در ثبت تعاملات بین پروتئینهای مختلف بسیار خوب است. برخی از این تعاملات بسیار پیچیده هستند و دانشمندان راههای مناسبی برای درک آنها پیدا نکردهاند. این مدل یادگیری عمیق میتواند این نوع برهمکنشها را از دادهها یاد بگیرد.»
مدلی که محققان توسعه دادند، بهنام Equidock، بر روی اتصال بدنه سخت متمرکز است، که زمانی اتفاق میافتد که دو پروتئین با چرخش یا در فضای سهبعدی به هم متصل میشوند، اما شکل آنها فشرده یا خم نمیشود. این مدل ساختارهای سهبعدی دو پروتئین را میگیرد و آن ساختارها را به نمودارهای سهبعدی تبدیل میکند که میتوانند توسط شبکه عصبی پردازش شوند. پروتئینها از زنجیرهای از اسیدهای آمینه تشکیل میشوند و هر یک از آن اسیدهای آمینه با یک گره در نمودار نشان داده میشود. محققان دانش هندسی را در مدل گنجاندهاند، بنابراین درک میکند که چگونه اجسام در صورت چرخش یا در فضای سهبعدی میتوانند تغییر کنند. این مدل همچنین دارای دانش ریاضی است که تضمین میکند پروتئینها همیشه به همان شکل متصل میشوند، مهم نیست در کجای فضای سهبعدی وجود دارند. با استفاده از این اطلاعات، سیستم یادگیری ماشینی، اتمهای دو پروتئین را شناسایی میکند که به احتمال زیاد برهمکنش میکنند و واکنشهای شیمیایی را تشکیل میدهند.
گانیا میگوید: «اگر ما بتوانیم از طریق پروتئینها بفهمیم که کدام بخشهای جداگانه احتمالاً این نقاط اتصالدهنده هستند، آنگاه تمام اطلاعاتی که برای قرار دادن این دو پروتئین در کنار هم نیاز داریم را به دست خواهد آورد. با فرض اینکه بتوانیم این دو مجموعه از نقاط را پیدا کنیم، پس میتوانیم بفهمیم که چگونه پروتئینها را بچرخانید تا یک مجموعه با مجموعه دیگر مطابقت داشته باشد.»
پس از آموزش مدل، محققان آن را با چهار روش نرمافزاری مقایسه کردند. Equidock قادر است کمپلکس پروتئین را تنها پس از یک تا پنج ثانیه پیشبینی کند. روشهای دیگر بسیار طولانیتر، از ۱۰ دقیقه تا یک ساعت یا بیشتر طول میکشند.