پیش بینی مکان های اتصال RBP در circRNA ها با استفاده از معماری یادگیری دنباله عمیق مبتنی بر LSTM


این مقاله در اصل در اینجا منتشر شده است

اطلاعات زیستی مختصر 2021 20 آگوست: bbab342. doi: 10.1093 / bib / bbab342. آنلاین قبل از چاپ

چکیده

RNA های دایره ای (circRNAs) به طور گسترده در یوکاریوت های بسیار واگرا بیان می شوند. اگرچه CircRNA ها سالهاست شناخته شده اند ، اما عملکرد آنها نامشخص است. تعامل با پروتئین متصل کننده RNA (RBP) برای تأثیر بر تنظیمات پس از رونویسی به عنوان یک مسیر مهم برای عملکرد CircRNA در نظر گرفته می شود ، مانند عمل به عنوان یک اسفنج RBP انکوژنیک برای مهار سرطان. در این مطالعه ، ما یک چارچوب یادگیری عمیق ، سایتهای CRPB ، برای پیش بینی مکانهای اتصال RBPs در CircRNA ها طراحی می کنیم. در این مدل ، توالی سایتهای اتصال طول متغیر با مدل word2vec به بردارهای ادغام تبدیل می شود. LSTM دو جهته برای کدگذاری بردارهای ادغام سایتهای اتصال استفاده می شود و سپس برای رمزگشایی و عملیات مرتب سازی به رمزگشای LSTM دیگری داده می شود. برای آموزش و آزمایش مدل ، ما چهار مجموعه داده حاوی توالی محلهای اتصال طول متغیر در circRNA می سازیم و هر مجموعه مربوط به RBP است که در بافتهای سرطان مثانه بیش از حد بیان می شود. نتایج تجربی در چهار مجموعه داده و مقایسه با سایر مدل های موجود نشان می دهد که سایت های CRP دارای عملکرد برتر هستند. سپس متوجه شدیم که الگوهای تعامل بسیار مشابهی در چهار مجموعه داده نقشه سایت وجود دارد. سرانجام ، ما سایتهای CRPB آموزش دیده را برای قرار دادن سایتهای اتصال دهنده IGF2BP1 در circCDYL پیاده سازی کردیم و نتایج م theثر بودن این روش را نشان داد. در نتیجه ، سایت های CRPB یک مدل پیش بینی کننده موثر برای شناسایی محل تعامل circRNA-RBP هستند. ما امیدواریم که سایتهای CRPB بتوانند راهنمای ارزشمندی برای مطالعات تجربی در مورد تأثیر circRNA بر تنظیمات پس از رونویسی ارائه دهند.

PMID: 34415289 | DOI: 10.1093 / bib / bbab342



دیدگاهتان را بنویسید