دانلود مقاله الگوریتم خوشه‌بندی برای ژن‌های دارای بیماری‌ سرطانی با تکرار میدانی خودسازگار
ترجمه نشده

دانلود مقاله الگوریتم خوشه‌بندی برای ژن‌های دارای بیماری‌ سرطانی با تکرار میدانی خودسازگار

عنوان فارسی مقاله: الگوریتم خوشه‌بندی جدید برای ژن‌های دارای بیماری‌های سرطانی متعدد با روش تکرار میدانی خودسازگار
عنوان انگلیسی مقاله: A new clustering algorithm for genes with multiple cancer diseases by self-consistent field iteration method
مجله/کنفرانس: تحلیل مدلسازی شبکه در انفورماتیک سلامت و بیوانفورماتیک - Network Modeling Analysis in Health Informatics and Bioinformatics
رشته های تحصیلی مرتبط: مهندسی کامپیوتر - پزشکی
گرایش های تحصیلی مرتبط: مهندسی الگوریتم و محاسبات - آنکولوژی
کلمات کلیدی فارسی: خوشه های ژن - خوشه بندی طیفی - داده های بیان همزمان ژن - مسئله ارزش ویژه غیرخطی - تکرار میدان خودسازگار
کلمات کلیدی انگلیسی: Gene clusters - Spectral clustering - Gene coexpression data - Nonlinear eigenvalue problem - Self-consistent field iteration
نوع نگارش مقاله: مقاله پژوهشی (Research Article)
شناسه دیجیتال (DOI): https://doi.org/10.1007/s13721-022-00362-6
نویسندگان: Ye Liu - Michael K. Ng
دانشگاه: School of Future Technology, South China University of Technology, China
صفحات مقاله انگلیسی: 16
ناشر: اسپرینگر - Springer
نوع ارائه مقاله: ژورنال
نوع مقاله: ISI
سال انتشار مقاله: 2022
ایمپکت فاکتور: 2.045 در سال 2020
شاخص H_index: 15 در سال 2022
شاخص SJR: 0.288 در سال 2020
شناسه ISSN: 21926662
شاخص Quartile (چارک): Q3 در سال 2020
فرمت مقاله انگلیسی: PDF
وضعیت ترجمه: ترجمه نشده است
قیمت مقاله انگلیسی: رایگان
آیا این مقاله بیس است: بله
آیا این مقاله مدل مفهومی دارد: دارد
آیا این مقاله پرسشنامه دارد: ندارد
آیا این مقاله متغیر دارد: دارد
آیا این مقاله فرضیه دارد: ندارد
کد محصول: e16382
رفرنس: دارای رفرنس در داخل متن و انتهای مقاله
نوع رفرنس دهی: vancouver
فهرست مطالب (ترجمه)

چکیده

مقدمه

آثار مرتبط

مدل ارائه شده

نتایج تجربی

نتایجی اظهار شده

منابع

فهرست مطالب (انگلیسی)

Abstract

Introduction

Related work

The proposed model

Experimental results

Concluding remarks

References

بخشی از مقاله (ترجمه ماشینی)

چکیده

     حجم فزاینده‌ای از ادبیات نشان می‌دهد که پیش‌بینی خوشه‌های ژنی مرتبط با بیماری سرطان انسان با استفاده از شبکه‌های بیولوژیکی در اطلاعات زیستی مهم است، به درک مکانیسم‌های بیماری کمک می‌کند و به توسعه تشخیص و درمان کمک می‌کند. با این حال، به دلیل نویز و پیش پردازش داده ها، یک شبکه یا نمودار منفرد ایجاد شده از یک بیماری سرطانی برای خوشه بندی ژن ها کافی نیست. از آنجایی که برخی از بیماری‌های سرطانی در عمل با یکدیگر مرتبط هستند، با ادغام چندین شبکه بیان ژن تولید شده از آن بیماری‌های سرطانی مرتبط، می‌توان به تقسیم دقیق‌تر و قوی‌تر ژن‌ها دست یافت. در این مقاله، ما یک روش خوشه‌بندی طیفی چندگانه با گراف را پیشنهاد می‌کنیم، که به ما کمک می‌کند تا ماژول‌های عملکردی در هر بیماری سرطانی را با دقت و جامع‌تر کشف کنیم، در عین حال می‌توان میزان ارتباط بین بیماری‌های سرطانی را نیز تعیین کرد. ایده ما این است که یک ماتریس مجاورت بلوکی بسازیم تا ماتریس مجاورت هر گراف و درجه ارتباط بین چندین نمودار را با هم ادغام کنیم، سپس از خوشه بندی طیفی برای محاسبه خوشه ها برای هر گراف استفاده شود. الگوریتم پیشنهادی مبتنی بر یک تکرار میدانی خودسازگار است به طوری که هم درجه ارتباط و هم خوشه‌های ژنی را می‌توان در طول تکرارها شناسایی کرد. علاوه بر این، شرایطی را ایجاد می کنیم که تحت آن همگرایی الگوریتم پیشنهادی با برخی مفروضات تضمین می شود. نتایج تجربی بر روی دو مجموعه داده از بیماری‌های سرطان انسانی ارائه شده است، که نشان می‌دهد روش پیشنهادی نه تنها می‌تواند ماژول‌های عملکردی ژن را شناسایی کند، بلکه میزان ارتباط بین بیماری‌های سرطانی مختلف را نیز به دقت محاسبه می‌کند.

توجه! این متن ترجمه ماشینی بوده و توسط مترجمین ای ترجمه، ترجمه نشده است.

بخشی از مقاله (انگلیسی)

Abstract

     An increasing body of literature shows that predicting gene clusters related to human cancer disease using biological networks is significant in bioinformation, it would help to understand disease mechanisms, and benefit the development of diagnostics and therapeutics. However, due to noise and preprocessing of data, a single network or graph generated from one cancer disease is insufficient to cluster genes. As some cancer diseases are correlated with each other in practice, by integrating several gene expression networks generated from those associated cancer diseases, more accurate and robust partition of genes can be obtained. In this paper, we propose a multiple graph spectral clustering method with graph association, it helps us to discover functional modules in each cancer disease more accurately and comprehensively, meanwhile the degree of association among cancer diseases can also be determined. Our idea is to construct a block adjacency matrix to integrate the adjacency matrix of each graph and the degree of association among multiple graphs together, then spectral clustering would be employed to calculate clusters for each graph. The proposed algorithm is based on a self-consistent field iteration such that both the degree of association and gene clusters can be identified during iterations. Moreover, we establish the condition under which convergence of the proposed algorithm is guaranteed with some assumptions. Experimental results on two datasets of human cancer diseases are presented, which demonstrate that the proposed method can not only identify gene functional modules, but also calculate the degree of association among different cancer diseases accurately.

Introduction

     The completion of Human Genome Project (HGP) and the development of advanced high-throughput technologies have introduced large quantities of gene expression datasets from diferent cancer diseases. Such datasets have motivated lots of research works to investigate the relationship among genes. Particularly, numerous research works have been done to predict gene clusters related to human cancer diseases (Chen et al. 2014; Gill et al. 2014; Hu et al. 2018; Li et al. 2014; Sun et al. 2011). Usually, genes in the same cluster are functionally related, so disease-related gene clusters can support the existence of distinct disease-specifc functional modules (Goh et al. 2007; Oti et al. 2006; Wu et al. 2010). The identifcation of gene clusters can not just help to better understand cancer disease mechanisms, but provide new and exact diagnostics and therapeutics.

Concluding remarks

     In this paper, we proposed a clustering method for multiple graphs with graphs association using a self-consistent feld iteration method. In each iteration of our method, the consistency among graphs are updated based on frst K eigenvectors containing the clustering structure information of each graph, then construct a new adjacency matrix. In terms of the experiment’s results, the clustering performance of our methods is better than the BLSC method using two gene expression datasets. Besides, results on two gene expression datasets also demonstrate better clustering performance with the degree of association among graphs. Moreover, the convergence of a nonlinear eigenvalue problem in which the consistency weight depends on eigenvectors of the block adjacency matrix, has been studied in “Appendix”.