چکیده
مقدمه
آثار مرتبط
مدل ارائه شده
نتایج تجربی
نتایجی اظهار شده
منابع
Abstract
Introduction
Related work
The proposed model
Experimental results
Concluding remarks
References
چکیده
حجم فزایندهای از ادبیات نشان میدهد که پیشبینی خوشههای ژنی مرتبط با بیماری سرطان انسان با استفاده از شبکههای بیولوژیکی در اطلاعات زیستی مهم است، به درک مکانیسمهای بیماری کمک میکند و به توسعه تشخیص و درمان کمک میکند. با این حال، به دلیل نویز و پیش پردازش داده ها، یک شبکه یا نمودار منفرد ایجاد شده از یک بیماری سرطانی برای خوشه بندی ژن ها کافی نیست. از آنجایی که برخی از بیماریهای سرطانی در عمل با یکدیگر مرتبط هستند، با ادغام چندین شبکه بیان ژن تولید شده از آن بیماریهای سرطانی مرتبط، میتوان به تقسیم دقیقتر و قویتر ژنها دست یافت. در این مقاله، ما یک روش خوشهبندی طیفی چندگانه با گراف را پیشنهاد میکنیم، که به ما کمک میکند تا ماژولهای عملکردی در هر بیماری سرطانی را با دقت و جامعتر کشف کنیم، در عین حال میتوان میزان ارتباط بین بیماریهای سرطانی را نیز تعیین کرد. ایده ما این است که یک ماتریس مجاورت بلوکی بسازیم تا ماتریس مجاورت هر گراف و درجه ارتباط بین چندین نمودار را با هم ادغام کنیم، سپس از خوشه بندی طیفی برای محاسبه خوشه ها برای هر گراف استفاده شود. الگوریتم پیشنهادی مبتنی بر یک تکرار میدانی خودسازگار است به طوری که هم درجه ارتباط و هم خوشههای ژنی را میتوان در طول تکرارها شناسایی کرد. علاوه بر این، شرایطی را ایجاد می کنیم که تحت آن همگرایی الگوریتم پیشنهادی با برخی مفروضات تضمین می شود. نتایج تجربی بر روی دو مجموعه داده از بیماریهای سرطان انسانی ارائه شده است، که نشان میدهد روش پیشنهادی نه تنها میتواند ماژولهای عملکردی ژن را شناسایی کند، بلکه میزان ارتباط بین بیماریهای سرطانی مختلف را نیز به دقت محاسبه میکند.
توجه! این متن ترجمه ماشینی بوده و توسط مترجمین ای ترجمه، ترجمه نشده است.
Abstract
An increasing body of literature shows that predicting gene clusters related to human cancer disease using biological networks is significant in bioinformation, it would help to understand disease mechanisms, and benefit the development of diagnostics and therapeutics. However, due to noise and preprocessing of data, a single network or graph generated from one cancer disease is insufficient to cluster genes. As some cancer diseases are correlated with each other in practice, by integrating several gene expression networks generated from those associated cancer diseases, more accurate and robust partition of genes can be obtained. In this paper, we propose a multiple graph spectral clustering method with graph association, it helps us to discover functional modules in each cancer disease more accurately and comprehensively, meanwhile the degree of association among cancer diseases can also be determined. Our idea is to construct a block adjacency matrix to integrate the adjacency matrix of each graph and the degree of association among multiple graphs together, then spectral clustering would be employed to calculate clusters for each graph. The proposed algorithm is based on a self-consistent field iteration such that both the degree of association and gene clusters can be identified during iterations. Moreover, we establish the condition under which convergence of the proposed algorithm is guaranteed with some assumptions. Experimental results on two datasets of human cancer diseases are presented, which demonstrate that the proposed method can not only identify gene functional modules, but also calculate the degree of association among different cancer diseases accurately.
Introduction
The completion of Human Genome Project (HGP) and the development of advanced high-throughput technologies have introduced large quantities of gene expression datasets from diferent cancer diseases. Such datasets have motivated lots of research works to investigate the relationship among genes. Particularly, numerous research works have been done to predict gene clusters related to human cancer diseases (Chen et al. 2014; Gill et al. 2014; Hu et al. 2018; Li et al. 2014; Sun et al. 2011). Usually, genes in the same cluster are functionally related, so disease-related gene clusters can support the existence of distinct disease-specifc functional modules (Goh et al. 2007; Oti et al. 2006; Wu et al. 2010). The identifcation of gene clusters can not just help to better understand cancer disease mechanisms, but provide new and exact diagnostics and therapeutics.
Concluding remarks
In this paper, we proposed a clustering method for multiple graphs with graphs association using a self-consistent feld iteration method. In each iteration of our method, the consistency among graphs are updated based on frst K eigenvectors containing the clustering structure information of each graph, then construct a new adjacency matrix. In terms of the experiment’s results, the clustering performance of our methods is better than the BLSC method using two gene expression datasets. Besides, results on two gene expression datasets also demonstrate better clustering performance with the degree of association among graphs. Moreover, the convergence of a nonlinear eigenvalue problem in which the consistency weight depends on eigenvectors of the block adjacency matrix, has been studied in “Appendix”.