دانلود مقاله انتخاب ژن های مهم با آزمون تصادفی برای دسته بندی سرطان
ترجمه نشده

دانلود مقاله انتخاب ژن های مهم با آزمون تصادفی برای دسته بندی سرطان

عنوان فارسی مقاله: انتخاب ژن های مهم با آزمون تصادفی برای دسته بندی سرطان با استفاده از اطلاعات بیان ژن
عنوان انگلیسی مقاله: Selecting significant genes by randomization test for cancer classification using gene expression data
مجله/کنفرانس: Journal of Biomedical Informatics
رشته های تحصیلی مرتبط: پزشکی، زیست شناسی
گرایش های تحصیلی مرتبط: خون و انکولوژی، بیوانفورماتیک
کلمات کلیدی فارسی: داده های بیان ژن، آزمون تصادفی، آنالیز تفکیکی حداقل مربعات جزئی، انتخاب ژن، دسته بندی سرطان
کلمات کلیدی انگلیسی: Gene expression data, Randomization test, Partial least squares discriminant analysis, Gene selection, Cancer classification
نوع نگارش مقاله: مقاله پژوهشی (Research Article)
شناسه دیجیتال (DOI): https://doi.org/10.1016/j.jbi.2013.03.009
دانشگاه: State Key Laboratory of Medicinal Chemical Biology, and Research Center for Analytical Sciences, College of Chemistry, Nankai University, Tianjin 300071, China
صفحات مقاله انگلیسی: 8
ناشر: الزویر - Elsevier
نوع ارائه مقاله: ژورنال
نوع مقاله: ISI
سال انتشار مقاله: 2013
ایمپکت فاکتور: 3.454 در سال 2017
شاخص H_index: 76 در سال 2019
شاخص SJR: 1.028 در سال 2019
شناسه ISSN: 1532-0464
شاخص Quartile (چارک): Q1 در سال 2019
فرمت مقاله انگلیسی: PDF
وضعیت ترجمه: ترجمه نشده است
قیمت مقاله انگلیسی: رایگان
آیا این مقاله بیس است: خیر
کد محصول: E11920
فهرست مطالب (انگلیسی)

Abstract

1. Introduction

2. Methods

3. Datasets

4. Results and discussion

5. Conclusions

Acknowledgment

References

بخشی از مقاله (انگلیسی)

Abstract

Gene selection is an important task in bioinformatics studies, because the accuracy of cancer classification generally depends upon the genes that have biological relevance to the classifying problems. In this work, randomization test (RT) is used as a gene selection method for dealing with gene expression data. In the method, a statistic derived from the statistics of the regression coefficients in a series of partial least squares discriminant analysis (PLSDA) models is used to evaluate the significance of the genes. Informative genes are selected for classifying the four gene expression datasets of prostate cancer, lung cancer, leukemia and non-small cell lung cancer (NSCLC) and the rationality of the results is validated by multiple linear regression (MLR) modeling and principal component analysis (PCA). With the selected genes, satisfactory results can be obtained.

Introduction

Cancer classification based on microarray has become a popular research topic in bioinformatics, which can be used to detect subtypes of cancers and produce therapies. A great many of studies have appeared for cancer classification [1–3]. These methods include principal component analysis (PCA) [4,5], k-nearest neighbor (k-NN) [6], hierarchical clustering analysis (HCA) [7], support vector machine (SVM) [8], Bayesian method [9], partial least squares discriminant analysis (PLSDA) [10], ensemble methods [11], etc. Among these methods, PLSDA has been the most commonly used one for cancer classification due to its simplicity [12–14]. Moreover, as a dimension reduction technique, PLS has been used in gene expression data analysis even in the case where the number of genes exceeds the number of samples.