چکیده
ساختار اولیهی پروتئین ها متشکل از یک زنجیره خطی از اسیدهای آمینه است که میتوانند دارای طول متغیر باشند. پروتئینها، تحت تاثیر عوامل متعدد شیمیایی و فیزیکی، به ساختارهای سه بعدی تا میخورند که وظایف و خواص بیولوژیکی آنها را تعیین می کند. تا خوردن نامناسب هنگامی رخ می دهد که پروتئین به صورت یک ساختار سه بعدی تا می خورد که ساختار طبیعی آن را نشان نداده و میتواند به بیماری منجر شود. با توجه به اهمیت این مسئله و به این علت که تکنیک های آزمایشگاهی همیشه عملی نیستند، روش های محاسباتی برای توصیف ساختار پروتئین پیشنهاد شده اند. در این مقاله، ما یک الگوریتم مبتنی بر بهینه سازی ازدحام ذرات (PSO) را برای پیش بینی ساختارهای پروتئین در مدل قطبی آبگریز سه بعدی ارائه میدهیم. با شروع از یک مجموعه کوچک از راه حل های کاندید، الگوریتم ما به طور موثر به بررسی فضای جستجو می پردازد و ساختارهای پروتئینی سه بعدی را با حداقل انرژی باز می گرداند. برای آزمایش الگوریتم خود، ما از دو مجموعه از توالیهای معیار با طول های مختلف استفاده نمودیم و نتایج خود را با نتایج منتشر شده مقایسه کردیم. الگوریتم ما با پیدا کردن ساختارهای انرژی پایینتر و یا با انجام تعداد کمتری از ارزیابی های انرژی، بهتر از الگوریتم های قبلی عمل می کند.
1. مقدمه
پروتئین ها بسیاری از وظایف بیولوژیکی را انجام می دهند و بلوک های ساختمانی موجودات را نشان می دهند. آنها ترکیبات آلی پیچیدهای هستند که واحد تشکیل دهنده پایهی آنها اسید آمینه می باشد. پروتئین ها در ابتدا زنجیره های خطی از اسیدهای آمینه هستند که طول آنها از چند تا هزاران اسید آمینه متغیر است. پروتئینها تحت تاثیر عوامل متعددی فیزیکی و شیمیایی، به ساختارهای سه بعدی منحصر به فرد تا میشوند که وظایف و خواص بیولوژیکی آنها را تعیین میکند. تا خوردن نامناسب هنگامی رخ می دهد که پروتئین به یک ساختار سهبعدی تا می شود که ساختار طبیعی درست آن را نشان نداده و می تواند به بسیاری از بیماری ها، مانند آلزایمر، انواع مختلفی از سرطانها و غیره منجر شود. با توجه به اهمیت این موضوع در زندگی انسان، دانشمندان روشهای آزمایشگاهی مانند کریستالوگرافی اشعه ایکس و تشدید مغناطیسی هسته ای (NMR) را برای تعیین ساختار فطری پروتئین توسعه داده اند. اگرچه این روشها قابل اعتماد هستند، آنها همیشه عملی نیستند. از این رو، پیشبینی ساختار طبیعی پروتئین، با توجه به توالی اولیه آن، وظیفه مهم و چالش برانگیزی در زیستشناسی محاسباتی است.
ساختار پروتئین اولیه، یک توالی خطی از اسیدهای آمینه است که از طریق پیوندهای پپتیدی به هم متصل میشوند. پروتئین ها با توجه به اثر آب گریز، پیوند واندروالس، نیروهای الکترواستاتیک، پیوند هیدروژنی و غیره تا میخورند. ساختارهای ثانویه که پروتئینها به آنها تبدیل می شوند، ساختارهای سه بعدی است که با یک الگوی پیوند تکراری مشخص می شوند. رایج ترین ساختارها مارپیچ ها و رشته ها هستند. پروتئین هایی که شامل این ساختارهای ثانویه هستند بیشتر می توانند به ساختار سوم تشکیل دهنده یک بسته از ساختارهای ثانویه، پیچ و حلقهها تا شوند. علاوه بر این، ازدحام مناطق ساختار سوم از برخی از توالیهای مجزا پروتئین، به اصطلاح ساختارهای کواترنر را تشکیل می دهد.
Abstract
The primary structure of proteins consists of a linear chain of amino acids that can vary in length. Proteins fold, under the influence of several chemical and physical factors, into their 3D structures, which determine their biological functions and properties. Misfolding occurs when the protein folds into a 3D structure that does not represent its native structure, which can lead to diseases. Due to the importance of this problem and since laboratory techniques are not always feasible, computational methods for characterizing protein structures have been proposed. In this paper, we present a particle swarm optimization (PSO) based algorithm for predicting protein structures in the 3D hydrophobic polar model. Starting from a small set of candidate solutions, our algorithm efficiently explores the search space and returns 3D protein structures with minimal energy. To test our algorithm, we used two sets of benchmark sequences of different lengths and compared our results to published results. Our algorithm performs better than previous algorithms by finding lower energy structures or by performing fewer numbers of energy evaluations.
1 Introduction
Proteins perform many biological functions and represent the building blocks of organisms. They are complex organic compounds of which the basic forming unit is the amino acid. Proteins are initially linear chains of amino acids which can vary in length from a few up to thousands of amino acids. Proteins fold, under the influence of several chemical and physical factors, into their unique 3D structures which determine their biological functions and properties. Misfolding occurs when the protein folds into a 3D structure that does not represent its correct native structure, which can lead to many diseases, such as Alzheimer, several types of cancer, etc. (Prusiner,1998). Due to the importance of this issue to human life, scientists have developed laboratory techniques such as X-ray crystallography and nuclear magnetic resonance (NMR) to determine the native structures of proteins. Although these methods are reliable, they are not always feasible. Hence, predicting the native structure of a protein, given its primary sequence, is an important and challenging task in computational biology. The primary protein structure is a linear sequence of amino acids connected together via peptide bonds. Proteins fold due to hydrophobic effect, van der Waals interactions, electrostatic forces, hydrogen bonding, etc. The secondary structures are three-dimensional structures characterized by a repeating bonding pattern. The most common structures are helices and strands. The proteins that include these secondary structures can further fold into the tertiary structure forming a bundle of secondary structures, turns and loops. Furthermore, the aggregation of tertiary structure regions of some separate protein sequences forms the so called quaternary structures (Rylance, 2004).
چکیده
1. مقدمه
2. پیش زمینه ای در مورد بهینه سازی ازدحام ذرات
3. PSO برای پیش بینی ساختار پروتئین
3.1 ارائه راه حل
3.2 الگوریتم ترمیم
3. 3 تابع هدف
3.4 به روز رسانی موقعیت
3.5 بررسی نرخ و سیاست انتخاب اسیدهای آمینه
3.6 معیار پذیرش ذره جدید و معیار توقف
4. نتایج تجربی و بحث
4.1 رویهی تجربی
4.2 نتایج
5. نتیجه گیری
Abstract
1 Introduction
2 Background on particle swarm optimization
3 PSO for protein structure prediction
3.1 Solution representation
3.2 Repair algorithm
3.3 Objective function
3.4 Position update
3.5 Determining RATE and selection policy of amino acids
3.6 Acceptance criterio
4 Experimental results and discussion
4.1 Experimental procedure
4.2 Results
5 Conclusion