در این مقاله، دو نوع از سیستم های یادگیری، سیستم یادگیری با نظارت و سیستم یادگیری بدون نظارت برای ساخت سیستمهای کنترلی تطبیق پذیر مبتنی بر شبکه های عصبی معرفی می شوند. هر دو روش برای کنترل حرکت طولی دستگاه شناور آزاد PTEROA به کار رفته اند. سیستم یادگیری با نظارت بر اساس مفهوم ساده یادگیری رفتار کنترلر با نظارت است که به همراه یک کنترلر فازی به عنوان ناظر پیاده سازی می شود و با آزمایشها و شبیه سازیهای عددی ارزیابی می شود. نشان داده می شود که ویژگیهای شبکه های عصبی مانند انعطافپذیری انتخاب I/O و اشباع خروجیها، کارایی مطلوبی برای سیستم کنترلی AUV فراهم می کنند.سیستم یادگیری بدون نظارت که SONCS نامیده می شود، به عنوان یک سیستم کنترلی تطبیقپذیر معرفی می گردد. زیرسیستمها و فرایند سازماندهی کنترلر با جزئیات شرح داده می شود. SONCS در مساله کنترلی وسیله بدون هادی فیزیکی PW45 به کار می رود و کارایی آن با استفاده از آزمایشهای تانکهای شناور آزاد ارزیابی می شود. نشان داده می شود بعد از چند بار تطبیقپذیری، SONCS در سازماندهی یک کنترلر مناسب برای شنای افقی در عمق مطلوب به موفقیت می رسد.
مقدمه
مفهوم پایه شبکه های عصبی مصنوعی از تلاشهایی که برای مدلسازی رفتارهای مغز در دهه 1940 انجام شد نشأت گرفت. در دهه گذشته، ویژگیهای جالب آنها به عنوان یک ابزار پردازش داده به ویژه در زمینه مسائل شناسایی الگو و بهینه سازی نشان داده شد. ویژگیهای شاخص آنها به موازی سازی زیاد، عملیات غیرخطی و توانایی یادگیری وابسته است. چون شبکه های عصبی مصنوعی با فرایندهای توزیع شده موازی اجرا می شود، می توانند با سیستمهای چند ورودی-چند خروجی (MIMO) مانند دستگاههای خودکار زیرآبی (AUV) کار کنند. انتظار می رود که آنها بتوانند غیرخطی بودن نیروهای هیدرودینامیک که به بدنه دستگاه اعمال می شود و تعاملات پیچیده بین پرتابگرها، سطوح کنترلی و غیره را دنبال کنند. علاوه بر این، حتی اگر دینامیک سیستم ناشناخته باشد یا نمایش آن به صورت ریاضی دشوار باشد، ممکن است آنها بتوانند به این نوع دینامیک پیچیده را به صورت تطبیق پذیر با استفاده از توانایی یادگیری خود رسیدگی کنند. به دلیل اینکه AUV ها در یک محیط ساختارنیافته به کار گرفته می شوند، این ویژگیها برای یک سیستم کنترلی هوشمند جذاب است.تلاشهای زیادی برای ساخت یک سیستم کنترلی تطبیق پذیر غیرخطی با استفاده از شبکه های عصبی انجام شده است. چارچوبی از نمایش رفتارهای تطبیق پذیر دنباله ای با استفاده از شبکه های عصبی اولین بار توسط جردن معرفی شد. یک روش ریاضی که شبیه MRAS (سیستم تطبیق پذیر مدل مرجع) است از نقطه نظر تئوری سیستمی توسط نارندرا دقیقا شرح داده شد. ولی در مسائل کنترلی سیستمهای واقعی مثالهای کمی از پیاده سازی شبکه های مصنوعی وجود دارد. این مقاله دو نوع از سیستمهای یادگیری که از شبکه های عصبی به عنوان کنترلر استفاده می کند را معرفی می نماید. اولین سیستم، سیستم یادگیری با نظارت است که بر اساس یک مفهوم ساده یادگیری روابط I/O (ورودی-خروجی) که توسط کنترلر ناظر که با تئوریهای سنتی طراحی شده بود ارائه می شد است. این سیستم به عنوان مرحله اول برای دستیابی به سیستم دوم بازرسی می شود، یعنی یک سیستم یادگیری بدون نظارت که می تواند به طور خودکار کارهای کنترلی که بدون ناظر باید انجام شود را فرا گیرد. یک معماری و روند عمومی یادگیری بی نظارت توسط نویسندگان معرفی شده است و این سیستم، سیستم کنترلر شبکه عصبی خود سازمانده (SONCS) نامیده شد. این سیستم شامل یک شبکه عصبی که شبکه مدل رو به جلو نامیده می شود که دینامیک شی کنترلی را نمایش می دهد؛ است. شبکه کنترلر به صورت تطبیق پذیر بر اساس اطلاعات خطا تنظیم می شود که توسط یک تابع ویژه ارزیابی حرکت به دست می آید که از خروجیهای مدل رو به جلو محاسبه می شود. کارایی سیستم رباتیک باید در دنیای واقعی و نه فقط در شبیه سازیها ارزیابی شود. بنابراین سیستمهای کنترلی مبتنی بر شبکه های عصبی که پیشنهاد شده در مورد کنترل حرکت طولی یک وسیله شناور آزاد واقعی PTREROA به کار گرفته شده، و با استفاده از تستهای تانک ارزیابی شده است.
In this paper, two types of learning systems, the supervised learning system and the unsupervised learning system, are introduced to construct neural-network-based control systems. Both approaches are applied to longitudinal motion control of the free-swimming vehicle "PTEROA". The supervised learning system is based on the simple concept of learning the behavior of the supervisor controller. It is implemented along with a fuzzy controller as the supervisor, and evaluated through numerical simulations and experiments. It is shown that the characteristics of the neural networks, such as flexibility of the I/0 selection and saturation of the outputs, provide favorable performance to the control system for A UVs. The unsupervised learning system, which is called "SONCS", is introduced as an adaptive control system. The subsystems and the organizing process of the controller are described in detail. The SONCS is applied to the control problem of the untethered test-bed vehicle PW45, and its performance is evaluated through free-swimming tank tests. It is shown that after several times of adaptation, the SONCS succeeds in organizing an appropriate controller for horizontal swimming at a desired depth.
INTRODUCTION
The basic concept of artificial neural networks originated from the efforts to model brain behaviors in the 1940's.1 In the past decade their fascinating characteristics as an information processing tool have been demonstrated, especially in the field of pattern recognition and optimization problems. 2-4 Their distinctive features depend on massive parallelism, nonlinear operation and learning ability. As artificial neural networks execute through parallel distributed processes, they can deal with multi-input multi-output (MIMO) systems like Autonomous Underwater Vehicles (AUVs). It is expected that they can follow the nonlinearity of the hydrodynamic forces acting on the vehicle body and the complex interactions between the thrusters, the control surfaces, etc. Moreover, even if the system dynamics are unknown or difficult to represent mathematically, they may be able to handle these kind of complex dynamics adaptively using their learning ability. Since AUVs are operated in an unstructured environment, these features are attractive for an intelligent control system. Several attempts have been carried out to make a nonlinear adaptive control system using neural networks. 5-8 A framework of representation of sequential adaptive behaviors using neural networks was first suggested by Jordan. s A mathematical aproach which is similar to MRAS (Model Referenced Adaptive System) was discussed in detail from the system theoretic point of view by Narendra. 8 On control problems of the real system, however, there are very few examples of implementation of artificial neural networks. This paper introduces two types of learning systems which utilize neural networks as controllers. The first one is a so-called "supervised" learning system which is based on a simple concept of learning I/O (inputoutput) relations provided by the supervisor controller which has been designed with conventional theories. 9 This system was investigated as the first step to get to the second one, that is, an unsupervised learning system which can automatically learn the control actions which should be taken without a supervisor. A general architecture and a procedure of unsupervised learning were introduced by the authors 1°'11 and the system was named "Self-Organizing Neural-NetController System (SONCS)". This system includes a neural network called a "Forward Model Network" which represents the dynamics of the controlled object. The controller network is adaptively adjusted according to error information, which is given by a specified evaluation function of motion, calculated from the outputs of the forward model. Generally speaking, performance of the robotic system should be investigated in the real world, not just via simulations. The proposed neural-network-based control systems are, therefore, applied to longitudinal motion control of an actual free-swimming vehicle, the "PTEROA ''~2 and evaluated through tank tests.
مقدمه
شبکه های عصبی چند لایه
سیستم یادگیری با نظارت
یادگیری با نظارت برای PTEROA60
مقاومت در برابر مزاحمتها
سیستم یادگیری بدون نظارت
ارزیابی و تطبیق پذیری
فرایند سازماندهی کنترلر
SONCS برای بستر تست کوچک PW45
کنترل فازی اولیه
پیش از یادگیری کنترلر
مدل رو به جلو
ارزیابی و تخمین
نتیجه گیری
INTRODUCTION
MULTILAYERED NEURAL NETWORKS
SUPERVISED LEARNING SYSTEM
SUPERVISED LEARNING FOR PTEROA60
RESULTS OF SUPERVISED LEARNING
Robustness against disturbances
UNSUPERVISED LEARNING SYSTEM
Evaluation and adaptation
Organizing process of controller
SONCS FOR THE SMALL TEST-BED PW45
Rudimentary fuzzy control
Pre-learning of controller
Forward modeling
Evaluation and adaptation
CONCLUDING REMARKS