بهبود سیستم های خودکار شناسایی گفتار از طریق ویژگی های دینامیک ارزیابی شده
ترجمه شده

بهبود سیستم های خودکار شناسایی گفتار از طریق ویژگی های دینامیک ارزیابی شده

عنوان فارسی مقاله: بهبود سیستم های خودکار شناسایی گفتار از طریق ویژگی های دینامیک ارزیابی شده از طرح بازگشتی سیگنال های گفتار
عنوان انگلیسی مقاله: Improvement of automatic speech recognition systems via nonlinear dynamical features evaluated from the recurrence plot of speech signals
مجله/کنفرانس: کامپیوتر و مهندسی برق - Computers and Electrical Engineering
رشته های تحصیلی مرتبط: مهندسی کامپیوتر
گرایش های تحصیلی مرتبط: هوش مصنوعی و مهندسی ااگوریتم ها و محاسبات
کلمات کلیدی فارسی: تشخیص گفتار خودکار، ضریب های کپسترال فرکانسی مل، فاز بازسازی شده، طرح تکرار، تبدیل موجک دو بعدی
کلمات کلیدی انگلیسی: Automatic speech recognition - Mel-frequency cepstral coefficients - Reconstructed phase space - Recurrence plot - Two-dimensional wavelet transform
نوع نگارش مقاله: مقاله پژوهشی (Research Article)
شناسه دیجیتال (DOI): https://doi.org/10.1016/j.compeleceng.2016.07.006
دانشگاه: گروه مهندسی پزشکی، دانشگاه صنعتی امیرکبیر، تهران، ایران
صفحات مقاله انگلیسی: 12
صفحات مقاله فارسی: 24
ناشر: الزویر - Elsevier
نوع ارائه مقاله: ژورنال
نوع مقاله: ISI
ایمپکت فاکتور: 2.762 در سال 2018
شاخص H_index: 49 در سال 2019
شاخص SJR: 0.443 در سال 2018
شناسه ISSN: 0045-7906
شاخص Quartile (چارک): Q2 در سال 2018
فرمت مقاله انگلیسی: PDF
وضعیت ترجمه: ترجمه شده و آماده دانلود
فرمت ترجمه فارسی: ورد و pdf
مشخصات ترجمه: تایپ شده با فونت B Nazanin 14
مقاله بیس: خیر
مدل مفهومی: ندارد
کد محصول: 9757
پرسشنامه: ندارد
متغیر: ندارد
درج شدن منابع داخل متن در ترجمه: خیر
ترجمه شدن توضیحات زیر تصاویر و جداول: بله
ترجمه شدن متون داخل تصاویر و جداول: بله
رفرنس در ترجمه: در داخل متن و انتهای مقاله درج شده است
نمونه ترجمه فارسی مقاله

چکیده

ویژگی های مبتنی بر طیف سیگنال، که معمولا در سیستم های خودکار تشخیص گفتار مورد استفاده قرار میگیرد (ASR) ، اطلاعات فاز سیگنال های گفتار رد میشود. ازین رو، با استفاده از ویژگی های اضافی، که در آن ها فاز سیگنال رد نشود، میتواند موجب پر شدن این خلا شود. با قرار دادن سیگنال های گفتار در فضای فاز  بازسازی شده ( RPS) و  سپس استخراج کردن بعضی از ویژگی های مفید از آن، روش جدیدی در این زمینه به دست آمده است. در این مقاله، ما این روش را با ارزیابی بعضی از ویژگی های مفید از طرح بازگشتی (RP) از سیگنال های داخلی RPS ، دنبال  میکنیم ؛ ویژگی های پیشنهاد شده با استفاده از اعمال کردن یک تبدیل موجک دو بعدی بر روی دیاگرام های منتج شده ی RP ، ارزیابی میشود. ویزگی های پیشنهاد شده در یک  طرح ASR به تنهایی ارزیابی شده و سپس در ترکیب با ضریب های کپسترال فرکانسی مل متداول (MFCC) بررسی میشود. برای مورد دوم، با استفاده از  مجموعه کلام رایج انگلیسی TIMIT ، 3.94% بهبود صحت طبقه بندی در نرخ صحت شناسایی صوت ، در مقایسه با استفاده ی تنها از ویژگی های MFCC به دست آمد.

1. مقدمه

در دهه های اخیر، انواع مختلفی از مدل های خطی برای کد گذاری، ترکیب و شناسایی گفتار با عملکرد های قابل قبول معرفی شده است. در این روش ها، انواع مختلفی از تحقیقات توانسته است بهبود هایی را در زمینه ی شناسایی گفتار با استفاده از روش های جدید، ایجاد کند و یا بتواند موجب شناسایی تلفظ های اشتباه با استفاده از مدل پنهان ماکروف شود ؛ اما پدیده های غیر خطی ایرودینامیک در سیستم تولید گفتار انسان هستند که معمولا نمیتوان آن ها را در سیستم ها و مدل های خطی در نظر گرفت.  ازین رو، روش های غیر خطی احتمالا میتوانند مدل های محاسباتی موثری را ایجاد کنند تا ویژگی های صوتی که در شناسایی پدیده های غیر خطی مفید تر هستند علاوه بر این، بعضی از مطالعه های جدید نشان داده است که  استفاده از ویژگی های غیر خطی میتواند موجب بهبود عملکرد سیستم های ASR شود.

نمونه متن انگلیسی مقاله

Abstract

The spectral-based features, typically used in Automatic Speech Recognition (ASR) systems, reject the phase information of speech signals. Thus, employing extra features, in which the phase of the signal is not rejected, may fill this gap. Embedding the speech signal in the Reconstructed Phase Space (RPS) and then extracting some useful features from it, is a recently considered approach in this field. In this paper, we will follow this approach by evaluating some useful features from the Recurrence Plot (RP) of the embedded speech signals in the RPS; the proposed features are evaluated via applying a two-dimensional wavelet transform to the resulted RP diagrams. The proposed features are examined in an ASR task alone and in combination with the traditional Mel-Frequency Cepstral Coefficients (MFCC). For the second case, using English TIMIT corpus, 3.94% absolute classification accuracy improvement in the phoneme recognition accuracy rate, against using only the MFCC features is gained.

1. Introduction

In recent decades, a variety of linear models for speech coding, synthesis, and recognition with acceptable performances have been introduced. In this way, many types of research achieved improvement in the field of speech recognition by employing novel methods [1,2] or the detection of mispronunciation using Hidden Markov model [3]; however, there are nonlinear aerodynamic phenomena in the human speech production system which generally could not be included in linear models [4]. Therefore, nonlinear methods could potentially provide effective computational models to extract acoustic features which are useful for the nonlinear phenomena detection [4]. Furthermore, some recent studies have shown that utilizing nonlinear characteristics may improve the performances of the ASR systems [5].

ترجمه فارسی فهرست مطالب

چکیده

مقدمه

تاثیر مطالعه

روش ها و مواد مورد استفاده

فضای فاز بازسازی شده

طرح بازگشتی

استخراج ویژگی

متغیر های ثابت دینامیک استخراج شده از RP ها

انتروپی : ر این قسمت، انتروپی رنی به عنوان چهارمین ویژگی در نظر گرفته میشود.

استخراج ویژگی با استفاده از تبدیل موجک

روش های کاهش ابعاد

انتخاب ویژگی 

تبدیل ویژگی ها

روش شناسی های آزمایشی

مروری بر روی سیستم

دیتابیس

نتایج آزمایشی

مباحث

جمع بندی

فهرست انگلیسی مطالب

1. Introduction

1.1. Contribution

2. Material and methods

2.1. The reconstructed phase space

2.2. The recurrence plot

2.3. Feature extraction

2.4. Dimensionality reduction methods

3. Experimental methodology

3.1. System overview

3.2. Database

4. Experimental results

4.1. Discussion

5. Conclusion

محتوای این محصول:
- اصل مقاله انگلیسی با فرمت pdf
- ترجمه فارسی مقاله با فرمت ورد (word) با قابلیت ویرایش، بدون آرم سایت ای ترجمه
- ترجمه فارسی مقاله با فرمت pdf، بدون آرم سایت ای ترجمه
قیمت محصول: ۳۱,۴۰۰ تومان
خرید محصول
بهبود سیستم های خودکار شناسایی گفتار از طریق ویژگی های دینامیک ارزیابی شده
مشاهده خریدهای قبلی
مقالات مشابه
نماد اعتماد الکترونیکی
پیوندها