دانلود مقاله معیارهای ارزیابی برای مولدهای تصویر کهکشانی
ترجمه نشده

دانلود مقاله معیارهای ارزیابی برای مولدهای تصویر کهکشانی

عنوان فارسی مقاله: معیارهای ارزیابی برای مولدهای تصویر کهکشانی
عنوان انگلیسی مقاله: Evaluation metrics for galaxy image generators
مجله/کنفرانس: نجوم و محاسبات - Astronomy and Computing
رشته های تحصیلی مرتبط: فیزیک
گرایش های تحصیلی مرتبط: اختر فیزیک (فیزیک نجومی) - فیزیک محاسباتی
کلمات کلیدی فارسی: یادگیری عمیق - مدل های تولیدی - بینایی کامپیوتر - ارزیابی - مورفولوژی کهکشان
کلمات کلیدی انگلیسی: Deep learning - Generative models - Computer-vision - Evaluation - Galaxy morphology
نوع نگارش مقاله: مقاله پژوهشی (Research Article)
شناسه دیجیتال (DOI): https://doi.org/10.1016/j.ascom.2022.100685
لینک سایت مرجع: https://www.sciencedirect.com/science/article/pii/S2213133722000993
نویسندگان: S. Hackstein - V. Kinakh - C. Bailer - M. Melchior a
دانشگاه: Institute for Data Science, University of Applied Sciences North Western Switzerland (FHNW), Switzerland
صفحات مقاله انگلیسی: 21
ناشر: الزویر - Elsevier
نوع ارائه مقاله: ژورنال
نوع مقاله: ISI
سال انتشار مقاله: 2023
ایمپکت فاکتور: 2.663 در سال 2020
شاخص H_index: 27 در سال 2022
شاخص SJR: 0.688 در سال 2020
شناسه ISSN: 2213-1337
شاخص Quartile (چارک): Q2 در سال 2020
فرمت مقاله انگلیسی: PDF
وضعیت ترجمه: ترجمه نشده است
قیمت مقاله انگلیسی: رایگان
آیا این مقاله بیس است: خیر
آیا این مقاله مدل مفهومی دارد: ندارد
آیا این مقاله پرسشنامه دارد: ندارد
آیا این مقاله متغیر دارد: ندارد
آیا این مقاله فرضیه دارد: ندارد
کد محصول: e17360
رفرنس: دارای رفرنس در داخل متن و انتهای مقاله
فهرست مطالب (ترجمه)

خلاصه

1. معرفی

2. مجموعه داده

3. معیارهای ارزیابی

4. مدل ها

5. نتایج

6. بحث

7. نتیجه گیری

بیانیه مشارکت نویسنده CRediT

اعلامیه منافع رقابتی

قدردانی

ضمیمه A. باغ وحش کهکشان - عدم تعادل طبقاتی

ضمیمه B. معیارهای ارزیابی رایج

ضمیمه C. پروکسی های مورفولوژیکی

پیوست D. مدل معماری و خطوط لوله آموزشی

پیوست E. تعداد خوشه ها

منابع

فهرست مطالب (انگلیسی)

Abstract

1. Introduction

2. Dataset

3. Evaluation metrics

4. Models

5. Results

6. Discussion

7. Conclusions

CRediT authorship contribution statement

Declaration of Competing Interest

Acknowledgments

Appendix A. Galaxy Zoo — class imbalance

Appendix B. Common evaluation metrics

Appendix C. Morphological proxies

Appendix D. Model architectures and training pipelines

Appendix E. Number of clusters

References

بخشی از مقاله (ترجمه ماشینی)

چکیده

     یک مشکل عمده با مدل‌های مولد عمیق، تأیید این است که توزیع تولید شده شبیه توزیع هدف است در حالی که نمونه تولید شده فردی از داده‌های اصلی قابل تشخیص نیست. به طور خاص، برای کاربرد در اخترفیزیک، باید مطمئن باشیم که داده های تولید شده با دانش قبلی ما مطابقت دارد و نمونه های تولید شده شامل همه انواع شی با فرکانس و تنوع صحیح است. ما در حال حاضر فاقد راه‌های عینی برای ارزیابی سیستماتیک این جنبه‌های کیفی هستیم، جایی که بازرسی انسانی به محدودیت‌های خود می‌رسد، زیرا این نیاز به تجزیه و تحلیل دقیق حجم زیادی از داده‌ها دارد. در این کار، ما معیارهای معقول را برای کیفیت مولدهای تصویر کهکشانی شناسایی می کنیم. برای این منظور، ما مجموعه کوچکی از مولدهای تصویر مشروط را که بر روی تصاویر کهکشانی با برچسب‌های طبقه‌بندی برای ویژگی‌های مورفولوژی بصری آموزش دیده‌اند، مقایسه می‌کنیم. سهم اصلی ما مجموعه جدیدی از معیارهای مبتنی بر خوشه برای تطبیق توزیع تولید شده با توزیع هدف است. علاوه بر این، ما از فاصله Wasserstein در پراکسی‌ها برای مورفولوژی کهکشان و همچنین تعدادی معیار دیگر که معمولاً برای تولیدکننده‌های تصویر استفاده می‌شوند، استفاده می‌کنیم. معیارهای مبتنی بر خوشه که به تازگی معرفی شده اند، پروکسی های خوبی برای کیفیت توزیع تولید شده هستند و برای شناسایی خودکار فروپاشی حالت مناسب هستند. علاوه بر این، معیارهای خوشه ای امکان تفسیر کیفی توزیع تولید شده را فراهم می کند. معیارهای مبتنی بر آمار مورفولوژیکی ابزار مفیدی برای بررسی سلامت فیزیکی نمونه‌های تولید شده فراهم می‌کنند. در نهایت، متوجه شدیم که فاصله شروع هسته استفاده شده با یک مدل InceptionV3 که از قبل در ImageNet آموزش داده شده است، یک پروکسی خوب برای کیفیت کلی مولدهای تصویر کهکشانی است، اگرچه نمی توان آن را به این راحتی تفسیر کرد.

توجه! این متن ترجمه ماشینی بوده و توسط مترجمین ای ترجمه، ترجمه نشده است.

بخشی از مقاله (انگلیسی)

Abstract

     A major problem with deep generative models is verifying that the generated distribution resembles the target distribution while the individual generated sample is indistinguishable from the original data. In particular, for application in astrophysics we need to be sure that the generated data matches our prior knowledge and that the generated samples entail all object types with the correct frequency and diversity. We currently lack objective ways to systematically assess these quality aspects, where human inspection reaches its limits, as this requires detailed analysis of a large data volume. In this work, we identify reasonable metrics for the quality of galaxy image generators. To this end, we compare a small set of conditional image generators, trained on galaxy images with classification labels for visual morphology features. Our main contribution is a new set of cluster-based metrics for matching the generated distribution to the target distribution. Furthermore, we use the Wasserstein distance on proxies for galaxy morphology as well as a number of other metrics commonly used for image generators. The newly introduced cluster-based metrics are good proxies for the quality of the generated distribution and are suited for automatized identification of mode collapse. Furthermore, the cluster metrics allow for a qualitative interpretation of the generated distribution. The metrics based on morphological statistics provide a useful tool to probe the physical soundness of generated samples. Finally, we find that kernel inception distance used with an InceptionV3 model pre-trained on ImageNet is a good proxy for the overall quality of galaxy image generators, although it cannot be interpreted that easily.

Introduction

     Upcoming astronomical surveys with telescopes, such as Euclid (Laureijs et al., 2012) and LSST (Abell et al., 2009), will provide a wealth of data with billions of galaxy images. These hold unprecedented insight in highly researched astrophysical and cosmological questions, such as formation and evolution of galaxies, the cosmic distribution of dark matter, as well as the expansion history of the Universe (Laureijs et al., 2011). However, the huge amount of images is far too big to be investigated by astrophysicists on an individual basis. Instead, fast and systematic extraction of galaxy properties from their images is required in order to inform and constrain physical models. There are a number of computational tools that have been developed and are already in use by the astrophysical community (Rodriguez-Gomez et al., 2019, Boquien et al., 2019, Shamir, 2011). Though these allow for a systematic extraction of properties, they require too much computational resources to provide big collections of high quality mock images in a reasonable amount of time. Hence, it is necessary to replace these tools by faster methods, e. g. by using machine learning techniques, such as deep neural networks (Lovell et al., 2019, Ferreira et al., 2020, Walmsley et al., 2022 e. g.).

Conclusions

     In order to find suitable evaluation metrics to assess the quality of galaxy image generators, we investigate a number of evaluation metrics with the potential to measure different quality aspects. These metrics are probed with a small number of conditional generative models, some of which purposely are of worse quality than the others. We identified evaluation metrics that are good proxies for the quality of individual images and the resemblance of the target distribution. Our main results are:

• The newly introduced cluster-based metrics (Section 3.1) are a formidable new tool to assess the distribution of generated data.

• The KID metric on features of the pre-trained InceptionV3 model (Szegedy et al., 2015) provides a useful proxy on the overall quality of galaxy image generators.

• Using an ALReLU activation (Mastromichalakis, 2020) significantly enhances classification accuracy for rare object types. This is required to train conditional generators on the highly imbalanced dataset of galaxy images.

     We introduce a new set of cluster-based metrics (Section 3.1), which are good proxies for the distribution quality. In particular, they allow for a qualitative interpretation regarding the sample diversity and the amount of samples generated for different types. Thus, they provide an intuitive new tool to assess the resemblance of the target distribution in a qualitative way, which so far has been a rather illusive task. In addition, one of the cluster metrics, the cluster error provides a formidable tool to identify mode collapse. Moreover, the cluster metrics have the potential to be transformed into a loss function to train generative models to reproduce the distribution of training data exactly, or any other target distribution, e. g. balanced datasets. Together, the aforementioned metrics provide a good basis to assess the quality of trained image generators, which is not necessarily limited to the context of galaxy images. We are currently working on providing losses based on these cluster metrics, which have the potential to drastically improve training of generative models regarding distribution quality, which is especially valuable for GANs.