چکیده
تولید صحنه های سه بعدی (3D) از تصاویر دو بعدی (2D)، یک گام مهم برای یک مقدمه موفق به خدمات چند رسانه ای سه بعدی است. در میان مسائل مربوطه، تخمین عمق از یک تصویر تک نمایی احتمالاً دشوارترین و چالش برانگیزترین وظیفه می باشد. در این مقاله، یک روش تخمین عمق جدید با استفاده از طبقه بندی شی بر اساس الگوریتم یادگیری بیزی را پیشنهاد می کنیم. با استفاده از داده های آموزشی از 6 ویژگی، اشیا در تصویر تک نمایی را به 4 نوع مختلف دسته بندی می کنیم. با توجه به نوع، یک مقدار عمق نسبی به هر شی تخصیص می دهیم و یک مدل 3 بعدی ساده را تولید می کنیم. نتایج تجربی نشان می دهد که روش پیشنهادی اطلاعات عمق را به درستی تخمین می زند و یک مدل 3 بعدی را تولید می نماید.
1- مقدمه
اگرچه تصاویر دو بعدی به طور موفقیت امیزی در خدمات مختلف چند رسانه ای را تا به امروز مورد بهره برداری قرار گرفته است، علاقه در مورد تصاویر سه بعدی به سرعت در حال افزایش است و روش های پردازش تصویر سه بعدی توجه بیشتری را جذب کرده است. تکنولوژی پردازش تصویر سه بعدی شامل طیف گسترده ای از عملیات مختلف از کسب صحنه های سه بعدی به نمایش سه بعدی می باشد. در میان آنها، تولید محتویات سه بعدی، یکی از ضروری ترین بخش ها برای خدمات تصویر سه بعدی می باشد.
به منظور گرفتن یک صحنه سه بعدی، نیاز به تجهیزات خاص مانند دوربین های استریو یا دیدهای متعدد و یک دوربین عمق دارد [1]. حتی اگر محتویات تصویر سه بعدی تولید شده و در دسترس باشد، مقدار محتویات برای برآورده ساختن تقاضای کاربر هنوز هم کافی نیست. از سوی دیگر، محتویات تصویر دو بعدی فراوان گرفته شده توسط دوربین های معمولی تک نمایی وجود دارد. از این رو، تولید صحنه های سه بعدی از محتویات دو بعدی می تواند جایگزین راه حلی برای غلبه بر اختلاف های فعلی و پر کردن کمبود محتویات تصویر سه بعدی شود.
ABSTRACT
Generation of three-dimensional (3D) scenes from two- dimensional (2D) images is an important step for a successful introduction to 3D multimedia services. Among the relevant problems, depth estimation from a single-view image is probably the most difficult and challenging task. In this paper, we propose a new depth estimation method using object classification based on the Bayesian learning algorithm. Using training data of six attributes, we categorize objects in the single-view image into four different types. According to the type, we assign a relative depth value to each object and generate a simple 3D model. Experimental results show that the proposed method estimates depth information properly and generates a good 3D model.
1. INTRODUCTION
Although two-dimensional (2D) images are successfully exploited in various multimedia services nowadays, interest on three-dimensional (3D) images is increasing rapidly and 3D image processing techniques are attracting more attention. The 3D image processing technology includes a wide range of different operations from 3D scene acquisition to 3D display. Among them, 3D contents generation is one of the most essential parts for the 3D image service.
In order to capture a 3D scene, we need special equipments, such as stereo or multi-view cameras and a depth camera [1]. Even if 3D image contents have been produced and become available, the amount of 3D contents is not enough to satisfy the user demand yet. On the other hand, there are abundant 2D image contents captured by conventional single-view cameras. Hence, generation of 3D scenes from 2D contents can be an alternative solution to overcome the current discrepancy and fill up the lack of 3D image contents.
چکیده
1- مقدمه
2- نشانه های عمق تک چشمی
3- طبقه بندی شی
3-1- نوع شی
3-2- صفات (ویژگی ها)
3-3- طبقه بندی بیزی
4- انتساب عمق
4-1- نقشه عمق اساسی
4-2- انتساب عمق برای اشیاء
5- نتایج تجربی
6- نتیجه گیری
ABSTRACT
1. INTRODUCTION
2. MONOCULAR DEPTH CUES
3. OBJECT CLASSIFICATION
3.1 Object Type
3.2 Attributes
3.3 Bayesian Classification
4. DEPTH ASSIGNMENT
4.1 Fundamental Depth Map
4.2 Depth Assignment for Objects
5. EXPEIMENTAL RESULTS
6. CONCLUSIONS