که:
شکل ۳‑۶: الگوریتم تشکیل یک طبقهبندیکننده قوی بر اساس چند ویژگی [۳۳]
درخت تصمیم آبشاری تقویتشده
طبقهبندیکننده نهایی برای آشکارسازی چهره یک درخت تصمیم شامل چندین طبقهبندیکننده قوی است که هر یک از این طبقهبندیکنندهها به عنوان یک گره از درخت تصمیم میباشند. علت استفاده از درخت تصمیم با چندین طبقهبندیکننده قوی، افزایش سرعت پردازش الگوریتم است. برای آموزش و ساخت یک طبقهبندیکننده قوی که دقت بسیار خوبی در آشکارسازی چهره داشته باشد، باید از تعداد زیادی ویژگی استفاده شود. برای تشخیص چهره یا غیرچهره بودن تصویر با استفاده از این طبقهبندیکننده قوی، باید تعداد زیادی ویژگی در یک مرحله از تصویر استخراج شده و توسط طبقهبندیکننده قوی مورد بررسی قرار گیرد؛ که این عملیات باعث کاهش سرعت سیستم میشود. در حالیکه بسیاری از تصاویر غیرچهره با تعداد بسیار کمی از ویژگیهای استخراج شده، از تصاویر چهره قابل تمایز هستند. بنابراین به جای تصمیمگیری یک مرحلهای در مورد چهره یا غیرچهره بودن تصویر، از یک درخت تصمیم استفاده میشود. این درخت تصمیم یک درخت یکطرفه مانند شکل ۳‑۷ میباشد و از چندین طبقهبندیکننده قوی تشکیل شده است.
مرحله ۲
مرحله ۳
مرحله n
شروع
مرحله ۱
عدم پذیرش
عدم پذیرش
عدم پذیرش
عدم پذیرش
پذیرش
شکل ۳‑۷: درخت تصمیم آبشاری برای آشکارسازی چهره
در این درخت، در هر مرحله (گره) یک طبقهبندیکننده قوی وجود دارد که با استفاده از تعداد اندکی ویژگی، تعدادی از تصاویر غیرچهره رد میشود و سایر تصاویر غیرچهره و تقریبا تمام تصاویر چهره به مرحله بعد راه مییابد. هرچند در هر گره تمام تصاویر غیرچهره رد نمیشود، اما در مراحل (گرههای) بعد، سایر تصاویر غیرچهره رد خواهند شد. در مراحل ابتدایی، با تعداد ویژگیهای کمتری میتوان میان تصویر چهره و بخش عمدهای از تصاویر غیرچهره تمایز قائل شد، اما با حرکت به سمت مراحل بالاتر، شباهت بین ویژگیهای استخراج شده تصاویر چهره و غیرچهره بیشتر میشود، به نحوی که ممکن است تعدادی از تصاویر چهره نیز به عنوان غیرچهره رد شوند. اما در مجموع، دقت و سرعت آشکارسازی چهره با استفاده از درخت تصمیم بیشتر از حالتی میباشد که تنها از یک طبقهبندیکننده قوی با تعداد ویژگی زیاد استفاده شود. پس از تشکیل طبقهبندیکننده نهایی، انتظار داریم تقریبا تمام تصاویر غیرچهره، در یکی از گرههای درخت تصمیم رد شوند و تقریبا تمام تصاویر چهره توسط هیچ گرهای حذف نگردند. هرچند در نهایت معمولا تعدادی تصویر چهره به اشتباه رد شده و تعدادی تصویر غیرچهره نیز به اشتباه به عنوان چهره آشکارسازی خواهند شد. شکل ۳‑۸ الگوریتم نحوه تشکیل یک درخت تصمیم آبشاری را نشان میدهد.
۱- مقادیر f (مقدار بیشینه FPR هر لایه)، d (مقدار کمینه TPR هر لایه) و Ftarget (حداکثر FPR درخت) توسط کاربر تعیین میگردد.
۲- P مجموعه نمونههای مثبت (چهره) و N مجموعه نمونههای منفی (غیرچهره) است.
۳- F0 = ۱ ، D0 = ۱ و i = 0 (Fi و Di به ترتیب مقدار FPR و TPR طبقهبندیکننده چند لایه از لایه اول تا لایه i است).
۴- تا زمانی که Fi > Ftarget میباشد، دستورات زیر انجام شود:
۴-۱- i = i + 1 ، ni = ۰ و Fi = Fi-1.
۴-۲- تا زمانی که Fi > f × Fi-1 است، دستورات زیر را انجام شود:
۴-۲-۱- ni = ni + ۱.
۴-۲-۲- با استفاده از مجموعههای P و N یک طبقهبندیکننده قوی شامل ni ویژگی آموزش داده شود.
۴-۲-۳- با استفاده از مجموعه آزمایشی، مقدار Fi و Di طبقهبندیکننده چند لایه کنونی محاسبه شود.
۴-۲-۴- مقدار حدآستانه طبقهبندیکننده قوی لایه i، تا زمانی که مقدار Di بیشتر از d × Di-1 شود، کاهش یابد. کاهش مقدار حد آستانه باعث افزایش Fi نیز میشود.
۴-۴- اگر Fi > Ftarget است، طبقهبندیکننده چند لایه فعلی (شامل i لایه) با مجموعه N مورد ارزیابی قرار گیرد، سپس تمام عناصر N به جز عناصری که به اشتباه جزو تصاویر مثبت (چهره) آشکارسازی شدهاند، پاک شود.
شکل ۳‑۸: الگوریتم تشکیل یک درخت تصمیم آبشاری بر اساس چند طبقهبندیکننده قوی [۳۳]
برای کاهش نرخ آشکارسازی اشتباه الگوریتم آشکارسازی چهره معمولا تعداد تصاویر غیرچهره بیشتر از تصاویر چهره است (چند یا چند ده برابر). آموزش یکباره سیستم با تمام دادههای آموزشی نیاز به حافظه بسیار زیاد و زمان زیاد دارد. به همین دلیل معمولا در آموزش درخت تصمیم، در مرحله ساخت هریک از گرهها، از تمام تصاویر چهره و تعدادی از تصاویر غیرچهره استفاده میشود. معمولا تعداد تصاویر غیرچهره که برای ساخت یک گره از درخت تصمیم استفاده میشود، برابر با تعداد تصاویر چهره است. سایر تصاویر غیرچهره برای تشکیل گرههای بعدی درخت مورد استفاده قرار خواهد گرفت. پس از ساخت هر گره، تصاویر غیرچهرهای که توسط آن گره به اشتباه چهره شناخته میشوند، به همراه تعداد دیگری از تصاویر غیرچهره جدید، به عنوان بخشی از تصاویر غیرچهره آموزشی گره بعد استفاده خواهد شد.
ردی
برای دانلود متن کامل پایان نامه به سایت azarim.ir مراجعه نمایید. |
ابی چهره
همان گونه که قبلا توضیح داده شد، دو مرحله اصلی در ردیابی عبارتند از: تخمین حرکت و تطابق. برای مرحله تخمین حرکت از روش پنجره جستجو و برای مرحله تطابق از محاسبه ضریب همبستگی و مجموع قدرمطلق تفاضل (SAD) استفاده شده است.
پنجره جستجو
جستجو در پنجره جستجو به چندین روش مختلف قابل اجرا است. از جمله مهمترین روشهای جستجو میتوان به جستجوی کامل[۱۱۵]، جستجوی لگاریتمی دوبعدی[۱۱۶] و جستجوی چند مرحلهای[۱۱۷] اشاره کرد. براساس نتایج ارائه شده در [۵۵]، بهترین دقت مربوط به روش جستجوی کامل است، هرچند این روش بیشترین پیچیدگی محاسباتی را دارد. در این نتایج روش جستجوی چند مرحلهای از لحاظ حجم محاسبات و دقت جستجو مناسبترین روش جستجو گزارش شده است. در آزمایشات انجام شده از دو روش جستجوی کامل و جستجوی چند مرحلهای استفاده شده است.
جستجوی کامل
در روش جستجوی کامل، از تمام نقاط پنجره جستجو برای محاسبه میزان انطباق قالب شی و تصویر استفاده میشود. اگر اندازه پنجره جستجو M×N باشد، تعداد نقاط جستجو برابر M×N نقطه خواهد بود. به دلیل اینکه تمام نقاط پنجره مورد جستجو قرار میگیرد، بهترین نقطهای که بیشترین تطابق را دارد به عنوان مکان شی تشخیص داده خواهد شد. اما حجم محاسبات این روش بسیار زیاد است. یکی از راهکارهای کاهش حجم محاسبات در روش جستجوی کامل، استفاده از گامهای یکسان بزرگتر از یک برای جستجو در پنجره میباشد. به عنوان مثال به جای محاسبه میزان انطباق در تکتک پیکسلها (تمام ردیفها و ستونهای پنجره)، محاسبه میزان انطباق فقط در پیکسلهایی انجام شود که در ردیف و ستون زوج قرار دارند. به این ترتیب تعداد نقاط مورد جستجو به حدود یک چهارم کاهش خواهد یافت.
جستجوی چند مرحلهای