طراحی سیستم نظارت چهره راننده جهت تشخیص خستگی و عدم تمرکز حواس- …

 
که:
شکل ‏۳‑۶: الگوریتم تشکیل یک طبقه‏بندی‏کننده قوی بر اساس چند ویژگی [۳۳]
درخت تصمیم آبشاری تقویت‏شده
طبقه‏بندی‏کننده نهایی برای آشکارسازی چهره یک درخت تصمیم شامل چندین طبقه‏بندی‏کننده قوی است که هر یک از این طبقه‏بندی‏کننده‏ها به عنوان یک گره از درخت تصمیم می‏باشند. علت استفاده از درخت تصمیم با چندین طبقه‏بندی‏کننده قوی، افزایش سرعت پردازش الگوریتم است. برای آموزش و ساخت یک طبقه‏بندی‏کننده قوی که دقت بسیار خوبی در آشکارسازی چهره داشته باشد، باید از تعداد زیادی ویژگی استفاده شود. برای تشخیص چهره یا غیرچهره بودن تصویر با استفاده از این طبقه‏بندی‏کننده قوی، باید تعداد زیادی ویژگی در یک مرحله از تصویر استخراج شده و توسط طبقه‏بندی‏کننده قوی مورد بررسی قرار گیرد؛ که این عملیات باعث کاهش سرعت سیستم می‏شود. در حالی‏که بسیاری از تصاویر غیرچهره با تعداد بسیار کمی از ویژگی‏های استخراج شده، از تصاویر چهره قابل تمایز هستند. بنابراین به جای تصمیم‏گیری یک مرحله‏ای در مورد چهره یا غیرچهره بودن تصویر، از یک درخت تصمیم استفاده می‏شود. این درخت تصمیم یک درخت یک‏طرفه مانند شکل ‏۳‑۷ می‏باشد و از چندین طبقه‏بندی‏کننده قوی تشکیل شده است.
مرحله ۲
مرحله ۳
مرحله n
شروع
مرحله ۱
عدم پذیرش
عدم پذیرش
عدم پذیرش
عدم پذیرش
پذیرش
شکل ‏۳‑۷: درخت تصمیم آبشاری برای آشکارسازی چهره
در این درخت، در هر مرحله (گره) یک طبقه‏بندی‏کننده قوی وجود دارد که با استفاده از تعداد اندکی ویژگی، تعدادی از تصاویر غیرچهره رد می‏شود و سایر تصاویر غیرچهره و تقریبا تمام تصاویر چهره به مرحله بعد راه می‏یابد. هرچند در هر گره تمام تصاویر غیرچهره رد نمی‏شود، اما در مراحل (گره‏های) بعد، سایر تصاویر غیرچهره رد خواهند شد. در مراحل ابتدایی، با تعداد ویژگی‏های کمتری می‏توان میان تصویر چهره و بخش عمده‏ای از تصاویر غیرچهره تمایز قائل شد، اما با حرکت به سمت مراحل بالاتر، شباهت بین ویژگی‏های استخراج شده تصاویر چهره و غیرچهره بیشتر می‏شود، به نحوی که ممکن است تعدادی از تصاویر چهره نیز به عنوان غیرچهره رد شوند. اما در مجموع، دقت و سرعت آشکارسازی چهره با استفاده از درخت تصمیم بیشتر از حالتی می‏باشد که تنها از یک طبقه‏بندی‏کننده قوی با تعداد ویژگی زیاد استفاده شود. پس از تشکیل طبقه‏بندی‏کننده نهایی، انتظار داریم تقریبا تمام تصاویر غیرچهره، در یکی از گره‏های درخت تصمیم رد شوند و تقریبا تمام تصاویر چهره توسط هیچ گره‏ای حذف نگردند. هرچند در نهایت معمولا تعدادی تصویر چهره به اشتباه رد شده و تعدادی تصویر غیرچهره نیز به اشتباه به عنوان چهره آشکارسازی خواهند شد. شکل ‏۳‑۸ الگوریتم نحوه تشکیل یک درخت تصمیم آبشاری را نشان می‏دهد.
۱- مقادیر f (مقدار بیشینه FPR هر لایه)، d (مقدار کمینه TPR هر لایه) و Ftarget (حداکثر FPR درخت) توسط کاربر تعیین می‏گردد.
۲- P مجموعه نمونه‏های مثبت (چهره) و N مجموعه نمونه‏های منفی (غیرچهره) است.
۳- F0 = ۱ ، D0 = ۱ و i = 0 (Fi و Di به ترتیب مقدار FPR و TPR طبقه‏بندی‏کننده چند لایه از لایه اول تا لایه i است).
۴- تا زمانی که Fi > Ftarget می‏باشد، دستورات زیر انجام شود:
۴-۱- i = i + 1 ، ni = ۰ و Fi = Fi-1.
۴-۲- تا زمانی که Fi > f × Fi-1 است، دستورات زیر را انجام شود:
۴-۲-۱- ni = ni + ۱.
۴-۲-۲- با استفاده از مجموعه‏های P و N یک طبقه‏بندی‏کننده قوی شامل ni ویژگی آموزش داده شود.
۴-۲-۳- با استفاده از مجموعه آزمایشی، مقدار Fi و Di طبقه‏بندی‏کننده چند لایه کنونی محاسبه شود.
۴-۲-۴- مقدار حدآستانه طبقه‏بندی‏کننده قوی لایه i، تا زمانی که مقدار Di بیشتر از d × Di-1 شود، کاهش یابد. کاهش مقدار حد آستانه باعث افزایش Fi نیز می‏شود.
۴-۴- اگر Fi > Ftarget است، طبقه‏بندی‏کننده چند لایه فعلی (شامل i لایه) با مجموعه N مورد ارزیابی قرار گیرد، سپس تمام عناصر N به جز عناصری که به اشتباه جزو تصاویر مثبت (چهره) آشکارسازی شده‏اند، پاک شود.
شکل ‏۳‑۸: الگوریتم تشکیل یک درخت تصمیم آبشاری بر اساس چند طبقه‏بندی‏کننده قوی [۳۳]
برای کاهش نرخ آشکارسازی اشتباه الگوریتم آشکارسازی چهره معمولا تعداد تصاویر غیرچهره بیشتر از تصاویر چهره است (چند یا چند ده برابر). آموزش یک‏باره سیستم با تمام داده‏های آموزشی نیاز به حافظه بسیار زیاد و زمان زیاد دارد. به همین دلیل معمولا در آموزش درخت تصمیم، در مرحله ساخت هریک از گره‏ها، از تمام تصاویر چهره و تعدادی از تصاویر غیرچهره استفاده می‏شود. معمولا تعداد تصاویر غیرچهره که برای ساخت یک گره از درخت تصمیم استفاده می‏شود، برابر با تعداد تصاویر چهره است. سایر تصاویر غیرچهره برای تشکیل گره‏های بعدی درخت مورد استفاده قرار خواهد گرفت. پس از ساخت هر گره، تصاویر غیرچهره‏ای که توسط آن گره به اشتباه چهره شناخته می‏شوند، به همراه تعداد دیگری از تصاویر غیرچهره جدید، به عنوان بخشی از تصاویر غیرچهره آموزشی گره بعد استفاده خواهد شد.
ردی

برای دانلود متن کامل پایان نامه به سایت azarim.ir مراجعه نمایید.

ابی چهره
همان گونه که قبلا توضیح داده شد، دو مرحله اصلی در ردیابی عبارتند از: تخمین حرکت و تطابق. برای مرحله تخمین حرکت از روش پنجره جستجو و برای مرحله تطابق از محاسبه ضریب همبستگی و مجموع قدرمطلق تفاضل (SAD) استفاده شده است.
پنجره جستجو
جستجو در پنجره جستجو به چندین روش مختلف قابل اجرا است. از جمله مهمترین روش‏های جستجو می‏توان به جستجوی کامل[۱۱۵]، جستجوی لگاریتمی دوبعدی[۱۱۶] و جستجوی چند مرحله‏ای[۱۱۷] اشاره کرد. براساس نتایج ارائه شده در [۵۵]، بهترین دقت مربوط به روش جستجوی کامل است، هرچند این روش بیشترین پیچیدگی محاسباتی را دارد. در این نتایج روش جستجوی چند مرحله‏ای از لحاظ حجم محاسبات و دقت جستجو مناسب‏ترین روش جستجو گزارش شده است. در آزمایشات انجام شده از دو روش جستجوی کامل و جستجوی چند مرحله‏ای استفاده شده است.
جستجوی کامل
در روش جستجوی کامل، از تمام نقاط پنجره جستجو برای محاسبه میزان انطباق قالب شی و تصویر استفاده می‏شود. اگر اندازه پنجره جستجو M×N باشد، تعداد نقاط جستجو برابر M×N نقطه خواهد بود. به دلیل این‏که تمام نقاط پنجره مورد جستجو قرار می‏گیرد، بهترین نقطه‏ای که بیشترین تطابق را دارد به عنوان مکان شی تشخیص داده خواهد شد. اما حجم محاسبات این روش بسیار زیاد است. یکی از راهکارهای کاهش حجم محاسبات در روش جستجوی کامل، استفاده از گام‏های یکسان بزرگتر از یک برای جستجو در پنجره می‏باشد. به عنوان مثال به جای محاسبه میزان انطباق در تک‏تک پیکسل‏ها (تمام ردیف‏ها و ستون‏های پنجره)، محاسبه میزان انطباق فقط در پیکسل‏هایی انجام شود که در ردیف و ستون زوج قرار دارند. به این ترتیب تعداد نقاط مورد جستجو به حدود یک چهارم کاهش خواهد یافت.
جستجوی چند مرحله‏ای