به گزارش خودرونگاران به نقل از ایسنا، محققان بر این باورند که این الگوریتم و فناوری میتواند در خودروهای خودران، رباتیک و در سیستمهای جستوجوی تصویر و فیلم مورد استفاده قرار بگیرد.
این محققان مدلهای قدیمی نسخه رایانهای را با یادگیری عمیق ترکیب کردهاند تا دقت و سرعت الگوریتم را ارتقا بخشند.
هدف آنها ایجاد یک نسخه زمان واقعی بود که به سیستم اجازه شناسایی و دستهبندی اجسام و بویژه انسانها را در شرایط رانندگی عادی شهری میدهد. این امر به خودروهای خودران، رباتهای تحویلدهنده بار یا پهپادهای با ارتفاع پرواز پایین اجازه خواهد داد تا عابران پیاده و ازدحامها را شناسایی کرده و با آنها برخورد نکنند.
بیشتر سیستمهای شناسایی عابر پیاده، یک تصویر را به بخشهای کوچکتر تقسیم کرده که با یک برنامه گروهبندی برای تعیین حضور یک شکل انسانی پردازش میشوند. این کار میتواند برای مهندسان چالشبرانگیز باشد زیرا انسانها دارای اندازهها و شکلهای گوناگون هستند و فاصله باعث تغییر دورنما و اندازه اشیا میشود. در زمان استفاده فوری، این کار شامل پردازش میلیونها بخش در پنج الی 30 فریم در ثانیه است.
روش تشخیص آبشاری مورد استفاده در سیستم جدید همین عملکرد پایه را اعمال میکند اما این کار را بطور مرحلهای و نه یکجا انجام میدهد. این کار به الگوریتم اجازه میدهد تا به سرعت فریمهایی را که شباهتی به حضور یک شکل انسانی ندارند، کنار گذاشته و بر روی تصاویر محتملتر تمرکز کند.
مرحله اول بر روی آسمان و فضاهای خالی تمرکز دارد. مرحله دوم به طبقهبندی و کنار گذاشتن فریمهایی میپردازد که به شکل و رنگ انسان بوده اما عابر نیستند (مانند درختان، بوته و سایر خودروها). مرحله نهایی نیز با دقت و جزئیات بیشتر به طبقهبندی ادامه میدهد تا زمانی که تنها عابران پیاده باقی بمانند. اگرچه این محاسبات و پردازشهای نهایی بسیار سنگین هستند، اما تنها تعداد کمی از آنها مورد نیاز بوده و از این رو این فرآیند بسرعت انجام میشود.
بطور سنتی، سیستمهای شناسایی آبشاری از دستهبندی کنندههای سادهتر موسوم به " یادگیرندههای ضعیف" استفاده میکنند. در سیستم جدید، سیستمهای شناسایی مرحله بعد همزمان با اجرا به یادگیری میپردازند و در نتیجه، دستهبندی کنندهها پیچیدهتر و سریعتر میشوند. دستهبندی کنندهها با گذشته زمان در هر مرحله بیشتر تقویت میشوند و در هر محله تغییر میکنند. این مهمترین تفاوت میان االگوریتم جدید و سیستمهای رایج شناسایی عابر پیاده است.
الگوریتم این کار را با یادگیری اینکه کدام ترکیب از یادگیرندههای ضعیف توانسته بودند عابران را در یک فریم تشخیص دهند، انجام داده و با ارتقای فریمها، بر روی آنها بیشتر تاکید میکند و فرآیند شناسایی را سرعت میبخشد.