X
تبلیغات
رایتل

ملکرد بهینه چراغ کنترلی موجب بهبود جریان ترافیک و جلوگیری از ازدحام در تقاطعها میشود،کنترل چراغ ترافیکی مسئله پیچیدهای می‌باشد از این رو الگوریتم های هوشمند متنوعی بر اساس منطق فازی، الگوری‌های تکاملی، یادگیری تقویتی و راه‌حلهای مبتنی بر شبکههای عصبی پیشنهاد گشته است. در ادامه روشهای مذکور با جزییات بیشتر بررسی می‌گردد.

  

 -1 یادگیری تقویتی در یادگیری تقویتی عامل با تعامل با محیط سعی در انتخاب سیاست بهینه در حالت فعلی برای انتقال به حالت ثانویه و نهایتا رسیدن به یک هدف مشخص را دارد. در حیطه مهندسی ترافیک کنترلکننده مترادف با عامل و محیط همان پیرامون کنترل کننده، جاده ها و ترافیک خودروها میباشد. در واقع کنترلکننده بر اساس سیاست تعیین‌شده تصمیم می‌گیرد و عمل می‌نماید که در این جا عمل مورد نظر تغییر وضعیت چراغهای راهنمایی است. این روش بر اساس یادگیری مبتنی بر سعی و خطا استوار است و عامل با گذشت زمان سیاست بهینه را اتخاذ می‌نماید. به این ترتیب که عامل و محیط در گامهای زمانیt=0,1,2,.. با هم در تعامل هستند در هرگام عامل از وضعیت فعلی ، S فظای حالت ممکن محیط(در بحث ما وضعیت ترافیک مدنظر است) عمل را انجام می‌دهد، نیز مجموعه اعمال قابل انجام در وضعیت می‌باشد. سپس عامل به موقعیت انتقال می یابد و پاداش را دریافت می‌نماید. عامل با توجه به اطلاعات هر حالت(s) مانند انتقال وضعیت‌های ممکن، پاداش و اعمال قابل انجام سیاست خود را در هر گام بهینه می نماید. به عنوان مثال نشان می دهد که عامل در موقعیتs به احتمال p عمل a را انجام می دهد]22[. شکل ‏2 13 دیاگرام تعامل محیط و عامل در ]20[ و ]23[ سیستم‌های چندعامله برای مدیریت چهارراه پیشنهاد شده‌است. در]20[هریک از کنترل کننده های مستقر در چهارراه به عنوان یک عامل در نظر گرفته شده و زمانبندی چراغ‌ها در قالب چند-چهارراهی صورت می‌پذیرد. ]23[ نیز خودروها و چهارراه را در قالب عامل معرفی می کند که با بهره‌گیری از تجهیزات ارتباطی اقدام به ارسال اطلاعات مفید به سایر عامل‌ها می‌نمایند، حوزه زمان‌بندی در این تحقیق به صورت تک-چهارارهی می‌باشد. در ]24[ و ]25[ راه کارهایی بر اساس Q-learning ارائه شده‌است. در این مقالات فضای حالات ترکیب طول‌های مختلف صف های منتهی به چهارراه‌ها در چهار جهت در نظر گرفته شده است. همچنین اعمالی که عامل انجام میدهد متناظر با توسعه یک فاز و یا تغییر آن است. پاداش‌ نیز با در نظر داشتن کاهش میانگین زمان انتظار خودروها به عامل اهدا می گردد. 2-7-3-2 کنترل فازی منطق فازی یک ابزار قدرتمند برای حل مسائل غیرقطعی و غیرخطی می‌باشد که سعی در شبیه سازی منطق انسانی دارد. همان طور که می‌دانیم یک پلیس راهنمایی و رانندگی بر اساس دانش کیفی و فازی اقدام به استدلال و تصمیم‌گیری می‌نماید]26[.ﻳﻚ ﻛﻨﺘﺮﻝ ﻛﻨﻨﺪﻩ ﻓﺎﺯﻱ ﺍﺯ ﭼﻬﺎﺭ ﺑﺨﺶ ﺍﺻﻠﻲ ﺗﺸﻜﻴﻞ ﺷﺪﻩ ﺍﺳﺖ. ﻓﺎﺯﻱ ﻛﻨﻨﺪﻩ، ﭘﺎﻳﮕـﺎﻩ ﻗﻮﺍﻋـﺪ، موتر استنتاج و ﻏﻴﺮ ﻓﺎﺯﻱ ﻛﻨﻨﺪﻩ. دیاگرم کلی یک کنترل‌کننده فازی در شکل (4) نمایش داده شده‌است. شکل ‏2 14 دیاگرام کنترل کننده فازی ﺍﻭﻟﻴﻦ ﺑﻠﻮﻙ ﺩﺍﺧﻞ ﻛﻨﺘﺮﻝ ﻛﻨﻨﺪﻩ، ﻓﺎﺯﻱ ﻛﻨﻨﺪﻩ ﻣﻲﺑﺎﺷﺪ، ﻛﻪ ﺩﺭ ﺁﻥ ﺩﺭﺟﻪ ﺗﻌﻠﻖ ﻣﻘـﺎﺩﻳﺮ ﻭﺭﻭﺩﻱ ﺑـﻪ ﺗـﺎﺑﻊﺗﻌﻠﻘﻬﺎﯼ ﻣﺨﺘﻠﻒ ﻣﺤﺎﺳﺒﻪ ﻣﻲﺷﻮﺩ. به عنوان مثال در شکل() درجه عضویت متغیرX که مقداری مابین 0 و 1 است را ملاحظه می‌نمایید.قسمت دوم پایگاه قوانین است،ﻫﺮ ﻛﻨﺘﺮﻝ ﻛﻨﻨﺪﻩ ﻓﺎﺯﻱ ﺍﺯ ﺗﻌﺪﺍﺩﻱ " ﺍﮔﺮـ ﺁﻧﮕﺎﻩ" ﺑﻪ ﻋﻨﻮﺍﻥ ﭘﺎﻳﮕﺎﻩ ﻗﻮﺍﻋﺪ ﺍﺳﺘﻔﺎﺩﻩ ﻣﻲﻛﻨﺪ. به عنوان مثال قوانین می تواند به فرمت زیر باشد : If X=small then Y=good; ﺑﻪ ﺩﻟﻴﻞ ﺍﻳﻨﻜﻪ ﻫﺮ ﭘﺎﻳﮕﺎﻩ ﻗﻮﺍﻋﺪ ﻓﺎﺯﻱ ﺩﺭ ﻋﻤﻞ ﺷﺎﻣﻞ ﺑﻴﺶ ﺍﺯ ﻳﻚ ﻗﺎﻋﺪﻩ ﻣﻲﺷﻮﺩ، ﺳﺌﻮﺍﻝ ﺍﺳﺎﺳﻲ ﺍﻳـﻦﺍﺳﺖ ﻛﻪ ﭼﮕﻮﻧـﻪ ﻣـﻲﺗـﻮﺍﻥ ﺍﺯ ﺭﻭﻱ ﻳـﻚ ﻣﺠﻤﻮﻋـﻪ ﺍﺯ ﻗﻮﺍﻋـﺪ ﻧﺘﻴﺠـﻪﮔﻴـﺮﻱ ﻛـﺮﺩ. در واقع انتخاب و تعیین نتیجه از مجموعه قوانین برقرار حاصل از ورودی ها به عهده موتور استنتاج است. ﺩﻭ ﺭﻭﺵ ﺑـﺮﺍﻱﻧﺘﻴﺠﻪﮔﻴﺮﻱ ﻭﺟﻮﺩ ﺩﺍﺭﺩ،ﺍﺳﺘﻨﺘﺎﺝ ﻣﺒﺘﻨﻲ ﺑﺮ ﺗﺮﮐﻴﺐ ﻗﻮﺍﻋﺪ ﻭ ﺍﺳﺘﻨﺘﺎﺝ ﻣﺒﺘﻨﯽ ﺑﺮﻗﻮﺍﻋﺪ ﺟﺪﺍﮔﺎﻧﻪ برای مطالعه بیشتر به[55] مراجعه کنید. نهایتا ﻣﺠﻤﻮﻋﻪ ﻓﺎﺯﻱ ﻧﺘﻴﺠﻪ ﺍﺳﺘﻨﺘﺎﺝ ﺑﺎﻳﺪ ﺗﺒﺪﻳﻞ ﺑﻪ ﻳﻚ ﻋﺪﺩ ﻏﻴﺮ ﻓﺎﺯﻱ ﺷﻮﺩ ﺗﺎ ﺑﺘﻮﺍﻥ ﺧﺮﻭﺟﻲ ﻣﺘﻨﺎﺳﺐ ﺑﺎ ﺁﻥ ﺭﺍ ﺑﻪ ﻋﻨﻮﺍﻥ ﺳﻴﮕﻨﺎﻝ ﻛﻨﺘﺮﻝ ﺑﻪ ﻓﺮﺁﻳﻨﺪ ﺍﻋﻤﺎﻝ ﻛﺮﺩ. ﺍﻳﻦ ﻋﻤﻞ ﺭﺍ ﻏﻴﺮﻓﺎﺯﻱ ﺳﺎﺯﻱ ﻣﻲ ﻧﺎﻣﻨﺪ. فرایند تصمیم‌گیری و استدلال در چنین سیستمی به این‌ترتیب است، کنترل‌کننده برای هر خط چهارراه تعداد خودروهای ورودی را با مفهایم فازی مانند کم، متوسط، زیاد و... ثبت می‌کند سپس با استفاده از این اطلاعات کیفی تصمیم به تغییر فاز و یا توسعه چراغ سبز می‌گیرد. لی و همکاران]27[ طی یک تحقیق سیستمی مبتنی بر منطق فازی جهت کنترل جریان ترافیک مجموعه‌ای از چهارراه ها ارائه نموده‌اند، در این تحقیق کنترل‌کنندهها با اطلاعات دریافتی از تقاطع‌های بالا و پایین دست چراغ‌های راهنمایی را برای ایجاد موج سبز زمان‌بندی می‌نمایند. در]28[کنترل‌کننده فازی دو مرحله‌ای پیشنهاد گشته است که با توجه به اطلاعات دریافتی ازloop detector های تعبیه شده در راه‌های منتهی به تقاطع حجم و طول صف‌ها را به صورت بلادرنگ تخمین می‌زند و به صورت فازی تصمیمگیری میکند . کارهای ]29[،]30[، 32[و ]31[ کنترل‌کننده‌هایی برای زمانبندی تک-چهارراهی بر اساس منطق فازی ارائه کرده‌اند که با بهره‌گیری از حس‌گرهای نصب‌شده در هر مسیر منتهی به چهارراه وضعیت ترافیک را پیشبینی می‌نماید. از قابلیت‌های ویژه]29[و]32[ علاوه بر کنترل بهینه ترافیک در وضعیت عادی در حالات ویژه و استثنایی همچون رخ دادن تصادفات جاده‌ای و تغییر ناگهانی الگوی ترافیک عملکرد مناسبی دارند. ]33[ نیز بر اساس منطق فازی الگوریتمی برای زمانبندی شبکه ای از چهارراه‌ها(چند-چهارراهی) پیشنهاد نموده است، قوانین فازی مورد استفاده قرار گرفته در این اثر حول پارامترهای مانند طول سیکل ها و اختلاف فاز چهارراه‌ها می‌باشد. 2-7-3-3 شبکه های عصبی مصنوعی شبکه های عصبی مصنوعی(ANN)در بسیاری از شاخه‌های علمی برای حل مسایل پیچیده و غیرخطی کاربرد دارند. ANNها شامل شبکه‌ای از نرون‌ها هستند که غالبا به عنوان یک سیستم تطبیقی در جریان فاز آموزش با بهره گرفتن از اطلاعات دریافتی، پارامترهای تصمیم‌گیری را تنظیم می‌نمایند و نهایتا یک الگو دسته بندی و تصمیم‌گیری یا در برخی موارد راه‌حلی برای مسئله‌های پیچیده می‌یابند. نخستین کار برد شبکه های عصبی در کنترل سیستم ها توسط ویدرو در سال 1963 ارائه شده است. یک شبکة عصبی ساده خطی آموزش می بینید آنگونه که یک پاندول معکوس را کنترل نماید (پایدار سازد ).در خلال 1970 تا 1980 شبکه های عصبی به نام cmac توسط آلبوس (albus) برای کنترل بلادرنگ بازو های ربات معرفی و مورد استفاده قرار گرفت. در خلال 1980 تا 1990 ، بسیاری دیگر از شبکه های عصبی استاتیکی و دینامیکی و معماری ic آنها پیشنهاد و پیاده سازی شدند. شبکه های عصبی mlp با کاربرد های بسیار وسیع در مسائل فنی و مهندسی ارائه شدند. شکل ‏2 15دیاگرام کنترل کننده آموزنده بر اساس ANN ANN ها دارای معایبی نیز می باشند؛ دستورات مشخصی برای طراحی شبکه جهت یک کاربرد اختیاری وجود ندارد،دقت نتایج بستگی زیادی به اندازه مجموعه آموزش دارد، آموزش شبکه ممکن است مشکل یا حتی غیرممکن باشد،پیش‌بینی عملکرد آینده شبکه (عمومیت یافتن) آن به سادگی امکان‌پذیر نیست. در مقالات ]34],[35[ کنترلکننده‌های با قابلیت خود-اموزشی بر اساس ANN برای زمانبندی چراغ‌راهنما ارائه شده است، این سیستم‌ها از دو قسمت شبکه عصبی و واحد ارزیابی عملکرد متشکل شده‌اند. قسمت شبکه عصبی متناوبا در حال یادگیری می‌باشد و قسمت ارزیابی دایما عملکرد را بررسی می‌نماید زمانی که آموزش‌ها کامل شد ANN مسولیت سیگنالدهی چراغ را بر عهده می‌گیرد. برخی تحقیقات مانند]36[و]37[ از ترکیب شبکه نرون‌ها و کنترل فازی سیستم‌های متفاوتی را برای زمان‌بندی چراغ ترافیکی پیشنهاد نموده‌اند. در این تحقیقات بر اساس متدهای نرون-فازی برای پیش‌بینی طول صف و وضعیت ترافیک در سیکل بعدی روش‌هایی ارئه شده است. با توجه به نتایج بدست آمده طی این تحقیقات شبکهی نرون‌های فازی عملکرد بهتری از تکنیک‌های مجزای فازی یا ANN دارد. 2-7-3-4 الگوریتم‌های تکاملی ارائه زمان‌بندی بهینه‌ یکی از مسائل مهم در حوزه کنترل ترافیک می‌‌باشد. باتوجه به غیرخطی بودن این مسئله و پیچیدگی زمانی بالا برای مسائل بزرگ بدست‌آوردن بهینگی سراسری به عنوان یک چالش مطرح می‌گردد. از اینرو الگوریتم‌های تکاملی راهکاری برای مقابله با این چالش می‌باشد. در]38[ مسئله بهینه‌سازی مدل شده برای زمان‌بندی چراغ‌کنترلی با بهره‌گیری از الگوریتم ژنتیک حل شده‌است، در مسئله مذکور هدف یافتن بهینه‌ترین زمانبندی برای 4 تقاطع با اختصاص 9 متغییر تصمیم‌گیری می‌باشد. در این مدل 9 متغییر با 24 بیت کد شده است، نتایج بدست آمده حاکی از موفقیت الگوریتم پیشنهادی برای رسیدن به بهینگی سراسری است. دربرخی تحقیقات مانند]39[ یک روش کنترلی بر اساس الگوریتم ژنتیک بهبودیافته برای منطقه شهری ارائه شده است. این الگوریتم به صورت دوره‌ای در فاصله های 5 تا 30 دقیقه‌ای زمانبندی بهینه را تعیین می‌نماید و تا حد ممکن بهینه‌ترین طول سیکل و اختلاف فاز را برای چهارراه‌های مجاور مشخص می‌کند. چن کان]40[ مدلی را برای یافتن بهینه ترین زمانبندی ترافیک ارائه نموده است که تابع هدف آن را کمینه سازی زمان انتظار تمام خودروهای وارد شده به چهارراه در نظر گرفته‌است، همچنین جهت تخمین زمان انتظار هر خودرو از مدل میانگین تاخیر خودرو وبستر بهره جسته‌است]17[. در مدل پیشنهادی طول فازها به عنوان متغییر تصمیم‌گیری و همچنین کمینه و بیشینه طول چراغ سبز به عنوان محدودیتهای اصلی مسئله درنظر گرفته شده است. ]41[و]42[ برای حل مشکل گیرافتادن در بهینگی محلی راهکارهایی بر اساس بهینه سازی ازدحام ذرات(PSO) ارائه شده‌است. ماهیت این الگوریتم‌ها بر جستجوی اجتماعی و جمعی می‌باشد که از روی رفتار و حرکت جمعی پرندگان مدل شده‌است. شبیه سازی‌ها نشان داده که این دسته از روش‌ها سرعت همگرایی بالای دارند. نهایتا ]43[ از الگوریتم مورچگان بهبودیافته برای چیره‌گشتن بر این مسئله بهره گرفته‌است، به این ترتیب که فضای مسئله را که قاعدا بزرگ می‌باشد جهت کاهش پیچیدگی محاسبات به چند زیرناحیه تقسیم نموده است. بررسی نتایج حاکی از بهبود و کاهش یافتن سربار محاسباتی این روش میباشد، باتوجه به کاربرد موردنظر ما که مبنی بر دریافت اطلاعات بلادرنگ ترافیکی و اتخاذ تصمیم در سریع‌ترین زمان ممکن است مزیت قابل قبولی به شمار می‌رود.