報告題目:基于多智能體顯式協調方法的智能交通信号控制
報告摘要:
交叉口交通信号控制(TSC)是減少城市道路擁堵的最有益方法之一,由于以下原因,這是一個具有挑戰性的問題:1)交通流量動态的複雜性,2)實時響應策略的必要性3)大規模城市範圍的協調難度。現有的強化學習方法可以學習将動态流量狀态映射到信号動作的策略,但缺乏對顯示協調的直觀表征。在線規劃方法可以對于實時流量以最佳響應方式進行重計算,但由于計算複雜性和缺乏全網協調,現有的在線規劃方法的可擴展性和效率有限。
在此背景下,我們提出了一種顯式多智能體協調 (MAC)方法來滿足自适應、實時和網絡範圍的TSC,并進一步研究了一種基于顯式表征來協調策略的強化學習方法。關于MAC,我們将TSC建模為分布式約束優化問題(DCOP),每個交叉口都被建模為一個單獨的智能體,并用相鄰路口之間的效用函數來建模協調影響。我們優化了現有的消息傳遞算法來實現城市網絡範圍的協調優化。關于RL方法,我們對鄰居路口對本地路口的決策影響進行了顯示的表征,通過信号以及出車流量預測兩種強監督任務來學習通信影響。兩種方法在現有的虛拟和真實數據上取得了不錯的實驗效果。
個人介紹:
喬天池,現在就讀研究生二年級,是王萬元老師的學生,研究方向為基于多智能體方法的智能信号控制。