一、选题依据及意义
自80年代交通信号灯使用到现在,一直是现代城市交通的重要组成部分,对疏导交通流量、提高道路通行能力,减少交通事故有明显效果。
但信号灯的变更周期相对固定,无法对不同的交通状况做相应调整,导致路口通行能力无法最大化,也是阻碍交通、造成道路拥堵的原因之一。因此,若能根据周边的交通流量和道路十字路口的交通特性,动态调节信号灯的变更周期,就可以提高交通通行能力。
为能够改善交通效率,已有多名学者提出能对交通灯进行时间设定的调度算法。但实际交通状况变化快、复杂性高,固定的调度算法往往不能很好的适应各种交通环境。因此,通过增强学习算法,令信号灯管理系统自行归纳出不同环境下的最优策略,即可解决上述问题。
二、研究目标与主要内容
研究目标
强化学习(RL)指的是一种机器学习方法,其中代理通过和环境交互,在下一个时间步骤中收到延迟奖励,以评估其先前的行为,从而学习到如何采取最优行为。它主要用于游戏(例如Atari,Mario),表现与人类相当,甚至超过人类。最近,随着算法的发展,神经网络的结合,它能够解决更复杂的任务,如钟摆问题。
在信号灯管理系统中,交通状况既为环境,调度信号灯是行为,交通状况的变化既为奖励。本文研究的目的,就是探讨增强学习算法在智能信号灯管理系统中的应用,设计出可以通过学习在各种交通环境下采取不同策略对交通所造成的影响,自行归纳出最优调度算法的信号灯管理系统。
主要内容
1)交通信号灯路口的定义及特征。
2)增强学习算法的说明
3)增强学习算法在智能信号灯管理系统中的应用
参考文献
著作:
[1] 张永灿,黄海平,曹雍,王汝传.基于无线传感网的智能交通灯自适应 算法[J].计算机技术与发展,2015(2);199-203.
[2] 李兆斌,徐昕,吴军. 增强学习算法的性能测试与对比分析[J]. 计算机应用研究,2010(10).
[3] 李慧,郭爱煌.交通信号的实时公平调度及其仿真[J].计算机应用,2012(4):1161-1164.
[4] 高巍巍.智能交通灯的调度算法研究[J].微型电脑应用,2017(4).
基于增强学习算法的智能信号灯管理系统设计由毕业论文网(www.huoyuandh.com)会员上传。