
info@juzhikan.asia
成都工业学院,四川省成都市,611730;
摘要:随着生产系统日益复杂化、任务调度需求动态变化,传统启发式与规则驱动的调度方法在多目标、多约束环境下表现出明显局限性。强化学习作为一种自适应、试错驱动的智能算法,为解决调度系统中的不确定性与实时优化问题提供了新的路径。本文围绕智能制造与大规模资源配置场景,构建基于强化学习的调度系统架构,通过状态空间建模、奖励函数设计与策略学习过程优化,实现对任务–资源匹配的动态决策与在线优化。系统采用模块化设计,融合神经网络与深度强化学习算法,在多个仿真与实际调度场景中进行验证,展现出较强的收敛性能与应用适应性。研究结果表明,该系统在提升资源利用效率、降低平均任务完成时间方面具有明显优势,为调度问题的智能化解决提供了可行思路与实现范式。
关键词:强化学习;调度优化;状态空间;奖励函数;系统架构
参考文献
[1]周华丽,邵金峰.强化学习算法在图书馆智能排架与借阅调度中的应用[J].电脑知识与技术,2025,21(13):61-63.
[2]曹小雄,廖伟文,李卓君.基于深度强化学习模型的纯电动牵引车智能充电调度系统[J].港口装卸,2025,(01):24-28.
[3]杨嘉.基于强化学习的边缘计算智能资源优化调度研究[J].信息与电脑,2025,37(01):1-3.
[4]张君,林琳,郭芮,等.基于改进深度强化学习的电网电力智能调度分析模型研究[J].自动化技术与应用,2025,44(07):139-142+177.
[5]陈宁,李法社,王霜,等.基于深度强化学习算法的分布式光伏-EV互补系统智能调度[J].高电压技术,2025,51(03):1454-1463.