论文阅读
模仿学习与行为决策
- 2021_Guo_ImitationDRL —— 模仿学习与深度强化学习结合的调度方法。
- 2024_Kang_ImitationDRL —— 面向复杂决策任务的 imitation-RL 协同框架。
扩散模型与生成式调度
- 2024_Dong_Cleandiffuser —— 扩散模型在决策生成与约束控制中的应用探索。
- 2024_Du_AGOD_DiffusionRL —— 扩散生成与强化学习结合的资源调度方法。
在线优化、分层调度与鲁棒控制
- 2024_Han_4level —— 面向复杂系统调度的四层结构建模思路。
- 2024_Huang_OnlineAlgo_LyapunovADMM —— Lyapunov 与 ADMM 结合的在线优化调度框架。
- 2025_Fan_DROS_DRO —— 基于分布鲁棒优化的不确定环境调度方法。
- 2026_Niu_CATS_LyapunovRL —— 融合 Lyapunov 约束与强化学习的稳定调度策略。