论文阅读

模仿学习与行为决策

2021_Guo_ImitationDRL —— 模仿学习与深度强化学习结合的调度方法。
2024_Kang_ImitationDRL —— 面向复杂决策任务的 imitation-RL 协同框架。

扩散模型与生成式调度

2024_Dong_Cleandiffuser —— 扩散模型在决策生成与约束控制中的应用探索。
2024_Du_AGOD_DiffusionRL —— 扩散生成与强化学习结合的资源调度方法。

在线优化、分层调度与鲁棒控制

2024_Han_4level —— 面向复杂系统调度的四层结构建模思路。
2024_Huang_OnlineAlgo_LyapunovADMM —— Lyapunov 与 ADMM 结合的在线优化调度框架。
2025_Fan_DROS_DRO —— 基于分布鲁棒优化的不确定环境调度方法。
2026_Niu_CATS_LyapunovRL —— 融合 Lyapunov 约束与强化学习的稳定调度策略。