Distributionally robust optimization scheduling model for electric power and computing power coordination considering spatiotemporal response
论文笔记 - 分布式鲁棒优化调度模型:考虑时空响应的电算协同
这篇论文的核心目标,是把数据中心中的计算任务建模为一种可以进行时间平移与空间迁移的柔性负荷,并在风电、光伏、计算任务三类不确定性同时存在的情况下,构建一个数据驱动的两阶段分布鲁棒优化调度模型,用于实现电力系统与算力系统的协同调度。
基本信息
题目:Distributionally robust optimization scheduling model for electric power and computing power coordination considering spatiotemporal response
期刊:Applied Energy
年份:2025
作者:Wei Fan, Ying Fan, Pengju Liu, Yue Wang, Fan Tong, Bowen Yi, Xing Yao
核心关键词:电力-算力协同、时空响应、分布鲁棒优化(DRO)、Copula、WGAN-GP、C&CG
背景与问题
背景
论文指出,数字经济快速发展带来了持续增长的算力能耗,这一趋势正在改变电力负荷结构,并加剧供需失衡;与此同时,东部地区算力需求高而新能源资源相对不足,西部地区新能源丰富而算力需求相对较低,电力与算力在空间上呈现显著错配。
作者因此提出三个关键问题:
- “数据流”和“电力流”之间是什么关系;
- 算力资源对电力系统到底有多大的调节潜力;
- 在计算任务本身也存在随机性的情况下,如何进行稳健调度。
核心矛盾
这篇论文实际在解决一个典型的“源-荷-算协同”问题:
- 源侧:风光出力具有波动性和随机性;
- 荷侧:传统负荷可调能力有限;
- 算侧:数据中心负荷大,但其中一部分任务具有可延后、可迁移属性;
- 挑战:如何把这种“算力柔性”显式纳入电力系统调度框架。
论文的主要创新点
作者在论文中明确给出三项贡献,可概括为以下三点:
构建了考虑时空响应的电力-算力协同调度模型
该模型把数据中心纳入电力系统优化调度框架,并显式刻画了计算资源的时间响应与空间响应能力。
提出了更真实的不确定场景生成与改进 DRO 方法
作者采用 Copula + WGAN-GP 的混合场景生成方法来描述风光与计算任务的不确定性;同时引入加权 Composite Norm,改进离散场景下的分布鲁棒优化模型。
从多维指标评估了算力资源对电力系统的调节价值
作者设计了调节价值评估指标体系,并以山东-蒙西为经验案例分析算力对净负荷平滑、可再生能源消纳和供电压力缓解的作用。
论文整体技术路线
根据论文结构,其研究逻辑可以概括为:
- 建立数据中心能耗模型,描述“任务量 → CPU利用率 → 服务器功耗 → 数据中心总功耗”的映射;
- 构建计算任务的时空响应模型,将任务分为不可调、可时间平移、可空间迁移三类;
- 在电力系统与计算网络统一框架下建立协同优化调度模型;
- 对风电、光伏、计算任务的不确定性生成场景;
- 进一步构建两阶段 DRO 模型;
- 用 C&CG 算法求解;
- 通过仿真与实证案例验证模型效果。
论文方法
数据中心能耗建模
作者认为,相较于按机架功率粗略估算数据中心能耗,更有意义的方式是从计算任务规模出发计算能耗,因为这样更有利于建立“算力-电力”映射关系。论文采用如下建模链路:
- 数据中心总能耗与 PUE、IT设备能耗比例、服务器数量、单服务器功耗有关;
- 单服务器功耗由空闲功耗与峰值功耗之间按 CPU 利用率线性插值得到;
- CPU 利用率由单位时间任务数与服务器处理能力之比表示。
这说明论文不是把数据中心视为固定电负荷,而是试图建立一个任务驱动的功耗模型。
计算任务分类
论文依据数据时效性,把计算任务划分为:
- 热数据(hot data):实时性要求高,通常不可调;
- 温数据(warm data):可以迁移;
- 冷数据(cold data):既可迁移,也可延后执行。
进一步地,论文把计算任务抽象为三类:
- FCT:固定计算任务;
- TSCT:可时间平移任务;
- STCT:可空间迁移任务。
总任务量满足:
其含义是:某区域某时段最终需要处理的任务量,由三部分组成。
时间响应建模:任务如何“时间平移”
这是论文的重要建模点。
作者特别强调:计算任务不能像部分电负荷那样“提前消费”,只能向后推迟执行。
也就是说,时间响应是单向的、后移的。
论文对 TSCT 的建模思想是:
- 先设定总任务中有一部分属于可平移任务;
- 某时段的可平移任务可以转移到后续任一时段;
- 但任一时段转出的总量不能超过该时段初始可平移任务量;
- 最终各时段任务量通过“流入-流出平衡”来表示。
这其实是把“任务延后执行”形式化为一种类似需求响应的时间重分配机制,但与传统需求响应的差异在于它只能“后移”,不能“前移”。
空间响应建模:任务如何“跨区域迁移”
论文还建模了任务在不同区域数据中心之间的迁移能力。
作者的关键假设包括:
- 光纤传输损耗可以忽略;
- 空间迁移的时延在该建模尺度下可忽略;
- 各区域时钟同步;
- 某区域某时刻最终任务量由“迁入任务 - 迁出任务”共同决定。
因此,STCT 的本质是把任务从算力紧张、电力紧张的区域迁移到新能源充足、算力相对富余的区域处理。
这个空间模型更接近“广域算力重分布”,其目标不是通信优化本身,而是利用跨区域算力转移来实现电力供需再平衡与新能源消纳提升。
协同优化模型:目标函数和约束
目标函数
论文构建的是一个综合成本最小化模型,总成本包括:
- 火电燃料成本;
- 机组启停成本;
- 碳排放成本;
- 弃风弃光惩罚成本;
- 输电成本;
- 失负荷惩罚成本;
- 时间平移任务补偿成本;
- 空间迁移任务传输成本。
这不是结合“最小碳排”和“最低成本”模型的一个兼顾:
- 电力系统经济性,
- 电力系统安全性,
- 可再生能源消纳,
- 算力侧灵活调节代价
的综合调度模型。
主要约束
论文包含的核心约束包括:
- 电力平衡约束;
- 机组运行约束;
- 储能约束;
- 输电约束;
- CPU 利用率约束;
- 时间平移任务约束;
- 空间迁移任务约束。
论文把“电网、储能、输电、数据中心任务流”放在了一个统一框架里,这正是其“电力-算力协同”的核心。
不确定性处理:为什么要用 DRO
不确定来源
论文同时考虑三类不确定性:
- 风电出力不确定;
- 光伏出力不确定;
- 计算任务到达量不确定。
相比很多只关注风光波动的论文,这篇文章将“任务需求波动”也作为关键不确定性纳入模型,这是它很重要的一个优点。
场景生成方法
作者采用混合方法生成不确定场景:
风电与光伏:Copula
Copula 用于保留风光之间的相关性。这说明作者并不是简单独立抽样,而是考虑了不同新能源出力之间的统计依赖关系。
计算任务:WGAN-GP
WGAN-GP 用于生成更真实的计算任务场景。 其目的在于避免人为假定任务分布,而是利用数据驱动方式去学习历史任务样本分布。
作者想表达的是,**如果不确定场景本身生成得不真实,那么后面的优化再复杂也没有意义。**因此,场景生成是这篇论文很关键的一环。
为什么不是随机优化或鲁棒优化
论文对三类方法的态度很明确:
- SO(随机优化):偏经济,但依赖分布假设;
- RO(鲁棒优化):偏安全,但容易过于保守;
- DRO(分布鲁棒优化):在两者之间取平衡。
作者最终采用的是两阶段分布鲁棒优化模型。
改进 DRO 的关键点
这篇论文不是直接套用经典 DRO,而是做了改进。
经典问题
传统离散场景 DRO 中,在 Composite Norm 约束下,不同场景相对原始概率的偏离幅度往往被设定得一致。作者认为这不符合实际,因为:
- 原本概率高的场景,应允许更大的概率波动;
- 原本概率低的场景,其偏离空间应更小。
改进方式
作者引入了加权 Composite Norm,使不同场景的分布偏离空间按原始概率加权。
这样做提升了模型的:可操作性、灵活性以及与真实场景的一致性。
这个改动本质上是在说:“不是所有不确定场景都应该一视同仁地悲观对待。”
求解方法:C&CG 算法
论文使用 Column-and-Constraint Generation(C&CG) 算法求解两阶段 DRO 模型。
基本思路
- 主问题(MP)先给出一组决策;
- 子问题(SP)在 ambiguity set 中寻找最坏概率分布;
- 再将最坏场景或约束不断加入主问题;
- 迭代直到上下界收敛。
由于 DRO 本身是“决策 + 最坏分布”的双层嵌套问题,直接求解很困难。C&CG 的作用就是把这种复杂嵌套问题拆开迭代求解。
实验设计
仿真场景设置
论文先做两区域仿真:
- R1:东部区域,电力负荷和算力需求高,但新能源装机较低;
- R2:西部区域,新能源丰富,但算力需求和电力负荷较低。
仿真时间尺度为:
- 1 小时一个时间步长;
- 研究一个典型日。
数据中心参数包括:
- PUE = 2;
- 服务器 IT 能耗占比 80%;
- 每个区域 80 万台服务器;
- 每台服务器可处理 500 tasks/s;
- 空闲功耗 100W,峰值功耗 300W;
- 时间可平移任务比例与空间可迁移任务比例均为 20%。
评价指标
论文用于评估算力调节价值的指标包括弃风弃光量、失负荷量、净负荷标准差和运行成本。分别对应:
- 弃风弃光量:反映新能源消纳能力;
- 失负荷量:反映供电可靠性;
- 净负荷标准差:反映调度难度与负荷平滑程度;
- 运行成本:反映经济性。
场景对比设计
从结果描述可知,论文设计了以下几类场景:
- S1:资源不能进行空间最优分配;
- S2:加入输电能力;
- S3-S5:逐步考虑计算任务的时空调节能力;
- S6-S8:比较 SO、RO、DRO 等不确定优化方法。
主要实验结果
时空调节确实有效
论文显示,相较于 S1:
- S2 成本降低 1.38%;
- S3、S4、S5 在逐步考虑计算任务时空调节后,成本分别降低 1.441% / 1.598% / 1.661%。
说明两件事:
- 输电本身就能改善资源错配;
- 在输电基础上进一步引入算力的时间平移和空间迁移,可以继续降低系统成本。
算力时空调节能够平滑净负荷曲线
论文结论指出,计算任务的时空调节可以:
- 平滑净负荷曲线;
- 缓解高峰供电压力;
- 提升新能源消纳能力。
这说明数据中心不只是“耗电大户”,也可以被重新理解为一种柔性调节资源。
DRO 在经济性与稳健性之间更平衡
论文对 S6-S8 的评价是:
- S6:基于期望值,偏激进;
- S7:基于最坏情形,偏保守;
- S8:DRO 得到中间值,更合理。
这正是 DRO 的价值所在,既不盲目乐观,也不过度悲观。
样本越多,DRO 越不保守
作者指出:
- 历史样本少时,DRO 更接近鲁棒优化;
- 历史样本多时,DRO 更接近随机优化;
- 当样本数达到 400 时,保守性得到较好控制。
这说明该模型具有较好的“数据自适应性”,数据少时更谨慎,数据多时更敢于利用统计规律。
置信水平越高,决策越保守
论文进一步分析了置信水平对成本的影响:
- 当 1-norm 和 ∞-norm 的置信水平提高时,
- 不确定分布的允许偏离范围更大,
- 模型会考虑更差的情形,
- 因而运行成本上升、决策更保守。
这相当于给管理者一个“风险旋钮”:
- 风险厌恶更强 → 置信水平更高 → 成本更高但更安全;
- 风险容忍更强 → 置信水平更低 → 成本更低但更激进。
13. 实证案例:山东—蒙西
论文实证案例选择了:
- 山东(SD):电力需求高、算力需求高;
- 西部内蒙古(WIM):新能源资源和算力资源更丰富。
案例中关键参数包括:
- 山东 800 万台服务器;
- 蒙西 400 万台服务器;
- 每台服务器 500 tasks/s;
- 空闲功耗 100W,峰值功耗 300W。
作者指出,经验案例与仿真结果基本一致。
这个案例实际上在模拟“东部负荷中心 + 西部新能源基地”的典型中国场景,因此与“东数西算”“西电东送”等国家战略背景有较强契合性。
论文局限性
时间尺度较粗
论文采用的是小时级调度。
这更适合日内/日前优化,不直接适用于你们所关注的毫秒级响应装置场景。
任务粒度较粗
任务被抽象为数量流,没有进一步下钻到:
- task-level 依赖关系,
- DAG 结构,
- 数据本地性,
- 容器/虚机迁移开销,
- 训练/推理任务差异等更细粒度问题。
网络假设偏理想化
论文在空间迁移中基本忽略了传输损耗和时延,这对宏观规划研究可以接受,但对真实系统落地会偏理想。
更偏优化,不是在线控制
它本质上仍是优化调度模型,不是面向在线闭环执行的实时算法框架。
对当前研究/项目的启发
如果把这篇论文放到“电力指令驱动的计算负荷响应”这个场景下,它至少有四点启发:
可以借用任务分类思路
可将任务划分为:
- 不可调任务;
- 时间可移任务;
- 空间可移任务;
- 资源弹性可调任务。
这对构建“任务-功耗-电力响应”映射模型非常有帮助。
可以借用其 formulation 结构
论文已经给出了一个比较清晰的电力-算力协同建模框架,可用于你写:
- 问题定义;
- 系统模型;
- 变量与约束;
- 目标函数;
- 研究内容中的形式化描述。
它适合作为“优化基线”
后续若想引入强化学习、扩散模型、快慢路径协同调度,这篇论文可以作为一个非常合适的优化基线。
它支持“省域跨区域协同”叙事
论文中的“东部高需求-西部高新能源”逻辑,与当前省域/跨域算电协同项目背景高度契合。
该论文的本质贡献,是把数据中心中的可延后、可迁移任务建模为电力系统可调用的柔性负荷,并在风光与任务双重不确定下,用数据驱动的分布鲁棒优化方法实现了电力-算力跨区域协同调度。