我突然深切地怀疑,我们 DC cooling 的技术路线走不通。如果总功耗 = 常数 × 制冷量 + 常数,冷量要抵消热量 相当于是固定的,那么优化 supply 温度好像没什么意义,因为冷量固定 => return - supply 固定。
感觉应该是,把冷风更好地利用起来,避免出现局部热点 另一边反而过冷,这样的情况吧。
若 PPO 都不 work,那 DDPG 是更不可能 work 的,整个毕设技术路线就走不通。
(虽然 GNN 项目 和 托福调研之类的不会受影响)
所以目前的任务就是把 PPO train 出来。可能是 reward 设置有问题。要不然干脆 supply 越高越好。
我突然深切地怀疑,我们 DC cooling 的技术路线走不通。如果总功耗 = 常数 × 制冷量 + 常数,冷量要抵消热量 相当于是固定的,那么优化 supply 温度好像没什么意义,因为冷量固定 => return - supply 固定。
感觉应该是,把冷风更好地利用起来,避免出现局部热点 另一边反而过冷,这样的情况吧。
啊…… 今天晚上光看托福了… 还没 check 变频空调 或者 修改其他 reward 的事。
加油啊,正在追寻 dolce 的我。加油啊。
看看别人的 reward 怎么设置的。