PPO 目前没 train work-每日打卡-行恒

- 正在追寻dolce
- 8级
- 自律力99.38
- 希望顺利毕业的学生

#戒断# PPO 目前没 train work

若 PPO 都不 work，那 DDPG 是更不可能 work 的，整个毕设技术路线就走不通。

（虽然 GNN 项目和托福调研之类的不会受影响）

所以目前的任务就是把 PPO train 出来。可能是 reward 设置有问题。要不然干脆 supply 越高越好。

3
+8番茄
106只自习生围观
2023年3月9日 11:04打卡
1 年，4 月前有动静
引用
举报

分享

正在追寻dolce
1 年，4 月前
2023年3月9日 11:05
卡主

看看别人的 reward 怎么设置的。

正在追寻dolce
1 年，4 月前
2023年3月9日 15:08
卡主

我突然深切地怀疑，我们 DC cooling 的技术路线走不通。如果总功耗 = 常数 × 制冷量 + 常数，冷量要抵消热量相当于是固定的，那么优化 supply 温度好像没什么意义，因为冷量固定 => return - supply 固定。

感觉应该是，把冷风更好地利用起来，避免出现局部热点另一边反而过冷，这样的情况吧。

正在追寻dolce
1 年，4 月前
2023年3月9日 22:14
卡主

啊…… 今天晚上光看托福了… 还没 check 变频空调或者修改其他 reward 的事。

加油啊，正在追寻 dolce 的我。加油啊。

1
3条 1页

作者的近日打卡

呜呜呜 vpn 炸了 - 呜呜呜，fail to clash core，呜呜呜…… --- 今天继续加油【合十】...
1 年，4 月前发布

好文分享：意诚，接受，觉照，次第 - 文章链接：https://mp.weixin.qq.com/s/KmAGmoIdz26RcDCNUP...
1 年，4 月前发布

猜你喜欢

要做的事情好像好多，写文章，学习mendeley,zotero的使用，建服务器 - 要做的事情好像很多，写文章，学习，建服务器等等，但是如何下手去做呢？年末准备的好

zhangwei_7

不做procrastinator - 专注

今天先看Financial的东西 - 然后争取把Predictive Modeling的作业做完

兔不知道
♂ 36
自律力23.27
Dallas TX

pretrain - 1. 悬空可能会 violate。 , 2. 给定 pick 时不调用 pick

正在追寻dolce
8级
自律力99.38
希望顺利毕业的学生

creative work没法预测准时间的 - 数据分析是creative work, 只能一直做, 没法预测要完成的时间

yingjie
自律力11.14

今天应该能把 exploration 大致搞明白 - 目前的想法是，exploration + multi-fidelity，做 A

正在追寻dolce
8级
自律力99.38
希望顺利毕业的学生

上午我们先 check OS 吧 - 软设进度计划之类的，可以等到形策写。 , , 工作方面，今天中午下午还可以听

正在追寻dolce
8级
自律力99.38
希望顺利毕业的学生

大家都希望 continuous work - 待办： , 1. 把 auxil 训起来； , 2. 改改 reward，bas

正在追寻dolce
8级
自律力99.38
希望顺利毕业的学生

呜呜呜，看起来没 train 出来 - 可能要设计更精细的 curriculum。

正在追寻dolce
8级
自律力99.38
希望顺利毕业的学生

想试着用 ML 糊弄一下 room-level model - 找出几个能代表一片颜色的关键点，它们的温度压力 + 压力作为 state，再联合

正在追寻dolce
8级
自律力99.38
希望顺利毕业的学生

合作伙伴

京ICP备11011403号

导航

联系我们

线上在线自习室晚自习。番茄工作法、四象限、打卡、作业清单、作业辅导、作业交流、作业跟踪、作业计划、个人宣传相关内容

© 行恒 2013