勇敢 RL 炼丹师,不怕困难。
加油加油。
(说起来明明昨天有段时间 跑的效果还可以。要不再把模型改回来吧?)
已经改回来了,但是魔改 normal 分布 std = 0。
……!!这是,收敛了嘛!
NaN说明除0了,改一下权重初始化,先跑几个epoch看看
发现 nan 可能跟 exp 有关。 RuntimeError: Function ‘ExpBackward0’ returned nan values in its 0th output.
线上在线自习室晚自习。番茄工作法、四象限、打卡、作业清单、作业辅导、作业交流、作业跟踪、作业计划、个人宣传相关内容
已经改回来了,但是魔改 normal 分布 std = 0。