#戒断# …为什么会 nan?

勇敢 RL 炼丹师,不怕困难。

加油加油。

(说起来明明昨天有段时间 跑的效果还可以。要不再把模型改回来吧?)

  • 4
  • +6番茄
  • 16只自习生围观
  • 2023年3月18日 10:45打卡
  • 2 日,14 小时前有动静
  • 引用
  • 举报
最近犒劳过的人
    • Prime
    • 自律力63.81
    • 北京西四环
    • 物理师

已经改回来了,但是魔改 normal 分布 std = 0。

……!!这是,收敛了嘛!

  • Prime
  • 6 日,13 小时前
  • 2023年3月20日 12:20

NaN说明除0了,改一下权重初始化,先跑几个epoch看看

发现 nan 可能跟 exp 有关。
RuntimeError: Function ‘ExpBackward0’ returned nan values in its 0th output.

作者的近日打卡

猜你喜欢

Pattern Recongnition - 也许可以搞到比较专业的课程的机会,希望能成功,这样项目进度会比现在快很多
  • Xchan
  • ♂ 36
  • 6级
  • 自律力66.25
  • 新加坡
  • 工程师
https://developer.mozilla.org/zh-CN/docs/Learn/HTML/Introduction_to_HTML/The_head_metadata_in_HTML - 刚反思了一下之前计划的不周——比如说C++语言的学习与MDN前端的学习,前者本来
jiayou - 加油!!!
jiayou - 加油
https://developer.mozilla.org/en-US/docs/Learn/Getting_started_with_the_web/HTML_basics - 朋辈压力好大啊…… , 我在Tomato Todo中看到有10来位同学一天的专注
fouriers transform - 这东西在图像处理里居然有应用。。。。。。我居然第四次自学这个。。。。。。我觉得这
  • Xchan
  • ♂ 36
  • 6级
  • 自律力66.25
  • 新加坡
  • 工程师
hello the world - 话说cpa要考试了,最近大家番茄是不是都要多了呢?
-懐- nostalgia - 早上去看了看爷爷,长成现在的样子,自己并不怎么满意呢...... 不知道爷爷会怎
homemade-toufu - 真是辛苦自己啦→_→又是没干正经事的一天 , 刷完《眨眼之间》
fresh - 这是第一次来到,希望成长

合作伙伴

线上在线自习室晚自习。番茄工作法、四象限、打卡、作业清单、作业辅导、作业交流、作业跟踪、作业计划、个人宣传相关内容

行恒 © 行恒 2013