知友评论第1页-行恒

train不出来模型的事情已经说啦……学长他意外的宽容。
那么下一步的计划就是，首先应付目前的ddl，参与工作方面，仔细学DQN的实现。嗯。是的。
目前的ddl：
- 周二中午答辩（需要读答辩稿）【紧急】
- 周三晚上cn作业【紧急】
- 周四cg pre（目前遇到技术问题）【紧急】
- 今天的di和db落下了
- 13周的cp lab【危】
- cp落下很多了【危】
在工作方面：
- cs285
- stable baseline的具体代码，大概会很复杂一堆trick
- 现在的想法1：多个输入maybe并不方便处理，要不把agent和destiny信息综合到map里，要不我自己写个神奇结构的网络，或许需要这样
- 现在的想法2：先用A*搞一堆nice的trajectory，放到那什么replay buffer里面，直接对着这些trajectory学习。

谁能成为意见领袖？

合作伙伴

导航

联系我们

© 行恒 2013