train不出来模型的事情已经说啦……学长他意外的宽容。
那么下一步的计划就是,首先应付目前的ddl,参与工作方面,仔细学DQN的实现。嗯。是的。
目前的ddl:
- 周二中午答辩(需要读答辩稿)【紧急】
- 周三晚上cn作业【紧急】
- 周四cg pre(目前遇到技术问题)【紧急】
- 今天的di和db落下了
- 13周的cp lab【危】
- cp落下很多了【危】
在工作方面:
- cs285
- stable baseline的具体代码,大概会很复杂一堆trick
- 现在的想法1:多个输入maybe并不方便处理,要不把agent和destiny信息综合到map里,要不我自己写个神奇结构的网络,或许需要这样
- 现在的想法2:先用A*搞一堆nice的trajectory,放到那什么replay buffer里面,直接对着这些trajectory学习。

谁能成为意见领袖?

语不惊人死不休

舍您其谁

合作伙伴

线上在线自习室晚自习。番茄工作法、四象限、打卡、作业清单、作业辅导、作业交流、作业跟踪、作业计划、个人宣传相关内容

行恒 © 行恒 2013