如题。 目前模型train不出来,打算先假装有模型、把剩下的代码写好。然后再跟学长和老师说,train不出来模型的事情。
train不出来模型的事情已经说啦……学长他意外的宽容。 那么下一步的计划就是,首先应付目前的ddl,参与工作方面,仔细学DQN的实现。嗯。是的。 目前的ddl: - 周二中午答辩(需要读答辩稿)【紧急】 - 周三晚上cn作业【紧急】 - 周四cg pre(目前遇到技术问题)【紧急】 - 今天的di和db落下了 - 13周的cp lab【危】 - cp落下很多了【危】 在工作方面: - cs285 - stable baseline的具体代码,大概会很复杂一堆trick - 现在的想法1:多个输入maybe并不方便处理,要不把agent和destiny信息综合到map里,要不我自己写个神奇结构的网络,或许需要这样 - 现在的想法2:先用A*搞一堆nice的trajectory,放到那什么replay buffer里面,直接对着这些trajectory学习。
线上在线自习室晚自习。番茄工作法、四象限、打卡、作业清单、作业辅导、作业交流、作业跟踪、作业计划、个人宣传相关内容
train不出来模型的事情已经说啦……学长他意外的宽容。
那么下一步的计划就是,首先应付目前的ddl,参与工作方面,仔细学DQN的实现。嗯。是的。
目前的ddl:
- 周二中午答辩(需要读答辩稿)【紧急】
- 周三晚上cn作业【紧急】
- 周四cg pre(目前遇到技术问题)【紧急】
- 今天的di和db落下了
- 13周的cp lab【危】
- cp落下很多了【危】
在工作方面:
- cs285
- stable baseline的具体代码,大概会很复杂一堆trick
- 现在的想法1:多个输入maybe并不方便处理,要不把agent和destiny信息综合到map里,要不我自己写个神奇结构的网络,或许需要这样
- 现在的想法2:先用A*搞一堆nice的trajectory,放到那什么replay buffer里面,直接对着这些trajectory学习。