现在需要知道的原理有,PPO,SAC,DDPG,RNN,transformer
又第一天了又第一天了……经典第一天。(以下的话有些意识流 / 语无伦次)
得知一个事情,就是一周后的现在,我最好已经在训练overcooked的环境了。哦,今天下午要发一封邮件汇报进展。
然后,周六要打一个高数竞赛,但还没有开始准备。
各种作业已经推迟掉了,最近就这两件事情。但仍然很有挑战性。高数竞赛没有什么route上的问题,只是ddl比较紧迫。然后就是DRL,迄今为止仅仅在看视频,一点都没实战,因此没有概念。目前的任务就是,对实战建立概念。
他们经常说的算法,什么DDPG、PPO(重点)SAC(重点,老师好像很偏爱这个),要大致理解原理。要实战,要train一个agent。现在看来,不一定用原生的pytorch,可能会调包,但我也不确定。老师发的那两个github库,要大致看懂它们提供了什么,是DRL方法的接口,还是成熟的pytorch代码。无论哪个都好啊。
希望有别人的实现方案,希望附带简单的小环境,最好能加一些注释,让我明白他的代码在干什么。这样我就可以对着学习了。(双手合十)
高数竞赛方面,在周六之前大概过3-4套【我的经典复习卷】。接下来的8910节课啊,我仍然需要看一下那两个库吧。沉下心来,不要走马观花。看看它们能给我提供什么。
总之加油加油,正在追寻dolce的我加油加油。不难对吧,我可以做到的,不就是调包/学别人写代码吗。不难不难,问题不大。加油加油。
如果真的能直接调库的话……(双手合十感激涕零语无伦次