今天是戒断第一天-每日打卡-行恒

- 正在追寻dolce
- 8级
- 自律力98.49
- 希望顺利毕业的学生

#戒断# 今天是戒断第一天

又第一天了又第一天了……经典第一天。（以下的话有些意识流 / 语无伦次）

得知一个事情，就是一周后的现在，我最好已经在训练overcooked的环境了。哦，今天下午要发一封邮件汇报进展。

然后，周六要打一个高数竞赛，但还没有开始准备。

各种作业已经推迟掉了，最近就这两件事情。但仍然很有挑战性。高数竞赛没有什么route上的问题，只是ddl比较紧迫。然后就是DRL，迄今为止仅仅在看视频，一点都没实战，因此没有概念。目前的任务就是，对实战建立概念。

他们经常说的算法，什么DDPG、PPO（重点）SAC（重点，老师好像很偏爱这个），要大致理解原理。要实战，要train一个agent。现在看来，不一定用原生的pytorch，可能会调包，但我也不确定。老师发的那两个github库，要大致看懂它们提供了什么，是DRL方法的接口，还是成熟的pytorch代码。无论哪个都好啊。

希望有别人的实现方案，希望附带简单的小环境，最好能加一些注释，让我明白他的代码在干什么。这样我就可以对着学习了。（双手合十）

高数竞赛方面，在周六之前大概过3-4套【我的经典复习卷】。接下来的8910节课啊，我仍然需要看一下那两个库吧。沉下心来，不要走马观花。看看它们能给我提供什么。

总之加油加油，正在追寻dolce的我加油加油。不难对吧，我可以做到的，不就是调包/学别人写代码吗。不难不难，问题不大。加油加油。

2
+9番茄
768只自习生围观
2021年11月10日 15:52打卡
2 年，10 月前有动静
引用
举报

正在追寻dolce
2 年，10 月前
2021年11月10日 19:31
卡主

如果真的能直接调库的话……（双手合十感激涕零语无伦次

正在追寻dolce
2 年，10 月前
2021年11月10日 19:32
卡主

现在需要知道的原理有，PPO，SAC，DDPG，RNN，transformer

1
2条 1页

#戒断# 今天是戒断第一天

作者的近日打卡

猜你喜欢

合作伙伴

导航

联系我们

© 行恒 2013