pick 它 train 不起来 应该怎样呢 TT

题外话:列个想做的事的清单:

  • 穿搭
  • 某历史新书 + 邓小平传
  • 紫微斗数
  • 入门投资,如房产、股票、基金

嗷,还有每天跟读新闻联播,可能还会跟读 fake news

当务之急:再设计一下 curriculum,然后开 train。
如果可能的话,设置 GPU 使用。
一个从头开始 train,一个接着最新 不成 的 train。

暂时不打算开 train 了,可能会再观察 1h。1h后见。

开始动一些歪想法… 如果能直接 reward shaping,会好嘛?试一下。

下一步应该是:写 pretrain。

(嚎啕大哭)PPO,求你!

下一步测试,ground truth 能不能 pick place,希望知道 是我代码的错,还是模型不好

  1. 为什么有时候仍然不 pick?虽然 place 每次都有动作。
  2. 为什么 train 的时候,不 pick 也不 place?输出的是什么,发生了什么??
  3. pick and place 希望有非常鲁棒的模型。

谁能成为意见领袖?

语不惊人死不休

舍您其谁

合作伙伴

线上在线自习室晚自习。番茄工作法、四象限、打卡、作业清单、作业辅导、作业交流、作业跟踪、作业计划、个人宣传相关内容

行恒 © 行恒 2013