戒断 482人次参与 5 月,2 周前更新 创建于3 年,1 月前


#戒断# 今天好好糊论文

发现死亡了一个 500 番茄的任务,心疼;发发打卡赚番茄。

#戒断# 现在所做的事情,是必经之路,早晚都要做的

从解释型、完成任务型选手,到成事型选手的过渡,总有一天要这样的。 2

#戒断# 注册一下

要去注册了诶,有点小激动… 听说今年投稿已经 12000 了,好像是很多的数字…

#戒断# 感谢 kimi.ai

对于你提纲中的这一部分,请使用严谨的中文学术语言,生成对应的综述内容。对于其中提到的概念,请你进行互联网搜索,了解相关信息,请尽量搜索英文文献。请使用分段、分子章节、分列表的形式写作。在列表或子章节前

#戒断# 再整个 newbee policy 叭

存 100 200 300 400 的 policy(?)按需取用,感觉可以。 然后就可生成 preference dataset,可以 feed data 让我的模型去跑。嗯!

#戒断# 喜报,imitation learning 能跑通

笑死,看 curve 是把 std 看成 performance 了,以为一点都没学到,给我吓死了。 1

#戒断# Act as an academic writing expert.

Act as an academic writing expert. Please improve the writing of the following paragraph. You don't

#戒断# 今晚在看 CDS 文章

Conservative Data Sharing for Multi-Task Offline Reinforcement Learning,好像是师兄推荐的论文,正好有时间就读读。

#戒断# 今天糊糊大饼 1 的代码,

然后看看如何做点正经工作(… 1

#戒断# 糊一下论文 pipeline

打算看看 offline 2 online 的工作,能否为 fine-tune 步骤带来灵感… 目前有一个 base policy,有训 base policy 得到的数据,想进行 online

#戒断# 午睡随感

有时候心里盘旋的想法,可能并不由我们的自主意识产生,而只是没休息好、状态不好、心情不好之类的衍生物。 这也是没办法的事;唯一能做的,就是尽可能管理自己的状态,然后别把那些想法往心里去…… 可能睡

#戒断# 关于 pre 的一点思考

感觉交互感是非常重要的。不然,即使读了很好的稿子,也没有人听。 下次可以 看一句稿子,交互转述一句。要假装是自己想的,认真指着 ppt 看着观众讲出来。

#戒断# 有点好奇公达兄在做的直播是什么

(如题) (btw 我不是小红书用户【捂脸】)

#戒断# 继续实践我的最新方法论

把身心泡进一个问题里。担忧效率并不能带来效率改善。 把身心泡进一个问题里。

#戒断# 2024 快乐!

今天是甲子月甲子日噢! 请拜托加油呀!

#戒断# 使用 python 3.6 可能导致莫名其妙的错误

23333333。使用 py 3.8 之类,错误可能就自动解决了。

#戒断# 希望现实世界的人不要看到这个网站

拜托了… 没有做什么出格的事情,所以请给我留一个发 random 东西的自留地吧…… 如果现实世界认识的人找到这里,我真的会被吓晕的…… 拜托了拜托了拜托了 1

#戒断# 去稍微看一眼宣讲会

反正离得很近,就在对面楼上。然后大概就继续回工位工作了。 今日:糊作业(矩阵或许要看一眼)、糊项目(应该很容易)、看论文。 加油加油!

#戒断# 一旦把情绪决策权放在别人身上

从此就踏上了一条必然失落、失望、失败的路。 别人总会不小心让我失望的,就像赌博总有赌输的一天一样… 心情不要依赖于他人。

#戒断# 感觉今天早上精神状态有点乱……

应该是昨晚 0 点睡觉的原因。以后拜托了,如果有条件就 11 点睡觉吧。 感觉现在做出合情合理的反应和规划,都需要有意思考了… 为防止说怪话,今天还是少说话吧。 (今天中午手机电脑 需要尽

合作伙伴

线上在线自习室晚自习。番茄工作法、四象限、打卡、作业清单、作业辅导、作业交流、作业跟踪、作业计划、个人宣传相关内容

行恒 © 行恒 2013