在看《Lessons from AlphaZero》,看到目前,作者还在用 state 可枚举、状态转移概率已知 的问题举例。 原来是 cs 人的时候会下意识反驳,并且把 state 塞进神经网络里; 但现在突然意识到,我要解决的问题场景,或许真的会比以往更加简单。
线上在线自习室晚自习。番茄工作法、四象限、打卡、作业清单、作业辅导、作业交流、作业跟踪、作业计划、个人宣传相关内容