UP主: 封面: 简介:用基于策略梯度的强化学习方法训练AI,模型依然是上一个有关王者荣耀的视频几乎同样的模型(resnet101+transformer)。由于训练次数有限所以水平依然不高,但比之前有进步...