视频选集 1.斯坦福CS336:大模型概述与tokenization 2.斯坦福CS336:利用PyTorch搭建大模型 3.斯坦福CS336:大模型架构设计与超参数调优 4.斯坦福CS336:详解MOE架构 5.斯坦福CS336:GPU原理与分布式训练基础 6.斯坦福CS336:内核优化与Triton框架应用 7.斯坦福CS336:详解大模型并行化策略 8.斯坦福CS336:手撕大模型并行训练 9.斯坦福CS336:详解Scaling laws 10.斯坦福CS336:详解模型推理 11.斯坦福CS336:如何用好Scaling laws 12.斯坦福CS336:模型评估详解 13.斯坦福CS336:训练数据策略 14.斯坦福CS336:实战数据过滤和去重 15.斯坦福CS336:详解SFT、RLHF 16.斯坦福CS336:详解大模型RL算法 17.斯坦福CS336:详解GRPO