视频选集 斯坦福CS336:大模型概述与tokenization 斯坦福CS336:利用PyTorch搭建大模型 斯坦福CS336:大模型架构设计与超参数调优 斯坦福CS336:详解MOE架构 斯坦福CS336:GPU原理与分布式训练基础 斯坦福CS336:内核优化与Triton框架应用 斯坦福CS336:详解大模型并行化策略 斯坦福CS336:手撕大模型并行训练 斯坦福CS336:详解Scaling laws 斯坦福CS336:详解模型推理 斯坦福CS336:如何用好Scaling laws 斯坦福CS336:模型评估详解 斯坦福CS336:训练数据策略 斯坦福CS336:实战数据过滤和去重 斯坦福CS336:详解SFT、RLHF 斯坦福CS336:详解大模型RL算法 斯坦福CS336:详解GRPO