RethinkFun的视频 模型量化二:训练后动态量化 PTQ PTDQ,pytorch里进行模型训练后动态量化 模型量化一:量化基础 对称量化 非对称量化 极大值量化 零点量化 DPO (Direct Preference Optimization) 算法讲解 DeepSeek-GRPO 大模型微调看这个视频就够了 SFT NEFTune 用梯度检查点来节省显存 gradient checkpointing 《RethinkFun深度学习教程》:17.2 旋转位置编码 《RethinkFun深度学习教程》:16.3 GPT2 《RethinkFun深度学习教程》:16.1 GPT1 一次学懂混合精度训练 AMP Automatic Mixed Precision 大模型预训练看这个视频就够了 代码实现大模型强化学习(PPO),看这个视频就够了。 图像生成 扩散模型 DDPM算法讲解(二):数学推导和代码实现 看傻眼!LLaVA多模态模型最简单的模型,最强的效果!LLaVA LLaVA-1.5 LLaVA-NeXT