UP主: 封面: 简介:大模型微调看这个视频就够了。包含ChatTempate,Completion Only,NEFTune,SFTTrainer的讲解和代码实现。视频代码:https://github.com/RethinkFun/sft/tree/main...
RethinkFun的视频 大模型微调看这个视频就够了 SFT NEFTune 用梯度检查点来节省显存 gradient checkpointing 《RethinkFun深度学习教程》:17.2 旋转位置编码 《RethinkFun深度学习教程》:16.3 GPT2 《RethinkFun深度学习教程》:16.1 GPT1 一次学懂混合精度训练 AMP Automatic Mixed Precision 大模型预训练看这个视频就够了 代码实现大模型强化学习(PPO),看这个视频就够了。 图像生成 扩散模型 DDPM算法讲解(二):数学推导和代码实现 看傻眼!LLaVA多模态模型最简单的模型,最强的效果!LLaVA LLaVA-1.5 LLaVA-NeXT