视频选集 1-Transformer整体框架结构 2-Tokenization-文本变成token 3-Embedding-Token变向量 4-Positional Encoding-位置编码 5-编码器和解码器 6-linear和softmax 7-文字序列要解决的语义问题 8-Attention-注意力机制 9-Self Attention-自注意力机制 10-Multi-Head Self Attention-多头自注意力机制 11-Feed Forward-前馈神经网络 12-编码器与解码器的区别