重磅推荐专栏:
《大模型AIGC》
《课程大纲》
《知识星球》
本专栏致力于探索和讨论当今最前沿的技术趋势和应用领域,包括但不限于ChatGPT和Stable Diffusion等。我们将深入研究大型模型的开发和应用,以及与之相关的人工智能生成内容(AIGC)技术。通过深入的技术解析和实践经验分享,旨在帮助读者更好地理解和应用这些领域的最新进展
1. 复习一下Transformer
1.1 Transformer的原理是什么?
Transformer是一种深度学习架构,最初设计用于处理文本翻译任务,但后来被广泛应用于自然语言处理和其他领域。让我们来了解一下它的基本原理:
Transformer的结构如下图所示,分为左边的编码器(encoder)和右边的解码器(decoder)两部分: