Transformer和预训练模型
分类:
自从《Attention is all you need》发表以来,开启了Transformer和预训练模型的时代,作为更加优异的序列处理模型,我希望在该文中对其原理进行介绍。同时,我将对目前流行的两种预训练模型进行介绍。如有错误,希望指正。
查看评论
暂无评论