大语言模型的技术总结系列一:RNN与Transformer架构的区别以及为什么Transformer更好 | DataLearnerAI