Transformer Overview
这篇是自己之前在学习Transformer的过程中,综合多方材料,对Transformer模型的梳理。 为什么是个ppt? 为了加深对模型细节的...
这篇是自己之前在学习Transformer的过程中,综合多方材料,对Transformer模型的梳理。 为什么是个ppt? 为了加深对模型细节的...
什么是Decoding策略 在使用GPT类产品的时候,不妨问一下自己这些问题: 同一个 prompt,为什么模型有时说的不一样? Chatbot里面...