RWKV-LM 线性 Transformer 模型

授权协议:None操作系统:None 开发语言:None
RWKV 是结合了 RNN 和 Transformer 的语言模型,适合长文本,运行速度较快,拟合性能较好,占用显存较少,训练用时较少。 RWKV 整体结构依然采用 Transformer Bl...