MAI-DS-R1 后训练优化的 DeepSeek-R1 模型

授权协议:None操作系统:None 开发语言:None
MAI-DS-R1 是后训练优化的 DeepSeek-R1 模型,微软在训练 MAI-DS-R1 的过程中,从大约 350000 个被屏蔽的主题示例中,收集和筛选查询关键词,将这些关键词转化为多...