FTLib 云原生分布式训练解决方案

授权协议:Apache操作系统:跨平台 开发语言:Python 查看源码 »
FTLib(Fault-Tolerant Library)是一个支持弹性伸缩和自动容错的云原生分布式训练解决方案,旨在帮助企业应对因训练数据量激增产生的意外情况,真正部署和运行大规模的分布式训练...