技术文章 Hugging Face Accelerate 两个后端的故事:FSDP 与 DeepSpeed 最近,我们尝试分别使用 DeepSpeed 和 PyTorch FSDP 进行训练,发现两者...