最近在搞分布式训练大模型,踩了两个晚上的坑今天终于爬出来了