凯发k8国际娱乐官网入口-k8凯发> ai开发平台modelarts> > > > 在notebook中,如何使用昇腾多卡进行调试?
更新时间:2022-12-09 gmt 08:00

在notebook中,如何使用昇腾多卡进行调试?-凯发k8国际娱乐官网入口

昇腾多卡训练任务是多进程多卡模式,跑几卡需要起几个python进程。昇腾底层会读取环境变量:rank_table_file,开发环境已经设置,用户无需关注。比如跑八卡,可以如下片段代码:

 export rank_size=8
 current_exec_path=$(pwd)
 echo 'start training'
 for((i=0;i<=$rank_size-1;i  ));
 do
 echo 'start rank '$i
 mkdir ${current_exec_path}/device$i
 cd ${current_exec_path}/device$i
 echo $i
 export rank_id=$i
 dev=`expr $i   0`
 echo $dev
 export device_id=$dev
 python train.py > train.log 2>&1 &
 done

其中,train.py中设置环境变量device_id:

devid = int(os.getenv('device_id'))
 context.set_context(mode=context.graph_mode, device_target="ascend", device_id=devid)
分享:

more

网站地图