ganga简单例子:
创建DaVinci目录:
source /cvmfs/lhcb.cern.ch/lib/LbEnv -c x86_64-centos7-gcc7-opt
lb-set-platform x86_64-centos7-gcc7-opt
lb-dev DaVinci v44r10p1
cd ./DaVinciDev_v44r10p1
make configure
make
测试DaVinci脚本:
提交ganga作业:
参考脚本:
ganga_2016_MagDownUp.py
查找未扫描的dst文件:
经常出现小部分子工作无法完成的情况,我们需要通过对比样本中的dst文件,与已扫描的dst文件,找到未扫描的dst文件(丢失文件)。
得到扫描样本信息:
lhcb-proxy-init
lb-dirac dirac-bookkeeping-get-files --BK /LHCb/Collision16/Beam6500GeV-VeloClosed-MagDown/RealData/Reco16/Stripping28r2/90000000/EW.DST --DQFlags=OK --Output=Collision16_MagDown_Stripping28r2_Reco16.txt
其中,“/LHCb/Collision16/Beam6500GeV-VeloClosed-MagDown/RealData/Reco16/Stripping28r2/90000000/EW.DST”是ganga所扫描的样本,根据自己的情况修改;
Output是输出文件的名字,下一步需要用到,同样根据情况修改。
根据MC的ID号码查询已产生样本的信息:
lb-dirac dirac-bookkeeping-decays-path 26266050
检查已经扫描的文件列表,得到丢失文件列表:
参考这个文件
GetLostFileList.C:
根据自己的情况,修改相关参数。
allfiles: 是上一步命令(dirac-bookkeeping-get-files)得到的文件
skimmed_dir:是gangadir的路径
下面的数字是ganga job的ID号码。
此外,还有扫描的数据样本是‘DST’还是‘MDST’,同样检查一下。
root -q -b -l GetLostFileList.C
重新提交ganga工作:
将产生的丢失文件拷贝到工作目录下面,然后,通过下面的脚本(
LFN_ganga_submit_2016.py)重新提交到ganga上
ganga LFN_ganga_submit_2016.py
根据自己的情况,把LFN_ganga_submit_2016.py里的输入文本文件修改一下。
重复上面过程,直到所有数据文件都被扫描回来。
Tips:经过1-2轮的扫描,由于丢失的dst文件较少,可以适当减少每个subjobs扫描的文件数,比如5或者1,来加快扫描速度。
--
HangYin - 2019-01-04
Topic revision: r8 - 2021-01-04
- HangYin