Submitting jobs to the GRID using CRAB

There are very complete tutorials and documentation on the official CMSSW pages:

User experience on submitting jobs to CRAB

Setting the environment (at CERN)

  • GRID: Preparation (this is done only once)

Basically, it is only a question of sourcing a LGC script source /afs/cern.ch/cms/LCG/LCG-2/UI/cms_ui_env.csh. I simplified this step by adding an alias into mi .cshrc file:

#... this goes in your .cshrc file
alias gridEnv 'source /afs/cern.ch/cms/LCG/LCG-2/UI/cms_ui_env.csh'

  • CRAB: Preparation (this is done only once)

Very similar situation as before (note: That the alias is setting things for CRAB ver. 2_7_8. This may need to be changed) :

#... this goes in your .cshrc file
alias crabEnv 'source /afs/cern.ch/cms/ccs/wm/scripts/Crab/CRAB_2_7_8/crab.csh'

Configurando las variables de entorno en YALI

  • El entorno para Grid ya viene preestablecido, asi que es tan solo adicionar un alias para configurar CRAB en su archivo de configuración ".bashrc":

#... Entorno para Crab
alias crabEnv='source /tmp/aosorio/CRAB_2_7_8_patch1/crab.sh'

  • El orden en el que se debe configurar el entorno antes de correr CRAB debe ser:
    • UI-Grid: usando el alias gridEnv que hemos definido; si el entorno Grid ya esta definido entonces saltar al siguiente paso
    • CMSSW: desde su area de trabajo, hacer cmsenv
    • CRAB: usando el alias crabEnv que hemos definido

Ejemplo 1 - produccion de una patTupla

Podemos usar un analisis cualquiera, como uno de los que teniamos hechos la vez pasada en MyAnalyzers/PatOne. La idea es enviarlo a que corra sobre unos datos en el Grid. Para buscar datos en DBS se puede mirar el siguiente tutorial. Nosotros aqui hemos buscado datos de la siguiente forma:

dbs search --query "find site.name where dataset=/SMHiggsToZZTo2L2Q_M-400_7TeV-jhu-pythia6/Fall10-START38_V12-v1/GEN-SIM-RECO and dataset.status like VALID*"

Using DBS instance at: http://cmsdbsprod.cern.ch/cms_dbs_prod_global/servlet/DBSServlet
-------------------------------------------------------
site.name

node12.datagrid.cea.fr
cmssrm-fzk.gridka.de

  • En donde "/SMHiggsToZZTo2L2Q_M-400_7TeV-jhu-pythia6/Fall10-START38_V12-v1/GEN-SIM-RECO" es un dataset escogido para este ejemplo. Es importante que este dataset se encuentre disponible analisis en algun Tier (por ejemplo si tomaramos algun RelVal, solo puede enviarse desde CERN).

  • Basicamente CRAB se configura atraves de un sencillo archivo de texto llamado crab.cfg el cual contiene varias secciones en las que el usuario introduce las opciones requeridas.

  • Primero, copiemos un crab.cfg de base y que viene con el programa:

cd MyAnalyzers/PatOne/test
cp $CRABDIR/python/crab.cfg .

  • Nos concentraremos en modificar la información en las siguientes secciones: [CRAB], [CMSSW] y [USER] .

  • Una lista detallada de los parametros de configuracion importantes para CRAB están descritos en Configuration Parameters.

Configurando crab.cfg

  • Para nuestro ejemplo, intentaremos correr el paso de crear patTuplas sobre datos que se encuentran en el Grid. Es decir que correremos el siguiente archivo de configuraciones patTuple_standard_cfg.py.

  • Modifiquemos en el archivo crab.cfg los siguientes valores:

       use_server=1
       datasetpath=/SMHiggsToZZTo2L2Q_M-400_7TeV-jhu-pythia6/Fall10-START38_V12-v1/GEN-SIM-RECO
       pset=patTuple_standard_cfg.py
       output_file= patTuple.root

  • Ahora creemos nuestro job para enviar al Gird usando el comando crab -create:

[yali] /home/aosorio/scratch0/CMSSW_4_2_5/src/MyAnalyzers/PatOne > crab -create
crab:  Version 2.7.8 running 

crab. Working options:
        scheduler           glite
        job type            CMSSW
        server              ON (use_server)
        working directory   /home/aosorio/scratch0/CMSSW_4_2_5/src/MyAnalyzers/PatOne/crab_0_110824_052513/

crab:  Required 1 jobs in total
crab:  Required 10 events in total
crab:  1 jobs can be created, each for 10 for a total of 10 events
pick RelValInputFiles INFO : Running on site 'edu.co' without direct access to RelVal files
crab:  Creating 1 jobs, please wait...
crab:  Total of 1 jobs created.

Log file is /home/aosorio/scratch0/CMSSW_4_2_5/src/MyAnalyzers/PatOne/crab_0_110824_052513/log/crab.log

Envio, Estado y Recuperacion de la Salida

  • Si todo sale bien, el job puede enviarse mediante el comando crab -submit:

[yali] /home/aosorio/scratch0/CMSSW_4_2_5/src/MyAnalyzers/PatOne > crab -submit                        
crab:  Version 2.7.8 running on Wed Aug 24 06:27:44 2011 COT (11:27:44 UTC)

crab. Working options:
	scheduler           glite
	job type            CMSSW
	server              ON (default)
	working directory   /home/aosorio/scratch0/CMSSW_4_2_5/src/MyAnalyzers/PatOne/crab_0_110824_062731/

crab:  Registering credential to the server : t2-cms-cs0.desy.de
crab:  Credential successfully delegated to the server.

crab:  Starting sending the project to the storage t2-cms-cs1.desy.de...
crab:  Task crab_0_110824_062731 successfully submitted to server t2-cms-cs0.desy.de

crab:  Total of 1 jobs submitted
Log file is /home/aosorio/scratch0/CMSSW_4_2_5/src/MyAnalyzers/PatOne/crab_0_110824_062731/log/crab.log

  • El estado del job que hemos enviado, puede monitorearse mediante el comando crab -status:

[yali] /home/aosorio/scratch0/CMSSW_4_2_5/src/MyAnalyzers/PatOne > crab -status
crab:  Version 2.7.8 running on Wed Aug 24 06:30:05 2011 COT (11:30:05 UTC)

crab. Working options:
	scheduler           glite
	job type            CMSSW
	server              ON (default)
	working directory   /home/aosorio/scratch0/CMSSW_4_2_5/src/MyAnalyzers/PatOne/crab_0_110824_062731/

crab:  
ID    END STATUS            ACTION       ExeExitCode JobExitCode E_HOST
----- --- ----------------- ------------  ---------- ----------- ---------
1     N   Ready             SubSuccess                           osg.hpc.ufl.edu

crab:   1 Total Jobs 
 >>>>>>>>> 1 Jobs Ready 
	List of jobs Ready: 1 

crab:  You can also follow the status of this task on :
	CMS Dashboard: http://dashb-cms-job-task.cern.ch/taskmon.html#task=aosorio_crab_0_110824_062731_y5zi12
	Server page: http://t2-cms-cs0.desy.de:8888/logginfo
	Your task name is: aosorio_crab_0_110824_062731_y5zi12 

Log file is /home/aosorio/scratch0/CMSSW_4_2_5/src/MyAnalyzers/PatOne/crab_0_110824_062731/log/crab.log

  • Para mirar el Estado del job, podemos consultar en la página siguiente, tal como aparece sugerido en la salida del comando anterior:

crab:  You can also follow the status of this task on :
	CMS Dashboard: http://dashb-cms-job-task.cern.ch/taskmon.html#task=aosorio_crab_0_110824_062731_y5zi12
	Server page: http://t2-cms-cs0.desy.de:8888/logginfo
	Your task name is: aosorio_crab_0_110824_062731_y5zi12 

  • Si el job esta listo, es decir en estado "Done", podemos intentar recuperar la salida de este mediante crab -getoutput:



Edit | Attach | Watch | Print version | History: r7 < r6 < r5 < r4 < r3 | Backlinks | Raw View | WYSIWYG | More topic actions
Topic revision: r7 - 2011-08-24 - AndresOsorio
 
    • Cern Search Icon Cern Search
    • TWiki Search Icon TWiki Search
    • Google Search Icon Google Search

    Main All webs login

This site is powered by the TWiki collaboration platform Powered by PerlCopyright &© 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback