PLEASE USE WYSIWYG AT THE BOTTOM OF THE PAGE TO EDIT THIS PAGE

機械学習の研究

編集にはページ下のWYSIWYGを使ってください。


このページでは、アトラス日本物理グループで進行している機械学習研究の概要と、使った学習データや解析用ソフトウェア、インストラクション等をまとめています。参考になる機械学習の教材や参考文献、その他資料なども載せていきたいと思います。役立ちそうな関連情報もお願いします。

解析トピック

WG1 : Higgs

ZH->llbbの偏極を使った背景事象削減(野口)


Directory: /eos/atlas/unpledged/group-tokyo/users/yenari/public/AJphys/MVA_datalibs/YoheiNoguchi_2019June

Code: MVATraining_VHbbの中

サンプル: TrainTrees

Memo: From Yohei Noguchi 2019 June 3rd
Tool: common tool developped in VH Hbb group
git clone ssh://git@gitlab.cern.ch:7999/CxAODFramework/MVATraining_VHbb.git
(cloned on 2019 June 3rd in this directory, because there is no specific tag)
Usage: see in this git repo (or cloned directory)
data is copied from /eos/atlas/atlascerngroupdisk/phys-higgs/HSG5/Run2/FullRunII2019/MVA/TrainTrees/


ttH, H->gamma gamma の改善(東野)

Directory: /eos/atlas/unpledged/group-tokyo/users/yenari/public/AJphys/MVA_datalibs/SatoshiHigashino_2019June

Code: MLの中

サンプル:root_files

Memo: From Satoshi Higashino 2019 June 13th

Tool
XGboost used in 80 fb-1 observation paper in ttH group. (additionaly developped by Satoshi)

Useful README.txt in this directory.


2-prongタウの識別BDTアルゴリズム(竹田)

Git repositry

1つ目はDxAODをNtupleにするコード、2つ目が実際にBDTを走らせるコード。タグはAJ-MachineLearning-00を使用する。

基本的にTau WGが用意している Lokiと呼ばれるTMVAのラッパーコードを動かす。その際に少しオプションを与える必要があるので、そのスクリプトがTauBDTレポジトリにある。

Data

  • /eos/atlas/unpledged/group-tokyo/users/ktakeda/Data/SingleTauXAOD/

WG3 : SUSY

BDT を用いたLow-Pt レプトンのアイソレーションの研究(赤塚)

DAOD

MUON5 という derivation。

https://gitlab.cern.ch/atlas/athena/blob/21.2/PhysicsAnalysis/DerivationFramework/DerivationFrameworkMuons/share/MUON5.py

ほとんど、skimming がされていないため、非常に巨大(全部で 90 TB くらいあります、、)

mc16_13TeV:mc16_13TeV.410470.PhPy8EG_A14_ttbar_hdamp258p75_nonallhad.deriv.DAOD_MUON5.e6337_s3126_r9364_p3654
mc16_13TeV:mc16_13TeV.410470.PhPy8EG_A14_ttbar_hdamp258p75_nonallhad.deriv.DAOD_MUON5.e6337_s3126_r10724_p3654
mc16_13TeV:mc16_13TeV.410470.PhPy8EG_A14_ttbar_hdamp258p75_nonallhad.deriv.DAOD_MUON5.e6337_s3126_r10201_p3654

Ntuple

Susy のフレームワークを用いて作成(SusySkimMaker)

最新 study で使ったものは、陳さんの private project のもの。必要があれば陳さんに permission をもらってください。

https://gitlab.cern.ch/shion/SusySkimPLT

以下に、これで作られた ntuple があります。mc16a + d のみ:

/gpfs/fs6001/sakatsuk/PromptLeptonTagger/data/SusySkimPLT_v2.5/

Software

とてもシンプルな BDTトレーニング

https://gitlab.cern.ch/sakatsuk/LowPtPLT_Training


WG5 : BSM long-lived

Unused ID hit cluster study(赤塚)

内部飛跡検出器で再構成された飛跡とクラスター情報を使ったオブジェクトの分類

Rel. 20のstudyの分をまとめていますが、ここで作ったDAOD_IDTRKVALIDは正しい-postExec optionが指定されていない可能性があって、(特にIBLの)noiseの分布がデータを再現していない可能性があります。

サンプル (Rel. 20)

/gpfs/fs7001/atljphys/datafiles/xAOD/other/

  • user.sakatsuk.00310969.physics_Main.merge.DAOD_IDTRKVALID_RPVLL.f758_m1616.r0.d4_EXT0
  • user.sakatsuk.00311071.physics_Main.merge.DAOD_IDTRKVALID_RPVLL.f758_m1616.r0.d4_EXT0
  • user.sakatsuk.00311170.physics_Main.merge.DAOD_IDTRKVALID_RPVLL.f758_m1616.r0.d4_EXT0
  • user.sakatsuk.00311244.physics_Main.merge.DAOD_IDTRKVALID_RPVLL.f758_m1616.r0.d4_EXT0
  • user.sakatsuk.00311287.physics_Main.merge.DAOD_IDTRKVALID_RPVLL.f758_m1616.r0.d4_EXT0
  • user.sakatsuk.00311321.physics_Main.merge.DAOD_IDTRKVALID_RPVLL.f758_m1616.r0.d4_EXT0
  • user.sakatsuk.00311365.physics_Main.merge.DAOD_IDTRKVALID_RPVLL.f758_m1616.r0.d4_EXT0
  • user.sakatsuk.00311402.physics_Main.merge.DAOD_IDTRKVALID_RPVLL.f758_m1616.r0.d4_EXT0
  • user.sakatsuk.00311473.physics_Main.merge.DAOD_IDTRKVALID_RPVLL.f758_m1616.r0.d4_EXT0
  • user.sakatsuk.00311481.physics_Main.merge.DAOD_IDTRKVALID_RPVLL.f758_m1616.r0.d4_EXT0
  • user.sakatsuk.00311563.physics_Main.merge.DAOD_IDTRKVALID_RPVLL.f758_m1616.r0.d4_EXT0
  • user.sakatsuk.361106.PowhegPythia8EvtGen_AZNLOCTEQ6L1_Zee.recon.DAOD_IDTRKVALID.e3601_s2576_s2132_r8551.d4_EXT0
  • user.sakatsuk.361106.PowhegPythia8EvtGen_AZNLOCTEQ6L1_Zee.recon.DAOD_IDTRKVALID.e3601_s2832_r8014.d4_EXT0
  • user.sakatsuk.361107.PowhegPythia8EvtGen_AZNLOCTEQ6L1_Zmumu.recon.DAOD_IDTRKVALID.e3601_s2576_s2132_r8193.d4_EXT0
  • user.sakatsuk.361107.PowhegPythia8EvtGen_AZNLOCTEQ6L1_Zmumu.recon.DAOD_IDTRKVALID.e3601_s2832_r8014.d4_EXT0
  • user.sakatsuk.361108.PowhegPythia8EvtGen_AZNLOCTEQ6L1_Ztautau.recon.DAOD_IDTRKVALID.e3601_s2832_r8610.d4_EXT0
  • user.sakatsuk.410000.PowhegPythiaEvtGen_P2012_ttbar_hdamp172p5_nonallhad.recon.DAOD_IDTRKVALID.e3698_s2608_s2183_r7728.d4_EXT0
サンプルの作り方

grid上で当時available だったESD から、適当なものを選んできて、

  • setupATLAS
  • asetup AtlasProduction,20.7.9.3,64,slc6,here
  • lsetup panda
  • lsetup emi
  • Reco_tf.py --autoConfiguration='everything' --maxEvents '-1' --inputESDFile=ESD.pool.root --outputDAOD_IDTRKVALIDFile=InDetDxAOD.pool.root
の様な感じで、privateにDAOD_IDTRKVALIDを作りました。

自分でathenaをcheckoutして、jobOptionをいじってOff-track pixel clusterを追加するオプションをenableしています。ちなみに、デフォルトではOff-track pixel clusterは捨てられているので、Officialに作られているDAOD_IDTRKVALIDにはoff-track pixel cluster が入っていないです。

データの中身

https://twiki.cern.ch/twiki/bin/view/AtlasProtected/InDetDerivedxAOD

(SCTの情報はRAWからProcessしないといけないようで、上のサンプルには入っていない)

コード(ntuple生成)

https://gitlab.cern.ch/sakatsuk/UnusedHits

Lepton -> Track -> Pixel Clusterの追い方や、Clusterのidentifierを用いたon-track/off-trackの判定の部分は参考になるかもしれません。

コード(BDT training)

https://gitlab.cern.ch/sakatsuk/HitIsoBDT


WG6 : Diboson

BDT W/Z/Top tagging(新田)

ブーストしているW/Zボソン、トップクォークの識別手法の研究

Rel. 20.7でのBDT W/Z/top taggingについての情報:

rel20.7の解析では、JETM8 derivationから以下で一回root fileにして、

https://gitlab.cern.ch/atlas-jetetmiss-substructure/WTopTagging/WTopTaggingDAODDumper

以下でflat ntupleにしていました。

https://gitlab.cern.ch/atlas-jetetmiss-substructure/WTopTagging/WTopTaggingFlattener

実際使用したflat ntupleは以下です。

/data/data6/zp/tnitta/data/BosonTopTaggingBDT/FlatNtuple2017May30/

/eos/atlas/atlascerngroupdisk/perf-jets/JSS/TopBosonTagAnalysis2016/FlatNTuples/20170530/MLTrainingTesting/

独立なtrainingとtestingのサンプルに分かれています。W/Top/dijetサンプルがあります。pT flatにreweightingする変数fjet_training_weight_pt_* が入っています。

Rel.21で作り直したsampleが以下です。

/eos/atlas/atlascerngroupdisk/perf-jets/JSS/TopBosonTagAnalysisRel21/FlattenerOutput/17Jan2019

同じ構造です。詳細は

https://twiki.cern.ch/twiki/bin/viewauth/AtlasProtected/TopBosonTagAnalysisRel21

flat ntuple自体の作り方は、

https://indico.cern.ch/event/810061/

flat ntupleを使って、BDTのtraining/testingをしたのは、以下のコードです。(非常に簡単なREADME.mdが付属してます。)

https://gitlab.cern.ch/tnitta/BosonTopTaggingBDT

特に

DNNのコードは

https://gitlab.cern.ch/atlas-jetetmiss-substructure/WTopTagging/TopBosonTaggingDL

これのようです。


WG7 : Top

機械学習の教材

A high-bias, low-variance introduction to Machine Learning for physicists ( arXiv:1803.08823)

Deep Learning , MIT Press, by Ian Goodfellow, Yoshua Bengio and Aaron Courvill(日本語訳 - Amazon

Machine Learning from Exotics group:

  • Introduction (A. Sogaard Exotics Workshop '18) slides, Red led recording
  • Hands-on session (D. Bachas Exotics Workshop '18) Wrench, tools GitLab, Red led recording (see second half)
    • Introduction to using Machine Learning and Deep Neural Networks with Keras using Jupyter Notebooks for a simple S/B classification problem.

関連情報など

Conferences, Meetings, Workshops

-- KojiTerashi - 2019-06-01

Edit | Attach | Watch | Print version | History: r12 < r11 < r10 < r9 < r8 | Backlinks | Raw View | WYSIWYG | More topic actions
Topic revision: r12 - 2019-07-04 - KojiTerashi
 
    • Cern Search Icon Cern Search
    • TWiki Search Icon TWiki Search
    • Google Search Icon Google Search

    Main All webs login

This site is powered by the TWiki collaboration platform Powered by PerlCopyright & 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback