論文の概要: Extracting more from boosted decision trees: A high energy physics case
study
- arxiv url: http://arxiv.org/abs/2001.06033v1
- Date: Thu, 16 Jan 2020 19:13:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-11 00:05:38.784802
- Title: Extracting more from boosted decision trees: A high energy physics case
study
- Title(参考訳): 強化された決定木からさらに抽出する:高エネルギー物理ケーススタディ
- Authors: Vidhi Lalchand
- Abstract要約: 提案手法は,本手法の弱点,過度な適合性などをターゲットとして,標準の強化決定木を抽出するアルゴリズムを提案する。
また,ATLAS Higgs (H) と Tau-tau データセットを併用したメタ学習手法を応用した。
本稿では,1つの応用に焦点をあてるが,この単純で堅牢な手法は高エネルギー物理学に広く応用されることが期待される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Particle identification is one of the core tasks in the data analysis
pipeline at the Large Hadron Collider (LHC). Statistically, this entails the
identification of rare signal events buried in immense backgrounds that mimic
the properties of the former. In machine learning parlance, particle
identification represents a classification problem characterized by overlapping
and imbalanced classes. Boosted decision trees (BDTs) have had tremendous
success in the particle identification domain but more recently have been
overshadowed by deep learning (DNNs) approaches. This work proposes an
algorithm to extract more out of standard boosted decision trees by targeting
their main weakness, susceptibility to overfitting. This novel construction
harnesses the meta-learning techniques of boosting and bagging simultaneously
and performs remarkably well on the ATLAS Higgs (H) to tau-tau data set (ATLAS
et al., 2014) which was the subject of the 2014 Higgs ML Challenge
(Adam-Bourdarios et al., 2015). While the decay of Higgs to a pair of tau
leptons was established in 2018 (CMS collaboration et al., 2017) at the
4.9$\sigma$ significance based on the 2016 data taking period, the 2014 public
data set continues to serve as a benchmark data set to test the performance of
supervised classification schemes. We show that the score achieved by the
proposed algorithm is very close to the published winning score which leverages
an ensemble of deep neural networks (DNNs). Although this paper focuses on a
single application, it is expected that this simple and robust technique will
find wider applications in high energy physics.
- Abstract(参考訳): 粒子識別は、LHC(Large Hadron Collider)のデータ分析パイプラインにおける中核的なタスクの1つである。
統計的には、これは前者の特性を模倣する巨大な背景に埋もれた稀な信号事象を識別する。
機械学習の用語では、粒子識別は重複クラスと不均衡クラスを特徴とする分類問題を表す。
押し上げ決定木(BDT)は粒子識別領域において大きな成功を収めてきたが、最近では深層学習(DNN)アプローチに隠れている。
本研究は, 主要な弱点, 過度な適合性をターゲットとして, 標準の強化された決定木からより多くを抽出するアルゴリズムを提案する。
2014年のhiggs ml challenge (adam-bourdarios et al., 2015) の対象となったatlas higgs (h) to tau-tau data set (atlas et al., 2014) で非常にうまく機能する。
2018年(cms collaboration et al., 2017)、2016年のデータ取得期間に基づく4.9$\sigma$の重要度で、tau leptonsに対するhiggsの崩壊が確立されたが、2014年の公開データセットは、教師付き分類スキームのパフォーマンスをテストするベンチマークデータセットとして機能し続けている。
提案アルゴリズムにより達成されたスコアは,ディープニューラルネットワーク(DNN)のアンサンブルを利用した,発行された勝利スコアに非常に近いことを示す。
本稿では,1つの応用に焦点をあてるが,この単純で堅牢な手法は高エネルギー物理学に広く応用されることが期待される。
関連論文リスト
- Generalization of Graph Neural Networks is Robust to Model Mismatch [84.01980526069075]
グラフニューラルネットワーク(GNN)は、その一般化能力によってサポートされている様々なタスクにおいて、その効果を実証している。
本稿では,多様体モデルから生成される幾何グラフで動作するGNNについて検討する。
本稿では,そのようなモデルミスマッチの存在下でのGNN一般化の堅牢性を明らかにする。
論文 参考訳(メタデータ) (2024-08-25T16:00:44Z) - A case study of sending graph neural networks back to the test bench for
applications in high-energy particle physics [0.0]
高エネルギー粒子衝突では、一次衝突生成物は、通常さらに崩壊し、木のような階層構造と事前の未知の多重度が生じる。
数理グラフの類似性は、高エネルギー粒子物理学に関連する多くの課題に対処するためにグラフニューラルネットワーク(GNN)が最適であるという考えを生み出している。
確立された完全接続型フィードフォワードアーキテクチャのニューラルネットワークに対する典型的なGNNのベンチマークテストについて述べる。
論文 参考訳(メタデータ) (2024-02-27T10:26:25Z) - Data Augmentations in Deep Weight Spaces [89.45272760013928]
そこで本研究では,Mixup法に基づく新しい拡張手法を提案する。
既存のベンチマークと新しいベンチマークでこれらのテクニックのパフォーマンスを評価する。
論文 参考訳(メタデータ) (2023-11-15T10:43:13Z) - A Comprehensive Study on Large-Scale Graph Training: Benchmarking and
Rethinking [124.21408098724551]
グラフニューラルネットワーク(GNN)の大規模グラフトレーニングは、非常に難しい問題である
本稿では,既存の問題に対処するため,EnGCNという新たなアンサンブルトレーニング手法を提案する。
提案手法は,大規模データセット上でのSOTA(State-of-the-art)の性能向上を実現している。
論文 参考訳(メタデータ) (2022-10-14T03:43:05Z) - Synthetic Over-sampling for Imbalanced Node Classification with Graph
Neural Networks [34.81248024048974]
グラフニューラルネットワーク(GNN)はノード分類の最先端性能を実現している。
多くの実世界のシナリオでは、ノードクラスは不均衡であり、グラフのほとんどの部分を構成する多数派クラスもある。
本研究では、マイノリティクラスの擬似インスタンスを生成し、トレーニングデータのバランスをとることで、この問題に対処する。
論文 参考訳(メタデータ) (2022-06-10T19:47:05Z) - Bag of Tricks for Training Deeper Graph Neural Networks: A Comprehensive
Benchmark Study [100.27567794045045]
ディープグラフニューラルネットワーク(GNN)のトレーニングは、非常に難しい。
我々は、深層GNNの「トリック」を評価するための最初の公正かつ再現可能なベンチマークを示す。
論文 参考訳(メタデータ) (2021-08-24T05:00:37Z) - New Methods and Datasets for Group Anomaly Detection From Fundamental
Physics [0.4297070083645048]
教師なしのグループ異常検出は、基礎物理学の新たなフロンティアとなっている。
グループ異常検出アルゴリズムの開発のために,現実的な合成ベンチマークデータセット(LHCO 2020)を提案する。
論文 参考訳(メタデータ) (2021-07-06T18:00:57Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z) - A meta-algorithm for classification using random recursive tree
ensembles: A high energy physics application [0.0]
本研究の目的は,個別のバイナリクラスの存在下での自動分類のためのメタアルゴリズムを提案することである。
重なり合うクラスは、両方のクラスに属する高密度の点を持つ特徴空間におけるあいまいな領域の存在によって記述される。
提案したアルゴリズムは、実験物理学において最も成功した解析手法の1つである古典的な強化決定木の変種である。
論文 参考訳(メタデータ) (2020-01-19T18:22:18Z) - Opportunities and Challenges of Deep Learning Methods for
Electrocardiogram Data: A Systematic Review [62.490310870300746]
心電図(Electrocardiogram、ECG)は、医学および医療において最も一般的に用いられる診断ツールの1つである。
深層学習法は心電図信号を用いた予測医療タスクにおいて有望な結果を得た。
本稿では、モデリングとアプリケーションの観点から、ECGデータに対するディープラーニング手法の体系的なレビューを行う。
論文 参考訳(メタデータ) (2019-12-28T02:44:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。