論文の概要: A meta-algorithm for classification using random recursive tree
ensembles: A high energy physics application
- arxiv url: http://arxiv.org/abs/2001.06880v1
- Date: Sun, 19 Jan 2020 18:22:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-08 10:13:13.623885
- Title: A meta-algorithm for classification using random recursive tree
ensembles: A high energy physics application
- Title(参考訳): ランダム再帰木アンサンブルを用いた分類のためのメタアルゴリズム:高エネルギー物理応用
- Authors: Vidhi Lalchand
- Abstract要約: 本研究の目的は,個別のバイナリクラスの存在下での自動分類のためのメタアルゴリズムを提案することである。
重なり合うクラスは、両方のクラスに属する高密度の点を持つ特徴空間におけるあいまいな領域の存在によって記述される。
提案したアルゴリズムは、実験物理学において最も成功した解析手法の1つである古典的な強化決定木の変種である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The aim of this work is to propose a meta-algorithm for automatic
classification in the presence of discrete binary classes. Classifier learning
in the presence of overlapping class distributions is a challenging problem in
machine learning. Overlapping classes are described by the presence of
ambiguous areas in the feature space with a high density of points belonging to
both classes. This often occurs in real-world datasets, one such example is
numeric data denoting properties of particle decays derived from high-energy
accelerators like the Large Hadron Collider (LHC). A significant body of
research targeting the class overlap problem use ensemble classifiers to boost
the performance of algorithms by using them iteratively in multiple stages or
using multiple copies of the same model on different subsets of the input
training data. The former is called boosting and the latter is called bagging.
The algorithm proposed in this thesis targets a challenging classification
problem in high energy physics - that of improving the statistical significance
of the Higgs discovery. The underlying dataset used to train the algorithm is
experimental data built from the official ATLAS full-detector simulation with
Higgs events (signal) mixed with different background events (background) that
closely mimic the statistical properties of the signal generating class
overlap. The algorithm proposed is a variant of the classical boosted decision
tree which is known to be one of the most successful analysis techniques in
experimental physics. The algorithm utilizes a unified framework that combines
two meta-learning techniques - bagging and boosting. The results show that this
combination only works in the presence of a randomization trick in the base
learners.
- Abstract(参考訳): 本研究の目的は,離散二項クラスの存在下での自動分類のためのメタアルゴリズムを提案することである。
重複するクラス分布の存在下での分類器学習は、機械学習において難しい問題である。
重なり合うクラスは、両クラスに属する点の密度が高い特徴空間におけるあいまいな領域の存在によって記述される。
これは実世界のデータセットでしばしば起こり、例えばLHC(Large Hadron Collider)のような高エネルギー加速器に由来する粒子崩壊の性質を示す数値データである。
クラスオーバーラップ問題を対象とした重要な研究機関は、アンサンブル分類器を使用して、複数の段階で繰り返し、あるいは入力トレーニングデータの異なるサブセットで同じモデルの複数のコピーを使用することで、アルゴリズムの性能を向上させる。
前者をブースティング(boosting)、後者をバグング(bagging)と呼ぶ。
この論文で提案されたアルゴリズムは、ヒッグス発見の統計的重要性を改善する高エネルギー物理学における挑戦的な分類問題をターゲットにしている。
アルゴリズムのトレーニングに使用される基礎となるデータセットは、信号生成クラスオーバーラップの統計特性を忠実に模倣する、ヒッグスイベント(信号)と異なるバックグラウンドイベント(背景)を混合した公式のATLASフル検出器シミュレーションから構築された実験データである。
提案したアルゴリズムは、実験物理学において最も成功した解析手法の1つである古典的な強化決定木の変種である。
このアルゴリズムは、ベージとブーピングという2つのメタラーニングテクニックを組み合わせた統合フレームワークを利用している。
その結果,この組み合わせは,基礎学習者のランダム化トリックの存在下でのみ有効であることがわかった。
関連論文リスト
- A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - FLASC: A Flare-Sensitive Clustering Algorithm [0.0]
本稿では,クラスタ内の分岐を検知してサブポピュレーションを同定するアルゴリズムFLASCを提案する。
アルゴリズムの2つの変種が提示され、ノイズの堅牢性に対する計算コストが取引される。
両変種は計算コストの観点からHDBSCAN*と類似してスケールし,安定した出力を提供することを示す。
論文 参考訳(メタデータ) (2023-11-27T14:55:16Z) - Regularization-Based Methods for Ordinal Quantification [49.606912965922504]
順序の場合、すなわち n>2 クラスの集合上で全順序が定義される場合について研究する。
本稿では,従来のアルゴリズムよりも優れた正規化OQアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-13T16:04:06Z) - Towards Automated Imbalanced Learning with Deep Hierarchical
Reinforcement Learning [57.163525407022966]
不均衡学習はデータマイニングにおいて基本的な課題であり、各クラスにトレーニングサンプルの不均等な比率が存在する。
オーバーサンプリングは、少数民族のための合成サンプルを生成することによって、不均衡な学習に取り組む効果的な手法である。
我々は,異なるレベルの意思決定を共同で最適化できる自動オーバーサンプリングアルゴリズムであるAutoSMOTEを提案する。
論文 参考訳(メタデータ) (2022-08-26T04:28:01Z) - A Dynamical Systems Algorithm for Clustering in Hyperspectral Imagery [0.18374319565577152]
ハイパースペクトル画像におけるクラスタリングのための新しい動的システムアルゴリズムを提案する。
このアルゴリズムの主な考え方は、密度を増加させる方向に「データポイントが押される」ことであり、同じ密度の領域に終わるピクセル群は同じクラスに属する。
本手法は, 既定素材のクラスを基礎事実として, k-means アルゴリズムと性能を比較した都市景観におけるアルゴリズムの評価を行う。
論文 参考訳(メタデータ) (2022-07-21T17:31:57Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Transfer learning based few-shot classification using optimal transport
mapping from preprocessed latent space of backbone neural network [0.0]
本論文は,大会における2番目に優れた応募について述べる。
メタラーニング手法は,各クラスに対して,バックボーンネットワークによって生成される潜在空間におけるクラス分布を変化させる。
そこで本研究では,シンクホーンアルゴリズムを用いた最適トランスポートマッピングを提案する。
論文 参考訳(メタデータ) (2021-02-09T23:10:58Z) - Data augmentation and feature selection for automatic model
recommendation in computational physics [0.0]
本稿では,トレーニングデータの欠如,高次元化,物理データへの共通データ拡張手法の適用性に関する2つのアルゴリズムを紹介する。
6つの多層パーセプトロンとリッジロジスティック回帰からなる積み重ねアンサンブルを組み合わせると、非線形構造力学の分類問題において90%の精度が得られる。
論文 参考訳(メタデータ) (2021-01-12T15:09:11Z) - Expectation propagation on the diluted Bayesian classifier [0.0]
本稿では,二項分類の文脈におけるスパース特徴選択の問題に対処する統計力学にインスパイアされた戦略を導入する。
予測伝搬(EP)として知られる計算スキームは、分類規則を学習する連続重みの知覚を訓練するために用いられる。
EPは、変数選択特性、推定精度、計算複雑性の点で頑健で競争力のあるアルゴリズムである。
論文 参考訳(メタデータ) (2020-09-20T23:59:44Z) - AP-Loss for Accurate One-Stage Object Detection [49.13608882885456]
一段階の物体検出器は、分類損失と局所化損失を同時に最適化することによって訓練される。
前者は、多数のアンカーのため、非常に前景と後方のアンカーの不均衡に悩まされる。
本稿では,一段検知器の分類タスクをランキングタスクに置き換える新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-08-17T13:22:01Z) - Learning Class Regularized Features for Action Recognition [68.90994813947405]
本稿では,階層活性化のクラスベース正規化を行うクラス正規化手法を提案する。
動作認識に最先端CNNアーキテクチャのクラス正規化ブロックを用いることで,Kineetics,UCF-101,HMDB-51データセットにおいて,それぞれ1.8%,1.2%,1.4%の体系的改善が得られた。
論文 参考訳(メタデータ) (2020-02-07T07:27:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。