論文の概要: Learnable cut flow
- arxiv url: http://arxiv.org/abs/2503.22498v1
- Date: Fri, 28 Mar 2025 15:04:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-31 15:31:07.536090
- Title: Learnable cut flow
- Title(参考訳): 学習可能なカットフロー
- Authors: Jing Li, Hao Sun,
- Abstract要約: Learnable Cut Flow(LCF)は、従来のカット選択をデータ駆動プロセスに変換するニューラルネットワークである。
LCFは2つのカット戦略パラレルを実装しており、観測可能な分布は独立に扱われる。
LCFは6つのさまざまなモックデータセットと、現実的なダイボソン対QCDデータセットでテストされている。
- 参考スコア(独自算出の注目度): 9.505166666374878
- License:
- Abstract: Neural networks have emerged as a powerful paradigm for tasks in high energy physics, yet their opaque training process renders them as a black box. In contrast, the traditional cut flow method offers simplicity and interpretability but demands human effort to identify optimal boundaries. To merge the strengths of both approaches, we propose the Learnable Cut Flow (LCF), a neural network that transforms the traditional cut selection into a fully differentiable, data-driven process. LCF implements two cut strategies-parallel, where observable distributions are treated independently, and sequential, where prior cuts shape subsequent ones-to flexibly determine optimal boundaries. Building on this, we introduce the Learnable Importance, a metric that quantifies feature importance and adjusts their contributions to the loss accordingly, offering model-driven insights unlike ad-hoc metrics. To ensure differentiability, a modified loss function replaces hard cuts with mask operations, preserving data shape throughout the training process. LCF is tested on six varied mock datasets and a realistic diboson vs. QCD dataset. Results demonstrate that LCF (1) accurately learns cut boundaries across typical feature distributions in both parallel and sequential strategies, (2) assigns higher importance to discriminative features with minimal overlap, (3) handles redundant or correlated features robustly, and (4) performs effectively in real-world scenarios. In diboson dataset, LCF initially underperforms boosted decision trees and multiplayer perceptrons when using all observables. However, pruning less critical features-guided by learned importance-boosts its performance to match or exceed these baselines. LCF bridges the gap between traditional cut flow method and modern black-box neural networks, delivering actionable insights into the training process and feature importance.
- Abstract(参考訳): ニューラルネットワークは高エネルギー物理学におけるタスクの強力なパラダイムとして登場したが、その不透明なトレーニングプロセスはそれらをブラックボックスとして表現している。
対照的に、従来のカットフロー法は単純さと解釈性を提供するが、最適な境界を識別するためには人間の努力が必要である。
両アプローチの長所をマージするために,従来のカット選択を,完全に微分可能なデータ駆動プロセスに変換するニューラルネットワークであるLearnerable Cut Flow (LCF)を提案する。
LCFは2つのカット戦略パラレルを実装しており、観測可能な分布は独立に扱われる。
これに基づいて、我々は、特徴の重要性を定量化し、その損失に対する貢献を調整する指標であるLearningable Importanceを導入し、アドホックな指標とは違ってモデル駆動的な洞察を提供する。
識別性を確保するために、修正された損失関数は、ハードカットをマスク操作に置き換え、トレーニングプロセス全体を通してデータ形状を保存する。
LCFは6つのさまざまなモックデータセットと、現実的なダイボソン対QCDデータセットでテストされている。
その結果, LCF (1) は, 並列戦略とシーケンシャル戦略の両方において, 典型的な特徴分布間の切断境界を正確に学習し, (2) 重複の少ない識別的特徴に高い重要性を割り当て, (3) 冗長性や相関性を強く扱い, (4) 実世界のシナリオにおいて効果的に機能することを示した。
ダイボソンデータセットでは、全てのオブザーバブルを使用すると、当初LCFは決定木やマルチプレイヤパーセプトロンの強化を過小評価する。
しかし、学習の重要さによって導かれる、批判的でない特徴を刈り取ることは、これらの基本線に合うか、超えるように、そのパフォーマンスを後押しする。
LCFは従来のカットフロー法と現代のブラックボックスニューラルネットワークのギャップを埋め、トレーニングプロセスと機能の重要性に関する実用的な洞察を提供する。
関連論文リスト
- Saliency Assisted Quantization for Neural Networks [0.0]
本稿では,学習期間中にリアルタイムな説明を提供することにより,深層学習モデルのブラックボックスの性質に対処する。
我々は資源制約に対処するために確立された量子化手法を用いる。
提案手法の有効性を評価するため,量子化が畳み込みニューラルネットワークの解釈可能性や精度に与える影響について検討する。
論文 参考訳(メタデータ) (2024-11-07T05:16:26Z) - SHERL: Synthesizing High Accuracy and Efficient Memory for Resource-Limited Transfer Learning [63.93193829913252]
本稿では,リソース制限シナリオに対するSHERLと呼ばれる革新的なMETL戦略を提案する。
初期経路では、中間出力は反冗長動作によって統合される。
遅延ルートでは、最小限の遅延事前トレーニングされたレイヤを利用することで、メモリオーバーヘッドのピーク需要を軽減できる。
論文 参考訳(メタデータ) (2024-07-10T10:22:35Z) - Robust and Explainable Fine-Grained Visual Classification with Transfer Learning: A Dual-Carriageway Framework [0.799543372823325]
我々は、Dual-Carriageway Framework (DCF) という自動ベストスーツトレーニングソリューション検索フレームワークを提案する。
3つの畳み込みニューラルネットワーク(ResNet18、ResNet34、Inception-v3)を用いてDCFの有効性を検証する。
その結果、既存のデータセットと新しいデータセットでそれぞれ2.13%、1.23%の微調整パスのパフォーマンスが向上した。
論文 参考訳(メタデータ) (2024-05-09T15:41:10Z) - Towards Continual Learning Desiderata via HSIC-Bottleneck
Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。
提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文 参考訳(メタデータ) (2024-01-17T09:01:29Z) - Slimmable Networks for Contrastive Self-supervised Learning [69.9454691873866]
自己教師付き学習は、大規模なモデルを事前訓練する上で大きな進歩を遂げるが、小さなモデルでは苦労する。
追加の教師を必要とせず、訓練済みの小型モデルを得るための1段階のソリューションも導入する。
スリム化可能なネットワークは、完全なネットワークと、様々なネットワークを得るために一度にトレーニングできるいくつかの重み共有サブネットワークから構成される。
論文 参考訳(メタデータ) (2022-09-30T15:15:05Z) - Distributed Contrastive Learning for Medical Image Segmentation [16.3860181959878]
監視されたディープラーニングは、高いパフォーマンスを達成するために大量のラベル付きデータを必要とします。
医用画像解析では、各サイトは限られた量のデータとラベルしか持たず、学習を効果的にしない。
アノテーションを限定した医用画像セグメンテーションのための2つのフェデレーション型自己教師型学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-07T20:47:05Z) - DCF-ASN: Coarse-to-fine Real-time Visual Tracking via Discriminative
Correlation Filter and Attentional Siamese Network [9.01402976480327]
識別相関フィルタ(DCF)とシアムネットワークは視覚追跡タスクにおいて有望な性能を達成している。
オンラインアップデーティングdcfモジュールを用いて,目標状態の概算を行う粗粒度追跡フレームワークを提案する。
提案したDCF-ASNは、トラッキング効率が良く、最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-03-19T03:01:21Z) - Towards Accurate Knowledge Transfer via Target-awareness Representation
Disentanglement [56.40587594647692]
本稿では,TRED(Target-Awareness Representation Disentanglement)の概念を取り入れた新しいトランスファー学習アルゴリズムを提案する。
TREDは、対象のタスクに関する関連する知識を元のソースモデルから切り離し、ターゲットモデルを微調整する際、レギュレータとして使用する。
各種実世界のデータセットを用いた実験により,本手法は標準微調整を平均2%以上安定的に改善することが示された。
論文 参考訳(メタデータ) (2020-10-16T17:45:08Z) - MetricUNet: Synergistic Image- and Voxel-Level Learning for Precise CT
Prostate Segmentation via Online Sampling [66.01558025094333]
本稿では,前立腺領域を高速に局在させる第1段階と,前立腺領域を正確に区分する第2段階の2段階のフレームワークを提案する。
マルチタスクネットワークにおけるボクセルワイドサンプリングによる新しいオンラインメトリック学習モジュールを提案する。
本手法は,従来のクロスエントロピー学習法やDice損失学習法と比較して,より代表的なボクセルレベルの特徴を効果的に学習することができる。
論文 参考訳(メタデータ) (2020-05-15T10:37:02Z) - Dynamic Hierarchical Mimicking Towards Consistent Optimization
Objectives [73.15276998621582]
一般化能力を高めたCNN訓練を推進するための汎用的特徴学習機構を提案する。
DSNに部分的にインスパイアされた私たちは、ニューラルネットワークの中間層から微妙に設計されたサイドブランチをフォークしました。
カテゴリ認識タスクとインスタンス認識タスクの両方の実験により,提案手法の大幅な改善が示された。
論文 参考訳(メタデータ) (2020-03-24T09:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。