論文の概要: Resonant Anomaly Detection with Multiple Reference Datasets
- arxiv url: http://arxiv.org/abs/2212.10579v1
- Date: Tue, 20 Dec 2022 19:00:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 14:30:05.619880
- Title: Resonant Anomaly Detection with Multiple Reference Datasets
- Title(参考訳): 複数の参照データセットを用いた共鳴異常検出
- Authors: Mayee F. Chen, Benjamin Nachman, Frederic Sala
- Abstract要約: 我々は、複数の参照データセットが利用可能な設定に対して、CWoLaとSALADの一般化を提案する。
実データ分析と合成データ解析を併用して,様々な環境下での性能向上を実証した。
- 参考スコア(独自算出の注目度): 13.336249986643567
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An important class of techniques for resonant anomaly detection in high
energy physics builds models that can distinguish between reference and target
datasets, where only the latter has appreciable signal. Such techniques,
including Classification Without Labels (CWoLa) and Simulation Assisted
Likelihood-free Anomaly Detection (SALAD) rely on a single reference dataset.
They cannot take advantage of commonly-available multiple datasets and thus
cannot fully exploit available information. In this work, we propose
generalizations of CWoLa and SALAD for settings where multiple reference
datasets are available, building on weak supervision techniques. We demonstrate
improved performance in a number of settings with realistic and synthetic data.
As an added benefit, our generalizations enable us to provide finite-sample
guarantees, improving on existing asymptotic analyses.
- Abstract(参考訳): 高エネルギー物理学における共鳴異常検出のための重要な種類の技術は、参照データセットとターゲットデータセットを区別できるモデルを構築している。
分類不要ラベル (CWoLa) やSimulation Assisted Likelihood-free Anomaly Detection (SALAD) などの手法は単一の参照データセットに依存している。
一般的に利用可能な複数のデータセットを活用できないため、利用可能な情報を十分に活用することはできない。
そこで本研究では,複数の参照データセットが利用できるような環境下でのCWoLaとSALADの一般化を提案する。
実データと合成データを用いて,様々な設定で性能が向上することを示す。
さらなる利点として、我々の一般化は有限サンプル保証を提供し、既存の漸近解析を改善します。
関連論文リスト
- A Framework for Fine-Tuning LLMs using Heterogeneous Feedback [69.51729152929413]
ヘテロジニアスフィードバックを用いた大規模言語モデル(LLM)の微調整フレームワークを提案する。
まず、不均一なフィードバックデータをSFTやRLHFなどの手法と互換性のある単一の監視形式にまとめる。
次に、この統合されたフィードバックデータセットから、性能向上を得るために高品質で多様なサブセットを抽出する。
論文 参考訳(メタデータ) (2024-08-05T23:20:32Z) - Bayesian Detector Combination for Object Detection with Crowdsourced Annotations [49.43709660948812]
制約のない画像できめ細かなオブジェクト検出アノテーションを取得するのは、時間がかかり、コストがかかり、ノイズに悩まされる。
ノイズの多いクラウドソースアノテーションでオブジェクト検出をより効果的に訓練するための新しいベイズ検出結合(BDC)フレームワークを提案する。
BDCはモデルに依存しず、アノテータのスキルレベルに関する事前の知識を必要とせず、既存のオブジェクト検出モデルとシームレスに統合される。
論文 参考訳(メタデータ) (2024-07-10T18:00:54Z) - Anomaly Detection of Tabular Data Using LLMs [54.470648484612866]
我々は,事前訓練された大規模言語モデル (LLM) がゼロショットバッチレベルの異常検出器であることを示す。
本稿では,実異常検出におけるLCMの潜在性を明らかにするために,エンドツーエンドの微調整手法を提案する。
論文 参考訳(メタデータ) (2024-06-24T04:17:03Z) - ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - Kernel spectral joint embeddings for high-dimensional noisy datasets using duo-landmark integral operators [9.782959684053631]
本研究では、2つの独立に観測された高次元ノイズデータセットの結合埋め込みを実現する新しいカーネルスペクトル法を提案する。
得られた低次元埋め込みは、同時クラスタリング、データの可視化、デノイングなど、多くの下流タスクに利用できる。
論文 参考訳(メタデータ) (2024-05-20T18:29:36Z) - DiffSpectralNet : Unveiling the Potential of Diffusion Models for
Hyperspectral Image Classification [6.521187080027966]
我々は拡散と変圧器技術を組み合わせたDiffSpectralNetと呼ばれる新しいネットワークを提案する。
まず,拡散モデルに基づく教師なし学習フレームワークを用いて,高レベル・低レベルのスペクトル空間的特徴を抽出する。
この拡散法はスペクトル空間の特徴を多様かつ有意義に抽出し,HSI分類の改善につながる。
論文 参考訳(メタデータ) (2023-10-29T15:26:37Z) - Unsupervised Anomaly Detection via Nonlinear Manifold Learning [0.0]
異常は、残りのデータから著しく逸脱するサンプルであり、その検出は機械学習モデルを構築する上で大きな役割を果たす。
非線形多様体学習に基づく頑健で効率的かつ解釈可能な手法を導入し,教師なし設定における異常を検出する。
論文 参考訳(メタデータ) (2023-06-15T18:48:10Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。