Fugu-MT 論文翻訳(概要): Detecting Scarce and Sparse Anomalous: Solving Dual Imbalance in Multi-Instance Learning

論文の概要: Detecting Scarce and Sparse Anomalous: Solving Dual Imbalance in Multi-Instance Learning

arxiv url: http://arxiv.org/abs/2503.13562v3
Date: Fri, 26 Sep 2025 14:02:05 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-29 14:23:57.287893
Title: Detecting Scarce and Sparse Anomalous: Solving Dual Imbalance in Multi-Instance Learning
Title（参考訳）: スカースとスパース異常の検出:マルチインスタンス学習における双対不均衡の解決
Authors: Lin-Han Jia, Lan-Zhe Guo, Zhi Zhou, Si-Ye Han, Zi-Wen Li, Yu-Feng Li,
Abstract要約: 実世界のアプリケーションでは、非常にスパースな異常のある異常なサンプルを検出することは極めて困難である。そこで我々は,BFGPU(Ba balanced Fine-Grained Positive-Unlabeled)という新しいフレームワークを提案する。
参考スコア（独自算出の注目度）: 26.7869141605306
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In real-world applications, it is highly challenging to detect anomalous samples with extremely sparse anomalies, as they are highly similar to and thus easily confused with normal samples. Moreover, the number of anomalous samples is inherently scarce. This results in a dual imbalance Multi-Instance Learning (MIL) problem, manifesting at both the macro and micro levels. To address this "needle-in-a-haystack problem", we find that MIL problem can be reformulated as a fine-grained PU learning problem. This allows us to address the imbalance issue in an unbiased manner using micro-level balancing mechanisms. To this end, we propose a novel framework, Balanced Fine-Grained Positive-Unlabeled (BFGPU)-based on rigorous theoretical foundations. Extensive experiments on both synthetic and real-world datasets demonstrate the effectiveness of BFGPU.
Abstract（参考訳）: 実世界のアプリケーションでは、非常にスパースな異常を伴う異常なサンプルを検出することは極めて困難であり、通常のサンプルと非常に類似しており、容易に混同される。さらに、異常サンプルの数は本質的に少ない。これにより、マクロレベルとマイクロレベルの両方で表される二重不均衡なマルチインスタンス学習(MIL)問題が発生する。この"needle-in-a-haystack"問題に対処するために、MIL問題は、きめ細かいPU学習問題として再構成可能であることを発見した。これにより、マイクロレベルのバランス機構を用いて、不均衡問題に偏りのない方法で対処することができる。そこで本研究では,厳密な理論的基礎に基づくバランスド・ファイン・グラインド・ポジティブ・アンラベル(BFGPU)の枠組みを提案する。合成データセットと実世界のデータセットの両方に対する大規模な実験は、BFGPUの有効性を実証している。

関連論文リスト

Distributionally Robust Multimodal Machine Learning [1.8788768422083866]
本稿では,マルチモーダル機械学習の理論的および実践的知見の両方を研究することを目的とした,分散ロバスト最適化(DRO)フレームワークを提案する。シミュレーション設定と実世界のデータセットの両方において,我々のアプローチが堅牢性を向上させることを実証的に実証した。
論文参考訳（メタデータ） (2025-11-07T21:18:35Z)
CAPMix: Robust Time Series Anomaly Detection Based on Abnormal Assumptions with Dual-Space Mixup [16.41978122704698]
時系列異常検出は不可欠だが困難な課題である。最近の異常仮定は、合成サンプルを注入し、識別モデルを訓練することにより、異常の欠如を軽減する。制御可能な異常拡張フレームワークであるCAPMixを提案する。
論文参考訳（メタデータ） (2025-09-08T08:15:12Z)
Robust Learnability of Sample-Compressible Distributions under Noisy or Adversarial Perturbations [0.723486289593299]
2018年、アシュティアーニらは、分布クラスの構造的性質として、元々リトルストーンとウォーマス (1986) によるエンハンブル圧縮性を再編成した。我々は、必要かつ十分な条件のセットを条件として、摂動サンプルからでも、サンプル圧縮可能なファミリーが学習可能であることを確証する。
論文参考訳（メタデータ） (2025-06-07T01:11:50Z)
FairSAM: Fair Classification on Corrupted Data Through Sharpness-Aware Minimization [12.178322948983263]
クリーンなデータに基づいてトレーニングされた画像分類モデルは、しばしば、破損したデータをテストする際に大きなパフォーマンス劣化に悩まされる。この劣化は全体的なパフォーマンスに影響を及ぼすだけでなく、様々な階層のサブグループに不均等に影響を与え、重要なアルゴリズムバイアスの懸念を引き起こす。既存の公平性を意識した機械学習手法は、性能格差を減らすことを目的としているが、データの破損に直面した場合、堅牢で公平な精度を維持することは困難である。我々は、アンダーラインFairnessを指向した戦略をアンダーラインSAMに統合した新しいフレームワークである textbfFairSAM を提案する。
論文参考訳（メタデータ） (2025-03-29T01:51:59Z)
Ensemble Debiasing Across Class and Sample Levels for Fairer Prompting Accuracy [17.610305828703957]
言語モデルは、強力な数発の学習者であり、テキスト分類タスクにおいて、全体的な精度が良好である。本稿では,クラス確率のフレキシブルな修正を実現するために,ポストホック非線形整数計画に基づくデバイアス法を提案する。本手法は,バランスの取れたクラスアキュラシーを用いて,最先端の総合的精度向上を実現する。
論文参考訳（メタデータ） (2025-03-07T05:34:31Z)
Rethinking Multiple Instance Learning: Developing an Instance-Level Classifier via Weakly-Supervised Self-Training [14.16923025335549]
複数インスタンス学習(MIL)問題は現在、バッグ分類またはインスタンス分類の観点から解決されている。我々は、MILを半教師付きインスタンス分類問題として定式化し、ラベル付きインスタンスとラベルなしインスタンスを全て活用できるようにした。本稿では,正の袋ラベルを用いてグローバルな制約を構築する,弱教師付き自己学習手法を提案する。
論文参考訳（メタデータ） (2024-08-09T01:53:41Z)
MAPL: Memory Augmentation and Pseudo-Labeling for Semi-Supervised Anomaly Detection [0.0]
メモリ拡張(Memory Augmentation)と擬似ラベル(Pseudo-Labeling, MAPL)と呼ばれる, 産業環境における表面欠陥検出のための新しいメソドロジーを導入する。この手法は、まず異常シミュレーション戦略を導入し、希少または未知の異常型を認識するモデルの能力を著しく改善する。入力データから直接異常領域を識別するために、MAPLによってエンドツーエンドの学習フレームワークが使用される。
論文参考訳（メタデータ） (2024-05-10T02:26:35Z)
DB-LLM: Accurate Dual-Binarization for Efficient LLMs [83.70686728471547]
大規模言語モデル(LLM)は自然言語処理の分野を著しく進歩させてきた。既存の超低ビット量子化は、常に深刻な精度低下を引き起こす。本稿では,LLM,すなわちDB-LLMのための新しいデュアルバイナライズ手法を提案する。
論文参考訳（メタデータ） (2024-02-19T09:04:30Z)
Learning with Imbalanced Noisy Data by Preventing Bias in Sample Selection [82.43311784594384]
実世界のデータセットには、ノイズの多いラベルだけでなく、クラス不均衡も含まれている。不均衡なデータセットにおけるノイズラベルに対処する,単純かつ効果的な手法を提案する。
論文参考訳（メタデータ） (2024-02-17T10:34:53Z)
Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文参考訳（メタデータ） (2023-12-19T13:17:43Z)
Learning with Complementary Labels Revisited: The Selected-Completely-at-Random Setting Is More Practical [66.57396042747706]
補完ラベル学習は、弱教師付き学習問題である。均一分布仮定に依存しない一貫したアプローチを提案する。相補的なラベル学習は、負のラベル付きバイナリ分類問題の集合として表現できる。
論文参考訳（メタデータ） (2023-11-27T02:59:17Z)
A Deep Instance Generative Framework for MILP Solvers Under Limited Data Availability [66.37474135424637]
我々は、MILPインスタンスのための最初の深層生成フレームワークであるG2MILPを提案する。 G2MILPはMILPインスタンスを二部グラフとして表現し、マスク付き変分オートエンコーダを元のグラフの一部を反復的に破損させ、置き換えて新しいグラフを生成する。生成されたMILPインスタンスの品質を評価するためのベンチマークスイートを設計する。
論文参考訳（メタデータ） (2023-10-04T13:34:34Z)
MSFlow: Multi-Scale Flow-based Framework for Unsupervised Anomaly Detection [124.52227588930543]
教師なし異常検出(UAD)は多くの研究の関心を集め、幅広い応用を推進している。不明瞭だが強力な統計モデルである正規化フローは、教師なしの方法で異常検出と局所化に適している。非対称な並列フローと融合フローからなるMSFlowと呼ばれる新しいマルチスケールフローベースフレームワークを提案する。我々のMSFlowは、検出AUORCスコアが99.7%、ローカライゼーションAUCROCスコアが98.8%、プロスコアが97.1%の新たな最先端技術を実現している。
論文参考訳（メタデータ） (2023-08-29T13:38:35Z)
RoSAS: Deep Semi-Supervised Anomaly Detection with Contamination-Resilient Continuous Supervision [21.393509817509464]
本稿では, テクスト汚染耐性連続監視信号を考案した, 半教師付き異常検出手法を提案する。当社のアプローチは、AUC-PRにおいて最先端の競合他社を20%-30%上回っている。
論文参考訳（メタデータ） (2023-07-25T04:04:49Z)
On Learning Latent Models with Multi-Instance Weak Supervision [57.18649648182171]
本稿では,複数の入力インスタンスに関連付けられた遷移関数$sigma$ラベルによって,教師信号が生成される弱い教師付き学習シナリオについて考察する。我々の問題は、潜在的な構造学習やニューロシンボリックな統合など、さまざまな分野で満たされている。
論文参考訳（メタデータ） (2023-06-23T22:05:08Z)
Revisiting Class Imbalance for End-to-end Semi-Supervised Object Detection [1.6249267147413524]
半教師付きオブジェクト検出(SSOD)は、擬似ラベルに基づくエンドツーエンド手法の開発において大きな進歩を遂げている。多くの手法は、擬似ラベルジェネレータの有効性を妨げるクラス不均衡のため、課題に直面している。本稿では,低品質な擬似ラベルの根本原因と,ラベル生成品質を改善するための新しい学習メカニズムについて検討する。
論文参考訳（メタデータ） (2023-06-04T06:01:53Z)
Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文参考訳（メタデータ） (2023-05-04T12:52:18Z)
Hard-normal Example-aware Template Mutual Matching for Industrial Anomaly Detection [78.734927709231]
異常検出器は、クエリー画像の未知の欠陥を検出し、ローカライズするために工業製造で広く使われている。これらの検出器は異常のないサンプルで訓練され、ほとんどの通常のサンプルと区別された異常を成功させた。しかし、ハードノーマルな例は、ほとんどの通常のサンプルから遠く離れており、しばしば既存の方法によって異常と誤認される。
論文参考訳（メタデータ） (2023-03-28T17:54:56Z)
Unbiased Multiple Instance Learning for Weakly Supervised Video Anomaly Detection [74.80595632328094]
弱監視ビデオ異常検出(WSVAD)における多重インスタンス学習(MIL)の優位性 We propose a new MIL framework: Unbiased MIL (UMIL) to learn unbiased anomaly features that improve WSVAD。
論文参考訳（メタデータ） (2023-03-22T08:11:22Z)
SoftMatch: Addressing the Quantity-Quality Trade-off in Semi-supervised Learning [101.86916775218403]
本稿では, サンプル重み付けを統一した定式化により, 一般的な擬似ラベル法を再検討する。トレーニング中の擬似ラベルの量と質を両立させることでトレードオフを克服するSoftMatchを提案する。実験では、画像、テキスト、不均衡な分類など、さまざまなベンチマークで大幅に改善されている。
論文参考訳（メタデータ） (2023-01-26T03:53:25Z)
Augment to Detect Anomalies with Continuous Labelling [10.646747658653785]
異常検出は、トレーニング観察と何らかの点で異なるサンプルを認識することである。最近の最先端のディープラーニングに基づく異常検出手法は、計算コスト、複雑さ、不安定な訓練手順、非自明な実装に悩まされている。我々は、軽量な畳み込みニューラルネットワークを訓練し、異常検出における最先端の性能に到達するための単純な学習手順を活用する。
論文参考訳（メタデータ） (2022-07-03T20:11:51Z)
Parallel MCMC Without Embarrassing Failures [19.429985676081618]
MCMCはデータパーティションで定義された(サブ)後続体上で並列に実行される。効率的ではあるが、このフレームワークは後部サンプリングの品質に非常に敏感である。我々はこの問題を緩和するための新しい組み合わせ戦略を提案する。
論文参考訳（メタデータ） (2022-02-22T20:17:46Z)
Uncertainty-aware Pseudo-label Selection for Positive-Unlabeled Learning [10.014356492742074]
本稿では,正の未ラベル学習環境における不均衡データセットとモデル校正の問題に取り組むことを提案する。マイノリティクラスからのシグナルを増強することにより、擬似ラベル付けはラベル付きデータセットをラベル付きデータセットから新しいサンプルで拡張する。 PUUPLは一連の実験において、高度に不均衡な設定で大幅な性能向上をもたらす。
論文参考訳（メタデータ） (2022-01-31T12:55:47Z)
SLA$^2$P: Self-supervised Anomaly Detection with Adversarial Perturbation [77.71161225100927]
異常検出は、機械学習の基本的な問題であるが、難しい問題である。本稿では,非教師付き異常検出のための新しい強力なフレームワークであるSLA$2$Pを提案する。
論文参考訳（メタデータ） (2021-11-25T03:53:43Z)
Toward Deep Supervised Anomaly Detection: Reinforcement Learning from Partially Labeled Anomaly Data [150.9270911031327]
本稿では,一部のラベル付き異常事例と大規模ラベルなしデータセットを用いた異常検出の問題点について考察する。既存の関連手法は、通常、一連の異常にまたがらない限られた異常例にのみ適合するか、ラベルのないデータから教師なしの学習を進めるかのいずれかである。そこで本研究では,ラベル付きおよびラベルなし両方の異常の検出をエンドツーエンドに最適化する,深層強化学習に基づくアプローチを提案する。
論文参考訳（メタデータ） (2020-09-15T03:05:39Z)
Towards Discriminability and Diversity: Batch Nuclear-norm Maximization under Label Insufficient Situations [154.51144248210338]
Batch Nuclear-norm Maximization (BNM) は、学習シナリオのラベルが不十分な場合の学習を促進するために提案されている。 BNMはライバルより優れており、既存のよく知られた手法でうまく機能する。
論文参考訳（メタデータ） (2020-03-27T05:04:24Z)
On Positive-Unlabeled Classification in GAN [130.43248168149432]
本稿では,標準GANに対する肯定的かつ未ラベルの分類問題を定義する。その後、GANにおける差別者の訓練を安定させる新しい手法が導かれる。
論文参考訳（メタデータ） (2020-02-04T05:59:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。