論文の概要: Subject Information Extraction for Novelty Detection with Domain Shifts
- arxiv url: http://arxiv.org/abs/2504.21247v1
- Date: Wed, 30 Apr 2025 01:04:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 22:56:07.209294
- Title: Subject Information Extraction for Novelty Detection with Domain Shifts
- Title(参考訳): ドメインシフトを用いた新規性検出のための主題情報抽出
- Authors: Yangyang Qu, Dazhi Fu, Jicong Fan,
- Abstract要約: 非教師なしノベルティ検出(UND)は、医療診断、サイバーセキュリティ、産業品質管理などの分野において不可欠である。
既存のUND法の多くは、トレーニングデータと通常のデータのテストは同じドメインに由来すると仮定している。
実際のシナリオでは、通常のテストやトレーニングデータでは、異なるドメインから派生することが一般的である。
- 参考スコア(独自算出の注目度): 20.89386559615201
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised novelty detection (UND), aimed at identifying novel samples, is essential in fields like medical diagnosis, cybersecurity, and industrial quality control. Most existing UND methods assume that the training data and testing normal data originate from the same domain and only consider the distribution variation between training data and testing data. However, in real scenarios, it is common for normal testing and training data to originate from different domains, a challenge known as domain shift. The discrepancies between training and testing data often lead to incorrect classification of normal data as novel by existing methods. A typical situation is that testing normal data and training data describe the same subject, yet they differ in the background conditions. To address this problem, we introduce a novel method that separates subject information from background variation encapsulating the domain information to enhance detection performance under domain shifts. The proposed method minimizes the mutual information between the representations of the subject and background while modelling the background variation using a deep Gaussian mixture model, where the novelty detection is conducted on the subject representations solely and hence is not affected by the variation of domains. Extensive experiments demonstrate that our model generalizes effectively to unseen domains and significantly outperforms baseline methods, especially under substantial domain shifts between training and testing data.
- Abstract(参考訳): 新規サンプルの特定を目的とした無監督ノベルティ検出(UND)は、医療診断、サイバーセキュリティ、産業品質管理などの分野において不可欠である。
既存のUND手法の多くは、トレーニングデータと通常のデータのテストは同じドメインに由来すると仮定し、トレーニングデータとテストデータの間の分散変動のみを考慮する。
しかし、実際のシナリオでは、通常のテストやトレーニングデータでは、異なるドメインから派生することが一般的であり、ドメインシフトと呼ばれる課題である。
トレーニングデータとテストデータの相違は、しばしば既存の方法によって、通常のデータの誤った分類につながる。
典型的な状況は、通常のデータテストとトレーニングデータは同じ主題を記述しているが、背景条件が異なることである。
この問題に対処するために,ドメイン情報をカプセル化した背景変動から対象情報を分離し,ドメインシフトによる検出性能を向上させる手法を提案する。
提案手法は,対象表現にのみ新規性検出を行い,ドメインの変動の影響を受けない深いガウス混合モデルを用いて背景変動をモデル化しながら,対象と背景の表現の相互情報を最小化する。
大規模な実験により,本モデルは未確認領域を効果的に一般化し,ベースライン法,特にトレーニングデータとテストデータ間の領域シフトにおいて著しく優れることが示された。
関連論文リスト
- A Dataset for Semantic Segmentation in the Presence of Unknowns [49.795683850385956]
既存のデータセットは、既知のものや未知のもののみの評価を可能にするが、両方ではない。
乱雑な実環境からの多様な異常な入力を特徴とする,新しい異常セグメンテーションデータセットISSUを提案する。
データセットは、既存の異常セグメンテーションデータセットの2倍大きい。
論文 参考訳(メタデータ) (2025-03-28T10:31:01Z) - SALUDA: Surface-based Automotive Lidar Unsupervised Domain Adaptation [62.889835139583965]
我々は、ソースデータとターゲットデータに基づいて、暗黙の基盤となる表面表現を同時に学習する教師なし補助タスクを導入する。
両方のドメインが同じ遅延表現を共有しているため、モデルは2つのデータソース間の不一致を許容せざるを得ない。
実験の結果,本手法は実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-
論文 参考訳(メタデータ) (2023-04-06T17:36:23Z) - Anomaly Detection under Distribution Shift [24.094884041252044]
異常検出(AD)は、通常のトレーニングサンプルのセットからパターンを学習し、テストデータの異常サンプルを特定することを目的とした、重要な機械学習タスクである。
既存のAD研究の多くは、トレーニングデータとテストデータは同一のデータ分布から引き出されると仮定しているが、テストデータは大きな分散シフトを持つ可能性がある。
トレーニングおよび推論段階のOOD標準試料の分布ギャップを最小化することにより, 多様な分布シフトに対する新しいロバストADアプローチを導入する。
論文 参考訳(メタデータ) (2023-03-24T07:39:08Z) - Single-domain Generalization in Medical Image Segmentation via Test-time
Adaptation from Shape Dictionary [64.5632303184502]
ドメインの一般化は通常、モデル学習のために複数のソースドメインからのデータを必要とする。
本稿では,1つのソースドメインのみで最悪のシナリオ下でモデルを学習し,異なる未確認対象ドメインに直接一般化する,重要な単一ドメインの一般化問題について考察する。
本稿では,領域間で不変なセグメンテーションのセグメンテーション先情報を抽出し,統合する医用画像セグメンテーションにおいて,この問題に対処する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-06-29T08:46:27Z) - IDANI: Inference-time Domain Adaptation via Neuron-level Interventions [24.60778570114818]
本稿では,ニューロンレベルの介入を用いたドメイン適応(DA)の新しいアプローチを提案する。
特定のニューロンにおける各テスト例の表現を変更した結果、ソースドメインからの逆実例が得られます。
実験の結果,本手法は未確認領域の性能向上を図っている。
論文 参考訳(メタデータ) (2022-06-01T06:39:28Z) - Source-Free Domain Adaptation via Distribution Estimation [106.48277721860036]
ドメイン適応は、ラベル付きソースドメインから学んだ知識を、データ分散が異なるラベル付きターゲットドメインに転送することを目的としています。
近年,ソースフリードメイン適応 (Source-Free Domain Adaptation, SFDA) が注目されている。
本研究では,SFDA-DEと呼ばれる新しいフレームワークを提案し,ソース分布推定によるSFDAタスクに対処する。
論文 参考訳(メタデータ) (2022-04-24T12:22:19Z) - Domain Generalization via Gradient Surgery [5.38147998080533]
現実のアプリケーションでは、マシンラーニングモデルは、トレーニングとテストドメイン間のデータ分散の変化があるシナリオに直面します。
本研究では,ドメインシフトのシナリオに現れる矛盾する勾配を特徴付けるとともに,新たな勾配合意戦略を考案する。
論文 参考訳(メタデータ) (2021-08-03T16:49:25Z) - A Brief Review of Domain Adaptation [1.2043574473965317]
本稿では、ラベルがソースドメインでのみ利用可能となる、教師なしドメイン適応に焦点を当てる。
ドメイン適応問題に対処することを目的とした、浅層および深層ドメイン適応アプローチが成功している。
論文 参考訳(メタデータ) (2020-10-07T07:05:32Z) - A Review of Single-Source Deep Unsupervised Visual Domain Adaptation [81.07994783143533]
大規模ラベル付きトレーニングデータセットにより、ディープニューラルネットワークは、幅広いベンチマークビジョンタスクを拡張できるようになった。
多くのアプリケーションにおいて、大量のラベル付きデータを取得するのは非常に高価で時間を要する。
限られたラベル付きトレーニングデータに対処するため、大規模ラベル付きソースドメインでトレーニングされたモデルを、疎ラベルまたは未ラベルのターゲットドメインに直接適用しようと試みている人も多い。
論文 参考訳(メタデータ) (2020-09-01T00:06:50Z) - Adaptive Risk Minimization: Learning to Adapt to Domain Shift [109.87561509436016]
ほとんどの機械学習アルゴリズムの基本的な前提は、トレーニングとテストデータは、同じ基礎となる分布から引き出されることである。
本研究では,学習データをドメインに構造化し,複数のテスト時間シフトが存在する場合の領域一般化の問題点について考察する。
本稿では、適応リスク最小化(ARM)の枠組みを紹介し、モデルがトレーニング領域に適応することを学ぶことで、効果的な適応のために直接最適化される。
論文 参考訳(メタデータ) (2020-07-06T17:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。