論文の概要: Stylist: Style-Driven Feature Ranking for Robust Novelty Detection
- arxiv url: http://arxiv.org/abs/2310.03738v1
- Date: Thu, 5 Oct 2023 17:58:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-06 13:08:50.379286
- Title: Stylist: Style-Driven Feature Ranking for Robust Novelty Detection
- Title(参考訳): Stylist:ロバストノベルティ検出のためのスタイル駆動機能ランキング
- Authors: Stefan Smeu, Elena Burceanu, Emanuela Haller, Andrei Liviu Nicolicioiu
- Abstract要約: 本稿では,タスクに関連する意味的・内容的変化と,無関係なスタイル的変化に分離する形式化を提案する。
この形式化の中で、ロバストな新規性検出を、スタイルの分布シフトに頑健でありながら意味的変化を見つけるタスクとして定義する。
提案手法は, 相関関係に係わる特徴を除去し, 新規検出性能を向上することを示す。
- 参考スコア(独自算出の注目度): 8.402607231390606
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Novelty detection aims at finding samples that differ in some form from the
distribution of seen samples. But not all changes are created equal. Data can
suffer a multitude of distribution shifts, and we might want to detect only
some types of relevant changes. Similar to works in out-of-distribution
generalization, we propose to use the formalization of separating into semantic
or content changes, that are relevant to our task, and style changes, that are
irrelevant. Within this formalization, we define the robust novelty detection
as the task of finding semantic changes while being robust to style
distributional shifts. Leveraging pretrained, large-scale model
representations, we introduce Stylist, a novel method that focuses on dropping
environment-biased features. First, we compute a per-feature score based on the
feature distribution distances between environments. Next, we show that our
selection manages to remove features responsible for spurious correlations and
improve novelty detection performance. For evaluation, we adapt domain
generalization datasets to our task and analyze the methods behaviors. We
additionally built a large synthetic dataset where we have control over the
spurious correlations degree. We prove that our selection mechanism improves
novelty detection algorithms across multiple datasets, containing both
stylistic and content shifts.
- Abstract(参考訳): 新規検出は、観察されたサンプルの分布と何らかの形で異なるサンプルを見つけることを目的としている。
しかし、すべての変更が等しく作成されるわけではない。
データは多岐にわたる分散シフトに苦しむ可能性があり、関連する変更の種類だけを検出したい場合もあります。
アウト・オブ・ディストリビューションの一般化における作業と同様に、我々のタスクと関係のある意味的・内容的変化と、無関係なスタイル変化の分離を形式化することを提案する。
この形式化の中で、ロバストな新規性検出は、スタイル分布シフトにロバストでありながら意味的変化を見つけるタスクとして定義する。
事前学習された大規模モデル表現を活用して,環境に偏りのある機能をドロップする,新しい手法であるstylistを提案する。
まず,環境間の特徴分布距離に基づいて特徴点ごとのスコアを計算する。
次に,この選択により,突発的相関の原因となる特徴を取り除き,新規検出性能を向上できることを示す。
評価のために、ドメイン一般化データセットをタスクに適用し、メソッドの振る舞いを分析する。
さらに、スプリアス相関度をコントロールする大規模な合成データセットを構築しました。
我々の選択メカニズムは、複数のデータセットにまたがる新規性検出アルゴリズムを改善し、スタイリスティックおよびコンテンツシフトの両方を含むことを示す。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Environment-biased Feature Ranking for Novelty Detection Robustness [8.402607231390606]
本研究は,意味的内容の面での新規性の検出を目的とした,堅牢な新規性検出の課題に対処する。
本稿では,事前学習した埋め込みとマルチ環境設定から始める手法を提案し,その環境焦点に基づいて特徴をランク付けする手法を提案する。
論文 参考訳(メタデータ) (2023-09-21T17:58:26Z) - Self-Evolution Learning for Mixup: Enhance Data Augmentation on Few-Shot
Text Classification Tasks [75.42002070547267]
テキスト分類におけるデータ拡張のための自己進化学習(SE)に基づくミックスアップ手法を提案する。
モデル出力と原サンプルの1つのホットラベルを線形に補間して,新しい軟質なラベル混在を生成する,新しいインスタンス固有ラベル平滑化手法を提案する。
論文 参考訳(メタデータ) (2023-05-22T23:43:23Z) - Even Small Correlation and Diversity Shifts Pose Dataset-Bias Issues [19.4921353136871]
実験サンプルがトレーニング中に見つからないパターンを示す場合の多様性シフトと、テストデータが観察された不変性と急激な特徴の異なる相関を示す場合の相関シフトの2種類について検討した。
そこで我々は,両タイプのシフトをデータセットを用いて分析し,制御可能な方法で共存する統合プロトコルを提案する。
論文 参考訳(メタデータ) (2023-05-09T23:40:23Z) - Intra-class Adaptive Augmentation with Neighbor Correction for Deep
Metric Learning [99.14132861655223]
深層学習のためのクラス内適応拡張(IAA)フレームワークを提案する。
クラスごとのクラス内変動を合理的に推定し, 適応型合成試料を生成し, 硬質試料の採掘を支援する。
本手法は,検索性能の最先端手法を3%~6%向上させる。
論文 参考訳(メタデータ) (2022-11-29T14:52:38Z) - Fake It Till You Make It: Near-Distribution Novelty Detection by
Score-Based Generative Models [54.182955830194445]
既存のモデルは、いわゆる"近く分布"設定で失敗するか、劇的な低下に直面します。
本稿では, スコアに基づく生成モデルを用いて, 合成近分布異常データを生成することを提案する。
本手法は,9つのノベルティ検出ベンチマークにおいて,近分布ノベルティ検出を6%改善し,最先端のノベルティ検出を1%から5%パスする。
論文 参考訳(メタデータ) (2022-05-28T02:02:53Z) - Deep learning model solves change point detection for multiple change
types [69.77452691994712]
変更点検出は、データ分散の急激な障害をキャッチすることを目的としている。
本稿では,マルチディストリビューションシナリオにおけるアプローチを提案する。
論文 参考訳(メタデータ) (2022-04-15T09:44:21Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z) - Incremental Unsupervised Domain-Adversarial Training of Neural Networks [17.91571291302582]
教師付き統計学習の文脈では通常、トレーニングセットはテストサンプルを描画する同じ分布から来ていると仮定される。
ここでは、モデルが新しいドメインに反復的に適応される段階的な視点から、別の道を選び、問題にアプローチします。
その結果,いくつかのデータセットにおける非増加事例に対する明らかな改善が報告され,他の最先端のドメイン適応アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2020-01-13T09:54:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。