論文の概要: Unsupervised Discovery, Control, and Disentanglement of Semantic
Attributes with Applications to Anomaly Detection
- arxiv url: http://arxiv.org/abs/2002.11169v4
- Date: Mon, 7 Jun 2021 15:50:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 21:56:26.815309
- Title: Unsupervised Discovery, Control, and Disentanglement of Semantic
Attributes with Applications to Anomaly Detection
- Title(参考訳): 意味属性の教師なし発見・制御・分散と異常検出への応用
- Authors: William Paul, I-Jeng Wang, Fady Alajaji, Philippe Burlina
- Abstract要約: 画像の意味的属性を制御する潜在因子を検出する教師なし生成表現に着目する。
a)マルチスケール生成モデルと相互情報(MI)を組み合わせたネットワークアーキテクチャを提案する。
b) について、解析的結果(Lemma 1) を導出し、2つの関連する異なる概念に明瞭さをもたらす。
- 参考スコア(独自算出の注目度): 15.817227809141116
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Our work focuses on unsupervised and generative methods that address the
following goals: (a) learning unsupervised generative representations that
discover latent factors controlling image semantic attributes, (b) studying how
this ability to control attributes formally relates to the issue of latent
factor disentanglement, clarifying related but dissimilar concepts that had
been confounded in the past, and (c) developing anomaly detection methods that
leverage representations learned in (a). For (a), we propose a network
architecture that exploits the combination of multiscale generative models with
mutual information (MI) maximization. For (b), we derive an analytical result
(Lemma 1) that brings clarity to two related but distinct concepts: the ability
of generative networks to control semantic attributes of images they generate,
resulting from MI maximization, and the ability to disentangle latent space
representations, obtained via total correlation minimization. More
specifically, we demonstrate that maximizing semantic attribute control
encourages disentanglement of latent factors. Using Lemma 1 and adopting MI in
our loss function, we then show empirically that, for image generation tasks,
the proposed approach exhibits superior performance as measured in the quality
and disentanglement trade space, when compared to other state of the art
methods, with quality assessed via the Frechet Inception Distance (FID), and
disentanglement via mutual information gap. For (c), we design several systems
for anomaly detection exploiting representations learned in (a), and
demonstrate their performance benefits when compared to state-of-the-art
generative and discriminative algorithms. The above contributions in
representation learning have potential applications in addressing other
important problems in computer vision, such as bias and privacy in AI.
- Abstract(参考訳): 我々の研究は、以下の目標に対処する教師なしおよび生成的手法に焦点を当てている。
(a)画像意味属性を制御する潜在要因を発見する教師なし生成表現の学習
(b)この属性を制御できる能力が、潜伏因子の絡み合いの問題に正式にどのように関係しているかの研究、過去に合併した関連しているが異質な概念の明確化、及び
(c)学習した表現を活用する異常検出手法の開発
(a)
のために
a) マルチスケール生成モデルと相互情報(MI)の最大化を組み合わせたネットワークアーキテクチャを提案する。
のために
(b) 解析結果(Lemma 1) を導出し, 生成ネットワークが生成した画像の意味的属性を制御し, MI の最大化と, 全体の相関最小化によって得られた潜在空間表現を解離する能力の2つの概念に明瞭さをもたらす。
より具体的には、意味属性制御の最大化が潜在要因の絡み合いを促進することを実証する。
そこで,Lemma 1 と MI を損失関数に適用することにより,画像生成タスクにおいて,Frechet Inception Distance (FID) による品質評価と,相互情報ギャップによる不整合性による品質評価により,技術手法の他の状態と比較して,品質および非絡合性取引空間における優れた性能を示すことを示す。
のために
c) 学習した表現を利用した異常検出システムをいくつか設計する。
(a)、最先端の生成および識別アルゴリズムと比較して性能上の利点を示す。
表現学習における上記の貢献は、aiにおけるバイアスやプライバシなど、コンピュータビジョンにおける他の重要な問題に対処するための潜在的な応用である。
関連論文リスト
- Multi-Modal Prompt Learning on Blind Image Quality Assessment [65.0676908930946]
画像品質評価(IQA)モデルは意味情報から大きな恩恵を受け、異なる種類のオブジェクトを明瞭に扱うことができる。
十分な注釈付きデータが不足している従来の手法では、セマンティックな認識を得るために、CLIPイメージテキスト事前学習モデルをバックボーンとして使用していた。
近年のアプローチでは、このミスマッチに即時技術を使って対処する試みがあるが、これらの解決策には欠点がある。
本稿では、IQAのための革新的なマルチモーダルプロンプトベースの手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:45:32Z) - Improving Vision Anomaly Detection with the Guidance of Language
Modality [64.53005837237754]
本稿では,マルチモーダルの観点から視覚モダリティの課題に取り組む。
本稿では,冗長な情報問題とスパース空間問題に対処するために,クロスモーダルガイダンス(CMG)を提案する。
視覚異常検出のためのよりコンパクトな潜在空間を学習するために、CMLEは言語モダリティから相関構造行列を学習する。
論文 参考訳(メタデータ) (2023-10-04T13:44:56Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Learning Prompt-Enhanced Context Features for Weakly-Supervised Video
Anomaly Detection [37.99031842449251]
弱い監督下での映像異常検出は重大な課題を呈する。
本稿では,効率的なコンテキストモデリングとセマンティック識別性の向上に焦点をあてた,弱教師付き異常検出フレームワークを提案する。
提案手法は,特定の異常なサブクラスの検出精度を大幅に向上させ,その実用的価値と有効性を裏付けるものである。
論文 参考訳(メタデータ) (2023-06-26T06:45:16Z) - Variational Distillation for Multi-View Learning [104.17551354374821]
我々は,多視点表現学習における2つの重要な特徴を利用するために,様々な情報ボトルネックを設計する。
厳密な理論的保証の下で,本手法は,観察とセマンティックラベルの内在的相関の把握を可能にする。
論文 参考訳(メタデータ) (2022-06-20T03:09:46Z) - Generative and Contrastive Self-Supervised Learning for Graph Anomaly
Detection [14.631674952942207]
グラフ異常検出のための自己教師付き学習法(SL-GAD)を提案する。
提案手法では,対象ノードに基づいて異なるコンテキストサブグラフを構築し,生成属性回帰とマルチビューコントラスト学習という2つのモジュールを用いて異常検出を行う。
提案手法は,6つのベンチマークデータセットに対して広範な実験を行い,提案手法が最先端の手法よりも大きなマージンで優れていることを示した。
論文 参考訳(メタデータ) (2021-08-23T02:15:21Z) - Proactive Pseudo-Intervention: Causally Informed Contrastive Learning
For Interpretable Vision Models [103.64435911083432]
PPI(Proactive Pseudo-Intervention)と呼ばれる新しい対照的な学習戦略を提案する。
PPIは、因果関係のない画像の特徴を保護するために積極的に介入する。
また,重要な画像画素を識別するための,因果的に通知された新たなサリエンスマッピングモジュールを考案し,モデル解釈の容易性を示す。
論文 参考訳(メタデータ) (2020-12-06T20:30:26Z) - Two-Level Adversarial Visual-Semantic Coupling for Generalized Zero-shot
Learning [21.89909688056478]
トレーニング中に推論ネットワークを用いて生成ネットワークを増強する2段階のジョイントアイデアを提案する。
これにより、ビジュアルドメインとセマンティックドメイン間の効果的な知識伝達のための強力な相互モーダル相互作用が提供される。
提案手法は,4つのベンチマークデータセットに対して,いくつかの最先端手法に対して評価し,その性能を示す。
論文 参考訳(メタデータ) (2020-07-15T15:34:09Z) - DisCont: Self-Supervised Visual Attribute Disentanglement using Context
Vectors [6.385006149689549]
本稿では、画像内の構造的帰納バイアスを利用して複数の属性をアンタングル化する自己教師型フレームワークDisContを提案する。
近年のコントラスト学習パラダイムの急激な増加により,我々のモデルは,自己教師付きコントラスト学習アルゴリズムと教師なし非教師付きアンタングルメントのギャップを埋める。
論文 参考訳(メタデータ) (2020-06-10T15:29:20Z) - Graph Representation Learning via Graphical Mutual Information
Maximization [86.32278001019854]
本稿では,入力グラフとハイレベルな隠蔽表現との相関を測る新しい概念であるGMIを提案する。
我々は,グラフニューラルエンコーダの入力と出力の間でGMIを最大化することで訓練された教師なし学習モデルを開発する。
論文 参考訳(メタデータ) (2020-02-04T08:33:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。