論文の概要: RSC-VAE: Recoding Semantic Consistency Based VAE for One-Class Novelty
Detection
- arxiv url: http://arxiv.org/abs/2305.04275v1
- Date: Sun, 7 May 2023 13:36:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 16:41:49.123550
- Title: RSC-VAE: Recoding Semantic Consistency Based VAE for One-Class Novelty
Detection
- Title(参考訳): rsc-vae: 一クラス新規検出のための意味的一貫性に基づく再コーディング
- Authors: Ge Zhang, Wangzhe Du
- Abstract要約: 我々は、典型的な再構成モデルである変分自動エンコーダ(VAE)の潜時空間を利用し、これを革新的に3つの領域に分割する。
この仮説に基づいて,新たなVAEアーキテクチャであるRSC-VAE(Recoding Semantic Consistency Based VAE)を提案する。
- 参考スコア(独自算出の注目度): 9.223853439465582
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years, there is an increasing interests in reconstruction based
generative models for image One-Class Novelty Detection, most of which only
focus on image-level information. While in this paper, we further exploit the
latent space of Variational Auto-encoder (VAE), a typical reconstruction based
model, and we innovatively divide it into three regions:
Normal/Anomalous/Unknown-semantic-region. Based on this hypothesis, we propose
a new VAE architecture, Recoding Semantic Consistency Based VAE (RSC-VAE),
combining VAE with recoding mechanism and constraining the semantic consistency
of two encodings. We come up with three training modes of RSC-VAE: 1. One-Class
Training Mode, alleviating False Positive problem of normal samples; 2.
Distributionally-Shifted Training Mode, alleviating False Negative problem of
anomalous samples; 3. Extremely-Imbalanced Training Mode, introducing a small
number of anomalous samples for training to enhance the second mode. The
experimental results on multiple datasets demonstrate that our mechanism
achieves state-of-the-art performance in various baselines including VAE.
- Abstract(参考訳): 近年,イメージワンクラスノベルティ検出のための再構成に基づく生成モデルへの関心が高まっており,そのほとんどは画像レベルの情報にのみ焦点をあてている。
本稿では,典型的な再構成モデルである変分自動符号化(VAE)の潜時空間をさらに活用し,これを革新的に3つの領域に分割する。
この仮説に基づき、vaeと再コーディング機構を結合し、2つのエンコーディングの意味的一貫性を制約した新しいvaeアーキテクチャ、recoding semantic consistency based vae (rsc-vae)を提案する。
RSC-VAEの3つのトレーニングモードを考え出した。
一 正常試料の偽陽性問題を緩和する一級訓練モード
2.異常サンプルの偽陰性問題を緩和する分布シフトトレーニングモード
3. 極端に不均衡なトレーニングモードを導入し, 少数の異常サンプルを導入し, 第2モードを強化した。
複数のデータセットに対する実験結果から,VAEを含む各種ベースラインの最先端性能が得られた。
関連論文リスト
- Unified Speech Recognition: A Single Model for Auditory, Visual, and Audiovisual Inputs [73.74375912785689]
本稿では,音声認識システムのための統合学習戦略を提案する。
3つのタスクの1つのモデルをトレーニングすることで、VSRとAVSRの性能が向上することを示す。
また,非ラベル標本をより効果的に活用するために,強欲な擬似ラベリング手法を導入する。
論文 参考訳(メタデータ) (2024-11-04T16:46:53Z) - Gaussian Switch Sampling: A Second Order Approach to Active Learning [11.775252660867285]
能動的学習において、取得関数は、モデル多様体内の表現位置に直接情報性を定義する。
本稿では,アクティブラーニングの文脈における情報内容とサンプルの重要性の2次定義を提案する。
我々は,モデル表現が訓練データの欠如によって制約されている場合でも,その定義が極めて正確な重要度スコアを生成することを示す。
論文 参考訳(メタデータ) (2023-02-16T15:24:56Z) - Boosting Low-Data Instance Segmentation by Unsupervised Pre-training
with Saliency Prompt [103.58323875748427]
この研究は、低データ体制のための新しい教師なし事前学習ソリューションを提供する。
近年のPrompting技術の成功に触発されて,QEISモデルを強化した新しい事前学習手法を導入する。
実験結果から,本手法は3つのデータセット上でのいくつかのQEISモデルを大幅に向上させることが示された。
論文 参考訳(メタデータ) (2023-02-02T15:49:03Z) - Adaptive Fine-Grained Sketch-Based Image Retrieval [100.90633284767205]
最近のファイングレード・スケッチに基づく画像検索は、モデルから新しいカテゴリへの一般化へとシフトしている。
実世界のアプリケーションでは、トレーニングされたFG-SBIRモデルは、新しいカテゴリと異なる人間のスケッチラーの両方に適用されることが多い。
モデルに依存しないメタラーニング(MAML)に基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-04T21:07:20Z) - Distribution-Aware Single-Stage Models for Multi-Person 3D Pose
Estimation [29.430404703883084]
本稿では,多人数の3Dポーズ推定問題に対処する新しいDASモデルを提案する。
提案するDASモデルでは,3次元カメラ空間における人物位置と人体関節をワンパスで同時に位置決めする。
CMU Panoptic と MuPoTS-3D のベンチマークに関する総合的な実験は、提案したDASモデルの優れた効率を実証している。
論文 参考訳(メタデータ) (2022-03-15T07:30:27Z) - Regularizing Variational Autoencoder with Diversity and Uncertainty
Awareness [61.827054365139645]
変分オートエンコーダ(VAE)は、償却変分推論に基づいて潜伏変数の後部を近似する。
よりディバースで不確実な潜在空間を学習するための代替モデルDU-VAEを提案する。
論文 参考訳(メタデータ) (2021-10-24T07:58:13Z) - Y-GAN: Learning Dual Data Representations for Efficient Anomaly
Detection [0.0]
本稿では,Y-GANと呼ばれる新しい再構成モデルを提案する。
モデルはY字型のオートエンコーダで構成され、2つの別々の潜在空間の画像を表現している。
論文 参考訳(メタデータ) (2021-09-28T20:17:04Z) - Few Shot Activity Recognition Using Variational Inference [9.371378627575883]
本稿では,少数のショットアクティビティ認識のための新しい変分推論ベースアーキテクチャフレームワーク(HF-AR)を提案する。
筆者らの枠組みは, 容積保存型家庭用フローを活用して, 新規クラスの柔軟な後部分布を学習する。
これにより、人間の行動認識のための最先端のショットアプローチと比較して、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2021-08-20T03:57:58Z) - Contrastive Prototype Learning with Augmented Embeddings for Few-Shot
Learning [58.2091760793799]
拡張埋め込み(CPLAE)モデルを用いた新しいコントラスト型プロトタイプ学習を提案する。
クラスプロトタイプをアンカーとして、CPLは、同じクラスのクエリサンプルを、異なるクラスのサンプルを、さらに遠くに引き出すことを目的としている。
いくつかのベンチマークによる大規模な実験により,提案したCPLAEが新たな最先端を実現することが示された。
論文 参考訳(メタデータ) (2021-01-23T13:22:44Z) - A Correspondence Variational Autoencoder for Unsupervised Acoustic Word
Embeddings [50.524054820564395]
そこで本稿では,変数分割音声セグメントを固定次元表現にマッピングするための教師なしモデルを提案する。
結果として得られる音響単語の埋め込みは、低リソース言語とゼロリソース言語のための検索、発見、インデックスシステムの基礎を形成することができる。
論文 参考訳(メタデータ) (2020-12-03T19:24:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。