論文の概要: Debunking Free Fusion Myth: Online Multi-view Anomaly Detection with
Disentangled Product-of-Experts Modeling
- arxiv url: http://arxiv.org/abs/2310.18728v2
- Date: Tue, 31 Oct 2023 22:52:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 10:54:37.512418
- Title: Debunking Free Fusion Myth: Online Multi-view Anomaly Detection with
Disentangled Product-of-Experts Modeling
- Title(参考訳): debunking free fusion myth:disentangled product-of-experts modelingによるオンラインマルチビュー異常検出
- Authors: Hao Wang, Zhi-Qi Cheng, Jingdong Sun, Xin Yang, Xiao Wu, Hongyang
Chen, and Yan Yang
- Abstract要約: マルチビューやマルチモーダルデータさえも、現実世界のアプリケーションには魅力的なものです。
本稿では,(1)多視点データに対処するProduct-of-Experts層,(2)ビュー共通表現とビュー固有表現を混在させるTotal Correction Discriminator,(3)すべてのコンポーネントをラップするジョイントロス関数を含む,新しい多視点変分自動符号化モデルdPoEを提案する。
- 参考スコア(独自算出の注目度): 25.02446577349165
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-view or even multi-modal data is appealing yet challenging for
real-world applications. Detecting anomalies in multi-view data is a prominent
recent research topic. However, most of the existing methods 1) are only
suitable for two views or type-specific anomalies, 2) suffer from the issue of
fusion disentanglement, and 3) do not support online detection after model
deployment. To address these challenges, our main ideas in this paper are
three-fold: multi-view learning, disentangled representation learning, and
generative model. To this end, we propose dPoE, a novel multi-view variational
autoencoder model that involves (1) a Product-of-Experts (PoE) layer in
tackling multi-view data, (2) a Total Correction (TC) discriminator in
disentangling view-common and view-specific representations, and (3) a joint
loss function in wrapping up all components. In addition, we devise theoretical
information bounds to control both view-common and view-specific
representations. Extensive experiments on six real-world datasets markedly
demonstrate that the proposed dPoE outperforms baselines.
- Abstract(参考訳): マルチビュー、あるいはマルチモーダルデータでさえ、現実のアプリケーションにとって非常に難しいものです。
マルチビューデータの異常検出は最近の顕著な研究トピックである。
しかし 既存の方法の多くは
1) 2つのビューまたはタイプ固有の異常にのみ適合する。
2) 核融合の絡み合いの問題に苦しむこと,及び
3) モデル展開後のオンライン検出はサポートしない。
これらの課題に対処するため,本稿の主な考え方は,多視点学習,非交叉表現学習,生成モデルである。
そこで本研究では,(1)多視点データに対処するProduct-of-Experts(PoE)層,(2)ビュー共通表現とビュー固有表現を混在させるTotal Correction(TC)識別器,(3)すべてのコンポーネントをラップするジョイントロス関数を含む,新しい多視点変分オートエンコーダモデルであるdPoEを提案する。
さらに,ビュー共通表現とビュー固有表現の両方を制御するための理論的情報境界を考案する。
6つの実世界のデータセットに対する大規模な実験は、提案されたdPoEがベースラインを上回っていることを示す。
関連論文リスト
- SpecRaGE: Robust and Generalizable Multi-view Spectral Representation Learning [9.393841121141076]
近年,多視点表現学習 (MvRL) が注目されている。
グラフラプラシアンベースのMvRL法は、マルチビューデータの表現に顕著な成功を収めた。
本稿では,グラフラプラシアン手法の強みを深層学習の力と統合した,新しい融合ベースのフレームワークであるtextitSpecRaGE$を紹介する。
論文 参考訳(メタデータ) (2024-11-04T14:51:35Z) - PoIFusion: Multi-Modal 3D Object Detection via Fusion at Points of Interest [65.48057241587398]
PoIFusionは、関心点(PoIs)におけるRGBイメージとLiDARポイントクラウドに関する情報を融合するフレームワークである。
提案手法は,各モダリティの視点を維持し,計算にやさしいプロジェクションと計算によってマルチモーダル特徴を得る。
我々はnuScenesとArgoverse2データセットについて広範囲に実験を行い、我々のアプローチを評価した。
論文 参考訳(メタデータ) (2024-03-14T09:28:12Z) - Multi-view Fuzzy Representation Learning with Rules based Model [25.997490574254172]
教師なしマルチビュー表現学習は、マルチビューデータをマイニングするために広く研究されている。
本稿では,MVRL_FSを用いた多視点ファジィ表現学習手法を提案する。
論文 参考訳(メタデータ) (2023-09-20T17:13:15Z) - Deep Incomplete Multi-view Clustering with Cross-view Partial Sample and
Prototype Alignment [50.82982601256481]
深層不完全なマルチビュークラスタリングのためのクロスビュー部分サンプルとプロトタイプアライメントネットワーク(CPSPAN)を提案する。
従来のコントラストベースの手法とは異なり、インスタンスとインスタンスの対応構築を導くために、ペア観測データアライメントを「プロキシ監視信号」として採用する。
論文 参考訳(メタデータ) (2023-03-28T02:31:57Z) - Credible Remote Sensing Scene Classification Using Evidential Fusion on
Aerial-Ground Dual-view Images [6.817740582240199]
マルチビュー(マルチソース、マルチモーダル、マルチパースペクティブなど)データはリモートセンシングタスクで頻繁に使用される。
データ品質の問題はさらに明確になり、マルチビューデータの潜在的なメリットが制限される。
深層学習は空中二視点リモートセンシングシーン分類の課題に導入される。
論文 参考訳(メタデータ) (2023-01-02T12:27:55Z) - Progressive Multi-view Human Mesh Recovery with Self-Supervision [68.60019434498703]
既存のソリューションは通常、新しい設定への一般化性能の低下に悩まされる。
マルチビューヒューマンメッシュリカバリのためのシミュレーションに基づく新しいトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-12-10T06:28:29Z) - Cross-view Graph Contrastive Representation Learning on Partially
Aligned Multi-view Data [52.491074276133325]
マルチビュー表現学習は、過去数十年間で急速に発展し、多くの分野に応用されてきた。
本稿では,多視点情報を統合してデータアライメントを行い,潜在表現を学習する,新しいクロスビューグラフコントラスト学習フレームワークを提案する。
複数の実データを用いて実験を行い,クラスタリングおよび分類作業における提案手法の有効性を示した。
論文 参考訳(メタデータ) (2022-11-08T09:19:32Z) - Two-level Data Augmentation for Calibrated Multi-view Detection [51.5746691103591]
ビュー間のアライメントを保った新しいマルチビューデータ拡張パイプラインを導入する。
また,シーンレベルで直接適用された第2レベルの拡張を提案する。
単純なマルチビュー検出モデルと組み合わせることで、2レベル拡張パイプラインは既存のベースラインすべてより優れています。
論文 参考訳(メタデータ) (2022-10-19T17:55:13Z) - TSK Fuzzy System Towards Few Labeled Incomplete Multi-View Data
Classification [24.01191516774655]
これらの課題に対処するために,トランスダクティブ半教師付きマルチビューTSKファジィシステムモデリング法(SSIMV_TSK)を提案する。
提案手法は,未知のビュー計算,ラベルなしデータの擬似ラベル学習,ファジィシステムモデリングをひとつのプロセスに統合し,解釈可能なファジィルールを持つモデルを生成する。
実データを用いた実験の結果,提案手法は最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-10-08T11:41:06Z) - Generative Partial Multi-View Clustering [133.36721417531734]
本稿では,不完全なマルチビュー問題に対処するため,GP-MVCと呼ばれる生成的部分的マルチビュークラスタリングモデルを提案する。
まず、マルチビューエンコーダネットワークをトレーニングして、一般的な低次元表現を学習し、次にクラスタリング層を使用して複数のビューをまたいだ一貫したクラスタ構造をキャプチャする。
第2に、他のビューが与える共有表現に基づいて、1つのビュー条件の欠落データを生成するために、ビュー固有の生成敵ネットワークを開発する。
論文 参考訳(メタデータ) (2020-03-29T17:48:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。