論文の概要: Ordinal-Content VAE: Isolating Ordinal-Valued Content Factors in Deep
Latent Variable Models
- arxiv url: http://arxiv.org/abs/2009.03034v1
- Date: Mon, 7 Sep 2020 11:59:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 02:03:39.126832
- Title: Ordinal-Content VAE: Isolating Ordinal-Valued Content Factors in Deep
Latent Variable Models
- Title(参考訳): 常用量VAE:深部潜伏変数モデルにおける順序値コンテンツ係数の分離
- Authors: Minyoung Kim and Vladimir Pavlovic
- Abstract要約: 深層表現学習では、特定の要因(エム内容)を他の要因から分離することが望まれる。
本稿では、コンテンツ潜在空間に部分的に順序付けられた集合構造を課す新しいVAE拡張を提案する。
従来の非規則的アプローチよりもコンテンツスタイルの分離が大幅に改善されたことを示す。
- 参考スコア(独自算出の注目度): 34.552283758419506
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In deep representational learning, it is often desired to isolate a
particular factor (termed {\em content}) from other factors (referred to as
{\em style}). What constitutes the content is typically specified by users
through explicit labels in the data, while all unlabeled/unknown factors are
regarded as style. Recently, it has been shown that such content-labeled data
can be effectively exploited by modifying the deep latent factor models (e.g.,
VAE) such that the style and content are well separated in the latent
representations. However, the approach assumes that the content factor is
categorical-valued (e.g., subject ID in face image data, or digit class in the
MNIST dataset). In certain situations, the content is ordinal-valued, that is,
the values the content factor takes are {\em ordered} rather than categorical,
making content-labeled VAEs, including the latent space they infer, suboptimal.
In this paper, we propose a novel extension of VAE that imposes a partially
ordered set (poset) structure in the content latent space, while simultaneously
making it aligned with the ordinal content values. To this end, instead of the
iid Gaussian latent prior adopted in prior approaches, we introduce a
conditional Gaussian spacing prior model. This model admits a tractable joint
Gaussian prior, but also effectively places negligible density values on the
content latent configurations that violate the poset constraint. To evaluate
this model, we consider two specific ordinal structured problems: estimating a
subject's age in a face image and elucidating the calorie amount in a food meal
image. We demonstrate significant improvements in content-style separation over
previous non-ordinal approaches.
- Abstract(参考訳): 深層表現学習では、特定の因子("em content} と呼ばれる)を他の要因("em style" と呼ばれる)から分離することがしばしば望まれる。
コンテンツを構成するものは通常、データ内の明示的なラベルを通してユーザによって指定されるが、ラベルなし/未知の要素はすべてスタイルとみなされる。
近年,コンテンツラベル付きデータは,スタイルとコンテンツが潜在表現で十分に分離するように,深い潜在因子モデル(例えばvae)を変更することで効果的に活用できることが示されている。
しかし、このアプローチでは、コンテンツファクタがカテゴリ値である(例えば、顔画像データのサブジェクトidやmnistデータセットのデジットクラス)と仮定している。
ある状況では、コンテンツは順序値であり、すなわち、コンテンツ要素が取る値はカテゴリーではなく「em順序」であり、コンテンツラベルvaeは、彼らが推測する潜在空間を含む、準最適である。
本稿では、コンテンツ潜在空間に部分的に順序付けられた集合(配置)構造を課し、同時に順序付きコンテンツ値に整合させるVAEの新規拡張を提案する。
この目的のために, 条件付きガウス間隔前モデルを導入することにより, 条件付きガウス間隔前モデルを導入する。
このモデルは、トラクタブルな合同ガウス的先行性を認め、また、ポーズ制約に違反するコンテンツ潜在構成に無視可能な密度値を効果的に配置する。
このモデルを評価するために, 被験者の年齢を顔画像で推定し, 食事画像におけるカロリー量を明らかにするという, 特定の順序構造の問題を考える。
従来の非順序的アプローチに比べて,コンテンツスタイルの分離が著しく改善されている。
関連論文リスト
- Content-Style Learning from Unaligned Domains: Identifiability under Unknown Latent Dimensions [11.872336932802844]
クロスドメインテクトitlatent Distribution Match (LDM) による新しい分析フレームワークを提案する。
我々は、潜伏変数の成分的独立性のような制限的な仮定を除去できることを示す。
我々は LDM の定式化を正規化マルチドメイン GAN ロスに再キャストし, 遅延変数を結合させた。
論文 参考訳(メタデータ) (2024-11-06T08:30:23Z) - Counterfactual Generation with Identifiability Guarantees [41.894343061841084]
我々は,MATTE (doMain AdapTive counTerfactual gEneration model) を開発した。
本研究は, 対物生成タスクに係わるコンテンツとスタイル変数の領域依存性に対処する。
本フレームワークは,教師なし型転送タスクにおける最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-02-23T13:24:19Z) - Attribute-Aware Deep Hashing with Self-Consistency for Large-Scale
Fine-Grained Image Retrieval [65.43522019468976]
本稿では属性認識ハッシュコードを生成するための自己整合性を持つ属性認識ハッシュネットワークを提案する。
本研究では,高レベル属性固有ベクトルを教師なしで蒸留する再構成タスクのエンコーダ・デコーダ構造ネットワークを開発する。
我々のモデルは,これらの属性ベクトルに特徴デコリレーション制約を設けて,それらの代表的能力を強化する。
論文 参考訳(メタデータ) (2023-11-21T08:20:38Z) - Advancing Incremental Few-shot Semantic Segmentation via Semantic-guided
Relation Alignment and Adaptation [98.51938442785179]
増分的な数ショットセマンティックセマンティックセマンティクスは、セマンティクスセマンティクスモデルを新しいクラスに漸進的に拡張することを目的としている。
このタスクは、データ不均衡のため、ベースクラスと新しいクラスの間で深刻な意味認識の問題に直面します。
本稿では,従来の意味情報のガイダンスを完全に考慮した意味誘導型関係調整適応法を提案する。
論文 参考訳(メタデータ) (2023-05-18T10:40:52Z) - Multi-Content Time-Series Popularity Prediction with Multiple-Model
Transformers in MEC Networks [34.44384973176474]
モバイルエッジキャッシング(MEC)におけるコーディング/アンコードされたコンテンツ配置は、グローバルなモバイルデータトラフィックの大幅な増加に対応するために進化してきた。
既存のデータ駆動の人気予測モデルは、コード化/アンコードされたコンテンツ配置フレームワークには適していない。
一般化能力の高いマルチモデル(ハイブリッド)トランスフォーマーベースエッジキャッシング(MTEC)フレームワークを開発した。
論文 参考訳(メタデータ) (2022-10-12T02:24:49Z) - Learning Conditional Invariance through Cycle Consistency [60.85059977904014]
本稿では,データセットの変動の有意義な要因と独立な要因を識別する新しい手法を提案する。
提案手法は,対象プロパティと残りの入力情報に対する2つの別個の潜在部分空間を含む。
我々は,より意味のある因子を同定し,よりスペーサーや解釈可能なモデルに導く合成および分子データについて実証する。
論文 参考訳(メタデータ) (2021-11-25T17:33:12Z) - Rethinking Content and Style: Exploring Bias for Unsupervised
Disentanglement [59.033559925639075]
本研究では,異なる要因が画像再構成において重要度や人気度が異なるという仮定に基づいて,教師なしc-s異節の定式化を提案する。
モデルインダクティブバイアスは,提案したC-Sアンタングルメントモジュール(C-S DisMo)によって導入された。
いくつかの一般的なデータセットに対する実験により、我々の手法が最先端の教師なしC-Sアンタングルメントを実現することを示す。
論文 参考訳(メタデータ) (2021-02-21T08:04:33Z) - Set Based Stochastic Subsampling [85.5331107565578]
本稿では,2段階間ニューラルサブサンプリングモデルを提案する。
画像分類,画像再構成,機能再構築,少数ショット分類など,様々なタスクにおいて,低いサブサンプリング率で関連ベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2020-06-25T07:36:47Z) - Adversarial Disentanglement with Grouped Observations [0.0]
我々は、データ(コンテンツ)の関連属性の表現が、他のすべての要因(スタイル)から切り離されていることを考察する。
この研究はこれらのアルゴリズムを補完し、スタイル表現におけるコンテンツ情報を排除する方法である。
画像データセットにおける実験結果と比較結果から,提案手法は,コンテンツとスタイル関連属性を効率的に分離し,未知のデータに一般化できることが示された。
論文 参考訳(メタデータ) (2020-01-14T13:21:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。