論文の概要: Encouraging Disentangled and Convex Representation with Controllable
Interpolation Regularization
- arxiv url: http://arxiv.org/abs/2112.03163v1
- Date: Mon, 6 Dec 2021 16:52:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-07 17:11:23.001362
- Title: Encouraging Disentangled and Convex Representation with Controllable
Interpolation Regularization
- Title(参考訳): 制御可能な補間正規化による遠方および凸表現の促進
- Authors: Yunhao Ge, Zhi Xu, Yao Xiao, Gan Xin, Yunkui Pang, and Laurent Itti
- Abstract要約: 制御不能な不整合表現学習(C-Dis-RL)に焦点を当てる。
制御可能な補間正規化法(CIR)を提案する。
- 参考スコア(独自算出の注目度): 15.725515910594725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We focus on controllable disentangled representation learning (C-Dis-RL),
where users can control the partition of the disentangled latent space to
factorize dataset attributes (concepts) for downstream tasks. Two general
problems remain under-explored in current methods: (1) They lack comprehensive
disentanglement constraints, especially missing the minimization of mutual
information between different attributes across latent and observation domains.
(2) They lack convexity constraints in disentangled latent space, which is
important for meaningfully manipulating specific attributes for downstream
tasks. To encourage both comprehensive C-Dis-RL and convexity simultaneously,
we propose a simple yet efficient method: Controllable Interpolation
Regularization (CIR), which creates a positive loop where the disentanglement
and convexity can help each other. Specifically, we conduct controlled
interpolation in latent space during training and 'reuse' the encoder to help
form a 'perfect disentanglement' regularization. In that case, (a)
disentanglement loss implicitly enlarges the potential 'understandable'
distribution to encourage convexity; (b) convexity can in turn improve robust
and precise disentanglement. CIR is a general module and we merge CIR with
three different algorithms: ELEGANT, I2I-Dis, and GZS-Net to show the
compatibility and effectiveness. Qualitative and quantitative experiments show
improvement in C-Dis-RL and latent convexity by CIR. This further improves
downstream tasks: controllable image synthesis, cross-modality image
translation and zero-shot synthesis. More experiments demonstrate CIR can also
improve other downstream tasks, such as new attribute value mining, data
augmentation, and eliminating bias for fairness.
- Abstract(参考訳): 制御可能な非絡み付き表現学習(C-Dis-RL)に焦点を当て、ユーザは非絡み付き潜在空間の分割を制御し、下流タスクのデータセット属性(概念)を分解できる。
1) 包括的乱れの制約が欠如しており、特に潜在領域と観測領域の異なる属性間の相互情報の最小化が欠如している。
2) 下流タスクの特定の属性を有意に操作する上で重要な非交叉空間における凸性制約を欠いている。
包括的c-dis-rlと凸性を同時に促進するため,制御可能な補間正則化 (cir) という簡易かつ効率的な手法を提案する。
具体的には、トレーニング中の潜在空間における制御補間とエンコーダの「再利用」を行い、「完全非絡み合い」正規化を支援する。
この場合は
(a)絡み合い損失は、潜在的「理解不能」な分布を暗黙的に拡大し、凸性を促進する。
b)凸性は、強靭で正確な絡み合いを改善することができる。
CIRは汎用モジュールであり、ELEGANT、I2I-Dis、GZS-Netの3つの異なるアルゴリズムとCIRを統合し、互換性と有効性を示す。
CIRによるC-Dis-RLと潜在凸性の改善を示す定性的および定量的実験を行った。
これにより、制御可能な画像合成、クロスモダリティ画像変換、ゼロショット合成といった下流タスクがさらに改善される。
さらなる実験では、新しい属性値マイニング、データ拡張、公平性のバイアスの排除など、CIRが他の下流タスクを改善することも実証されている。
関連論文リスト
- Double-Shot 3D Shape Measurement with a Dual-Branch Network [14.749887303860717]
我々は、異なる構造光(SL)変調を処理するために、デュアルブランチ畳み込みニューラルネットワーク(CNN)-トランスフォーマーネットワーク(PDCNet)を提案する。
PDCNet内では、Transformerブランチを使用してフリンジイメージのグローバルな認識をキャプチャし、CNNブランチはスペックルイメージのローカル詳細を収集するように設計されている。
提案手法は, 自己生成データセット上で高精度な結果が得られる一方で, フランジオーダーの曖昧さを低減できることを示す。
論文 参考訳(メタデータ) (2024-07-19T10:49:26Z) - Closed-Loop Unsupervised Representation Disentanglement with $\beta$-VAE
Distillation and Diffusion Probabilistic Feedback [45.68054456449699]
表現の混乱は、AIが現実世界を根本的に理解し、差別と生成の両方に利益をもたらす可能性がある。
我々はtextbfCL-Dis と呼ばれる textbfCL-Disentanglement アプローチを提案する。
実画像操作や視覚解析といったアプリケーションにおけるCL-Disの優位性を示す実験がある。
論文 参考訳(メタデータ) (2024-02-04T05:03:22Z) - Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.668052890249726]
本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文 参考訳(メタデータ) (2023-10-20T12:45:12Z) - Tensor-based Multi-view Spectral Clustering via Shared Latent Space [14.470859959783995]
MvSC(Multi-view Spectral Clustering)は多様なデータソースによって注目を集めている。
MvSCの新しい手法はRestricted Kernel Machineフレームワークから共有潜在空間を介して提案される。
論文 参考訳(メタデータ) (2022-07-23T17:30:54Z) - Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Gleo-Det: Deep Convolution Feature-Guided Detector with Local Entropy
Optimization for Salient Points [5.955667705173262]
本稿では, 深い畳み込み特徴のガイダンスを伴い, 繰り返し可能性の要求に基づき, きめ細かな制約を実現することを提案する。
畳み込み特徴のガイダンスを用いて、正と負の両面からコスト関数を定義する。
論文 参考訳(メタデータ) (2022-04-27T12:40:21Z) - Maximum Spatial Perturbation Consistency for Unpaired Image-to-Image
Translation [56.44946660061753]
本稿では,最大空間摂動整合(MSPC)と呼ばれる普遍正規化手法を提案する。
MSPCは空間摂動関数(T)と変換演算子(G)を可換(TG = GT)に強制する。
提案手法は,ほとんどのI2Iベンチマークにおいて最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-03-23T19:59:04Z) - Contrastive Conditional Neural Processes [45.70735205041254]
条件付きニューラル・プロセス(CNP)は、メタラーニング環境下でのプロセスの機能に近い確率的推論でニューラルネットワークをブリッジする。
2つの補助的コントラスト分岐が階層的に設定される。すなわち、インストラクテーション時間的コントラスト学習(tt TCL)とクロスストラクテーション関数コントラスト学習(tt FCL)である。
実験により、tt TCLは観測の高レベルの抽象化を捉えるのに対し、tt FCLは基底関数の同定に役立ち、より効率的な表現を提供することを示す。
論文 参考訳(メタデータ) (2022-03-08T10:08:45Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Unpaired Adversarial Learning for Single Image Deraining with Rain-Space
Contrastive Constraints [61.40893559933964]
我々は,CDR-GAN という名称の GAN フレームワークにおいて,比較学習手法により,経験者の相互特性を探索する有効な非経験的 SID 手法を開発した。
提案手法は, 合成および実世界の両方のデータセットにおいて, 既存の非対効果のデラミニング手法に対して良好に動作し, 完全教師付きモデルや半教師付きモデルよりも優れている。
論文 参考訳(メタデータ) (2021-09-07T10:00:45Z) - An Information Bottleneck Approach for Controlling Conciseness in
Rationale Extraction [84.49035467829819]
我々は,情報ボトルネック(IB)の目的を最適化することで,このトレードオフをよりよく管理できることを示す。
我々の完全教師なしのアプローチは、文上のスパース二項マスクを予測する説明器と、抽出された合理性のみを考慮したエンドタスク予測器を共同で学習する。
論文 参考訳(メタデータ) (2020-05-01T23:26:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。