論文の概要: L-VAE: Variational Auto-Encoder with Learnable Beta for Disentangled Representation
- arxiv url: http://arxiv.org/abs/2507.02619v1
- Date: Thu, 03 Jul 2025 13:45:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:16.373189
- Title: L-VAE: Variational Auto-Encoder with Learnable Beta for Disentangled Representation
- Title(参考訳): L-VAE:分散表現のための学習可能なベータ付き変分自動エンコーダ
- Authors: Hazal Mogultay Ozcan, Sinan Kalkan, Fatos T. Yarman-Vural,
- Abstract要約: L-VAEは損失関数の項の相対重みを学習することでβ-VAEの限界を緩和する。
L-VAEは、一組のアンタングルメントメトリクスによって測定される最高のパフォーマンスまたは2番目のパフォーマンスを一貫して提供する。
- 参考スコア(独自算出の注目度): 9.117340902796647
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a novel model called Learnable VAE (L-VAE), which learns a disentangled representation together with the hyperparameters of the cost function. L-VAE can be considered as an extension of \b{eta}-VAE, wherein the hyperparameter, \b{eta}, is empirically adjusted. L-VAE mitigates the limitations of \b{eta}-VAE by learning the relative weights of the terms in the loss function to control the dynamic trade-off between disentanglement and reconstruction losses. In the proposed model, the weight of the loss terms and the parameters of the model architecture are learned concurrently. An additional regularization term is added to the loss function to prevent bias towards either reconstruction or disentanglement losses. Experimental analyses show that the proposed L-VAE finds an effective balance between reconstruction fidelity and disentangling the latent dimensions. Comparisons of the proposed L-VAE against \b{eta}-VAE, VAE, ControlVAE, DynamicVAE, and {\sigma}-VAE on datasets, such as dSprites, MPI3D-complex, Falcor3D, and Isaac3D reveals that L-VAE consistently provides the best or the second best performances measured by a set of disentanglement metrics. Moreover, qualitative experiments on CelebA dataset, confirm the success of the L-VAE model for disentangling the facial attributes.
- Abstract(参考訳): 本稿では,コスト関数のハイパーパラメータとともに,不整合表現を学習する,Learable VAE (L-VAE) と呼ばれる新しいモデルを提案する。
L-VAE は \b{eta}-VAE の拡張と見なすことができ、ハイパーパラメータである \b{eta} は経験的に調整される。
L-VAEは、損失関数における項の相対重みを学習し、絡み合いと復元損失の間の動的トレードオフを制御することにより、b{eta}-VAEの限界を緩和する。
提案モデルでは,損失項の重みとモデルアーキテクチャのパラメータを同時に学習する。
損失関数に追加の正規化項を追加して、復元または歪んだ損失に対するバイアスを防止する。
実験により, 提案したL-VAEは, 復元忠実度と潜伏次元との効果的なバランスを見出した。
提案した L-VAE と \b{eta}-VAE, VAE, ControlVAE, DynamicVAE, {\sigma}-VAE の比較では,dSprites, MPI3D-complex, Falcor3D, Isaac3D などのデータセット上で,L-VAE が一貫した不整合測定値によって測定された最高の,あるいは2番目のパフォーマンスを提供することが明らかになった。
さらに、CelebAデータセットの定性的な実験により、L-VAEモデルが顔の特徴を引き離すことに成功した。
関連論文リスト
- Matching aggregate posteriors in the variational autoencoder [0.5759862457142761]
変分オートエンコーダ(VAE)は、よく研究され、深い、潜伏変数モデル(DLVM)である。
本稿では,VAE に付随する目的関数を改良することにより,VAE の欠点を克服する。
提案手法はEmphaggregate variational autoencoder (AVAE) と命名され,VAEの理論的枠組みに基づいて構築されている。
論文 参考訳(メタデータ) (2023-11-13T19:22:37Z) - Uncertainty Guided Adaptive Warping for Robust and Efficient Stereo
Matching [77.133400999703]
相関に基づくステレオマッチングは優れた性能を達成した。
固定モデルによる現在のメソッドは、さまざまなデータセットで均一に動作しない。
本稿では,ロバストなステレオマッチングのための相関を動的に計算する新しい視点を提案する。
論文 参考訳(メタデータ) (2023-07-26T09:47:37Z) - A Model for Multi-View Residual Covariances based on Perspective
Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。
我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文 参考訳(メタデータ) (2022-02-01T21:21:56Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Auto-Weighted Layer Representation Based View Synthesis Distortion
Estimation for 3-D Video Coding [78.53837757673597]
本稿では,自動重み付け層表現に基づくビュー合成歪み推定モデルを提案する。
提案手法は, 精度, 効率の両面において, 最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-01-07T12:12:41Z) - Regularizing Variational Autoencoder with Diversity and Uncertainty
Awareness [61.827054365139645]
変分オートエンコーダ(VAE)は、償却変分推論に基づいて潜伏変数の後部を近似する。
よりディバースで不確実な潜在空間を学習するための代替モデルDU-VAEを提案する。
論文 参考訳(メタデータ) (2021-10-24T07:58:13Z) - ControlVAE: Tuning, Analytical Properties, and Performance Analysis [14.272917020105147]
ControlVAEは、新しい変分自動エンコーダフレームワークである。
VAEモデルのKL分割を所定の値に安定化する。
復元品質とKL分割の良好なトレードオフを達成することができる。
論文 参考訳(メタデータ) (2020-10-31T12:32:39Z) - DynamicVAE: Decoupling Reconstruction Error and Disentangled
Representation Learning [15.317044259237043]
本稿では, 重みを$beta$-VAEで表すと, 潜伏因子を効果的に分解するために1ドルより大きくなるという一般的な仮定に挑戦する。
我々は,$beta$-VAEが$beta 1$であるだけでなく,動的制御による復元精度を大幅に向上させることができることを示した。
論文 参考訳(メタデータ) (2020-09-15T00:01:11Z) - q-VAE for Disentangled Representation Learning and Latent Dynamical
Systems [8.071506311915396]
q-VAEと呼ばれるTsallis統計から導出される変分オートエンコーダ(VAE)を提案する。
提案手法では,サンプルデータに隠された潜伏空間を統計的に抽出するために標準VAEを用いる。
論文 参考訳(メタデータ) (2020-03-04T01:38:39Z) - Learnable Bernoulli Dropout for Bayesian Deep Learning [53.79615543862426]
Learnable Bernoulli Dropout (LBD) は、他のモデルパラメータと共に最適化されたパラメータとしてドロップアウト率を考慮する新しいモデルに依存しないドロップアウトスキームである。
LBDは画像分類とセマンティックセグメンテーションにおける精度と不確実性の推定を改善する。
論文 参考訳(メタデータ) (2020-02-12T18:57:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。