論文の概要: Encoder-Decoder Manifold Alignment for Idempotent Generation
- arxiv url: http://arxiv.org/abs/2606.22304v1
- Date: Sun, 21 Jun 2026 02:14:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 19:18:30.6033
- Title: Encoder-Decoder Manifold Alignment for Idempotent Generation
- Title(参考訳): エンコーダ・デコーダ・マニフォールド・アライメント
- Authors: Dareen Alharthi, Abdul Waheed, Bhiksha Raj,
- Abstract要約: この失敗の主な理由は、エンコーダとデコーダによって学習された多様体間の幾何学的ミスマッチである。
我々は、エンコーダとデコーダに同じ基礎となるデータ多様体の一貫性のある表現を学習させ、このギャップを明示的に埋める新しいトレーニングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 51.959208893243776
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, several learning paradigms have been introduced to enforce idempotency in generative models. The goal is to ensure that repeated application of a model leaves samples unchanged once they lie on the target data manifold. In practice, however, many of these approaches fail to achieve exact fixed points, leading to instability and drift under repeated application. In this work, we argue that a key reason for this failure is a geometric mismatch between the manifolds learned by the encoder and decoder. The encoder projects inputs onto one latent manifold, while the decoder implicitly learns to reconstruct data from a different manifold. This discrepancy prevents the model from learning truly idempotent mappings. To address this issue, we propose a new training framework that explicitly closes this gap by forcing the encoder and decoder to learn consistent representations of the same underlying data manifold. By aligning the geometry of these components, our method encourages stable projections. Empirically, we show that our approach achieves significantly lower idempotency error and consistently regenerates identical outputs under repeated application, compared to existing methods. We demonstrate the effectiveness of the proposed framework on both image generation and image editing tasks. Finally, we show that enforcing idempotency in this manner improves identity preservation and information stability, leading to more realistic and controllable generative editing models.
- Abstract(参考訳): 近年, 生成モデルにおいて, イデオポトシーを強制する学習パラダイムがいくつか導入されている。
目標は、モデルの繰り返し適用が、ターゲットデータ多様体上に置かれると、サンプルが変更されないようにすることです。
しかし、実際には、これらのアプローチの多くは正確な固定点を達成することができず、繰り返し適用された場合の不安定性とドリフトにつながる。
この研究において、この失敗の鍵となる理由は、エンコーダとデコーダによって学習された多様体間の幾何学的ミスマッチであると主張する。
エンコーダは1つの潜在多様体に入力を投影し、デコーダは異なる多様体からデータを暗黙的に再構成することを学習する。
この不一致は、モデルが真の等等写像を学習するのを防ぐ。
この問題に対処するために、エンコーダとデコーダに同じ基礎となるデータ多様体の一貫性のある表現を学習させ、このギャップを明示的に埋める新しいトレーニングフレームワークを提案する。
これらの成分の幾何を整列させることで、安定な射影を奨励する。
実験により,本手法は既往の手法と比較して,Idempotencyエラーを著しく低減し,同一の出力を連続的に再現することを示す。
本稿では,画像生成作業と画像編集作業におけるフレームワークの有効性を示す。
最後に、この方法でのイデオロシティの強制は、アイデンティティの保存と情報の安定性を改善し、より現実的で制御可能な生成編集モデルをもたらすことを示す。
関連論文リスト
- Every Step Counts: Decoding Trajectories as Authorship Fingerprints of dLLMs [63.82840470917859]
本稿では,dLLMの復号化機構をモデル属性の強力なツールとして利用できることを示す。
本稿では、デコードステップ間の構造的関係を捉え、モデル固有の振る舞いをよりよく明らかにする、DDM(Directed Decoding Map)と呼ばれる新しい情報抽出手法を提案する。
論文 参考訳(メタデータ) (2025-10-02T06:25:10Z) - Shifting the Paradigm: A Diffeomorphism Between Time Series Data Manifolds for Achieving Shift-Invariancy in Deep Learning [22.053675805215686]
ディープラーニングモデルは、出力の変化を引き起こす入力シフトに敏感である。
我々は高次元データ多様体から同じ次元の別の多様体にサンプルをマッピングする微分可能関数を提案する。
論文 参考訳(メタデータ) (2025-02-27T09:42:52Z) - Boosting Alignment for Post-Unlearning Text-to-Image Generative Models [55.82190434534429]
大規模な生成モデルは、大量のデータによって推進される印象的な画像生成能力を示している。
これはしばしば必然的に有害なコンテンツや不適切なコンテンツを生み出し、著作権の懸念を引き起こす。
学習しない反復ごとに最適なモデル更新を求めるフレームワークを提案し、両方の目的に対して単調な改善を確実にする。
論文 参考訳(メタデータ) (2024-12-09T21:36:10Z) - Continuous Speculative Decoding for Autoregressive Image Generation [27.308442169466975]
連続的視覚自己回帰(AR)モデルは、画像生成において有望な性能を示す。
投機的復号化は 事実上 自己回帰推論を加速させた
この研究は、低受理率、不整合出力分布、解析式のない修正分布からの課題に対処する。
論文 参考訳(メタデータ) (2024-11-18T09:19:15Z) - Improved Variational Inference in Discrete VAEs using Error Correcting Codes [3.053842954605396]
本研究は, 離散変分オートエンコーダにおける推論を, 生成的視点で解釈することで改善する手法を提案する。
我々は,このモデルを通信システムとして概念化し,誤り訂正符号(ECC)を利用して潜在表現に冗長性を導入することを提案する。
本稿では,2変数の潜伏変数と低複素度繰り返し符号を持つ離散変分オートコーダを用いて概念実証を行い,グローバルおよびローカルなデータ特徴を分離する階層構造に拡張する。
論文 参考訳(メタデータ) (2024-10-10T11:59:58Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - Unsupervised Controllable Generation with Self-Training [90.04287577605723]
GANによる制御可能な世代は依然として困難な研究課題である。
本稿では,自己学習を通じてジェネレータを制御する潜伏符号の分布を学習するための教師なしフレームワークを提案する。
我々のフレームワークは、変分オートエンコーダのような他の変種と比較して、より良い絡み合いを示す。
論文 参考訳(メタデータ) (2020-07-17T21:50:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。