論文の概要: Information-Regularized Constrained Inversion for Stable Avatar Editing from Sparse Supervision
- arxiv url: http://arxiv.org/abs/2604.02883v1
- Date: Fri, 03 Apr 2026 08:46:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.413306
- Title: Information-Regularized Constrained Inversion for Stable Avatar Editing from Sparse Supervision
- Title(参考訳): スパーススーパービジョンからの安定アバター編集のための情報規則化制約付きインバージョン
- Authors: Zhenxiao Liang, Qixing Huang,
- Abstract要約: 本研究では、構造化アバターラテント空間における制約付き反転として編集を行う条件付き編集再構成フレームワークを提案する。
この方法は小さな部分空間行列で動作し、効率的に実装することができる。
- 参考スコア(独自算出の注目度): 32.22231480259466
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Editing animatable human avatars typically relies on sparse supervision, often a few edited keyframes, yet naively fitting a reconstructed avatar to these edits frequently causes identity leakage and pose-dependent temporal flicker. We argue that these failures are best understood as an ill-conditioned inversion: the available edited constraints do not sufficiently determine the latent directions responsible for the intended edit. We propose a conditioning-guided edited reconstruction framework that performs editing as a constrained inversion in a structured avatar latent space, restricting updates to a low-dimensional, part-specific edit subspace to prevent unintended identity changes. Crucially, we design the editing constraints during inversion by optimizing a conditioning objective derived from a local linearization of the full decoding-and-rendering pipeline, yielding an edit-subspace information matrix whose spectrum predicts stability and drives frame reweighting / keyframe activation. The resulting method operates on small subspace matrices and can be implemented efficiently (e.g., via Hessian-vector products), and improves stability under limited edited supervision.
- Abstract(参考訳): アニマタブルな人間のアバターの編集は、しばしばスパース・インスペクション(英語版)に依存し、しばしば数個の編集されたキーフレームに依存するが、これらの編集に再建されたアバターを鼻で合わせると、しばしばアイデンティティ・リークとポーズ依存の時間的フリックが生じる。
利用可能な編集制約は、意図した編集に責任を負う潜在方向を十分に決定できない。
本研究では、構造化アバター潜在空間における制約付き反転として編集を行い、意図しない同一性変化を防止するために、低次元部分固有の編集部分空間への更新を制限する条件付き編集再構成フレームワークを提案する。
重要なことに、本研究では、完全復号・レンダリングパイプラインの局所線形化から導いた条件付け目標を最適化し、スペクトルが安定性を予測し、フレーム再重み付け/キーフレームアクティベーションを駆動する編集サブスペース情報行列を生成することにより、インバージョン中の編集制約を設計する。
この方法は、小さな部分空間行列上で動作し、効率よく(例えば、ヘッセンベクトル生成物を介して)実装でき、限定的な編集監督の下で安定性を向上させる。
関連論文リスト
- CrispEdit: Low-Curvature Projections for Scalable Non-Destructive LLM Editing [25.410131838577907]
CrispEditは、機能保存を明示的な制約として扱う、原則化された2階編集アルゴリズムである。
CrispEditは、データセット全体の平均1%未満の機能劣化を維持しながら、高い編集成功を実現していることを示す。
論文 参考訳(メタデータ) (2026-02-17T18:58:04Z) - Beyond Hard Writes and Rigid Preservation: Soft Recursive Least-Squares for Lifelong LLM Editing [16.768713543557443]
モデル編集は、関係のない振る舞いを保持しながら、再トレーニングすることなく、新しい事実やルールで事前訓練された更新を行う。
長い逐次編集のための最小二乗エディタ RLSEdit を提案する。
複数のモデルファミリの実験は、10K編集への安定したスケーリングを示し、編集成功と全体安定性の両方において強力なベースラインを達成している。
論文 参考訳(メタデータ) (2026-01-22T06:11:44Z) - Spectral Characterization and Mitigation of Sequential Knowledge Editing Collapse [44.49646322759214]
モデルの一般能力は、事前訓練された重み行列の支配的な特異方向と密接に関連していることを示す。
支配的な特異部分空間を明示的に保存することにより、シーケンシャルな編集を安定化するプラグイン・アンド・プレイフレームワークであるREVIVEを提案する。
論文 参考訳(メタデータ) (2026-01-16T07:18:14Z) - Kontinuous Kontext: Continuous Strength Control for Instruction-based Image Editing [76.44219733285898]
Kontinuous Kontext は命令駆動の編集モデルであり、編集強度を制御できる新しい次元を提供する。
軽量プロジェクタネットワークは、入力スカラーと編集命令をモデルの変調空間の係数にマッピングする。
本モデルのトレーニングには,既存の生成モデルを用いて,画像編集・指導・強化四重項の多種多様なデータセットを合成する。
論文 参考訳(メタデータ) (2025-10-09T17:51:03Z) - Follow-Your-Shape: Shape-Aware Image Editing via Trajectory-Guided Region Control [52.87568958372421]
Follow-Your-Shapeは、トレーニング不要でマスクなしのフレームワークで、オブジェクト形状の正確かつ制御可能な編集をサポートする。
インバージョンとデノナイジングパスのトークン単位の速度差を比較することで,TDM(Torjectory Divergence Map)を算出する。
本手法は、特に大規模な形状変更を必要とするタスクにおいて、優れた編集性と視覚的忠実性を実現する。
論文 参考訳(メタデータ) (2025-08-11T16:10:00Z) - Tuning-Free Image Editing with Fidelity and Editability via Unified Latent Diffusion Model [60.82962950960996]
拡散遅延最適化を行うチューニング不要なUnifyEditを導入する。
本研究では, 自己注意保持制約(SA)と相互注意アライメント制約(CA)の2つを開発し, テキストアライメントの強化を図る。
提案手法は,様々な編集作業における構造保存とテキストアライメントのバランスを保ち,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2025-04-08T01:02:50Z) - Lost in Edits? A $λ$-Compass for AIGC Provenance [119.95562081325552]
本稿では,実測出力と操作された出力を頑健に識別し,識別する新しい潜在空間属性法を提案する。
LambdaTracerは、InstructPix2Pixのようなテキスト誘導編集ツールによって自動化されるか、Adobe Photoshopのような編集ソフトウェアで手動で実行されるか、様々な反復編集プロセスで有効である。
論文 参考訳(メタデータ) (2025-02-05T06:24:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。