論文の概要: Controlla: Learning Controllability via Graph-Constrained Latent Geometry
- arxiv url: http://arxiv.org/abs/2605.16603v1
- Date: Fri, 15 May 2026 20:06:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:46.796676
- Title: Controlla: Learning Controllability via Graph-Constrained Latent Geometry
- Title(参考訳): Controlla: Graph-Constrained Latent Geometryによる学習制御性
- Authors: Jamuna S. Murthy, Amin Karimi Monsefi, Rajiv Ramnath,
- Abstract要約: 本稿では,可制御性を構造的潜在幾何学の特性として扱うモジュラー分解制御フレームワークを提案する。
Controllaは、マルチモーダル入力からアイデンティティと属性要素を学び、それらをグラフ先行値と整合させる。
実験では、制御性、アイデンティティの保存、およびモード間のアライメントが一貫した改善を示す。
- 参考スコア(独自算出の注目度): 3.797867929356259
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Controllable multimodal generation is commonly formulated as an inference-time conditioning problem using prompts, guidance, or auxiliary modules. While effective, such approaches do not explicitly structure how semantic attributes evolve, which can lead to identity drift and inconsistent cross-modal behavior. We propose Controlla, a modular factorized-control framework that treats controllability as a property of structured latent geometry. Controlla learns identity and attribute factors from multimodal inputs and aligns them with graph priors using graph-constrained optimal transport, encouraging attributes to follow graph-consistent trajectories while preserving reference identity. To evaluate this setting, we construct AffectHuman-43K, a leakage-aware multimodal benchmark for reference-grounded affective control, and introduce geometry-aware metrics for trajectory consistency and latent disentanglement. Experiments show consistent improvements in controllability, identity preservation, and cross-modal alignment, with additional analyses on graph sensitivity, extensibility, and robustness.
- Abstract(参考訳): 制御可能なマルチモーダル生成は一般に、プロンプト、ガイダンス、補助モジュールを用いて推論時条件付け問題として定式化される。
有効ではあるが、このようなアプローチは意味的属性の進化の仕方を明確には構成していない。
構造付き潜在幾何の性質として制御可能性を扱うモジュラー分解制御フレームワークであるControllaを提案する。
Controllaはマルチモーダル入力からアイデンティティと属性要素を学習し、グラフ制約された最適トランスポートを使用してグラフ先行と整列し、参照IDを保持しながらグラフ一貫性のトラジェクトリに従うように属性を奨励する。
この設定を評価するため,AffectHuman-43Kという参照接地感情制御のためのリーク対応マルチモーダルベンチマークを構築し,軌跡の整合性や潜伏不整合性を考慮した幾何学的メトリクスを導入する。
実験では、制御性、アイデンティティ保存、および相互モーダルアライメントが一貫した改善を示し、グラフの感度、拡張性、堅牢性について分析した。
関連論文リスト
- Why Steering Works: Toward a Unified View of Language Model Parameter Dynamics [81.80010043113445]
局所的な微調整、LoRAに基づく適応、およびアクティベーションに基づく介入を分離して研究する。
制御信号によって誘導される動的ウェイト更新として、これらの介入をフレーム化する統一的な視点を示す。
提案手法では,選択と効用との間に一貫したトレードオフが観測される。
論文 参考訳(メタデータ) (2026-02-02T17:04:36Z) - From Passive Metric to Active Signal: The Evolving Role of Uncertainty Quantification in Large Language Models [77.04403907729738]
このサーベイは、受動的診断基準からリアルタイムモデル動作を導くアクティブ制御信号への不確実性の進化をグラフ化する。
3つのフロンティアにまたがるアクティブ制御信号として不確実性がいかに活用されているかを示す。
この調査は、次世代のスケーラブルで信頼性があり、信頼できるAIを構築するためには、新しい不確実性のトレンドを習得することが不可欠である、と論じている。
論文 参考訳(メタデータ) (2026-01-22T06:21:31Z) - SALVE: Sparse Autoencoder-Latent Vector Editing for Mechanistic Control of Neural Networks [0.0]
SALVEは機械的解釈可能性とモデル編集を橋渡しするフレームワークである。
私たちは、監督なしでスパースでモデルネイティブな機能ベースを学びます。
Grad-FAM(英語版)によりこれらの特徴を検証した。
論文 参考訳(メタデータ) (2025-12-17T20:06:03Z) - Transformers Provably Learn Directed Acyclic Graphs via Kernel-Guided Mutual Information [91.66597637613263]
注意機構を活用するトランスフォーマーベースのモデルは、グラフ内の複雑な依存関係をキャプチャする上で、強い経験的成功を示している。
本稿では,カーネル誘導相互情報(KG-MI)を$f$-divergenceに基づく新しい情報理論指標を提案する。
我々は、K$親和性DAGによって生成された任意のシーケンスが、勾配上昇による単層マルチヘッドトランスを訓練し、大域的最適時間に収束することを証明した。
論文 参考訳(メタデータ) (2025-10-29T14:07:12Z) - Graph Neural Network and Transformer Integration for Unsupervised System Anomaly Discovery [14.982273490507986]
本研究では,分散バックエンドサービスシステムを対象とした教師なし異常検出手法を提案する。
複雑な構造的依存関係、多様な振る舞いの進化、ラベル付きデータの欠如といった現実的な課題に対処する。
その結果,提案手法はいくつかの重要な指標において既存モデルよりも優れていることがわかった。
論文 参考訳(メタデータ) (2025-08-13T00:35:58Z) - Learning Action-based Representations Using Invariance [18.1941237781348]
我々は,制御に関係のある遠隔状態の特徴を割引する多段階制御可能性指標を学習するアクションビシミュレーション符号化を導入する。
我々は,報酬のない一様ランダムなデータに基づく行動ビシミュレーション事前学習が,複数の環境におけるサンプル効率を向上させることを実証した。
論文 参考訳(メタデータ) (2024-03-25T02:17:54Z) - Data-heterogeneity-aware Mixing for Decentralized Learning [63.83913592085953]
グラフの混合重みとノード間のデータ不均一性の関係に収束の依存性を特徴付ける。
グラフが現在の勾配を混合する能力を定量化する計量法を提案する。
そこで本研究では,パラメータを周期的かつ効率的に最適化する手法を提案する。
論文 参考訳(メタデータ) (2022-04-13T15:54:35Z) - Is Disentanglement enough? On Latent Representations for Controllable
Music Generation [78.8942067357231]
強い生成デコーダが存在しない場合、アンタングル化は必ずしも制御性を意味するものではない。
VAEデコーダに対する潜伏空間の構造は、異なる属性を操作するための生成モデルの能力を高める上で重要な役割を果たす。
論文 参考訳(メタデータ) (2021-08-01T18:37:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。