論文の概要: Contrastive Diffusion Alignment: Learning Structured Latents for Controllable Generation
- arxiv url: http://arxiv.org/abs/2510.14190v1
- Date: Thu, 16 Oct 2025 00:48:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.663064
- Title: Contrastive Diffusion Alignment: Learning Structured Latents for Controllable Generation
- Title(参考訳): コントラスト拡散アライメント:制御可能生成のための構造化潜水器の学習
- Authors: Ruchi Sandilya, Sumaira Perez, Charles Lynch, Lindsay Victoria, Benjamin Zebley, Derrick Matthew Buchanan, Mahendra T. Bhati, Nolan Williams, Timothy J. Spellman, Faith M. Gunning, Conor Liston, Logan Grosenick,
- Abstract要約: ConDAは拡散埋め込み内での対照的な学習を適用して、潜在幾何学とシステムダイナミクスを整合させるフレームワークである。
ConDAは線形および条件付きベースラインと比較して制御性が改善された解釈可能な潜在表現を生成する。
- 参考スコア(独自算出の注目度): 6.124866439620813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models excel at generation, but their latent spaces are not explicitly organized for interpretable control. We introduce ConDA (Contrastive Diffusion Alignment), a framework that applies contrastive learning within diffusion embeddings to align latent geometry with system dynamics. Motivated by recent advances showing that contrastive objectives can recover more disentangled and structured representations, ConDA organizes diffusion latents such that traversal directions reflect underlying dynamical factors. Within this contrastively structured space, ConDA enables nonlinear trajectory traversal that supports faithful interpolation, extrapolation, and controllable generation. Across benchmarks in fluid dynamics, neural calcium imaging, therapeutic neurostimulation, and facial expression, ConDA produces interpretable latent representations with improved controllability compared to linear traversals and conditioning-based baselines. These results suggest that diffusion latents encode dynamics-relevant structure, but exploiting this structure requires latent organization and traversal along the latent manifold.
- Abstract(参考訳): 拡散モデルは生成時に優れるが、その潜在空間は解釈可能な制御のために明示的に組織化されていない。
ConDA(Contrastive Diffusion Alignment)は,拡散埋め込み内でのコントラスト学習を適用し,潜在幾何学とシステム力学を整合させるフレームワークである。
対照的な目的がより不整合で構造化された表現を回復できることを示す最近の進歩に触発され、ConDAは拡散潜水器を編成し、その方向が基礎となる動的要因を反映する。
この対照的に構造化された空間の中で、ConDAは忠実な補間、外挿、制御可能な生成をサポートする非線形軌道軌道を可能にする。
流体力学、神経カルシウムイメージング、治療的神経刺激、表情のベンチマークにおいて、ConDAは線形トラバーサルやコンディショニングベースラインと比較して制御性を向上させた解釈可能な潜在表現を生成する。
これらの結果は拡散ラテントが動的関連構造を符号化することを示しているが、この構造を利用するためには、ラテント多様体に沿ったラテント構造とトラバーサルが必要であることを示唆している。
関連論文リスト
- Empirical Investigation of Latent Representational Dynamics in Large Language Models: A Manifold Evolution Perspective [4.935224714809964]
本稿では,低次元意味多様体上で進化する連続軌跡として,大規模言語モデル(LLM)の生成をモデル化する概念的フレームワークである動的マニフォールド進化論(DMET)を紹介する。
この理論は、3つの解釈可能な測度-状態連続性(C$)、誘引子コンパクト性(Q$)、トポロジカル持続性(P$)を通じて潜在力学を特徴づけ、滑らかさ、安定性、表現進化の構造を共同で捉える。
論文 参考訳(メタデータ) (2025-05-24T14:17:50Z) - Constrained Discrete Diffusion [61.81569616239755]
本稿では,拡散過程における微分可能制約最適化の新たな統合であるCDD(Constrained Discrete Diffusion)を紹介する。
CDDは直接、離散拡散サンプリングプロセスに制約を課し、トレーニング不要で効果的なアプローチをもたらす。
論文 参考訳(メタデータ) (2025-03-12T19:48:12Z) - Improving Vector-Quantized Image Modeling with Latent Consistency-Matching Diffusion [55.185588994883226]
VQ-LCMDは、学習を安定させる埋め込み空間内の連続空間潜在拡散フレームワークである。
VQ-LCMDは、関節埋め込み拡散変動下界と整合整合性(CM)損失を組み合わせた新しいトレーニング目標を使用する。
実験により,提案したVQ-LCMDは離散状態潜伏拡散モデルと比較して,FFHQ,LSUN教会,LSUNベッドルームにおいて優れた結果が得られることが示された。
論文 参考訳(メタデータ) (2024-10-18T09:12:33Z) - Extraction and Recovery of Spatio-Temporal Structure in Latent Dynamics
Alignment with Diffusion Models [1.4756031289693907]
行動関連脳の計算では、神経信号をその中の急激な領域に合わせる必要がある。
本研究では,拡散モデルの表現性を利用して潜在力学の固有時間構造を保存するアライメント手法であるEDDiffを提案する。
提案手法は, 潜時力学の時間的構造を保ち, 整合性, ニューラルデコード性能において, 既存の手法より優れることを示す。
論文 参考訳(メタデータ) (2023-06-09T05:53:11Z) - Latent Traversals in Generative Models as Potential Flows [113.4232528843775]
我々は,学習された動的ポテンシャルランドスケープを持つ潜在構造をモデル化することを提案する。
物理、最適輸送、神経科学にインスパイアされたこれらの潜在的景観は、物理的に現実的な偏微分方程式として学習される。
本手法は,最先端のベースラインよりも定性的かつ定量的に歪んだ軌跡を実現する。
論文 参考訳(メタデータ) (2023-04-25T15:53:45Z) - Simulating progressive intramural damage leading to aortic dissection
using an operator-regression neural network [0.2955543753858105]
We developed a data-driven surrogate model for the delamination process for differential strut distributions using DeepONet。
その結果,DeepONetは様々なストラット分布を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2021-08-25T03:49:19Z) - An Ode to an ODE [78.97367880223254]
我々は、O(d) 群上の行列フローに応じて主フローの時間依存パラメータが進化する ODEtoODE と呼ばれるニューラルODE アルゴリズムの新しいパラダイムを提案する。
この2つの流れのネストされたシステムは、訓練の安定性と有効性を提供し、勾配の消滅・爆発問題を確実に解決する。
論文 参考訳(メタデータ) (2020-06-19T22:05:19Z) - Network Diffusions via Neural Mean-Field Dynamics [52.091487866968286]
本稿では,ネットワーク上の拡散の推論と推定のための新しい学習フレームワークを提案する。
本研究の枠組みは, ノード感染確率の正確な進化を得るために, モリ・ズワンジッヒ形式から導かれる。
我々のアプローチは、基礎となる拡散ネットワークモデルのバリエーションに対して多用途で堅牢である。
論文 参考訳(メタデータ) (2020-06-16T18:45:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。