論文の概要: On the flow matching interpretability
- arxiv url: http://arxiv.org/abs/2510.21210v1
- Date: Fri, 24 Oct 2025 07:26:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 06:57:23.392302
- Title: On the flow matching interpretability
- Title(参考訳): フローマッチングの解釈可能性について
- Authors: Francesco Pivi, Simone Gazza, Davide Evangelista, Roberto Amadini, Maurizio Gabbrielli,
- Abstract要約: 本稿では,既知の物理分布から各フローステップを抽出するフレームワークを提案する。
流れの軌跡は、シミュレートされた物理過程の平衡状態にマッピングされる(そしてトラバースに制約される)。
このことは、生成フローに物理的意味論を埋め込むことで、神経軌跡を解釈可能な物理過程に変換することを示している。
- 参考スコア(独自算出の注目度): 2.816392009888047
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative models based on flow matching have demonstrated remarkable success in various domains, yet they suffer from a fundamental limitation: the lack of interpretability in their intermediate generation steps. In fact these models learn to transform noise into data through a series of vector field updates, however the meaning of each step remains opaque. We address this problem by proposing a general framework constraining each flow step to be sampled from a known physical distribution. Flow trajectories are mapped to (and constrained to traverse) the equilibrium states of the simulated physical process. We implement this approach through the 2D Ising model in such a way that flow steps become thermal equilibrium points along a parametric cooling schedule. Our proposed architecture includes an encoder that maps discrete Ising configurations into a continuous latent space, a flow-matching network that performs temperature-driven diffusion, and a projector that returns to discrete Ising states while preserving physical constraints. We validate this framework across multiple lattice sizes, showing that it preserves physical fidelity while outperforming Monte Carlo generation in speed as the lattice size increases. In contrast with standard flow matching, each vector field represents a meaningful stepwise transition in the 2D Ising model's latent space. This demonstrates that embedding physical semantics into generative flows transforms opaque neural trajectories into interpretable physical processes.
- Abstract(参考訳): フローマッチングに基づく生成モデルは、様々な領域で顕著な成功を収めてきたが、それらは基本的な限界、すなわち中間生成段階における解釈可能性の欠如に悩まされている。
実際、これらのモデルは一連のベクトル場更新を通じてノイズをデータに変換することを学習するが、各ステップの意味は不透明である。
この問題を解決するために、既知の物理分布から各フローステップをサンプリングする一般的なフレームワークを提案する。
流れの軌跡は、シミュレートされた物理過程の平衡状態にマッピングされる(そしてトラバースに制約される)。
本手法は, パラメトリック冷却スケジュールに沿って流路が熱平衡点となるような2次元イジングモデルを用いて実装する。
提案アーキテクチャは,離散Ising構成を連続潜在空間にマッピングするエンコーダと,温度駆動拡散を行うフローマッチングネットワークと,物理的制約を保ちながら離散Ising状態に戻るプロジェクタとを含む。
格子径が大きくなるにつれてモンテカルロ生成を高速化しながら, 物理忠実度を保ちながら, この枠組みを複数の格子サイズで検証する。
標準フローマッチングとは対照的に、各ベクトル場は2次元イジングモデルの潜在空間における有意義な段階的な遷移を表す。
このことは、生成フローに物理的意味論を埋め込むことで、不透明な神経軌道が解釈可能な物理過程に変換されることを示している。
関連論文リスト
- Kuramoto Orientation Diffusion Models [67.0711709825854]
指紋やテクスチャなどのオリエンテーションに富んだ画像は、しばしばコヒーレントな角模様を示す。
生体系における位相同期の役割を動機として,スコアベース生成モデルを提案する。
一般的な画像ベンチマークで競合する結果を実装し,指紋やテクスチャなどの指向性データセットの生成品質を大幅に向上する。
論文 参考訳(メタデータ) (2025-09-18T18:18:49Z) - Flow Equivariant Recurrent Neural Networks [2.900810893770134]
機械学習では、データの対称性を尊重するニューラルネットワークアーキテクチャを同変と呼ぶ。
我々は同変ネットワーク理論をこの流れの体系に拡張し、時間とともに自然変換を捉える。
これらのモデルは、トレーニング速度、長さの一般化、速度の一般化において、非同変モデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2025-07-20T02:52:21Z) - FlowMo: Variance-Based Flow Guidance for Coherent Motion in Video Generation [51.110607281391154]
FlowMoは、テキスト・ビデオ・モデルにおける動きコヒーレンスを高めるためのトレーニング不要のガイダンス手法である。
時間次元のパッチワイドな分散を測定して動きのコヒーレンスを推定し、サンプリング中にこの分散を動的に減少させるためにモデルを導く。
論文 参考訳(メタデータ) (2025-06-01T19:55:33Z) - FlowDPS: Flow-Driven Posterior Sampling for Inverse Problems [51.99765487172328]
逆問題解決のための後部サンプリングは,フローを用いて効果的に行うことができる。
Flow-Driven Posterior Smpling (FlowDPS) は最先端の代替手段よりも優れています。
論文 参考訳(メタデータ) (2025-03-11T07:56:14Z) - Generative prediction of flow fields around an obstacle using the diffusion model [12.094115138998745]
本稿では,障害物まわりの流れ場を予測するために,障害物形状を入力として利用する幾何学的-フロー拡散モデルを提案する。
マルコフ過程は障害物形状に条件付けされ、各ステップで除去されるノイズを推定する。
我々は、円、楕円、長方形、三角形を含む単純な障害物を取り巻く流れのデータセットを用いて、幾何学と流れの拡散モデルを訓練する。
論文 参考訳(メタデータ) (2024-06-30T15:48:57Z) - Forward Flow for Novel View Synthesis of Dynamic Scenes [97.97012116793964]
本稿では,前向きワープを用いた動的シーンの新たなビュー合成のためのニューラルラジアンス場(NeRF)アプローチを提案する。
本手法は、新しいビューレンダリングとモーションモデリングの両方において、既存の手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-29T16:51:06Z) - Lagrangian Flow Networks for Conservation Laws [1.3385962626827215]
流体密度と速度を連続的に空間と時間でモデル化するLagrangian Flow Networks (LFlows)を紹介した。
LFlowsは2次元および3次元の競合モデルと比較して密度モデリングタスクにおいて高い予測精度を示す。
実世界の応用として、疎気象レーダ測定に基づく鳥の移動をモデル化する。
論文 参考訳(メタデータ) (2023-05-26T11:58:27Z) - Haar Wavelet based Block Autoregressive Flows for Trajectories [129.37479472754083]
歩行者等の軌道予測は,自律型エージェントの性能向上に不可欠である。
本稿では分割結合を利用した新しいハールウェーブレットに基づくブロック自己回帰モデルを提案する。
実世界の2つのデータセット上で、多種多様な正確な軌跡を生成するアプローチの利点について説明する。
論文 参考訳(メタデータ) (2020-09-21T13:57:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。