論文の概要: Action-Inspired Generative Models
- arxiv url: http://arxiv.org/abs/2605.14631v1
- Date: Thu, 14 May 2026 09:43:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.759097
- Title: Action-Inspired Generative Models
- Title(参考訳): アクションインスパイアされた生成モデル
- Authors: Eshwar R. A., Debnath Pal,
- Abstract要約: アクションインスパイアされた生成モデル(AGM)
既往の橋梁整合法が輸送景観の遷移に均一な回帰重みを割り当てるという観察に動機づけられた双対ネットワーク生成フレームワークを導入する。
学習可能なポテンシャルを通して不定形輸送経路を選択的に解析すると、フィデリティとカバレッジのメトリクス間で生成品質が一貫した改善が得られることを実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Action-Inspired Generative Models (AGMs), a dual-network generative framework motivated by the observation that existing bridge-matching methods assign uniform regression weight to every stochastic transition in the transport landscape, regardless of whether a given bridge sample lies along a structurally coherent trajectory or a degenerate one. We address this by introducing a lightweight learned scalar potential $V_φ$ that scores bridge samples online and modulates the drift objective via importance weights derived through a stop-gradient barrier -- preventing adversarial feedback between the two networks whilst preserving $V_φ$'s guiding signal. Crucially, $V_φ$ comprises only $\sim$1.4% of the primary drift network's parameter count, adds no overhead to the inference graph, and requires no iterative half-bridge fitting or auxiliary stochastic differential equation (SDE) solvers: it is a plug-and-play enhancement to any bridge-matching training loop. At inference, $V_φ$ is discarded entirely, leaving standard Euler-Maruyama integration of the exponential moving average (EMA) drift. We demonstrate that selectively penalising uninformative transport paths through the learned potential yields consistent improvements in generation quality across fidelity and coverage metrics.
- Abstract(参考訳): 既存のブリッジマッチング手法は, 橋梁試料が構造的に整合した軌道に沿ってあるか, あるいは縮退した軌道に沿ってあるかに関わらず, 輸送ランドスケープ内の全ての確率的遷移に対して, 均一な回帰重みを割り当てるという観察から動機付けられた, デュアルネットワーク生成フレームワークであるAGM(Action-Inspired Generative Models)を紹介する。
我々は、オンラインの橋梁サンプルをスコアリングし、停止段階の障壁から導かれる重みによって漂流目標を変調する軽量な学習スカラーポテンシャルであるV_φ$を導入し、V_φ$の誘導信号を保存しながら、2つのネットワーク間の敵対的フィードバックを防止している。
重要なのは、V_φ$ は一次ドリフトネットワークのパラメータの 1.4% の$\sim$1.4% しか含まず、推論グラフにオーバーヘッドを追加せず、繰り返し半ブリッジフィッティングや補助確率微分方程式 (SDE) の解法を必要としない。
推測では、$V_φ$は完全に破棄され、指数移動平均(EMA)ドリフトの標準のオイラー・丸山積分が残る。
学習可能なポテンシャルを通して不定形輸送経路を選択的に解析すると、フィデリティとカバレッジのメトリクス間で生成品質が一貫した改善が得られることを実証する。
関連論文リスト
- Rectified Schrödinger Bridge Matching for Few-Step Visual Navigation [18.319705014361908]
視覚ナビゲーションはEmbodied AIの中核的な課題であり、自律エージェントは高次元の感覚観察を長距離行動軌跡に変換する必要がある。
我々は,シュルディンガー橋と決定論的輸送の共通速度場構造を利用するフレームワークであるRectified Schrdinger Bridge Matching (RSBM)を提案する。
RSBMはわずか3段階のトレーニングで94%以上の成功率と92%以上の成功率を達成し、高忠実度生成ポリシーとEmbodied AIの低レイテンシ要求とのギャップを著しく狭めている。
論文 参考訳(メタデータ) (2026-04-07T10:22:27Z) - Look-Ahead and Look-Back Flows: Training-Free Image Generation with Trajectory Smoothing [3.77130368225397]
流速場調整による画像生成を改善するため, 各種トレーニングフリーなフローマッチング手法が開発されている。
本研究では, 曲率ゲートウェイトを用いて, 電流および次ステップの潜伏を平均化するemphLook-Aheadと, 指数移動平均を用いて潜伏を滑らかにするemphLook-Backの2つの学習自由軌道平滑化手法を提案する。
論文 参考訳(メタデータ) (2026-02-10T06:34:47Z) - DiffusionDriveV2: Reinforcement Learning-Constrained Truncated Diffusion Modeling in End-to-End Autonomous Driving [65.7087560656003]
エンドツーエンドの自動運転のための生成拡散モデルは、しばしばモード崩壊に悩まされる。
強化学習を利用して低品質モードを制約し,優れた軌道探索を行うDiffusionDriveV2を提案する。
これにより、そのコアであるガウス混合モデル固有の多重モード性を維持しながら、全体的な出力品質が大幅に向上する。
論文 参考訳(メタデータ) (2025-12-08T17:29:52Z) - Variational Inference Optimized Using the Curved Geometry of Coupled Free Energy [4.252549987351643]
結合自由エネルギーに基づく変分推論のための最適化フレームワークを提案する。
我々は、結合指数族の曲面幾何学を考慮に入れ、変分推論手法を拡張した。
論文 参考訳(メタデータ) (2025-06-10T10:47:21Z) - Flow-GRPO: Training Flow Matching Models via Online RL [80.62659379624867]
本稿では,オンライン政策強化学習をフローマッチングモデルに統合する最初の方法であるFlow-GRPOを提案する。
提案手法では,(1)決定論的正規微分方程式を同値な微分方程式に変換するODE-to-SDE変換と,(2)推論ステップの数を維持しながらトレーニングの段階を短縮するDenoising Reduction戦略の2つの主要な戦略を用いる。
論文 参考訳(メタデータ) (2025-05-08T17:58:45Z) - Joint Transmit and Pinching Beamforming for Pinching Antenna Systems (PASS): Optimization-Based or Learning-Based? [89.05848771674773]
MISO (Multiple-input Single-output) フレームワークを提案する。
それは複数の導波路で構成されており、多数の低コストアンテナ(PA)を備えている。
PAの位置は、大規模パスと空間の両方にまたがるように再構成することができる。
論文 参考訳(メタデータ) (2025-02-12T18:54:10Z) - Adaptive Federated Learning Over the Air [108.62635460744109]
オーバー・ザ・エア・モデル・トレーニングの枠組みの中で,適応勾配法,特にAdaGradとAdamの連合バージョンを提案する。
解析の結果,AdaGrad に基づくトレーニングアルゴリズムは $mathcalO(ln(T) / T 1 - frac1alpha の速度で定常点に収束することがわかった。
論文 参考訳(メタデータ) (2024-03-11T09:10:37Z) - Do Generative Models Know Disentanglement? Contrastive Learning is All
You Need [59.033559925639075]
本論文では,変数空間におけるコントラスト(DisCo)による非監視的,モデル非依存的手法を提案する。
DisCoは、GAN、VAE、およびフローを含む、事前訓練された非解離生成モデルに与えられた最先端の解離を達成します。
論文 参考訳(メタデータ) (2021-02-21T08:01:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。