論文の概要: Reasoning as Energy Minimization over Structured Latent Trajectories
- arxiv url: http://arxiv.org/abs/2603.28248v1
- Date: Mon, 30 Mar 2026 10:20:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.334527
- Title: Reasoning as Energy Minimization over Structured Latent Trajectories
- Title(参考訳): 構造的潜在軌道のエネルギー最小化としての推論
- Authors: David K. Johansson,
- Abstract要約: 構造的潜在計画(EBRM)によるエネルギーベース推論を提案する。
EBRMは、学習エネルギー関数$E(h_x, z)$の下で、多段階潜在軌道$z_1:T$の最適化をモデル化する。
訓練は、教師付きエンコーダ・デコーダ学習とハードネガティブを用いた対照的なエネルギーシェーピングを組み合わせる。
我々は,ステップごとの復号化,遅延ドリフト追跡,勾配分解による解析を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-shot neural decoders commit to answers without iterative refinement, while chain-of-thought methods introduce discrete intermediate steps but lack a scalar measure of reasoning progress. We propose Energy-Based Reasoning via Structured Latent Planning (EBRM), which models reasoning as gradient-based optimization of a multi-step latent trajectory $z_{1:T}$ under a learned energy function $E(h_x, z)$. The energy decomposes into per-step compatibility, transition consistency, and trajectory smoothness terms. Training combines supervised encoder-decoder learning with contrastive energy shaping using hard negatives, while inference performs gradient descent or Langevin dynamics over $z$ and decodes from $z_T$. We identify a critical failure mode: on CNF logic satisfaction, latent planning reduces accuracy from $\approx 95\%$ to $\approx 56\%$. This degradation arises from a distribution mismatch, where the decoder is trained on encoder outputs $h_x$ but evaluated on planner outputs $z_T$ that drift into unseen latent regions. We analyze this behavior through per-step decoding, latent drift tracking, and gradient decomposition. To address it, we propose dual-path decoder training and latent anchoring. We further introduce a six-part ablation protocol covering component contributions, trajectory length, planner dynamics, initialization, decoder training distribution, and anchor weight. Experiments on three synthetic tasks show that energy decreases monotonically and induces structured latent trajectories on graph and logic tasks, while remaining flat on arithmetic ($r = 0.073$), indicating a negative result. Code is available at https://github.com/dkjo8/ebr-via-structured-latent-planning.
- Abstract(参考訳): 単発神経デコーダは反復的洗練なしに答えにコミットする一方、チェーン・オブ・シント法は個別の中間ステップを導入するが、推論の進歩のスカラー尺度は欠如している。
本稿では,多段階遅延軌道の勾配に基づく最適化をモデルとした構造的遅延計画(EBRM)によるエネルギーベース推論を提案し,その手法を学習エネルギー関数$E(h_x, z)$の下で提案する。
エネルギーはステップごとの整合性、遷移の整合性、軌道の滑らかさの項に分解される。
トレーニングは、教師付きエンコーダ・デコーダ学習とハードネガティブを用いた対照的なエネルギーシェーピングを組み合わせ、推論は、z$以上の勾配降下またはランゲヴィンダイナミクスを実行し、$z_T$からデコードする。
CNFのロジック満足度では、遅延プランニングは精度を$\approx 95\%$から$\approx 56\%$に下げる。
この劣化は、デコーダがエンコーダ出力で$h_x$でトレーニングされる分散ミスマッチから生じるが、プランナー出力で$z_T$で評価される。
我々は,ステップごとの復号化,遅延ドリフト追跡,勾配分解による解析を行った。
そこで本研究では,デュアルパスデコーダのトレーニングと潜時アンカリングを提案する。
さらに,コンポーネントのコントリビューション,軌道長,プランナーダイナミクス,初期化,デコーダのトレーニング分布,アンカーウェイトを対象とする6部アブレーションプロトコルを導入する。
3つの合成タスクの実験では、エネルギーは単調に減少し、グラフや論理タスク上で構造化された潜在軌道を誘導する一方で、算術(r = 0.073$)で平坦であり、負の結果を示す。
コードはhttps://github.com/dkjo8/ebr-via-structured-latent-planningで公開されている。
関連論文リスト
- Operator Learning Using Weak Supervision from Walk-on-Spheres [81.26322147849918]
トレーニング型PDEソルバは、高価なデータ生成や不安定な物理インフォームドニューラルネットワーク(PINN)によってボトルネックされることが多い
モンテカルロ法を用いてPDEの解をトレーニング中の弱監督過程として推定する手法を提案する。
論文 参考訳(メタデータ) (2026-03-01T17:23:39Z) - Unbiased Gradient Estimation for Event Binning via Functional Backpropagation [64.88399635309918]
バックプロパゲーション中に弱微分を合成することにより任意の双対関数の非バイアス勾配推定のための新しいフレームワークを提案する。
自己監督型光流ではECEが9.4%,SLAMでは5.1%低下し,事象に基づく視覚知覚において大きなメリットが示された。
論文 参考訳(メタデータ) (2026-02-13T04:05:03Z) - Gradient Descent as a Perceptron Algorithm: Understanding Dynamics and Implicit Acceleration [67.12978375116599]
勾配降下(GD)のステップが一般化されたパーセプトロンアルゴリズムのステップに還元されることを示す。
これは、ニューラルネットワークで観測される最適化力学と暗黙の加速現象を説明するのに役立つ。
論文 参考訳(メタデータ) (2025-12-12T14:16:35Z) - Renormalizable Spectral-Shell Dynamics as the Origin of Neural Scaling Laws [2.779943773196378]
高い非線形最適化ダイナミクスにもかかわらず、ディープ・ネットワーク・トレーニングは単純なマクロ構造に従うことを示す。
平均二乗誤差損失の場合、トレーニングエラーは$dot e_t=-M(t)e_t$と$M(t)=J_(t)J_(t)!*$として進化する。
このフレームワークは、ニューラルスケーリング法則と二重降下を説明し、遅延(NTKライクな)トレーニングと特徴学習を同一スペクトルシェルの2つの限界として統一する。
論文 参考訳(メタデータ) (2025-12-11T08:38:46Z) - INC: An Indirect Neural Corrector for Auto-Regressive Hybrid PDE Solvers [61.84396402100827]
本稿では,学習した補正を支配方程式に統合する間接ニューラルコレクタ(mathrmINC$)を提案する。
$mathrmINC$は、$t-1 + L$の順番でエラー増幅を減らし、$t$はタイムステップ、$L$はリプシッツ定数である。
大規模なベンチマークで$mathrmINC$をテストし、1Dカオスシステムから3D乱流まで、多くの異なる解法、神経バックボーン、テストケースをカバーした。
論文 参考訳(メタデータ) (2025-11-16T20:14:28Z) - Tortoise and Hare Guidance: Accelerating Diffusion Model Inference with Multirate Integration [5.634791333443662]
Tortoise and Hare Guidance(THG)は、高忠実度生成を維持しながら拡散サンプリングを加速するトレーニングフリー戦略である。
THGは機能評価(NFE)の回数を30%まで削減し, 世代密度の低下はほとんど生じないことを示した。
本研究は,拡散解法におけるマルチレート定式化の可能性を強調し,モデル再構成なしにリアルタイムな高品質な画像合成を実現することを目的とした。
論文 参考訳(メタデータ) (2025-11-06T07:08:58Z) - Decentralized Nonconvex Composite Federated Learning with Gradient Tracking and Momentum [78.27945336558987]
分散サーバ(DFL)はクライアント・クライアント・アーキテクチャへの依存をなくす。
非滑らかな正規化はしばしば機械学習タスクに組み込まれる。
本稿では,これらの問題を解決する新しいDNCFLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-17T08:32:25Z) - BP(\lambda): Online Learning via Synthetic Gradients [6.581214715240991]
リカレントニューラルネットワークのトレーニングは通常、時間によるバックプロパゲーション(BPTT)に依存します。
それらの実装において、合成勾配は、バックプロパゲート勾配とブートストラップされた合成勾配の混合によって学習される。
RL における $mathrmTD(lambda)$ の蓄積に着想を得て,BPTT の利用を完全に回避した完全オンラインな合成勾配学習法を提案する。
論文 参考訳(メタデータ) (2024-01-13T11:13:06Z) - Low PAPR MIMO-OFDM Design Based on Convolutional Autoencoder [20.544993155126967]
ピーク対平均電力比(mathsfPAPR$)削減と波形設計のための新しい枠組みを提案する。
畳み込みオートコーダ(mathsfCAE$)アーキテクチャが提示される。
1つのトレーニングされたモデルが、幅広いSNRレベルにわたって、$mathsfPAPR$の削減、スペクトル設計、および$mathsfMIMO$の検出のタスクをカバーしていることを示す。
論文 参考訳(メタデータ) (2023-01-11T11:35:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。