論文の概要: Reasoning on the Manifold: Bidirectional Consistency for Self-Verification in Diffusion Language Models
- arxiv url: http://arxiv.org/abs/2604.16565v2
- Date: Thu, 23 Apr 2026 12:41:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:05.998894
- Title: Reasoning on the Manifold: Bidirectional Consistency for Self-Verification in Diffusion Language Models
- Title(参考訳): マニフォールドの推論:拡散言語モデルにおける自己検証のための双方向整合性
- Authors: Jiaoyang Ruan, Xin Gao, Yinda Chen, Hengyu Zeng, Liang Du, Guanghao Li, Jie Fu, Jian Pu,
- Abstract要約: BMC(Bidirectional Manifold Consistency)は、トレーニングなし、教師なしのメトリクスである。
BMCは、根拠となる真理の答えなしに、解の有効性の堅牢な判別器として機能する。
本研究は,dLLMの正当性を示す頑健な指標として,固有幾何安定性を確立した。
- 参考スコア(独自算出の注目度): 30.607422839762553
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Diffusion Large Language Models (dLLMs) offer structural advantages for global planning, efficiently verifying that they arrive at correct answers via valid reasoning traces remains a critical challenge. In this work, we propose a geometric perspective: Reasoning on the Manifold. We hypothesize that valid generation trajectories reside as stable attractors on the high-density manifold of the learned distribution, whereas invalid paths exhibit off-manifold drift. To operationalize this, we introduce Bidirectional Manifold Consistency (BMC), a training-free, unsupervised metric that quantifies the stability of the generated sequence through a forward-masking and backward-reconstruction cycle. Empirically, we demonstrate BMC's versatility across the full reasoning lifecycle: (1) in Diagnosis, it serves as a robust discriminator of solution validity without ground truth answer; (2) in Inference, it enables rejection resampling to effectively concentrate computational resources on complex reasoning tasks; and (3) in Alignment, it functions as a dense geometric reward that transforms sparse outcome supervision into fine-grained guidance, empowering models to self-evolve beyond standard baselines. Our results establish intrinsic geometric stability as a robust indicator of correctness for dLLMs.
- Abstract(参考訳): Diffusion Large Language Models (dLLMs) は、グローバルプランニングにおいて構造的優位性を提供するが、有効な推論トレースを通じて正しい回答に達することを効率よく検証することは、依然として重要な課題である。
本稿では幾何学的視点として,マニフォールドの推論を提案する。
有効生成軌道は学習された分布の高密度多様体上の安定な誘引子として存在し、一方、無効な経路はオフ・マニフォールドのドリフトを示す。
そこで本稿では, 双方向マニフォールド整合性 (BMC) について紹介する。これは, トレーニング不要で教師なしの指標で, 前方・後方・後方の再構成サイクルを通じて生成されたシーケンスの安定性を定量化する。
実験的に、BMCの汎用性は、(1)診断においては、根本的真理応答を伴わない解の妥当性の堅牢な判別器として機能し、(2)推論では、複雑な推論タスクに効果的に計算資源を集中させることができること、(3)アライメントでは、スパース結果の監督をきめ細かなガイダンスに変換し、モデルを標準ベースラインを超えて自己進化させるような、密密な幾何学的報酬として機能すること、である。
本研究は,dLLMの正当性を示す頑健な指標として,固有幾何安定性を確立した。
関連論文リスト
- GHS-TDA: A Synergistic Reasoning Framework Integrating Global Hypothesis Space with Topological Data Analysis [27.271992201673083]
CoT (Chain-of-Thought) は,大規模言語モデル (LLM) の推論精度を大幅に向上することが示されている。
既存のCoTメソッドには2つの基本的な制限がある。
論文 参考訳(メタデータ) (2026-02-10T14:00:30Z) - Cross-Modal Redundancy and the Geometry of Vision-Language Embeddings [11.831077025246664]
視覚言語モデル(VLM)は画像とテキストを顕著な成功を収めるが、それらの共有埋め込み空間の幾何学はいまだに理解されていない。
我々は、アラインドスパースオートエンコーダ(SAE)を用いて、クロスモーダル冗長性を利用したIso-Energy Assumptionを運用する。
この帰納バイアスは、再構成を損なうことなくSAE溶液を変化させ、幾何学解析のツールとして機能する表現を与える。
論文 参考訳(メタデータ) (2026-02-05T21:56:26Z) - Riemannian Flow Matching for Disentangled Graph Domain Adaptation [51.98961391065951]
グラフドメイン適応(GDA)は典型的には、ユークリッド空間におけるグラフ埋め込みの整列に逆学習を使用する。
DisRFMは、埋め込みとフローベースのトランスポートを統一する幾何学的なGDAフレームワークである。
論文 参考訳(メタデータ) (2026-01-31T11:05:35Z) - The Reasoning-Creativity Trade-off: Toward Creativity-Driven Problem Solving [57.652356955571065]
最先端の大規模言語モデル(LLM)パイプラインは、ブートストラップの推論ループに依存している。
我々は、この設計選択が、推論経路上のモデルの分布の崩壊にどのように敏感であるかを分析する。
本稿では,分散創造推論(DCR)について紹介する。これは,解トレースの確率測定を通じて,トレーニングを勾配流としてキャストする,統一的な変分目的である。
論文 参考訳(メタデータ) (2026-01-02T17:10:31Z) - The Procrustean Bed of Time Series: The Optimization Bias of Point-wise Loss [53.542743390809356]
本稿では,最適化バイアス(EOB)の期待に関する第一原理解析を提案する。
時間列が決定論的で構造化されるほど、ポイントワイドの損失関数によるバイアスがより厳しくなる。
本稿では,DFTとDWTの両原理を同時に実現する具体的ソリューションを提案する。
論文 参考訳(メタデータ) (2025-12-21T06:08:22Z) - Stabilizing Reinforcement Learning for Honesty Alignment in Language Models on Deductive Reasoning [27.42733470720954]
本研究では,地上の真実軌道をロールアウトに注入し,早期の訓練崩壊を防ぐ強化学習手法を提案する。
その結果,本手法は学習を安定させ,全体の推論性能を大幅に向上させることを示した。
論文 参考訳(メタデータ) (2025-11-12T11:34:19Z) - Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z) - Robust Self-Supervised LiDAR Odometry via Representative Structure
Discovery and 3D Inherent Error Modeling [67.75095378830694]
そこで我々は,2段階のオドメトリ推定ネットワークを構築し,一連の部分領域変換を推定してエゴモーメントを求める。
本稿では,トレーニング,推論,マッピングフェーズにおける信頼できない構造の影響を軽減することを目的とする。
我々の2フレームのオードメトリーは、翻訳/回転誤差の点で、過去の芸術の状態を16%/12%上回っている。
論文 参考訳(メタデータ) (2022-02-27T12:52:27Z) - Distributional Robustness and Regularization in Reinforcement Learning [62.23012916708608]
経験値関数の新しい正規化器を導入し、ワッサーシュタイン分布のロバストな値関数を下限とすることを示す。
強化学習における$textitexternalな不確実性に対処するための実用的なツールとして正規化を使用することを提案する。
論文 参考訳(メタデータ) (2020-03-05T19:56:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。