論文の概要: Natural Language Edge Labelling: Decoupling Intent from Execution in Structured LM Reasoning
- arxiv url: http://arxiv.org/abs/2510.04817v1
- Date: Mon, 06 Oct 2025 14:00:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.884392
- Title: Natural Language Edge Labelling: Decoupling Intent from Execution in Structured LM Reasoning
- Title(参考訳): 自然言語エッジラベリング:構造化LM推論における実行からのインテントの分離
- Authors: Abhinav Madahar,
- Abstract要約: 本稿では,各検索エッジに自由形式の自然言語ディレクティブを付加するラベルラタオーバーレイであるNature Language Edge Labelling (NLEL)を紹介する。
NLEL は CoT/ToT を厳密に一般化し、ラベル付きバンドルの下でのトップ$k$選択の時空単調性を証明し、制御ベクトル歪みによりセレクタ不足を限定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Controllers for structured LM reasoning (e.g., Chain-of-Thought, self-consistency, and Tree-of-Thoughts) often entangle what to try next with how to execute it, exposing only coarse global knobs and yielding brittle, compute-inefficient, and hard-to-audit behavior. We introduce Natural Language Edge Labelling (NLEL), a labeller-tuner overlay that attaches a free-form natural-language directive to each search edge and translates it into a schema-bounded control vector for decoding, search (branch quotas, exploration $\beta$), generation bundle size, retrieval mixtures, and verification passes. A labeller $\Lambda$ emits labels from the parent state and a compact context; a tuner $\Psi$ maps $(P, L, C)\to \Pi$, with strict schema validation and trust-region projection around safe defaults. Downstream selection remains ToT-style with score $S=\mu+\beta\sigma$ and depth-annealed $\beta$. We show NLEL strictly generalizes CoT/ToT, prove an anytime-monotonicity property for top-$k$ selection under label-conditioned bundles, and bound selector shortfall by control-vector distortion, providing decision-relevant justification for guards like trust regions and verification passes. We instantiate $\Psi$ as a prompt-only JSON Parameter Emitter and preregister an evaluation on GSM8K, MATH (subset), StrategyQA, and ARC-Challenge with compute-aware reporting (success@compute, tokens-per-success) and ablations over $\Lambda$, $\Psi$, trust-region radius, and control quantization; preregistered forecasts anticipate accuracy gains at comparable token budgets and improved success@compute under constraints. NLEL offers an interpretable, model-agnostic interface that separates intent from execution for controllable, auditable LM inference.
- Abstract(参考訳): 構造化LM推論のためのコントローラ(例えば、Chain-of-Thought、Self-Consistency、Tree-of-Thoughts)は、次に何をするかを絞って実行し、粗いグローバルノブだけを露出し、脆く、計算非効率で、難聴な振る舞いをもたらす。
NLEL(Natural Language Edge Labelling)は,各検索エッジに自由形式の自然言語ディレクティブを付加し,デコード,検索(ブランチクォータ,探索$\beta$),生成バンドルサイズ,検索ミックス,検証パスのスキーマ境界制御ベクトルに変換するラベル付きオーバレイである。
labeller $\Lambda$は、親状態とコンパクトなコンテキストからラベルを出力する; tuner $\Psi$ map $(P, L, C)\to \Pi$, 厳密なスキーマ検証と、セーフデフォルトに関する信頼領域のプロジェクション。
ダウンストリームの選択はToTスタイルのままで、スコアは$S=\mu+\beta\sigma$、深さは$\beta$である。
我々は、NLELがCoT/ToTを厳密に一般化し、ラベル条件付きバンドルの下でのトップ$k$選択の時空単調性を証明し、制御ベクトル歪みによるセレクタ不足を制限し、信頼領域や検証パスのようなガードに対する決定関連正当性を提供することを示す。
プロンプトのみのJSONパラメータとして$\Psi$をインスタンス化し、GSM8K、MATH(サブセット)、StrategyQA、ARC-Challengeに対する評価を事前登録します。
NLELは、制御可能で監査可能なLM推論の実行からインテントを分離する解釈可能な、モデルに依存しないインターフェイスを提供する。
関連論文リスト
- Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - Auditable Early Stopping for Agentic Routing: Ledger-Verified Run-Wise Certificates under Local DP [0.0]
ツール・ユース・エージェントのための最優先ルータが、よい葉を欠くことなく探索を止められるようになれば、私たちは対処します。
本稿では,各ノードのキーを,葉の摂動を実現する指数関数レースに結合するランワイズ証明書を提案する。
合成グラフと小さな実パイプラインの実験は、厳密な停止、決定論的リプレイ、オーバーヘッドの低さを示している。
論文 参考訳(メタデータ) (2025-09-09T01:25:09Z) - Fast Controlled Generation from Language Models with Adaptive Weighted Rejection Sampling [90.86991492288487]
トークンの制約を評価するのは 違法にコストがかかる
LCDは文字列上のグローバル分布を歪め、ローカル情報のみに基づいてトークンをサンプリングすることができる。
我々のアプローチは最先端のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2025-04-07T18:30:18Z) - $\texttt{SEM-CTRL}$: Semantically Controlled Decoding [53.86639808659575]
$texttSEM-CTRL$は、LLMデコーダに直接、リッチなコンテキスト依存制約とタスクおよびインスタンス固有のセマンティクスを強制する統一的なアプローチである。
texttSEM-CTRL$は、小さな訓練済みのLLMがより大きな変種や最先端の推論モデルよりも効率的に性能を向上することを可能にする。
論文 参考訳(メタデータ) (2025-03-03T18:33:46Z) - Reasoning to Attend: Try to Understand How <SEG> Token Works [44.33848900059659]
我々は、$texttSEG>$トークンが、画像とテキストのペア内のセマンティックな類似性に寄与していることを示す。
本稿では,高活性点の誘導の下で,LMMの高強度な$textbfREA$soning機能を実現するREADを提案する。
論文 参考訳(メタデータ) (2024-12-23T17:44:05Z) - Selective Generation for Controllable Language Models [19.909671258499184]
生成言語モデル(GLM)の信頼性は、重要な意思決定システムへの展開において不可欠である。
テキストエンタテインメント関係(FDR-E)に関して、偽発見率を制御する2つの選択的生成アルゴリズムを提案する。
選択予測を直接修正した$textttSGentextttSup$は、人間によって注釈付けされたエンテーメントラベル付きデータを悪用する。
人間のアノテーションはコストがかかるので、unを完全に活用した半教師付きバージョンである$textttSGentexttSemi$を提案します。
論文 参考訳(メタデータ) (2023-07-18T13:36:24Z) - Semi-DETR: Semi-Supervised Object Detection with Detection Transformers [105.45018934087076]
半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
論文 参考訳(メタデータ) (2023-07-16T16:32:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。