論文の概要: Diagnosing Harmful Continuation in Answer-Correct Long-CoT Training Traces
- arxiv url: http://arxiv.org/abs/2605.29288v1
- Date: Thu, 28 May 2026 03:12:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:55.627197
- Title: Diagnosing Harmful Continuation in Answer-Correct Long-CoT Training Traces
- Title(参考訳): 術後長期CoTトレーニングにおける無害継続の診断
- Authors: Chen He, Yuhao Wu, Lei Wang, Wenxuan Zhang, Fumin Shen,
- Abstract要約: 解答正解長CoTデータにおける閉包後の継続について検討する。
筆者らは,編集者識別後継続後のSFT成績の改善を観察した。
さらに、不確実性や隠蔽状態の進行を通じて、削除後の継続を特徴付ける。
- 参考スコア(独自算出の注目度): 38.23963807225183
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Long chain-of-thought (CoT) traces are widely used as supervision for reasoning-oriented LLM SFT, yet answer-correct traces can still lead to markedly different fine-tuning outcomes. We study post-conclusion continuation in answer-correct long-CoT data: a continuation where the answer appears sufficiently supported, but the trace continues with additional reasoning that remains in the supervised target. To test its training effect, we use a delete-only editor to construct answer-preserving suffix removal and compare CoT-based SFT on the original and processed traces. We observe improved SFT outcomes after removing the editor-identified post-conclusion continuation, suggesting that this continuation is harmful to training in our setting. We therefore refer to this empirically supported phenomenon as harmful continuation. Beyond this intervention, we further characterize the removed post-conclusion continuation through uncertainty and hidden-state progress. We observe persistent local uncertainty together with weakened terminal-directional progress, forming an uncertainty--geometry mismatch. Finally, we instantiate Harmful Continuation Cut (HCC), a lightweight boundary proxy that approximates the editor-identified post-conclusion continuation boundary.
- Abstract(参考訳): 長いチェーン・オブ・シント(CoT)のトレースは推論指向のLSM SFTの監視として広く使用されているが、答えの正しいトレースは依然として著しく異なる微調整結果をもたらす可能性がある。
回答正解長CoTデータにおける解答後継続について検討し,回答が十分に支持される継続について検討するが,その痕跡は教師対象に残る追加の推論で継続する。
学習効果をテストするために,削除専用エディタを用いて解答保存接尾辞を合成し,元のトレースと処理されたトレースをCoTベースのSFTと比較する。
筆者らは,編集者識別後継続後のSFT成績の改善を観察し,この継続がトレーニングに有害であることを示唆した。
したがって、実証的に支持されたこの現象を有害な継続とみなす。
この介入の他に、不確実性や隠蔽状態の進展を通じて、削除後の継続を特徴付ける。
連続した局所不確かさと終端方向の進行の弱さを観察し,不確実性-幾何学的ミスマッチを形成する。
最後に,編集者識別後継続境界を近似した軽量境界プロキシであるHermful Continuation Cut (HCC) をインスタンス化する。
関連論文リスト
- Faithfulness as Information Flow: Evaluating and Training Faithful Chain-of-Thought Reasoning [10.87972575497941]
思考の連鎖(CoT)推論は言語モデルを監視するのに有用である。
モデルはCoTをバイパスするプロンプト・ツー・アンサー・ショートカットに依存することができる。
構造的情報フローの観点からCoTの忠実性を考察する。
論文 参考訳(メタデータ) (2026-05-22T23:37:29Z) - Stop When Reasoning Converges: Semantic-Preserving Early Exit for Reasoning Models [17.588873255093596]
長鎖の思考(CoT)を生成することでLRM(Large Reasoning Models)の性能が向上する
LRMは、しばしば過度に考え、ソリューションがすでに安定し、トークンを無駄にし、レイテンシを増大した後も、推論を続けます。
本稿では,軽量冗長検出器と応答レベル検証を組み合わせたプラグアンドプレイフレームワークPUMAを提案する。
論文 参考訳(メタデータ) (2026-05-17T22:04:11Z) - When Reasoning Traces Become Performative: Step-Level Evidence that Chain-of-Thought Is an Imperfect Oversight Channel [5.106950500256654]
CoT(Chain-of- Thought)トレースは、言語モデルの能力向上とモデルの振る舞いの監査にますます利用されている。
我々は、この仮定を、回答コミットプロキシを中心に構築されたステップレベルのDect-Classify-Compareフレームワークでテストする。
9つのモデルと7つの推論ベンチマーク、潜在コミットメント、明示的な回答到着は平均61.9%のステップで一致している。
論文 参考訳(メタデータ) (2026-05-12T08:24:47Z) - Sanity Checks for Long-Form Hallucination Detection [6.501493411588847]
大規模言語モデルに対する幻覚検出法は、連鎖的推論トレースで機能するが、それらが推論自体を評価するか、あるいは最終回答の表面相関を単に活用するかは定かではない。
提案手法では,各応答の最終回答を基本的真理に置き換えるtextscForce と,軌道を無傷で残しながら回答発表ステップを除去する textscRemove という2つのオラクルテストを通じて,この区別を明らかにする制御不変性手法を導入する。
このことは、彼らの予測力が構造からではなく、答えレベルの成果物に由来するかどうかを明らかにする
論文 参考訳(メタデータ) (2026-05-08T18:00:58Z) - FACT-E: Causality-Inspired Evaluation for Trustworthy Chain-of-Thought Reasoning [49.65751420291115]
CoT(Chain-of-Thought)プロンプトはLSM推論を改善したが、モデルはしばしば不誠実な中間ステップを含むコヒーレントな説明を生成する。
我々は、CoTの品質を評価するための因果性に着想を得たフレームワークであるFACT-Eを提案する。
FACT-Eは推論・軌道選択を改善し、文脈内学習を強くすることを示す。
論文 参考訳(メタデータ) (2026-04-12T15:35:08Z) - Balancing Faithfulness and Performance in Reasoning via Multi-Listener Soft Execution [79.98699884805636]
Reasoning Execution by Multiple Listeners (REMUL) は多人数の強化学習手法である。
REMULは、推論が他の当事者に従えるかがより忠実になるという仮説に基づいている。
スピーカーは、リスナーにとって明らかな推論を生み出すことで報われます。
論文 参考訳(メタデータ) (2026-02-18T02:55:55Z) - Are Reasoning LLMs Robust to Interventions on Their Chain-of-Thought? [79.86483056611105]
推論 LLM は、答えを出す前にステップバイステップの思考連鎖を生成する。
これらの推論は、その内部で発生する破壊の痕跡をどれほど堅牢にしていますか?
一定のタイミングでモデル自身のCoTを摂動させる制御された評価フレームワークを導入する。
論文 参考訳(メタデータ) (2026-02-07T10:02:58Z) - Do Latent-CoT Models Think Step-by-Step? A Mechanistic Study on Sequential Reasoning Tasks [37.23113613155819]
Latent Chain-of-Thought (Latent-CoT) は、長い論理を出力することなくステップバイステップの計算を可能にすることを目的としている。
本研究では, 連続的思考型教師学生蒸留モデルであるCODIについて, 厳密なシーケンシャル・イット・タスクについて検討する。
論文 参考訳(メタデータ) (2026-01-31T01:48:23Z) - ConCISE: Confidence-guided Compression in Step-by-step Efficient Reasoning [64.93140713419561]
大型推論モデル (LRM) は、Chain-of-Thought (CoT) による複雑な推論タスクで強く機能するが、しばしば冗長な出力に悩まされる。
既存の微調整ベースの圧縮手法は、ポストホックプルーニングを動作させるか、コヒーレンスを推論する破壊を危険にさらすか、サンプリングベースの選択に依存するかのいずれかである。
ConCISEは、簡潔な推論連鎖を生成するために設計されたフレームワークであり、信頼注入を統合して推論の信頼性を高める。
論文 参考訳(メタデータ) (2025-05-08T01:40:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。