論文の概要: Revisiting Anthropomorphic Reflection Markers in Large Language Model Reasoning
- arxiv url: http://arxiv.org/abs/2605.28305v1
- Date: Wed, 27 May 2026 11:00:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.991354
- Title: Revisiting Anthropomorphic Reflection Markers in Large Language Model Reasoning
- Title(参考訳): 大言語モデル推論における擬似反射マーカーの再検討
- Authors: Yahan Yu, Noa Nakanishi, Fei Cheng,
- Abstract要約: 我々は人為的な反射マーカーを再検討し、その解釈と反射における役割について検討する。
我々はこれらのマーカーをプロンプトレベルとトークンレベルの介入によって抑制し、タスク性能への影響を分析する。
以上の結果から,人為的マーカーが一様ではないことが示唆された。
- 参考スコア(独自算出の注目度): 10.284391306452175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) often produce explicit reflective traces during complex reasoning, accompanied by anthropomorphic markers such as wait, hmm, and alternatively. Although these markers are commonly used as visible indicators of reflection, their mechanisms remain unclear, which leaves the risk of overthinking associated with redundant and repetitive reflection markers. In this work, we revisit anthropomorphic reflection markers, examining their necessity for reasoning and role in the reflection. We suppress these markers through prompt-level and token-level interventions, and analyze their effects on task performance across four benchmarks and two model scales. Our results show that anthropomorphic markers are not uniformly necessary for reasoning performance: suppressing them can preserve or improve performance in several settings, especially under larger sampling budgets. Meanwhile, marker suppression does not necessarily remove reflection behavior, as models can still perform marker-free verification. These suggest that anthropomorphic markers tend to be surface cues rather than reliable proxies for reflection itself, and motivate future research on reasoning mechanisms beyond explicit marker patterns.
- Abstract(参考訳): 大規模言語モデル(LLM)は、複雑な推論の間、しばしば明確な反射的トレースを生成する。
これらのマーカーは一般的に反射の可視的な指標として使用されるが、そのメカニズムは不明確であり、冗長かつ反復的な反射マーカーに関連する過度な考えのリスクを残している。
本研究では,人為的反射マーカーを再検討し,その解釈とリフレクションにおける役割について検討する。
我々は、これらのマーカーをプロンプトレベルとトークンレベルの介入によって抑制し、4つのベンチマークと2つのモデルスケールにわたるタスクパフォーマンスへの影響を分析する。
以上の結果から, 人為的マーカーは, 特により大規模なサンプリング予算の下では, 性能を抑えるか, 改善するかの判断に一様ではないことが示唆された。
一方、マーカー抑制は必ずしも反射挙動を除去するわけではない。
これらのことは、人為的マーカーは、反射そのものの信頼できるプロキシよりも表面的手がかりである傾向にあり、明示的なマーカーパターンを超えた推論機構に関する将来の研究を動機付けていることを示唆している。
関連論文リスト
- PathCal: State-Aware Reflection-Marker Calibration for Efficient Reasoning [23.11660945127322]
異なるマーカークラスが、異なる方法で精度と生成長に影響を与えることを示す。
PathCalは、マーカーの型を識別することで推論経路を校正する学習不要な復号制御器である。
論文 参考訳(メタデータ) (2026-05-21T22:13:20Z) - HighlightBench: Benchmarking Markup-Driven Table Reasoning in Scientific Documents [88.16322879912458]
マルチモーダルな大言語モデル (MLLM) は文書理解においてかなりの進歩を遂げているが、明示的な論理ディレクティブとしてそのような方法を扱う能力はいまだ探索されていない。
マークアップ駆動型テーブル理解のための診断ベンチマークであるHighlightBenchを導入し,評価を5つのタスクファミリに分解する。
構成された出力制約の下では、視覚的手がかりがシンボリック推論と一貫して一致しなければならない場合、強いモデルでさえ不安定であることを示す。
論文 参考訳(メタデータ) (2026-03-25T06:15:40Z) - Teaching Large Reasoning Models Effective Reflection [62.73646680747003]
大規模推論モデル(LRM)は、最近、複雑な推論タスクにおいて印象的なパフォーマンスを示している。
しかし、すべてのリフレクションが有益であるとは限らない。
まず,自己批判のみを用いてモデルの反射的推論能力を高める訓練フレームワークである自己批判ファインチューニング(SCFT)を提案する。
論文 参考訳(メタデータ) (2026-01-19T04:51:53Z) - Automated Detection of Visual Attribute Reliance with a Self-Reflective Agent [58.90049897180927]
視覚モデルにおける視覚的特徴の意図しない依存を検出するための自動フレームワークを提案する。
自己反射エージェントは、モデルが依存する可能性のある視覚特性に関する仮説を生成し、テストする。
我々は,視覚特性の多様さを示すために設計された130モデルの新しいベンチマークに対して,我々のアプローチを評価した。
論文 参考訳(メタデータ) (2025-10-24T17:59:02Z) - First Try Matters: Revisiting the Role of Reflection in Reasoning Models [66.39546876232512]
我々は、モデルがすでに答を生み出しているが、その出力を確定する前に反射し続ける反射行動に焦点を当てる。
分析の結果,反射はおおむね肯定的であり,モデルの初期回答を変えることは滅多にないことがわかった。
本稿では,いくつかの候補解が生成されると推論プロセスが停止し,推論時間のトークン効率を向上させる質問認識早期検索手法を提案する。
論文 参考訳(メタデータ) (2025-10-09T14:57:10Z) - Think Clearly: Improving Reasoning via Redundant Token Pruning [57.01254508252785]
推論過程における冗長性を意図的に除去することで、性能が大幅に向上することを示す。
本手法は, 推論集約型ベンチマークにおいて, トレーニングを伴わずに, 全体的な精度を著しく向上することを示した。
論文 参考訳(メタデータ) (2025-06-17T06:04:01Z) - Efficient Reasoning Through Suppression of Self-Affirmation Reflections in Large Reasoning Models [29.615519143908998]
自己確認反射は、事前の内容を肯定する冗長な反射ステップであり、しばしば既に正しい推論ステップの後に起こる。
自己確認反射の抑制は複数のモデル間で精度を低下させることなく出力長を減少させることを示す。
また、そのような反射を明示的に抑制することで、現行の列車方式も改善する。
論文 参考訳(メタデータ) (2025-06-14T05:30:09Z) - FIRM: Flexible Interactive Reflection reMoval [75.38207315080624]
本稿では,フレキシブル・インタラクティブ・イメージ・リフレクション・リモーバルのための新しいフレームワークFIRMを提案する。
提案するフレームワークは,従来の対話的手法で必要とされるガイダンス時間の10%しか必要としない。
実世界のリフレクション除去データセットの結果から,提案手法が最先端のリフレクション除去性能を示すことが確認された。
論文 参考訳(メタデータ) (2024-06-03T17:34:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。