Fugu-MT 論文翻訳(概要): LLMs Encode Their Failures: Predicting Success from Pre-Generation Activations

論文の概要: LLMs Encode Their Failures: Predicting Success from Pre-Generation Activations

arxiv url: http://arxiv.org/abs/2602.09924v1
Date: Tue, 10 Feb 2026 15:57:00 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-11 20:17:43.665787
Title: LLMs Encode Their Failures: Predicting Success from Pre-Generation Activations
Title（参考訳）: LLMは失敗をエンコードする - プレジェネレーションアクティベーションの成功を予測する
Authors: William Lugoloobi, Thomas Foster, William Bankes, Chris Russell,
Abstract要約: 我々は,前世代のアクティベーションに関する線形プローブを訓練し,数学やコーディングタスクにおける政策固有の成功を予測する。モデルが人間の難易度とは異なる難易度のモデル固有の概念を符号化していることを示す。モデルプールをまたいでクエリをルーティングすることは、最高のパフォーマンスモデルを超えることができることを実証する。
参考スコア（独自算出の注目度）: 5.275682987885503
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Running LLMs with extended reasoning on every problem is expensive, but determining which inputs actually require additional compute remains challenging. We investigate whether their own likelihood of success is recoverable from their internal representations before generation, and if this signal can guide more efficient inference. We train linear probes on pre-generation activations to predict policy-specific success on math and coding tasks, substantially outperforming surface features such as question length and TF-IDF. Using E2H-AMC, which provides both human and model performance on identical problems, we show that models encode a model-specific notion of difficulty that is distinct from human difficulty, and that this distinction increases with extended reasoning. Leveraging these probes, we demonstrate that routing queries across a pool of models can exceed the best-performing model whilst reducing inference cost by up to 70\% on MATH, showing that internal representations enable practical efficiency gains even when they diverge from human intuitions about difficulty. Our code is available at: https://github.com/KabakaWilliam/llms_know_difficulty
Abstract（参考訳）: あらゆる問題に対して拡張推論でLSMを実行するのはコストがかかるが、どの入力が実際に追加の計算を必要とするかを判断することは依然として困難である。生成前の内部表現から、自分たちの成功の可能性が回復可能かどうか、この信号がより効率的な推論を導くことができるかどうかを検討する。我々は,事前世代のアクティベーションに関する線形プローブを訓練し,問題長やTF-IDFといった表面的特徴を著しく上回り,数学やコーディングタスクにおけるポリシー固有の成功を予測する。同一問題に対して人間とモデルの両方のパフォーマンスを提供するE2H-AMCを用いて、モデル固有の難易度の概念を符号化し、この区別が拡張された推論によって増加することを示す。これらのプローブを利用することで、モデルプールをまたいだルーティングクエリが最高の性能モデルを超え、MATHの推論コストを最大70%削減できることを示し、内部表現が難易度に関する人間の直観から逸脱した場合でも、実用的な効率向上を可能にすることを示した。私たちのコードは、https://github.com/KabakaWilliam/llms_know_difficultyで利用可能です。

関連論文リスト

Estimating problem difficulty without ground truth using Large Language Model comparisons [4.599673637363014]
そこで本研究では,LLMとLLMを比較し,問題の難易度を推定する手法を提案する。 LLMはペアの難易度比較を行い、Bradley-Terryスコアは結果に基づいて計算される。我々の研究は、時間を要する人間のアノテーションと合成データ生成を置き換えるための重要なステップである。
論文参考訳（メタデータ） (2025-12-16T09:13:56Z)
Verifying Large Language Models' Reasoning Paths via Correlation Matrix Rank [71.09032766271493]
大規模言語モデル (LLM) は誤りや幻覚を引き起こす傾向がある。アウトプットを効果的かつ効率的にチェックする方法は、アプリケーションにとって重要な問題となっている。
論文参考訳（メタデータ） (2025-10-28T11:01:10Z)
LLMs Encode How Difficult Problems Are [4.990590622073335]
大規模言語モデルが人間の判断に沿う方法で問題難易度を符号化するかどうかを検討する。我々は60のモデルで層とトークンの位置の線形プローブを訓練し、Easy2HardBenchの数学的および符号化部分集合を評価した。
論文参考訳（メタデータ） (2025-10-20T22:48:23Z)
QueST: Incentivizing LLMs to Generate Difficult Problems [77.75835742350644]
大規模言語モデルは、推論タスク、競合レベルのコーディングと数学の問題を解く上で、強力なパフォーマンスを達成した。既存の競合するコーディングデータセットには、数千から数万の問題しか含まれていない。本稿では,難解なグラフサンプリングと難解な拒否の微調整を組み合わせた新しいフレームワークであるQueSTを提案する。
論文参考訳（メタデータ） (2025-10-20T16:29:53Z)
Code-driven Number Sequence Calculation: Enhancing the inductive Reasoning Abilities of Large Language Models [44.17697803306198]
textitCodeSeqは,数列から構築した合成後トレーニングデータセットである。パイプラインは、失敗したテストケースを反映し、反復的な修正を取り入れることで、教師付き微妙なデータを生成する。実験の結果,textitCodeSeqでトレーニングしたモデルでは,様々な推論タスクが改善され,OOD性能が保たれることがわかった。
論文参考訳（メタデータ） (2025-10-16T12:29:40Z)
HINT: Helping Ineffective Rollouts Navigate Towards Effectiveness [49.72591739116668]
強化学習(RL)は、大規模言語モデル(LLM)の長いチェーン・オブ・シント(CoT)推論能力を高めるための重要な要因となっている。しかし、GRPOのような一般的な手法は、タスクの難しさがモデルの能力を超えると失敗し、スパーシリティと非効率なトレーニングに報いる。我々は、適応的なヒントフレームワークであるHINT: Helping In Effective Rollouts Navigate Towards Effectiveを提案する。
論文参考訳（メタデータ） (2025-10-10T13:42:03Z)
The LLM Already Knows: Estimating LLM-Perceived Question Difficulty via Hidden Representations [33.65540900920885]
大規模言語モデル(LLM)によって知覚される入力質問の難しさを推定することは、正確な性能評価と適応推論に不可欠である。本稿では,LLMが生成する隠れ表現のみを利用する難易度推定手法を提案する。
論文参考訳（メタデータ） (2025-09-16T09:38:41Z)
Staying in the Sweet Spot: Responsive Reasoning Evolution via Capability-Adaptive Hint Scaffolding [59.60915947702282]
検証可能な報酬(RLVR)による強化学習は,大規模言語モデル(LLM)の推論能力の向上に成功している。既存のRLVR手法は、訓練データの困難さとモデルの能力のミスマッチにより、探索の非効率に悩まされることが多い。本稿では,高効率領域に留まることの難易度を動的に調整する新しい監視支援RLVRフレームワークであるSEELEを提案する。
論文参考訳（メタデータ） (2025-09-08T17:36:21Z)
Long Is More Important Than Difficult for Training Reasoning Models [21.369780872368143]
問題の難しさよりも推論長が、主に訓練されたモデルの性能に影響を及ぼすことを示す。このモデルであるLong1K-32Bは,1,000のトレーニングサンプルだけで優れた性能を発揮する。
論文参考訳（メタデータ） (2025-03-23T13:33:59Z)
Adaptive Distraction: Probing LLM Contextual Robustness with Automated Tree Search [76.54475437069395]
大きな言語モデル(LLM)は、意味的に一貫性があるがタスクに依存しないコンテキスト情報に直面している場合、元のパフォーマンスを維持するのに苦労することが多い。本稿では,木探索に基づく動的散逸生成フレームワークを提案する。
論文参考訳（メタデータ） (2025-02-03T18:43:36Z)
Confident Adaptive Language Modeling [95.45272377648773]
CALMは、入力と生成時間ごとに異なる量の計算を動的に割り当てるフレームワークである。ハイパフォーマンスを確実に維持しつつ、計算能力、潜在的スピードアップを最大3ドルまで削減する上で、我々のフレームワークの有効性を実証する。
論文参考訳（メタデータ） (2022-07-14T17:00:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。