論文の概要: The Critical Horizon: Inspection Design Principles for Multi-Stage Operations and Deep Reasoning
- arxiv url: http://arxiv.org/abs/2602.09394v1
- Date: Tue, 10 Feb 2026 04:02:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.369807
- Title: The Critical Horizon: Inspection Design Principles for Multi-Stage Operations and Deep Reasoning
- Title(参考訳): 臨界地平線:多段運転と深部推論のための検査設計原理
- Authors: Seyed Morteza Emadi,
- Abstract要約: 初期ステップと最終結果とを繋ぐ信号は指数関数的に深さとともに減衰し、終端データのみからアルゴリズムが学べない限界的な地平線を形成する。
これらの結果は、AIの操作におけるインスペクション設計とインスペクション設計のための共通の分析基盤を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Manufacturing lines, service journeys, supply chains, and AI reasoning chains share a common challenge: attributing a terminal outcome to the intermediate stage that caused it. We establish an information-theoretic barrier to this credit assignment problem: the signal connecting early steps to final outcomes decays exponentially with depth, creating a critical horizon beyond which no algorithm can learn from endpoint data alone. We prove four results. First, a Signal Decay Bound: sample complexity for attributing outcomes to early stages grows exponentially in the number of intervening steps. Second, Width Limits: parallel rollouts provide only logarithmic relief, with correlation capping the effective number of independent samples. Third, an Objective Mismatch: additive reward aggregation optimizes the wrong quantity when sequential validity requires all steps to be correct. Fourth, Optimal Inspection Design: uniform checkpoint spacing is minimax-optimal under homogeneous signal attenuation, while a greedy algorithm yields optimal non-uniform schedules under heterogeneous attenuation. Together, these results provide a common analytical foundation for inspection design in operations and supervision design in AI.
- Abstract(参考訳): 製造ライン、サービス旅行、サプライチェーン、AI推論チェーンは共通の課題を共有している。
我々は、この信用代入問題に対する情報理論上の障壁を確立する: 初期ステップと最終結果を結ぶ信号は、指数関数的に奥行きと崩壊し、アルゴリズムがエンドポイントデータのみから学べない重要な地平線を作り出す。
4つの結果が得られます。
第一に、シグナル減衰バウンド(Signal Decay Bound): 結果から初期段階へ帰属するサンプルの複雑さは、介入するステップの数で指数関数的に増加する。
第2に、Width Limits: 並列ロールアウトは対数的リリーフのみを提供する。
第3に、Objective Mismatch: 追加報酬のアグリゲーションは、シーケンシャルな妥当性が正しいすべてのステップを必要とする場合に、間違った量を最適化します。
第4に、最適検査設計:均一なチェックポイント間隔は、均一な信号減衰の下では最小最適であり、一方、グレディアルゴリズムは不均一な減衰の下で最適な非一様スケジュールを生成する。
これらの結果は、AIの操作におけるインスペクション設計とインスペクション設計のための共通の分析基盤を提供する。
関連論文リスト
- Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning [71.30276778807068]
サンプルプルーニングとトークンプルーニングを戦略的に協調する統合フレームワークを提案する。
Q-Tuningは、トレーニングデータの12.5%しか使用せず、全データSFTベースラインに対する平均38%の改善を実現している。
論文 参考訳(メタデータ) (2025-09-28T13:27:38Z) - Fractured Chain-of-Thought Reasoning [61.647243580650446]
完全CoTと解のみのサンプリングを補間する統合推論時間戦略であるフラクチャードサンプリングを導入する。
フラクチャードサンプリングは、Pass@kとトークンの予算に対して、急激なログ線形スケーリングゲインをもたらすため、優れた精度とコストのトレードオフを一貫して達成できることを示す。
論文 参考訳(メタデータ) (2025-05-19T11:30:41Z) - Towards Sample-Optimal Compressive Phase Retrieval with Sparse and
Generative Priors [59.33977545294148]
O(k log L)$サンプルは振幅に基づく経験損失関数を最小化する任意のベクトルに信号が近いことを保証するのに十分であることを示す。
この結果はスパース位相検索に適応し、基底信号が$s$-sparseおよび$n$-dimensionalである場合、$O(s log n)$サンプルは同様の保証に十分であることを示す。
論文 参考訳(メタデータ) (2021-06-29T12:49:54Z) - A Retrospective Approximation Approach for Smooth Stochastic
Optimization [0.2867517731896504]
グラディエント(グラディエント、英: Gradient、SG)とは、最適化(SO)問題をスムーズ(ノンフィクション)な目標値で解くための補足的反復手法である。
論文 参考訳(メタデータ) (2021-03-07T16:29:36Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。