論文の概要: TrigReason: Trigger-Based Collaboration between Small and Large Reasoning Models
- arxiv url: http://arxiv.org/abs/2604.14847v1
- Date: Thu, 16 Apr 2026 10:33:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.842693
- Title: TrigReason: Trigger-Based Collaboration between Small and Large Reasoning Models
- Title(参考訳): TrigReason: 小規模と大規模の推論モデル間のトリガーベースコラボレーション
- Authors: Yi Zhao, Yajuan Peng, Cam-Tu Nguyen, Zuchao Li, Xiaoliang Wang, Xiaoming Fu, Hai Zhao,
- Abstract要約: 大規模推論モデル(LRM)は複雑なタスクにおいて高い性能を達成するが、自己回帰的推論によって高い推論遅延に悩まされる。
最近の研究は、小型共振モデル(SRM)を用いてLEM推論を高速化する。
TrigReasonは、継続的ポーリングを選択的介入で置き換えるトリガーベースの協調推論フレームワークである。
- 参考スコア(独自算出の注目度): 59.83398270447905
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Reasoning Models (LRMs) achieve strong performance on complex tasks through extended chains of thought but suffer from high inference latency due to autoregressive reasoning. Recent work explores using Small Reasoning Models (SRMs) to accelerate LRM inference. In this paper, we systematically characterize the capability boundaries of SRMs and identify three common types of reasoning risks: (1) path divergence, where SRMs lack the strategic ability to construct an initial plan, causing reasoning to deviate from the most probable path; (2) cognitive overload, where SRMs fail to solve particularly difficult steps; and (3) recovery inability, where SRMs lack robust self-reflection and error correction mechanisms. To address these challenges, we propose TrigReason, a trigger-based collaborative reasoning framework that replaces continuous polling with selective intervention. TrigReason delegates most reasoning to the SRM and activates LRM intervention only when necessary-during initial strategic planning (strategic priming trigger), upon detecting extraordinary overconfidence (cognitive offload trigger), or when reasoning falls into unproductive loops (intervention request trigger). The evaluation results on AIME24, AIME25, and GPQA-D indicate that TrigReason matches the accuracy of full LRMs and SpecReason, while offloading 1.70x - 4.79x more reasoning steps to SRMs. Under edge-cloud conditions, TrigReason reduces latency by 43.9\% and API cost by 73.3\%. Our code is available at \href{https://github.com/QQQ-yi/TrigReason}{https://github.com/QQQ-yi/TrigReason}
- Abstract(参考訳): 大規模推論モデル(LRM)は思考の連鎖を延長することで複雑なタスクにおいて高い性能を達成するが、自己回帰的推論による高い推論遅延に悩まされる。
最近の研究は、小型共振モデル(SRM)を用いてLEM推論を高速化する。
本稿では,SRMの能力境界を体系的に評価し,(1)SRMが初期計画を構築する戦略的能力に欠ける経路分散,(2)SRMが特に難解なステップを解けない認知的過負荷,(3)SRMが堅牢な自己回帰と誤り訂正機構を欠く回復不能,の3つの共通タイプの推論リスクを同定する。
これらの課題に対処するため、我々はトリガーベースの協調推論フレームワークであるTrigReasonを提案し、継続的ポーリングを選択的介入で置き換える。
TrigReasonはSRMにほとんどの推論を委譲し、必要な戦略計画(戦略プライミング・トリガー)、異常な過信(認知的オフロード・トリガー)の検出、あるいは推論が非生産的ループ(干渉要求トリガー)に陥る時にのみLEMの介入を活性化する。
AIME24, AIME25, GPQA-Dの評価結果から, TrigReason は完全な LRM と SpecReason の精度と一致し, 1.70x - 4.79倍の推理ステップを SRM にオフロードした。
エッジクラウド環境では、TrigReasonはレイテンシを43.9\%、APIコストを73.3\%削減する。
我々のコードは \href{https://github.com/QQQ-yi/TrigReason}{https://github.com/QQQQ-yi/TrigReason} で入手できる。
関連論文リスト
- When Is Thinking Enough? Early Exit via Sufficiency Assessment for Efficient Reasoning [52.21239821135325]
本稿では、効率的な推論のための新しいフレームワークDTSR(Dynamic Thought Sufficiency in Reasoning)を紹介する。
人間のメタ認知にインスパイアされたDTSRは、リフレクションシグナルモニタリングとThought Sufficiency Checkという2つの段階で動作する。
DTSRは推論長を28.9%から34.9%削減し、性能損失を最小限に抑えている。
論文 参考訳(メタデータ) (2026-04-08T07:56:28Z) - One Token Embedding Is Enough to Deadlock Your Large Reasoning Model [91.48868589442837]
我々は, LRMの生成制御フローをハイジャックする資源枯渇手法であるDeadlock Attackを提案する。
提案手法は4つの先進LEMにおいて100%の攻撃成功率を達成する。
論文 参考訳(メタデータ) (2025-10-12T07:42:57Z) - R-Horizon: How Far Can Your Large Reasoning Model Really Go in Breadth and Depth? [63.51955244144878]
R-HoriZONは、Large Reasoning Models(LRMs)における長い水平推論挙動を刺激するために設計された方法である
R-HoriZONに基づいて、長い推論地平線にまたがる相互依存問題を伴う複雑な多段階推論タスクを含む、長期水平推論ベンチマークを構築する。
分析の結果, LRMは有効推論長が限られており, 複数の問題に対する思考予算の配分に苦慮していることが明らかとなった。
論文 参考訳(メタデータ) (2025-10-09T13:16:22Z) - BadReasoner: Planting Tunable Overthinking Backdoors into Large Reasoning Models for Fun or Profit [12.189197763012409]
大規模言語モデル(LRM)は人工知能の重要な進歩として現れている。
本稿では,LRMに対する未探索攻撃ベクトルを同定し,これを「過度なチューナブル」と呼ぶ。
そこで本研究では,単純なオン/オフ攻撃を超越して,攻撃者がモデルの推論冗長性の範囲を正確に制御できるような,新たな調整可能なバックドアを提案する。
論文 参考訳(メタデータ) (2025-07-24T11:24:35Z) - Think-RM: Enabling Long-Horizon Reasoning in Generative Reward Models [50.4652276723694]
Think-RMは、高度な機能をサポートするフレキシブルで自己誘導的な推論トレースを生成する。
Think-RM は RM-Bench 上で最先端の結果を達成し,BT RM と GenRM の垂直スケールを8% 上回った。
論文 参考訳(メタデータ) (2025-05-22T05:56:11Z) - SpecReason: Fast and Accurate Inference-Time Compute via Speculative Reasoning [14.020244011380063]
SpecReasonは、LEM推論を加速するシステムである。
最終回答の正確性を維持する上で、思考トークンのセマンティックな柔軟性を利用する。
バニラLEM推論よりも1.4-3.0times$のスピードアップを実現している。
論文 参考訳(メタデータ) (2025-04-10T16:05:19Z) - ReaRAG: Knowledge-guided Reasoning Enhances Factuality of Large Reasoning Models with Iterative Retrieval Augmented Generation [38.64751082999587]
大きな推論モデル(LRM)は、顕著な推論能力を示すが、主にパラメトリック知識に依存し、事実の正確性を制限する。
本稿では,過剰な反復を伴わない多様なクエリを探索する,事実性強化推論モデルReaRAGを提案する。
我々の研究は、レトリーバル強化世代(RAG)のロバスト推論を効果的に統合しつつ、LRMの事実性を向上する。
論文 参考訳(メタデータ) (2025-03-27T17:44:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。