論文の概要: Real-Time Reasoning Agents in Evolving Environments
- arxiv url: http://arxiv.org/abs/2511.04898v1
- Date: Fri, 07 Nov 2025 00:51:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-10 21:00:44.629233
- Title: Real-Time Reasoning Agents in Evolving Environments
- Title(参考訳): 進化する環境におけるリアルタイム推論エージェント
- Authors: Yule Wen, Yixin Ye, Yanzhe Zhang, Diyi Yang, Hao Zhu,
- Abstract要約: 進化する環境におけるエージェントに対する新しい問題定式化としてリアルタイム推論を導入する。
我々の研究は、実用的なエージェントを開発するための重要なテストベッドとしてリアルタイム推論を確立している。
- 参考スコア(独自算出の注目度): 52.21796134114843
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agents in the real world must make not only logical but also timely judgments. This requires continuous awareness of the dynamic environment: hazards emerge, opportunities arise, and other agents act, while the agent's reasoning is still unfolding. Despite advances in language model reasoning, existing approaches fail to account for this dynamic nature. We introduce real-time reasoning as a new problem formulation for agents in evolving environments and build Real-Time Reasoning Gym to demonstrate it. We study two paradigms for deploying language models in agents: (1) reactive agents, which employ language models with bounded reasoning computation for rapid responses, and (2) planning agents, which allow extended reasoning computation for complex problems. Our experiments show that even state-of-the-art models struggle with making logical and timely judgments in either paradigm. To address this limitation, we propose AgileThinker, which simultaneously engages both reasoning paradigms. AgileThinker consistently outperforms agents engaging only one reasoning paradigm as the task difficulty and time pressure rise, effectively balancing reasoning depth and response latency. Our work establishes real-time reasoning as a critical testbed for developing practical agents and provides a foundation for research in temporally constrained AI systems, highlighting a path toward real-time capable agents.
- Abstract(参考訳): 現実世界のエージェントは論理的なだけでなく、タイムリーな判断もしなければならない。
危険が出現し、機会が生まれ、他のエージェントが行動し、エージェントの推論がまだ展開されている。
言語モデル推論の進歩にもかかわらず、既存のアプローチはこの動的な性質を説明できない。
進化する環境におけるエージェントの新しい問題定式化としてリアルタイム推論を導入し、実時間推論ジャムを構築して実演する。
エージェントに言語モデルをデプロイするためのパラダイムとして,(1)素早い応答に有界推論計算を持つ言語モデルを利用するリアクティブエージェント,(2)複雑な問題に対する拡張推論計算を可能にする計画エージェントの2つについて検討する。
我々の実験は、最先端モデルでさえ、どちらのパラダイムでも論理的かつタイムリーな判断を下すことに苦労していることを示している。
この制限に対処するために、両方の推論パラダイムを同時に扱うAgileThinkerを提案する。
AgileThinkerは、タスクの難易度と時間のプレッシャーが上昇し、推論の深さとレスポンスの遅延が効果的にバランスしているため、エージェントが1つの推論パラダイムのみを実行するのを一貫して上回ります。
我々の研究は、実用的なエージェントを開発するための重要なテストベッドとしてリアルタイム推論を確立し、時間的に制約されたAIシステムの研究の基盤を提供し、リアルタイム能力のあるエージェントへの道のりを強調します。
関連論文リスト
- Unlocking the Power of Multi-Agent LLM for Reasoning: From Lazy Agents to Deliberation [42.38513187601995]
強化学習と検証可能な報酬で訓練された大規模言語モデル(LLM)は、複雑な推論タスクにおいて大きな成果を上げている。
最近の研究は、メタ思考エージェントが計画を提案し、進捗を監視し、推論エージェントが逐次的な会話のターンを通じてサブタスクを実行するというマルチエージェント設定にまで拡張されている。
1つのエージェントが支配的であり、もう1つのエージェントがほとんど貢献せず、コラボレーションが損なわれ、セットアップが非効率なシングルエージェントに崩壊する。
我々は、推論エージェントがノイズのある出力を破棄し、指示を集約し、推論プロセスを再起動させることで、議論を促す検証可能な報酬機構を提案する。
論文 参考訳(メタデータ) (2025-11-04T06:37:31Z) - GSM-Agent: Understanding Agentic Reasoning Using Controllable Environments [56.007498767771075]
GSM-Agentは複雑な環境でエージェント推論を評価するための新しいベンチマークである。
我々は,環境文書の埋め込みをノードにクラスタ化することでエージェント推論パターンを分析し,各ツールコールを最も近いノードにマッピングする。
本稿では,LLMのエージェント推論性能を向上させるためのツール拡張テストタイムスケーリング手法を提案する。
論文 参考訳(メタデータ) (2025-09-26T07:24:37Z) - DUMA: a Dual-Mind Conversational Agent with Fast and Slow Thinking [12.71072798544731]
DUMAは2つの生成型Large Language Model(LLM)をそれぞれ高速な思考と低速な思考に利用することで、デュアルミンドのメカニズムを具現化している。
我々は、不動産業界のオンライン調査を扱うための会話エージェントを構築した。
論文 参考訳(メタデータ) (2023-10-27T11:43:46Z) - From Heuristic to Analytic: Cognitively Motivated Strategies for
Coherent Physical Commonsense Reasoning [66.98861219674039]
ヒューリスティック分析推論(HAR)戦略は、モデル決定のための合理化のコヒーレンスを大幅に改善する。
以上の結果から, PLM推論の一貫性と信頼性を効果的に向上できる可能性が示唆された。
論文 参考訳(メタデータ) (2023-10-24T19:46:04Z) - CausalCity: Complex Simulations with Agency for Causal Discovery and
Reasoning [68.74447489372037]
本稿では,因果探索と反事実推論のためのアルゴリズムの開発を目的とした,高忠実度シミュレーション環境を提案する。
私たちの作業の中核となるコンポーネントは、複雑なシナリオを定義して作成することが簡単になるような、テキストの緊急性を導入することです。
我々は3つの最先端の手法による実験を行い、ベースラインを作成し、この環境の可利用性を強調する。
論文 参考訳(メタデータ) (2021-06-25T00:21:41Z) - Modelling Multi-Agent Epistemic Planning in ASP [66.76082318001976]
本稿では,マルチショット・アンサー・セット・プログラミング・ベース・プランナの実装について述べる。
本稿は, アドホックなエピステミック状態表現とASPソルバの効率を生かしたプランナーが, 文献から収集したベンチマークに対して, 競合的な性能を示すことを示す。
論文 参考訳(メタデータ) (2020-08-07T06:35:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。