論文の概要: Anticipate and Learn: Unleashing Idle-Time Compute in Proactive Agents
- arxiv url: http://arxiv.org/abs/2605.25971v2
- Date: Tue, 26 May 2026 04:49:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.174967
- Title: Anticipate and Learn: Unleashing Idle-Time Compute in Proactive Agents
- Title(参考訳): 期待と学習: プロアクティブエージェントにおけるアイドル時間計算の解放
- Authors: Haoyi Hu, Qirong Lyu, Xianghan Kong, Weiwen Liu, Jianghao Lin, Zixuan Guo, Yan Xu, Yasheng Wang, Weinan Zhang, Yong Yu,
- Abstract要約: ProActは、アイドルタイム計算を利用して、今後のユーザニーズを予測し、満たすプロアクティブエージェントアーキテクチャである。
進化する対話履歴を永続記憶とともに解析することにより、ProActは今後のニーズを予測し、情報を反復的に取得する。
MemBenchの評価では、ProActが最先端の反射精度を達成し、持続的で堅牢な性能を裏付けている。
- 参考スコア(独自算出の注目度): 51.46570338144688
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While AI agents demonstrate remarkable capabilities in reasoning and tool use, they remain fundamentally reactive: they compute responses only after explicit user prompts. This paradigm ignores a critical opportunity: the idle time between interactions is largely wasted, leaving agents unable to prepare for future user needs. To bridge this gap, we introduce ProAct, a proactive agent architecture that leverages idle-time compute to anticipate and fulfill likely upcoming user needs. By analyzing evolving dialogue history together with persistent memory, ProAct predicts upcoming needs and iteratively acquires information, allowing the agent to resolve knowledge gaps and prepare evidence before the user initiates a query. To rigorously evaluate proactive capabilities, we also introduce ProActEval, a comprehensive benchmark comprising 200 scenarios across 40 domains, featuring predictable need chains and diverse user cognitive profiles. Empirical results demonstrate significant advantages over reactive baselines. ProAct accelerates task completion by reducing required turns by 14.8%, decreases user effort by 11.7%, and cuts hallucination rates by 28.1% on ProActEval. Furthermore, MemBench evaluations confirm that ProAct achieves state-of-the-art reflective accuracy, underscoring its sustained and robust performance.
- Abstract(参考訳): AIエージェントは推論とツールの使用において顕著な能力を示すが、それらは基本的にはリアクティブであり、明示的なユーザプロンプトの後にのみ応答を計算する。
このパラダイムは重要な機会を無視している。インタラクション間のアイドル時間は大部分が無駄になり、エージェントは将来のユーザニーズに備えることができない。
このギャップを埋めるために、私たちは、アイドル時間計算を利用して、今後のユーザニーズを予測し、満たすプロアクティブエージェントアーキテクチャであるProActを紹介します。
進化する対話履歴を永続記憶とともに解析することにより、ProActは今後のニーズを予測し、情報を繰り返し取得し、エージェントが知識ギャップを解決し、ユーザがクエリを開始する前に証拠を作成することができる。
ProActEvalは40のドメインにわたる200のシナリオからなる総合的なベンチマークで、予測可能なニーズチェーンと多様なユーザ認知プロファイルを備えている。
経験的結果は、反応性ベースラインよりも大きな利点を示している。
ProActは必要なターンを14.8%減らし、ユーザの労力を11.7%減らし、ProActEvalの幻覚率を28.1%減らしてタスク完了を加速する。
さらに、MemBenchの評価では、ProActが最先端の反射精度を達成し、持続的で堅牢な性能を裏付けている。
関連論文リスト
- ProactiveBench: Benchmarking Proactiveness in Multimodal Large Language Models [51.06179253173491]
ProactiveBenchは、さまざまなタスクにまたがってプロアクティブ性をテストするベンチマークです。
本研究は, (i) MLLMs on ProactiveBench, (ii) MLLMs on (i) MLLMs they are generally lack proactiveness; (ii) proactiveness not correlation with model capacity; (iii) "hinting" at proactiveness is yields only marginal gains。
論文 参考訳(メタデータ) (2026-03-19T20:58:03Z) - ProactiveMobile: A Comprehensive Benchmark for Boosting Proactive Intelligence on Mobile Devices [17.39388308538324]
本稿では,プロアクティブなモバイルエージェント開発のためのベンチマークであるProactiveMobileを紹介する。
プロアクティブタスクは、デバイス上のコンテキスト信号の4次元にわたる潜在ユーザ意図を推測するものとして形式化されている。
このベンチマークは成功率19.15%で、実験ではo1 (15.71%) と GPT-5 (7.39%) を上回っている。
論文 参考訳(メタデータ) (2026-02-25T12:32:37Z) - Pushing Forward Pareto Frontiers of Proactive Agents with Behavioral Agentic Optimization [61.641777037967366]
プロアクティブな大規模言語モデル(LLM)エージェントは、複数のターンで積極的に計画し、クエリし、相互作用することを目的としている。
エージェント強化学習(RL)は、マルチターン環境でエージェントを訓練するための有望なソリューションとして登場した。
本稿では,行動強化と情報収集能力の強化を両立させたエージェントRLフレームワークであるBAOを提案する。
論文 参考訳(メタデータ) (2026-02-11T20:40:43Z) - ProAgent: Harnessing On-Demand Sensory Contexts for Proactive LLM Agent Systems [7.591337469415894]
ProAgentは、大量の感覚コンテキストとLCM推論を利用してプロアクティブアシストを提供するエンドツーエンドのプロアクティブエージェントシステムである。
ProAgent on Augmented Reality (AR) メガネをエッジサーバで実装し,実世界のテストベッド,パブリックデータセット,ユーザスタディを通じて広範囲に評価する。
その結果,ProAgentは最大33.4%,ツールコールF1スコア16.8%,ユーザの満足度が向上した。
論文 参考訳(メタデータ) (2025-12-07T08:21:07Z) - Active Test-time Vision-Language Navigation [60.69722522420299]
ATENAは、不確実なナビゲーション結果に対するエピソードフィードバックを通じて、実用的な人間とロボットのインタラクションを可能にする、テスト時のアクティブな学習フレームワークである。
特にATENAは、成功エピソードにおける確実性を高め、失敗エピソードにおいてそれを減らすことを学び、不確実性の校正を改善している。
さらに,自信ある予測に基づいて,エージェントがナビゲーション結果を評価することができる自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-07T02:24:44Z) - Proactive Agent: Shifting LLM Agents from Reactive Responses to Active Assistance [95.03771007780976]
我々は、人間の指示なしにタスクを予測および開始できるプロアクティブエージェントを開発するという課題に取り組む。
まず,実世界の人的活動を収集し,前向きなタスク予測を生成する。
これらの予測は、ヒトのアノテータによって受け入れられるか拒否されるかのどちらかとしてラベル付けされる。
ラベル付きデータは、人間の判断をシミュレートする報酬モデルをトレーニングするために使用される。
論文 参考訳(メタデータ) (2024-10-16T08:24:09Z) - Beyond Trial-and-Error: Predicting User Abandonment After a Moderation Intervention [0.6918368994425961]
現在のコンテンツモデレーションは、リアクティブで試行錯誤的なアプローチに従っている。
我々は、モデレーターが実装前に行動の影響を予測できるように、積極的に予測的なアプローチを導入する。
Reddit上でのオンラインコミュニティの大規模な禁止に対する16,540人のユーザーの反応を調査した。
論文 参考訳(メタデータ) (2024-04-23T08:52:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。