論文の概要: Overhearing LLM Agents: A Survey, Taxonomy, and Roadmap
- arxiv url: http://arxiv.org/abs/2509.16325v1
- Date: Fri, 19 Sep 2025 18:11:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:15.734533
- Title: Overhearing LLM Agents: A Survey, Taxonomy, and Roadmap
- Title(参考訳): LLMエージェントのオーバーヒアリング - 調査, 分類, ロードマップ
- Authors: Andrew Zhu, Chris Callison-Burch,
- Abstract要約: 我々は、LLMエージェントと相互作用する代替パラダイムについて研究し、これを"overhearing agent"と呼ぶ。
ユーザの注意を喚起する代わりに、過剰に耳を傾けるエージェントは、環境活動を監視し、コンテキスト支援を提供する場合にのみ介入する。
この分類に基づいて、過剰に耳を傾けるエージェントシステムを構築する研究者や開発者にとってのベストプラクティスのリストを作成します。
- 参考スコア(独自算出の注目度): 34.93417975075926
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Imagine AI assistants that enhance conversations without interrupting them: quietly providing relevant information during a medical consultation, seamlessly preparing materials as teachers discuss lesson plans, or unobtrusively scheduling meetings as colleagues debate calendars. While modern conversational LLM agents directly assist human users with tasks through a chat interface, we study this alternative paradigm for interacting with LLM agents, which we call "overhearing agents." Rather than demanding the user's attention, overhearing agents continuously monitor ambient activity and intervene only when they can provide contextual assistance. In this paper, we present the first analysis of overhearing LLM agents as a distinct paradigm in human-AI interaction and establish a taxonomy of overhearing agent interactions and tasks grounded in a survey of works on prior LLM-powered agents and exploratory HCI studies. Based on this taxonomy, we create a list of best practices for researchers and developers building overhearing agent systems. Finally, we outline the remaining research gaps and reveal opportunities for future research in the overhearing paradigm.
- Abstract(参考訳): 医療相談中に関連情報をひっそりと提供し、教師が授業計画について議論するときに教材をシームレスに準備し、同僚がカレンダーを議論するときに不当に会議をスケジュールするAIアシスタントを想像してください。
現代の会話型LLMエージェントは、チャットインタフェースを介して、人間のタスクを直接支援する一方で、この代替パラダイムをLLMエージェントと対話するために研究し、これを「オーバーハーディングエージェント」と呼ぶ。
ユーザの注意を喚起する代わりに、過剰に耳を傾けるエージェントは、環境活動を監視し、コンテキスト支援を提供する場合にのみ介入する。
本稿では,人間とAIの相互作用における異なるパラダイムとしてのLLMエージェントの初回分析を行い,従来のLLMエージェントと探索的HCI研究に関する調査から得られた過剰聴覚エージェントの相互作用とタスクの分類を確立した。
この分類に基づいて、過剰に耳を傾けるエージェントシステムを構築する研究者や開発者にとってのベストプラクティスのリストを作成します。
最後に,残りの研究ギャップについて概説し,今後の研究の機会を明らかにする。
関連論文リスト
- First Steps Towards Overhearing LLM Agents: A Case Study With Dungeons & Dragons Gameplay [31.08300242866497]
LLMエージェントと対話するための代替パラダイムを提案し、これを"overhearing agent"と呼ぶ。
これらの過度に耳を傾けるエージェントは会話に積極的に参加せず、人間同士の会話に「参加」し、バックグラウンドタスクを実行したり、ユーザーを支援するための提案を行う。
本研究では,ダンジョンマスターを補助するオーバヘッドエージェントとして,大規模マルチモーダル音声モデルを用いた詳細な研究を行う。
論文 参考訳(メタデータ) (2025-05-28T19:34:36Z) - A Desideratum for Conversational Agents: Capabilities, Challenges, and Future Directions [51.96890647837277]
大規模言語モデル(LLM)は、従来の対話システムから、自律的な行動、文脈認識、ユーザとのマルチターンインタラクションが可能な高度なエージェントへと、会話AIを推進してきた。
本調査では,人間レベルの知性にアプローチするよりスケーラブルなシステムにおいて,何が達成されたのか,どのような課題が持続するのか,何を行う必要があるのか,といった,次世代の会話エージェントのデシラトゥムを提示する。
論文 参考訳(メタデータ) (2025-04-07T21:01:25Z) - Agentic Large Language Models, a survey [1.517355052203938]
エージェントLLMはエージェントとして機能する大きな言語モデルである。
文献は、推論、リフレクション、検索の3つのカテゴリに従って整理する。
重要な応用は、医療診断、物流、金融市場分析である。
論文 参考訳(メタデータ) (2025-03-29T11:02:20Z) - TAMA: A Human-AI Collaborative Thematic Analysis Framework Using Multi-Agent LLMs for Clinical Interviews [54.35097932763878]
Thematic Analysis (TA) は、構造化されていないテキストデータの潜在意味を明らかにするために広く使われている定性的手法である。
本稿では,多エージェントLEMを用いた人間とAIの協調的テーマ分析フレームワークTAMAを提案する。
TAMA は既存の LLM 支援TA アプローチよりも優れており,高い主題的ヒット率,カバレッジ,独特性を実現している。
論文 参考訳(メタデータ) (2025-03-26T15:58:16Z) - Multi-Agent Autonomous Driving Systems with Large Language Models: A Survey of Recent Advances [36.83764809130289]
大規模言語モデル (LLM) が自律運転システム (ADS) に統合された。
LLMは、限られた認識、不十分な協調、高い計算要求の3つの大きな課題に直面している。
LLMに基づくマルチエージェントADSの最近の進歩は、エージェント間のコミュニケーションと協調の改善に焦点が当てられている。
論文 参考訳(メタデータ) (2025-02-24T03:26:13Z) - A Survey on the Memory Mechanism of Large Language Model based Agents [66.4963345269611]
大規模言語モデル(LLM)に基づくエージェントは、最近、研究や産業コミュニティから多くの注目を集めている。
LLMベースのエージェントは、現実の問題を解決する基礎となる自己進化能力に特徴付けられる。
エージェント-環境相互作用をサポートする重要なコンポーネントは、エージェントのメモリである。
論文 参考訳(メタデータ) (2024-04-21T01:49:46Z) - A Survey on Large Language Model based Autonomous Agents [105.2509166861984]
大規模言語モデル(LLM)は、人間レベルの知性を達成する上で、顕著な可能性を示している。
本稿では,LLMに基づく自律エージェントの分野を総合的な観点から体系的に検討する。
本稿では、社会科学、自然科学、工学の分野におけるLLMベースの自律エージェントの多様な応用について概観する。
論文 参考訳(メタデータ) (2023-08-22T13:30:37Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。