論文の概要: A Desideratum for Conversational Agents: Capabilities, Challenges, and Future Directions
- arxiv url: http://arxiv.org/abs/2504.16939v1
- Date: Mon, 07 Apr 2025 21:01:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.084616
- Title: A Desideratum for Conversational Agents: Capabilities, Challenges, and Future Directions
- Title(参考訳): 会話エージェントのデシダータム:能力,課題,今後の方向性
- Authors: Emre Can Acikgoz, Cheng Qian, Hongru Wang, Vardhan Dongre, Xiusi Chen, Heng Ji, Dilek Hakkani-Tür, Gokhan Tur,
- Abstract要約: 大規模言語モデル(LLM)は、従来の対話システムから、自律的な行動、文脈認識、ユーザとのマルチターンインタラクションが可能な高度なエージェントへと、会話AIを推進してきた。
本調査では,人間レベルの知性にアプローチするよりスケーラブルなシステムにおいて,何が達成されたのか,どのような課題が持続するのか,何を行う必要があるのか,といった,次世代の会話エージェントのデシラトゥムを提示する。
- 参考スコア(独自算出の注目度): 51.96890647837277
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Recent advances in Large Language Models (LLMs) have propelled conversational AI from traditional dialogue systems into sophisticated agents capable of autonomous actions, contextual awareness, and multi-turn interactions with users. Yet, fundamental questions about their capabilities, limitations, and paths forward remain open. This survey paper presents a desideratum for next-generation Conversational Agents - what has been achieved, what challenges persist, and what must be done for more scalable systems that approach human-level intelligence. To that end, we systematically analyze LLM-driven Conversational Agents by organizing their capabilities into three primary dimensions: (i) Reasoning - logical, systematic thinking inspired by human intelligence for decision making, (ii) Monitor - encompassing self-awareness and user interaction monitoring, and (iii) Control - focusing on tool utilization and policy following. Building upon this, we introduce a novel taxonomy by classifying recent work on Conversational Agents around our proposed desideratum. We identify critical research gaps and outline key directions, including realistic evaluations, long-term multi-turn reasoning skills, self-evolution capabilities, collaborative and multi-agent task completion, personalization, and proactivity. This work aims to provide a structured foundation, highlight existing limitations, and offer insights into potential future research directions for Conversational Agents, ultimately advancing progress toward Artificial General Intelligence (AGI). We maintain a curated repository of papers at: https://github.com/emrecanacikgoz/awesome-conversational-agents.
- Abstract(参考訳): 大規模言語モデル(LLM)の最近の進歩は、従来の対話システムから、自律的な行動、文脈認識、ユーザとのマルチターンインタラクションが可能な高度なエージェントへと、会話AIを推進してきた。
しかし、それらの能力、制限、パスに関する根本的な疑問は、まだオープンである。
本調査では,人間レベルの知性にアプローチするよりスケーラブルなシステムにおいて,何が達成されたのか,どのような課題が持続するのか,何を行う必要があるのか,といった,次世代の会話エージェントのデシラトゥムを提示する。
そのために,LLM駆動型会話エージェントを3つの主次元にまとめて体系的に分析する。
一 推論-意思決定のために人間の知性に触発された論理的、体系的な思考
(二 モニター)自己認識及びユーザインタラクション監視を包含し、
三 コントロール-ツールの利用と政策の追従に焦点を当てる。
本研究は,本研究を主軸とした会話エージェントに関する最近の研究を分類し,新たな分類法を導入するものである。
我々は、現実的な評価、長期多ターン推論スキル、自己進化能力、協調的かつ多エージェントなタスク完了、パーソナライゼーション、積極的活動など、重要な研究ギャップを特定し、重要な方向性を概説する。
この研究は、構造化された基盤を提供し、既存の制限を強調し、会話エージェントの将来的な研究方向性に関する洞察を提供することを目的としており、最終的には人工知能(AGI)への進歩を推し進めている。
https://github.com/emrecanacikgoz/awesome-conversational-agents.com/awesome-conversational-agents。
関連論文リスト
- Who Speaks Next? Multi-party AI Discussion Leveraging the Systematics of Turn-taking in Murder Mystery Games [7.946510318969307]
本研究では,会話分析における隣接対やターンテイクといった会話規範に着目した。
本稿では,AIエージェントの対話制御にこれらの規範を適用した"Murder Mystery Agents"という新しいフレームワークを提案する。
提案フレームワークは、隣接ペアと自己選択機構に基づいて、次の話者選択を統合する。
論文 参考訳(メタデータ) (2024-12-06T10:45:54Z) - Multi-Agent Large Language Models for Conversational Task-Solving [0.0]
対話型タスク解決における新たな主人公として,マルチエージェントシステムが誕生する。
複雑さの異なるタスク間で、マルチエージェントの議論がどのように機能するかは、いまだ不明である。
2022年から2024年までの20のマルチエージェント研究の分類について提案する。
論文 参考訳(メタデータ) (2024-10-30T11:38:13Z) - Towards Human-centered Proactive Conversational Agents [60.57226361075793]
積極的システムと反応性システムの区別は、積極的システムのイニシアティブな性質にある。
我々は,人間中心型PCAの3つの重要な側面,すなわち知性,適応性,市民性に関する新たな分類法を確立する。
論文 参考訳(メタデータ) (2024-04-19T07:14:31Z) - Position Paper: Agent AI Towards a Holistic Intelligence [53.35971598180146]
エージェントAI - 大きな基盤モデルをエージェントアクションに統合する具体的システム。
本稿では,エージェント・ファウンデーション・モデル(エージェント・ファウンデーション・モデル)を提案する。
論文 参考訳(メタデータ) (2024-02-28T16:09:56Z) - The Rise and Potential of Large Language Model Based Agents: A Survey [91.71061158000953]
大規模言語モデル(LLM)は、人工知能(AGI)の潜在的な火花と見なされる
まず、エージェントの概念を哲学的起源からAI開発まで追跡し、LLMがエージェントに適した基盤である理由を説明します。
単一エージェントシナリオ,マルチエージェントシナリオ,ヒューマンエージェント協調の3つの側面において,LLMベースのエージェントの広範な応用について検討する。
論文 参考訳(メタデータ) (2023-09-14T17:12:03Z) - A Survey on Proactive Dialogue Systems: Problems, Methods, and Prospects [100.75759050696355]
本稿では,対話エージェントの多種多様な対話における能動性に関する顕著な問題と先進的な設計について概説する。
我々は、現実世界のアプリケーションのニーズを満たすが、将来もっと研究に焦点を当てる必要がある課題について議論する。
論文 参考訳(メタデータ) (2023-05-04T11:38:49Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z) - Building Affordance Relations for Robotic Agents - A Review [7.50722199393581]
Affordancesは、エージェントがオブジェクトでアクションを実行する可能性を記述する。
我々は,ロボット作業における余裕の概念を用いて,さまざまな戦略の共通基盤をレビューし,発見する。
AIエージェントの能力を向上させる可能性を秘めたアプライアンスを含むさまざまな興味深い研究方向を特定し、議論します。
論文 参考訳(メタデータ) (2021-05-14T08:35:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。