論文の概要: Multi-Party Conversational Agents: A Survey
- arxiv url: http://arxiv.org/abs/2505.18845v1
- Date: Sat, 24 May 2025 19:40:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.691354
- Title: Multi-Party Conversational Agents: A Survey
- Title(参考訳): 多人数会話エージェントの実態調査
- Authors: Sagar Sapkota, Mohammad Saqib Hasan, Mubarak Shah, Santu Karmaker,
- Abstract要約: マルチパーティ会話エージェント(Multi-party Conversational Agents、MPCA)は、2人以上の参加者との対話を同時に行うように設計されたシステムである。
MPCAは、発話の意味論と社会的ダイナミクスの両方を解釈する必要があるため、さらなる課題に直面している。
本調査は,MPCAの最近の進歩を3つの重要な疑問に答えるものである。
- 参考スコア(独自算出の注目度): 44.99833362998488
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-party Conversational Agents (MPCAs) are systems designed to engage in dialogue with more than two participants simultaneously. Unlike traditional two-party agents, designing MPCAs faces additional challenges due to the need to interpret both utterance semantics and social dynamics. This survey explores recent progress in MPCAs by addressing three key questions: 1) Can agents model each participants' mental states? (State of Mind Modeling); 2) Can they properly understand the dialogue content? (Semantic Understanding); and 3) Can they reason about and predict future conversation flow? (Agent Action Modeling). We review methods ranging from classical machine learning to Large Language Models (LLMs) and multi-modal systems. Our analysis underscores Theory of Mind (ToM) as essential for building intelligent MPCAs and highlights multi-modal understanding as a promising yet underexplored direction. Finally, this survey offers guidance to future researchers on developing more capable MPCAs.
- Abstract(参考訳): マルチパーティ会話エージェント(Multi-party Conversational Agents、MPCA)は、2人以上の参加者との対話を同時に行うように設計されたシステムである。
従来の2党エージェントとは異なり、MPCAの設計は、発話の意味論と社会的ダイナミクスの両方を解釈する必要があるため、さらなる課題に直面している。
本調査は,MPCAの最近の進歩を3つの重要な疑問に対処することによって調査する。
1) エージェントは各参加者の精神状態をモデル化できるのか?
(心のモデリングの状態)
2)対話内容は適切に理解できるか?
(意味理解)
3)将来の会話の流れを推論し予測できるのか?
(Agent Action Modeling)。
従来の機械学習からLLM(Large Language Models)やマルチモーダルシステムまで,さまざまな手法をレビューする。
我々の分析は、知的なMPCAを構築する上では、心の理論(ToM)が不可欠であると評価し、有望だが未解明の方向性としてマルチモーダル理解を強調する。
最後に、この調査は将来の研究者に、より有能なMPCAの開発に関するガイダンスを提供する。
関連論文リスト
- A Desideratum for Conversational Agents: Capabilities, Challenges, and Future Directions [51.96890647837277]
大規模言語モデル(LLM)は、従来の対話システムから、自律的な行動、文脈認識、ユーザとのマルチターンインタラクションが可能な高度なエージェントへと、会話AIを推進してきた。
本調査では,人間レベルの知性にアプローチするよりスケーラブルなシステムにおいて,何が達成されたのか,どのような課題が持続するのか,何を行う必要があるのか,といった,次世代の会話エージェントのデシラトゥムを提示する。
論文 参考訳(メタデータ) (2025-04-07T21:01:25Z) - Towards Anthropomorphic Conversational AI Part I: A Practical Framework [49.62013440962072]
会話に関わる人間の知性の重要な側面を再現するために設計されたマルチモジュールフレームワークを導入する。
アプローチの第2段階では、これらの会話データは、フィルタリングとラベル付けの後に、強化学習のためのトレーニングおよびテストデータとして機能する。
論文 参考訳(メタデータ) (2025-02-28T03:18:39Z) - Multi-Agent Large Language Models for Conversational Task-Solving [0.0]
対話型タスク解決における新たな主人公として,マルチエージェントシステムが誕生する。
複雑さの異なるタスク間で、マルチエージェントの議論がどのように機能するかは、いまだ不明である。
2022年から2024年までの20のマルチエージェント研究の分類について提案する。
論文 参考訳(メタデータ) (2024-10-30T11:38:13Z) - On the Discussion of Large Language Models: Symmetry of Agents and
Interplay with Prompts [51.3324922038486]
本稿では,プロンプトの相互作用と議論機構の実証結果について報告する。
また、コンピュートとマージに基づくスケーラブルな議論機構も提案している。
論文 参考訳(メタデータ) (2023-11-13T04:56:48Z) - Don't Copy the Teacher: Data and Model Challenges in Embodied Dialogue [92.01165203498299]
後続の身体的対話命令は、自然言語交換から複雑なタスクのシーケンスを完了させるエージェントを必要とする。
本稿では,模倣学習(IL)と関連する低レベルメトリクスが,実際には誤解を招くものであり,具体的対話研究の目標と一致していないことを論じる。
論文 参考訳(メタデータ) (2022-10-10T05:51:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。