論文の概要: Reliable Collaborative Conversational Agent System Based on LLMs and Answer Set Programming
- arxiv url: http://arxiv.org/abs/2505.06438v2
- Date: Mon, 09 Jun 2025 17:41:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.060438
- Title: Reliable Collaborative Conversational Agent System Based on LLMs and Answer Set Programming
- Title(参考訳): LLMと解集合プログラミングに基づく信頼性の高い協調対話エージェントシステム
- Authors: Yankai Zeng, Gopal Gupta,
- Abstract要約: 我々は、ASP駆動のボットが同じ知識ベースを共有し、割り当てられたタスクを独立して完了する、マネージャ-顧客-サービスデュアル-エージェントパラダイムを提案する。
AutoManagerでは、カスタマーサービスボットが顧客の注文を受け、マネージャボットがメニューと食品の供給を管理します。
我々はAutoManagerシステムを評価し,現実のTaco Bell Drive-Thru AI Order Takerと比較した。
- 参考スコア(独自算出の注目度): 1.5258983562331396
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As the Large-Language-Model-driven (LLM-driven) Artificial Intelligence (AI) bots became popular, people realized their strong potential in Task-Oriented Dialogue (TOD). However, bots relying wholly on LLMs are unreliable in their knowledge, and whether they can finally produce a correct outcome for the task is not guaranteed. The collaboration among these agents also remains a challenge, since the necessary information to convey is unclear, and the information transfer is by prompts: unreliable, and malicious knowledge is easy to inject. With the help of knowledge representation and reasoning tools such as Answer Set Programming (ASP), conversational agents can be built safely and reliably, and communication among the agents made more reliable as well. We propose a Manager-Customer-Service Dual-Agent paradigm, where ASP-driven bots share the same knowledge base and complete their assigned tasks independently. The agents communicate with each other through the knowledge base, ensuring consistency. The knowledge and information conveyed are encapsulated and invisible to the users, ensuring the security of information transmission. To illustrate the dual-agent conversational paradigm, we have constructed AutoManager, a collaboration system for managing the drive-through window of a fast-food restaurant such as Taco Bell in the US. In AutoManager, the customer service bot takes the customer's order while the manager bot manages the menu and food supply. We evaluated our AutoManager system and compared it with the real-world Taco Bell Drive-Thru AI Order Taker, and the results show that our method is more reliable.
- Abstract(参考訳): 大規模言語モデル駆動型(LLM駆動)人工知能(AI)ボットが普及するにつれて、タスク指向対話(TOD)の強いポテンシャルが認識されるようになった。
しかし、LLMに完全に依存しているボットは彼らの知識に信頼できないため、最終的にタスクの正しい結果が得られるかどうかは保証されていない。
これらのエージェント間のコラボレーションは、伝達に必要な情報が不明確であり、情報伝達は、信頼できない、悪意のある知識の注入が容易である、というプロンプトによって行われるため、依然として課題である。
Answer Set Programming(ASP)のような知識表現と推論ツールの助けを借りて、会話エージェントを安全かつ確実に構築することができ、エージェント間の通信もより信頼性が高くなります。
我々は、ASP駆動のボットが同じ知識ベースを共有し、割り当てられたタスクを独立して完了する、マネージャ-顧客-サービスデュアル-エージェントパラダイムを提案する。
エージェントは知識ベースを介して相互に通信し、一貫性を確保する。
伝達される知識と情報は、ユーザによってカプセル化され、見えないため、情報伝達の安全性が保証される。
両エージェント対話のパラダイムを説明するために,米国のタコスベルのようなファーストフードレストランのドライブスルーウィンドウを管理するコラボレーションシステムであるAutoManagerを構築した。
AutoManagerでは、カスタマーサービスボットが顧客の注文を受け、マネージャボットがメニューと食品の供給を管理します。
我々はAutoManagerシステムを評価し,現実のTaco Bell Drive-Thru AI Order Takerと比較した。
関連論文リスト
- PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC [98.82146219495792]
本稿では,PC-Agentという階層型エージェントフレームワークを提案する。
認識の観点からは,現在のMLLMのスクリーンショットコンテンツに対する認識能力の不十分さを克服するために,アクティブ知覚モジュール(APM)を考案する。
意思決定の観点から、複雑なユーザ命令や相互依存サブタスクをより効果的に扱うために、階層的なマルチエージェント協調アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-20T05:41:55Z) - IntellAgent: A Multi-Agent Framework for Evaluating Conversational AI Systems [2.2810745411557316]
IntellAgentは、対話型AIシステムを評価するためのスケーラブルでオープンソースのフレームワークである。
IntellAgentは、ポリシー駆動グラフモデリング、リアルイベント生成、対話型ユーザエージェントシミュレーションを組み合わせることで、合成ベンチマークの作成を自動化する。
我々の研究は、IntellAgentが、研究と展開の橋渡しの課題に対処することで、会話AIを前進させるための効果的なフレームワークであることを示した。
論文 参考訳(メタデータ) (2025-01-19T14:58:35Z) - Agent S: An Open Agentic Framework that Uses Computers Like a Human [31.16046798529319]
我々は、GUI(Graphical User Interface)を通じてコンピュータとの自律的なインタラクションを可能にするオープンエージェントフレームワークであるAgent Sを提案する。
Agent Sは、ドメイン固有の知識の取得、長いタスクの水平線の計画、動的で一様でないインターフェイスの処理という、コンピュータタスクの自動化における3つの重要な課題に対処することを目指している。
論文 参考訳(メタデータ) (2024-10-10T17:43:51Z) - ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.58666091522198]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文 参考訳(メタデータ) (2024-06-28T08:28:38Z) - CAAP: Context-Aware Action Planning Prompting to Solve Computer Tasks with Front-End UI Only [21.054681757006385]
本稿では,スクリーンショット画像のみを通して環境を知覚するエージェントを提案する。
大規模言語モデルの推論能力を活用することで,大規模人間の実演データの必要性を解消する。
AgentはMiniWoB++の平均成功率は94.5%、WebShopの平均タスクスコアは62.3である。
論文 参考訳(メタデータ) (2024-06-11T05:21:20Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - Responsible Task Automation: Empowering Large Language Models as
Responsible Task Automators [17.991044940694778]
大規模言語モデル(LLM)は、ユーザ命令に従ってタスクを自動補完する有望な可能性を示している。
大きな疑問が浮かび上がってくる。人間がタスクを自動化するのを助けるとき、機械はどうやって責任を持って振る舞うことができるのか?
我々は、責任あるタスク自動化(Responsible Task Automation, ResponsibleTA)を、LCMベースのコーディネータとタスク自動化の実行者との間の責任ある協調を促進するための基本的なフレームワークとして提示する。
論文 参考訳(メタデータ) (2023-06-02T02:42:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。