論文の概要: Reliable Collaborative Conversational Agent System Based on LLMs and Answer Set Programming
- arxiv url: http://arxiv.org/abs/2505.06438v1
- Date: Fri, 09 May 2025 21:14:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:48.842952
- Title: Reliable Collaborative Conversational Agent System Based on LLMs and Answer Set Programming
- Title(参考訳): LLMと解集合プログラミングに基づく信頼性の高い協調対話エージェントシステム
- Authors: Yankai Zeng, Gopal Gupta,
- Abstract要約: 本稿では,管理者・アシスタント・デュアルエージェント・パラダイムを提案する。
2つのASP駆動のボットは同じ知識ベースを共有し、タスクを独立して完了する。
ファストフードレストランのドライブスルーウィンドウを管理するデュアルエージェントシステムであるAutoManagerを構築した。
- 参考スコア(独自算出の注目度): 1.5258983562331396
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As the Large-Language-Model-driven (LLM-driven) Artificial Intelligence (AI) bots became popular, people realized their strong potential in Task-Oriented Dialogue (TOD). However, bots relying wholly on LLMs are unreliable in their knowledge, and whether they can finally produce a correct result for the task is not guaranteed. The collaboration among these agents also remains a challenge, since the necessary information to convey is unclear, and the information transfer is by prompts -- unreliable, and malicious knowledge is easy to inject. With the help of logic programming tools such as Answer Set Programming (ASP), conversational agents can be built safely and reliably, and communication among the agents made more efficient and secure. We proposed an Administrator-Assistant Dual-Agent paradigm, where the two ASP-driven bots share the same knowledge base and complete their tasks independently, while the information can be passed by a Collaborative Rule Set (CRS). The knowledge and information conveyed are encapsulated and invisible to the users, ensuring the security of information transmission. We have constructed AutoManager, a dual-agent system for managing the drive-through window of a fast-food restaurant such as Taco Bell in the US. In AutoManager, the assistant bot takes the customer's order while the administrator bot manages the menu and food supply. We evaluated our AutoManager and compared it with the real-world Taco Bell Drive-Thru AI Order Taker, and the results show that our method is more reliable.
- Abstract(参考訳): 大規模言語モデル駆動型(LLM駆動)人工知能(AI)ボットが普及するにつれて、タスク指向対話(TOD)の強いポテンシャルが認識されるようになった。
しかし、LLMに完全に依存しているボットは、その知識が信頼できないため、最終的にタスクに対して正しい結果が得られるかどうかが保証されない。
これらのエージェント間のコラボレーションは、伝達に必要な情報が不明確であり、情報伝達は、信頼できない、悪意のある知識を注入するのが容易なプロンプトによって行われるため、依然として課題である。
Answer Set Programming (ASP)のような論理プログラミングツールの助けを借りて、会話エージェントを安全かつ確実に構築することができ、エージェント間の通信をより効率的かつセキュアにすることができる。
そこで我々は,2つのASP駆動型ボットが同一の知識ベースを共有し,個別にタスクを完了し,情報をCRS(Collaborative Rule Set)によって伝達する,管理者支援型Dual-Agentパラダイムを提案する。
伝達される知識と情報は、ユーザによってカプセル化され、見えないため、情報伝達の安全性が保証される。
われわれは,米国のタコスベルなどのファストフードレストランのドライブスルーウィンドウを管理するデュアルエージェントシステムであるAutoManagerを構築した。
AutoManagerでは、アシスタントボットが顧客の注文を受け、管理者ボットがメニューと食品の供給を管理します。
我々はAutoManagerを評価し,現実のTaco Bell Drive-Thru AI Order Takerと比較した。
関連論文リスト
- PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC [98.82146219495792]
本稿では,PC-Agentという階層型エージェントフレームワークを提案する。
認識の観点からは,現在のMLLMのスクリーンショットコンテンツに対する認識能力の不十分さを克服するために,アクティブ知覚モジュール(APM)を考案する。
意思決定の観点から、複雑なユーザ命令や相互依存サブタスクをより効果的に扱うために、階層的なマルチエージェント協調アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-20T05:41:55Z) - IntellAgent: A Multi-Agent Framework for Evaluating Conversational AI Systems [2.2810745411557316]
IntellAgentは、対話型AIシステムを評価するためのスケーラブルでオープンソースのフレームワークである。
IntellAgentは、ポリシー駆動グラフモデリング、リアルイベント生成、対話型ユーザエージェントシミュレーションを組み合わせることで、合成ベンチマークの作成を自動化する。
我々の研究は、IntellAgentが、研究と展開の橋渡しの課題に対処することで、会話AIを前進させるための効果的なフレームワークであることを示した。
論文 参考訳(メタデータ) (2025-01-19T14:58:35Z) - Agent S: An Open Agentic Framework that Uses Computers Like a Human [31.16046798529319]
我々は、GUI(Graphical User Interface)を通じてコンピュータとの自律的なインタラクションを可能にするオープンエージェントフレームワークであるAgent Sを提案する。
Agent Sは、ドメイン固有の知識の取得、長いタスクの水平線の計画、動的で一様でないインターフェイスの処理という、コンピュータタスクの自動化における3つの重要な課題に対処することを目指している。
論文 参考訳(メタデータ) (2024-10-10T17:43:51Z) - ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.58666091522198]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文 参考訳(メタデータ) (2024-06-28T08:28:38Z) - CAAP: Context-Aware Action Planning Prompting to Solve Computer Tasks with Front-End UI Only [21.054681757006385]
本稿では,スクリーンショット画像のみを通して環境を知覚するエージェントを提案する。
大規模言語モデルの推論能力を活用することで,大規模人間の実演データの必要性を解消する。
AgentはMiniWoB++の平均成功率は94.5%、WebShopの平均タスクスコアは62.3である。
論文 参考訳(メタデータ) (2024-06-11T05:21:20Z) - Building Cooperative Embodied Agents Modularly with Large Language
Models [104.57849816689559]
本研究では, 分散制御, 生の知覚観察, コストのかかるコミュニケーション, 様々な実施環境下でインスタンス化された多目的タスクといった課題に対処する。
我々は,LLMの常識知識,推論能力,言語理解,テキスト生成能力を活用し,認知に触発されたモジュラーフレームワークにシームレスに組み込む。
C-WAH と TDW-MAT を用いた実験により, GPT-4 で駆動される CoELA が, 強い計画に基づく手法を超越し, 創発的な効果的なコミュニケーションを示すことを示した。
論文 参考訳(メタデータ) (2023-07-05T17:59:27Z) - Responsible Task Automation: Empowering Large Language Models as
Responsible Task Automators [17.991044940694778]
大規模言語モデル(LLM)は、ユーザ命令に従ってタスクを自動補完する有望な可能性を示している。
大きな疑問が浮かび上がってくる。人間がタスクを自動化するのを助けるとき、機械はどうやって責任を持って振る舞うことができるのか?
我々は、責任あるタスク自動化(Responsible Task Automation, ResponsibleTA)を、LCMベースのコーディネータとタスク自動化の実行者との間の責任ある協調を促進するための基本的なフレームワークとして提示する。
論文 参考訳(メタデータ) (2023-06-02T02:42:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。