論文の概要: ChatShop: Interactive Information Seeking with Language Agents
- arxiv url: http://arxiv.org/abs/2404.09911v2
- Date: Sun, 16 Jun 2024 15:24:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-19 04:57:50.435047
- Title: ChatShop: Interactive Information Seeking with Language Agents
- Title(参考訳): ChatShop: 言語エージェントによる対話型情報検索
- Authors: Sanxing Chen, Sam Wiseman, Bhuwan Dhingra,
- Abstract要約: 新しい情報を戦略的に求める欲求と能力は 人間の学習に欠かせないものです
我々は,言語エージェントが戦略的探索を行う能力をテストするために設計された,人気のあるWebショッピングタスクを分析した。
提案課題は,エージェントが情報を探究し,徐々に蓄積する能力を効果的に評価できることを示す。
- 参考スコア(独自算出の注目度): 16.879814917881895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The desire and ability to seek new information strategically are fundamental to human learning but often overlooked in current language agent evaluation. We analyze a popular web shopping task designed to test language agents' ability to perform strategic exploration and discover that it can be reformulated and solved as a single-turn retrieval task without the need for interactive information seeking. This finding encourages us to rethink realistic constraints on information access that would necessitate strategic information seeking. We then redesign the task to introduce a notion of task ambiguity and the role of a shopper, serving as a dynamic party with whom the agent strategically interacts in an open-ended conversation to make informed decisions. Our experiments demonstrate that the proposed task can effectively evaluate the agent's ability to explore and gradually accumulate information through multi-turn interactions. Additionally, we show that large language model-simulated shoppers serve as a good proxy for real human shoppers, revealing similar error patterns in agents.
- Abstract(参考訳): 新しい情報を戦略的に求める欲求と能力は、人間の学習の基本であるが、しばしば現在の言語エージェント評価では見落とされがちである。
我々は,言語エージェントが戦略的探索を行う能力をテストし,対話的な情報検索を必要とせず,一ターン検索タスクとして再構成・解決できることを確かめるために設計された,人気のあるWebショッピングタスクを分析した。
この発見は、戦略的情報欲求を必要とする情報アクセスに関する現実的な制約を再考することを促します。
そこで我々は,タスクのあいまいさと買い物客の役割の概念を導入し,エージェントがオープンエンドの会話で戦略的に対話し,情報的意思決定を行う動的パーティーとして機能するタスクを再設計する。
提案課題は,マルチターンインタラクションによってエージェントが情報を探索し,徐々に蓄積する能力を効果的に評価できることを実証した。
さらに、大規模言語モデルを用いた買い物客は、実際の買い物客にとって良い代理となり、エージェントに類似したエラーパターンを明らかにする。
関連論文リスト
- Challenges in Human-Agent Communication [55.53932430345333]
これらのシステムがもたらす12の重要なコミュニケーション課題を特定し分析する。
これには、エージェントからユーザへの情報伝達の課題、ユーザからエージェントへの情報伝達の課題、すべての人間とエージェントのコミュニケーションで考慮すべき課題の概略が含まれる。
私たちの発見は、これらのシステムの透明性と制御を支援するために、新しいデザインパターン、原則、ガイドラインを緊急に呼び出すのに役立ちます。
論文 参考訳(メタデータ) (2024-11-28T01:21:26Z) - A Survey on Complex Tasks for Goal-Directed Interactive Agents [60.53915548970061]
この調査は、目標指向の対話エージェントを評価するための、関連するタスクと環境をコンパイルする。
関連リソースの最新のコンパイルは、プロジェクトのWebサイトにある。
論文 参考訳(メタデータ) (2024-09-27T08:17:53Z) - SECURE: Semantics-aware Embodied Conversation under Unawareness for Lifelong Robot Learning [17.125080112897102]
SECUREはこのような問題を解決するために設計された対話型タスク学習フレームワークである。
具体的会話を使って、その欠陥のあるドメインモデルを修正します。
エージェントが意味論的に認識されている場合、無意識で再配置を解決する学習がより効率的であることを示す。
論文 参考訳(メタデータ) (2024-09-26T11:40:07Z) - Tell Me More! Towards Implicit User Intention Understanding of Language
Model Driven Agents [110.25679611755962]
現在の言語モデル駆動エージェントは、しばしば効果的なユーザ参加のメカニズムを欠いている。
Intention-in-Interaction (IN3) は明示的なクエリを通してユーザの暗黙の意図を検査するための新しいベンチマークである。
私たちは、タスクの曖昧さを積極的に評価し、ユーザの意図を問う強力なモデルであるMistral-Interactを経験的に訓練し、それらを実行可能な目標へと洗練させます。
論文 参考訳(メタデータ) (2024-02-14T14:36:30Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z) - Improving Language Model Prompting in Support of Semi-autonomous Task
Learning [6.021787236982658]
言語モデル(LLM)は、新しいタスク能力を取得するために必要なエージェントの知識の源としてポテンシャルを提供する。
本稿では,新しいタスクを学習するエージェントに対して有用なLLM応答をもたらす手がかりを構築できる新しいエージェント機能への取り組みについて述べる。
論文 参考訳(メタデータ) (2022-09-13T15:36:01Z) - Boosting Search Engines with Interactive Agents [25.89284695491093]
本稿では,文脈的クエリ改善のためのメタストラテジーを学習するエージェントの設計における第一歩について述べる。
エージェントには単純だが効果的な検索操作者がいて、クエリや検索結果のきめ細やかで透明な制御を行う。
論文 参考訳(メタデータ) (2021-09-01T13:11:57Z) - Can You be More Social? Injecting Politeness and Positivity into
Task-Oriented Conversational Agents [60.27066549589362]
人間エージェントが使用する社会言語は、ユーザーの応答性の向上とタスク完了に関連しています。
このモデルは、ソーシャル言語理解要素で拡張されたシーケンスからシーケンスまでのディープラーニングアーキテクチャを使用する。
人的判断と自動言語尺度の両方を用いたコンテンツ保存と社会言語レベルの評価は,エージェントがより社会的に適切な方法でユーザの問題に対処できる応答を生成できることを示している。
論文 参考訳(メタデータ) (2020-12-29T08:22:48Z) - SPA: Verbal Interactions between Agents and Avatars in Shared Virtual
Environments using Propositional Planning [61.335252950832256]
SPA(Sense-Plan-Ask)は、仮想的な仮想環境において、仮想的な人間のようなエージェントとユーザアバターの間の言語的対話を生成する。
提案アルゴリズムは実行時コストを小さくし,自然言語通信を利用せずにエージェントよりも効率的に目標を達成できることが判明した。
論文 参考訳(メタデータ) (2020-02-08T23:15:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。