論文の概要: Assisting Unknown Teammates in Unknown Tasks: Ad Hoc Teamwork under
Partial Observability
- arxiv url: http://arxiv.org/abs/2201.03538v1
- Date: Mon, 10 Jan 2022 18:53:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-11 15:59:57.679796
- Title: Assisting Unknown Teammates in Unknown Tasks: Ad Hoc Teamwork under
Partial Observability
- Title(参考訳): 未知のタスクで未知のチームメイトを支援する:部分的可観測性の下でのアドホックなチームワーク
- Authors: Jo\~ao G. Ribeiro, Cassandro Martinho, Alberto Sardinha, Francisco S.
Melo
- Abstract要約: 部分観測可能性(ATPO)の下でのアドホックチームワークの課題設定のための新しいオンライン予測アルゴリズムを提案する。
ATPOは、エージェントの観察を使用して、チームメイトが実行しているタスクを特定することで、部分的な可観測性を実現する。
以上の結果から,ATPOはタスクの膨大なライブラリからチームメイトのタスクを識別し,ほぼ最適時間で解決し,より大きな問題サイズに適応するスケーラブルなスケーラビリティを実現する上で,有効かつ堅牢であることが示された。
- 参考スコア(独自算出の注目度): 15.995282665634097
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present a novel Bayesian online prediction algorithm for
the problem setting of ad hoc teamwork under partial observability (ATPO),
which enables on-the-fly collaboration with unknown teammates performing an
unknown task without needing a pre-coordination protocol. Unlike previous works
that assume a fully observable state of the environment, ATPO accommodates
partial observability, using the agent's observations to identify which task is
being performed by the teammates. Our approach assumes neither that the
teammate's actions are visible nor an environment reward signal. We evaluate
ATPO in three domains -- two modified versions of the Pursuit domain with
partial observability and the overcooked domain. Our results show that ATPO is
effective and robust in identifying the teammate's task from a large library of
possible tasks, efficient at solving it in near-optimal time, and scalable in
adapting to increasingly larger problem sizes.
- Abstract(参考訳): 本稿では,前調整プロトコルを必要とせずに未知のタスクを実行する未知のチームメイトとのオンザフライコラボレーションを可能にする部分可観測性(atpo)下でのアドホックなチームワークの問題設定のための,ベイズオンライン予測アルゴリズムを提案する。
環境の完全な可観測性を想定した以前の作業とは異なり、ATPOは、エージェントの観察を使用して、チームメイトが実行しているタスクを特定することで、部分的な可観測性に対応している。
当社のアプローチでは,チームメイトの行動が目に見えるものでも,環境報奨信号でもないと仮定している。
部分観察可能な2種類のPursuitドメインとオーバークッキングされたドメインの2つの修正版である3つのドメインでATPOを評価した。
以上の結果から,ATPOはタスクの膨大なライブラリからチームメイトのタスクを識別する上で有効で堅牢であり,ほぼ最適時間で解決し,より大きな問題サイズに適応する上でスケーラブルであることが示唆された。
関連論文リスト
- Seamless Detection: Unifying Salient Object Detection and Camouflaged Object Detection [73.85890512959861]
本稿では,SOD(Salient Object Detection)とCOD(Camouflaged Object Detection)を統合化するためのタスク非依存フレームワークを提案する。
我々は、間隔層と大域的コンテキストを含む単純で効果的なコンテキストデコーダを設計し、67fpsの推論速度を実現する。
公開SODデータセットとCODデータセットの実験は、教師なし設定と教師なし設定の両方において、提案したフレームワークの優位性を実証している。
論文 参考訳(メタデータ) (2024-12-22T03:25:43Z) - Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration [51.452664740963066]
Collaborative Gymは、エージェント、人間、タスク環境間の非同期で三分割的なインタラクションを可能にするフレームワークである。
シミュレーション条件と実環境条件の両方において,Co-Gymを3つの代表的なタスクでインスタンス化する。
その結果、協調作業員はタスクパフォーマンスにおいて、完全に自律的なエージェントよりも一貫して優れていたことが判明した。
論文 参考訳(メタデータ) (2024-12-20T09:21:15Z) - CP-Guard: Malicious Agent Detection and Defense in Collaborative Bird's Eye View Perception [54.78412829889825]
コラボレーティブ・パーセプション(CP)は自動運転に有望な技術を示している。
CPでは、ego CAVは協力者からのメッセージを受信する必要があるため、悪意のあるエージェントによる攻撃が容易になる。
我々は,各エージェントが協調ネットワーク内の悪意あるエージェントを正確に検出し,排除するための新しい方法である textbfCP-Guard を提案する。
論文 参考訳(メタデータ) (2024-12-16T17:28:25Z) - WorkArena: How Capable Are Web Agents at Solving Common Knowledge Work Tasks? [83.19032025950986]
本稿では,Webブラウザを介してソフトウェアと対話する大規模言語モデルベースエージェントについて検討する。
WorkArenaは、広く使用されているServiceNowプラットフォームに基づく33のタスクのベンチマークである。
BrowserGymは、そのようなエージェントの設計と評価のための環境である。
論文 参考訳(メタデータ) (2024-03-12T14:58:45Z) - Making Friends in the Dark: Ad Hoc Teamwork Under Partial Observability [11.786470737937638]
本稿では,部分観測可能性の下でのアドホックチームワークの設定を形式的に定義する。
11のドメインから70のPOMDPで得られた結果は、未知のタスクの解決において、未知のチームメイトを支援するだけでなく、より困難な問題へのスケーリングにも堅牢であることを示している。
論文 参考訳(メタデータ) (2023-09-30T16:40:50Z) - ProAgent: Building Proactive Cooperative Agents with Large Language
Models [89.53040828210945]
ProAgentは、大規模な言語モデルを利用してプロアクティブエージェントを生成する新しいフレームワークである。
ProAgentは現状を分析し、チームメイトの意図を観察から推測することができる。
ProAgentは高度なモジュール化と解釈可能性を示し、様々な調整シナリオに容易に統合できる。
論文 参考訳(メタデータ) (2023-08-22T10:36:56Z) - Knowledge-based Reasoning and Learning under Partial Observability in Ad
Hoc Teamwork [4.454557728745761]
本稿では,非単調な論理的推論に基づいてアドホックエージェントの動作を決定するアーキテクチャを提案する。
これは、他のエージェントの行動を予測するモデルのオンライン選択、適応、学習をサポートする。
単純なシナリオと複雑なシナリオの両方において、アーキテクチャのパフォーマンスが、最先端のデータ駆動ベースラインと同等か、あるいは同等であることを示す。
論文 参考訳(メタデータ) (2023-06-01T15:21:27Z) - A General Learning Framework for Open Ad Hoc Teamwork Using Graph-based
Policy Learning [11.998708550268978]
完全かつ部分的な可観測性の下でオープンなアドホックチームワークのためのソリューションのクラスを開発する。
我々のソリューションは、オープンなアドホックチームワークにおいて、完全かつ部分的に観察可能なケースで効率的なポリシーを学習できることを示します。
論文 参考訳(メタデータ) (2022-10-11T13:44:44Z) - Exploring Visual Context for Weakly Supervised Person Search [155.46727990750227]
人探索は、歩行者の検出と人物の再識別を共同で扱う、困難なタスクとして最近登場した。
既存のアプローチは、バウンディングボックスとIDアノテーションの両方が利用可能な完全に教師付き設定に従っている。
本稿では,ボックスアノテーションのみを用いた弱教師付き人物検索について実験的に考察する。
論文 参考訳(メタデータ) (2021-06-19T14:47:13Z) - Expected Value of Communication for Planning in Ad Hoc Teamwork [44.262891197318034]
自律エージェントの望ましい目標は、未知のチームメイトとオンザフライで調整できるようにすることだ。
アドホックなチームワークの中心的な課題の1つは、他のエージェントの現在の計画を迅速に認識し、それに応じて計画することです。
アドホックなチームワークのための新しい計画アルゴリズムを提示し、どのクエリに問い合わせるかを決定し、それに応じて計画する。
論文 参考訳(メタデータ) (2021-03-01T18:09:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。