論文の概要: Generic-to-Specific Reasoning and Learning for Scalable Ad Hoc Teamwork
- arxiv url: http://arxiv.org/abs/2508.04163v1
- Date: Wed, 06 Aug 2025 07:44:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.597642
- Title: Generic-to-Specific Reasoning and Learning for Scalable Ad Hoc Teamwork
- Title(参考訳): スケーラブルなアドホックチームワークのためのジェネリック・ツー・特化推論と学習
- Authors: Hasra Dodampegama, Mohan Sridharan,
- Abstract要約: 本稿では,アドホックチームワークにおける推論と学習のための知識ベースおよびデータ駆動手法の相補的強みを活用することを提唱する。
任意の目的のために、我々のアーキテクチャは、各アドホックエージェントが非単調な論理的推論によってその動作を決定することを可能にする。
現実的な物理に基づく3Dシミュレーション環境であるVirtualHomeにおけるアーキテクチャの能力について実験的に評価した。
- 参考スコア(独自算出の注目度): 10.462598319732187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI agents deployed in assistive roles often have to collaborate with other agents (humans, AI systems) without prior coordination. Methods considered state of the art for such ad hoc teamwork often pursue a data-driven approach that needs a large labeled dataset of prior observations, lacks transparency, and makes it difficult to rapidly revise existing knowledge in response to changes. As the number of agents increases, the complexity of decision-making makes it difficult to collaborate effectively. This paper advocates leveraging the complementary strengths of knowledge-based and data-driven methods for reasoning and learning for ad hoc teamwork. For any given goal, our architecture enables each ad hoc agent to determine its actions through non-monotonic logical reasoning with: (a) prior commonsense domain-specific knowledge; (b) models learned and revised rapidly to predict the behavior of other agents; and (c) anticipated abstract future goals based on generic knowledge of similar situations in an existing foundation model. We experimentally evaluate our architecture's capabilities in VirtualHome, a realistic physics-based 3D simulation environment.
- Abstract(参考訳): 補助的役割に配置されたAIエージェントは、事前調整なしで他のエージェント(人間、AIシステム)と協力する必要があることが多い。
このようなアドホックなチームワークの最先端と見なされる手法は、しばしばデータ駆動のアプローチを追求する。
エージェントの数が増加するにつれて、意思決定の複雑さが効果的に協力することを難しくする。
本稿では,アドホックチームワークにおける推論と学習のための知識ベースおよびデータ駆動手法の相補的強みを活用することを提唱する。
任意の目的のために、我々のアーキテクチャは、各アドホックエージェントが非単調な論理的推論を通してそのアクションを決定することを可能にする。
(a)先行共通知識ドメイン固有の知識
b) 他のエージェントの行動を予測するために学習・改訂されたモデル,及び
(c) 既存の基盤モデルにおいて、類似した状況に関する一般的な知識に基づいて、抽象的な将来の目標を期待する。
現実的な物理に基づく3Dシミュレーション環境であるVirtualHomeにおけるアーキテクチャの能力について実験的に評価した。
関連論文リスト
- When Models Know More Than They Can Explain: Quantifying Knowledge Transfer in Human-AI Collaboration [79.69935257008467]
我々は,人間とAIの知識伝達能力に関する概念的かつ実験的フレームワークである知識統合と伝達評価(KITE)を紹介する。
最初の大規模人間実験(N=118)を行い,その測定を行った。
2段階のセットアップでは、まずAIを使って問題解決戦略を思いつき、その後独立してソリューションを実装し、モデル説明が人間の理解に与える影響を分離します。
論文 参考訳(メタデータ) (2025-06-05T20:48:16Z) - Agentic Knowledgeable Self-awareness [79.25908923383776]
KnowSelfはデータ中心のアプローチで、人間のような知識のある自己認識を持つエージェントを応用する。
我々の実験により、KnowSelfは、外部知識を最小限に使用して、様々なタスクやモデルにおいて、様々な強力なベースラインを達成できることが実証された。
論文 参考訳(メタデータ) (2025-04-04T16:03:38Z) - A Comprehensive Survey of Agents for Computer Use: Foundations, Challenges, and Future Directions [4.904229981437243]
コンピュータ利用エージェント(英: Agents for Computer Use, ACU)は、デジタルデバイス上で複雑なタスクを実行できるシステムである。
急速な進歩にもかかわらず、ACUはまだ日々の使用には成熟していない。
論文 参考訳(メタデータ) (2025-01-27T15:44:02Z) - Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning [50.47568731994238]
人工知能(AI)エージェント作成の鍵となる方法は強化学習(RL)である
本稿では,構造化推論をAIエージェントのポリシーに統合し,学習するための一般的なフレームワークモデルを提案する。
論文 参考訳(メタデータ) (2023-12-22T17:57:57Z) - A Study of Situational Reasoning for Traffic Understanding [63.45021731775964]
トラフィック領域における状況推論のための3つの新しいテキストベースのタスクを考案する。
先行作業における言語推論タスクにまたがる一般化能力を示す知識強化手法を4つ採用する。
本稿では,データ分割におけるモデル性能の詳細な解析を行い,モデル予測を分類的に検討する。
論文 参考訳(メタデータ) (2023-06-05T01:01:12Z) - Knowledge-based Reasoning and Learning under Partial Observability in Ad
Hoc Teamwork [4.454557728745761]
本稿では,非単調な論理的推論に基づいてアドホックエージェントの動作を決定するアーキテクチャを提案する。
これは、他のエージェントの行動を予測するモデルのオンライン選択、適応、学習をサポートする。
単純なシナリオと複雑なシナリオの両方において、アーキテクチャのパフォーマンスが、最先端のデータ駆動ベースラインと同等か、あるいは同等であることを示す。
論文 参考訳(メタデータ) (2023-06-01T15:21:27Z) - ArK: Augmented Reality with Knowledge Interactive Emergent Ability [115.72679420999535]
基礎モデルから新しいドメインへの知識記憶の伝達を学習する無限エージェントを開発する。
私たちのアプローチの核心は、Augmented Reality with Knowledge Inference Interaction (ArK)と呼ばれる新しいメカニズムである。
我々のArKアプローチは,大規模な基礎モデルと組み合わせることで,生成された2D/3Dシーンの品質を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-05-01T17:57:01Z) - Toward a Reasoning and Learning Architecture for Ad Hoc Teamwork [4.454557728745761]
先行調整のないエージェントチームにおけるコラボレーションを指すアドホックなチームワークのためのアーキテクチャを提案する。
私たちのアーキテクチャは、知識ベースとデータ駆動推論と学習の原則を組み合わせています。
シミュレーションされたマルチエージェントのコラボレーションドメインであるFort Attackを使って、アーキテクチャが予期せぬ変更への適応をサポートすることを実証しています。
論文 参考訳(メタデータ) (2022-08-24T13:57:33Z) - Behavior Priors for Efficient Reinforcement Learning [97.81587970962232]
本稿では,情報とアーキテクチャの制約を,確率論的モデリング文献のアイデアと組み合わせて行動の事前学習を行う方法について考察する。
このような潜伏変数の定式化が階層的強化学習(HRL)と相互情報と好奇心に基づく目的との関係について論じる。
シミュレーションされた連続制御領域に適用することで,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2020-10-27T13:17:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。