論文の概要: Probabilistic Active Goal Recognition
- arxiv url: http://arxiv.org/abs/2507.21846v1
- Date: Tue, 29 Jul 2025 14:22:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:56.464945
- Title: Probabilistic Active Goal Recognition
- Title(参考訳): 確率論的能動ゴール認識
- Authors: Chenyuan Zhang, Cristian Rojas Cardenas, Hamid Rezatofighi, Mor Vered, Buser Say,
- Abstract要約: 能動ゴール認識のための確率的フレームワークを採用する。
本稿では,モンテカルロ木探索アルゴリズムと共同信条更新機構を組み合わせた統合解を提案する。
共同信条更新は受動的目標認識を著しく上回ることを示す。
- 参考スコア(独自算出の注目度): 12.583886275683302
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In multi-agent environments, effective interaction hinges on understanding the beliefs and intentions of other agents. While prior work on goal recognition has largely treated the observer as a passive reasoner, Active Goal Recognition (AGR) focuses on strategically gathering information to reduce uncertainty. We adopt a probabilistic framework for Active Goal Recognition and propose an integrated solution that combines a joint belief update mechanism with a Monte Carlo Tree Search (MCTS) algorithm, allowing the observer to plan efficiently and infer the actor's hidden goal without requiring domain-specific knowledge. Through comprehensive empirical evaluation in a grid-based domain, we show that our joint belief update significantly outperforms passive goal recognition, and that our domain-independent MCTS performs comparably to our strong domain-specific greedy baseline. These results establish our solution as a practical and robust framework for goal inference, advancing the field toward more interactive and adaptive multi-agent systems.
- Abstract(参考訳): 多エージェント環境では、効果的な相互作用は、他のエージェントの信念と意図を理解することに集中する。
目標認識に関する先行研究は、観測者を受動的理性者として扱ってきたが、アクティブゴール認識(AGR)は、不確実性を減らすために戦略的に情報を収集することに焦点を当てている。
我々は,アクティブゴール認識のための確率的フレームワークを採用し,モンテカルロ木探索(MCTS)アルゴリズムと共同信念更新機構を組み合わせた統合ソリューションを提案する。
グリッドベースドメインにおける総合的な経験的評価を通じて、我々の共同信念更新は受動的目標認識を著しく上回り、我々のドメインに依存しないMCTSは、我々の強いドメイン固有の欲求ベースラインと同等に機能することを示した。
これらの結果は、よりインタラクティブで適応的なマルチエージェントシステムに向けて、ゴール推論のための実用的で堅牢なフレームワークとして、私たちのソリューションを確立します。
関連論文リスト
- Self-Paced Collaborative and Adversarial Network for Unsupervised Domain Adaptation [74.27130400558013]
本稿では,CAN(Collaborative and Adversarial Network)と呼ばれる非教師付きドメイン適応手法を提案する。
CANは、ニューラルネットワークのトレーニングに、ドメイン協調学習戦略とドメイン共用学習戦略を使用する。
対象領域における識別性をさらに高めるために,SPCAN(Self-Paced CAN)を提案する。
論文 参考訳(メタデータ) (2025-06-24T02:58:37Z) - Spatio-Temporal Domain Awareness for Multi-Agent Collaborative
Perception [18.358998861454477]
車両間通信の潜在的な応用としてのマルチエージェント協調認識は、単一エージェント認識よりも自律走行車の性能知覚を著しく向上させる可能性がある。
本稿では,エージェント間の認識特性をエンドツーエンドに集約する新しい協調認識フレームワークSCOPEを提案する。
論文 参考訳(メタデータ) (2023-07-26T03:00:31Z) - Attention Based Feature Fusion For Multi-Agent Collaborative Perception [4.120288148198388]
グラフアテンションネットワーク(GAT)の形での中間的協調認識ソリューションを提案する。
提案手法は,複数の連結エージェント間で交換される中間表現を融合するアテンションベースのアグリゲーション戦略を開発する。
このアプローチは、チャネルレベルと空間レベルの中間特徴写像における重要な領域を適応的に強調することにより、オブジェクト検出精度が向上する。
論文 参考訳(メタデータ) (2023-05-03T12:06:11Z) - Generative multitask learning mitigates target-causing confounding [61.21582323566118]
マルチタスク学習のための因果表現学習のためのシンプルでスケーラブルなアプローチを提案する。
改善は、目標を狙うが入力はしない、観測されていない共同ファウンダーを緩和することによる。
人の属性とタスクノミーのデータセットに対する我々の結果は、事前の確率シフトに対するロバストネスの概念的改善を反映している。
論文 参考訳(メタデータ) (2022-02-08T20:42:14Z) - Goal-Aware Cross-Entropy for Multi-Target Reinforcement Learning [15.33496710690063]
本稿では,目標認識型クロスエントロピー(GACE)ロスを提案する。
次に、目標関連情報を利用して与えられた指示に集中する目標識別型注意ネットワーク(GDAN)を考案する。
論文 参考訳(メタデータ) (2021-10-25T14:24:39Z) - Learning to Plan Optimistically: Uncertainty-Guided Deep Exploration via
Latent Model Ensembles [73.15950858151594]
本稿では,不確実な長期報酬に直面した最適化による深層探査を可能にするLOVE(Latent Optimistic Value Exploration)を提案する。
潜在世界モデルと値関数推定を組み合わせ、無限水平リターンを予測し、アンサンブルにより関連する不確実性を回復する。
連続行動空間における視覚ロボット制御タスクにLOVEを適用し、最先端や他の探査目標と比較して、平均20%以上のサンプル効率の改善を実証する。
論文 参考訳(メタデータ) (2020-10-27T22:06:57Z) - Learning from Extrinsic and Intrinsic Supervisions for Domain
Generalization [95.73898853032865]
ドメイン間を同時に一般化する方法を学ぶための新しいドメイン一般化フレームワークを提案する。
提案手法の有効性を2つの標準オブジェクト認識ベンチマークで示す。
論文 参考訳(メタデータ) (2020-07-18T03:12:24Z) - Off-Dynamics Reinforcement Learning: Training for Transfer with Domain
Classifiers [138.68213707587822]
強化学習におけるドメイン適応のためのシンプルで実践的で直感的なアプローチを提案する。
報酬関数を変更することで、力学の違いを補うことで、この目標を達成することができることを示す。
我々のアプローチは、連続状態とアクションを持つドメインに適用でき、ダイナミックスの明示的なモデルを学ぶ必要がない。
論文 参考訳(メタデータ) (2020-06-24T17:47:37Z) - Mutual Information-based State-Control for Intrinsically Motivated
Reinforcement Learning [102.05692309417047]
強化学習において、エージェントは、外部報酬信号を用いて一連の目標に到達することを学習する。
自然界では、知的生物は内部の駆動から学習し、外部の信号を必要としない。
目的状態と制御可能な状態の間の相互情報として本質的な目的を定式化する。
論文 参考訳(メタデータ) (2020-02-05T19:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。