論文の概要: Removing Planner Bias in Goal Recognition Through Multi-Plan Dataset Generation
- arxiv url: http://arxiv.org/abs/2602.14691v1
- Date: Mon, 16 Feb 2026 12:25:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:50.399355
- Title: Removing Planner Bias in Goal Recognition Through Multi-Plan Dataset Generation
- Title(参考訳): マルチプランデータセット生成によるゴール認識におけるプランナーバイアスの除去
- Authors: Mustafa F. Abdelwahed, Felipe Meneguzzi Kin Max Piamolini Gusmao, Joan Espasa,
- Abstract要約: 既存のデータセットはすべて、それらを生成した計画システムによって誘導される体系的なバイアスに悩まされる。
そこで本研究では,トップk計画を用いて,同じ目標仮説の複数の異なる計画を生成する手法を提案する。
これにより、異なる計画セットに基づいてゴールを推測する際、ゴール認識器のレジリエンスを測定するために、バージョンカバレッジスコア(VCS)と呼ばれる新しい指標を導入することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous agents require some form of goal and plan recognition to interact in multiagent settings. Unfortunately, all existing goal recognition datasets suffer from a systematical bias induced by the planning systems that generated them, namely heuristic-based forward search. This means that existing datasets lack enough challenge for more realistic scenarios (e.g., agents using different planners), which impacts the evaluation of goal recognisers with respect to using different planners for the same goal. In this paper, we propose a new method that uses top-k planning to generate multiple, different, plans for the same goal hypothesis, yielding benchmarks that mitigate the bias found in the current dataset. This allows us to introduce a new metric called Version Coverage Score (VCS) to measure the resilience of the goal recogniser when inferring a goal based on different sets of plans. Our results show that the resilience of the current state-of-the-art goal recogniser degrades substantially under low observability settings.
- Abstract(参考訳): 自律エージェントは、マルチエージェント設定で対話するために、ある種の目標と計画認識を必要とする。
残念ながら、既存のゴール認識データセットはすべて、それらを生成した計画システム、すなわちヒューリスティックベースの前方探索によって引き起こされる体系的バイアスに悩まされている。
これは、既存のデータセットが、より現実的なシナリオ(例えば、異なるプランナーを使用するエージェント)に十分な課題を欠いていることを意味します。
本稿では、トップkプランニングを用いて、同じ目標仮説の複数の異なるプランを生成し、現在のデータセットのバイアスを軽減するベンチマークを生成する手法を提案する。
これにより、異なる計画セットに基づいてゴールを推測する際、ゴール認識器のレジリエンスを測定するために、バージョンカバレッジスコア(VCS)と呼ばれる新しい指標を導入することができる。
以上の結果から,現状のゴール認識器のレジリエンスは,低可観測条件下では著しく低下することがわかった。
関連論文リスト
- Locally Adaptive Multi-Objective Learning [50.29753546978998]
私たちは、データの分散が時間とともに任意に変化するようなオンライン環境で作業しています。
この問題に対する既存のアプローチは、時間軸全体にわたって目的の集合を最小化することを目的としている。
本稿では,多目的学習法の一部を適応型オンラインアルゴリズムに置き換えることで,局所適応性を実現する方法を検討する。
論文 参考訳(メタデータ) (2026-02-16T17:31:48Z) - Decentralized Multi-Agent Goal Assignment for Path Planning using Large Language Models [7.94408712915778]
本研究は,マルチエージェントパス計画における分散型ゴール割り当ての問題に対処する。
エージェントは、環境の構造的表現に基づいて、目標よりもランク付けされた選好を独立に生成する。
完全に観測可能なグリッドワールド設定において,greedys,Optimal assignment,および大規模言語モデル(LLM)ベースのエージェントを比較した。
論文 参考訳(メタデータ) (2025-10-27T20:05:56Z) - Hierarchical Object-Oriented POMDP Planning for Object Rearrangement [19.62753215239688]
現在のオブジェクト再構成ソリューションは、主に強化学習または手作業による計画手法に基づいており、様々な課題への適応性に欠けることが多い。
この制限に対処するために,新しい階層的オブジェクト指向部分観測マルコフ決定プロセス(HOO-POMDP)を導入する。
本稿では、部分的に観測可能なマルチルーム環境における多目的再構成問題を解決するためのオンライン・プランニング・フレームワークと新しいベンチマーク・データセットを提案する。
論文 参考訳(メタデータ) (2024-12-02T10:19:36Z) - Propose, Assess, Search: Harnessing LLMs for Goal-Oriented Planning in Instructional Videos [48.15438373870542]
VidAssistは、インストラクショナルビデオにおけるゼロ/フェーショット目標指向の計画のために設計された統合フレームワークである。
最適な計画生成のための幅優先探索アルゴリズムを採用している。
実験によると、VidAssistは異なる目標指向の計画設定のための統一されたフレームワークを提供する。
論文 参考訳(メタデータ) (2024-09-30T17:57:28Z) - Temporally Extended Goal Recognition in Fully Observable
Non-Deterministic Domain Models [43.460098744623416]
既存のアプローチでは、ゴール仮説は1つの最終状態上の1つの共役公式からなると仮定している。
完全可観測非決定論的(FOND)計画領域モデルにおける時間的拡張目標に焦点をあてる。
実験結果から, 異なる認識環境における時間的拡張目標の認識において, 提案手法が正確であることが示唆された。
論文 参考訳(メタデータ) (2023-06-14T18:02:00Z) - Imitating Graph-Based Planning with Goal-Conditioned Policies [72.61631088613048]
本稿では,目標目標条件ポリシにサブゴール条件ポリシを蒸留する自己シミュレーション方式を提案する。
提案手法は,既存の目標条件付きRL手法のサンプル効率を大幅に向上させることができることを実証的に示す。
論文 参考訳(メタデータ) (2023-03-20T14:51:10Z) - Discrete Factorial Representations as an Abstraction for Goal
Conditioned Reinforcement Learning [99.38163119531745]
離散化ボトルネックを適用することにより,目標条件付きRLセットアップの性能が向上することを示す。
分布外目標に対する期待した回帰を実験的に証明し、同時に表現的な構造で目標を指定できるようにします。
論文 参考訳(メタデータ) (2022-11-01T03:31:43Z) - Generative multitask learning mitigates target-causing confounding [61.21582323566118]
マルチタスク学習のための因果表現学習のためのシンプルでスケーラブルなアプローチを提案する。
改善は、目標を狙うが入力はしない、観測されていない共同ファウンダーを緩和することによる。
人の属性とタスクノミーのデータセットに対する我々の結果は、事前の確率シフトに対するロバストネスの概念的改善を反映している。
論文 参考訳(メタデータ) (2022-02-08T20:42:14Z) - Unsupervised and self-adaptative techniques for cross-domain person
re-identification [82.54691433502335]
非重複カメラにおける人物再識別(ReID)は難しい課題である。
Unsupervised Domain Adaptation(UDA)は、ソースで訓練されたモデルから、IDラベルアノテーションなしでターゲットドメインへの機能学習適応を実行するため、有望な代替手段です。
本稿では,新しいオフライン戦略によって生成されたサンプルのトリプレットを利用する,UDAベースのReID手法を提案する。
論文 参考訳(メタデータ) (2021-03-21T23:58:39Z) - PlanGAN: Model-based Planning With Sparse Rewards and Multiple Goals [14.315501760755609]
PlanGANは、スパース報酬のある環境におけるマルチゴールタスクを解くためのモデルベースのアルゴリズムである。
本研究は,PlanGANが4~8倍の効率で,同等の性能を達成できることを示唆する。
論文 参考訳(メタデータ) (2020-06-01T12:53:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。