論文の概要: General Dynamic Goal Recognition
- arxiv url: http://arxiv.org/abs/2505.09737v1
- Date: Wed, 14 May 2025 18:57:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-16 22:29:06.079843
- Title: General Dynamic Goal Recognition
- Title(参考訳): 汎用動的ゴール認識
- Authors: Osher Elhadad, Reuth Mirsky,
- Abstract要約: 本稿では、リアルタイムGRシステムの実現を目的とした、GRのより広範な定義であるGeneral Dynamic GR問題を紹介する。
本稿では,モデルフリーな目標条件付きRL手法を用いて,GRの様々な変更タスクへの高速適応を実現する。
- 参考スコア(独自算出の注目度): 3.1905745371064493
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding an agent's intent through its behavior is essential in human-robot interaction, interactive AI systems, and multi-agent collaborations. This task, known as Goal Recognition (GR), poses significant challenges in dynamic environments where goals are numerous and constantly evolving. Traditional GR methods, designed for a predefined set of goals, often struggle to adapt to these dynamic scenarios. To address this limitation, we introduce the General Dynamic GR problem - a broader definition of GR - aimed at enabling real-time GR systems and fostering further research in this area. Expanding on this foundation, this paper employs a model-free goal-conditioned RL approach to enable fast adaptation for GR across various changing tasks.
- Abstract(参考訳): エージェントの動作を通じてエージェントの意図を理解することは、人間とロボットのインタラクション、対話型AIシステム、マルチエージェントのコラボレーションに不可欠である。
目標認識(GR)として知られるこのタスクは、目標が多数あり、常に進化している動的環境において重大な課題を提起する。
定義済みの目標セットのために設計された従来のGRメソッドは、しばしばこれらの動的なシナリオに適応するのに苦労する。
この制限に対処するために、リアルタイムGRシステムの実現とこの分野のさらなる研究を促進することを目的とした、より広範なGRの定義であるGeneral Dynamic GR問題を導入する。
本稿では,モデルフリーな目標条件付きRL手法を用いて,GRの高速適応を実現する。
関連論文リスト
- GRAML: Dynamic Goal Recognition As Metric Learning [3.1905745371064493]
ゴール認識(GR)は、観察された行動に基づいてエージェントの目的を認識する問題である。
GRの最近のデータ駆動アプローチは、コストがかかる手作業によるドメインモデルの必要性を軽減する。
本稿では,GRAML:Goal Recognition as Metric Learningを紹介する。
論文 参考訳(メタデータ) (2025-05-06T19:38:07Z) - On Generalization Across Environments In Multi-Objective Reinforcement Learning [6.686583184622338]
我々は,多目的強化学習(MORL)における一般化の概念を定式化し,その評価方法について述べる。
パラメータ化された環境構成を持つ多目的ドメインを特徴とする新しいベンチマークを提案。
このベンチマークにおける最先端のMORLアルゴリズムのベースライン評価は、限定的な一般化能力を示し、改善の余地があることを示唆している。
論文 参考訳(メタデータ) (2025-03-02T08:50:14Z) - Model Evolution Framework with Genetic Algorithm for Multi-Task Reinforcement Learning [85.91908329457081]
マルチタスク強化学習は、様々なシナリオにまたがって一般化可能なエージェントを開発することを目的として、様々なタスクを完遂するために単一のポリシーを採用する。
既存のアプローチでは、ルーティングネットワークを使用して各タスクの特定のルートを生成し、モジュールのセットをさまざまなモデルに再構築し、複数のタスクを同時に完了させるのが一般的である。
本稿では,遺伝的アルゴリズム(MEGA)を用いたモデル進化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-19T09:22:34Z) - ODGR: Online Dynamic Goal Recognition [8.359170964198748]
本稿では,そのエージェントの目標をリアルタイムに認識するために,他のエージェントの方針を学習するために使用される新しいRLを提案する。
最近のアプローチでは、強化学習をゴール認識パイプラインの一部として利用する方法が示されているが、事前に定義された目標を認識することに限定されている。
本稿では,これらの制約に対処するための第一歩として,新しい問題として "Online Dynamic Goal Recognition" (ODGR) を定式化する。
論文 参考訳(メタデータ) (2024-07-23T06:52:52Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Dynamic value alignment through preference aggregation of multiple
objectives [0.0]
動的値アライメントの方法論として,アライメントすべき値が動的に変化する手法を提案する。
本稿では,複数の目的に対応するためにDeep $Q$-Learningを拡張し,単純化した2脚交点上で評価する。
論文 参考訳(メタデータ) (2023-10-09T17:07:26Z) - Discrete Factorial Representations as an Abstraction for Goal
Conditioned Reinforcement Learning [99.38163119531745]
離散化ボトルネックを適用することにより,目標条件付きRLセットアップの性能が向上することを示す。
分布外目標に対する期待した回帰を実験的に証明し、同時に表現的な構造で目標を指定できるようにします。
論文 参考訳(メタデータ) (2022-11-01T03:31:43Z) - Rethinking Trajectory Prediction via "Team Game" [118.59480535826094]
本稿では,対話型グループコンセンサスの概念を明示的に導入した,マルチエージェント軌道予測の新しい定式化について述べる。
チームスポーツと歩行者の2つのマルチエージェント設定において,提案手法は既存手法と比較して常に優れた性能を達成している。
論文 参考訳(メタデータ) (2022-10-17T07:16:44Z) - Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in
Latent Space [76.46113138484947]
汎用ロボットは、現実世界の非構造環境において困難なタスクを完了するために、多様な行動レパートリーを必要とする。
この問題に対処するため、目標条件強化学習は、コマンド上の幅広いタスクの目標に到達可能なポリシーを取得することを目的としている。
本研究では,長期的課題に対する目標条件付き政策を実践的に訓練する手法であるPlanning to Practiceを提案する。
論文 参考訳(メタデータ) (2022-05-17T06:58:17Z) - HCDG: A Hierarchical Consistency Framework for Domain Generalization on
Medical Image Segmentation [33.623948922908184]
ドメイン一般化のための新しい階層的一貫性フレームワーク(HCDG)を提案する。
Extrinsic Consistencyでは、複数のソースドメインにまたがる知識を活用して、データレベルの一貫性を強制します。
Intrinsic Consistencyでは、デュアルタスクシナリオの下で同じインスタンスに対してタスクレベルの一貫性を実行します。
論文 参考訳(メタデータ) (2021-09-13T07:07:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。