論文の概要: Goal Recognition via Linear Programming
- arxiv url: http://arxiv.org/abs/2404.07934v1
- Date: Thu, 11 Apr 2024 17:34:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-12 13:01:15.232210
- Title: Goal Recognition via Linear Programming
- Title(参考訳): 線形プログラミングによるゴール認識
- Authors: Felipe Meneguzzi, Luísa R. de A. Santos, Ramon Fraga Pereira, André G. Pereira,
- Abstract要約: 計画としての目標認識に関する研究は、計画課題のモデル、観察、計画手法を用いた目標の推論を含む。
本稿では,Operator-Countingフレームワークに依存する新しい認識手法を設計する。
我々は、新しいIP/LP制約が、部分的かつノイズの多い観測可能性の下で、ゴールの認識をいかに改善できるかを示す。
- 参考スコア(独自算出の注目度): 14.129476759815251
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Goal Recognition is the task by which an observer aims to discern the goals that correspond to plans that comply with the perceived behavior of subject agents given as a sequence of observations. Research on Goal Recognition as Planning encompasses reasoning about the model of a planning task, the observations, and the goals using planning techniques, resulting in very efficient recognition approaches. In this article, we design novel recognition approaches that rely on the Operator-Counting framework, proposing new constraints, and analyze their constraints' properties both theoretically and empirically. The Operator-Counting framework is a technique that efficiently computes heuristic estimates of cost-to-goal using Integer/Linear Programming (IP/LP). In the realm of theory, we prove that the new constraints provide lower bounds on the cost of plans that comply with observations. We also provide an extensive empirical evaluation to assess how the new constraints improve the quality of the solution, and we found that they are especially informed in deciding which goals are unlikely to be part of the solution. Our novel recognition approaches have two pivotal advantages: first, they employ new IP/LP constraints for efficiently recognizing goals; second, we show how the new IP/LP constraints can improve the recognition of goals under both partial and noisy observability.
- Abstract(参考訳): ゴール認識(Goal Recognition)とは、観察者が一連の観察として与えられた対象エージェントの認知行動に対応する計画に対応する目標を識別することを目的としたタスクである。
計画としての目標認識に関する研究は、計画課題のモデル、観察、計画手法を用いた目標の推論を含み、非常に効率的な認識アプローチをもたらす。
本稿では,Operator-Countingフレームワークに依存し,新たな制約を提案し,理論的にも経験的にも制約の特性を解析する新しい認識手法を設計する。
Operator-Countingフレームワークは、Integer/Linear Programming (IP/LP)を使用して、コスト・ツー・ゴールのヒューリスティックな見積もりを効率的に計算する手法である。
理論の領域では、新しい制約が観測に準拠する計画のコストに低い限界をもたらすことを証明している。
また,新たな制約が解の質をどのように向上させるかを評価するための実験的な評価も行った。
第1に、新しいIP/LP制約が、部分的かつノイズの多い観測可能性の下で、目標の認識をいかに改善できるかを示す。
関連論文リスト
- Directed Exploration in Reinforcement Learning from Linear Temporal Logic [59.707408697394534]
リニア時間論理(LTL)は強化学習におけるタスク仕様のための強力な言語である。
合成された報酬信号は基本的に疎結合であり,探索が困難であることを示す。
我々は、仕様をさらに活用し、それに対応するリミット決定性B"uchi Automaton(LDBA)をマルコフ報酬プロセスとしてキャストすることで、よりよい探索を実現することができることを示す。
論文 参考訳(メタデータ) (2024-08-18T14:25:44Z) - Expectation Alignment: Handling Reward Misspecification in the Presence of Expectation Mismatch [19.03141646688652]
我々は、人間のAIエージェントに対する信念である心の理論を基礎として、公式な説明的枠組みを開発する。
ユーザからの期待を推測するために,特定報酬を用いた対話型アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-12T19:43:37Z) - On efficient computation in active inference [1.1470070927586016]
計算量を大幅に減らした有限時間地平線に対する新しい計画アルゴリズムを提案する。
また、新規かつ既存のアクティブな推論計画スキームに対して適切な目標分布を設定するプロセスを簡単にする。
論文 参考訳(メタデータ) (2023-07-02T07:38:56Z) - Imitating Graph-Based Planning with Goal-Conditioned Policies [72.61631088613048]
本稿では,目標目標条件ポリシにサブゴール条件ポリシを蒸留する自己シミュレーション方式を提案する。
提案手法は,既存の目標条件付きRL手法のサンプル効率を大幅に向上させることができることを実証的に示す。
論文 参考訳(メタデータ) (2023-03-20T14:51:10Z) - Leveraging Planning Landmarks for Hybrid Online Goal Recognition [7.690707525070737]
本稿では,象徴的な計画的ランドマークに基づくアプローチとデータ駆動型目標認識アプローチを組み合わせた,オンライン目標認識のためのハイブリッド手法を提案する。
提案手法は最先端技術よりも計算時間をはるかに効率よくするが,目標認識性能も向上する。
論文 参考訳(メタデータ) (2023-01-25T13:21:30Z) - Investigating the Combination of Planning-Based and Data-Driven Methods
for Goal Recognition [7.620967781722714]
現実の環境での2つの最先端計画に基づく計画認識手法の適用について検討する。
このようなアプローチは、人間の行動が完全に合理的ではないため、人間の目標を認識する上では困難であることを示す。
本研究では,観察行動データに基づいて学習した分類に基づく手法により,既存の手法の拡張を提案する。
論文 参考訳(メタデータ) (2023-01-13T15:24:02Z) - Discrete Factorial Representations as an Abstraction for Goal
Conditioned Reinforcement Learning [99.38163119531745]
離散化ボトルネックを適用することにより,目標条件付きRLセットアップの性能が向上することを示す。
分布外目標に対する期待した回帰を実験的に証明し、同時に表現的な構造で目標を指定できるようにします。
論文 参考訳(メタデータ) (2022-11-01T03:31:43Z) - C-Planning: An Automatic Curriculum for Learning Goal-Reaching Tasks [133.40619754674066]
ゴール条件強化学習は、ナビゲーションや操作を含む幅広い領域のタスクを解決できる。
本研究では,学習時間における探索を用いて,中間状態を自動生成する遠隔目標獲得タスクを提案する。
E-stepはグラフ検索を用いて最適な経路点列を計画することに対応し、M-stepはそれらの経路点に到達するための目標条件付きポリシーを学習することを目的としている。
論文 参考訳(メタデータ) (2021-10-22T22:05:31Z) - Sequential Transfer in Reinforcement Learning with a Generative Model [48.40219742217783]
本稿では,従来の課題から知識を移譲することで,新たな課題を学習する際のサンプルの複雑さを軽減する方法について述べる。
この種の事前知識を使用することのメリットを明確に示すために,PAC境界のサンプル複雑性を導出する。
簡単なシミュレートされた領域における理論的な発見を実証的に検証する。
論文 参考訳(メタデータ) (2020-07-01T19:53:35Z) - Reparameterized Variational Divergence Minimization for Stable Imitation [57.06909373038396]
確率的発散の選択における変動が、より高性能なILOアルゴリズムをもたらす可能性について検討する。
本稿では,提案する$f$-divergence最小化フレームワークの課題を軽減するために,逆模倣学習のための再パラメータ化手法を提案する。
経験的に、我々の設計選択は、ベースラインアプローチより優れ、低次元連続制御タスクにおける専門家のパフォーマンスとより密に適合するIOOアルゴリズムを許容することを示した。
論文 参考訳(メタデータ) (2020-06-18T19:04:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。