Fugu-MT 論文翻訳(概要): Domain Concretization from Examples: Addressing Missing Domain Knowledge via Robust Planning

論文の概要: Domain Concretization from Examples: Addressing Missing Domain Knowledge via Robust Planning

arxiv url: http://arxiv.org/abs/2011.09034v1
Date: Wed, 18 Nov 2020 01:56:15 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-24 04:47:29.935535
Title: Domain Concretization from Examples: Addressing Missing Domain Knowledge via Robust Planning
Title（参考訳）: ドメインの強化:ロバスト計画によるドメイン知識の欠如への対処
Authors: Akshay Sharma, Piyush Rajesh Medikeri and Yu Zhang
Abstract要約: 本稿では、ドメイン抽象化の逆問題であるDomain Concretizationの問題として、これを定式化する。提案アルゴリズムは,設計者や教師が人間ユーザから取得した不完全なドメインモデルに基づいて,最小限のモデル仮定の下で設定された候補モデルを探索する。すると、候補モデルの集合の下で成功の確率が最大となるロバストな計画を生成する。
参考スコア（独自算出の注目度）: 5.051046322526032
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The assumption of complete domain knowledge is not warranted for robot planning and decision-making in the real world. It could be due to design flaws or arise from domain ramifications or qualifications. In such cases, existing planning and learning algorithms could produce highly undesirable behaviors. This problem is more challenging than partial observability in the sense that the agent is unaware of certain knowledge, in contrast to it being partially observable: the difference between known unknowns and unknown unknowns. In this work, we formulate it as the problem of Domain Concretization, an inverse problem to domain abstraction. Based on an incomplete domain model provided by the designer and teacher traces from human users, our algorithm searches for a candidate model set under a minimalistic model assumption. It then generates a robust plan with the maximum probability of success under the set of candidate models. In addition to a standard search formulation in the model-space, we propose a sample-based search method and also an online version of it to improve search time. We tested our approach on IPC domains and a simulated robotics domain where incompleteness was introduced by removing domain features from the complete model. Results show that our planning algorithm increases the plan success rate without impacting the cost much.
Abstract（参考訳）: 完全なドメイン知識の仮定は、現実世界におけるロボット計画と意思決定には必須ではない。これは設計上の欠陥やドメインの分岐や資格に起因する可能性がある。そのような場合、既存の計画と学習アルゴリズムは、非常に望ましくない振る舞いを生み出す可能性がある。この問題は、エージェントが特定の知識に気づいていないという意味では部分的可観測性よりも、部分的に可観測性である(未知の未知と未知の未知の違い)。本稿では、ドメイン抽象化の逆問題であるDomain Concretizationの問題として、これを定式化する。設計者および教師が提供した不完全なドメインモデルに基づいて,提案アルゴリズムは最小限のモデル仮定で設定した候補モデルを探索する。そして、候補モデルの集合の下で成功の最大確率を持つロバストな計画を生成する。モデル空間における標準的な検索定式化に加えて,検索時間を改善するためにサンプルベースの検索手法とオンライン版を提案する。完全モデルからドメインの特徴を取り除き,不完全性を導入したICCドメインとシミュレーションロボティクスドメインに対して,我々のアプローチを検証した。その結果,計画アルゴリズムはコストに大きな影響を及ぼすことなく,計画の成功率を高めることがわかった。

関連論文リスト

Integrating Reinforcement Learning, Action Model Learning, and Numeric Planning for Tackling Complex Tasks [12.281688043929996]
自動計画アルゴリズムは、各アクションの前提条件と効果を指定するドメインのモデルを必要とする。数値的なドメインモデルと計画の学習が、数値的な計画環境にとって効果的なアプローチであるかどうかは不明だ。本研究では、数値的なドメインモデルを学習し、それを代替のモデルフリーソリューションと比較する利点について検討する。
論文参考訳（メタデータ） (2025-02-18T16:26:21Z)
LLM-Generated Heuristics for AI Planning: Do We Even Need Domain-Independence Anymore? [87.71321254733384]
大規模言語モデル(LLM)は、特定の計画問題に適した計画手法を生成することができる。 LLMは、いくつかの標準IPCドメインで最先端のパフォーマンスを達成することができる。これらの結果がパラダイムシフトを意味するのか、既存の計画手法をどのように補完するかについて議論する。
論文参考訳（メタデータ） (2025-01-30T22:21:12Z)
Depth-Bounded Epistemic Planning [50.42592219248395]
本稿では,動的てんかん論理に基づく新しい計画法を提案する。新規性は、計画エージェントの推論の深さを上界bに制限することである。推論深度の境界b内における解を持つ計画タスクに関して、完全なものであることを示す。
論文参考訳（メタデータ） (2024-06-03T09:30:28Z)
AI planning in the imagination: High-level planning on learned abstract search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文参考訳（メタデータ） (2023-08-16T22:47:16Z)
Robots That Ask For Help: Uncertainty Alignment for Large Language Model Planners [85.03486419424647]
KnowNoは、大きな言語モデルの不確実性を測定し、調整するためのフレームワークである。 KnowNoは、タスク完了に関する統計的保証を提供する共形予測理論に基づいている。
論文参考訳（メタデータ） (2023-07-04T21:25:12Z)
Risk-Sensitive and Robust Model-Based Reinforcement Learning and Planning [2.627046865670577]
我々は、逐次意思決定における計画と強化学習のアプローチに対処する。多くの実世界の領域において、完全に正確なモデルやシミュレータを構築することは不可能である。私たちはモデルベースのアルゴリズムに焦点をあてて、この目標に対して多くのコントリビューションを行います。
論文参考訳（メタデータ） (2023-04-02T16:44:14Z)
Ideal Abstractions for Decision-Focused Learning [108.15241246054515]
本稿では,決定関連情報の損失を最小限に抑えるために,出力空間を自動的に構成する手法を提案する。本手法は,ディープニューラルネットワークトレーニングのためのデータ取得と,閉ループ山火事管理タスクの2つの領域で実証する。
論文参考訳（メタデータ） (2023-03-29T23:31:32Z)
Graph Value Iteration [35.87805182676444]
ディープ強化学習(Dep Reinforcement Learning, RL)は、2人のプレイヤーによるゲームや科学的な発見など、様々な検索領域で成功している。最大の難点は、学習フレームワークが解決計画を見つけない限り、報酬信号がゼロであることである。本稿では,グラフ探索をグラフ値繰り返しで拡張し,ハードプランニングインスタンスを解くドメイン非依存の手法を提案する。
論文参考訳（メタデータ） (2022-09-20T10:45:03Z)
On Generalizing Beyond Domains in Cross-Domain Continual Learning [91.56748415975683]
ディープニューラルネットワークは、新しいタスクを学んだ後、これまで学んだ知識の破滅的な忘れ込みに悩まされることが多い。提案手法は、ドメインシフト中の新しいタスクを精度良く学習することで、DomainNetやOfficeHomeといった挑戦的なデータセットで最大10%向上する。
論文参考訳（メタデータ） (2022-03-08T09:57:48Z)
Safe-Planner: A Single-Outcome Replanner for Computing Strong Cyclic Policies in Fully Observable Non-Deterministic Domains [0.22940141855172028]
我々は、古典的ドメインの集合に非決定論的ドメインをコンパイルするために、単一出力決定に依存する、Safe-Plannerと呼ばれるオフラインのリプランナーを導入する。実験により,この手法により,SPは誤った計画の生成を回避できるが,強い解に直結する弱い計画を生成することができることを示した。
論文参考訳（メタデータ） (2021-09-23T16:20:35Z)
Safe Learning of Lifted Action Models [46.65973550325976]
本稿では,古典計画におけるモデルフリー計画問題の解法を提案する。将来の問題を高い確率で解くのに必要な軌道の数は、ドメインモデルの潜在的サイズにおいて線形である。
論文参考訳（メタデータ） (2021-07-09T01:24:01Z)
In Search of Lost Domain Generalization [25.43757332883202]
ドメインの一般化のためのテストベッドであるDomainBedを実装します。 DomainBedを用いて広範な実験を行い、慎重に実装すると、経験的リスク最小化が最先端のパフォーマンスを示すことを確かめる。
論文参考訳（メタデータ） (2020-07-02T23:08:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。