論文の概要: On Exploiting Hitting Sets for Model Reconciliation
- arxiv url: http://arxiv.org/abs/2012.09274v3
- Date: Wed, 27 Sep 2023 17:59:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-29 03:56:54.776197
- Title: On Exploiting Hitting Sets for Model Reconciliation
- Title(参考訳): モデル和解のための爆発的ハッティングセットについて
- Authors: Stylianos Loukas Vasileiou, Alessandro Previti, William Yeoh
- Abstract要約: ヒューマン・アウェア・プランニングにおいて、プランニング・エージェントは、その計画がなぜ最適なのかを人間に説明する必要があるかもしれない。
この手法はモデル和解と呼ばれ、エージェントはモデルと人間のモデルの違いを調和させようとする。
我々は,計画の領域を超えて拡張されたモデル和解のための論理ベースのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 53.81101846598925
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In human-aware planning, a planning agent may need to provide an explanation
to a human user on why its plan is optimal. A popular approach to do this is
called model reconciliation, where the agent tries to reconcile the differences
in its model and the human's model such that the plan is also optimal in the
human's model. In this paper, we present a logic-based framework for model
reconciliation that extends beyond the realm of planning. More specifically,
given a knowledge base $KB_1$ entailing a formula $\varphi$ and a second
knowledge base $KB_2$ not entailing it, model reconciliation seeks an
explanation, in the form of a cardinality-minimal subset of $KB_1$, whose
integration into $KB_2$ makes the entailment possible. Our approach, based on
ideas originating in the context of analysis of inconsistencies, exploits the
existing hitting set duality between minimal correction sets (MCSes) and
minimal unsatisfiable sets (MUSes) in order to identify an appropriate
explanation. However, differently from those works targeting inconsistent
formulas, which assume a single knowledge base, MCSes and MUSes are computed
over two distinct knowledge bases. We conclude our paper with an empirical
evaluation of the newly introduced approach on planning instances, where we
show how it outperforms an existing state-of-the-art solver, and generic
non-planning instances from recent SAT competitions, for which no other solver
exists.
- Abstract(参考訳): ヒューマン・アウェア・プランニングでは、プランニングエージェントは、そのプランが最適である理由を人間ユーザーに説明する必要があるかもしれない。
これを行うための一般的なアプローチはモデル和解(model reconciliation)と呼ばれ、エージェントはそのモデルと人間のモデルの違いを調和させようとする。
本稿では,計画の領域を超えたモデル調整のための論理ベースのフレームワークを提案する。
より具体的には、知識ベースが$KB_1$で式が$\varphi$であり、2番目の知識ベースが$KB_2$でなくても、モデル和解は$KB_1$の基数最小部分集合の形で説明を求める。
提案手法は,不一致の分析の文脈から生まれた概念に基づき,既存の最小補正集合 (mcses) と最小不満足集合 (muses) 間のヒット集合の双対性を利用して,適切な説明を導出する。
しかし、単一の知識ベースを仮定する一貫性のない公式を対象とする作業とは異なり、MCSとMUSは2つの異なる知識ベースで計算される。
本稿では,新たに導入された計画インスタンスに対するアプローチを実証的に評価し,既存の最先端のソルバと,他のソルバが存在しない最近のsatコンペティションの汎用的非計画インスタンスとを比較検討した。
関連論文リスト
- MAP: Low-compute Model Merging with Amortized Pareto Fronts via Quadratic Approximation [80.47072100963017]
モデルマージは、同じトレーニング済みモデルから細調整された複数のシングルタスクモデルをマルチタスクモデルに結合する効果的なアプローチである。
既存のモデルマージ手法は、平均的なタスク精度の向上に重点を置いている。
Amortized Pareto Front (MAP) を用いた新しい低計算アルゴリズム Model Merging を導入する。
論文 参考訳(メタデータ) (2024-06-11T17:55:25Z) - Accelerating Ensemble Error Bar Prediction with Single Models Fits [0.5249805590164902]
Nモデルのアンサンブルは、推論に使用される場合の1つのモデルに比べて、およそN倍計算的に要求される。
本研究では,単一モデルを用いてアンサンブル誤りを予測し,完全アンサンブルを必要とせずに不確実性を推定する手法を提案する。
論文 参考訳(メタデータ) (2024-04-15T16:10:27Z) - COPlanner: Plan to Roll Out Conservatively but to Explore Optimistically
for Model-Based RL [50.385005413810084]
ダイナスタイルのモデルベース強化学習には、ポリシー学習と実環境探索のためのサンプルを生成するモデルロールアウトという2つのフェーズが含まれる。
$textttCOPlanner$は、不正確な学習された動的モデル問題に対処するモデルベースのメソッドのための計画駆動フレームワークである。
論文 参考訳(メタデータ) (2023-10-11T06:10:07Z) - Action-State Dependent Dynamic Model Selection [6.5268245109828005]
強化学習アルゴリズムはデータから動的プログラミング問題に対する最適解を近似して推定するために用いられる。
典型的な例として、リバランスコストの下で異なるポートフォリオモデルを切り替える方法があります。
マクロ経済変数のセットと価格データを用いて、実証的なアプリケーションでは、後見で最高のポートフォリオモデルを選択するよりも優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-07-07T09:23:14Z) - Aggregation of Pareto optimal models [0.8122270502556374]
統計的決定論において、モデルが最適であるとは、他のモデルが少なくとも1つの自然状態のリスクを減らし、他のモデルに対するリスクを減らさないことをいう。
本稿では4つの論理的なステップで答えを示す。
すべての有理/一貫性アグリゲーション規則は階層的ベイズモデリングの一般化に従わなければならないことを示す。
論文 参考訳(メタデータ) (2021-12-08T08:21:15Z) - Lifted Model Checking for Relational MDPs [12.574454799055026]
pCTL-REBELは、リレーショナルMDP上のpCTL特性を検証するためのリフトモデルチェック手法である。
pCTLモデル検査手法は, 無限領域であっても, リレーショナルMDPに対して決定可能であることを示す。
論文 参考訳(メタデータ) (2021-06-22T13:12:36Z) - Forethought and Hindsight in Credit Assignment [62.05690959741223]
我々は、前向きモデルや後向きモデルによる後向き操作による予測として使われる計画の利益と特異性を理解するために活動する。
本稿では,予測を(再)評価すべき状態の選択に主眼を置いて,計画におけるモデルの利用について検討する。
論文 参考訳(メタデータ) (2020-10-26T16:00:47Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z) - A Simple Approach to Case-Based Reasoning in Knowledge Bases [56.661396189466664]
我々は,古典人工知能(AI)におけるケースベース推論を想起させる,アンフノトレーニングを必要とする知識グラフ(KG)における推論に対する驚くほど単純かつ正確なアプローチを提案する。
ソースエンティティとバイナリ関係が与えられたターゲットエンティティを見つけるタスクを考えてみましょう。
我々の非パラメトリックなアプローチは、与えられた関係を通して類似したソースエンティティを接続する複数のテキストトグラフパスパターンを見つけることによって、クエリ毎にクレープな論理ルールを導出します。
論文 参考訳(メタデータ) (2020-06-25T06:28:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。