論文の概要: Explaining Control Policies through Predicate Decision Diagrams
- arxiv url: http://arxiv.org/abs/2503.06420v2
- Date: Tue, 25 Mar 2025 16:57:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-26 20:13:13.636018
- Title: Explaining Control Policies through Predicate Decision Diagrams
- Title(参考訳): 述語決定図による制御法の説明
- Authors: Debraj Chakraborty, Clemens Dubslaff, Sudeep Kanav, Jan Kretinsky, Christoph Weinhuber,
- Abstract要約: 学習決定木(DT)は、生成したコントローラの解釈可能なモデルに対して広く利用されている。
しかし、DTは共有意思決定を活用しません。これはバイナリ意思決定図(BDD)で採用され、そのサイズを減らし、説明可能性を改善するための重要な概念です。
本研究では、述語でBDDを拡張する述語決定図(PDD)を導入し、コントローラ表現におけるDTとBDDの利点を統一する。
- 参考スコア(独自算出の注目度): 1.7767503371811662
- License:
- Abstract: Safety-critical controllers of complex systems are hard to construct manually. Automated approaches such as controller synthesis or learning provide a tempting alternative but usually lack explainability. To this end, learning decision trees (DTs) have been prevalently used towards an interpretable model of the generated controllers. However, DTs do not exploit shared decision-making, a key concept exploited in binary decision diagrams (BDDs) to reduce their size and thus improve explainability. In this work, we introduce predicate decision diagrams (PDDs) that extend BDDs with predicates and thus unite the advantages of DTs and BDDs for controller representation. We establish a synthesis pipeline for efficient construction of PDDs from DTs representing controllers, exploiting reduction techniques for BDDs also for PDDs.
- Abstract(参考訳): 複雑なシステムの安全クリティカルなコントローラは手動で構築するのは難しい。
コントローラ合成や学習といった自動的なアプローチは、誘惑的な代替手段を提供するが、通常は説明性に欠ける。
この目的のために、学習決定木(DT)は、生成したコントローラの解釈可能なモデルに対して広く使用されている。
しかし、DTは共有意思決定を活用しません。これはバイナリ意思決定図(BDD)で採用され、そのサイズを減らし、説明可能性を改善するための重要な概念です。
本研究では、述語でBDDを拡張する述語決定図(PDD)を導入し、コントローラ表現におけるDTとBDDの利点を統一する。
我々は、コントローラを表すDTからPDDを効率的に構築するための合成パイプラインを構築し、PDDにもBDDの削減技術を活用する。
関連論文リスト
- Understanding the Logic of Direct Preference Alignment through Logic [54.272600416107146]
本稿では,単一モデルと参照モデルに基づくアプローチの選好損失を特徴付ける新しいフォーマリズムを提案する。
そこで我々は,この嗜好学習の形式的視点が,DPA損失景観の大きさと構造の両方に新たな光を当てていることを示す。
論文 参考訳(メタデータ) (2024-12-23T16:23:13Z) - Making Large Language Models Better Planners with Reasoning-Decision Alignment [70.5381163219608]
マルチモーダリティ強化LLMに基づくエンドツーエンド意思決定モデルを提案する。
ペア化されたCoTと計画結果との推論・決定アライメントの制約を提案する。
提案する大規模言語プランナをRDA-Driverとして推論・決定アライメントする。
論文 参考訳(メタデータ) (2024-08-25T16:43:47Z) - Relative Difficulty Distillation for Semantic Segmentation [54.76143187709987]
我々は,Relative Difficulty Distillation (RDD) というセマンティックセグメンテーションのための画素レベルのKDパラダイムを提案する。
RDDにより、教師ネットワークは、追加の最適化目標を伴わずに、学習焦点に対する効果的なガイダンスを提供することができる。
我々の研究は、RDDが既存のKDメソッドと統合して、上位パフォーマンスバウンダリを改善できることを示します。
論文 参考訳(メタデータ) (2024-07-04T08:08:25Z) - Canonical Decision Diagrams Modulo Theories [0.19285000127136376]
決定図は命題公式を表現する強力なツールである。
いくつかの形式(例えば OBDD や SDD など)は標準的であり、(原子リスト上の与えられた条件の下では)公式の同値類を単項的に表す。
DDをSMTレベルに活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-04-25T09:34:49Z) - Part Representation Learning with Teacher-Student Decoder for Occluded
Person Re-identification [65.63180725319906]
本稿では,隠蔽者ReIDのためのTSD(Teacher-Student Decoder)フレームワークを提案する。
提案するTSDは,Parsing-aware Teacher Decoder (PTD) と標準学生デコーダ (SSD) から構成される。
論文 参考訳(メタデータ) (2023-12-15T13:54:48Z) - Exploiting Asymmetry in Logic Puzzles: Using ZDDs for Symbolic Model
Checking Dynamic Epistemic Logic [0.0]
我々は、動的疫学論理で使用されるクリプキモデルを象徴的に符号化するためにZDDを使用する。
BDDを適切なZDDに置き換えることで、メモリ使用量を大幅に削減できることを示す。
これはZDDがマルチエージェントシステムのモデル検査に有用なツールであることを示唆している。
論文 参考訳(メタデータ) (2023-07-11T07:13:09Z) - Analyzing Strategies for Dynamical Decoupling Insertion on IBM Quantum
Computer [0.0]
短期量子デバイスはエラーを受けており、デコヒーレンスエラーは無視できない情報源の1つである。
動的デカップリングはアイドルキュービットをデコヒーレンスエラーから保護する技術である。
アイドル量子ビットに繋がる異なる条件を特定し、これらの条件下でDD挿入の戦略を評価する。
論文 参考訳(メタデータ) (2022-04-29T17:28:35Z) - Belief Revision in Sentential Decision Diagrams [126.94029917018733]
本研究では,Dalリビジョンの構文的特徴化に基づくSDDの一般的なリビジョンアルゴリズムを開発する。
ランダムに生成した知識ベースを用いた予備実験は、SDDフォーマリズム内で直接リビジョンを行う利点を示している。
論文 参考訳(メタデータ) (2022-01-20T11:01:41Z) - Optimal PID and Antiwindup Control Design as a Reinforcement Learning
Problem [3.131740922192114]
DRL制御法の解釈可能性に着目した。
特に、線形固定構造コントローラをアクター・クリティカル・フレームワークに埋め込まれた浅層ニューラルネットワークとみなす。
論文 参考訳(メタデータ) (2020-05-10T01:05:26Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z) - Variable Shift SDD: A More Succinct Sentential Decision Diagram [10.91026094237478]
Sentential Decision Diagram (SDD) はブール関数の抽出可能な表現である。
可変シフトSDD(VS-SDD)という,より簡潔なSDD変種を提案する。
我々は,VS-SDDがSDDよりも大きくなることはなく,VS-SDDのサイズがSDDよりも指数関数的に小さいケースがあることを示した。
論文 参考訳(メタデータ) (2020-04-06T09:18:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。