論文の概要: dtControl 2.0: Explainable Strategy Representation via Decision Tree
Learning Steered by Experts
- arxiv url: http://arxiv.org/abs/2101.07202v1
- Date: Fri, 15 Jan 2021 11:22:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-28 18:19:12.955116
- Title: dtControl 2.0: Explainable Strategy Representation via Decision Tree
Learning Steered by Experts
- Title(参考訳): dtControl 2.0: 専門家による決定木学習による説明可能な戦略表現
- Authors: Pranav Ashok, Mathias Jackermeier, Jan K\v{r}et\'insk\'y, Christoph
Weinhuber, Maximilian Weininger, Mayank Yadav
- Abstract要約: dtcontrol 2.0は,いくつかの基本的な新機能を備えた新バージョンである。
ユーザーは、決定木学習プロセスで活用されるドメイン知識を提供することができる。
また、動的に提供される情報に基づいてプロセスをインタラクティブに操作することもできます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances have shown how decision trees are apt data structures for
concisely representing strategies (or controllers) satisfying various
objectives. Moreover, they also make the strategy more explainable. The recent
tool dtControl had provided pipelines with tools supporting strategy synthesis
for hybrid systems, such as SCOTS and Uppaal Stratego. We present dtControl
2.0, a new version with several fundamentally novel features. Most importantly,
the user can now provide domain knowledge to be exploited in the decision tree
learning process and can also interactively steer the process based on the
dynamically provided information. To this end, we also provide a graphical user
interface. It allows for inspection and re-computation of parts of the result,
suggesting as well as receiving advice on predicates, and visual simulation of
the decision-making process. Besides, we interface model checkers of
probabilistic systems, namely Storm and PRISM and provide dedicated support for
categorical enumeration-type state variables. Consequently, the controllers are
more explainable and smaller.
- Abstract(参考訳): 近年の進歩は、様々な目的を満足する戦略(またはコントローラ)を簡潔に表現するための決定木が適切なデータ構造であることを示す。
さらに、戦略をより説明しやすいものにしている。
最近のツールdtControlは、SCOTSやUppaal Strategoといったハイブリッドシステムの戦略合成をサポートするツールを備えたパイプラインを提供している。
dtcontrol 2.0は,いくつかの基本的な新機能を備えた新バージョンである。
最も重要なのは、ユーザが決定木学習プロセスで悪用されるドメイン知識を提供し、動的に提供された情報に基づいてプロセスを対話的に制御できることだ。
この目的のために、グラフィカルユーザインタフェースも提供します。
これにより、結果の一部の検査と再計算が可能になり、述語に対するアドバイスの受け付け、意思決定プロセスの視覚的なシミュレーションが可能になる。
さらに、確率システムのモデルチェッカー、すなわちStormとPRISMをインターフェースし、分類列挙型状態変数の専用サポートを提供する。
その結果、コントローラはより説明しやすく、小さくなる。
関連論文リスト
- ViTree: Single-path Neural Tree for Step-wise Interpretable Fine-grained
Visual Categorization [56.37520969273242]
細かな視覚分類のための新しいアプローチであるViTreeを紹介する。
ツリーパスをトラバースすることで、ViTreeは変換処理された機能からパッチを効果的に選択し、情報のあるローカルリージョンをハイライトする。
このパッチとパスの選択性は、ViTreeのモデルの解釈可能性を高め、モデルの内部動作に関するより良い洞察を可能にする。
論文 参考訳(メタデータ) (2024-01-30T14:32:25Z) - PartIR: Composing SPMD Partitioning Strategies for Machine Learning [1.1250231074374903]
NNパーティショニングシステムの設計であるPartIRについて述べる。
PartIRは書き直しに対する漸進的なアプローチに重点を置いており、ハードウェアとランタイムに依存しない。
予測可能性,表現性,ピーク性能に到達する能力を示すために,いくつかの異なるモデルでPartIRを評価した。
論文 参考訳(メタデータ) (2024-01-20T10:30:31Z) - AVIS: Autonomous Visual Information Seeking with Large Language Model
Agent [123.75169211547149]
本稿では,視覚的質問応答フレームワークAVISを提案する。
本手法は,LLM(Large Language Model)を利用して外部ツールの利用を動的に強化する。
AVIS は Infoseek や OK-VQA などの知識集約型視覚質問応答ベンチマークの最先端結果を達成する。
論文 参考訳(メタデータ) (2023-06-13T20:50:22Z) - PDSketch: Integrated Planning Domain Programming and Learning [86.07442931141637]
我々は PDSketch という新しいドメイン定義言語を提案する。
これにより、ユーザーはトランジションモデルで柔軟にハイレベルな構造を定義できる。
移行モデルの詳細は、トレーニング可能なニューラルネットワークによって満たされる。
論文 参考訳(メタデータ) (2023-03-09T18:54:12Z) - DiffStack: A Differentiable and Modular Control Stack for Autonomous
Vehicles [75.43355868143209]
DiffStackは、予測、計画、制御のための、微分可能でモジュラーなスタックです。
nuScenesデータセットの結果から,DiffStackによるエンドツーエンドトレーニングは,オープンループおよびクローズループ計画の指標を大幅に改善することが示された。
論文 参考訳(メタデータ) (2022-12-13T09:05:21Z) - Meta-Reinforcement Learning for Adaptive Control of Second Order Systems [3.131740922192114]
プロセス制御では、多くのシステムは類似しており、よく理解されているダイナミクスを持ち、メタ学習を通じて一般化可能なコントローラを作成することは可能であることを示唆している。
本稿では,メタ強化学習(meta-RL)制御戦略を定式化し,モデル構造などのトレーニングにおいて,既知のオフライン情報を活用する。
重要な設計要素は、トレーニング中にモデルベースの情報をオフラインで利用し、新しい環境と対話するためのモデルフリーのポリシー構造を維持することである。
論文 参考訳(メタデータ) (2022-09-19T18:51:33Z) - A Framework for Understanding and Visualizing Strategies of RL Agents [0.0]
本稿では,時間論理式を用いてエージェント戦略を特徴付ける逐次決定タスクの理解可能なモデル学習フレームワークを提案する。
我々は,手工芸の専門家政策と訓練された強化学習エージェントの痕跡を用いて,StarCraft II (SC2) の戦闘シナリオに関する枠組みを評価した。
論文 参考訳(メタデータ) (2022-08-17T21:58:19Z) - Meta Reinforcement Learning for Adaptive Control: An Offline Approach [3.131740922192114]
トレーニングにおいて、既知のオフライン情報を活用するメタ強化学習(meta-RL)制御戦略を定式化する。
我々のメタRLエージェントはリカレントな構造を持ち、隠された状態変数を通して現在のダイナミックスに対して"コンテキスト"を蓄積します。
ここで報告されたテストでは、メタRLエージェントは完全にオフラインで訓練されたが、新しい設定で優れた結果が得られた。
論文 参考訳(メタデータ) (2022-03-17T23:58:52Z) - A Dependency Syntactic Knowledge Augmented Interactive Architecture for
End-to-End Aspect-based Sentiment Analysis [73.74885246830611]
エンドツーエンドABSAのためのマルチタスク学習を用いた対話型アーキテクチャを新たに提案する。
このモデルは、よく設計された依存性関係埋め込みグラフ畳み込みネットワーク(DreGcn)を活用することで、構文知識(依存性関係と型)を完全に活用することができる。
3つのベンチマークデータセットの大規模な実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-04-04T14:59:32Z) - Guided Variational Autoencoder for Disentanglement Learning [79.02010588207416]
本稿では,潜在表現非絡み合い学習を行うことで,制御可能な生成モデルを学習できるアルゴリズム,Guided-VAEを提案する。
我々は、ガイド-VAEにおける教師なし戦略と教師なし戦略を設計し、バニラVAE上でのモデリングと制御能力の強化を観察する。
論文 参考訳(メタデータ) (2020-04-02T20:49:15Z) - dtControl: Decision Tree Learning Algorithms for Controller
Representation [0.0]
決定木は証明可能な正確なコントローラを簡潔に表現するために使用することができる。
本稿では、メモリレスコントローラを決定木として表現するための簡易な合成ツールであるdtControlについて述べる。
論文 参考訳(メタデータ) (2020-02-12T17:13:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。