論文の概要: Exact and Cost-Effective Automated Transformation of Neural Network
Controllers to Decision Tree Controllers
- arxiv url: http://arxiv.org/abs/2304.06049v2
- Date: Sat, 16 Sep 2023 00:52:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 00:21:23.129107
- Title: Exact and Cost-Effective Automated Transformation of Neural Network
Controllers to Decision Tree Controllers
- Title(参考訳): ニューラルネットワーク制御器から決定木制御器への実行・費用効果自動変換
- Authors: Kevin Chang, Nathan Dahlin, Rahul Jain and Pierluigi Nuzzo
- Abstract要約: NNベースのコントローラを等価なソフト決定木(SDT)に変換することとその妥当性への影響について検討する。
我々は、冗長な分岐を自動的に実行できるように、正確だが費用効率のよい変換アルゴリズムを考案する。
以上の結果から,SDT変換は,MountainCar-v0とCartPole-v0のランタイムを最大21倍,2倍改善したことを示す。
- 参考スコア(独自算出の注目度): 7.5324684039928975
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Over the past decade, neural network (NN)-based controllers have demonstrated
remarkable efficacy in a variety of decision-making tasks. However, their
black-box nature and the risk of unexpected behaviors and surprising results
pose a challenge to their deployment in real-world systems with strong
guarantees of correctness and safety. We address these limitations by
investigating the transformation of NN-based controllers into equivalent soft
decision tree (SDT)-based controllers and its impact on verifiability.
Differently from previous approaches, we focus on discrete-output NN
controllers including rectified linear unit (ReLU) activation functions as well
as argmax operations. We then devise an exact but cost-effective transformation
algorithm, in that it can automatically prune redundant branches. We evaluate
our approach using two benchmarks from the OpenAI Gym environment. Our results
indicate that the SDT transformation can benefit formal verification, showing
runtime improvements of up to 21x and 2x for MountainCar-v0 and CartPole-v0,
respectively.
- Abstract(参考訳): 過去10年間で、ニューラルネットワーク(NN)ベースのコントローラは、さまざまな意思決定タスクにおいて顕著な効果を示してきた。
しかしながら、彼らのブラックボックスの性質と予期せぬ行動や驚くべき結果のリスクは、正確性と安全性の保証が強い現実世界システムへの展開に挑戦する。
NNベースのコントローラを等価なソフト決定木(SDT)ベースのコントローラに変換することとその妥当性への影響を調べることで、これらの制限に対処する。
従来の手法とは違って,正規化線形ユニット(ReLU)アクティベーション関数やargmax演算を含む離散出力NNコントローラに注目する。
次に、冗長分岐を自動的に実行できるように、正確だが費用効率のよい変換アルゴリズムを考案する。
OpenAI Gym環境からの2つのベンチマークによるアプローチの評価を行った。
以上の結果から,SDT変換は,MountainCar-v0とCartPole-v0のランタイムを最大21倍,2倍改善したことを示す。
関連論文リスト
- Lyapunov-stable Neural Control for State and Output Feedback: A Novel Formulation [67.63756749551924]
学習ベースのニューラルネットワーク(NN)制御ポリシは、ロボット工学と制御の幅広いタスクにおいて、印象的な経験的パフォーマンスを示している。
非線形力学系を持つNNコントローラのトラクション領域(ROA)に対するリアプノフ安定性の保証は困難である。
我々は、高速な経験的ファルシフィケーションと戦略的正則化を用いて、Lyapunov証明書とともにNNコントローラを学習するための新しいフレームワークを実証する。
論文 参考訳(メタデータ) (2024-04-11T17:49:15Z) - Optimal Controller Realizations against False Data Injections in Cooperative Driving [2.2134894590368748]
本研究では,False-Data Injection(FDI)攻撃の効果を緩和するためのコントローラ指向アプローチについて検討する。
我々は,新しいが等価なコントローラのクラスがベースコントローラを表現可能であることを示す。
FDI攻撃の影響を最小限に抑えるセンサの最適組み合わせを得る。
論文 参考訳(メタデータ) (2024-04-08T09:53:42Z) - Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - Auto-Train-Once: Controller Network Guided Automatic Network Pruning from Scratch [72.26822499434446]
オートトレインオース (Auto-Train-Once, ATO) は、DNNの計算コストと記憶コストを自動的に削減するために設計された、革新的なネットワークプルーニングアルゴリズムである。
総合的な収束解析と広範な実験を行い,本手法が様々なモデルアーキテクチャにおける最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2024-03-21T02:33:37Z) - Structured Deep Neural Network-Based Backstepping Trajectory Tracking Control for Lagrangian Systems [9.61674297336072]
提案したコントローラは、任意の互換性のあるニューラルネットワークパラメータに対してクローズループ安定性を確保することができる。
モデル近似誤差や外乱の存在下では、閉ループ安定性と追従制御性能が保証されることが示されている。
論文 参考訳(メタデータ) (2024-03-01T09:09:37Z) - Cal-DETR: Calibrated Detection Transformer [67.75361289429013]
本稿では,Deformable-DETR,UP-DETR,DINOのキャリブレーション検出トランス(Cal-DETR)のメカニズムを提案する。
我々は、不確実性を利用してクラスロジットを変調する不確実性誘導ロジット変調機構を開発する。
その結果、Cal-DETRは、ドメイン内およびドメイン外の両方を校正する競合する列車時間法に対して有効であることがわかった。
論文 参考訳(メタデータ) (2023-11-06T22:13:10Z) - Actor-Critic based Improper Reinforcement Learning [61.430513757337486]
我々は,未知のマルコフ決定プロセスに対して,学習者に100万ドルのベースコントローラを付与する不適切な強化学習環境を考える。
本稿では,(1)ポリシーグラディエントに基づくアプローチ,(2)単純なアクター・クリティカル・スキームとNatural Actor-Criticスキームを切り替えるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-19T05:55:02Z) - Generating Probabilistic Safety Guarantees for Neural Network
Controllers [30.34898838361206]
ダイナミクスモデルを使用して、ニューラルネットワークコントローラが安全に動作するために保持する必要がある出力プロパティを決定します。
ニューラルネットワークポリシの近似を効率的に生成するための適応的検証手法を開発した。
本手法は,航空機衝突回避ニューラルネットワークの確率的安全性を保証することができることを示す。
論文 参考訳(メタデータ) (2021-03-01T18:48:21Z) - Control of Stochastic Quantum Dynamics with Differentiable Programming [0.0]
微分可能プログラミングに基づく制御スキームの自動設計のためのフレームワークを提案する。
このアプローチを、ホモジエン検出を受けるクビットの状態準備と安定化に適用する。
その結果、信号と雑音の比が低いにもかかわらず、平均忠実度が約85%の目標状態へのキュービットの準備と安定化をコントローラに教えることができる。
論文 参考訳(メタデータ) (2021-01-04T19:00:03Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。