論文の概要: Equivalent and Compact Representations of Neural Network Controllers With Decision Trees
- arxiv url: http://arxiv.org/abs/2304.06049v3
- Date: Fri, 18 Jul 2025 15:52:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-21 20:43:25.972403
- Title: Equivalent and Compact Representations of Neural Network Controllers With Decision Trees
- Title(参考訳): 決定木を用いたニューラルネットワーク制御系の等価かつコンパクトな表現法
- Authors: Kevin Chang, Nathan Dahlin, Rahul Jain, Pierluigi Nuzzo,
- Abstract要約: NNベースのコントローラを等価なソフト決定木(SDT)に変換することとその妥当性への影響について検討する。
筆者らはまず,OpenAI GymのCarRacing環境において,自律走行NNコントローラに適用したトランスフォーメーションアルゴリズムの有効性を実証した。
- 参考スコア(独自算出の注目度): 6.895161326320554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Over the past decade, neural network (NN)-based controllers have demonstrated remarkable efficacy in a variety of decision-making tasks. However, their black-box nature and the risk of unexpected behaviors pose a challenge to their deployment in real-world systems requiring strong guarantees of correctness and safety. We address these limitations by investigating the transformation of NN-based controllers into equivalent soft decision tree (SDT)-based controllers and its impact on verifiability. In contrast to existing work, we focus on discrete-output NN controllers including rectified linear unit (ReLU) activation functions as well as argmax operations. We then devise an exact yet efficient transformation algorithm which automatically prunes redundant branches. We first demonstrate the practical efficacy of the transformation algorithm applied to an autonomous driving NN controller within OpenAI Gym's CarRacing environment. Subsequently, we evaluate our approach using two benchmarks from the OpenAI Gym environment. Our results indicate that the SDT transformation can benefit formal verification, showing runtime improvements of up to $21 \times$ and $2 \times$ for MountainCar-v0 and CartPole-v1, respectively.
- Abstract(参考訳): 過去10年間で、ニューラルネットワーク(NN)ベースのコントローラは、さまざまな意思決定タスクにおいて顕著な効果を示してきた。
しかしながら、彼らのブラックボックスの性質と予期せぬ行動のリスクは、現実のシステムへの展開に困難をもたらし、正確性と安全性の保証を強く要求する。
NNベースのコントローラを等価なソフト決定木(SDT)ベースのコントローラに変換することとその妥当性への影響を調べることで、これらの制限に対処する。
既存の作業とは対照的に、我々はargmax操作と同様に正則線形ユニット(ReLU)アクティベーション機能を含む離散出力NNコントローラに焦点をあてる。
次に、冗長分岐を自動生成する完全かつ効率的な変換アルゴリズムを考案する。
筆者らはまず,OpenAI GymのCarRacing環境において,自律走行NNコントローラに適用したトランスフォーメーションアルゴリズムの有効性を実証した。
その後、OpenAI Gym環境の2つのベンチマークを用いてアプローチを評価した。
以上の結果から,SDT 変換は,MountainCar-v0 と CartPole-v1 のそれぞれに対して,最大 21 の \times$ と 2 の \times$ のランタイム改善を示す形式検証に有効であることが示唆された。
関連論文リスト
- Two-Stage Learning of Stabilizing Neural Controllers via Zubov Sampling and Iterative Domain Expansion [17.905596843865705]
連続時間システムのための制御器とリアプノフ関数を協調的に合成する新しい2段階学習フレームワークを提案する。
SMTソルバに頼ってリアプノフ条件を正式に検証する既存のシステムとは異なり、最先端のニューラルネットワーク検証器$alpha,!
論文 参考訳(メタデータ) (2025-06-02T06:20:09Z) - Neural Network-assisted Interval Reachability for Systems with Control Barrier Function-Based Safe Controllers [1.77513002450736]
制御バリア関数(CBF)は、動的システムのための最適化ベースのコントローラとフィルタの設計に広く利用されている。
CBFベースのコントローラは安全保証を提供するが、システムの性能を損なう可能性がある。
最適化制御器を用いたシステムの性能検証のための計算効率の良い区間到達性手法を提案する。
論文 参考訳(メタデータ) (2025-04-11T04:14:55Z) - Lyapunov-stable Neural Control for State and Output Feedback: A Novel Formulation [67.63756749551924]
学習ベースのニューラルネットワーク(NN)制御ポリシは、ロボット工学と制御の幅広いタスクにおいて、印象的な経験的パフォーマンスを示している。
非線形力学系を持つNNコントローラのトラクション領域(ROA)に対するリアプノフ安定性の保証は困難である。
我々は、高速な経験的ファルシフィケーションと戦略的正則化を用いて、Lyapunov証明書とともにNNコントローラを学習するための新しいフレームワークを実証する。
論文 参考訳(メタデータ) (2024-04-11T17:49:15Z) - Optimal Controller Realizations against False Data Injections in Cooperative Driving [2.2134894590368748]
本研究では,False-Data Injection(FDI)攻撃の効果を緩和するためのコントローラ指向アプローチについて検討する。
我々は,新しいが等価なコントローラのクラスがベースコントローラを表現可能であることを示す。
FDI攻撃の影響を最小限に抑えるセンサの最適組み合わせを得る。
論文 参考訳(メタデータ) (2024-04-08T09:53:42Z) - Growing Q-Networks: Solving Continuous Control Tasks with Adaptive Control Resolution [51.83951489847344]
ロボット工学の応用において、スムーズな制御信号はシステム摩耗とエネルギー効率を減らすために一般的に好まれる。
本研究では,離散的な動作空間を粗い状態から細かい制御分解能まで拡大することにより,この性能ギャップを埋めることを目的とする。
我々の研究は、値分解とアダプティブ・コントロール・リゾリューションが組み合わさることで、単純な批判のみのアルゴリズムが得られ、連続制御タスクにおいて驚くほど高い性能が得られることを示唆している。
論文 参考訳(メタデータ) (2024-04-05T17:58:37Z) - Auto-Train-Once: Controller Network Guided Automatic Network Pruning from Scratch [72.26822499434446]
オートトレインオース (Auto-Train-Once, ATO) は、DNNの計算コストと記憶コストを自動的に削減するために設計された、革新的なネットワークプルーニングアルゴリズムである。
総合的な収束解析と広範な実験を行い,本手法が様々なモデルアーキテクチャにおける最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2024-03-21T02:33:37Z) - Structured Deep Neural Network-Based Backstepping Trajectory Tracking Control for Lagrangian Systems [9.61674297336072]
提案したコントローラは、任意の互換性のあるニューラルネットワークパラメータに対してクローズループ安定性を確保することができる。
モデル近似誤差や外乱の存在下では、閉ループ安定性と追従制御性能が保証されることが示されている。
論文 参考訳(メタデータ) (2024-03-01T09:09:37Z) - Cal-DETR: Calibrated Detection Transformer [67.75361289429013]
本稿では,Deformable-DETR,UP-DETR,DINOのキャリブレーション検出トランス(Cal-DETR)のメカニズムを提案する。
我々は、不確実性を利用してクラスロジットを変調する不確実性誘導ロジット変調機構を開発する。
その結果、Cal-DETRは、ドメイン内およびドメイン外の両方を校正する競合する列車時間法に対して有効であることがわかった。
論文 参考訳(メタデータ) (2023-11-06T22:13:10Z) - Sub-linear Regret in Adaptive Model Predictive Control [56.705978425244496]
本稿では,STT-MPC (Self-Tuning tube-based Model Predictive Control) について述べる。
システム力学を最初に認識したアルゴリズムと比較して,アルゴリズムの後悔を解析する。
論文 参考訳(メタデータ) (2023-10-07T15:07:10Z) - Actor-Critic based Improper Reinforcement Learning [61.430513757337486]
我々は,未知のマルコフ決定プロセスに対して,学習者に100万ドルのベースコントローラを付与する不適切な強化学習環境を考える。
本稿では,(1)ポリシーグラディエントに基づくアプローチ,(2)単純なアクター・クリティカル・スキームとNatural Actor-Criticスキームを切り替えるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-19T05:55:02Z) - Automated Repair of Neural Networks [0.26651200086513094]
安全でないNNの安全仕様を修復するためのフレームワークを提案する。
提案手法では,重み値のいくつかを修正して,新しい安全なNN表現を探索することができる。
我々は,提案するフレームワークが安全なNNを実現する能力を示す広範な実験を行った。
論文 参考訳(メタデータ) (2022-07-17T12:42:24Z) - Generating Probabilistic Safety Guarantees for Neural Network
Controllers [30.34898838361206]
ダイナミクスモデルを使用して、ニューラルネットワークコントローラが安全に動作するために保持する必要がある出力プロパティを決定します。
ニューラルネットワークポリシの近似を効率的に生成するための適応的検証手法を開発した。
本手法は,航空機衝突回避ニューラルネットワークの確率的安全性を保証することができることを示す。
論文 参考訳(メタデータ) (2021-03-01T18:48:21Z) - Control of Stochastic Quantum Dynamics with Differentiable Programming [0.0]
微分可能プログラミングに基づく制御スキームの自動設計のためのフレームワークを提案する。
このアプローチを、ホモジエン検出を受けるクビットの状態準備と安定化に適用する。
その結果、信号と雑音の比が低いにもかかわらず、平均忠実度が約85%の目標状態へのキュービットの準備と安定化をコントローラに教えることができる。
論文 参考訳(メタデータ) (2021-01-04T19:00:03Z) - DAIS: Automatic Channel Pruning via Differentiable Annealing Indicator
Search [55.164053971213576]
畳み込みニューラルネットワークは,計算オーバーヘッドが大きいにもかかわらず,コンピュータビジョンタスクの実行において大きな成功を収めている。
構造的(チャネル)プルーニングは、通常、ネットワーク構造を保ちながらモデルの冗長性を低減するために適用される。
既存の構造化プルーニング法では、手作りのルールが必要であり、これは大きなプルーニング空間に繋がる可能性がある。
論文 参考訳(メタデータ) (2020-11-04T07:43:01Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z) - Controllable Orthogonalization in Training DNNs [96.1365404059924]
直交性はディープニューラルネットワーク(DNN)のトレーニングに広く用いられている。
本稿では,ニュートン反復(ONI)を用いた計算効率が高く,数値的に安定な直交化法を提案する。
本稿では,画像分類ネットワークの性能向上のために,最適化の利点と表現能力の低下との間に最適なトレードオフを与えるために,直交性を効果的に制御する手法を提案する。
また、ONIは、スペクトル正規化と同様に、ネットワークのリプシッツ連続性を維持することにより、GAN(Generative Adversarial Network)のトレーニングを安定化させることを示した。
論文 参考訳(メタデータ) (2020-04-02T10:14:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。