論文の概要: Deep Binary Reinforcement Learning for Scalable Verification
- arxiv url: http://arxiv.org/abs/2203.05704v1
- Date: Fri, 11 Mar 2022 01:20:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-14 12:26:55.945451
- Title: Deep Binary Reinforcement Learning for Scalable Verification
- Title(参考訳): スケーラブルな検証のためのディープバイナリ強化学習
- Authors: Christopher Lazarus and Mykel J. Kochenderfer
- Abstract要約: バイナライズニューラルネットワーク(BNN)に特化したRLアルゴリズムを提案する。
Atari環境でBNNを訓練した後、ロバスト性特性を検証する。
- 参考スコア(独自算出の注目度): 44.44006029119672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The use of neural networks as function approximators has enabled many
advances in reinforcement learning (RL). The generalization power of neural
networks combined with advances in RL algorithms has reignited the field of
artificial intelligence. Despite their power, neural networks are considered
black boxes, and their use in safety-critical settings remains a challenge.
Recently, neural network verification has emerged as a way to certify safety
properties of networks. Verification is a hard problem, and it is difficult to
scale to large networks such as the ones used in deep reinforcement learning.
We provide an approach to train RL policies that are more easily verifiable. We
use binarized neural networks (BNNs), a type of network with mostly binary
parameters. We present an RL algorithm tailored specifically for BNNs. After
training BNNs for the Atari environments, we verify robustness properties.
- Abstract(参考訳): 関数近似器としてのニューラルネットワークの利用は、強化学習(RL)の多くの進歩を可能にした。
ニューラルネットワークの一般化力とRLアルゴリズムの進歩は、人工知能の分野を再燃させた。
そのパワーにもかかわらず、ニューラルネットワークはブラックボックスと見なされ、安全クリティカルな設定での使用は依然として課題である。
近年,ネットワークの安全性を認証する手段として,ニューラルネットワーク検証が登場している。
検証は難しい問題であり、深層強化学習で使用されるような大規模ネットワークに拡張することは困難である。
より容易に検証可能なRLポリシーをトレーニングするためのアプローチを提供する。
主にバイナリパラメータを持つネットワークの一種であるバイナライズニューラルネットワーク(BNN)を使用している。
本稿では,BNNに特化したRLアルゴリズムを提案する。
Atari環境でBNNを訓練した後、ロバスト性特性を検証する。
関連論文リスト
- Fully Spiking Actor Network with Intra-layer Connections for
Reinforcement Learning [51.386945803485084]
エージェントが制御する多次元決定論的ポリシーを学習する必要があるタスクに焦点をあてる。
既存のスパイクベースのRL法は、SNNの出力として発火率を取り、完全に接続された層を通して連続的なアクション空間(つまり決定論的なポリシー)を表すように変換する。
浮動小数点行列操作を伴わない完全にスパイクするアクターネットワークを開発するため,昆虫に見られる非スパイク介在ニューロンからインスピレーションを得た。
論文 参考訳(メタデータ) (2024-01-09T07:31:34Z) - Adversarial Training Using Feedback Loops [1.6114012813668932]
ディープニューラルネットワーク(DNN)は、一般化性に制限があるため、敵の攻撃に非常に敏感である。
本稿では制御理論に基づく新しいロバスト化手法を提案する。
フィードバック制御アーキテクチャに基づく新しい逆行訓練アプローチは、フィードバックループ逆行訓練(FLAT)と呼ばれる。
論文 参考訳(メタデータ) (2023-08-23T02:58:02Z) - Uncertainty Quantification and Resource-Demanding Computer Vision
Applications of Deep Learning [5.130440339897478]
ディープニューラルネットワーク(DNN)を安全クリティカルなアプリケーションに導入するには、モデルの不確実性を徹底的に扱う必要がある。
本稿では、新しいオブジェクトクラスに遭遇したとき、DNNに不確実性を示す方法について調査する。
また、不確実性定量化の助けを借りて、少数のラベルから学習する訓練方法を提案する。
論文 参考訳(メタデータ) (2022-05-30T08:31:03Z) - HyBNN and FedHyBNN: (Federated) Hybrid Binary Neural Networks [0.0]
新しいハイブリッドニューラルネットワークアーキテクチャHybrid Binary Neural Network (Hybrid Binary Neural Network, HyBNN)を導入する。
HyBNNは、タスク非依存、一般、完全精度の変動型オートエンコーダと、タスク固有のバイナリニューラルネットワークで構成されている。
提案システムは,入力バイナライゼーションにより,バニラバイナリニューラルネットワークを著しく上回る性能を有することを示す。
論文 参考訳(メタデータ) (2022-05-19T20:27:01Z) - Deep Reinforcement Learning with Spiking Q-learning [51.386945803485084]
スパイクニューラルネットワーク(SNN)は、少ないエネルギー消費で人工知能(AI)を実現することが期待されている。
SNNと深部強化学習(RL)を組み合わせることで、現実的な制御タスクに有望なエネルギー効率の方法を提供する。
論文 参考訳(メタデータ) (2022-01-21T16:42:11Z) - Provable Regret Bounds for Deep Online Learning and Control [77.77295247296041]
我々は、損失関数がニューラルネットワークのパラメータを最適化するために適応できることを示し、後から最も優れたネットと競合することを示す。
オンライン設定におけるこれらの結果の適用として、オンライン制御コントローラの証明可能なバウンダリを得る。
論文 参考訳(メタデータ) (2021-10-15T02:13:48Z) - Mining the Weights Knowledge for Optimizing Neural Network Structures [1.995792341399967]
タスク固有のニューラルネットワーク(略してTNN)の重みを入力として使用するスイッチャーニューラルネットワーク(SNN)を導入する。
重みに含まれる知識をマイニングすることで、SNNはTNNのニューロンをオフにするスケーリング因子を出力する。
精度の面では,ベースラインネットワークやその他の構造学習手法を安定的に,かつ著しく上回っている。
論文 参考訳(メタデータ) (2021-10-11T05:20:56Z) - Building Compact and Robust Deep Neural Networks with Toeplitz Matrices [93.05076144491146]
この論文は、コンパクトで、訓練が容易で、信頼性があり、敵の例に対して堅牢なニューラルネットワークを訓練する問題に焦点を当てている。
Toeplitzファミリーの構造化行列の特性を利用して、コンパクトでセキュアなニューラルネットワークを構築する。
論文 参考訳(メタデータ) (2021-09-02T13:58:12Z) - Progressive Tandem Learning for Pattern Recognition with Deep Spiking
Neural Networks [80.15411508088522]
スパイキングニューラルネットワーク(SNN)は、低レイテンシと高い計算効率のために、従来の人工知能ニューラルネットワーク(ANN)よりも優位性を示している。
高速かつ効率的なパターン認識のための新しいANN-to-SNN変換およびレイヤワイズ学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-02T15:38:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。