論文の概要: mPOLICE: Provable Enforcement of Multi-Region Affine Constraints in Deep Neural Networks
- arxiv url: http://arxiv.org/abs/2502.02434v1
- Date: Tue, 04 Feb 2025 15:58:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:57:32.451061
- Title: mPOLICE: Provable Enforcement of Multi-Region Affine Constraints in Deep Neural Networks
- Title(参考訳): mPOLICE:ディープニューラルネットワークにおけるマルチリージョンアフィン制約の防止
- Authors: Mohammadmehdi Ataei, Hyunmin Cheong, Adrian Butscher,
- Abstract要約: 深層ニューラルネットワークは、気候モデリング、ロボット工学、産業制御など、厳しい出力制約を守らなければならない分野にますます採用されている。
本稿では,各領域に異なるパターンを割り当てるmPOLICEについて述べる。
重みと偏りの両方が各領域に固有のアクティベーションパターンを割り当て、矛盾なく制約が満たされることを保証するレイヤワイズ問題を定式化する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Deep neural networks are increasingly employed in fields such as climate modeling, robotics, and industrial control, where strict output constraints must be upheld. Although prior methods like the POLICE algorithm can enforce affine constraints in a single convex region by adjusting network parameters, they struggle with multiple disjoint regions, often leading to conflicts or unintended affine extensions. We present mPOLICE, a new method that extends POLICE to handle constraints imposed on multiple regions. mPOLICE assigns a distinct activation pattern to each constrained region, preserving exact affine behavior locally while avoiding overreach into other parts of the input domain. We formulate a layer-wise optimization problem that adjusts both the weights and biases to assign unique activation patterns to each convex region, ensuring that constraints are met without conflicts, while maintaining the continuity and smoothness of the learned function. Our experiments show the enforcement of multi-region constraints for multiple scenarios, including regression and classification, function approximation, and non-convex regions through approximation. Notably, mPOLICE adds zero inference overhead and minimal training overhead.
- Abstract(参考訳): 深層ニューラルネットワークは、気候モデリング、ロボット工学、産業制御などの分野でますます採用されており、厳しい出力制約を守らなければならない。
POLICEアルゴリズムのような従来の手法では、ネットワークパラメータを調整することで単一凸領域のアフィン制約を強制できるが、複数の非結合領域と競合し、しばしば競合や意図しないアフィン拡張につながる。
我々は,複数のリージョンに課される制約に対処するために,POLICEを拡張した新しい手法であるmPOLICEを提案する。
mPOLICEは、各制約された領域に異なるアクティベーションパターンを割り当て、入力ドメインの他の部分へのオーバーリーチを回避しながら、正確なアフィン動作をローカルに保存する。
本稿では,各凸領域に一意なアクティベーションパターンを割り当てる重みとバイアスを調整し,学習関数の連続性と滑らかさを維持しつつ,矛盾なく制約が満たされることを保証するレイヤワイズ最適化問題を定式化する。
本実験は, 回帰と分類, 関数近似, および非凸領域を含む複数のシナリオに対する多重領域制約の適用性を示す。
特に、mPOLICEは推論オーバーヘッドをゼロにし、トレーニングオーバーヘッドを最小にする。
関連論文リスト
- Diffusion Predictive Control with Constraints [51.91057765703533]
制約付き拡散予測制御(DPCC)
トレーニングデータから逸脱可能な、明示的な状態と行動制約を持つ拡散制御アルゴリズム。
DPCCは,学習した制御タスクの性能を維持しつつ,新しいテスト時間制約を満たす上で,既存の手法よりも優れるロボットマニピュレータのシミュレーションを通して示す。
論文 参考訳(メタデータ) (2024-12-12T15:10:22Z) - Learning to Explore with Lagrangians for Bandits under Unknown Linear Constraints [8.784438985280094]
線形制約が未知の多腕バンディットにおける純粋探索として問題を研究する。
まず、制約下での純粋な探索のために、サンプルの複雑さを低く抑えたラグランジアン緩和を提案する。
第二に、ラグランジアンの下界と凸の性質を利用して、トラック・アンド・ストップとガミファイド・エクスプローラー(LATSとLAGEX)の2つの計算効率の良い拡張を提案する。
論文 参考訳(メタデータ) (2024-10-24T15:26:14Z) - Robust Stochastically-Descending Unrolled Networks [85.6993263983062]
Deep Unrolling(ディープ・アンローリング)は、トレーニング可能なニューラルネットワークの層に切り捨てられた反復アルゴリズムをアンロールする、新たな学習最適化手法である。
アンロールネットワークの収束保証と一般化性は、いまだにオープンな理論上の問題であることを示す。
提案した制約の下で訓練されたアンロールアーキテクチャを2つの異なるアプリケーションで数値的に評価する。
論文 参考訳(メタデータ) (2023-12-25T18:51:23Z) - Neural Fields with Hard Constraints of Arbitrary Differential Order [61.49418682745144]
我々は、ニューラルネットワークに厳しい制約を課すための一連のアプローチを開発する。
制約は、ニューラルネットワークとそのデリバティブに適用される線形作用素として指定することができる。
私たちのアプローチは、広範囲の現実世界のアプリケーションで実証されています。
論文 参考訳(メタデータ) (2023-06-15T08:33:52Z) - Constrained Empirical Risk Minimization: Theory and Practice [2.4934936799100034]
本稿では,Deep Neural Networks (DNN) などのパラメータ化された関数集合に対する制約の厳格化を可能にするフレームワークを提案する。
我々は、幾何学的深層学習で使用される同変ネットワークの範囲外にある制約に焦点を当てる。
このフレームワークの主な例として、畳み込みニューラルネットワーク(CNN)のフィルタをウェーブレットに制限し、これらのウェーブレットネットワークを医療領域における輪郭予測のタスクに適用する。
論文 参考訳(メタデータ) (2023-02-09T16:11:58Z) - DRIP: Domain Refinement Iteration with Polytopes for Backward
Reachability Analysis of Neural Feedback Loops [12.706980346861986]
本研究では,ニューラルネットワーク(NN)ポリシによって制御されるシステムに対して,衝突回避保証を提供するフレームワークとしての後方到達性について検討する。
NNは典型的には可逆ではないため、既存の手法ではNNを緩和する領域を前提としており、状態の集合を緩やかに過度に近似させる。
本稿では、緩和領域に洗練されたループを持つアルゴリズムDRIPを導入し、BP集合の境界をかなり厳しくする。
論文 参考訳(メタデータ) (2022-12-09T03:06:58Z) - Shortest-Path Constrained Reinforcement Learning for Sparse Reward Tasks [59.419152768018506]
最適ポリシーは必ずk-SP制約を満たすことを示す。
本研究では,SP制約に違反するポリシーを完全に排除する代わりに,新たなコスト関数を提案する。
また,MiniGrid,DeepMind Lab,Atari,Fetchを用いた実験の結果,提案手法はPPOを著しく改善することが示された。
論文 参考訳(メタデータ) (2021-07-13T21:39:21Z) - Dealing with Non-Stationarity in Multi-Agent Reinforcement Learning via
Trust Region Decomposition [52.06086375833474]
非定常性は多エージェント強化学習における厄介な問題である。
ポリシーシーケンスの定常性を明示的にモデル化するための$delta$-stationarity測定を導入する。
共同政策の分岐を推定するために,メッセージパッシングに基づく信頼領域分解ネットワークを提案する。
論文 参考訳(メタデータ) (2021-02-21T14:46:50Z) - Local Propagation in Constraint-based Neural Network [77.37829055999238]
ニューラルネットワークアーキテクチャの制約に基づく表現について検討する。
本稿では,いわゆるアーキテクチャ制約を満たすのに適した簡単な最適化手法について検討する。
論文 参考訳(メタデータ) (2020-02-18T16:47:38Z) - Reinforcement Learning for POMDP: Partitioned Rollout and Policy
Iteration with Application to Autonomous Sequential Repair Problems [2.6389022766562236]
有限状態と制御空間を持つ動的プログラミング問題と部分状態観測について考察する。
本稿では,マルチステップのルックアヘッド,既知の基本方針付きロールアウト,端末コスト関数近似を用いたアルゴリズムについて論じる。
論文 参考訳(メタデータ) (2020-02-11T02:38:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。