論文の概要: mPOLICE: Provable Enforcement of Multi-Region Affine Constraints in Deep Neural Networks
- arxiv url: http://arxiv.org/abs/2502.02434v2
- Date: Mon, 26 May 2025 16:16:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 14:37:19.154954
- Title: mPOLICE: Provable Enforcement of Multi-Region Affine Constraints in Deep Neural Networks
- Title(参考訳): mPOLICE:ディープニューラルネットワークにおけるマルチリージョンアフィン制約の防止
- Authors: Mohammadmehdi Ataei, Hyunmin Cheong, Adrian Butscher,
- Abstract要約: mPOLICEは、POLICEを一般化し、複数の不随伴凸領域上のアフィン制約を確実に強制する新しいアプローチである。
従来のディープラーニングパイプラインにmPOLICEを組み込んだトレーニングアルゴリズムを導入する。
様々な応用実験を通じてmPOLICEの柔軟性と有効性を検証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep neural networks are increasingly used in safety-critical domains such as robotics and scientific modeling, where strict adherence to output constraints is essential. Methods like POLICE, which are tailored for single convex regions, face challenges when extended to multiple disjoint regions, often leading to constraint violations or unwanted affine behavior across regions. This paper proposes mPOLICE, a new approach that generalizes POLICE to provably enforce affine constraints over multiple disjoint convex regions. At its core, mPOLICE assigns distinct neuron activation patterns to each constrained region, enabling localized affine behavior and avoiding unintended generalization. This is implemented through a layer-wise optimization of the network parameters. Additionally, we introduce a training algorithm that incorporates mPOLICE into conventional deep learning pipelines, balancing task-specific performance with constraint enforcement using periodic sign pattern enforcement. We validate the flexibility and effectiveness of mPOLICE through experiments across various applications, including safety-critical reinforcement learning, implicit 3D shape representation with geometric constraints, and fluid dynamics simulations with boundary condition enforcement. Importantly, mPOLICE incurs no runtime overhead during inference, making it a practical and reliable solution for constraint handling in deep neural networks.
- Abstract(参考訳): 深層ニューラルネットワークは、出力制約への厳密な固執が不可欠であるロボット工学や科学モデリングのような安全クリティカルな領域で、ますます使われている。
単一の凸領域用に調整されたPOLICEのような手法は、複数の非結合領域に拡張された場合の課題に直面し、しばしば制約違反や領域間の不必要なアフィンの振る舞いを引き起こす。
本稿では,POLICEを一般化した新しい手法であるmPOLICEを提案する。
中心となるmPOLICEは、それぞれの制限された領域に異なるニューロン活性化パターンを割り当て、局所的なアフィンの挙動を可能にし、意図しない一般化を避ける。
これはネットワークパラメータを階層的に最適化することで実現される。
さらに,従来のディープラーニングパイプラインにmPOLICEを組み込んだトレーニングアルゴリズムを導入する。
安全クリティカルな強化学習,幾何学的制約による暗黙的な3次元形状表現,境界条件適用による流体力学シミュレーションなど,様々な応用の実験を通じて,mPOLICEの柔軟性と有効性を検証する。
重要なことは、mPOLICEは推論中にランタイムオーバーヘッドを発生しないため、ディープニューラルネットワークにおける制約処理の実用的で信頼性の高いソリューションである。
関連論文リスト
- Reinforcement learning with combinatorial actions for coupled restless bandits [62.89013331120493]
提案するSEQUOIAは,動作空間に対する長期報酬を直接最適化するRLアルゴリズムである。
我々は,複数介入,経路制約,二部間マッチング,容量制約という,制約を伴う4つの新しいレスレス・バンディット問題に対して,SEQUOIAを実証的に検証した。
論文 参考訳(メタデータ) (2025-03-01T21:25:21Z) - Diffusion Predictive Control with Constraints [51.91057765703533]
制約付き拡散予測制御(DPCC)
トレーニングデータから逸脱可能な、明示的な状態と行動制約を持つ拡散制御アルゴリズム。
DPCCは,学習した制御タスクの性能を維持しつつ,新しいテスト時間制約を満たす上で,既存の手法よりも優れるロボットマニピュレータのシミュレーションを通して示す。
論文 参考訳(メタデータ) (2024-12-12T15:10:22Z) - Learning to Explore with Lagrangians for Bandits under Unknown Linear Constraints [8.784438985280094]
線形制約が未知の多腕バンディットにおける純粋探索として問題を研究する。
まず、制約下での純粋な探索のために、サンプルの複雑さを低く抑えたラグランジアン緩和を提案する。
第二に、ラグランジアンの下界と凸の性質を利用して、トラック・アンド・ストップとガミファイド・エクスプローラー(LATSとLAGEX)の2つの計算効率の良い拡張を提案する。
論文 参考訳(メタデータ) (2024-10-24T15:26:14Z) - Robust Stochastically-Descending Unrolled Networks [85.6993263983062]
Deep Unrolling(ディープ・アンローリング)は、トレーニング可能なニューラルネットワークの層に切り捨てられた反復アルゴリズムをアンロールする、新たな学習最適化手法である。
アンロールネットワークの収束保証と一般化性は、いまだにオープンな理論上の問題であることを示す。
提案した制約の下で訓練されたアンロールアーキテクチャを2つの異なるアプリケーションで数値的に評価する。
論文 参考訳(メタデータ) (2023-12-25T18:51:23Z) - Neural Fields with Hard Constraints of Arbitrary Differential Order [61.49418682745144]
我々は、ニューラルネットワークに厳しい制約を課すための一連のアプローチを開発する。
制約は、ニューラルネットワークとそのデリバティブに適用される線形作用素として指定することができる。
私たちのアプローチは、広範囲の現実世界のアプリケーションで実証されています。
論文 参考訳(メタデータ) (2023-06-15T08:33:52Z) - Constrained Empirical Risk Minimization: Theory and Practice [2.4934936799100034]
本稿では,Deep Neural Networks (DNN) などのパラメータ化された関数集合に対する制約の厳格化を可能にするフレームワークを提案する。
我々は、幾何学的深層学習で使用される同変ネットワークの範囲外にある制約に焦点を当てる。
このフレームワークの主な例として、畳み込みニューラルネットワーク(CNN)のフィルタをウェーブレットに制限し、これらのウェーブレットネットワークを医療領域における輪郭予測のタスクに適用する。
論文 参考訳(メタデータ) (2023-02-09T16:11:58Z) - DRIP: Domain Refinement Iteration with Polytopes for Backward
Reachability Analysis of Neural Feedback Loops [12.706980346861986]
本研究では,ニューラルネットワーク(NN)ポリシによって制御されるシステムに対して,衝突回避保証を提供するフレームワークとしての後方到達性について検討する。
NNは典型的には可逆ではないため、既存の手法ではNNを緩和する領域を前提としており、状態の集合を緩やかに過度に近似させる。
本稿では、緩和領域に洗練されたループを持つアルゴリズムDRIPを導入し、BP集合の境界をかなり厳しくする。
論文 参考訳(メタデータ) (2022-12-09T03:06:58Z) - Dealing with Non-Stationarity in Multi-Agent Reinforcement Learning via
Trust Region Decomposition [52.06086375833474]
非定常性は多エージェント強化学習における厄介な問題である。
ポリシーシーケンスの定常性を明示的にモデル化するための$delta$-stationarity測定を導入する。
共同政策の分岐を推定するために,メッセージパッシングに基づく信頼領域分解ネットワークを提案する。
論文 参考訳(メタデータ) (2021-02-21T14:46:50Z) - Local Propagation in Constraint-based Neural Network [77.37829055999238]
ニューラルネットワークアーキテクチャの制約に基づく表現について検討する。
本稿では,いわゆるアーキテクチャ制約を満たすのに適した簡単な最適化手法について検討する。
論文 参考訳(メタデータ) (2020-02-18T16:47:38Z) - Reinforcement Learning for POMDP: Partitioned Rollout and Policy
Iteration with Application to Autonomous Sequential Repair Problems [2.6389022766562236]
有限状態と制御空間を持つ動的プログラミング問題と部分状態観測について考察する。
本稿では,マルチステップのルックアヘッド,既知の基本方針付きロールアウト,端末コスト関数近似を用いたアルゴリズムについて論じる。
論文 参考訳(メタデータ) (2020-02-11T02:38:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。