論文の概要: Acceleration techniques for optimization over trained neural network
ensembles
- arxiv url: http://arxiv.org/abs/2112.07007v1
- Date: Mon, 13 Dec 2021 20:50:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 16:48:48.551920
- Title: Acceleration techniques for optimization over trained neural network
ensembles
- Title(参考訳): ニューラルネットワークアンサンブルの最適化のための高速化技術
- Authors: Keliang Wang, Leonardo Lozano, Carlos Cardonha, David Bergman
- Abstract要約: 本研究では, 線形単位活性化の補正されたフィードフォワードニューラルネットワークを用いて, 目的関数をモデル化する最適化問題について検討する。
本稿では,1つのニューラルネットワークを最適化するために,既存のBig-M$の定式化をベースとした混合整数線形プログラムを提案する。
- 参考スコア(独自算出の注目度): 1.0323063834827415
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study optimization problems where the objective function is modeled
through feedforward neural networks with rectified linear unit (ReLU)
activation. Recent literature has explored the use of a single neural network
to model either uncertain or complex elements within an objective function.
However, it is well known that ensembles of neural networks produce more stable
predictions and have better generalizability than models with single neural
networks, which suggests the application of ensembles of neural networks in a
decision-making pipeline. We study how to incorporate a neural network ensemble
as the objective function of an optimization model and explore computational
approaches for the ensuing problem. We present a mixed-integer linear program
based on existing popular big-$M$ formulations for optimizing over a single
neural network. We develop two acceleration techniques for our model, the first
one is a preprocessing procedure to tighten bounds for critical neurons in the
neural network while the second one is a set of valid inequalities based on
Benders decomposition. Experimental evaluations of our solution methods are
conducted on one global optimization problem and two real-world data sets; the
results suggest that our optimization algorithm outperforms the adaption of an
state-of-the-art approach in terms of computational time and optimality gaps.
- Abstract(参考訳): 本稿では,リニアユニット(ReLU)を活性化したフィードフォワードニューラルネットワークを用いて目的関数をモデル化する最適化問題について検討する。
最近の文献では、目的関数内の不確実または複雑な要素をモデル化する単一のニューラルネットワークの使用を探求している。
しかしながら、ニューラルネットワークのアンサンブルは、単一のニューラルネットワークを持つモデルよりも、より安定した予測とより一般化性をもたらすことが知られており、意思決定パイプラインにおけるニューラルネットワークのアンサンブルの適用が示唆されている。
最適化モデルの目的関数としてニューラルネットワークアンサンブルを組み込む方法について検討し,次の問題に対する計算的アプローチを検討する。
本稿では,ニューラルネットワークの最適化のために,既存の大容量モデルに基づく混合整数線形プログラムを提案する。
本稿では,ニューラルネットワークにおける臨界ニューロンの境界を厳格化するための前処理手法と,Benders分解に基づく有効不等式セットの2つの高速化手法を提案する。
本手法の実験的な評価は,1つの大域的最適化問題と2つの実世界のデータセットを用いて行われ,計算時間と最適性ギャップの点で,最先端のアプローチの適応性を上回ることを示唆する。
関連論文リスト
- Regularized Gauss-Newton for Optimizing Overparameterized Neural Networks [2.0072624123275533]
一般化されたガウスニュートン(GGN)最適化法は、曲率推定を解法に組み込む。
本研究では、2層ニューラルネットワークを明示的な正規化で最適化するGGN法について検討する。
論文 参考訳(メタデータ) (2024-04-23T10:02:22Z) - Graph Neural Networks for Learning Equivariant Representations of Neural Networks [55.04145324152541]
本稿では,ニューラルネットワークをパラメータの計算グラフとして表現することを提案する。
我々のアプローチは、ニューラルネットワークグラフを多種多様なアーキテクチャでエンコードする単一モデルを可能にする。
本稿では,暗黙的ニューラル表現の分類や編集など,幅広いタスクにおける本手法の有効性を示す。
論文 参考訳(メタデータ) (2024-03-18T18:01:01Z) - The Convex Landscape of Neural Networks: Characterizing Global Optima
and Stationary Points via Lasso Models [75.33431791218302]
ディープニューラルネットワーク(DNN)モデルは、プログラミング目的に使用される。
本稿では,凸型神経回復モデルについて検討する。
定常的非次元目的物はすべて,グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。
また, 静止非次元目的物はすべて, グローバルサブサンプリング型凸解法プログラムとして特徴付けられることを示す。
論文 参考訳(メタデータ) (2023-12-19T23:04:56Z) - The limitation of neural nets for approximation and optimization [0.0]
最適化問題における目的関数の近似と最小化のために,ニューラルネットワークを代理モデルとして用いることに関心がある。
本研究は、一般的な非線形最適化テスト問題の目的関数を近似する最適なアクティベーション関数を決定することから始まる。
論文 参考訳(メタデータ) (2023-11-21T00:21:15Z) - Physics Informed Piecewise Linear Neural Networks for Process
Optimization [0.0]
ニューラルネットワークモデルに埋め込まれた最適化問題に対して,物理情報を用いた線形ニューラルネットワークモデルの更新が提案されている。
すべてのケースにおいて、物理インフォームドトレーニングニューラルネットワークに基づく最適結果は、大域的最適性に近い。
論文 参考訳(メタデータ) (2023-02-02T10:14:54Z) - Non-Gradient Manifold Neural Network [79.44066256794187]
ディープニューラルネットワーク(DNN)は通常、勾配降下による最適化に数千のイテレーションを要します。
非次最適化に基づく新しい多様体ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-15T06:39:13Z) - Efficient and Sparse Neural Networks by Pruning Weights in a
Multiobjective Learning Approach [0.0]
本稿では、予測精度とネットワーク複雑性を2つの個別目的関数として扱うことにより、ニューラルネットワークのトレーニングに関する多目的視点を提案する。
模範的畳み込みニューラルネットワークの予備的な数値結果から、ニューラルネットワークの複雑性の大幅な低減と精度の低下が可能であることが確認された。
論文 参考訳(メタデータ) (2020-08-31T13:28:03Z) - Persistent Neurons [4.061135251278187]
本稿では,学習課題を最適化するトラジェクトリベースの戦略を提案する。
永続ニューロンは、決定論的誤差項によって個々の更新が破損する勾配情報バイアスを持つ方法とみなすことができる。
完全かつ部分的なパーシステンスモデルの評価を行い、NN構造における性能向上に有効であることを示す。
論文 参考訳(メタデータ) (2020-07-02T22:36:49Z) - The Hidden Convex Optimization Landscape of Two-Layer ReLU Neural
Networks: an Exact Characterization of the Optimal Solutions [51.60996023961886]
コーン制約のある凸最適化プログラムを解くことにより,グローバルな2層ReLUニューラルネットワークの探索が可能であることを示す。
我々の分析は新しく、全ての最適解を特徴づけ、最近、ニューラルネットワークのトレーニングを凸空間に持ち上げるために使われた双対性に基づく分析を活用できない。
論文 参考訳(メタデータ) (2020-06-10T15:38:30Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z) - Parallelization Techniques for Verifying Neural Networks [52.917845265248744]
検証問題に基づくアルゴリズムを反復的に導入し、2つの分割戦略を探索する。
また、ニューラルネットワークの検証問題を単純化するために、ニューロンアクティベーションフェーズを利用する、高度に並列化可能な前処理アルゴリズムも導入する。
論文 参考訳(メタデータ) (2020-04-17T20:21:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。