論文の概要: A Combinatorial Perspective on the Optimization of Shallow ReLU Networks
- arxiv url: http://arxiv.org/abs/2210.00176v1
- Date: Sat, 1 Oct 2022 03:09:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 16:08:29.183325
- Title: A Combinatorial Perspective on the Optimization of Shallow ReLU Networks
- Title(参考訳): 浅部ReLUネットワークの最適化に関する総合的展望
- Authors: Michael Matena, Colin Raffel
- Abstract要約: 浅いReLUネットワークを最適化するNPハード問題は、各トレーニング例のアクティベーションパターンの探索として特徴付けられる。
ゾノトープを用いて自然にモデル化できることを示し、その集合は実現可能な活性化パターンの集合であることを示す。
- 参考スコア(独自算出の注目度): 35.329916555349214
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The NP-hard problem of optimizing a shallow ReLU network can be characterized
as a combinatorial search over each training example's activation pattern
followed by a constrained convex problem given a fixed set of activation
patterns. We explore the implications of this combinatorial aspect of ReLU
optimization in this work. We show that it can be naturally modeled via a
geometric and combinatoric object known as a zonotope with its vertex set
isomorphic to the set of feasible activation patterns. This assists in analysis
and provides a foundation for further research. We demonstrate its usefulness
when we explore the sensitivity of the optimal loss to perturbations of the
training data. Later we discuss methods of zonotope vertex selection and its
relevance to optimization. Overparameterization assists in training by making a
randomly chosen vertex more likely to contain a good solution. We then
introduce a novel polynomial-time vertex selection procedure that provably
picks a vertex containing the global optimum using only double the minimum
number of parameters required to fit the data. We further introduce a local
greedy search heuristic over zonotope vertices and demonstrate that it
outperforms gradient descent on underparameterized problems.
- Abstract(参考訳): 浅いreluネットワークを最適化するnp-hard問題は、各トレーニングサンプルのアクティベーションパターンに対する組合せ探索と、一定の一連のアクティベーションパターンが与えられた制約付き凸問題とを特徴付けることができる。
本稿では,ReLU最適化におけるこの組合せ的側面の意義について考察する。
本稿では,その頂点集合が実現可能な活性化パターンの集合に同型なゾノトペとして知られる幾何学的および組合せ的対象を通して自然にモデル化できることを示す。
これは分析を支援し、さらなる研究の基盤を提供する。
トレーニングデータの摂動に対する最適損失の感度を検討する際に,その有用性を示す。
その後,zonotope 頂点選択法とその最適化への応用について考察する。
過剰パラメータ化は、ランダムに選択された頂点が良い解をより多く含むようにすることで、トレーニングを支援する。
次に,データに適合する最小パラメータの2倍だけを用いて,大域的最適化を含む頂点を確実に選択する多項式時間頂点選択手順を提案する。
さらに,zonotope頂点上での局所的グリーディ探索ヒューリスティックを導入し,低パラメータ問題に対する勾配降下よりも優れることを示す。
関連論文リスト
- Optimizing Solution-Samplers for Combinatorial Problems: The Landscape
of Policy-Gradient Methods [52.0617030129699]
本稿では,DeepMatching NetworksとReinforcement Learningメソッドの有効性を解析するための新しい理論フレームワークを提案する。
我々の主な貢献は、Max- and Min-Cut、Max-$k$-Bipartite-Bi、Maximum-Weight-Bipartite-Bi、Traveing Salesman Problemを含む幅広い問題である。
本分析の副産物として,バニラ降下による新たな正則化プロセスを導入し,失効する段階的な問題に対処し,悪い静止点から逃れる上で有効であることを示す理論的および実験的証拠を提供する。
論文 参考訳(メタデータ) (2023-10-08T23:39:38Z) - Sample Complexity for Quadratic Bandits: Hessian Dependent Bounds and
Optimal Algorithms [64.10576998630981]
最適なヘッセン依存型サンプルの複雑さを, 初めて厳密に評価した。
ヘシアン非依存のアルゴリズムは、すべてのヘシアンインスタンスに対して最適なサンプル複雑さを普遍的に達成する。
本アルゴリズムにより得られたサンプルの最適複雑さは,重み付き雑音分布においても有効である。
論文 参考訳(メタデータ) (2023-06-21T17:03:22Z) - Sparse Quadratic Optimisation over the Stiefel Manifold with Application
to Permutation Synchronisation [71.27989298860481]
二次目的関数を最大化するスティーフェル多様体上の行列を求める非最適化問題に対処する。
そこで本研究では,支配的固有空間行列を求めるための,単純かつ効果的なスパーシティプロモーティングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-30T19:17:35Z) - Implicit differentiation for fast hyperparameter selection in non-smooth
convex learning [87.60600646105696]
内部最適化問題が凸であるが非滑らかである場合の一階法を研究する。
本研究では, ヤコビアンの近位勾配降下と近位座標降下収率列の前方モード微分が, 正確なヤコビアンに向かって収束していることを示す。
論文 参考訳(メタデータ) (2021-05-04T17:31:28Z) - A Feasible Level Proximal Point Method for Nonconvex Sparse Constrained
Optimization [25.73397307080647]
本稿では,汎用凸あるいは非汎用機械目標の新しいモデルを提案する。
本稿では,各サブプロブレムの点レベルを徐々に緩和した制約を解くアルゴリズムを提案する。
我々は,新しい数値スケール問題の有効性を実証する。
論文 参考訳(メタデータ) (2020-10-23T05:24:05Z) - Evolutionary Algorithm and Multifactorial Evolutionary Algorithm on
Clustered Shortest-Path Tree problem [2.578242050187029]
CluSPT(Clustered Shortest-Path Tree Problem)はNPハード問題である。
探索処理の性能を向上させるために,2つの手法を提案する。
論文 参考訳(メタデータ) (2020-10-19T08:37:18Z) - Adaptive Sampling of Pareto Frontiers with Binary Constraints Using
Regression and Classification [0.0]
本稿では,二項制約を持つブラックボックス多目的最適化問題に対する適応最適化アルゴリズムを提案する。
本手法は確率的回帰モデルと分類モデルに基づいており,最適化目標のサロゲートとして機能する。
また,予想される超体積計算を高速化するために,新しい楕円形トランケーション法を提案する。
論文 参考訳(メタデータ) (2020-08-27T09:15:02Z) - The Hidden Convex Optimization Landscape of Two-Layer ReLU Neural
Networks: an Exact Characterization of the Optimal Solutions [51.60996023961886]
コーン制約のある凸最適化プログラムを解くことにより,グローバルな2層ReLUニューラルネットワークの探索が可能であることを示す。
我々の分析は新しく、全ての最適解を特徴づけ、最近、ニューラルネットワークのトレーニングを凸空間に持ち上げるために使われた双対性に基づく分析を活用できない。
論文 参考訳(メタデータ) (2020-06-10T15:38:30Z) - Convex Geometry and Duality of Over-parameterized Neural Networks [70.15611146583068]
有限幅2層ReLUネットワークの解析のための凸解析手法を開発した。
正規化学習問題に対する最適解が凸集合の極点として特徴づけられることを示す。
高次元では、トレーニング問題は無限に多くの制約を持つ有限次元凸問題としてキャストできることが示される。
論文 参考訳(メタデータ) (2020-02-25T23:05:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。