Fugu-MT 論文翻訳(概要): Rethinking Architecture Selection in Differentiable NAS

論文の概要: Rethinking Architecture Selection in Differentiable NAS

arxiv url: http://arxiv.org/abs/2108.04392v1
Date: Tue, 10 Aug 2021 00:53:39 GMT
ステータス: 翻訳完了
システム内更新日: 2021-08-12 01:09:28.984867
Title: Rethinking Architecture Selection in Differentiable NAS
Title（参考訳）: 微分可能なNASにおけるアーキテクチャ選択の再考
Authors: Ruochen Wang, Minhao Cheng, Xiangning Chen, Xiaocheng Tang, Cho-Jui Hsieh
Abstract要約: 微分可能なニューラルアーキテクチャ探索は、その探索効率と簡易性において最も人気のあるNAS手法の1つである。本稿では,各操作がスーパーネットに与える影響を直接測定する摂動に基づくアーキテクチャ選択を提案する。提案手法により,DARTSの故障モードを大幅に緩和できることがわかった。
参考スコア（独自算出の注目度）: 74.61723678821049
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Differentiable Neural Architecture Search is one of the most popular Neural Architecture Search (NAS) methods for its search efficiency and simplicity, accomplished by jointly optimizing the model weight and architecture parameters in a weight-sharing supernet via gradient-based algorithms. At the end of the search phase, the operations with the largest architecture parameters will be selected to form the final architecture, with the implicit assumption that the values of architecture parameters reflect the operation strength. While much has been discussed about the supernet's optimization, the architecture selection process has received little attention. We provide empirical and theoretical analysis to show that the magnitude of architecture parameters does not necessarily indicate how much the operation contributes to the supernet's performance. We propose an alternative perturbation-based architecture selection that directly measures each operation's influence on the supernet. We re-evaluate several differentiable NAS methods with the proposed architecture selection and find that it is able to extract significantly improved architectures from the underlying supernets consistently. Furthermore, we find that several failure modes of DARTS can be greatly alleviated with the proposed selection method, indicating that much of the poor generalization observed in DARTS can be attributed to the failure of magnitude-based architecture selection rather than entirely the optimization of its supernet.
Abstract（参考訳）: 微分可能なニューラルアーキテクチャ探索(英: differentiable neural architecture search)は、最も一般的なニューラルアーキテクチャ探索(nas)手法の1つで、モデル重みとアーキテクチャパラメータをグラデーションベースのアルゴリズムによる重み付けスーパーネットで共同で最適化することによって達成される。探索フェーズの最後には、アーキテクチャパラメータの値が演算強度を反映しているという暗黙の仮定で、最大のアーキテクチャパラメータを持つ操作が最終アーキテクチャを形成するために選択される。スーパーネットの最適化について多くの議論がなされているが、アーキテクチャの選択プロセスはほとんど注目されていない。アーキテクチャパラメータの規模が必ずしもその操作がスーパーネットの性能にどの程度貢献するかを示すものではないことを示す実証的および理論的分析を提供する。スーパーネットに対する各操作の影響を直接測定する代替の摂動ベースのアーキテクチャ選択を提案する。提案したアーキテクチャ選択により、いくつかの異なるNAS手法を再評価し、基盤となるスーパーネットから大幅に改良されたアーキテクチャを一貫して抽出できることを見出した。さらに,提案手法では複数のdartの障害モードが大幅に緩和され,dartで観測される貧弱な一般化の多くはスーパーネットの最適化ではなく,マグニチュードベースのアーキテクチャ選択の失敗に起因していることが示唆された。

関連論文リスト

OStr-DARTS: Differentiable Neural Architecture Search based on Operation Strength [70.76342136866413]
分散アーキテクチャサーチ(DARTS)は、効果的なニューラルネットワークサーチの有望な技術として登場した。 DARTSは、アーキテクチャの劣化につながる、よく知られた退化問題に悩まされている。最終損失に対する操作の重要性を推定する操作強度に基づく新しい基準を提案する。
論文参考訳（メタデータ） (2024-09-22T13:16:07Z)
EM-DARTS: Hierarchical Differentiable Architecture Search for Eye Movement Recognition [54.99121380536659]
眼球運動バイオメトリックスは、高い安全性の識別により注目されている。深層学習(DL)モデルは近年,眼球運動認識に成功している。 DLアーキテクチャはまだ人間の事前知識によって決定されている。眼球運動認識のためのDLアーキテクチャを自動設計する階層的微分可能なアーキテクチャ探索アルゴリズムEM-DARTSを提案する。
論文参考訳（メタデータ） (2024-09-22T13:11:08Z)
Efficient Search of Multiple Neural Architectures with Different Complexities via Importance Sampling [3.759936323189417]
本研究では、2つのメトリクスの重み付け和からなる目的関数を最適化するアーキテクチャの複雑性を考慮したワンショットNASに焦点を当てた。提案手法は,CIAFR-10およびImageNetデータセット上の畳み込みニューラルネットワークのアーキテクチャ探索に適用される。
論文参考訳（メタデータ） (2022-07-21T07:06:03Z)
BaLeNAS: Differentiable Architecture Search via the Bayesian Learning Rule [95.56873042777316]
近年,微分可能なアーキテクチャ探索 (DARTS) が注目されている。本稿では,アーキテクチャ重みをガウス分布に緩和することにより,ニューラルネットワーク探索を分布学習問題として定式化する。ベイズ主義の原理から異なるNASがいかに恩恵を受け、探索を強化し、安定性を向上するかを実証する。
論文参考訳（メタデータ） (2021-11-25T18:13:42Z)
iDARTS: Differentiable Architecture Search with Stochastic Implicit Gradients [75.41173109807735]
微分可能なArchiTecture Search(DARTS)は先日,ニューラルアーキテクチャサーチ(NAS)の主流になった。暗黙の関数定理に基づいてDARTSの過次計算に取り組む。提案手法であるiDARTSのアーキテクチャ最適化は,定常点に収束することが期待される。
論文参考訳（メタデータ） (2021-06-21T00:44:11Z)
Smooth Variational Graph Embeddings for Efficient Neural Architecture Search [41.62970837629573]
本研究では,探索空間からニューラルネットワークをスムーズにエンコードし,正確に再構築できる2面変分グラフオートエンコーダを提案する。 ENASアプローチ,NAS-Bench-101およびNAS-Bench-201探索空間で定義されたニューラルネットワークに対する提案手法の評価を行った。
論文参考訳（メタデータ） (2020-10-09T17:05:41Z)
Adversarially Robust Neural Architectures [43.74185132684662]
本稿では,NASフレームワークを用いたアーキテクチャの観点から,ネットワークの対角的ロバスト性を改善することを目的とする。本稿では, 対向ロバスト性, リプシッツ定数, アーキテクチャパラメータの関係について検討する。提案アルゴリズムは,異なるデータセットに対する様々な攻撃の下で,すべてのモデルの中で最高の性能を実証的に達成する。
論文参考訳（メタデータ） (2020-09-02T08:52:15Z)
Off-Policy Reinforcement Learning for Efficient and Effective GAN Architecture Search [50.40004966087121]
本稿では,GANアーキテクチャ探索のための強化学習に基づくニューラルアーキテクチャ探索手法を提案する。鍵となる考え方は、よりスムーズなアーキテクチャサンプリングのためのマルコフ決定プロセス(MDP)として、GANアーキテクチャ探索問題を定式化することである。我々は,従来の政策によって生成されたサンプルを効率的に活用する,非政治的なGANアーキテクチャ探索アルゴリズムを利用する。
論文参考訳（メタデータ） (2020-07-17T18:29:17Z)
Stage-Wise Neural Architecture Search [65.03109178056937]
ResNetやNASNetのような現代の畳み込みネットワークは、多くのコンピュータビジョンアプリケーションで最先端の結果を得た。これらのネットワークは、同じ解像度で表現を操作するレイヤのセットであるステージで構成されている。各ステージにおけるレイヤー数の増加はネットワークの予測能力を向上させることが示されている。しかし、結果として得られるアーキテクチャは、浮動小数点演算、メモリ要求、推論時間の観点から計算的に高価になる。
論文参考訳（メタデータ） (2020-04-23T14:16:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。