Fugu-MT 論文翻訳(概要): Neural Architecture Search: Two Constant Shared Weights Initialisations

論文の概要: Neural Architecture Search: Two Constant Shared Weights Initialisations

arxiv url: http://arxiv.org/abs/2302.04406v3
Date: Tue, 08 Apr 2025 07:57:20 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-18 06:16:40.266108
Title: Neural Architecture Search: Two Constant Shared Weights Initialisations
Title（参考訳）: Neural Architecture Search: 2つの定数共有ウェイトの初期化
Authors: Ekaterina Gracheva,
Abstract要約: エプシナス(Epsinas)は、2つの一定の共有重み付け初期化とそれらの出力統計を用いてアーキテクチャポテンシャルを評価する新しいゼロコストNAS計量である。平均等級で正規化された原出力の分散は、訓練された精度と強く相関していることを示す。我々の計算では、データラベルは必要とせず、単一のミニバッチで動作し、勾配の必要がなくなる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In the last decade, zero-cost metrics have gained prominence in neural architecture search (NAS) due to their ability to evaluate architectures without training. These metrics are significantly faster and less computationally expensive than traditional NAS methods and provide insights into neural architectures' internal workings. This paper introduces epsinas, a novel zero-cost NAS metric that assesses architecture potential using two constant shared weight initialisations and the statistics of their outputs. We show that the dispersion of raw outputs, normalised by their average magnitude, strongly correlates with trained accuracy. This effect holds across image classification and language tasks on NAS-Bench-101, NAS-Bench-201, and NAS-Bench-NLP. Our method requires no data labels, operates on a single minibatch, and eliminates the need for gradient computation, making it independent of training hyperparameters, loss metrics, and human annotations. It evaluates a network in a fraction of a GPU second and integrates seamlessly into existing NAS frameworks. The code supporting this study can be found on GitHub at https://github.com/egracheva/epsinas.
Abstract（参考訳）: 過去10年間で、ゼロコストメトリクスは、トレーニングなしでアーキテクチャを評価する能力のために、ニューラルアーキテクチャサーチ(NAS)で注目されている。これらのメトリクスは従来のNAS手法よりも大幅に高速で計算コストが低く、ニューラルアーキテクチャの内部動作に関する洞察を提供する。本稿では、2つの定数共有重み初期化とそれらの出力統計を用いてアーキテクチャポテンシャルを評価する新しいゼロコストNAS指標であるエプシナスを紹介する。平均等級で正規化された原出力の分散は、訓練された精度と強く相関していることを示す。この効果はNAS-Bench-101、NAS-Bench-201、NAS-Bench-NLP上の画像分類や言語タスクにまたがる。提案手法では,データラベルを必要とせず,単一のミニバッチ上で動作し,勾配計算の必要性を排除し,ハイパーパラメータや損失メトリクス,人間のアノテーションのトレーニングに依存しない。ネットワークをGPUのほんの数秒で評価し、既存のNASフレームワークとシームレスに統合する。この研究をサポートするコードはGitHubのhttps://github.com/egracheva/epsinas.comにある。

関連論文リスト

Training-free Neural Architecture Search through Variance of Knowledge of Deep Network Weights [0.0]
本稿では,フィッシャー情報に基づく画像分類精度のトレーニングフリープロキシを提案する。提案するプロキシは,3つの公開データセットと2つの検索空間において,最先端の結果を達成する。
論文参考訳（メタデータ） (2025-02-07T14:48:28Z)
Delta-NAS: Difference of Architecture Encoding for Predictor-based Evolutionary Neural Architecture Search [5.1331676121360985]
我々は,NASの微粒化を低コストで行うアルゴリズムを構築した。類似ネットワークの精度の差を予測することにより,問題を低次元空間に投影することを提案する。
論文参考訳（メタデータ） (2024-11-21T02:43:32Z)
Graph is all you need? Lightweight data-agnostic neural architecture search without training [45.79667238486864]
ニューラルアーキテクチャサーチ(NAS)は、ニューラルネットワークモデルの自動設計を可能にする。我々の手法はnasgraphと呼ばれ、ニューラルネットワークをグラフに変換することによって計算コストを大幅に削減する。 NAS-Bench201からランダムにサンプリングされた200のアーキテクチャの中で、最高のアーキテクチャを217CPU秒で見つけることができる。
論文参考訳（メタデータ） (2024-05-02T14:12:58Z)
FR-NAS: Forward-and-Reverse Graph Predictor for Efficient Neural Architecture Search [10.699485270006601]
ニューラルネットワーク探索のための新しいグラフニューラルネットワーク(GNN)予測器を提案する。この予測器は、従来のグラフビューと逆グラフビューを組み合わせることで、ニューラルネットワークをベクトル表現に変換する。実験の結果, 予測精度は3%～16%向上し, 予測精度は有意に向上した。
論文参考訳（メタデータ） (2024-04-24T03:22:49Z)
DNA Family: Boosting Weight-Sharing NAS with Block-Wise Supervisions [121.05720140641189]
蒸留型ニューラルアーキテクチャ(DNA)技術を用いたモデル群を開発した。提案するDNAモデルでは,アルゴリズムを用いてサブサーチ空間にのみアクセス可能な従来の手法とは対照的に,すべてのアーキテクチャ候補を評価できる。当社のモデルでは,モバイルコンボリューションネットワークと小型ビジョントランスフォーマーにおいて,ImageNet上で78.9%,83.6%の最先端トップ1精度を実現している。
論文参考訳（メタデータ） (2024-03-02T22:16:47Z)
Efficacy of Neural Prediction-Based Zero-Shot NAS [0.04096453902709291]
ディープラーニングを用いたゼロショットニューラルアーキテクチャ探索(NAS)の新しい手法を提案する。提案手法では,畳み込みカーネルを符号化した罪のフーリエ和を用いて,評価対象のアーキテクチャに類似した構造を持つ計算フィードフォワードグラフの構築を可能にする。実験の結果,NAS-Bench-201データセットの相関関係から,グラフ畳み込みネットワークを用いた従来の手法よりも高い収束率を示すことがわかった。
論文参考訳（メタデータ） (2023-08-31T14:54:06Z)
DCP-NAS: Discrepant Child-Parent Neural Architecture Search for 1-bit CNNs [53.82853297675979]
バイナリ重みとアクティベーションを備えた1ビット畳み込みニューラルネットワーク(CNN)は、リソース制限された組み込みデバイスの可能性を示している。自然なアプローチの1つは、NASの計算とメモリコストを削減するために1ビットCNNを使用することである。本稿では,1ビットCNNを効率的に探索するためにDCP-NAS(Disrepant Child-Parent Neural Architecture Search)を提案する。
論文参考訳（メタデータ） (2023-06-27T11:28:29Z)
NASiam: Efficient Representation Learning using Neural Architecture Search for Siamese Networks [76.8112416450677]
シームズネットワークは、自己教師付き視覚表現学習(SSL)を実現するための最も傾向のある方法の1つである。 NASiamは、初めて微分可能なNASを使用して、多層パーセプトロンプロジェクタと予測器(エンコーダ/予測器ペア)を改善する新しいアプローチである。 NASiamは、小規模(CIFAR-10/CIFAR-100)と大規模(画像Net)画像分類データセットの両方で競合性能を達成し、わずか数GPU時間しかかからない。
論文参考訳（メタデータ） (2023-01-31T19:48:37Z)
Generalization Properties of NAS under Activation and Skip Connection Search [66.8386847112332]
ニューラルネットワーク探索(NAS)の一般化特性を統一的枠組みの下で検討する。我々は, 有限幅政権下でのニューラル・タンジェント・カーネル(NTK)の最小固有値の下(および上)境界を導出する。トレーニングなしでもNASがトップパフォーマンスアーキテクチャを選択する方法を示す。
論文参考訳（メタデータ） (2022-09-15T12:11:41Z)
Pi-NAS: Improving Neural Architecture Search by Reducing Supernet Training Consistency Shift [128.32670289503025]
最近提案されたニューラルアーキテクチャサーチ (NAS) 手法は,スーパーネット上で数十億のアーキテクチャを共存させ,その潜在的な精度を推定する。アーキテクチャの予測精度と実際の能力のランキング相関は誤りであり、既存のNAS手法のジレンマを引き起こす。このランク付け相関問題は,特徴シフトやパラメータシフトを含む,スーパーネットトレーニングの整合性シフトに起因している。この2つのシフトを、Pi-NASと呼ばれる非自明なスーパーネットPiモデルを用いて同時に解決する。
論文参考訳（メタデータ） (2021-08-22T09:08:48Z)
Neural Architecture Search on ImageNet in Four GPU Hours: A Theoretically Inspired Perspective [88.39981851247727]
トレーニングフリーニューラルアーキテクチャサーチ(TE-NAS)という新しいフレームワークを提案する。 TE-NASは、ニューラルネットワークカーネル(NTK)のスペクトルと入力空間内の線形領域の数を分析することによってアーキテクチャをランク付けする。 1) この2つの測定はニューラルネットワークのトレーサビリティと表現性を示し, (2) ネットワークのテスト精度と強く相関することを示した。
論文参考訳（メタデータ） (2021-02-23T07:50:44Z)
Weak NAS Predictors Are All You Need [91.11570424233709]
最近の予測器ベースのnasアプローチは、アーキテクチャとパフォーマンスのペアをサンプリングし、プロキシの精度を予測するという2つの重要なステップで問題を解決しようとする。私たちはこのパラダイムを、アーキテクチャ空間全体をカバーする複雑な予測子から、ハイパフォーマンスなサブスペースへと徐々に進む弱い予測子へとシフトさせます。 NAS-Bench-101 および NAS-Bench-201 で最高の性能のアーキテクチャを見つけるためのサンプルを少なくし、NASNet 検索空間における最先端の ImageNet パフォーマンスを実現します。
論文参考訳（メタデータ） (2021-02-21T01:58:43Z)
Learning N:M Fine-grained Structured Sparse Neural Networks From Scratch [75.69506249886622]
ディープニューラルネットワーク(DNN)におけるスパーシティは、資源制約された環境でモデルを圧縮し、加速するために広く研究されている。本稿では,N:M細粒構造スパースネットワークのスクラッチからトレーニングを初めて行う。
論文参考訳（メタデータ） (2021-02-08T05:55:47Z)
Direct Federated Neural Architecture Search [0.0]
本稿では,ハードウェアに依存せず,計算的に軽量な直接フェデレーションNASと,準備の整ったニューラルネットワークモデルを探すためのワンステージ手法を提案する。以上の結果から, 従来技術の精度向上を図りながら, 資源消費の大幅な削減を図った。
論文参考訳（メタデータ） (2020-10-13T08:11:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。