Fugu-MT 論文翻訳(概要): Differentiable Architecture Pruning for Transfer Learning

論文の概要: Differentiable Architecture Pruning for Transfer Learning

arxiv url: http://arxiv.org/abs/2107.03375v1
Date: Wed, 7 Jul 2021 17:44:59 GMT
ステータス: 翻訳完了
システム内更新日: 2021-07-08 14:17:04.602131
Title: Differentiable Architecture Pruning for Transfer Learning
Title（参考訳）: 転送学習のための微分可能アーキテクチャpruning
Authors: Nicolo Colombo and Yang Gao
Abstract要約: 本研究では,与えられた大規模モデルからサブアーキテクチャを抽出するための勾配に基づくアプローチを提案する。我々のアーキテクチャ・プルーニング・スキームは、異なるタスクを解くために再訓練を成功させることができるトランスファー可能な新しい構造を生成する。理論的収束保証を提供し、実データ上で提案した伝達学習戦略を検証する。
参考スコア（独自算出の注目度）: 6.935731409563879
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose a new gradient-based approach for extracting sub-architectures from a given large model. Contrarily to existing pruning methods, which are unable to disentangle the network architecture and the corresponding weights, our architecture-pruning scheme produces transferable new structures that can be successfully retrained to solve different tasks. We focus on a transfer-learning setup where architectures can be trained on a large data set but very few data points are available for fine-tuning them on new tasks. We define a new gradient-based algorithm that trains architectures of arbitrarily low complexity independently from the attached weights. Given a search space defined by an existing large neural model, we reformulate the architecture search task as a complexity-penalized subset-selection problem and solve it through a two-temperature relaxation scheme. We provide theoretical convergence guarantees and validate the proposed transfer-learning strategy on real data.
Abstract（参考訳）: 与えられた大規模モデルからサブアーキテクチャを抽出するための勾配に基づく新しいアプローチを提案する。ネットワークアーキテクチャと対応する重みを区別できない既存のプルーニングメソッドとは対照的に、アーキテクチャプルーニングスキームは、異なるタスクを解決するためにうまく再トレーニングできる、転送可能な新しい構造を生成します。大規模なデータセットでアーキテクチャをトレーニングすることができるが、新しいタスクでそれらを微調整することのできるデータポイントはごくわずかである。重みとは無関係に任意に低複雑性のアーキテクチャを学習する新しい勾配に基づくアルゴリズムを定式化する。既存の大規模ニューラルモデルによって定義された探索空間を前提として,アーキテクチャ探索タスクを複雑性に見合ったサブセット選択問題として再構成し,2温度緩和方式で解く。理論的収束保証を提供し、実データ上で提案した伝達学習戦略を検証する。

関連論文リスト

The Effect of Architecture During Continual Learning [2.1485350418225244]
本稿では,ソボレフ空間のアーキテクチャと重みを共同でモデル化する数学的枠組みを提案する。モデル重みのみの学習は、分布シフト下での破滅的な忘れを緩和するには不十分であることを示す。フィードフォワード、畳み込み、グラフニューラルネットワークを含む回帰と分類に関する実証的研究は、最適なアーキテクチャと重みの学習が同時に性能を大幅に向上させることを示した。
論文参考訳（メタデータ） (2026-01-27T16:29:42Z)
Evolving CNN Architectures: From Custom Designs to Deep Residual Models for Diverse Image Classification and Detection Tasks [0.9023847175654603]
本稿では,CNNモデルに対するカスタム畳み込みニューラルネットワーク(CNN)アーキテクチャの比較検討を行った。データセットはバイナリ分類、きめ細かいマルチクラス認識、オブジェクト検出シナリオにまたがる。本稿では,ネットワーク深度,残差接続,特徴抽出戦略,影響分類,ローカライゼーション性能などのアーキテクチャ要因について分析する。
論文参考訳（メタデータ） (2026-01-03T07:45:08Z)
Evolutionary Architecture Search through Grammar-Based Sequence Alignment [8.631577300185961]
局所配列アライメントのためのSmith-Watermanアルゴリズムの2つの適応版を導入し、文法に基づく進化的アーキテクチャ探索において編集距離を計算する。我々は,従来の作業よりも計算の複雑さを大幅に改善し,アーキテクチャ間の最短経路を効率的に計算する方法について強調する。今後の作業は、この新しいツールの上に構築され、ニューラルアーキテクチャ設計全体にわたってより広範囲に使用できる新しいコンポーネントを発見し、NASを超えてそのアプリケーションを広げる。
論文参考訳（メタデータ） (2025-12-04T16:57:49Z)
Spectral Architecture Search for Neural Networks [0.0]
本稿では,層間転送行列のスペクトル特性を利用した新しいアーキテクチャ探索プロトコルを提案する。提案手法は, 最小限の表現率を有する自己創出型アーキテクチャで, 調査対象のタスクを処理可能であることを示す。
論文参考訳（メタデータ） (2025-04-01T15:14:30Z)
Mechanistic Design and Scaling of Hybrid Architectures [114.3129802943915]
我々は、様々な計算プリミティブから構築された新しいハイブリッドアーキテクチャを特定し、テストする。本研究では,大規模計算最適法則と新しい状態最適スケーリング法則解析を用いて,結果のアーキテクチャを実験的に検証する。我々は,MAD合成法と計算-最適パープレキシティを相関させ,新しいアーキテクチャの正確な評価を可能にする。
論文参考訳（メタデータ） (2024-03-26T16:33:12Z)
Heterogeneous Continual Learning [88.53038822561197]
本稿では,ネットワークアーキテクチャの変更に伴う継続学習(CL)問題に対処する新しい枠組みを提案する。本研究は, 蒸留ファミリ上に構築し, より弱いモデルが教師の役割を担うような, 新たな環境に適応するものである。また、知識伝達を支援するために、タスク前の視覚的特徴を復元するクイック・ディープ・インバージョン(QDI)を提案する。
論文参考訳（メタデータ） (2023-06-14T15:54:42Z)
Equivariant Architectures for Learning in Deep Weight Spaces [54.61765488960555]
重み空間の学習のための新しいネットワークアーキテクチャを提案する。入力として、事前訓練された不変量の重みとバイアスの連結をとる。これらのレイヤを3つの基本的な操作で実装する方法を示す。
論文参考訳（メタデータ） (2023-01-30T10:50:33Z)
Conceptual Expansion Neural Architecture Search (CENAS) [1.3464152928754485]
概念拡張ニューラルアーキテクチャサーチ(CENAS)という手法を提案する。サンプル効率が高く、計算的創造性にインスパイアされたトランスファーラーニングアプローチとニューラルアーキテクチャサーチを組み合わせたものだ。新しいモデルのパラメータを近似するために、既存の重みを転送することで、素早いアーキテクチャ探索よりも高速なモデルを見つける。
論文参考訳（メタデータ） (2021-10-07T02:29:26Z)
SIRe-Networks: Skip Connections over Interlaced Multi-Task Learning and Residual Connections for Structure Preserving Object Classification [28.02302915971059]
本稿では、オブジェクト分類タスクにおける消失勾配を低減するために、SIReを定義したインターレース型マルチタスク学習戦略を提案する。提案手法は、自動エンコーダを介して入力画像構造を保存することにより、畳み込みニューラルネットワーク(CNN)を直接改善する。提案手法を検証するため、SIRe戦略を介して単純なCNNと有名なネットワークの様々な実装を拡張し、CIFAR100データセットで広範囲にテストする。
論文参考訳（メタデータ） (2021-10-06T13:54:49Z)
Elastic Architecture Search for Diverse Tasks with Different Resources [87.23061200971912]
本研究では,異なるリソースを持つ多様なタスクを効率的に配置する上で,クラス群に対応するリソース制約や関心のタスクをテスト時に動的に指定する,新たな課題について検討する。従来のNASアプローチでは、全てのクラスのアーキテクチャを同時に設計することを模索しており、これはいくつかの個別のタスクに最適ではないかもしれない。本稿では、様々なリソース制約のある多様なタスクに対して、実行時に即時特殊化を可能にする、Elastic Architecture Search (EAS)と呼ばれる斬新で一般的なフレームワークを提案する。
論文参考訳（メタデータ） (2021-08-03T00:54:27Z)
Disentangling Neural Architectures and Weights: A Case Study in Supervised Classification [8.976788958300766]
本研究は、神経構造とそのエッジウェイトの役割を解消する問題について考察する。十分に訓練されたアーキテクチャでは、重み付けのリンク固有の微調整は不要である。我々は、ハードアーキテクチャ探索問題を実現可能な最適化問題に変換する、新しい計算効率のよい手法を用いる。
論文参考訳（メタデータ） (2020-09-11T11:22:22Z)
Adversarially Robust Neural Architectures [43.74185132684662]
本稿では,NASフレームワークを用いたアーキテクチャの観点から,ネットワークの対角的ロバスト性を改善することを目的とする。本稿では, 対向ロバスト性, リプシッツ定数, アーキテクチャパラメータの関係について検討する。提案アルゴリズムは,異なるデータセットに対する様々な攻撃の下で,すべてのモデルの中で最高の性能を実証的に達成する。
論文参考訳（メタデータ） (2020-09-02T08:52:15Z)
Large-Scale Gradient-Free Deep Learning with Recursive Local Representation Alignment [84.57874289554839]
大規模データセット上でディープニューラルネットワークをトレーニングするには、重要なハードウェアリソースが必要である。これらのネットワークをトレーニングするためのワークホースであるバックプロパゲーションは、本質的に並列化が難しいシーケンシャルなプロセスである。本稿では、深層ネットワークのトレーニングに使用できるバックプロップに代わる、神経生物学的に有望な代替手段を提案する。
論文参考訳（メタデータ） (2020-02-10T16:20:02Z)
RC-DARTS: Resource Constrained Differentiable Architecture Search [162.7199952019152]
資源制約付き微分可能なアーキテクチャ探索法(RC-DARTS)を提案する。 RC-DARTS法は,モデルサイズが小さく,計算量も少ない,軽量なニューラルアーキテクチャを学習する。
論文参考訳（メタデータ） (2019-12-30T05:02:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。