論文の概要: RSBNet: One-Shot Neural Architecture Search for A Backbone Network in
Remote Sensing Image Recognition
- arxiv url: http://arxiv.org/abs/2112.03456v1
- Date: Tue, 7 Dec 2021 02:44:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 14:32:33.210253
- Title: RSBNet: One-Shot Neural Architecture Search for A Backbone Network in
Remote Sensing Image Recognition
- Title(参考訳): RSBNet:リモートセンシング画像認識におけるバックボーンネットワークのためのワンショットニューラルネットワーク探索
- Authors: Cheng Peng, Yangyang Li, Ronghua Shang, Licheng Jiao
- Abstract要約: 本稿では、シーン分類、土地被覆分類、オブジェクト検出を含むRSI認識タスクにおけるバックボーンアーキテクチャの新しい設計パラダイムを提案する。
重量共有戦略と進化的アルゴリズムに基づく新しいワンショットアーキテクチャ探索フレームワークRSBNetを提案する。
評価課題の異なる5つのベンチマークデータセットを用いて大規模な実験を行い,提案手法の有効性を示した。
- 参考スコア(独自算出の注目度): 43.95699860302204
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, a massive number of deep learning based approaches have been
successfully applied to various remote sensing image (RSI) recognition tasks.
However, most existing advances of deep learning methods in the RSI field
heavily rely on the features extracted by the manually designed backbone
network, which severely hinders the potential of deep learning models due the
complexity of RSI and the limitation of prior knowledge. In this paper, we
research a new design paradigm for the backbone architecture in RSI recognition
tasks, including scene classification, land-cover classification and object
detection. A novel one-shot architecture search framework based on
weight-sharing strategy and evolutionary algorithm is proposed, called RSBNet,
which consists of three stages: Firstly, a supernet constructed in a layer-wise
search space is pretrained on a self-assembled large-scale RSI dataset based on
an ensemble single-path training strategy. Next, the pre-trained supernet is
equipped with different recognition heads through the switchable recognition
module and respectively fine-tuned on the target dataset to obtain
task-specific supernet. Finally, we search the optimal backbone architecture
for different recognition tasks based on the evolutionary algorithm without any
network training. Extensive experiments have been conducted on five benchmark
datasets for different recognition tasks, the results show the effectiveness of
the proposed search paradigm and demonstrate that the searched backbone is able
to flexibly adapt different RSI recognition tasks and achieve impressive
performance.
- Abstract(参考訳): 近年,様々なリモートセンシング画像(rsi)認識タスクに対して,膨大な数のディープラーニング手法が適用されている。
しかし、RSI分野におけるディープラーニング手法の進歩のほとんどは、手動で設計したバックボーンネットワークによって抽出された特徴に大きく依存しており、RSIの複雑さと事前知識の制限により、ディープラーニングモデルの可能性を著しく妨げている。
本稿では,シーン分類,土地被覆分類,オブジェクト検出など,rsi認識タスクにおけるバックボーンアーキテクチャの新しい設計パラダイムについて検討する。
ウェイトシェアリング戦略と進化的アルゴリズムに基づく新しいワンショットアーキテクチャ検索フレームワークRSBNetが提案されている。まず,レイヤワイド検索空間に構築されたスーパーネットを,アンサンブル単一パストレーニング戦略に基づく大規模RSIデータセット上で事前学習する。
次に、予め訓練されたスーパーネットは、切り換え可能な認識モジュールを介して異なる認識ヘッドを備え、それぞれターゲットデータセットに微調整してタスク固有のスーパーネットを得る。
最後に,ネットワーク学習を伴わない進化的アルゴリズムに基づいて,異なる認識タスクに対して最適なバックボーンアーキテクチャを探索する。
異なる認識タスクのための5つのベンチマークデータセットについて広範な実験が行われ、提案手法の有効性を示し、検索されたバックボーンが異なるrsi認識タスクを柔軟に適応し、印象的なパフォーマンスを達成できることを実証した。
関連論文リスト
- EM-DARTS: Hierarchical Differentiable Architecture Search for Eye Movement Recognition [54.99121380536659]
眼球運動バイオメトリックスは、高い安全性の識別により注目されている。
深層学習(DL)モデルは近年,眼球運動認識に成功している。
DLアーキテクチャはまだ人間の事前知識によって決定されている。
眼球運動認識のためのDLアーキテクチャを自動設計する階層的微分可能なアーキテクチャ探索アルゴリズムEM-DARTSを提案する。
論文 参考訳(メタデータ) (2024-09-22T13:11:08Z) - Designing deep neural networks for driver intention recognition [40.87622566719826]
本稿では,ニューラルネットワークアーキテクチャが現実世界の安全クリティカルなアプリケーションに与える影響について検討する。
2つの運転意図認識データセットに対して8つの探索戦略のセットを評価する。
論文 参考訳(メタデータ) (2024-02-07T12:54:15Z) - SIRe-Networks: Skip Connections over Interlaced Multi-Task Learning and
Residual Connections for Structure Preserving Object Classification [28.02302915971059]
本稿では、オブジェクト分類タスクにおける消失勾配を低減するために、SIReを定義したインターレース型マルチタスク学習戦略を提案する。
提案手法は、自動エンコーダを介して入力画像構造を保存することにより、畳み込みニューラルネットワーク(CNN)を直接改善する。
提案手法を検証するため、SIRe戦略を介して単純なCNNと有名なネットワークの様々な実装を拡張し、CIFAR100データセットで広範囲にテストする。
論文 参考訳(メタデータ) (2021-10-06T13:54:49Z) - Differentiable Neural Architecture Search with Morphism-based
Transformable Backbone Architectures [35.652234989200956]
本研究の目的は,ワンショットトレーニングやオンライントレーニングにアーキテクチャ検索プロセスをより適応させることである。
ネットワークアソシエーションに基づいた、微分可能なニューラルアーキテクチャ探索のための成長メカニズムを導入している。
また、リカレントニューラルネットワークのための最近提案された2入力バックボーンアーキテクチャを実装した。
論文 参考訳(メタデータ) (2021-06-14T07:56:33Z) - Joint Learning of Neural Transfer and Architecture Adaptation for Image
Recognition [77.95361323613147]
現在の最先端の視覚認識システムは、大規模データセット上でニューラルネットワークを事前トレーニングし、より小さなデータセットでネットワーク重みを微調整することに依存している。
本稿では,各ドメインタスクに適応したネットワークアーキテクチャの動的適応と,効率と効率の両面で重みの微調整の利点を実証する。
本手法は,ソースドメインタスクでスーパーネットトレーニングを自己教師付き学習に置き換え,下流タスクで線形評価を行うことにより,教師なしパラダイムに容易に一般化することができる。
論文 参考訳(メタデータ) (2021-03-31T08:15:17Z) - SAR-NAS: Skeleton-based Action Recognition via Neural Architecture
Searching [18.860051578038608]
スケルトンベースのアクションインスタンスをテンソルにエンコードし、正常細胞と還元細胞という2種類のネットワーク細胞を構築するための一連の操作を定義する。
NTU RGB+DとKinecticsのデータセットに挑戦する実験では、骨格に基づく行動認識のために開発されたネットワークのほとんどは、コンパクトで効率的なものではないことが確認された。
提案手法は,最先端の手法よりも比較や性能の向上が可能な,そのようなコンパクトなネットワークを探索する手法を提供する。
論文 参考訳(メタデータ) (2020-10-29T03:24:15Z) - NAS-Navigator: Visual Steering for Explainable One-Shot Deep Neural
Network Synthesis [53.106414896248246]
本稿では,分析者がドメイン知識を注入することで,解のサブグラフ空間を効果的に構築し,ネットワーク探索をガイドするフレームワークを提案する。
このテクニックを反復的に適用することで、アナリストは、与えられたアプリケーションに対して最高のパフォーマンスのニューラルネットワークアーキテクチャに収束することができる。
論文 参考訳(メタデータ) (2020-09-28T01:48:45Z) - DC-NAS: Divide-and-Conquer Neural Architecture Search [108.57785531758076]
本稿では,ディープ・ニューラル・アーキテクチャーを効果的かつ効率的に探索するためのディバイド・アンド・コンカ(DC)手法を提案する。
ImageNetデータセットで75.1%の精度を達成しており、これは同じ検索空間を使った最先端の手法よりも高い。
論文 参考訳(メタデータ) (2020-05-29T09:02:16Z) - Deep Multimodal Neural Architecture Search [178.35131768344246]
様々なマルチモーダル学習タスクのための一般化された深層マルチモーダルニューラルアーキテクチャサーチ(MMnas)フレームワークを考案する。
マルチモーダル入力が与えられたら、まずプリミティブ演算のセットを定義し、その後、ディープエンコーダ-デコーダベースの統一バックボーンを構築する。
統合されたバックボーンの上にタスク固有のヘッドをアタッチして、異なるマルチモーダル学習タスクに取り組む。
論文 参考訳(メタデータ) (2020-04-25T07:00:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。