論文の概要: Local-to-Global Information Communication for Real-Time Semantic
Segmentation Network Search
- arxiv url: http://arxiv.org/abs/2302.08481v1
- Date: Thu, 16 Feb 2023 18:40:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-17 13:05:05.795079
- Title: Local-to-Global Information Communication for Real-Time Semantic
Segmentation Network Search
- Title(参考訳): リアルタイム意味セグメンテーションネットワーク探索のための地域間情報通信
- Authors: Guangliang Cheng, Peng Sun, Ting-Bing Xu, Shuchang Lyu and Peiwen Lin
- Abstract要約: そこで我々は,セル共有方式をセル非依存モデルに置き換えることで,軽量モデルをより効率的に検索できる新しい検索空間を提案する。
ローカル情報交換において、グラフ畳み込みネットワーク(GCN)誘導モジュールは、細胞間の通信配信としてシームレスに統合される。
グローバルな情報集約のために,ネットワーク内の長距離多層機能を自動的に集約する,新しい高密度接続型核融合モジュール(セル)を提案する。
- 参考スコア(独自算出の注目度): 13.132958359671067
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Neural Architecture Search (NAS) has shown great potentials in automatically
designing neural network architectures for real-time semantic segmentation.
Unlike previous works that utilize a simplified search space with cell-sharing
way, we introduce a new search space where a lightweight model can be more
effectively searched by replacing the cell-sharing manner with cell-independent
one. Based on this, the communication of local to global information is
achieved through two well-designed modules. For local information exchange, a
graph convolutional network (GCN) guided module is seamlessly integrated as a
communication deliver between cells. For global information aggregation, we
propose a novel dense-connected fusion module (cell) which aggregates
long-range multi-level features in the network automatically. In addition, a
latency-oriented constraint is endowed into the search process to balance the
accuracy and latency. We name the proposed framework as Local-to-Global
Information Communication Network Search (LGCNet). Extensive experiments on
Cityscapes and CamVid datasets demonstrate that LGCNet achieves the new
state-of-the-art trade-off between accuracy and speed. In particular, on
Cityscapes dataset, LGCNet achieves the new best performance of 74.0\% mIoU
with the speed of 115.2 FPS on Titan Xp.
- Abstract(参考訳): ニューラルネットワーク検索(NAS)は、リアルタイムセマンティックセグメンテーションのためのニューラルネットワークアーキテクチャを自動設計する大きな可能性を示している。
セル共有方式で簡易検索空間を利用する従来の作品とは異なり,セル共有方式をセル非依存方式に置き換え,軽量モデルをより効果的に検索できる新たな検索空間を導入する。
これに基づき、地域情報とグローバル情報の通信は、2つのよく設計されたモジュールによって達成される。
ローカル情報交換では、グラフ畳み込みネットワーク(GCN)誘導モジュールが細胞間の通信配信としてシームレスに統合される。
グローバル情報集約のために,ネットワーク内の長距離マルチレベル機能を自動集約する新しい密結合型核融合モジュール(cell)を提案する。
さらに、レイテンシ指向の制約を検索プロセスに付与し、精度とレイテンシのバランスをとる。
提案するフレームワークを,LGCNet (Local-to-Global Information Communication Network Search) と呼ぶ。
CityscapesとCamVidデータセットに関する大規模な実験は、LGCNetが精度とスピードの間の新たな最先端のトレードオフを実現していることを示している。
特にCityscapesのデータセットでは、LGCNetはTitan Xp上の115.2 FPSの速度で74.0\% mIoUの新しい最高のパフォーマンスを達成する。
関連論文リスト
- ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - MCFNet: Multi-scale Covariance Feature Fusion Network for Real-time
Semantic Segmentation [6.0118706234809975]
我々は,Multi-scale Covariance Feature Fusion Network (MCFNet)と呼ばれるバイラテラルネットワーク(BiseNet)に基づく新しいアーキテクチャを提案する。
具体的には、新しい機能改善モジュールと新しい機能融合モジュールを導入する。
提案したCityscapes,CamVidデータセットのモデルを評価し,最先端の手法と比較した。
論文 参考訳(メタデータ) (2023-12-12T12:20:27Z) - Residual Graph Convolutional Network for Bird's-Eye-View Semantic
Segmentation [3.8073142980733]
本稿では,Residual Graph Convolutional (RGC) モジュールを深層CNNに組み込むことを提案する。
RGCモジュールは、完全なBird's-Eye-View (BEV)情報をグラフ空間に効率的に投影する。
RGCネットワークは、IoUとmIoUの4つの最先端ネットワークと4つの変種を上回ります。
論文 参考訳(メタデータ) (2023-12-07T05:04:41Z) - DLGSANet: Lightweight Dynamic Local and Global Self-Attention Networks
for Image Super-Resolution [83.47467223117361]
画像の超解像化に有効な軽量な動的局所・大域自己アテンションネットワーク(DLGSANet)を提案する。
トランスフォーマーのネットワーク設計により,ローカル特徴を効率的に抽出するシンプルなマルチヘッド動的自己アテンション(MHDLSA)モジュールを開発した。
この問題を解決するために,最も有用な類似値を選択するために,スパースグローバル自己アテンション(SparseGSA)モジュールを開発した。
論文 参考訳(メタデータ) (2023-01-05T12:06:47Z) - JMSNAS: Joint Model Split and Neural Architecture Search for Learning
over Mobile Edge Networks [23.230079759174902]
モバイルエッジネットワーク上でのDNNモデルの自動生成とデプロイのために,ジョイントモデル分割とニューラルアーキテクチャサーチ(JMSNAS)フレームワークを提案する。
計算資源制約と通信資源制約の両方を考慮すると、計算グラフ探索問題を定式化する。
実験により,最先端の分割機械学習設計手法よりも提案手法が優れていることを確認した。
論文 参考訳(メタデータ) (2021-11-16T03:10:23Z) - An Entropy-guided Reinforced Partial Convolutional Network for Zero-Shot
Learning [77.72330187258498]
エントロピー誘導強化部分畳み込みネットワーク(ERPCNet)を提案する。
ERPCNetは、人間のアノテーションのない意味的関連性と視覚的相関に基づいて、局所性を抽出し、集約する。
グローバルな協力的局所性を動的に発見するだけでなく、ポリシー勾配最適化のためにより高速に収束する。
論文 参考訳(メタデータ) (2021-11-03T11:13:13Z) - Global Aggregation then Local Distribution for Scene Parsing [99.1095068574454]
提案手法は,エンドツーエンドのトレーニング可能なブロックとしてモジュール化され,既存のセマンティックセグメンテーションネットワークに容易に接続可能であることを示す。
私たちのアプローチでは、Cityscapes、ADE20K、Pascal Context、Camvid、COCO-stuffといった主要なセマンティックセグメンテーションベンチマークに基づいて、新しい最先端の技術を構築できます。
論文 参考訳(メタデータ) (2021-07-28T03:46:57Z) - Spatio-temporal Modeling for Large-scale Vehicular Networks Using Graph
Convolutional Networks [110.80088437391379]
SMARTと呼ばれるグラフベースのフレームワークが提案され、大規模な地理的領域にわたるV2I通信遅延の統計をモデル化し、追跡する。
深層Q-networksアルゴリズムと統合したグラフ畳み込みネットワークを用いたグラフ再構築型手法を開発する。
その結果,提案手法は,モデル化の精度と効率と,大規模車両ネットワークにおける遅延性能を有意に向上させることが示された。
論文 参考訳(メタデータ) (2021-03-13T06:56:29Z) - Real-Time Semantic Segmentation via Auto Depth, Downsampling Joint
Decision and Feature Aggregation [54.28963233377946]
本稿では,セグメンテーション戦略の自動化を目的として,AutoRTNetという共同検索フレームワークを提案する。
具体的には,ネットワーク深度とダウンサンプリング戦略を協調的に決定するハイパーセルと,自動マルチスケール機能アグリゲーションを実現するアグリゲーションセルを提案する。
論文 参考訳(メタデータ) (2020-03-31T14:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。