論文の概要: Real-Time Semantic Segmentation via Auto Depth, Downsampling Joint
Decision and Feature Aggregation
- arxiv url: http://arxiv.org/abs/2003.14226v1
- Date: Tue, 31 Mar 2020 14:02:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 01:23:24.673144
- Title: Real-Time Semantic Segmentation via Auto Depth, Downsampling Joint
Decision and Feature Aggregation
- Title(参考訳): auto depth,downsampling joint decision, feature aggregationによるリアルタイム意味セグメンテーション
- Authors: Peng Sun, Jiaxiang Wu, Songyuan Li, Peiwen Lin, Junzhou Huang, and Xi
Li
- Abstract要約: 本稿では,セグメンテーション戦略の自動化を目的として,AutoRTNetという共同検索フレームワークを提案する。
具体的には,ネットワーク深度とダウンサンプリング戦略を協調的に決定するハイパーセルと,自動マルチスケール機能アグリゲーションを実現するアグリゲーションセルを提案する。
- 参考スコア(独自算出の注目度): 54.28963233377946
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To satisfy the stringent requirements on computational resources in the field
of real-time semantic segmentation, most approaches focus on the hand-crafted
design of light-weight segmentation networks. Recently, Neural Architecture
Search (NAS) has been used to search for the optimal building blocks of
networks automatically, but the network depth, downsampling strategy, and
feature aggregation way are still set in advance by trial and error. In this
paper, we propose a joint search framework, called AutoRTNet, to automate the
design of these strategies. Specifically, we propose hyper-cells to jointly
decide the network depth and downsampling strategy, and an aggregation cell to
achieve automatic multi-scale feature aggregation. Experimental results show
that AutoRTNet achieves 73.9% mIoU on the Cityscapes test set and 110.0 FPS on
an NVIDIA TitanXP GPU card with 768x1536 input images.
- Abstract(参考訳): リアルタイムセマンティックセグメンテーションの分野における計算資源の厳密な要求を満たすため、ほとんどのアプローチは軽量セグメンテーションネットワークの手作り設計に焦点を当てている。
近年,ニューラルネットワークサーチ (NAS) は,ネットワークの最適構築ブロックの自動探索に使用されているが,ネットワーク深度,ダウンサンプリング戦略,機能集約方法は,まだ試行錯誤によって事前に設定されている。
本稿では,これらの戦略の設計を自動化するための共同検索フレームワークであるAutoRTNetを提案する。
具体的には,ネットワークの深さとダウンサンプリング戦略を共同で決定するハイパーセルと,マルチスケールの自動集約を実現する集約セルを提案する。
実験の結果、autortnet は cityscapes テストセットで73.9% miou、nvidia titanxp gpu カードで 768x1536 の入力イメージで 110.0 fps を達成した。
関連論文リスト
- SimQ-NAS: Simultaneous Quantization Policy and Neural Architecture
Search [6.121126813817338]
最近のワンショットニューラルネットワーク検索アルゴリズムは、特定のタスクに適したハードウェアに依存しないスーパーネットワークをトレーニングし、異なるハードウェアプラットフォームのための効率的なサブネットワークを抽出する。
我々は,光学習された予測器と組み合わせた多目的探索アルゴリズムを用いることで,サブネットワークアーキテクチャとそれに対応する量子化ポリシーの両方を効率的に探索できることを示す。
論文 参考訳(メタデータ) (2023-12-19T22:08:49Z) - Pruning-as-Search: Efficient Neural Architecture Search via Channel
Pruning and Structural Reparameterization [50.50023451369742]
プルーニング・アズ・サーチ(Pruning-as-Search、PaS)は、必要なサブネットワークを自動的に効率的に検索するエンドツーエンドのプルーニング手法である。
提案したアーキテクチャは,ImageNet-1000分類タスクにおいて,1.0%$ Top-1精度で先行技術より優れていた。
論文 参考訳(メタデータ) (2022-06-02T17:58:54Z) - CONetV2: Efficient Auto-Channel Size Optimization for CNNs [35.951376988552695]
本研究は,チャネルサイズのマイクロサーチ空間を調べることにより,計算制約のある環境において効率的な手法を提案する。
チャネルサイズ最適化に際し、ネットワークの異なる接続層内の依存関係を抽出する自動アルゴリズムを設計する。
また、テスト精度と高い相関性を持ち、個々のネットワーク層を解析できる新しいメトリクスも導入する。
論文 参考訳(メタデータ) (2021-10-13T16:17:19Z) - Neural Architecture Search for Efficient Uncalibrated Deep Photometric
Stereo [105.05232615226602]
差別化可能なニューラルアーキテクチャサーチ(NAS)戦略を利用して、非校正型PSアーキテクチャを自動的に見つける。
DiLiGenTデータセットの実験では、自動検索されたニューラルネットワークのパフォーマンスが、最先端の未校正PSメソッドと好適に比較されている。
論文 参考訳(メタデータ) (2021-10-11T21:22:17Z) - Coarse-to-Fine Searching for Efficient Generative Adversarial Networks [43.21560798088658]
GAN(Generative Adversarial Network)は通常、様々な複雑な画像生成を行うように設計されている。
まず,経路,演算子,チャネルなど3次元のジェネレータネットワークの無傷検索空間を探索し,ネットワーク性能の完全な探索を行う。
探索コストを大幅に削減するため,探索プロセス全体を3つのサブ最適化問題に分割する粗大な探索戦略を探索する。
論文 参考訳(メタデータ) (2021-04-19T11:46:20Z) - Combined Depth Space based Architecture Search For Person
Re-identification [70.86236888223569]
個人再識別(ReID)のための軽量で適切なネットワークの設計を目指しています。
本研究では,CDNetと呼ばれる効率的なネットワークアーキテクチャの探索に基づく,複合深さ空間(Componed Depth Space, CDS)と呼ばれる新しい検索空間を提案する。
そこで我々はTop-k Sample Search戦略という低コストの検索戦略を提案し、検索空間をフル活用し、局所的な最適結果のトラップを避ける。
論文 参考訳(メタデータ) (2021-04-09T02:40:01Z) - AutoPose: Searching Multi-Scale Branch Aggregation for Pose Estimation [96.29533512606078]
本稿では,新しいニューラルアーキテクチャサーチ(NAS)フレームワークであるAutoPoseを紹介する。
高精度で高解像度な2次元ポーズ推定に向けて、クロススケール接続の複数の並列ブランチを自動的に検出することができる。
論文 参考訳(メタデータ) (2020-08-16T22:27:43Z) - Semantic Segmentation With Multi Scale Spatial Attention For Self
Driving Cars [2.7317088388886384]
本稿では,様々なスケールのマルチスケール特徴融合を用いた新しいニューラルネットワークを提案し,その精度と効率的なセマンティックイメージセグメンテーションを提案する。
我々は、ResNetベースの特徴抽出器、ダウンサンプリング部における拡張畳み込み層、アップサンプリング部におけるアトラス畳み込み層を使用し、コンキャット操作を用いてそれらをマージした。
より文脈的な情報をエンコードし、ネットワークの受容領域を強化するため、新しいアテンションモジュールが提案されている。
論文 参考訳(メタデータ) (2020-06-30T20:19:09Z) - DHP: Differentiable Meta Pruning via HyperNetworks [158.69345612783198]
本稿では,ネットワークの自動プルーニングのためのハイパーネットによる識別可能なプルーニング手法を提案する。
遅延ベクトルは、バックボーンネットワーク内の畳み込み層の出力チャネルを制御し、レイヤのプルーニングのハンドルとして機能する。
画像分類、単一画像超解像、復調のための様々なネットワークで実験が行われた。
論文 参考訳(メタデータ) (2020-03-30T17:59:18Z) - DCNAS: Densely Connected Neural Architecture Search for Semantic Image
Segmentation [44.46852065566759]
Densely Connected NAS (DCNAS) フレームワークを提案し、視覚情報のマルチスケール表現に対して最適なネットワーク構造を直接検索する。
具体的には,学習可能な重みを使ってセルを相互に接続することにより,多数の主流ネットワーク設計をカバーするために,密結合された検索空間を導入する。
我々は、DCNASアルゴリズムから得られたアーキテクチャが、公開セマンティックイメージセグメンテーションベンチマーク上で最先端のパフォーマンスを達成することを実証した。
論文 参考訳(メタデータ) (2020-03-26T13:21:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。