論文の概要: Rethinking Lightweight Salient Object Detection via Network Depth-Width
Tradeoff
- arxiv url: http://arxiv.org/abs/2301.06679v1
- Date: Tue, 17 Jan 2023 03:43:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-18 14:54:53.909096
- Title: Rethinking Lightweight Salient Object Detection via Network Depth-Width
Tradeoff
- Title(参考訳): ネットワーク奥行き-幅トレードオフによる軽量サルエント物体検出の再考
- Authors: Jia Li, Shengye Qiao, Zhirui Zhao, Chenxi Xie, Xiaowu Chen and
Changqun Xia
- Abstract要約: 既存の有能なオブジェクト検出手法では、より深いネットワークが採用され、性能が向上する。
本稿では,U字形構造を3つの相補枝に分解することで,新しい3方向デコーダフレームワークを提案する。
提案手法は,5つのベンチマークにおいて効率と精度のバランスが良くなることを示す。
- 参考スコア(独自算出の注目度): 26.566339984225756
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing salient object detection methods often adopt deeper and wider
networks for better performance, resulting in heavy computational burden and
slow inference speed. This inspires us to rethink saliency detection to achieve
a favorable balance between efficiency and accuracy. To this end, we design a
lightweight framework while maintaining satisfying competitive accuracy.
Specifically, we propose a novel trilateral decoder framework by decoupling the
U-shape structure into three complementary branches, which are devised to
confront the dilution of semantic context, loss of spatial structure and
absence of boundary detail, respectively. Along with the fusion of three
branches, the coarse segmentation results are gradually refined in structure
details and boundary quality. Without adding additional learnable parameters,
we further propose Scale-Adaptive Pooling Module to obtain multi-scale
receptive filed. In particular, on the premise of inheriting this framework, we
rethink the relationship among accuracy, parameters and speed via network
depth-width tradeoff. With these insightful considerations, we comprehensively
design shallower and narrower models to explore the maximum potential of
lightweight SOD. Our models are purposed for different application
environments: 1) a tiny version CTD-S (1.7M, 125FPS) for resource constrained
devices, 2) a fast version CTD-M (12.6M, 158FPS) for speed-demanding scenarios,
3) a standard version CTD-L (26.5M, 84FPS) for high-performance platforms.
Extensive experiments validate the superiority of our method, which achieves
better efficiency-accuracy balance across five benchmarks.
- Abstract(参考訳): 既存の有能な物体検出法では、より深くより広いネットワークを用いて性能を向上し、計算負荷と推論速度を遅くする。
これは、効率と正確さのバランスを良好にするために、サリエンシー検出を再考することを促します。
この目的のために,競争精度を維持しつつ軽量なフレームワークを設計する。
具体的には,U字型構造を3つの相補的な分岐に分解し,意味的文脈の解消,空間構造の喪失,境界詳細の欠如に対処する,新しい3方向デコーダフレームワークを提案する。
3つの分枝の融合とともに、粗い分節結果は構造の詳細と境界品質において徐々に洗練される。
さらに,学習可能なパラメータを追加することなく,マルチスケール・レセプティブ・ファイリングを得るためのスケール適応型プーリングモジュールを提案する。
特に,この枠組みを継承することを前提として,ネットワーク奥行き幅トレードオフによる精度,パラメータ,速度の関係を再考する。
このような洞察に富んだ考察により,軽量sodの最大ポテンシャルを探求するために,より浅く狭いモデルを包括的に設計する。
私たちのモデルは、異なるアプリケーション環境向けに作られています。
1)リソース制約デバイス用の小さなバージョンCTD-S(1.7M,125FPS)。
2)高速版CTD-M(12.6M、158FPS)。
3 高性能プラットフォーム向けの標準版CTD-L (26.5M, 84FPS)。
5つのベンチマークで効率と精度のバランスを良くする手法の優位性を検証する。
関連論文リスト
- Accelerating Deep Neural Networks via Semi-Structured Activation
Sparsity [0.0]
ネットワークの機能マップにスパシティを爆発させることは、推論のレイテンシを低減する方法の1つです。
そこで本研究では,セミ構造化されたアクティベーション空間を小さなランタイム修正によって活用する手法を提案する。
当社のアプローチでは,ImageNetデータセット上のResNet18モデルに対して,最小精度が1.1%の1.25倍の速度向上を実現している。
論文 参考訳(メタデータ) (2023-09-12T22:28:53Z) - Surrogate Lagrangian Relaxation: A Path To Retrain-free Deep Neural
Network Pruning [9.33753001494221]
ネットワークプルーニングは、ディープニューラルネットワークの計算コストとモデルサイズの削減に広く用いられている手法である。
本稿では,サロゲートラグランジアン緩和に基づく体系的な重み付け最適化手法を開発する。
論文 参考訳(メタデータ) (2023-04-08T22:48:30Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - PIDNet: A Real-time Semantic Segmentation Network Inspired by PID
Controllers [6.0653144230649865]
2分岐ネットワークアーキテクチャは、リアルタイムセマンティックセグメンテーションタスクにおける効率と有効性を示している。
PIDNetは、詳細な情報、コンテキスト、境界情報を解析するための3つの分岐を含む。
私たちのPIDNetのファミリーは、推論速度と精度の最良のトレードオフを達成し、その精度は、CityscapesとCamVidデータセットに類似した推論速度を持つ既存のモデル全てを上回ります。
論文 参考訳(メタデータ) (2022-06-04T23:16:52Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Joint Channel and Weight Pruning for Model Acceleration on Moblie
Devices [37.51092726022731]
プルーニングは、計算資源の消費と精度のバランスをとるために広く採用されているプラクティスである。
We present a unified framework with Joint Channel pruning and Weight pruning (JCW)。
本稿では,JCW フレームワークに最適化された多目的進化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-15T11:18:42Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - FDFlowNet: Fast Optical Flow Estimation using a Deep Lightweight Network [12.249680550252327]
我々はFDFlowNet(fast Deep Flownet)と呼ばれるリアルタイム光フロー推定のための軽量で効果的なモデルを提案する。
我々は、PWC-Netの約2倍の速度で、挑戦的なKITTIとSintelベンチマークにおいて、より良い、あるいは同様の精度を達成する。
論文 参考訳(メタデータ) (2020-06-22T14:01:01Z) - A Privacy-Preserving-Oriented DNN Pruning and Mobile Acceleration
Framework [56.57225686288006]
モバイルエッジデバイスの限られたストレージとコンピューティング能力を満たすために、ディープニューラルネットワーク(DNN)の軽量プルーニングが提案されている。
従来のプルーニング手法は主に、ユーザデータのプライバシを考慮せずに、モデルのサイズを減らしたり、パフォーマンスを向上させることに重点を置いていた。
プライベートトレーニングデータセットを必要としないプライバシ保護指向のプルーニングおよびモバイルアクセラレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-13T23:52:03Z) - Toward fast and accurate human pose estimation via soft-gated skip
connections [97.06882200076096]
本稿では,高精度かつ高効率な人間のポーズ推定について述べる。
我々は、最先端技術よりも精度と効率を両立させる文脈において、この設計選択を再分析する。
本モデルでは,MPII と LSP のデータセットから最先端の結果が得られる。
論文 参考訳(メタデータ) (2020-02-25T18:51:51Z) - Triple Wins: Boosting Accuracy, Robustness and Efficiency Together by
Enabling Input-Adaptive Inference [119.19779637025444]
深層ネットワークは、(クリーンな自然画像の場合)正確さと(敵対的な摂動画像の場合)頑健さの相違に直面することを最近提案された。
本稿では,入力適応推論に関連するマルチエグジットネットワークについて検討し,モデル精度,ロバスト性,効率の最適化において「スイートポイント」を達成する上での強い期待を示す。
論文 参考訳(メタデータ) (2020-02-24T00:40:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。