論文の概要: Fine-Grained Dynamic Head for Object Detection
- arxiv url: http://arxiv.org/abs/2012.03519v1
- Date: Mon, 7 Dec 2020 08:16:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-16 21:52:25.462977
- Title: Fine-Grained Dynamic Head for Object Detection
- Title(参考訳): 物体検出のための細粒度動的ヘッド
- Authors: Lin Song, Yanwei Li, Zhengkai Jiang, Zeming Li, Hongbin Sun, Jian Sun,
Nanning Zheng
- Abstract要約: 本稿では,各インスタンスの異なるスケールからfpn特徴の画素レベルの組み合わせを条件付きで選択する,きめ細かい動的ヘッドを提案する。
実験は,いくつかの最先端検出ベンチマークにおける提案手法の有効性と有効性を示す。
- 参考スコア(独自算出の注目度): 68.70628757217939
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Feature Pyramid Network (FPN) presents a remarkable approach to alleviate
the scale variance in object representation by performing instance-level
assignments. Nevertheless, this strategy ignores the distinct characteristics
of different sub-regions in an instance. To this end, we propose a fine-grained
dynamic head to conditionally select a pixel-level combination of FPN features
from different scales for each instance, which further releases the ability of
multi-scale feature representation. Moreover, we design a spatial gate with the
new activation function to reduce computational complexity dramatically through
spatially sparse convolutions. Extensive experiments demonstrate the
effectiveness and efficiency of the proposed method on several state-of-the-art
detection benchmarks. Code is available at
https://github.com/StevenGrove/DynamicHead.
- Abstract(参考訳): The Feature Pyramid Network (FPN) は、インスタンスレベルの割り当てを行うことでオブジェクト表現のスケールのばらつきを緩和する顕著なアプローチを示す。
それでもこの戦略は、インスタンス内の異なるサブリージョンの異なる特性を無視している。
そこで本研究では,FPN特徴量の画素レベルの組み合わせを各インスタンスの異なるスケールから条件付きで選択する,微細な動的ヘッドを提案する。
さらに,新しい活性化関数を持つ空間ゲートを設計し,空間的に疎い畳み込みによって計算複雑性を劇的に低減する。
大規模実験により,提案手法の有効性と有効性が実証された。
コードはhttps://github.com/StevenGrove/DynamicHeadで入手できる。
関連論文リスト
- DyFADet: Dynamic Feature Aggregation for Temporal Action Detection [70.37707797523723]
カーネル重みと受容フィールドを異なるタイムスタンプで適応できる新しい動的特徴集約(DFA)モジュールを構築した。
DFAを使用することで動的DADヘッド(DyHead)の開発を支援し、パラメータを調整したマルチスケール機能を適応的に集約する。
新しい動的TADモデルであるDyFADetは、一連の挑戦的なTADベンチマークで有望なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-07-03T15:29:10Z) - HPS-Det: Dynamic Sample Assignment with Hyper-Parameter Search for
Object Detection [25.71039912705784]
本稿では,ハイパーパラメータ探索に基づく新しい動的サンプル割当て方式を提案する。
実験により、結果のHPS-Detは、異なるオブジェクト検出ベースラインよりもパフォーマンスが向上することが示された。
論文 参考訳(メタデータ) (2022-07-23T15:13:57Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - Dynamic Convolution for 3D Point Cloud Instance Segmentation [146.7971476424351]
動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
我々は、同じ意味圏と閉投票を持つ等質点を幾何学的遠近点に対して収集する。
提案手法は提案不要であり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
論文 参考訳(メタデータ) (2021-07-18T09:05:16Z) - Towards Better Object Detection in Scale Variation with Adaptive Feature
Selection [3.5352273012717044]
チャネル次元の多レベル表現を融合する方法を自動学習する新しい適応的特徴選択モジュール(AFSM)を提案する。
これは、特徴ピラミッド構造を持つ検出器の性能を著しく向上させる。
クラス不均衡問題に対処するために,クラス対応サンプリング機構(CASM)を提案する。
論文 参考訳(メタデータ) (2020-12-06T13:41:20Z) - DyCo3D: Robust Instance Segmentation of 3D Point Clouds through Dynamic
Convolution [136.7261709896713]
本稿では,インスタンスの性質に応じて適切な畳み込みカーネルを生成するデータ駆動型アプローチを提案する。
提案手法はScanetNetV2とS3DISの両方で有望な結果が得られる。
また、現在の最先端よりも推論速度を25%以上向上させる。
論文 参考訳(メタデータ) (2020-11-26T14:56:57Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Hierarchical Dynamic Filtering Network for RGB-D Salient Object
Detection [91.43066633305662]
RGB-D Salient Object Detection (SOD) の主な目的は、相互融合情報をよりよく統合し活用する方法である。
本稿では,これらの問題を新たな視点から考察する。
我々は、より柔軟で効率的なマルチスケールのクロスモーダルな特徴処理を実装している。
論文 参考訳(メタデータ) (2020-07-13T07:59:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。