論文の概要: DSIC: Dynamic Sample-Individualized Connector for Multi-Scale Object
Detection
- arxiv url: http://arxiv.org/abs/2011.07774v2
- Date: Thu, 25 Mar 2021 02:14:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 00:34:31.362325
- Title: DSIC: Dynamic Sample-Individualized Connector for Multi-Scale Object
Detection
- Title(参考訳): DSIC:マルチスケール物体検出のための動的サンプル分割コネクタ
- Authors: Zekun Li, Yufan Liu, Bing Li, Weiming Hu
- Abstract要約: マルチスケールオブジェクト検出のための動的サンプル独立接続器(DSIC)を提案する。
ISGは、機能統合の入力としてバックボーンから多レベル特徴を適応的に抽出する。
CSGはマルチレベル機能に基づいて情報伝達経路を自動的に活性化する。
- 参考スコア(独自算出の注目度): 33.61001547745264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although object detection has reached a milestone thanks to the great success
of deep learning, the scale variation is still the key challenge. Integrating
multi-level features is presented to alleviate the problems, like the classic
Feature Pyramid Network (FPN) and its improvements. However, the specifically
designed feature integration modules of these methods may not have the optimal
architecture for feature fusion. Moreover, these models have fixed
architectures and data flow paths, when fed with various samples. They cannot
adjust and be compatible with each kind of data. To overcome the above
limitations, we propose a Dynamic Sample-Individualized Connector (DSIC) for
multi-scale object detection. It dynamically adjusts network connections to fit
different samples. In particular, DSIC consists of two components: Intra-scale
Selection Gate (ISG) and Cross-scale Selection Gate (CSG). ISG adaptively
extracts multi-level features from backbone as the input of feature
integration. CSG automatically activate informative data flow paths based on
the multi-level features. Furthermore, these two components are both
plug-and-play and can be embedded in any backbone. Experimental results
demonstrate that the proposed method outperforms the state-of-the-arts.
- Abstract(参考訳): ディープラーニングの大きな成功のおかげで、オブジェクト検出はマイルストーンに達したが、スケールの変動は依然として重要な課題である。
従来のFeature Pyramid Network(FPN)やその改善といった問題を軽減するために、マルチレベル機能の統合が提案されている。
しかし、これらの方法の特別に設計された機能統合モジュールは、機能融合に最適なアーキテクチャを持っていないかもしれない。
さらに、これらのモデルには、様々なサンプルを投入する際に、固定されたアーキテクチャとデータフローパスがある。
それぞれのデータを調整することはできず、互換性も持たない。
上記の制限を克服するため,マルチスケールオブジェクト検出のための動的サンプル分割コネクタ(DSIC)を提案する。
ネットワーク接続を動的に調整し、異なるサンプルに適合する。
特にDSICは、ISG(Intra-scale Selection Gate)とCSG(Cross-scale Selection Gate)の2つのコンポーネントで構成されている。
ISGは、機能統合の入力としてバックボーンから多レベル特徴を適応的に抽出する。
CSGはマルチレベル機能に基づいて情報伝達経路を自動的に活性化する。
さらに、これら2つのコンポーネントはプラグインとプレイの両方で、任意のバックボーンに埋め込まれる。
実験の結果,提案手法は最先端技術よりも優れていた。
関連論文リスト
- Multi-scale Feature Fusion with Point Pyramid for 3D Object Detection [18.41721888099563]
本稿では,POP-RCNN(Point Pyramid RCNN)を提案する。
提案手法は, 様々な既存フレームワークに適用して, 特に長距離検出において, 特徴の豊かさを高めることができる。
論文 参考訳(メタデータ) (2024-09-06T20:13:14Z) - DAMSDet: Dynamic Adaptive Multispectral Detection Transformer with
Competitive Query Selection and Adaptive Feature Fusion [82.2425759608975]
赤外可視物体検出は、赤外画像と可視画像の相補的情報を融合することにより、フルデイ物体検出の堅牢化を目指している。
本稿では,この2つの課題に対処する動的適応型マルチスペクトル検出変換器(DAMSDet)を提案する。
4つの公開データセットの実験は、他の最先端の手法と比較して大幅に改善されている。
論文 参考訳(メタデータ) (2024-03-01T07:03:27Z) - Bi-directional Adapter for Multi-modal Tracking [67.01179868400229]
汎用の双方向アダプタを用いたマルチモーダル視覚プロンプト追跡モデルを提案する。
我々は、モーダリティ固有の情報をあるモーダリティから別のモーダリティへ転送するための、シンプルだが効果的なライト・フィーチャー・アダプタを開発した。
本モデルでは,完全微調整法と素早い学習法の両方と比較して,追跡性能が優れている。
論文 参考訳(メタデータ) (2023-12-17T05:27:31Z) - Multistep feature aggregation framework for salient object detection [0.0]
本稿では,有能な物体検出のための多段階特徴集約フレームワークを提案する。
Diverse Reception (DR) モジュール、Multiscale Interaction (MSI) モジュール、Feature Enhancement (FE) モジュールの3つのモジュールで構成されている。
6つのベンチマークデータセットの実験結果は、MSFAが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2022-11-12T16:13:16Z) - Joint Spatial-Temporal and Appearance Modeling with Transformer for
Multiple Object Tracking [59.79252390626194]
本稿ではTransSTAMという新しい手法を提案する。Transformerを利用して各オブジェクトの外観特徴とオブジェクト間の空間的時間的関係の両方をモデル化する。
提案手法はMOT16, MOT17, MOT20を含む複数の公開ベンチマークで評価され, IDF1とHOTAの両方で明確な性能向上を実現している。
論文 参考訳(メタデータ) (2022-05-31T01:19:18Z) - I^3Net: Implicit Instance-Invariant Network for Adapting One-Stage
Object Detectors [64.93963042395976]
暗黙のInstance-Invariant Network(I3Net)は、ワンステージ検出器の適応に適しています。
i3netは、異なる層における深い特徴の自然な特徴を利用してインスタンス不変な特徴を暗黙的に学習する。
実験によると、I3Netはベンチマークデータセットの最先端のパフォーマンスを上回っている。
論文 参考訳(メタデータ) (2021-03-25T11:14:36Z) - Learning to Generate Content-Aware Dynamic Detectors [62.74209921174237]
サンプル適応型モデルアーキテクチャを自動的に生成する効率的な検出器の設計を新たに導入する。
動的ルーティングの学習を導くために、オブジェクト検出に適したコースツーファインの成層図を紹介します。
MS-COCOデータセットの実験により、CADDetはバニラルーティングに比べて10%少ないFLOPで1.8以上のmAPを達成することが示された。
論文 参考訳(メタデータ) (2020-12-08T08:05:20Z) - RGBT Tracking via Multi-Adapter Network with Hierarchical Divergence
Loss [37.99375824040946]
本稿では,モダリティ共有型,モダリティ特化型,インスタンス認識型ターゲット表現学習を共同で行うための,新しいマルチアダプタネットワークを提案する。
2つのRGBT追跡ベンチマークデータセットの実験は、提案したトラッカーの優れた性能を示す。
論文 参考訳(メタデータ) (2020-11-14T01:50:46Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。