論文の概要: Focus on Local Regions for Query-based Object Detection
- arxiv url: http://arxiv.org/abs/2310.06470v1
- Date: Tue, 10 Oct 2023 09:41:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-11 18:01:32.750871
- Title: Focus on Local Regions for Query-based Object Detection
- Title(参考訳): 問合せ型オブジェクト検出のための局所領域に着目して
- Authors: Hongbin Xu, Yamei Xia, Shuai Zhao, Bo Cheng
- Abstract要約: 本稿では,デコーダのみを備えたトランスフォーマー型アーキテクチャであるFoLRを提案する。
我々は無関係な物体間の接続を分離することで自己認識機構を強化する。
また、クエリの局所領域に基づいて効率的な特徴を抽出する適応サンプリング手法を設計する。
- 参考スコア(独自算出の注目度): 14.982147587695652
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Query-based methods have garnered significant attention in object detection
since the advent of DETR, the pioneering end-to-end query-based detector.
However, these methods face challenges like slow convergence and suboptimal
performance. Notably, self-attention in object detection often hampers
convergence due to its global focus. To address these issues, we propose FoLR,
a transformer-like architecture with only decoders. We enhance the
self-attention mechanism by isolating connections between irrelevant objects
that makes it focus on local regions but not global regions. We also design the
adaptive sampling method to extract effective features based on queries' local
regions from feature maps. Additionally, we employ a look-back strategy for
decoders to retain prior information, followed by the Feature Mixer module to
fuse features and queries. Experimental results demonstrate FoLR's
state-of-the-art performance in query-based detectors, excelling in convergence
speed and computational efficiency.
- Abstract(参考訳): クエリーベースの手法は、エンドツーエンドのクエリーベースの検出器であるDETRの出現以来、オブジェクト検出に大きな注目を集めてきた。
しかし、これらの手法は低収束や準最適性能といった課題に直面している。
特に、オブジェクト検出における自己着脱は、そのグローバルな焦点によって収束を阻害することが多い。
これらの問題に対処するために,デコーダのみを有するトランスフォーマーのようなアーキテクチャであるFoLRを提案する。
我々は,グローバル領域ではなく局所領域に焦点をあてる無関係オブジェクト間の接続を分離することにより,自己着脱機構を強化する。
また,特徴マップからクエリの局所領域に基づく効果的な特徴を抽出する適応的サンプリング手法を設計する。
さらに、デコーダが事前情報を保持するためのルックバック戦略と、機能とクエリを融合するfeature mixerモジュールを採用しています。
クエリベースの検出器におけるFoLRの最先端性能を実証し,収束速度と計算効率に優れていた。
関連論文リスト
- Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - DQnet: Cross-Model Detail Querying for Camouflaged Object Detection [54.82390534024954]
カモフラージュされた物体検出のための畳み込みニューラルネットワーク(CNN)は、完全な対象範囲を無視しながら局所的な識別領域を活性化する傾向がある。
本稿では,CNNの内在的特性から部分的活性化が引き起こされることを論じる。
完全なオブジェクト範囲を活性化できる特徴マップを得るために,クロスモデル詳細クエリネットワーク(DQnet)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-16T06:23:58Z) - Bagging Regional Classification Activation Maps for Weakly Supervised
Object Localization [11.25759292976175]
BagCAMsは、ローカライゼーションタスクのためのよく訓練された分類器をより良く投影するためのプラグアンドプレイ機構である。
我々のBagCAMは、地域ローカライザの集合を定義するために、提案した地域ローカライザ生成戦略を採用する。
実験により,提案したBagCAMを用いることで,ベースラインWSOL法の性能が向上することが示唆された。
論文 参考訳(メタデータ) (2022-07-16T03:03:01Z) - Delving into Sequential Patches for Deepfake Detection [64.19468088546743]
近年の顔偽造技術は、ほとんど追跡不可能なディープフェイクビデオを生み出しており、悪意のある意図で活用することができる。
従来の研究では、ディープフェイク法にまたがる一般化を追求する上で、局所的な低レベルな手がかりと時間的情報の重要性が指摘されてきた。
本稿では,局所的・時間的変換をベースとしたDeepfake Detectionフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-06T16:46:30Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Local Context Attention for Salient Object Segmentation [5.542044768017415]
本研究では,一様表現型アーキテクチャで局所強化特徴写像を生成するための新しいローカルコンテキスト注意ネットワーク(LCANet)を提案する。
提案するネットワークでは,粗い予測と大域的コンテキストの間の相関特徴写像を計算し,アテンショナル・コリレーション・フィルタ (ACF) モジュールを導入している。
いくつかの有能なオブジェクトセグメンテーションデータセットに対して総合的な実験を行い、提案したLCANetの最先端手法に対する優れた性能を実証した。
論文 参考訳(メタデータ) (2020-09-24T09:20:06Z) - Hierarchical Context Embedding for Region-based Object Detection [40.9463003508027]
階層型コンテキスト埋め込み(HCE)フレームワークは、プラグイン・アンド・プレイコンポーネントとして適用することができる。
文脈依存型オブジェクトカテゴリの認識を促進するために,画像レベルのカテゴリ埋め込みモジュールを提案する。
画像全体と関心領域の両方に階層的に埋め込まれたコンテキスト情報を活用することで、新しいRoI機能を生成する。
論文 参考訳(メタデータ) (2020-08-04T05:33:22Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。