Fugu-MT 論文翻訳(概要): Pixel-Semantic Revise of Position Learning A One-Stage Object Detector with A Shared Encoder-Decoder

論文の概要: Pixel-Semantic Revise of Position Learning A One-Stage Object Detector with A Shared Encoder-Decoder

arxiv url: http://arxiv.org/abs/2001.01057v2
Date: Tue, 29 Sep 2020 02:28:34 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-14 12:39:00.524575
Title: Pixel-Semantic Revise of Position Learning A One-Stage Object Detector with A Shared Encoder-Decoder
Title（参考訳）: 共有エンコーダ・デコーダを用いた一段階物体検出器の位置学習の画素論的修正
Authors: Qian Li, Nan Guo, Xiaochun Ye, Dongrui Fan, and Zhimin Tang
Abstract要約: 異なる手法がオブジェクトを適応的に検出することを分析する。いくつかの最先端検出器は、異なる特徴ピラミッドと多レベルセマンティック情報を強化するための多くのメカニズムを組み合わせている。この研究は、注意機構を持つ共有エンコーダデコーダを持つアンカーフリー検出器によって対処される。
参考スコア（独自算出の注目度）: 5.371825910267909
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recently, many methods have been proposed for object detection. They cannot detect objects by semantic features, adaptively. In this work, according to channel and spatial attention mechanisms, we mainly analyze that different methods detect objects adaptively. Some state-of-the-art detectors combine different feature pyramids with many mechanisms to enhance multi-level semantic information. However, they require more cost. This work addresses that by an anchor-free detector with shared encoder-decoder with attention mechanism, extracting shared features. We consider features of different levels from backbone (e.g., ResNet-50) as the basis features. Then, we feed the features into a simple module, followed by a detector header to detect objects. Meantime, we use the semantic features to revise geometric locations, and the detector is a pixel-semantic revising of position. More importantly, this work analyzes the impact of different pooling strategies (e.g., mean, maximum or minimum) on multi-scale objects, and finds the minimum pooling improve detection performance on small objects better. Compared with state-of-the-art MNC based on ResNet-101 for the standard MSCOCO 2014 baseline, our method improves detection AP of 3.8%.
Abstract（参考訳）: 近年,物体検出のための手法が多数提案されている。意味的特徴によって、適応的にオブジェクトを検出できない。本研究は, チャネルや空間的注意機構に基づいて, 物体を適応的に検出する手法を主に分析する。いくつかの最先端検出器は、異なる特徴ピラミッドと多レベルセマンティック情報を強化するための多くのメカニズムを組み合わせる。しかし、よりコストがかかる。この研究は、注意機構を持つ共有エンコーダデコーダを備えたアンカーフリー検出器によって、共有特徴を抽出する。バックボーン(ResNet-50など)から異なるレベルの機能を基本機能として検討する。そして、これらの特徴を単純なモジュールに供給し、続いて検出器ヘッダーでオブジェクトを検出します。意味的特徴を幾何学的位置の修正に利用し、検出器は位置のピクセル・セマンティックな修正である。さらに重要なことは、この研究がマルチスケールオブジェクトに対する様々なプーリング戦略(平均値または最小値)の影響を分析し、最小プールによって小さなオブジェクトの検出性能が向上することである。標準 MSCOCO 2014 ベースラインの ResNet-101 に基づく最先端 MNC と比較して,本手法では検出精度が3.8%向上した。

関連論文リスト

Learning to Borrow Features for Improved Detection of Small Objects in Single-Shot Detectors [0.0]
そこで本研究では,クラス内のより大規模で意味的にリッチなインスタンスから,小さなオブジェクト表現を識別的特徴の「バラバラ化」を可能にする新しいフレームワークを提案する。本手法は, 複雑な視覚環境下でのロバストな物体検出に有望な方向を提供するため, ベースライン法よりも小さな物体検出精度を著しく向上させる。
論文参考訳（メタデータ） (2025-04-30T01:18:33Z)
Toward Realistic Camouflaged Object Detection: Benchmarks and Method [11.279532701331647]
カモフラージュされたオブジェクト検出(COD)は、主にセマンティックまたはインスタンスセグメンテーション手法に依存している。カモフラージュ検出のためのCAFR(camouflage-aware feature refinement)戦略を提案する。 CAFRは、大型モデルの以前の知識の中で、現在の物体の明確な認識を十分に利用し、背景と前景の区別を深く理解する検出器を支援する。
論文参考訳（メタデータ） (2025-01-13T13:04:00Z)
Visible and Clear: Finding Tiny Objects in Difference Map [50.54061010335082]
本稿では,検出モデルに自己再構成機構を導入し,それと微小物体との強い相関関係を明らかにする。具体的には、再構成画像と入力の差分マップを構築して、検出器の首の内側に再構成ヘッドを配置し、小さな物体に対して高い感度を示す。さらに、小さな特徴表現をより明確にするために、差分マップガイド機能拡張(DGFE)モジュールを開発する。
論文参考訳（メタデータ） (2024-05-18T12:22:26Z)
Skipped Feature Pyramid Network with Grid Anchor for Object Detection [6.99246486061412]
特徴ピラミッドの各レベルにおいてより強力な意味論を得るために,スキップ接続を提案する。提案手法では,各レベルが一定スケールの物体を検知する責任を負うことがより合理的である。
論文参考訳（メタデータ） (2023-10-22T23:27:05Z)
SimPLR: A Simple and Plain Transformer for Efficient Object Detection and Segmentation [49.65221743520028]
マルチスケールインダクティブバイアスをアテンション機構にシフトさせることで, プレーン検出器SimPLRが動作可能であることを示す。我々はSimPLRとスケールアウェアスを併用した実験を通して、単純なアーキテクチャでありながら、マルチスケールビジョントランスフォーマーの代替品と競合することを発見した。
論文参考訳（メタデータ） (2023-10-09T17:59:26Z)
Fast and Accurate Object Detection on Asymmetrical Receptive Field [0.0]
本稿では,物体検出精度を受容場の変化の観点から改善する手法を提案する。 YOLOv5の頭部の構造は、非対称なプール層を付加することによって改変される。本稿では, 従来の YOLOv5 モデルと比較し, いくつかのパラメータから解析する。
論文参考訳（メタデータ） (2023-03-15T23:59:18Z)
Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。 ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2023-03-14T11:53:12Z)
Hierarchical Point Attention for Indoor 3D Object Detection [111.04397308495618]
本研究は、点ベース変圧器検出器の汎用階層設計として、2つの新しい注意操作を提案する。まず、よりきめ細かい特徴学習を可能にするために、シングルスケールの入力機能からマルチスケールトークンを構築するマルチスケール注意(MS-A)を提案する。第2に,適応型アテンション領域を持つサイズ適応型ローカルアテンション(Local-A)を提案する。
論文参考訳（メタデータ） (2023-01-06T18:52:12Z)
Rethinking the Detection Head Configuration for Traffic Object Detection [11.526701794026641]
本稿では,検出ヘッドとオブジェクト分布のマッチングに基づいて,軽量なトラフィックオブジェクト検出ネットワークを提案する。提案したモデルでは,BDD100Kデータセットと提案したETFOD-v2データセットの他のモデルよりも,より競争力のあるパフォーマンスを実現している。
論文参考訳（メタデータ） (2022-10-08T02:23:57Z)
Multi-patch Feature Pyramid Network for Weakly Supervised Object Detection in Optical Remote Sensing Images [39.25541709228373]
マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。 MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
論文参考訳（メタデータ） (2021-08-18T09:25:39Z)
Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文参考訳（メタデータ） (2020-11-17T09:39:42Z)
Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。 5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文参考訳（メタデータ） (2020-07-17T15:41:37Z)
MultiResolution Attention Extractor for Small Object Detection [40.74232149130456]
小さい物体は解像度が低く、小さいため検出が難しい。人間の視覚の「注意」メカニズムにインスパイアされ、我々は2つの特徴抽出手法を利用して、小さな物体の最も有用な情報をマイニングする。
論文参考訳（メタデータ） (2020-06-10T16:47:56Z)
Hit-Detector: Hierarchical Trinity Architecture Search for Object Detection [67.84976857449263]
本稿では,オブジェクト検出器のすべてのコンポーネントに対して,効率的なアーキテクチャを同時に発見するための階層型三元探索フレームワークを提案する。そこで我々は,各コンポーネントのエンドツーエンド検索を効率的に行うために,異なるコンポーネントに対して異なるサブ検索空間を自動的にスクリーニングする新しい手法を採用した。検索したアーキテクチャ、すなわちhit-Detectorは、27Mパラメータを持つCOCOミニバルセット上で41.4%のmAPを達成する。
論文参考訳（メタデータ） (2020-03-26T10:20:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。