論文の概要: A Competitive Method to VIPriors Object Detection Challenge
- arxiv url: http://arxiv.org/abs/2104.09059v1
- Date: Mon, 19 Apr 2021 05:33:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-21 03:20:46.813993
- Title: A Competitive Method to VIPriors Object Detection Challenge
- Title(参考訳): 物体検出課題を克服するための競争的手法
- Authors: Fei Shen, Xin He, Mengwan Wei and Yi Xie
- Abstract要約: 本稿では,vipriors object detection challengeへの提案の技術的詳細を紹介する。
本稿では,bbox-jitter, grid-mask,mix-upを含むデータ問題に対処する効果的なデータ拡張手法を提案する。
また、より重要なROI機能を学ぶために、堅牢な関心領域(ROI)抽出方法も提示します。
- 参考スコア(独自算出の注目度): 13.024811732127615
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this report, we introduce the technical details of our submission to the
VIPriors object detection challenge. Our solution is based on mmdetction of a
strong baseline open-source detection toolbox. Firstly, we introduce an
effective data augmentation method to address the lack of data problem, which
contains bbox-jitter, grid-mask, and mix-up. Secondly, we present a robust
region of interest (ROI) extraction method to learn more significant ROI
features via embedding global context features. Thirdly, we propose a
multi-model integration strategy to refinement the prediction box, which
weighted boxes fusion (WBF). Experimental results demonstrate that our approach
can significantly improve the average precision (AP) of object detection on the
subset of the COCO2017 dataset.
- Abstract(参考訳): 本稿では,VIPriorsオブジェクト検出問題に対する提案の技術的詳細について紹介する。
我々のソリューションは、強力なベースラインのオープンソース検出ツールボックスのmm検出に基づいている。
まず,bbox-jitter, grid-mask,mix-upを含むデータ問題に対処する効果的なデータ拡張手法を提案する。
次に,グローバルコンテキスト機能を埋め込むことにより,より重要なroi機能を学ぶためのロバストなroi抽出手法を提案する。
第3に,ボックス融合(WBF)を重み付けした予測ボックスを改良する多モデル統合手法を提案する。
実験の結果,COCO2017データセットのサブセットにおけるオブジェクト検出の平均精度(AP)を大幅に向上できることが示された。
関連論文リスト
- PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - MUFASA: Multi-View Fusion and Adaptation Network with Spatial Awareness for Radar Object Detection [3.1212590312985986]
レーダー点雲の空間は 正確な物体検出に 困難を生じさせます
本稿では,レーダポイント雲の包括的特徴抽出手法を提案する。
我々は、VoDデータセット上のレーダベース手法のmAPが50.24%である場合、最先端の結果を得る。
論文 参考訳(メタデータ) (2024-08-01T13:52:18Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Attention Based Feature Fusion For Multi-Agent Collaborative Perception [4.120288148198388]
グラフアテンションネットワーク(GAT)の形での中間的協調認識ソリューションを提案する。
提案手法は,複数の連結エージェント間で交換される中間表現を融合するアテンションベースのアグリゲーション戦略を開発する。
このアプローチは、チャネルレベルと空間レベルの中間特徴写像における重要な領域を適応的に強調することにより、オブジェクト検出精度が向上する。
論文 参考訳(メタデータ) (2023-05-03T12:06:11Z) - MBDF-Net: Multi-Branch Deep Fusion Network for 3D Object Detection [17.295359521427073]
3次元物体検出のためのMulti-Branch Deep Fusion Network (MBDF-Net)を提案する。
最初の段階では、マルチブランチ機能抽出ネットワークは、Adaptive Attention Fusionモジュールを使用して、単一モーダルなセマンティックな特徴からクロスモーダルな融合機能を生成する。
第2段階では、関心領域(RoI)をプールした核融合モジュールを用いて局所的な特徴を改良する。
論文 参考訳(メタデータ) (2021-08-29T15:40:15Z) - Ensembling object detectors for image and video data analysis [98.26061123111647]
本稿では,複数の物体検出器の出力をアンサンブルすることで,画像データ上の境界ボックスの検出性能と精度を向上させる手法を提案する。
本研究では,2段階追跡に基づく検出精度向上手法を提案することで,映像データに拡張する。
論文 参考訳(メタデータ) (2021-02-09T12:38:16Z) - DHARI Report to EPIC-Kitchens 2020 Object Detection Challenge [2.0263791972068628]
本報告では,EPIC-Kitchens Object Detection Challengeへの参加の技術的詳細について述べる。
ダックフィリングとミックスアップ技術を導入して,データの増大と,提案手法のロバスト性を大幅に向上させる。
カテゴリー不均衡のギャップを埋めるために、クラスバランスサンプリングが利用され、テスト結果を大幅に改善する。
論文 参考訳(メタデータ) (2020-06-28T09:29:48Z) - Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。
そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。
CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。
検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文 参考訳(メタデータ) (2020-02-03T02:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。