論文の概要: 2nd Place Solution for SODA10M Challenge 2021 -- Continual Detection
Track
- arxiv url: http://arxiv.org/abs/2110.13064v1
- Date: Mon, 25 Oct 2021 15:58:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-26 14:11:14.360735
- Title: 2nd Place Solution for SODA10M Challenge 2021 -- Continual Detection
Track
- Title(参考訳): 第2位SoDA10Mチャレンジ2021 - 連続検出トラック
- Authors: Manoj Acharya, Christopher Kanan
- Abstract要約: ResNet50-FPNをベースラインとして採用し、最終的な提案モデルのいくつかの改善を試みる。
タスク固有のリプレイ方式,学習率スケジューリング,モデルキャリブレーション,原画像スケールの使用により,画像中の大小オブジェクトの性能向上が期待できる。
- 参考スコア(独自算出の注目度): 35.06282647572304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this technical report, we present our approaches for the continual object
detection track of the SODA10M challenge. We adapt ResNet50-FPN as the baseline
and try several improvements for the final submission model. We find that
task-specific replay scheme, learning rate scheduling, model calibration, and
using original image scale helps to improve performance for both large and
small objects in images. Our team `hypertune28' secured the second position
among 52 participants in the challenge. This work will be presented at the ICCV
2021 Workshop on Self-supervised Learning for Next-Generation Industry-level
Autonomous Driving (SSLAD).
- Abstract(参考訳): 本報告では,soda10mチャレンジの連続的物体検出トラックに対するアプローチについて述べる。
ResNet50-FPNをベースラインとして採用し、最終的な提案モデルのいくつかの改善を試みる。
我々は,タスク固有のリプレイスキーム,学習率スケジューリング,モデルキャリブレーション,およびオリジナル画像スケールの使用が,画像内の大小いずれのオブジェクトのパフォーマンス向上に役立つことを見出した。
我々のチーム「hypertune28」は52人中2番目のポジションを確保した。
この研究はICCV 2021 Workshop on Self-supervised Learning for Next-Generation Industry-level Autonomous Driving (SSLAD)で発表される。
関連論文リスト
- Precise Drive with VLM: First Prize Solution for PRCV 2024 Drive LM challenge [8.941623670652389]
本報告ではPRCVチャレンジの方法論について概説する。
シナリオの認知と意思決定に重点を置いています。
我々のモデルは0.6064のスコアを獲得し、競技の最終結果の最初の賞を確保した。
論文 参考訳(メタデータ) (2024-11-05T11:00:55Z) - Fine-Grained Hard Negative Mining: Generalizing Mitosis Detection with a
Fifth of the MIDOG 2022 Dataset [1.2183405753834562]
ミトーシス領域一般化チャレンジ2022(MIDOG)の深層学習ソリューションについて述べる。
我々のアプローチは、アグレッシブデータ拡張を用いた回転不変深層学習モデルの訓練である。
我々のモデルアンサンブルは、自動評価後の最終テストセットで.697のF1スコアを達成した。
論文 参考訳(メタデータ) (2023-01-03T13:06:44Z) - Highly Accurate Dichotomous Image Segmentation [139.79513044546]
Dichotomous Image segmentation (DIS)と呼ばれる新しいタスクは、自然画像から高度に正確な物体を抽出することを目的としている。
私たちは、5,470の高解像度画像(例えば、2K、4K以上の画像)を含む最初の大規模データセットdis5Kを収集します。
また、Disdisモデルトレーニングのための特徴レベルとマスクレベルの両方のガイダンスを用いて、単純な中間監視ベースライン(IS-Net)を導入する。
論文 参考訳(メタデータ) (2022-03-06T20:09:19Z) - Workshop on Autonomous Driving at CVPR 2021: Technical Report for
Streaming Perception Challenge [57.647371468876116]
本稿では,現実的な自律運転シナリオのためのリアルタイム2次元物体検出システムについて紹介する。
私たちの検出器は、YOLOXと呼ばれる新しい設計のYOLOモデルで構築されています。
Argoverse-HDデータセットでは,検出のみのトラック/トラックで2位を7.8/6.1上回る41.0ストリーミングAPを達成した。
論文 参考訳(メタデータ) (2021-07-27T06:36:06Z) - NTIRE 2021 Multi-modal Aerial View Object Classification Challenge [88.89190054948325]
CVPR の NTIRE 2021 ワークショップと共同で,MAVOC (Multi-modal Aerial View Object Classification) の最初の挑戦を紹介した。
この課題は、EOとSAR画像を用いた2つの異なるトラックで構成されている。
本コンペティションで提案した最上位の手法について検討し,その成果を目視テストセットで評価する。
論文 参考訳(メタデータ) (2021-07-02T16:55:08Z) - Two-Stream Consensus Network: Submission to HACS Challenge 2021
Weakly-Supervised Learning Track [78.64815984927425]
弱い監督による時間的行動ローカライゼーションの目標は、ビデオの興味ある動作を時間的に特定し、分類することである。
この課題では,2ストリームコンセンサスネットワーク(TSCN)を主要なフレームワークとして採用しています。
この課題では,本手法が今後の学術研究のベースラインとなることを期待して,第2位にランクインした。
論文 参考訳(メタデータ) (2021-06-21T03:36:36Z) - Relation Modeling in Spatio-Temporal Action Localization [25.09128518931016]
本稿では,CVPR 2021 における AVA-Kinetics Crossover Challenge of ActivityNet ワークショップの報告を行う。
提案手法は,関係時間的行動検出に複数種類の関係手法を用いており,大規模ビデオデータセットのエンドツーエンドトレーニングにおいて,複数の関係モデリングを統合するためのトレーニング戦略を採用している。
AVA-Kineticsのテストセットで40.67 mAPを達成した。
論文 参考訳(メタデータ) (2021-06-15T11:40:18Z) - LID 2020: The Learning from Imperfect Data Challenge Results [242.86700551532272]
Imperfect Dataワークショップからの学習は、新しいアプローチの開発に刺激を与え、促進することを目的としている。
我々は、弱教師付き学習環境における最先端のアプローチを見つけるために、3つの課題を編成する。
この技術的レポートは、課題のハイライトを要約している。
論文 参考訳(メタデータ) (2020-10-17T13:06:12Z) - 2nd Place Solution to ECCV 2020 VIPriors Object Detection Challenge [24.368684444351068]
我々は、最先端のデータ強化戦略、モデル設計、および後処理アンサンブル手法を用いることで、データ不足の難しさを克服し、競争結果を得ることができることを示す。
当社の全体的な検出システムは,COCO 2017の検証セット上で,事前トレーニングや移行学習の重み付けなしで,わずか10Kのトレーニングイメージを使用して36.6$%のAPを達成している。
論文 参考訳(メタデータ) (2020-07-17T09:21:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。