論文の概要: 3rd Place Solution to Google Landmark Recognition Competition 2021
- arxiv url: http://arxiv.org/abs/2110.02794v2
- Date: Thu, 7 Oct 2021 14:43:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-08 12:00:59.121050
- Title: 3rd Place Solution to Google Landmark Recognition Competition 2021
- Title(参考訳): googleのランドマーク認識競争、2021年の3位に
- Authors: Cheng Xu, Weimin Wang, Shuai Liu, Yong Wang, Yuxiang Tang, Tianling
Bian, Yanyu Yan, Qi She, Cheng Yang
- Abstract要約: Google Landmark Recognition 2021コンペティションのソリューションを紹介します。
アンサンブルされたモデルは、民間のリーダーボードで0.489点を獲得し、2021年のGoogleランドマーク認識コンペティションで3位となった。
- 参考スコア(独自算出の注目度): 17.59843220514826
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we show our solution to the Google Landmark Recognition 2021
Competition. Firstly, embeddings of images are extracted via various
architectures (i.e. CNN-, Transformer- and hybrid-based), which are optimized
by ArcFace loss. Then we apply an efficient pipeline to re-rank predictions by
adjusting the retrieval score with classification logits and non-landmark
distractors. Finally, the ensembled model scores 0.489 on the private
leaderboard, achieving the 3rd place in the 2021 edition of the Google Landmark
Recognition Competition.
- Abstract(参考訳): 本稿では,google landmark recognition 2021 コンペティションに対する我々の解決策を示す。
まず、画像の埋め込みは様々なアーキテクチャ(CNN-、Transformer-、ハイブリッドベース)を通して抽出され、ArcFaceロスによって最適化される。
次に,分類ロジットと非ランドマークトラクタによる検索スコアの調整により,予測の再ランクに効率的なパイプラインを適用する。
最後に、アンサンブルされたモデルはプライベートリーダーボードで0.489点を獲得し、2021年のGoogle Landmark Recognition Competitionで3位を獲得した。
関連論文リスト
- Hierarchical Audio-Visual Information Fusion with Multi-label Joint
Decoding for MER 2023 [51.95161901441527]
本稿では,離散的感情と次元的感情の両方を認識するための新しい枠組みを提案する。
基礎モデルから抽出した深い特徴は、生ビデオの頑健な音響的および視覚的表現として使用される。
我々の最終システムは最先端のパフォーマンスを達成し、MER-MULTIサブチャレンジのリーダーボードで3位にランクインする。
論文 参考訳(メタデータ) (2023-09-11T03:19:10Z) - EFaR 2023: Efficient Face Recognition Competition [51.77649060180531]
バイオメトリックス国際会議(IJCB 2023)における効率的な顔認識コンペティション(EFaR)の概要について述べる。
この競技会は6つの異なるチームから17の応募を受けた。
提案したソリューションは、様々なベンチマークで達成された検証精度の重み付けスコアと、浮動小数点演算数とモデルサイズによって与えられるデプロイ可能性に基づいてランク付けされる。
論文 参考訳(メタデータ) (2023-08-08T09:58:22Z) - FB-OCC: 3D Occupancy Prediction based on Forward-Backward View
Transformation [79.41536932037822]
FB-BEVは前方投影を用いた近縁カメラを用いた鳥眼視知覚設計である。
設計と最適化の結果、最先端のmIoUスコアはnuScenesデータセットで54.19%となり、チャレンジトラックで1位となった。
論文 参考訳(メタデータ) (2023-07-04T05:55:54Z) - 2nd Place Solution to Google Landmark Retrieval 2020 [15.620571007364362]
本稿では,Google Landmark Retrieval Competition 2020における第2位のソリューションについて述べる。
後処理を伴わないランドマーク検索のためのグローバル特徴モデルのトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-07-11T10:14:14Z) - Google Landmark Retrieval 2021 Competition Third Place Solution [5.2576738414324335]
我々は、検索と認識トラックの両方に対して、Google Landmark Challenges 2021にソリューションを提示する。
どちらのソリューションも、動的マージンを持つSub-center ArcFaceに基づくトランスフォーマーとConvNetモデルのアンサンブルである。
論文 参考訳(メタデータ) (2021-10-09T17:56:40Z) - 2nd Place Solution to Google Landmark Retrieval 2021 [1.2776569352615768]
本稿では,Google Landmark Retrieval 2021 Competition on Kaggleに関する2番目のソリューションを提案する。
本手法は, 個人の再識別によるトレーニングトリックをベースラインとして, 国別タグによるトレーニング画像を選択するための大陸対応サンプリング戦略を提示し, 検索タスクに対してランドマーク・カウンタリー・アウェア・リオークティング(Landmark-Country aware re rank)を提案する。
論文 参考訳(メタデータ) (2021-10-08T17:59:58Z) - SAIC_Cambridge-HuPBA-FBK Submission to the EPIC-Kitchens-100 Action
Recognition Challenge 2021 [80.05652375838073]
本報告では,EPIC-Kitchens-100 Action Recognition Challenge 2021への提出の技術的詳細について述べる。
我々の提出は、公共のリーダーボードで見ることができ、RGBのみを使用して、44.82%のトップ1の行動認識精度を達成した。
論文 参考訳(メタデータ) (2021-10-06T16:29:47Z) - Google Landmark Recognition 2020 Competition Third Place Solution [5.1215007533994]
われわれは、Google Landmark Recognition 2020コンペティションの3位となるソリューションを提示する。
これは、サブセンターのArcFaceモデルのみのグローバル機能のアンサンブルである。
クラスサイズの調律可能なマージン関数群であるArcFace損失の動的マージンを導入する。
論文 参考訳(メタデータ) (2020-10-11T21:30:43Z) - 1st Place Solution to Google Landmark Retrieval 2020 [0.0]
本稿は、Kaggleに関するGoogle Landmark Retrieval 2020コンペティションの第1位となるソリューションを提示する。
このソリューションは、多数のランドマーククラスを分類するためのメトリックラーニングに基づいており、2つのトレインデータセットによるトランスファーラーニングを使用している。
論文 参考訳(メタデータ) (2020-08-24T05:45:20Z) - 1st Place Solutions for OpenImage2019 -- Object Detection and Instance
Segmentation [116.25081559037872]
この記事では,2つのチャンピオンチーム,検出トラックのMMfruit'とセグメンテーショントラックのMMfruitSeg'のソリューションについて,OpenImage Challenge 2019で紹介する。
一般に、対象検出器の場合、バックボーンの端の共有特徴は分類と回帰の両方に適さないことが知られている。
自己学習型最適特徴抽出によりオブジェクトの分類と回帰を分離するデカップリングヘッド(DH)を提案する。
論文 参考訳(メタデータ) (2020-03-17T06:45:07Z) - Take an Emotion Walk: Perceiving Emotions from Gaits Using Hierarchical Attention Pooling and Affective Mapping [55.72376663488104]
本稿では、ビデオやモーションキャプチャーデータから得られた歩行スタイルから、知覚された人間の感情を分類するためのオートエンコーダに基づくアプローチを提案する。
3次元ポーズシーケンスから抽出した各ステップのポーズにおける各関節の動きを考慮し、これらの関節の動きをエンコーダに階層的にプールする。
我々はデコーダを訓練し、潜伏埋め込みからトップダウン方式で1ステップ当たりの関節の動きを再構築する。
論文 参考訳(メタデータ) (2019-11-20T05:04:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。