論文の概要: Solutions for Fine-grained and Long-tailed Snake Species Recognition in
SnakeCLEF 2022
- arxiv url: http://arxiv.org/abs/2207.01216v1
- Date: Mon, 4 Jul 2022 05:55:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-05 15:18:44.658182
- Title: Solutions for Fine-grained and Long-tailed Snake Species Recognition in
SnakeCLEF 2022
- Title(参考訳): SnakeCLEF 2022における細粒・長細スネーク種認識の解法
- Authors: Cheng Zou, Furong Xu, Meng Wang, Wen Li, Yuan Cheng
- Abstract要約: 我々はSnakeCLEF 2022でヘビの種を認識できる方法を紹介した。
いくつかの異なるモデルのアンサンブルにより、3位にランクインしたプライベートスコア82.65%が最終リーダーボードで達成される。
- 参考スコア(独自算出の注目度): 30.8004334312293
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatic snake species recognition is important because it has vast
potential to help lower deaths and disabilities caused by snakebites. We
introduce our solution in SnakeCLEF 2022 for fine-grained snake species
recognition on a heavy long-tailed class distribution. First, a network
architecture is designed to extract and fuse features from multiple modalities,
i.e. photograph from visual modality and geographic locality information from
language modality. Then, logit adjustment based methods are studied to relieve
the impact caused by the severe class imbalance. Next, a combination of
supervised and self-supervised learning method is proposed to make full use of
the dataset, including both labeled training data and unlabeled testing data.
Finally, post processing strategies, such as multi-scale and multi-crop
test-time-augmentation, location filtering and model ensemble, are employed for
better performance. With an ensemble of several different models, a private
score 82.65%, ranking the 3rd, is achieved on the final leaderboard.
- Abstract(参考訳): 自動ヘビ種認識は、ヘビによる死亡や障害の軽減に役立つ可能性があるため重要である。
我々はSnakeCLEF 2022でヘビの種を認識できる方法を紹介した。
まず,ネットワークアーキテクチャは,視覚モダリティから写真,言語モダリティから地理的局所情報など,複数のモダリティから特徴を抽出・融合するように設計されている。
次に,ロジット調整に基づく手法について検討し,重度のクラス不均衡による影響を緩和する。
次に,ラベル付きトレーニングデータとラベルなしテストデータの両方を含むデータセットをフル活用するために,教師付き学習と自己教師付き学習を組み合わせた学習手法を提案する。
最後に,マルチスケールおよびマルチクロップテスト時拡張,位置フィルタリング,モデルアンサンブルといったポスト処理戦略を,パフォーマンス向上に活用する。
いくつかの異なるモデルのアンサンブルで、3位にランク付けされたプライベートスコア82.65%が最終リーダーボードで達成される。
関連論文リスト
- Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Watch out Venomous Snake Species: A Solution to SnakeCLEF2023 [27.7177597421459]
SnakeCLEF2023コンペティションは、ヘビ種識別のための高度なアルゴリズムの開発を目的としている。
本稿では,画像とメタデータの両方を活用する手法を提案する。
本手法は,F1と他の指標を組み合わせて,F1の91.31%のスコアを得る。
論文 参考訳(メタデータ) (2023-07-19T04:59:58Z) - Adjusting Logit in Gaussian Form for Long-Tailed Visual Recognition [41.38745794825594]
特徴量の観点から、長い尾の視覚認識の問題について検討する。
2つの新しいロジット調整法が提案され,計算オーバーヘッドの少ないモデル性能が向上した。
論文 参考訳(メタデータ) (2023-05-18T02:06:06Z) - Explored An Effective Methodology for Fine-Grained Snake Recognition [8.908667065576632]
我々は,様々なメタ情報を活用し,きめ細かい識別を支援するために,強力なマルチモーダルバックボーンを設計する。
ラベルのないデータセットを最大限に活用するために,自己教師付き学習と教師付き学習共同学習を用いる。
本手法は,個人用および公開用データセットにおいて,それぞれ92.7%,89.4%のマクロf1スコアを達成できる。
論文 参考訳(メタデータ) (2022-07-24T02:19:15Z) - On-the-Fly Test-time Adaptation for Medical Image Segmentation [63.476899335138164]
ソースモデルをテスト時にターゲットデータに適応させることは、データシフト問題に対する効率的な解決策である。
本稿では、各畳み込みブロックに適応バッチ正規化層を設けるAdaptive UNetという新しいフレームワークを提案する。
テスト期間中、モデルは新しいテストイメージのみを取り込み、ドメインコードを生成して、テストデータに従ってソースモデルの特徴を適応させる。
論文 参考訳(メタデータ) (2022-03-10T18:51:29Z) - CvS: Classification via Segmentation For Small Datasets [52.821178654631254]
本稿では,分類ラベルをセグメントマップの予測から導出する小型データセットのコスト効率の高い分類器であるCvSを提案する。
我々は,CvSが従来の手法よりもはるかに高い分類結果が得られることを示す多種多様な問題に対して,本フレームワークの有効性を評価する。
論文 参考訳(メタデータ) (2021-10-29T18:41:15Z) - Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
半教師付き長尾認識という新しい認識設定を提案する。
2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文 参考訳(メタデータ) (2021-05-01T00:43:38Z) - Distribution Alignment: A Unified Framework for Long-tail Visual
Recognition [52.36728157779307]
長尾視覚認識のための分散アライメント戦略を提案する。
次に,二段階学習における一般化された再重み付け法を導入して,事前のクラスバランスをとる。
提案手法は, 4つの認識タスクすべてにおいて, 単純で統一されたフレームワークを用いて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-03-30T14:09:53Z) - Graph-based Pyramid Global Context Reasoning with a Saliency-aware
Projection for COVID-19 Lung Infections Segmentation [16.94939282349418]
グラフベースのPyramid Global Context Reasoning(Graph-PGCR)モジュールを提案する。
異種感染症間の長距離依存性をモデル化し、サイズの変化を適応させることができる。
当社のGraph-PGCRモジュールはプラグアンドプレイで、パフォーマンスを向上させるためにあらゆるアーキテクチャに統合できます。
論文 参考訳(メタデータ) (2021-03-07T02:28:10Z) - Temperate Fish Detection and Classification: a Deep Learning based
Approach [6.282069822653608]
本研究では,2段階の深層学習手法を提案する。
最初のステップは、種や性別によらず、画像中の各魚を検出することです。
第2のステップでは、画像中の各魚を事前フィルタリングせずに分類するために、Squeeze-and-Excitation (SE)アーキテクチャを備えた畳み込みニューラルネットワーク(CNN)を採用する。
論文 参考訳(メタデータ) (2020-05-14T12:40:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。