論文の概要: Motif Mining and Unsupervised Representation Learning for BirdCLEF 2022
- arxiv url: http://arxiv.org/abs/2206.04805v1
- Date: Wed, 8 Jun 2022 06:58:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-14 08:52:59.253066
- Title: Motif Mining and Unsupervised Representation Learning for BirdCLEF 2022
- Title(参考訳): BirdCLEF 2022におけるモチーフマイニングと教師なし表現学習
- Authors: Anthony Miyaguchi, Jiangyue Yu, Bryan Cheungvivatpant, Dakota Dudley,
Aniketh Swain
- Abstract要約: 音声モチーフのスペクトル表現における三重項損失を用いたトレーニングデータセットの教師なし表現を実装した。
私たちの最高のモデルは、公開のリーダーボードでスコア0.48で実行されます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We build a classification model for the BirdCLEF 2022 challenge using
unsupervised methods. We implement an unsupervised representation of the
training dataset using a triplet loss on spectrogram representation of audio
motifs. Our best model performs with a score of 0.48 on the public leaderboard.
- Abstract(参考訳): 教師なし手法を用いたBirdCLEF 2022チャレンジの分類モデルを構築した。
音声モチーフのスペクトル表現における三重項損失を用いたトレーニングデータセットの教師なし表現を実装した。
私たちの最高のモデルは、公開リーダーボードでスコア0.48で実行されます。
関連論文リスト
- Transfer Learning with Semi-Supervised Dataset Annotation for Birdcall
Classification [0.0]
本研究では,BirdCLEF 2023コンペティションのための半教師付きデータセットアノテーションを用いたトランスファー学習について検討する。
提案手法では,既存の市販モデルであるBirdNETとMixITを用いて,コンペティションにおける表現とラベル付けの課題に対処する。
論文 参考訳(メタデータ) (2023-06-29T07:56:27Z) - Fine-Grained Hard Negative Mining: Generalizing Mitosis Detection with a
Fifth of the MIDOG 2022 Dataset [1.2183405753834562]
ミトーシス領域一般化チャレンジ2022(MIDOG)の深層学習ソリューションについて述べる。
我々のアプローチは、アグレッシブデータ拡張を用いた回転不変深層学習モデルの訓練である。
我々のモデルアンサンブルは、自動評価後の最終テストセットで.697のF1スコアを達成した。
論文 参考訳(メタデータ) (2023-01-03T13:06:44Z) - Robustness of Unsupervised Representation Learning without Labels [92.90480374344777]
モデルとタスクに依存しない,ラベルのない,教師なしのロバストネス尺度のファミリーを提案する。
本研究は, 線形プローブによる検証を行い, MOCOv2の場合, 対向トレーニングの結果が3倍の精度で得られたことを示す。
論文 参考訳(メタデータ) (2022-10-08T18:03:28Z) - The ReturnZero System for VoxCeleb Speaker Recognition Challenge 2022 [0.0]
RTZR VoxCeleb Speaker Recognition Challenge 2022 (VoxSRC-22) の上位候補について述べる。
最上位のシステムは7つのモデルの融合であり、3種類のモデルアーキテクチャを含んでいる。
最後の提出はVoxSRC22テストセットで0.165 DCFと2.912% EERを達成した。
論文 参考訳(メタデータ) (2022-09-21T06:54:24Z) - Fine-Grained Predicates Learning for Scene Graph Generation [155.48614435437355]
Fine-Grained Predicates Learningは、シーングラフ生成タスクにおいて、識別困難な述語間の差別化を目的としている。
本稿では,SGGモデルによる詳細な述語ペアの探索を支援するPredicate Latticeを提案する。
次に、カテゴリ識別損失とエンティティ識別損失を提案し、どちらも粒度の細かい述語の識別に寄与する。
論文 参考訳(メタデータ) (2022-04-06T06:20:09Z) - The JHU submission to VoxSRC-21: Track 3 [31.804401484416452]
本報告では、Voxceleb Speaker Recognition Challenge 2021 Track 3に提出されたジョンズ・ホプキンス大学話者認識システムについて述べる。
私たちの全体的なトレーニングプロセスは、昨年のVoxSRC 2020チャレンジで提案されたものと似ています。
これは、Voxceleb1 test o、VoxSRC-21 Validation、テストトライアルにおいて、EER(%)の1.89、6.50、および6.89をそれぞれ示す、最も優れた提案モデルである。
論文 参考訳(メタデータ) (2021-09-28T01:30:10Z) - Two-Stream Consensus Network: Submission to HACS Challenge 2021
Weakly-Supervised Learning Track [78.64815984927425]
弱い監督による時間的行動ローカライゼーションの目標は、ビデオの興味ある動作を時間的に特定し、分類することである。
この課題では,2ストリームコンセンサスネットワーク(TSCN)を主要なフレームワークとして採用しています。
この課題では,本手法が今後の学術研究のベースラインとなることを期待して,第2位にランクインした。
論文 参考訳(メタデータ) (2021-06-21T03:36:36Z) - Semi-supervised Facial Action Unit Intensity Estimation with Contrastive
Learning [54.90704746573636]
提案手法では,手動でキーフレームを選択する必要はなく,2%の注釈付きフレームで最先端の結果を生成できる。
提案手法は, ランダムに選択したデータに対してわずか2%の費用で作業した場合に, 既存の手法よりも優れていることを実験的に検証した。
論文 参考訳(メタデータ) (2020-11-03T17:35:57Z) - A Sober Look at the Unsupervised Learning of Disentangled
Representations and their Evaluation [63.042651834453544]
モデルとデータの両方に帰納的バイアスを伴わずに,非教師なしの非教師付き表現学習は不可能であることを示す。
異なる手法は、対応する損失によって「強化」された特性を効果的に強制するが、よく見分けられたモデルは監督なしでは特定できないように見える。
以上の結果から,遠絡学習における今後の研究は,帰納的バイアスと(単純に)監督の役割を明確化すべきであることが示唆された。
論文 参考訳(メタデータ) (2020-10-27T10:17:15Z) - MoPro: Webly Supervised Learning with Momentum Prototypes [140.76848620407168]
本稿では,教師付き学習におけるアノテーションの可読性を損なうことなく,Webで教師付き表現学習手法を提案する。
MoProは、弱いラベル付きノイズデータセットであるWebVisionで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-09-17T00:59:59Z) - Self-Supervised Contrastive Learning for Unsupervised Phoneme
Segmentation [37.054709598792165]
このモデルは畳み込みニューラルネットワークであり、生波形上で直接動作する。
ノイズコントラスト推定原理を用いて信号のスペクトル変化を同定する。
テスト時には、モデル出力にピーク検出アルゴリズムを適用して最終境界を生成する。
論文 参考訳(メタデータ) (2020-07-27T12:10:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。