論文の概要: Merlin L48 Spectrogram Dataset
- arxiv url: http://arxiv.org/abs/2511.00252v1
- Date: Fri, 31 Oct 2025 20:51:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.692171
- Title: Merlin L48 Spectrogram Dataset
- Title(参考訳): Merlin L48 Spectrogram Dataset
- Authors: Aaron Sun, Subhransu Maji, Grant Van Horn,
- Abstract要約: 我々は,鳥の音の録音から得られた,細粒度で実世界のマルチラベルデータセットであるL48データセットを紹介した。
L48は、困難できめ細かなドメインに単一陽性のアノテーションを付加した自然なSPML設定を提供する。
既存のSPML手法をL48上でベンチマークし、合成データセットと比較して大きな性能差を観測する。
- 参考スコア(独自算出の注目度): 22.177897988238275
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In the single-positive multi-label (SPML) setting, each image in a dataset is labeled with the presence of a single class, while the true presence of other classes remains unknown. The challenge is to narrow the performance gap between this partially-labeled setting and fully-supervised learning, which often requires a significant annotation budget. Prior SPML methods were developed and benchmarked on synthetic datasets created by randomly sampling single positive labels from fully-annotated datasets like Pascal VOC, COCO, NUS-WIDE, and CUB200. However, this synthetic approach does not reflect real-world scenarios and fails to capture the fine-grained complexities that can lead to difficult misclassifications. In this work, we introduce the L48 dataset, a fine-grained, real-world multi-label dataset derived from recordings of bird sounds. L48 provides a natural SPML setting with single-positive annotations on a challenging, fine-grained domain, as well as two extended settings in which domain priors give access to additional negative labels. We benchmark existing SPML methods on L48 and observe significant performance differences compared to synthetic datasets and analyze method weaknesses, underscoring the need for more realistic and difficult benchmarks.
- Abstract(参考訳): シングル陽性のマルチラベル(SPML)設定では、データセット内の各イメージは単一のクラスの存在とラベル付けされるが、他のクラスの真の存在は分かっていない。
課題は、部分的にラベル付けされた設定と完全な教師付き学習の間のパフォーマンスギャップを狭めることです。
以前のSPML法は、Pascal VOC、COCO、NAS-WIDE、CUB200のような完全な注釈付きデータセットから、ランダムに1つの正のラベルをサンプリングして生成された合成データセットに基づいて開発され、ベンチマークされた。
しかし、この合成アプローチは現実世界のシナリオを反映せず、難解な誤分類につながるような微細な複雑さを捉えることに失敗する。
本研究では,鳥の鳴き声の録音から得られた,細粒度で実世界のマルチラベルデータセットであるL48データセットを紹介する。
L48は、難易度の高いきめ細かなドメインに単一陽性のアノテーションを付加した自然なSPML設定と、ドメイン先行が追加の負のラベルにアクセスするための2つの拡張設定を提供する。
我々は,L48上で既存のSPML手法をベンチマークし,合成データセットと比較して大きな性能差を観測し,手法の弱点を分析し,より現実的で困難なベンチマークの必要性を強調する。
関連論文リスト
- Doubling Your Data in Minutes: Ultra-fast Tabular Data Generation via LLM-Induced Dependency Graphs [15.476573983202162]
タブラルデータはさまざまなドメインで重要であるが、プライバシの懸念と収集コストのため、高品質なデータセットは依然として不足している。
本稿では,SPADA for SPArse Dependency-driven Augmentationを提案する。
4つのデータセットの実験により、SPADAは拡散ベースの手法と比較して制約違反を4%削減し、LCMベースのベースラインよりも約9500倍高速に生成することが示された。
論文 参考訳(メタデータ) (2025-07-25T14:43:50Z) - TACOS: Open Tagging and Comparative Scoring for Instruction Fine-Tuning Data Selection [9.020110377060153]
We present TACOS, a innovative method that integrates Open Tagging and Comparison Scoring for IFT data selection。
データの多様性を捉えるために、LLMを活用して、オープンドメインタグを人間のクエリに割り当てる。
本稿では,クラスタ内のサンプルの相対的品質評価を可能にする比較評価手法を提案する。
論文 参考訳(メタデータ) (2025-07-04T15:46:07Z) - MLLM-Selector: Necessity and Diversity-driven High-Value Data Selection for Enhanced Visual Instruction Tuning [69.7347209018861]
視覚的インストラクションのチューニングに有用なデータを自動的に識別するMLLM-Selectorを提案する。
モデル性能を向上させるために,VITデータプールの各サンプルの必要なスコアを算出し,サンプルのピボットを同定する。
以上の結果から,データ選択における必要条件と多様性の混合の重要性が指摘され,MLLMセレクタの創出につながった。
論文 参考訳(メタデータ) (2025-03-26T12:42:37Z) - Boosting Single Positive Multi-label Classification with Generalized Robust Loss [12.942661993684881]
MLL(Multi-label Learning)は、完全入手が難しい包括的なマルチセマンティックアノテーションを必要とする。
本稿では,各画像が1つの正のラベルに関連付けられているSPML(Single Positive Multi-label Learning)について検討する。
既存のSPML手法は、ハードな擬似ラベルやロバストな損失といったメカニズムを用いて、損失を設計することのみに焦点を当てている。
論文 参考訳(メタデータ) (2024-05-06T14:13:38Z) - Contrastive Multiple Instance Learning for Weakly Supervised Person ReID [50.04900262181093]
本稿では、より効果的に教師付きされたReIDに適した新しいフレームワークであるContrastive Multiple Instance Learning (CMIL)を紹介する。
CMILは、対照的な損失を生かしながら、単一のモデルと擬似ラベルを必要とせず、自分自身を区別する。
PerformancePhoto.coの実際のアプリケーションから自然に発生する弱いラベルを特徴とするMUDDデータセットの拡張であるWL-MUDDデータセットをリリースする。
論文 参考訳(メタデータ) (2024-02-12T14:48:31Z) - TarGEN: Targeted Data Generation with Large Language Models [51.87504111286201]
TarGENは、高品質な合成データセットを生成するための、多段階のプロンプト戦略である。
我々は,LLMが不正確なラベル付きインスタンスを修正できるようにする自己補正法により,TarGENを増強する。
合成データセットを元のデータセットと比較した包括的な分析により、データセットの複雑さと多様性の類似または高いレベルが明らかになる。
論文 参考訳(メタデータ) (2023-10-27T03:32:17Z) - Pareto Optimization for Active Learning under Out-of-Distribution Data
Scenarios [79.02009938011447]
本研究では,未ラベルデータプールからバッチサイズを固定した未ラベルサンプルの最適なサブセットを選択するサンプリング手法を提案する。
実験の結果,従来の機械学習(ML)タスクとディープラーニング(DL)タスクの両方において,その効果が示された。
論文 参考訳(メタデータ) (2022-07-04T04:11:44Z) - Mining Multi-Label Samples from Single Positive Labels [32.10330097419565]
条件付き生成逆数ネットワーク(cGAN)は、クラス条件生成タスクにおいて優れた結果を示している。
複数の条件を同時に制御するために、cGANは複数のラベルのトレーニングデータセットを必要とし、各データインスタンスに複数のラベルを割り当てることができる。
マルコフ連鎖モンテカルロ法に基づくS2Mサンプリングという新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-06-12T15:14:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。