論文の概要: Positive-First Most Ambiguous: A Simple Active Learning Criterion for Interactive Retrieval of Rare Categories
- arxiv url: http://arxiv.org/abs/2603.24480v1
- Date: Wed, 25 Mar 2026 16:22:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.385602
- Title: Positive-First Most Ambiguous: A Simple Active Learning Criterion for Interactive Retrieval of Rare Categories
- Title(参考訳): ポジティブファーストが最も曖昧な: 希少カテゴリーの対話的検索のためのシンプルなアクティブラーニング基準
- Authors: Kawtar Zaher, Olivier Buisson, Alexis Joly,
- Abstract要約: 現実世界のきめ細かいビジュアル検索では、最小限の監督力を持つ大きなラベルのないコレクションから稀な概念を発見する必要がある。
これは特に生物多様性モニタリング、生態学的研究、長い尾の視覚領域において重要である。
PF-MA(Positive-First Most Ambiguous)は、クラス不均衡な非対称性に明示的に対処する基準である。
PF-MAは、関連するサンプルの比率が高い小さなバッチを一貫して返却し、早期検索とユーザ満足度を向上させる。
- 参考スコア(独自算出の注目度): 1.8631279231581521
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-world fine-grained visual retrieval often requires discovering a rare concept from large unlabeled collections with minimal supervision. This is especially critical in biodiversity monitoring, ecological studies, and long-tailed visual domains, where the target may represent only a tiny fraction of the data, creating highly imbalanced binary problems. Interactive retrieval with relevance feedback offers a practical solution: starting from a small query, the system selects candidates for binary user annotation and iteratively refines a lightweight classifier. While Active Learning (AL) is commonly used to guide selection, conventional AL assumes symmetric class priors and large annotation budgets, limiting effectiveness in imbalanced, low-budget, low-latency settings. We introduce Positive-First Most Ambiguous (PF-MA), a simple yet effective AL criterion that explicitly addresses the class imbalance asymmetry: it prioritizes near-boundary samples while favoring likely positives, enabling rapid discovery of subtle visual categories while maintaining informativeness. Unlike standard methods that oversample negatives, PF-MA consistently returns small batches with a high proportion of relevant samples, improving early retrieval and user satisfaction. To capture retrieval diversity, we also propose a class coverage metric that measures how well selected positives span the visual variability of the target class. Experiments on long-tailed datasets, including fine-grained botanical data, demonstrate that PF-MA consistently outperforms strong baselines in both coverage and classifier performance, across varying class sizes and descriptors. Our results highlight that aligning AL with the asymmetric and user-centric objectives of interactive fine-grained retrieval enables simple yet powerful solutions for retrieving rare and visually subtle categories in realistic human-in-the-loop settings.
- Abstract(参考訳): 現実世界のきめ細かいビジュアル検索では、最小限の監督力を持つ大規模な未ラベルコレクションから稀な概念を発見する必要がある。
これは、生物多様性のモニタリング、生態学研究、長い尾の視覚領域において特に重要であり、ターゲットはデータのごく一部だけを表現し、高度に不均衡なバイナリー問題を引き起こす。
関連性フィードバックによる対話型検索は,小規模なクエリから,バイナリユーザアノテーションの候補を選択し,軽量な分類器を反復的に洗練する,実用的なソリューションを提供する。
アクティブラーニング(AL)は選択を導くのに一般的に使用されるが、従来のALは対称クラス事前と大きなアノテーション予算を前提としており、不均衡で低予算で低レイテンシの設定における有効性を制限している。
PF-MA(Positive-First Most Ambiguous)は、クラス不均衡な非対称性に明示的に対処する単純で効果的なAL基準である。
負をオーバーサンプリングする標準的な方法とは異なり、PF-MAは、関連するサンプルの比率が高い小さなバッチを一貫して返却し、早期検索とユーザ満足度を改善している。
また,検索の多様性を捉えるために,選択された肯定値が対象クラスの視覚的多様性にどの程度の幅があるかを測定するクラスカバレッジ指標を提案する。
きめ細かい植物データを含む長い尾のデータセットの実験では、PF-MAは、クラスのサイズや記述子によって、カバレッジと分類器のパフォーマンスの両方において、強いベースラインを一貫して上回っている。
この結果から,ALを非対称かつユーザ中心の対話的微粒化検索の目的と整合させることにより,リアルなヒューマン・イン・ザ・ループ・セッティングにおいて,希少かつ視覚的に微妙なカテゴリを検索する上で,シンプルかつ強力なソリューションが実現できることが示唆された。
関連論文リスト
- Active Learning via Classifier Impact and Greedy Selection for Interactive Image Retrieval [4.699825956909531]
Active Learning(AL)は,ラベル付けに最も重要な例を選択することで,アノテーションコストの削減を目的とした,ユーザインタラクションのアプローチである。
我々はGAL(Greedy Active Learning)と呼ばれる新しいバッチモードアクティブラーニングフレームワークを導入し、このアプリケーションに対処する。
論文 参考訳(メタデータ) (2024-12-03T09:27:46Z) - Probably Approximately Precision and Recall Learning [60.00180898830079]
機械学習における重要な課題は、一方的なフィードバックの頻度である。
本稿では,確率的近似(PAC)フレームワークを導入し,各入力をラベルの集合にマッピングする仮説を定めている。
我々は、正のデータのみから学習する新しいアルゴリズムを開発し、実現可能な場合において最適なサンプル複雑性を実現する。
論文 参考訳(メタデータ) (2024-11-20T04:21:07Z) - Category-Prompt Refined Feature Learning for Long-Tailed Multi-Label Image Classification [8.139529179222844]
Category-Prompt Refined Feature Learning (CPRFL) は長尺多ラベル画像分類の新しい手法である。
CPRFLは、事前訓練されたCLIPの埋め込みからカテゴリプロンプトを初期化し、カテゴリ固有の視覚表現を分離する。
2つのLCMLCベンチマークにおいて,本手法の有効性を検証し,本手法がベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-08-15T12:51:57Z) - LLM meets Vision-Language Models for Zero-Shot One-Class Classification [4.094697851983375]
ゼロショットワンクラス視覚分類の問題を考える。
本稿では、視覚的に混乱するオブジェクトに対して、まず大きな言語モデルをクエリする2段階のソリューションを提案する。
我々は,そのラベルのみを用いて,あるカテゴリと他のセマンティック関連カテゴリを識別する能力を初めて示す。
論文 参考訳(メタデータ) (2024-03-31T12:48:07Z) - When Measures are Unreliable: Imperceptible Adversarial Perturbations
toward Top-$k$ Multi-Label Learning [83.8758881342346]
新しい損失関数は、視覚的および測定的不受容性を両立できる敵の摂動を生成するために考案された。
大規模ベンチマークデータセットを用いた実験により,提案手法が最上位の$kのマルチラベルシステムを攻撃する際の優位性を実証した。
論文 参考訳(メタデータ) (2023-07-27T13:18:47Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Bias Mimicking: A Simple Sampling Approach for Bias Mitigation [57.17709477668213]
本稿では,新しいクラス条件サンプリング手法であるBias Mimickingを紹介する。
Bias Mimickingは、4つのベンチマークで3%の精度でサンプリングの精度を向上する。
論文 参考訳(メタデータ) (2022-09-30T17:33:00Z) - Evolving Multi-Label Fuzzy Classifier [5.53329677986653]
マルチラベル分類は、同時に複数のクラスに1つのサンプルを割り当てるという問題に対処するために、機械学習コミュニティで多くの注目を集めている。
本稿では,新たなマルチラベルサンプルをインクリメンタルかつシングルパスで自己適応・自己展開可能な多ラベルファジィ分類器(EFC-ML)を提案する。
論文 参考訳(メタデータ) (2022-03-29T08:01:03Z) - Towards Cross-Granularity Few-Shot Learning: Coarse-to-Fine
Pseudo-Labeling with Visual-Semantic Meta-Embedding [13.063136901934865]
少ないショットラーニングは、テスト時に少数のサンプルしか持たない、新しいカテゴリに迅速に適応することを目的としている。
本稿では,より困難なシナリオ,すなわちクロスグラニュラリティ・グラニュラリティ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラティヴ・グラニュラ
画像埋め込みの類似性に応じて,各粗いクラスを擬似微細クラスにグリーディクラスタリングすることで,詳細なデータ分布を近似する。
論文 参考訳(メタデータ) (2020-07-11T03:44:21Z) - Selecting Relevant Features from a Multi-domain Representation for
Few-shot Classification [91.67977602992657]
本稿では,従来の特徴適応手法よりもシンプルかつ効果的である特徴選択に基づく新しい戦略を提案する。
このような特徴の上に構築された単純な非パラメトリック分類器は高い精度を示し、訓練中に見たことのない領域に一般化する。
論文 参考訳(メタデータ) (2020-03-20T15:44:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。