論文の概要: GLEAN: Generalized Category Discovery with Diverse and Quality-Enhanced LLM Feedback
- arxiv url: http://arxiv.org/abs/2502.18414v1
- Date: Tue, 25 Feb 2025 18:11:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-26 15:23:04.869248
- Title: GLEAN: Generalized Category Discovery with Diverse and Quality-Enhanced LLM Feedback
- Title(参考訳): GLEAN: 多様性と品質向上したLDMフィードバックを備えた一般化カテゴリディスカバリ
- Authors: Henry Peng Zou, Siffi Singh, Yi Nian, Jianfeng He, Jason Cai, Saab Mansour, Hang Su,
- Abstract要約: Generalized Category Discovery (GCD)は、ラベルなしデータの既知のカテゴリと新しいカテゴリの両方を認識することを目的としている。
従来のGCD手法では、紛らわしいインスタンスのエラーの修正が困難であるなど、重大な課題に直面していた。
一般化されたカテゴリ発見のための統一的なフレームワークであるGLEANを提案する。
- 参考スコア(独自算出の注目度): 13.969403782532957
- License:
- Abstract: Generalized Category Discovery (GCD) is a practical and challenging open-world task that aims to recognize both known and novel categories in unlabeled data using limited labeled data from known categories. Due to the lack of supervision, previous GCD methods face significant challenges, such as difficulty in rectifying errors for confusing instances, and inability to effectively uncover and leverage the semantic meanings of discovered clusters. Therefore, additional annotations are usually required for real-world applicability. However, human annotation is extremely costly and inefficient. To address these issues, we propose GLEAN, a unified framework for generalized category discovery that actively learns from diverse and quality-enhanced LLM feedback. Our approach leverages three different types of LLM feedback to: (1) improve instance-level contrastive features, (2) generate category descriptions, and (3) align uncertain instances with LLM-selected category descriptions. Extensive experiments demonstrate the superior performance of \MethodName over state-of-the-art models across diverse datasets, metrics, and supervision settings. Our code is available at https://github.com/amazon-science/Glean.
- Abstract(参考訳): Generalized Category Discovery (GCD) は、既知のカテゴリと新しいカテゴリの両方を、既知のカテゴリから限定されたラベル付きデータを使用してラベル付きデータで認識することを目的とした、実用的で挑戦的なオープンワールドタスクである。
監視の欠如により、従来のGCD手法では、混乱するインスタンスのエラーの修正が困難であることや、発見されたクラスタの意味を効果的に発見・活用できないことなど、大きな課題に直面している。
したがって、実際の適用には追加のアノテーションが必要である。
しかし、人間のアノテーションは非常に費用がかかり非効率である。
これらの課題に対処するため,GLEANを提案する。GLEANは一般化されたカテゴリ発見のための統合フレームワークで,多種多様な品質向上されたLLMフィードバックから積極的に学習する。
提案手法は3種類のLCMフィードバックを活用して,(1)インスタンスレベルのコントラスト特性の改善,(2)カテゴリ記述の生成,(3)不確実なインスタンスとLSM選択されたカテゴリ記述の整合性を実現する。
大規模な実験では、さまざまなデータセット、メトリクス、監視設定にわたる最先端モデルよりも、‘MethodName’の方が優れたパフォーマンスを示している。
私たちのコードはhttps://github.com/amazon-science/Glean.comで公開されています。
関連論文リスト
- Solving the Catastrophic Forgetting Problem in Generalized Category Discovery [46.63232918739251]
Generalized Category Discovery (GCD)は、ラベルなしデータセット内の既知のカテゴリと新しいカテゴリの混合を識別することを目的としている。
最近の最先端手法SimGCDは、既知のクラスデータからの知識を、偏りのある学習を通して、新しいクラスの学習に転送する。
本稿では,従来の手法にシームレスに統合された新しい学習手法であるLegoGCDを提案する。
論文 参考訳(メタデータ) (2025-01-09T14:31:54Z) - Active Generalized Category Discovery [60.69060965936214]
GCD(Generalized Category Discovery)は、新しいクラスと古いクラスの未ラベルのサンプルをクラスタ化するための取り組みである。
我々は,能動的学習の精神を取り入れて,能動的一般化カテゴリー発見(AGCD)という新たな設定を提案する。
提案手法は, 汎用および微粒なデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-07T07:12:24Z) - Generalized Category Discovery with Large Language Models in the Loop [10.440661581492723]
トレーニングループにLarge Language Modelを導入する,エンドツーエンドのアクティブラーニングフレームワークであるLoopを提案する。
ループはSOTAモデルよりも大きなマージンで優れており、検出されたクラスタの正確なカテゴリ名を生成する。
論文 参考訳(メタデータ) (2023-12-18T02:55:14Z) - Learn to Categorize or Categorize to Learn? Self-Coding for Generalized
Category Discovery [49.1865089933055]
テスト時に未知のカテゴリを発見できる新しい,効率的かつ自己管理手法を提案する。
このアプローチの健全な特徴は、個々のデータインスタンスに最小長のカテゴリコードの割り当てである。
試行錯誤による評価は, 提案手法の有効性を実証するものである。
論文 参考訳(メタデータ) (2023-10-30T17:45:32Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - Open World Classification with Adaptive Negative Samples [89.2422451410507]
オープンワールド分類は、自然言語処理における重要な実践的妥当性と影響を伴う課題である。
そこで本研究では, アンダーライン適応型アンダーラインアンプ (ANS) に基づいて, 学習段階における効果的な合成オープンカテゴリサンプルを生成する手法を提案する。
ANSは最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-03-09T21:12:46Z) - Fine-grained Category Discovery under Coarse-grained supervision with
Hierarchical Weighted Self-contrastive Learning [37.6512548064269]
粗粒度監視(FCDC)下での細粒度カテゴリー発見という新たな実践シナリオについて検討する。
FCDCは、粗いラベル付きデータのみを用いて、既知のデータと異なる粒度のカテゴリにモデルを適応させ、かなりのラベル付けコストを削減できるきめ細かなカテゴリを発見することを目的としている。
本稿では,新しい重み付き自己コントラストモジュールを構築し,それを階層的に教師付き学習と組み合わせることで,階層型自己コントラストネットワークを提案する。
論文 参考訳(メタデータ) (2022-10-14T12:06:23Z) - XCon: Learning with Experts for Fine-grained Category Discovery [4.787507865427207]
本稿では,XCon(Expert-Contrastive Learning)と呼ばれる新しい手法を提案する。
細粒度データセットを用いた実験では,従来の最適手法よりも明らかに改善された性能を示し,本手法の有効性を示した。
論文 参考訳(メタデータ) (2022-08-03T08:03:12Z) - Adaptive Class Suppression Loss for Long-Tail Object Detection [49.7273558444966]
アダプティブクラス抑圧損失(ACSL:Adaptive Class Suppression Loss)を考案し,尾部カテゴリの検出性能を改善する。
当社のACSLはResNet50-FPNで5.18%と5.2%の改善を実現し,新たな最先端技術を実現した。
論文 参考訳(メタデータ) (2021-04-02T05:12:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。