論文の概要: Generalized Category Discovery in Event-Centric Contexts: Latent Pattern Mining with LLMs
- arxiv url: http://arxiv.org/abs/2505.23304v1
- Date: Thu, 29 May 2025 10:02:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.801996
- Title: Generalized Category Discovery in Event-Centric Contexts: Latent Pattern Mining with LLMs
- Title(参考訳): イベント中心コンテキストにおける一般化カテゴリー発見:LLMを用いた潜在パターンマイニング
- Authors: Yi Luo, Qiwen Wang, Junqi Yang, Luyao Tang, Zhenghao Lin, Zhenzhe Ying, Weiqiang Wang, Chen Lin,
- Abstract要約: イベント中心のGCDは,長い複雑な物語と高度に不均衡なクラス分布を特徴とする。
クラスタクラスのアライメントを改善するためのイベントパターンの抽出と精巧化にLLMを活用するフレームワークであるPaMAを提案する。
新たに構築されたScam Reportデータセットを含む2つのEC-GCDベンチマークの評価は、PaMAが12.58%のHスコアゲインで先行メソッドより優れていることを示している。
- 参考スコア(独自算出の注目度): 34.06878654462158
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalized Category Discovery (GCD) aims to classify both known and novel categories using partially labeled data that contains only known classes. Despite achieving strong performance on existing benchmarks, current textual GCD methods lack sufficient validation in realistic settings. We introduce Event-Centric GCD (EC-GCD), characterized by long, complex narratives and highly imbalanced class distributions, posing two main challenges: (1) divergent clustering versus classification groupings caused by subjective criteria, and (2) Unfair alignment for minority classes. To tackle these, we propose PaMA, a framework leveraging LLMs to extract and refine event patterns for improved cluster-class alignment. Additionally, a ranking-filtering-mining pipeline ensures balanced representation of prototypes across imbalanced categories. Evaluations on two EC-GCD benchmarks, including a newly constructed Scam Report dataset, demonstrate that PaMA outperforms prior methods with up to 12.58% H-score gains, while maintaining strong generalization on base GCD datasets.
- Abstract(参考訳): Generalized Category Discovery (GCD) は、既知のクラスのみを含む部分的にラベル付けされたデータを用いて、既知のカテゴリと新しいカテゴリの両方を分類することを目的としている。
既存のベンチマークの性能は高いが、現在のテキストGCDメソッドでは、現実的な設定では十分な検証が不十分である。
イベント中心型GCD(EC-GCD)は,(1)主観的基準によるクラスタリングと分類グループ化の相違,(2)マイノリティクラスに対する不公平なアライメントの2つの主な課題を呈する,長い,複雑な物語と高度に不均衡なクラス分布を特徴とする。
そこで我々は,LLMを利用してイベントパターンを抽出・精査し,クラスタクラスのアライメントを改善するPaMAを提案する。
さらに、ランキングフィルタリングマイニングパイプラインは、不均衡なカテゴリ間でプロトタイプのバランスの取れた表現を保証する。
新たに構築されたScam Reportデータセットを含む2つのEC-GCDベンチマークの評価では、PaMAは12.58%のHスコアゲインを持つ事前メソッドよりも優れており、ベースGCDデータセットの強力な一般化を維持している。
関連論文リスト
- Split Matching for Inductive Zero-shot Semantic Segmentation [52.90218623214213]
Zero-shot Semantic (ZSS)は、トレーニング中にアノテートされていないカテゴリをセグメントすることを目的としている。
ハンガリーのマッチングを2つのコンポーネントに分離する新しい割当て戦略であるSplit Matching (SM)を提案する。
SMは、インダクティブZSS設定の下で最初に分離されたハンガリー語マッチングを導入し、2つの標準ベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2025-05-08T07:56:30Z) - ProtoGCD: Unified and Unbiased Prototype Learning for Generalized Category Discovery [42.965641047139904]
一般化圏発見(GCD)は実用的だが未発見の問題である。
ラベルなしデータは、古いクラスと新しいクラスの両方を含んでいる。
ProtoGCDは、ジェネリックデータセットときめ細かいデータセットの両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-04-02T06:13:14Z) - Learning Part Knowledge to Facilitate Category Understanding for Fine-Grained Generalized Category Discovery [10.98097145569408]
Generalized Category Discovery (GCD)は、目に見えないカテゴリと新しいカテゴリの両方を含むラベルのないデータを分類することを目的としている。
本稿では,細粒度GCDに対処するための部分知識の導入を提案する。
論文 参考訳(メタデータ) (2025-03-21T01:37:51Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Balanced Classification: A Unified Framework for Long-Tailed Object
Detection [74.94216414011326]
従来の検出器は、分類バイアスによる長期データを扱う際の性能劣化に悩まされる。
本稿では,カテゴリ分布の格差に起因する不平等の適応的是正を可能にする,BAlanced CLassification (BACL) と呼ばれる統一フレームワークを提案する。
BACLは、さまざまなバックボーンとアーキテクチャを持つさまざまなデータセット間で、一貫してパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-08-04T09:11:07Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。