論文の概要: Discovering the Hidden Role of Gini Index In Prompt-based Classification
- arxiv url: http://arxiv.org/abs/2603.15654v1
- Date: Sat, 07 Mar 2026 01:39:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.345424
- Title: Discovering the Hidden Role of Gini Index In Prompt-based Classification
- Title(参考訳): プロンプトに基づく分類におけるジーニ指数の隠れた役割の解明
- Authors: Ruixi Lin,
- Abstract要約: 我々は,クラス精度の差を検出・最適化するためのツールとして,Gini Indexの隠れた役割に関する基礎的な理解を追求する。
本稿では,実世界のLLMおよびビジョンモデルにおけるGiniの直観,ベンチマークスコアを紹介するとともに,Giniの洞察を相対的精度支配の尺度としてだけでなく,直接的な最適化指標として深く論じる。
- 参考スコア(独自算出の注目度): 4.501091570166657
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In classification tasks, the long-tailed minority classes usually offer the predictions that are most important. Yet these classes consistently exhibit low accuracies, whereas a few high-performing classes dominate the game. We pursue a foundational understanding of the hidden role of Gini Index as a tool for detecting and optimizing (debiasing) disparities in class accuracy, focusing on the case of prompt-based classification. We introduce the intuitions, benchmark Gini scores in real-world LLMs and vision models, and thoroughly discuss the insights of Gini not only as a measure of relative accuracy dominance but also as a direct optimization metric. Through rigorous case analyses, we first show that weak to strong relative accuracy imbalance exists in both prompt-based, text and image classification results and regardless of whether the classification is high-dimensional or low-dimensional. Then, we harness the Gini metric to propose a post-hoc model-agnostic bias mitigation method. Experimental results across few-shot news, biomedical, and zero-shot image classification show that our method significantly reduces both relative and absolute accuracy imbalances, minimizing top class relative dominance while elevating weakest classes.
- Abstract(参考訳): 分類タスクでは、長い尾を持つマイノリティクラスは通常、最も重要な予測を提供する。
しかし、これらのクラスは一貫して低い精度を示し、高いパフォーマンスのクラスがゲームを支配している。
我々は,クラス精度の差を検出・最適化するためのツールとして,Gini Indexの隠れた役割に関する基礎的理解を追求し,プロンプトベース分類の場合に着目した。
本稿では,実世界のLLMおよびビジョンモデルにおけるGiniの直観,ベンチマークスコアを紹介するとともに,Giniの洞察を相対的精度支配の尺度としてだけでなく,直接的な最適化指標として深く論じる。
厳密なケース分析により,高次元か低次元かにかかわらず,プロンプトベース,テキスト,画像の双方の分類結果に強い相対的精度の不均衡が存在することを示す。
次に,Gini測定値を用いて,ポストホックモデル非依存バイアス緩和法を提案する。
バイオメディカル,ゼロショット画像分類などの実験結果から,本手法は相対的および絶対的精度の両不均衡を著しく低減し,最下位のクラスを増大させながら上位クラスの相対優位性を最小化する。
関連論文リスト
- Reducing Class-Wise Performance Disparity via Margin Regularization [82.81746960548382]
ディープニューラルネットワークは、クラスバランスのデータでトレーニングされた場合でも、クラスレベルでの精度において大きな違いを示すことが多い。
本稿では,性能格差低減のためのMargin Regularization for Performance Disparity Reduction (MR$2$)を提案する。
分析の結果,クラスごとの機能変動がエラーにどのように寄与するかが明らかとなり,ハードクラスに対するより大きなマージンの利用が動機となった。
論文 参考訳(メタデータ) (2026-01-30T12:56:08Z) - Addressing Class Imbalance with Probabilistic Graphical Models and Variational Inference [10.457756074328664]
本研究では,深い確率的グラフィカルモデル(DPGM)に基づく不均衡データ分類手法を提案する。
本稿では,少数クラスの表現能力を適応的に調整できる変分推論最適化確率モデルを提案する。
逆学習機構を組み合わさって、潜在空間におけるマイノリティクラスサンプルを生成し、モデルがカテゴリ境界をより正確に特徴づけられるようにします。
論文 参考訳(メタデータ) (2025-04-08T07:38:30Z) - Ensemble Debiasing Across Class and Sample Levels for Fairer Prompting Accuracy [17.610305828703957]
言語モデルは、強力な数発の学習者であり、テキスト分類タスクにおいて、全体的な精度が良好である。
我々は、全体的な精度の追求は、強い階級を豊かにするだけでなく、弱い階級を育てることによってもたらされると信じている。
本論文では,文脈内学習クラス確率のフレキシブルな修正を可能にするHeaviside Step関数に基づくアンサンブルデバイアス法を提案する。
論文 参考訳(メタデータ) (2025-03-07T05:34:31Z) - Classes Are Not Equal: An Empirical Study on Image Recognition Fairness [100.36114135663836]
我々は,クラスが等しくないことを実験的に証明し,様々なデータセットにまたがる画像分類モデルにおいて,公平性の問題が顕著であることを示した。
以上の結果から,モデルでは認識が困難であるクラスに対して,予測バイアスが大きくなる傾向が示唆された。
データ拡張および表現学習アルゴリズムは、画像分類のある程度の公平性を促進することにより、全体的なパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2024-02-28T07:54:50Z) - Understanding the Detrimental Class-level Effects of Data Augmentation [63.1733767714073]
最適な平均精度を達成するには、ImageNetで最大20%の個々のクラスの精度を著しく損なうコストがかかる。
本稿では,DAがクラスレベルの学習力学とどのように相互作用するかを理解するためのフレームワークを提案する。
そこで本研究では, クラス条件拡張戦略により, 負の影響を受けるクラスの性能が向上することを示す。
論文 参考訳(メタデータ) (2023-12-07T18:37:43Z) - Class-Imbalanced Graph Learning without Class Rebalancing [62.1368829847041]
クラス不均衡は実世界のノード分類タスクでよく見られ、グラフ学習モデルには大きな課題がある。
本研究では、トポロジカルパラダイムからクラス不均衡バイアスの根本原因にアプローチする。
我々は,クラス再バランスを伴わずにクラス不均衡バイアスを軽減するために,軽量なトポロジカル拡張フレームワークであるBATを考案した。
論文 参考訳(メタデータ) (2023-08-27T19:01:29Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。