論文の概要: UniPROT: Uniform Prototype Selection via Partial Optimal Transport with Submodular Guarantees
- arxiv url: http://arxiv.org/abs/2604.10952v1
- Date: Mon, 13 Apr 2026 03:49:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.297994
- Title: UniPROT: Uniform Prototype Selection via Partial Optimal Transport with Submodular Guarantees
- Title(参考訳): UniPROT:submodular Guaranteeによる部分最適輸送による一様プロトタイプ選択
- Authors: Prateek Chanda, Prayas Agrawal, Karthik S. Gurumoorthy, Ganesh Ramakrishnan, Bamdev Mishra, Pratik Jawanpuria,
- Abstract要約: 本稿では,一様重み付き分布と対象分布との最適輸送距離を最小化する新しいサブセット選択フレームワークを提案する。
我々は,UniPROTにおける統一プロトタイプ重みの強制は,非バランスな分類ベンチマークにおけるマイノリティークラス表現を,多数派精度を損なうことなく一貫して改善することを示す。
この結果は、UniPROTを一様重み付きプロトタイプ選択のためのスケーラブルで理論的に基礎付けられたソリューションとして確立する。
- 参考スコア(独自算出の注目度): 20.9287741780124
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Selecting prototypical examples from a source distribution to represent a target data distribution is a fundamental problem in machine learning. Existing subset selection methods often rely on implicit importance scores, which can be skewed towards majority classes and lead to low-quality prototypes for minority classes. We present $\methodprop$, a novel subset selection framework that minimizes the optimal transport (OT) distance between a uniformly weighted prototypical distribution and the target distribution. While intuitive, this formulation leads to a cardinality-constrained maximization of a \emph{super-additive} objective, which is generally intractable to approximate efficiently. To address this, we propose a principled reformulation of the OT marginal constraints, yielding a partial optimal transport-based submodular objective. We prove that this reformulation enables a greedy algorithm with a $(1-1/e)$ approximation guarantee relative to the original super-additive maximization problem. Empirically, we showcase that enforcing uniform prototype weights in UniPROT consistently improves minority-class representation in imbalanced classification benchmarks without compromising majority-class accuracy. In both finetuning and pretraining regimes for large language models under domain imbalance, UniPROT enforces uniform source contributions, yielding robust performance gains. Our results establish UniPROT as a scalable, theoretically grounded solution for uniform-weighted prototype selection. Our code is publicly available at GitHub\footnote{Code: https://github.com/efficiency-learning/UniPROT}
- Abstract(参考訳): ターゲットデータ分布を表すためにソース分布からプロトタイプ例を選択することは、機械学習の基本的な問題である。
既存のサブセット選択法は、しばしば暗黙の重要度スコアに依存するが、これは多数派に歪められ、少数派階級の低品質なプロトタイプに繋がる。
我々は、一様重み付き原型分布と対象分布の間の最適輸送(OT)距離を最小化する新しい部分集合選択フレームワークである$\methodprop$を提案する。
直感的であるが、この定式化は、集合の濃度に制約のある最大化をもたらす。
そこで本研究では, OT限界制約の原理的再構成を提案し, 部分最適輸送に基づく部分モジュラー目的を導出する。
この改定により,元の超加法最大化問題に対して,1-1/e)$近似のグリーディアルゴリズムが可能であることを証明した。
実験により、UniPROTにおける一様プロトタイプの重み付けは、多数クラス精度を損なうことなく、不均衡な分類ベンチマークにおけるマイノリティクラス表現を一貫して改善することを示した。
ドメイン不均衡の下での大規模言語モデルの微調整と事前訓練の両方において、UniPROTは均一なソースコントリビューションを強制し、堅牢なパフォーマンス向上をもたらす。
この結果は、UniPROTを一様重み付きプロトタイプ選択のためのスケーラブルで理論的に基礎付けられたソリューションとして確立する。
私たちのコードはGitHub\footnote{Code: https://github.com/efficiency-learning/UniPROT}で公開されています。
関連論文リスト
- FAIL: Flow Matching Adversarial Imitation Learning for Image Generation [52.643484089126844]
フローマッチングモデルのポストトレーニング-高品質な目標値による出力分布の調整-数学的にはImitation Learningと等価である。
本研究では,明示的な報酬やペア比較を伴わずに,対人訓練による政策-専門的差異を最小限に抑えるフローマッチング・アドリアラーニング(FAIL)を提案する。
論文 参考訳(メタデータ) (2026-02-12T16:36:33Z) - Proto-EVFL: Enhanced Vertical Federated Learning via Dual Prototype with Extremely Unaligned Data [28.626677790020082]
垂直連合学習(VFL)では、VFLの異なる分野にまたがるアンアライメントなサンプルは、極端にクラス不均衡である。
デュアルプロトタイプによる拡張VFLフレームワークであるProto-EVFLを提案する。
VFL における二段階最適化フレームワークである Proto-EVFL が収束速度 1/sqrt T であることを示す。
論文 参考訳(メタデータ) (2025-07-30T08:48:33Z) - MaskPro: Linear-Space Probabilistic Learning for Strict (N:M)-Sparsity on Large Language Models [53.36415620647177]
半構造化された空間は、M$M$の重みからN$の要素を戦略的に保持することで、有望なソリューションを提供する。
既存の(N:M)互換のアプローチは通常、かなりのエラーに悩まされるルールベースの階層的な欲求探索と、禁止的なトレーニングコストを引き起こす勾配駆動学習の2つのカテゴリに分類される。
MaskProという新しい線形空間確率的フレームワークを提案する。これは、M$連続重みごとに事前のカテゴリー分布を学習し、その後、この分布を活用して(N:M)スパーシリティを$N$-wayサンプリングを通じて生成することを目的としている。
論文 参考訳(メタデータ) (2025-06-15T15:02:59Z) - Project-Probe-Aggregate: Efficient Fine-Tuning for Group Robustness [61.45587642780908]
画像テキスト基礎モデルのパラメータ効率向上のための3段階のアプローチを提案する。
本手法は, マイノリティ標本同定とロバストトレーニングアルゴリズムの2つの重要な要素を改良する。
我々の理論分析は,PPAが少数群の識別を向上し,バランスの取れたグループエラーを最小限に抑えるためにベイズが最適であることを示している。
論文 参考訳(メタデータ) (2025-03-12T15:46:12Z) - A Deep Positive-Negative Prototype Approach to Integrated Prototypical Discriminative Learning [0.30693357740321775]
本稿では,PbLと識別手法を組み合わせた新しいDPNPモデルを提案する。
DPNPは特徴空間内のほぼ規則的な位置でプロトタイプを編成でき、より低次元の特徴空間においても競争力のある分類精度を達成できることを示す。
論文 参考訳(メタデータ) (2025-01-05T08:24:31Z) - Prototypical Contrastive Learning through Alignment and Uniformity for
Recommendation [6.790779112538357]
提案するアンダーライン・アライメントとアンダーライン・ユニフォーマル性によるインダーライン型コントラスト学習について述べる。
具体的には、まず、原点グラフから異なる拡張点間の整合性を確保するために、潜時空間としてプロトタイプを提案する。
明示的な負の欠如は、インスタンスとプロトタイプ間の整合性損失を直接最適化することで、次元的な崩壊の問題が容易に生じることを意味する。
論文 参考訳(メタデータ) (2024-02-03T08:19:26Z) - Distributionally Robust Post-hoc Classifiers under Prior Shifts [31.237674771958165]
本研究では,クラスプライヤやグループプライヤの分布の変化による変化に頑健なトレーニングモデルの問題点について検討する。
本稿では,事前学習モデルからの予測に対するスケーリング調整を行う,非常に軽量なポストホック手法を提案する。
論文 参考訳(メタデータ) (2023-09-16T00:54:57Z) - Optimal transport framework for efficient prototype selection [21.620708125860066]
最適なトランスポート(ot)ベースのフレームワークを開発し、与えられたターゲットデータセットを最もよく表現する有益な例を選定する。
目的関数は部分モジュラリティの重要な特性を享受し、計算速度と決定論的近似保証を持つ並列化可能なグリーディ法を提案する。
論文 参考訳(メタデータ) (2021-03-18T10:50:14Z) - LFD-ProtoNet: Prototypical Network Based on Local Fisher Discriminant
Analysis for Few-shot Learning [98.64231310584614]
Prototypeal Network (ProtoNet) は、各クラスのプロトタイプ表現までの距離を用いてメートル法学習と分類を行う、数発の学習フレームワークである。
提案手法の有用性は,理論上は予測されるリスクバウンドを提供し,MiniImageNetとタイレッドImageNetに優れた分類精度を実証的に示すことによって示される。
論文 参考訳(メタデータ) (2020-06-15T11:56:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。