論文の概要: GRASP: Guided Residual Adapters with Sample-wise Partitioning
- arxiv url: http://arxiv.org/abs/2512.01675v1
- Date: Mon, 01 Dec 2025 13:43:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.873634
- Title: GRASP: Guided Residual Adapters with Sample-wise Partitioning
- Title(参考訳): GRASP: サンプル分割によるガイド付き残留アダプタ
- Authors: Felix Nützel, Mischa Dombrowski, Bernhard Kainz,
- Abstract要約: GRASP: サンプル分割によるガイド型残留アダプタを提案する。
長尾MIMIC-CXR-LTデータセットでは、GRASPは特に稀なクラスにおいて優れたFIDと多様性のメトリクスを得る。
- 参考スコア(独自算出の注目度): 10.504309161945065
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in text-to-image diffusion models enable high-fidelity generation across diverse prompts. However, these models falter in long-tail settings, such as medical imaging, where rare pathologies comprise a small fraction of data. This results in mode collapse: tail-class outputs lack quality and diversity, undermining the goal of synthetic data augmentation for underrepresented conditions. We pinpoint gradient conflicts between frequent head and rare tail classes as the primary culprit, a factor unaddressed by existing sampling or conditioning methods that mainly steer inference without altering the learned distribution. To resolve this, we propose GRASP: Guided Residual Adapters with Sample-wise Partitioning. GRASP uses external priors to statically partition samples into clusters that minimize intra-group gradient clashes. It then fine-tunes pre-trained models by injecting cluster-specific residual adapters into transformer feedforward layers, bypassing learned gating for stability and efficiency. On the long-tail MIMIC-CXR-LT dataset, GRASP yields superior FID and diversity metrics, especially for rare classes, outperforming baselines like vanilla fine-tuning and Mixture of Experts variants. Downstream classification on NIH-CXR-LT improves considerably for tail labels. Generalization to ImageNet-LT confirms broad applicability. Our method is lightweight, scalable, and readily integrates with diffusion pipelines.
- Abstract(参考訳): テキスト・画像拡散モデルの最近の進歩は、多様なプロンプトをまたいだ高忠実度生成を可能にする。
しかし、これらのモデルでは、まれな病理がわずかなデータから構成される医療画像のような、長い尾の環境に干渉する。
テールクラスの出力は品質と多様性を欠き、表現不足の条件に対する合成データ拡張の目標を損なう。
従来のサンプリング法やコンディショニング法では,学習分布を変化させることなく,主にステア推論を行なわなかった要因として,頻度の高い頭部と稀な尾部の衝突を主原因として挙げる。
そこで本研究では, GRASP: Guided Residual Adapters with Sample-wise Partitioningを提案する。
GRASPは外部プリエントを使用して、サンプルを静的にクラスタに分割し、グループ内の勾配衝突を最小限にする。
次に、クラスタ固有の残留アダプタをトランスフォーマーフィードフォワード層に注入し、学習したゲーティングを回避し、安定性と効率性を高めることで、事前訓練されたモデルを微調整する。
長尾MIMIC-CXR-LTデータセットでは、GRASPは優れたFIDと多様性のメトリクスを得る。
NIH-CXR-LTの下流分類はテールラベルに対してかなり改善される。
ImageNet-LTへの一般化は、幅広い適用性を確認している。
我々の手法は軽量でスケーラブルで、拡散パイプラインと容易に統合できる。
関連論文リスト
- MeDi: Metadata-Guided Diffusion Models for Mitigating Biases in Tumor Classification [13.350688594462214]
本稿では,このようなメタデータを生成拡散モデルフレームワーク(MeDi)に明示的にモデル化する手法を提案する。
MeDiは、不足しているサブ集団を合成データで対象とする拡張を可能にする。
TCGAの未確認サブポピュレーションに対して,MeDiが高品質な病理像を生成することを実験的に示す。
論文 参考訳(メタデータ) (2025-06-20T16:41:25Z) - A New Formulation of Lipschitz Constrained With Functional Gradient Learning for GANs [52.55025869932486]
本稿では,大規模データセット上でGAN(Generative Adversarial Networks)のトレーニングを行うための有望な代替手法を提案する。
本稿では,GANの学習を安定させるために,Lipschitz-Constrained Functional Gradient GANs Learning (Li-CFG)法を提案する。
判別器勾配のノルムを増大させることにより、潜在ベクトルの近傍サイズを小さくすることができることを示す。
論文 参考訳(メタデータ) (2025-01-20T02:48:07Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Intra-class Adaptive Augmentation with Neighbor Correction for Deep
Metric Learning [99.14132861655223]
深層学習のためのクラス内適応拡張(IAA)フレームワークを提案する。
クラスごとのクラス内変動を合理的に推定し, 適応型合成試料を生成し, 硬質試料の採掘を支援する。
本手法は,検索性能の最先端手法を3%~6%向上させる。
論文 参考訳(メタデータ) (2022-11-29T14:52:38Z) - Improving GANs for Long-Tailed Data through Group Spectral
Regularization [51.58250647277375]
本稿では, スペクトル爆発によるモード崩壊を防止する新しいグループスペクトル正規化器 (gSR) を提案する。
我々は,gSRが既存の拡張および正規化技術と効果的に組み合わせることで,長期化データ上での最先端の画像生成性能が向上することを発見した。
論文 参考訳(メタデータ) (2022-08-21T17:51:05Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - Imbalanced Data Learning by Minority Class Augmentation using Capsule
Adversarial Networks [31.073558420480964]
本稿では,2つの同時手法を合体させて,不均衡な画像のバランスを回復する手法を提案する。
我々のモデルでは、生成的および識別的ネットワークは、新しい競争力のあるゲームをする。
カプセルGANの合体は、畳み込みGANと比較して非常に少ないパラメータで重なり合うクラスを認識するのに効果的である。
論文 参考訳(メタデータ) (2020-04-05T12:36:06Z) - Embedding Propagation: Smoother Manifold for Few-Shot Classification [131.81692677836202]
本稿では, 組込み伝搬を非教師なし非パラメトリック正規化器として, 数ショット分類における多様体平滑化に用いることを提案する。
埋め込み伝播がより滑らかな埋め込み多様体を生み出すことを実証的に示す。
複数の半教師付き学習シナリオにおいて,埋め込み伝搬によりモデルの精度が最大16%向上することを示す。
論文 参考訳(メタデータ) (2020-03-09T13:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。