論文の概要: Foreground-Aware Dataset Distillation via Dynamic Patch Selection
- arxiv url: http://arxiv.org/abs/2601.02727v1
- Date: Tue, 06 Jan 2026 05:44:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.811148
- Title: Foreground-Aware Dataset Distillation via Dynamic Patch Selection
- Title(参考訳): 動的パッチ選択によるフォアグラウンドアウェアデータセット蒸留
- Authors: Longzhen Li, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama,
- Abstract要約: コンテンツ適応方式でパッチ選択を向上する前景対応型データセット蒸留法を提案する。
複数のベンチマーク実験により,提案手法は既存手法よりも蒸留性能を一貫して向上することが示された。
- 参考スコア(独自算出の注目度): 56.565143366562495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a foreground-aware dataset distillation method that enhances patch selection in a content-adaptive manner. With the rising computational cost of training large-scale deep models, dataset distillation has emerged as a promising approach for constructing compact synthetic datasets that retain the knowledge of their large original counterparts. However, traditional optimization-based methods often suffer from high computational overhead, memory constraints, and the generation of unrealistic, noise-like images with limited architectural generalization. Recent non-optimization methods alleviate some of these issues by constructing distilled data from real image patches, but the used rigid patch selection strategies can still discard critical information about the main objects. To solve this problem, we first leverage Grounded SAM2 to identify foreground objects and compute per-image foreground occupancy, from which we derive a category-wise patch decision threshold. Guided by these thresholds, we design a dynamic patch selection strategy that, for each image, either selects the most informative patch from multiple candidates or directly resizes the full image when the foreground dominates. This dual-path mechanism preserves more key information about the main objects while reducing redundant background content. Extensive experiments on multiple benchmarks show that the proposed method consistently improves distillation performance over existing approaches, producing more informative and representative distilled datasets and enhancing robustness across different architectures and image compositions.
- Abstract(参考訳): 本稿では、コンテンツ適応方式でパッチ選択を向上する前景対応型データセット蒸留法を提案する。
大規模深層モデルの訓練における計算コストの増大に伴い、データセットの蒸留は、大規模な原産地の知識を保持するコンパクトな合成データセットを構築するための有望なアプローチとして現れてきた。
しかし、従来の最適化に基づく手法は、高い計算オーバーヘッド、メモリ制約、アーキテクチャの一般化に制限のある非現実的なノイズライクな画像の生成に悩まされることが多い。
最近の非最適化手法は、実際の画像パッチから蒸留したデータを構築することでこれらの問題を緩和しているが、使用済みの厳密なパッチ選択戦略は、メインオブジェクトに関する重要な情報を捨てることが可能である。
この問題を解決するために、まずgrounded SAM2を用いて前景オブジェクトを特定し、画像ごとの占有率を計算する。
これらのしきい値に導かれる動的パッチ選択戦略を設計し、各画像に対して複数の候補から最も情報性の高いパッチを選択するか、フォアグラウンドが支配するときに全体像を直接再サイズする。
このデュアルパスメカニズムは、冗長なバックグラウンドコンテンツを減らしながら、メインオブジェクトに関するより重要な情報を保存します。
複数のベンチマーク実験により,提案手法は既存手法よりも蒸留性能を常に向上し,より情報的かつ代表的な蒸留データセットを生成し,異なるアーキテクチャや画像合成における堅牢性を向上することを示した。
関連論文リスト
- Seeing What Matters: Empowering CLIP with Patch Generation-to-Selection [54.21851618853518]
本稿では,CLIPのトレーニング効率を高めるために,パッチ生成と選択という簡潔で効果的なアプローチを提案する。
私たちのアプローチであるCLIP-PGSは、ゼロショット分類と検索タスクにおいて、新しい最先端結果を設定する。
論文 参考訳(メタデータ) (2025-03-21T12:10:38Z) - Efficient Dataset Distillation via Diffusion-Driven Patch Selection for Improved Generalization [34.53986517177061]
本稿では, 既存の拡散式蒸留法に対する新しい枠組みを提案し, 生成ではなく拡散モデルを用いて選択する。
提案手法は,入力画像とテキストプロンプトに基づいて拡散モデルから発生するノイズを予測し,各ペアの損失を算出する。
この合理化フレームワークは単一段階の蒸留プロセスを実現するとともに,我々の手法が様々なメトリクスにわたって最先端の手法より優れていることを示す広範な実験を行った。
論文 参考訳(メタデータ) (2024-12-13T08:34:46Z) - One Category One Prompt: Dataset Distillation using Diffusion Models [22.512552596310176]
本稿では,D3M(Diffusion Models)をデータセット蒸留の新たなパラダイムとして導入し,生成的テキスト・画像基盤モデルの最近の進歩を活用する。
提案手法では,テキストから画像への合成モデルを微調整する手法であるテキストインバージョンを用いて,大規模データセットの簡潔かつ情報的な表現を生成する。
論文 参考訳(メタデータ) (2024-03-11T20:23:59Z) - On the Effect of Image Resolution on Semantic Segmentation [27.115235051091663]
本研究では,高分解能セグメンテーションを直接生成できるモデルが,より複雑なシステムの性能と一致することを示す。
提案手法は,ボトムアップ情報伝搬手法を様々なスケールで活用する。
先進的なセマンティックセグメンテーションデータセットを用いて,本手法を厳格に検証した。
論文 参考訳(メタデータ) (2024-02-08T04:21:30Z) - HIPA: Hierarchical Patch Transformer for Single Image Super Resolution [62.7081074931892]
本稿では,階層型パッチ分割を用いた高解像度画像を段階的に復元する新しいトランスフォーマーアーキテクチャHIPAを提案する。
入力画像を複数のステージで処理するカスケードモデルを構築し、小さなパッチサイズでトークンから始めて、徐々に全解像度にマージします。
このような階層的なパッチ機構は、複数の解像度で機能集約を可能にするだけでなく、異なる画像領域に対するパッチ認識機能も適応的に学習する。
論文 参考訳(メタデータ) (2022-03-19T05:09:34Z) - Boosting Robustness of Image Matting with Context Assembling and Strong
Data Augmentation [83.31087402305306]
トリマップへのロバストさと、異なる領域の画像への一般化はまだ未定である。
マルチレベルコンテキストアッセンブルと強力なデータ拡張により高ロバスト性(RMat)を実現する画像マッチング手法を提案する。
論文 参考訳(メタデータ) (2022-01-18T11:45:17Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。