論文の概要: HIERAMP: Coarse-to-Fine Autoregressive Amplification for Generative Dataset Distillation
- arxiv url: http://arxiv.org/abs/2603.06932v1
- Date: Fri, 06 Mar 2026 23:08:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:13.412003
- Title: HIERAMP: Coarse-to-Fine Autoregressive Amplification for Generative Dataset Distillation
- Title(参考訳): HIERAMP: 生成データセット蒸留のための粗大な自己回帰増幅
- Authors: Lin Zhao, Xinru Jiang, Xi Xiao, Qihui Fan, Lei Lu, Yanzhi Wang, Xue Lin, Octavia Camps, Pu Zhao, Jianyang Gu,
- Abstract要約: 有効蒸留データに対する階層的セマンティクスの寄与について検討する。
異なるレベルで意味を増幅するためにHIERAMPを提案する。
セマンティックアンプリフィケーションは、粗いスケールのオブジェクトレイアウトを構築する際に、より多様なトークン選択をもたらす。
- 参考スコア(独自算出の注目度): 43.84917604612718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dataset distillation often prioritizes global semantic proximity when creating small surrogate datasets for original large-scale ones. However, object semantics are inherently hierarchical. For example, the position and appearance of a bird's eyes are constrained by the outline of its head. Global proximity alone fails to capture how object-relevant structures at different levels support recognition. In this work, we investigate the contributions of hierarchical semantics to effective distilled data. We leverage the vision autoregressive (VAR) model whose coarse-to-fine generation mirrors this hierarchy and propose HIERAMP to amplify semantics at different levels. At each VAR scale, we inject class tokens that dynamically identify salient regions and use their induced maps to guide amplification at that scale. This adds only marginal inference cost while steering synthesis toward discriminative parts and structures. Empirically, we find that semantic amplification leads to more diverse token choices in constructing coarse-scale object layouts. Conversely, at fine scales, the amplification concentrates token usage, increasing focus on object-related details. Across popular dataset distillation benchmarks, HIERAMP consistently improves validation performance without explicitly optimizing global proximity, demonstrating the importance of semantic amplification for effective dataset distillation.
- Abstract(参考訳): データセットの蒸留は、元の大規模データセットに対して小さなサロゲートデータセットを作成する際に、大域的なセマンティックな近接性を優先することが多い。
しかし、オブジェクトの意味論は本質的に階層的である。
例えば、鳥の目の位置や外観は頭部の輪郭によって制約される。
グローバルな近接性だけでは、異なるレベルのオブジェクト関連構造が認識をどのようにサポートしているかをキャプチャできない。
本研究では, 有効蒸留データに対する階層的セマンティクスの寄与について検討する。
我々は、この階層を粗大にミラーする視覚自己回帰モデルを活用し、異なるレベルで意味を増幅するためにHIERAMPを提案する。
各VARスケールでは,局所領域を動的に識別するクラストークンを注入し,そのスケールでの増幅を誘導する。
これにより、識別部品や構造に対する合成を操りながら、限界推論コストが増大する。
経験的に、意味の増幅は、粗いスケールのオブジェクトレイアウトを構築する際により多様なトークン選択をもたらす。
逆に、細かいスケールでは、増幅はトークンの使用に集中し、オブジェクト関連の詳細に焦点を当てます。
人気のあるデータセット蒸留ベンチマーク全体にわたって、HIERAMPは、グローバルな近接性を明示的に最適化することなく、検証性能を一貫して改善し、効果的なデータセット蒸留のためのセマンティックアンプリフィケーションの重要性を実証している。
関連論文リスト
- Bridging the Semantic Gap for Categorical Data Clustering via Large Language Models [64.58262227709842]
ARISE(Attention-weighted Representation with Integrated Semantic Embeddings)が紹介される。
正確なクラスタリングのためにカテゴリデータのメトリック空間を補完するセマンティックアウェア表現を構築する。
8つのベンチマークデータセットの実験では、7つの代表的なデータセットよりも一貫した改善が示されている。
論文 参考訳(メタデータ) (2026-01-03T11:37:46Z) - Online Data Curation for Object Detection via Marginal Contributions to Dataset-level Average Precision [9.096185004908692]
DetGainは、オブジェクト検出に特化したオンラインデータキュレーション手法である。
予測品質に基づいて、各画像の限界摂動をデータセットレベルの平均精度(AP)に推定する。
論文 参考訳(メタデータ) (2025-11-18T07:08:18Z) - HiGFA: Hierarchical Guidance for Fine-grained Data Augmentation with Diffusion Models [82.10385962490051]
生成拡散モデルは、データ拡張の約束を示す。
きめ細かいタスクにそれらを適用することは、重大な課題である。
HiGFAは階層的な信頼性駆動型オーケストレーションであり、多様なが忠実な合成画像を生成する。
論文 参考訳(メタデータ) (2025-11-16T10:46:16Z) - CONCORD: Concept-Informed Diffusion for Dataset Distillation [29.092857460373278]
本研究では,データセット蒸留のためのconcept-Informed Diffusion (CONCORD)を提案する。
提案手法は, 蒸留画像生成の可制御性と解釈性の両方を著しく向上させる。
画像Net-1Kとそのサブセットの最先端性能を達成し,CONCORDの有効性を実証する。
論文 参考訳(メタデータ) (2025-05-23T20:39:23Z) - Sharing Key Semantics in Transformer Makes Efficient Image Restoration [148.22790334216117]
視覚変換器(ViT)の基盤となる自己注意機構は、すべてのグローバルな手がかりを包含する傾向がある。
劣化した画像の小さな部分、特にセマンティックに密に整合した部分では、回復プロセスを支援するために特に関連する情報を提供する。
本稿では, IR(e, SemanIR) 用の Transformer を通じて鍵セマンティクスを共有することで, IR の性能向上を提案する。
論文 参考訳(メタデータ) (2024-05-30T12:45:34Z) - Reprint: a randomized extrapolation based on principal components for data augmentation [19.797216197418926]
本稿では,不均衡なデータ分類のための,シンプルで効果的な隠れ空間データ拡張手法を提案する。
各クラス内のサンプルの隠れスペース表現を与えられたREPRINTは、ランダムな方法で、ターゲットクラスの拡張例を外挿する。
この方法は、拡張例のために新しい軟質ラベルを合成できるラベル改質成分を含む。
論文 参考訳(メタデータ) (2022-04-26T01:38:47Z) - Enhancing the Generalization for Intent Classification and Out-of-Domain
Detection in SLU [70.44344060176952]
インテント分類は、音声言語理解(SLU)における主要な課題である
近年の研究では、余分なデータやラベルを使用することで、OOD検出性能が向上することが示されている。
本稿では、IND意図分類とOOD検出の両方をサポートしながら、INDデータのみを用いてモデルを訓練することを提案する。
論文 参考訳(メタデータ) (2021-06-28T08:27:38Z) - Supervised Visualization for Data Exploration [9.742277703732187]
本稿では,無作為な森林確率と拡散に基づく次元減少に基づく新しい可視化手法について述べる。
我々のアプローチはノイズやパラメータのチューニングに頑健であり、データ探索のための信頼性の高い可視化を作成しながら、簡単に使用できる。
論文 参考訳(メタデータ) (2020-06-15T19:10:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。