論文の概要: CIEGAD: Cluster-Conditioned Interpolative and Extrapolative Framework for Geometry-Aware and Domain-Aligned Data Augmentation
- arxiv url: http://arxiv.org/abs/2512.10178v1
- Date: Thu, 11 Dec 2025 00:32:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 16:15:42.132144
- Title: CIEGAD: Cluster-Conditioned Interpolative and Extrapolative Framework for Geometry-Aware and Domain-Aligned Data Augmentation
- Title(参考訳): CIEGAD:Geometry-AwareとDomain-Aligned Data Augmentationのためのクラスタ型補間・補間フレームワーク
- Authors: Keito Inoshita, Xiaokang Zhou, Akira Kawai, Katsutoshi Yada,
- Abstract要約: 実践的なディープラーニングデプロイメントでは、データの不足とラベル分布の不均衡が、意味不明な領域につながることが多い。
幾何認識・領域対応データ拡張のためのクラスタ条件補間・外挿フレームワーク(CIEGAD)を提案する。
本研究では,CIEGADが実世界のデータ分布の周辺を効果的に拡張し,実世界のデータと実世界のデータとの高整合性を維持しつつ,意味的多様性も維持していることを示す。
- 参考スコア(独自算出の注目度): 10.159901538172575
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In practical deep learning deployment, the scarcity of data and the imbalance of label distributions often lead to semantically uncovered regions within the real-world data distribution, hindering model training and causing misclassification near class boundaries as well as unstable behaviors in peripheral areas. Although recent large language models (LLMs) show promise for data augmentation, an integrated framework that simultaneously achieves directional control of generation, domain alignment, and quality control has not yet been fully established. To address these challenges, we propose a Cluster-conditioned Interpolative and Extrapolative framework for Geometry-Aware and Domain-aligned data augmentation (CIEGAD), which systematically complements both in-distribution and out-of-distribution semantically uncovered regions. CIEGAD constructs domain profiles through cluster conditioning, allocates generation with a hierarchical frequency-geometric allocation integrating class frequency and geometric indicators, and finely controls generation directions via the coexistence of interpolative and extrapolative synthesis. It further performs quality control through geometry-constrained filtering combined with an LLM-as-a-Judge mechanism. Experiments on multiple classification tasks demonstrate that CIEGAD effectively extends the periphery of real-world data distributions while maintaining high alignment between generated and real-world data as well as semantic diversity. In particular, for long-tailed and multi-class classification tasks, CIEGAD consistently improves F1 and recall, validating the triple harmony of distributional consistency, diversity, and quality. These results indicate that CIEGAD serves as a practically oriented data augmentation framework that complements underrepresented regions while preserving alignment with real-world data.
- Abstract(参考訳): 実践的なディープラーニングデプロイメントでは、データの不足とラベル分布の不均衡は、しばしば実世界のデータ分布内の意味不明な領域につながり、モデルトレーニングを妨げ、クラス境界付近での誤分類や周辺領域の不安定な振る舞いを引き起こす。
近年の大規模言語モデル (LLM) はデータ拡張の可能性を示唆しているが、生成やドメインアライメント、品質管理の方向性制御を同時に実現する統合フレームワークはまだ確立されていない。
これらの課題に対処するため、我々は、分布内および分布外の両方を意味不明に体系的に補完する、幾何学的・領域対応データ拡張のためのクラスタ条件補間・補間フレームワーク(CIEGAD)を提案する。
CIEGADは、クラスタ条件付けを通じてドメインプロファイルを構築し、クラス周波数と幾何指標を統合した階層的な周波数幾何学的アロケーションで生成を割り当て、補間合成と外挿合成の共存によって生成方向をきめ細かく制御する。
さらに、LLM-as-a-Judge機構と組み合わせた幾何制約フィルタリングによる品質制御を行う。
複数の分類タスクの実験では、CIEGADは実世界のデータ分布の周辺を効果的に拡張し、生成したデータと実世界のデータの高整合性と意味的な多様性を維持する。
特に、長い尾とマルチクラスの分類タスクでは、CIEGADは一貫してF1とリコールを改善し、分散一貫性、多様性、品質の三重調和を検証する。
これらの結果から,CIEGADは現実のデータとの整合性を維持しつつ,未表現領域を補完する実用的なデータ拡張フレームワークとして機能することが示唆された。
関連論文リスト
- HFedATM: Hierarchical Federated Domain Generalization via Optimal Transport and Regularized Mean Aggregation [12.655334562608314]
Federated Learning(FL)は、複数のクライアントが生データを共有せずに、共同で共有グローバルモデルをトレーニングする分散アプローチである。
本稿では階層型フェデレーションドメイン一般化(HFedDG)を紹介する。
論文 参考訳(メタデータ) (2025-08-07T08:14:52Z) - Geometric Knowledge-Guided Localized Global Distribution Alignment for Federated Learning [7.893874342163829]
本研究では,グローバルな埋め込み分布を局所的にシミュレートすることに焦点を当てた幾何学誘導型データ生成手法を提案する。
まず,埋め込み分布の幾何学的形状の概念を紹介する。
そして、プライバシー制約の下でグローバルな幾何学的形状を得るという課題に対処する。
論文 参考訳(メタデータ) (2025-03-09T05:30:28Z) - Multisource Collaborative Domain Generalization for Cross-Scene Remote Sensing Image Classification [57.945437355714155]
クロスシーン画像分類は, 異なる分布領域のアノテート領域に, 地中物質の事前の知識を伝達することを目的としている。
既存のアプローチでは、未確認のターゲットドメインへの単一ソースドメインの一般化に重点を置いている。
マルチソースリモートセンシングデータの均一性と不均一性特性に基づく,新しいマルチソース協調型ドメイン一般化フレームワーク(MS-CDG)を提案する。
論文 参考訳(メタデータ) (2024-12-05T06:15:08Z) - Improving Anomaly Segmentation with Multi-Granularity Cross-Domain
Alignment [17.086123737443714]
異常セグメンテーションは、画像中の非定型物体を識別する上で重要な役割を担っている。
既存の手法は合成データに顕著な結果を示すが、合成データドメインと実世界のデータドメインの相違を考慮できないことが多い。
シーンと個々のサンプルレベルの両方で、ドメイン間の機能を調和させるのに適した、マルチグラニュラリティ・クロスドメインアライメントフレームワークを導入します。
論文 参考訳(メタデータ) (2023-08-16T22:54:49Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Relation Matters: Foreground-aware Graph-based Relational Reasoning for
Domain Adaptive Object Detection [81.07378219410182]
我々は、FGRR(Fearground-aware Graph-based Reasoning)というドメインDのための新しい汎用フレームワークを提案する。
FGRRはグラフ構造を検出パイプラインに組み込んで、ドメイン内およびドメイン間フォアグラウンドオブジェクト関係を明示的にモデル化する。
実験の結果、提案したFGRRは4つのDomainDベンチマークの最先端よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-06-06T05:12:48Z) - Deep face recognition with clustering based domain adaptation [57.29464116557734]
そこで本研究では,ターゲットドメインとソースがクラスを共有しない顔認識タスクを対象とした,クラスタリングに基づく新しいドメイン適応手法を提案する。
本手法は,特徴領域をグローバルに整列させ,その一方で,対象クラスタを局所的に識別することで,識別対象特徴を効果的に学習する。
論文 参考訳(メタデータ) (2022-05-27T12:29:11Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Towards Uncovering the Intrinsic Data Structures for Unsupervised Domain
Adaptation using Structurally Regularized Deep Clustering [119.88565565454378]
Unsupervised Domain Adapt (UDA) は、ターゲットドメイン上のラベルなしデータの予測を行う分類モデルを学ぶことである。
本稿では,対象データの正規化判別クラスタリングと生成クラスタリングを統合する構造的正規化深層クラスタリングのハイブリッドモデルを提案する。
提案するH-SRDCは, インダクティブ設定とトランスダクティブ設定の両方において, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2020-12-08T08:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。