論文の概要: Domain Generalization through Spatial Relation Induction over Visual Primitives
- arxiv url: http://arxiv.org/abs/2605.06043v1
- Date: Thu, 07 May 2026 11:31:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.725385
- Title: Domain Generalization through Spatial Relation Induction over Visual Primitives
- Title(参考訳): 視覚的プリミティブを用いた空間的関係誘導による領域一般化
- Authors: Dat Nguyen, Duc-Duy Nguyen,
- Abstract要約: Primitive-Aware Structure for Domain gEneralization (PARSE) は、視覚的視覚的プリミティブとその関係性を構成する画像分類フレームワークである。
本研究では, ソフトバイナリ, 三項述語, 四項述語を用いて, 端から端まで学習可能な空間アライメント(空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント) を表現した。
CUB-DGとDomainBedベンチマークスイート全体で、PARSEはCUB-DGの精度を4.5ポイント以上改善し、DomainBedの既存のDGメソッドと競合し続けている。
- 参考スコア(独自算出の注目度): 4.085285915236828
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Domain generalization requires identifying stable representations that support reliable classification across domains. Most existing methods seek such stability through improving the training process, for example, through model selection strategies, data augmentation, or feature-alignment objectives. Although these strategies can be effective, they leave the representation learning of structural composition implicit, which may limit performance on compositional domain generalization benchmarks. In this work, we propose Primitive-Aware Relational Structure for domain gEneralization (PARSE), an image classification framework that factors visual recognition into visual primitives and their relational composition. We represent these compositions using soft binary, ternary, and quaternary predicates over primitive locations, yielding differentiable measures of spatial alignment that can be learned end-to-end. To learn primitives and relational structures jointly, we design an end-to-end architecture with three components: (1) a convolutional neural network (CNN) backbone that extracts general visual features, (2) a concept bottleneck layer that maps these features to primitive heatmaps with differentiable spatial coordinates, and (3) a structural scoring layer that evaluates candidate spatial relations among the detected primitives. We then compute class probability from the joint evidence of its class-specific relational compositions. Across CUB-DG and the DomainBed benchmark suite,PARSE improves accuracy by over 4.5 percentage points on CUB-DG and remains competitive with existing DG methods on DomainBed.
- Abstract(参考訳): ドメインの一般化には、ドメイン間の信頼性の高い分類をサポートする安定した表現を特定する必要がある。
既存のほとんどの方法は、例えば、モデル選択戦略、データ拡張、機能調整の目的などを通じて、トレーニングプロセスを改善することで、そのような安定性を求めています。
これらの戦略は有効であるが、構造構成の表現学習を暗黙的に残し、構成領域一般化ベンチマークのパフォーマンスを制限する可能性がある。
本研究では,視覚的プリミティブとそれらの関係合成に視覚的認識を分解する画像分類フレームワークであるPrimitive-Aware Relational Structure for domain gEneralization (PARSE)を提案する。
本研究では, ソフトバイナリ, 三項述語, 四項述語を用いて, 端から端まで学習可能な空間アライメント(空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント, 空間アライメント) を表現した。
1)一般的な視覚的特徴を抽出する畳み込みニューラルネットワーク(CNN)バックボーン,(2)これらの特徴を異なる空間座標を持つ原始熱マップにマッピングする概念ボトルネック層,(3)検出されたプリミティブ間の空間関係を推定する構造評価層,である。
次に、クラス固有の関係合成の合同証拠からクラス確率を計算する。
CUB-DGとDomainBedベンチマークスイート全体で、PARSEはCUB-DGの精度を4.5ポイント以上改善し、DomainBedの既存のDGメソッドと競合し続けている。
関連論文リスト
- Towards Multiscale Graph-based Protein Learning with Geometric Secondary Structural Motifs [10.433254687685038]
タンパク質構造を学習するための強力なツールとして、グラフニューラルネットワーク(GNN)が登場した。
本稿では,タンパク質に合わせたマルチスケールグラフベースの効率的な学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-31T18:50:24Z) - Hierarchical Neural Semantic Representation for 3D Semantic Correspondence [72.8101601086805]
階層型ニューラルセマンティック表現(HNSR)を設計し,高次構造と多分解能局所幾何学的特徴を捉える。
第2に,グローバルなセマンティック特徴を用いた粗いセマンティック対応を確立する,プログレッシブなグローバル-ローカルマッチング戦略を設計する。
第3に,本フレームワークはトレーニングフリーで,様々なトレーニング済みの3D生成バックボーンと広範囲に互換性があり,多様な形状カテゴリにまたがる強力な一般化が示されている。
論文 参考訳(メタデータ) (2025-09-22T07:23:07Z) - Adaptive Betweenness Clustering for Semi-Supervised Domain Adaptation [108.40945109477886]
分類領域アライメントを実現するために,G-ABC (Adaptive Betweenness Clustering) と呼ばれる新しいSSDA手法を提案する。
提案手法は従来のSSDA手法よりも優れており,提案したG-ABCアルゴリズムの優位性を示している。
論文 参考訳(メタデータ) (2024-01-21T09:57:56Z) - Unsupervised Domain Adaptation for Point Cloud Semantic Segmentation via
Graph Matching [14.876681993079062]
本稿では,2つの領域間の局所的な特徴アライメントを探索するグラフベースのフレームワークを提案する。
また、カテゴリー誘導型コントラスト損失を定式化し、セグメント化モデルを誘導し、対象領域における識別的特徴を学習する。
論文 参考訳(メタデータ) (2022-08-09T02:30:15Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - Domain Generalisation for Object Detection under Covariate and Concept Shift [10.32461766065764]
ドメインの一般化は、ドメイン固有の特徴を抑えながら、ドメイン不変の機能の学習を促進することを目的としている。
オブジェクト検出のためのドメイン一般化手法を提案し, オブジェクト検出アーキテクチャに適用可能な最初のアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-10T11:14:18Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - Towards Uncovering the Intrinsic Data Structures for Unsupervised Domain
Adaptation using Structurally Regularized Deep Clustering [119.88565565454378]
Unsupervised Domain Adapt (UDA) は、ターゲットドメイン上のラベルなしデータの予測を行う分類モデルを学ぶことである。
本稿では,対象データの正規化判別クラスタリングと生成クラスタリングを統合する構造的正規化深層クラスタリングのハイブリッドモデルを提案する。
提案するH-SRDCは, インダクティブ設定とトランスダクティブ設定の両方において, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2020-12-08T08:52:00Z) - Bi-Directional Generation for Unsupervised Domain Adaptation [61.73001005378002]
教師なしのドメイン適応は、確立されたソースドメイン情報に依存するラベルなしのターゲットドメインを促進する。
従来の手法では、潜在空間におけるドメインの不一致を強制的に低減することで、本質的なデータ構造が破壊される。
本稿では、2つの中間領域をブリッジソースとターゲットドメインに補間する一貫した分類器を用いた双方向生成ドメイン適応モデルを提案する。
論文 参考訳(メタデータ) (2020-02-12T09:45:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。