論文の概要: Mixstyle-Entropy: Domain Generalization with Causal Intervention and Perturbation
- arxiv url: http://arxiv.org/abs/2408.03608v2
- Date: Thu, 22 Aug 2024 13:13:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-23 18:36:08.933153
- Title: Mixstyle-Entropy: Domain Generalization with Causal Intervention and Perturbation
- Title(参考訳): 混合型エントロピー:因果介入と摂動を伴う領域一般化
- Authors: Luyao Tang, Yuxuan Yuan, Chaoqi Chen, Xinghao Ding, Yue Huang,
- Abstract要約: ドメイン一般化(DG)は、ドメイン関連情報に依存しない表現を学習することでこの問題を解決し、未知の環境への外挿を容易にする。
既存のアプローチは典型的には、ソースデータから共有された特徴を抽出するための調整済みのトレーニング目標の定式化に重点を置いている。
InPerという因果性に基づく新しいフレームワークを提案する。これは、訓練中の因果的介入と試験中の因果的摂動を組み込むことにより、モデル一般化を強化するために設計された。
- 参考スコア(独自算出の注目度): 38.97031630265987
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the considerable advancements achieved by deep neural networks, their performance tends to degenerate when the test environment diverges from the training ones. Domain generalization (DG) solves this issue by learning representations independent of domain-related information, thus facilitating extrapolation to unseen environments. Existing approaches typically focus on formulating tailored training objectives to extract shared features from the source data. However, the disjointed training and testing procedures may compromise robustness, particularly in the face of unforeseen variations during deployment. In this paper, we propose a novel and holistic framework based on causality, named InPer, designed to enhance model generalization by incorporating causal intervention during training and causal perturbation during testing. Specifically, during the training phase, we employ entropy-based causal intervention (EnIn) to refine the selection of causal variables. To identify samples with anti-interference causal variables from the target domain, we propose a novel metric, homeostatic score, through causal perturbation (HoPer) to construct a prototype classifier in test time. Experimental results across multiple cross-domain tasks confirm the efficacy of InPer.
- Abstract(参考訳): ディープニューラルネットワークによって達成されたかなりの進歩にもかかわらず、テスト環境がトレーニング環境から逸脱する傾向にある。
ドメイン一般化(DG)は、ドメイン関連情報に依存しない表現を学習することでこの問題を解決し、未知の環境への外挿を容易にする。
既存のアプローチは典型的には、ソースデータから共有された特徴を抽出するための調整済みのトレーニング目標の定式化に重点を置いている。
しかし、解離したトレーニングとテストの手順は、特に展開中に予期せぬ変動に直面した場合、堅牢性を損なう可能性がある。
本稿では,因果関係を基礎とした新しい枠組みInPerを提案する。このフレームワークは,訓練中の因果的介入と試験中の因果的摂動を組み込むことで,モデル一般化の促進を目的としている。
具体的には、トレーニングフェーズにおいて、エントロピーに基づく因果介入(EnIn)を用いて因果変数の選択を洗練させる。
対象領域から反干渉因果変数を持つサンプルを同定するために, 因果摂動(HoPer)を通した新しい計量, ホメオスタティックスコアを提案し, 試行時間内にプロトタイプ分類器を構築する。
複数のクロスドメインタスクにまたがる実験結果から、InPerの有効性が確認された。
関連論文リスト
- Targeted Cause Discovery with Data-Driven Learning [66.86881771339145]
本稿では,観測結果から対象変数の因果変数を推定する機械学習手法を提案する。
我々は、シミュレートされたデータの教師あり学習を通じて因果関係を特定するために訓練されたニューラルネットワークを用いる。
大規模遺伝子制御ネットワークにおける因果関係の同定における本手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-08-29T02:21:11Z) - Learning Unknown Intervention Targets in Structural Causal Models from
Heterogeneous Data [27.38242139321935]
構造因果モデルにおける未知の介入対象を特定する問題について検討する。
潜在的共同設立者の存在下では、観察された変数間の介入対象を一意に決定することはできない。
我々の手法は、返却された候補集合は常に真の介入対象のサブセットであるため、技術の現状を改善します。
論文 参考訳(メタデータ) (2023-12-11T03:31:54Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Deployment of Image Analysis Algorithms under Prevalence Shifts [6.373765910269204]
領域ギャップは、医療画像解析のための機械学習(ML)ベースのソリューションの臨床的翻訳において、最も関連する障害の一つである。
そこで本研究では,トレーニング済みの分類器を新しい環境に適応させるために,推定したデプロイメントの頻度を利用して精度の高い画像分類を行うワークフローを提案する。
論文 参考訳(メタデータ) (2023-03-22T13:16:37Z) - Active Learning for Optimal Intervention Design in Causal Models [11.294389953686945]
本研究は、最適介入を特定するための因果的アクティブラーニング戦略を開発し、分布のインターベンショナル平均と所望の目標平均との相違によって測定した。
本研究では、Perturb-CITE-seq実験から得られた合成データと単細胞転写データの両方にアプローチを適用し、特定の細胞状態遷移を誘導する最適な摂動を同定する。
論文 参考訳(メタデータ) (2022-09-10T20:40:30Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - Pre-training also Transfers Non-Robustness [20.226917627173126]
一般化への貢献が認められているにもかかわらず、事前学習は、事前訓練されたモデルから微調整されたモデルへの非破壊性も伝達する。
その結果, 損耗を緩和し, 一般化を保ち, 有効性を検証した。
論文 参考訳(メタデータ) (2021-06-21T11:16:13Z) - Decentralized Local Stochastic Extra-Gradient for Variational
Inequalities [125.62877849447729]
我々は、不均一(非IID)で多くのデバイスに分散する問題データを持つ領域上での分散変分不等式(VIs)を考察する。
我々は、完全に分散化された計算の設定を網羅する計算ネットワークについて、非常に一般的な仮定を行う。
理論的には, モノトン, モノトンおよび非モノトンセッティングにおける収束速度を理論的に解析する。
論文 参考訳(メタデータ) (2021-06-15T17:45:51Z) - Unsupervised Domain Adaptation for Spatio-Temporal Action Localization [69.12982544509427]
S時間動作の局所化はコンピュータビジョンにおいて重要な問題である。
本稿では、エンドツーエンドの教師なしドメイン適応アルゴリズムを提案する。
空間的特徴と時間的特徴を別々にあるいは共同的に適応した場合に,顕著な性能向上が達成できることを示す。
論文 参考訳(メタデータ) (2020-10-19T04:25:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。