論文の概要: Selecting Data Augmentation for Simulating Interventions
- arxiv url: http://arxiv.org/abs/2005.01856v4
- Date: Mon, 26 Oct 2020 10:52:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 00:04:28.085018
- Title: Selecting Data Augmentation for Simulating Interventions
- Title(参考訳): 干渉シミュレーションのためのデータ拡張の選択
- Authors: Maximilian Ilse, Jakub M. Tomczak, Patrick Forr\'e
- Abstract要約: 純粋に観察データで訓練された機械学習モデルと経験的リスクの原則は、目に見えない領域に一般化することができない。
我々は、データ拡張の成功を説明するために、観察されたドメインとタスクラベルの急激な相関を弱める方法を説明するために、因果的概念を用いることができると論じる。
- 参考スコア(独自算出の注目度): 12.848239550098693
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning models trained with purely observational data and the
principle of empirical risk minimization \citep{vapnik_principles_1992} can
fail to generalize to unseen domains. In this paper, we focus on the case where
the problem arises through spurious correlation between the observed domains
and the actual task labels. We find that many domain generalization methods do
not explicitly take this spurious correlation into account. Instead, especially
in more application-oriented research areas like medical imaging or robotics,
data augmentation techniques that are based on heuristics are used to learn
domain invariant features. To bridge the gap between theory and practice, we
develop a causal perspective on the problem of domain generalization. We argue
that causal concepts can be used to explain the success of data augmentation by
describing how they can weaken the spurious correlation between the observed
domains and the task labels. We demonstrate that data augmentation can serve as
a tool for simulating interventional data. We use these theoretical insights to
derive a simple algorithm that is able to select data augmentation techniques
that will lead to better domain generalization.
- Abstract(参考訳): 純粋に観測データで訓練された機械学習モデルと経験的リスク最小化の原理は、目に見えない領域に一般化できない。
本稿では,観測された領域と実際のタスクラベルとの疎結合によって問題が発生する場合に焦点を当てる。
多くのドメイン一般化法は、このスプリアス相関を明示的に考慮していない。
代わりに、特に医療画像やロボティクスのようなよりアプリケーション指向の研究領域では、ヒューリスティックスに基づくデータ拡張技術がドメイン不変機能を学ぶために使用される。
理論と実践のギャップを埋めるため,ドメインの一般化問題に対する因果的視点を構築した。
因果概念は、観測されたドメインとタスクラベルの間のスパーラスな相関を弱める方法を説明することによって、データ拡張の成功を説明するのに使うことができる。
介入データのシミュレーションツールとして,データ拡張が有効であることを示す。
これらの理論的な洞察を用いて、より優れた領域の一般化につながるデータ拡張手法を選択できる単純なアルゴリズムを導出する。
関連論文リスト
- Learning Divergence Fields for Shift-Robust Graph Representations [73.11818515795761]
本研究では,相互依存データに対する問題に対して,学習可能な分散場を持つ幾何学的拡散モデルを提案する。
因果推論によって新たな学習目標が導出され、ドメイン間で無神経な相互依存の一般化可能なパターンを学習するためのモデルが導出される。
論文 参考訳(メタデータ) (2024-06-07T14:29:21Z) - Deriving Causal Order from Single-Variable Interventions: Guarantees & Algorithm [14.980926991441345]
介入データを含むデータセットは,データ分布に関する現実的な仮定の下で効果的に抽出可能であることを示す。
観察的および介入的設定における各変数の限界分布の比較に依拠する介入忠実性を導入する。
また、多数の単一変数の介入を含むデータセットから因果順序を推測するアルゴリズムであるIntersortを導入する。
論文 参考訳(メタデータ) (2024-05-28T16:07:17Z) - DIGIC: Domain Generalizable Imitation Learning by Causal Discovery [69.13526582209165]
因果性は機械学習と組み合わせて、ドメインの一般化のための堅牢な表現を生成する。
我々は、実証データ分布を活用して、ドメインの一般化可能なポリシーの因果的特徴を発見するために、異なる試みを行っている。
DIGICと呼ばれる新しいフレームワークを設計し、実演データ分布から専門家行動の直接的な原因を見出すことにより因果的特徴を識別する。
論文 参考訳(メタデータ) (2024-02-29T07:09:01Z) - Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z) - SALUDA: Surface-based Automotive Lidar Unsupervised Domain Adaptation [62.889835139583965]
我々は、ソースデータとターゲットデータに基づいて、暗黙の基盤となる表面表現を同時に学習する教師なし補助タスクを導入する。
両方のドメインが同じ遅延表現を共有しているため、モデルは2つのデータソース間の不一致を許容せざるを得ない。
実験の結果,本手法は実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-
論文 参考訳(メタデータ) (2023-04-06T17:36:23Z) - Domain-aware Triplet loss in Domain Generalization [0.0]
ドメインシフトは、テストとトレーニングデータの分布の相違によって引き起こされる。
ドメイン一般化のためのドメイン認識三重項損失を設計し、モデルが類似のセマンティックな特徴をクラスタリングするのを助ける。
本アルゴリズムは,埋め込み空間におけるドメイン情報を分散するように設計されている。
論文 参考訳(メタデータ) (2023-03-01T14:02:01Z) - Direct-Effect Risk Minimization for Domain Generalization [11.105832297850188]
本稿では、因果推論による直接的および間接的効果の概念を領域一般化問題に導入する。
直接効果を学習するモデルは、相関シフトしたドメイン間で最悪のケースリスクを最小限に抑えると我々は主張する。
5つの相関シフトデータセットとDomainBedベンチマークの実験により、我々のアプローチの有効性が検証された。
論文 参考訳(メタデータ) (2022-11-26T15:35:36Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - Domain-Class Correlation Decomposition for Generalizable Person
Re-Identification [34.813965300584776]
個人の再識別では、ドメインとクラスは相関する。
このドメイン・クラス間の相関関係により、ドメインの敵対的学習はクラスに関する特定の情報を失うことが示される。
我々のモデルは、大規模ドメイン一般化Re-IDベンチマークにおいて最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-06-29T09:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。