論文の概要: GCISG: Guided Causal Invariant Learning for Improved Syn-to-real
Generalization
- arxiv url: http://arxiv.org/abs/2208.10024v1
- Date: Mon, 22 Aug 2022 02:39:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 13:29:43.661047
- Title: GCISG: Guided Causal Invariant Learning for Improved Syn-to-real
Generalization
- Title(参考訳): gcisg: 改良されたsyn-to-real一般化のための因果不変学習
- Authors: Gilhyun Nam, Gyeongjae Choi, Kyungmin Lee
- Abstract要約: 人工的に生成されたデータを用いたディープラーニングモデルのトレーニングは、トレーニングデータが不足している場合の代替となる可能性がある。
本稿では,データ生成のための因果的枠組みを用いて,領域ギャップを特徴付ける。
そこで本研究では,構文から現実への一般化を促進するスタイル不変表現の学習をモデルに促す因果不変学習を提案する。
- 参考スコア(独自算出の注目度): 1.2215956380648065
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Training a deep learning model with artificially generated data can be an
alternative when training data are scarce, yet it suffers from poor
generalization performance due to a large domain gap. In this paper, we
characterize the domain gap by using a causal framework for data generation. We
assume that the real and synthetic data have common content variables but
different style variables. Thus, a model trained on synthetic dataset might
have poor generalization as the model learns the nuisance style variables. To
that end, we propose causal invariance learning which encourages the model to
learn a style-invariant representation that enhances the syn-to-real
generalization. Furthermore, we propose a simple yet effective feature
distillation method that prevents catastrophic forgetting of semantic knowledge
of the real domain. In sum, we refer to our method as Guided Causal Invariant
Syn-to-real Generalization that effectively improves the performance of
syn-to-real generalization. We empirically verify the validity of proposed
methods, and especially, our method achieves state-of-the-art on visual
syn-to-real domain generalization tasks such as image classification and
semantic segmentation.
- Abstract(参考訳): 人工的なデータを用いたディープラーニングモデルのトレーニングは、トレーニングデータが不足している場合には代替になり得るが、大きなドメインギャップによる一般化性能の低下に悩まされる。
本稿では,データ生成のための因果フレームワークを用いて,ドメイン間隙を特徴付ける。
実データと合成データは共通のコンテンツ変数を持つが、異なるスタイル変数を持つと仮定する。
したがって、合成データセットでトレーニングされたモデルでは、ニュアサンススタイル変数を学習するため、一般化が不十分な場合がある。
そこで,本研究では,共変不変表現をモデルに学習させることを奨励する因果不変性学習を提案する。
さらに,実領域の意味的知識の破滅的な忘れを防止し,簡便かつ効果的な特徴蒸留法を提案する。
要約すると、本手法は、Syn-to-real Generalizationの性能を効果的に向上するガイド因果不変Syn-to-real Generalizationと呼ぶ。
提案手法の有効性を実証的に検証し,特に画像分類やセマンティクスセグメンテーションなどの視覚的シント・リアル領域一般化タスクにおいて最先端の手法を実現する。
関連論文リスト
- Fine-Tuning Pre-trained Language Models for Robust Causal Representation Learning [26.29386609645171]
プレトレーニング言語モデル(PLM)の微調整は、様々な領域で有効であることが示されている。
本研究では, 分解仮定に基づいて, いわゆる因果前ドア調整によりロバスト表現を導出可能であることを示す。
そこで本研究では,表現学習に微調整機構と因果関係を導入することにより,領域一般化問題に光を当てる。
論文 参考訳(メタデータ) (2024-10-18T11:06:23Z) - Learning Divergence Fields for Shift-Robust Graph Representations [73.11818515795761]
本研究では,相互依存データに対する問題に対して,学習可能な分散場を持つ幾何学的拡散モデルを提案する。
因果推論によって新たな学習目標が導出され、ドメイン間で無神経な相互依存の一般化可能なパターンを学習するためのモデルが導出される。
論文 参考訳(メタデータ) (2024-06-07T14:29:21Z) - SEER-ZSL: Semantic Encoder-Enhanced Representations for Generalized
Zero-Shot Learning [0.7420433640907689]
一般化ゼロショット学習(GZSL)は、見知らぬクラスから知識を伝達することで、目に見えないクラスを認識する。
本稿では,一般化ギャップに対処するための二重戦略を提案する。
論文 参考訳(メタデータ) (2023-12-20T15:18:51Z) - Syntactically Robust Training on Partially-Observed Data for Open
Information Extraction [25.59133746149343]
オープン情報抽出モデルは十分な監督力を持った有望な結果を示している。
そこで本研究では,統語論的に頑健な学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-17T12:39:13Z) - Style Interleaved Learning for Generalizable Person Re-identification [69.03539634477637]
DG ReIDトレーニングのための新しいスタイルインターリーブラーニング(IL)フレームワークを提案する。
従来の学習戦略とは異なり、ILには2つの前方伝播と1つの後方伝播が組み込まれている。
我々のモデルはDG ReIDの大規模ベンチマークにおいて最先端の手法を一貫して上回ることを示す。
論文 参考訳(メタデータ) (2022-07-07T07:41:32Z) - Generalizable Information Theoretic Causal Representation [37.54158138447033]
本稿では,観測データから因果表現を学習するために,仮説因果グラフに基づいて相互情報量で学習手順を規則化することを提案する。
この最適化は、因果性に着想を得た学習がサンプルの複雑さを減らし、一般化能力を向上させるという理論的保証を導出する反ファクト的損失を伴う。
論文 参考訳(メタデータ) (2022-02-17T00:38:35Z) - Towards Principled Disentanglement for Domain Generalization [90.9891372499545]
機械学習モデルの根本的な課題は、アウト・オブ・ディストリビューション(OOD)データへの一般化である。
私たちはまず、DEC(Disentanglement-Constrained Domain Generalization)と呼ばれる制約付き最適化としてOOD一般化問題を定式化する。
この変換に基づいて、結合表現の不絡合と領域一般化のための原始双対アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-11-27T07:36:32Z) - Mitigating Generation Shifts for Generalized Zero-Shot Learning [52.98182124310114]
一般化ゼロショット学習(英: Generalized Zero-Shot Learning、GZSL)は、学習中に見知らぬクラスが観察できない、見つからないサンプルを認識するために意味情報(属性など)を活用するタスクである。
本稿では,未知のデータ合成を効率よく,効率的に学習するための新しい生成シフト緩和フローフレームワークを提案する。
実験結果から,GSMFlowは従来のゼロショット設定と一般化されたゼロショット設定の両方において,最先端の認識性能を実現することが示された。
論文 参考訳(メタデータ) (2021-07-07T11:43:59Z) - Contrastive Syn-to-Real Generalization [125.54991489017854]
我々は,学習した特徴埋め込みの多様性が一般化性能に重要な役割を果たすことを重要視する。
本研究では,イメージネットの知識を生かして合成領域への過剰適合を防ぐ新しい枠組みであるコントラスト合成から実への一般化(csg)を提案する。
CSGの各種合成訓練における効果を実証し、ゼロショット領域の一般化に対する最先端性能を示す。
論文 参考訳(メタデータ) (2021-04-06T05:10:29Z) - DomainMix: Learning Generalizable Person Re-Identification Without Human
Annotations [89.78473564527688]
本稿では,ラベル付き合成データセットとラベル付き実世界のデータセットを用いてユニバーサルモデルをトレーニングする方法を示す。
このように、人間のアノテーションはもはや不要であり、大規模で多様な現実世界のデータセットにスケーラブルである。
実験結果から,提案手法は完全な人間のアノテーションで訓練されたアノテーションとほぼ同等であることがわかった。
論文 参考訳(メタデータ) (2020-11-24T08:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。