論文の概要: ITSA: An Information-Theoretic Approach to Automatic Shortcut Avoidance
and Domain Generalization in Stereo Matching Networks
- arxiv url: http://arxiv.org/abs/2201.02263v1
- Date: Thu, 6 Jan 2022 22:03:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-10 22:17:23.162764
- Title: ITSA: An Information-Theoretic Approach to Automatic Shortcut Avoidance
and Domain Generalization in Stereo Matching Networks
- Title(参考訳): ITSA:ステレオマッチングネットワークにおける自動ショートカット回避とドメイン一般化のための情報理論アプローチ
- Authors: WeiQin Chuah, Ruwan Tennakoon, Reza Hoseinnezhad, Alireza
Bab-Hadiashar, David Suter
- Abstract要約: ステレオマッチングネットワークにおける特徴表現の学習は,合成データアーチファクトに大きく影響されていることを示す。
我々は,情報理論的ショートカット回避(ITSA)アプローチを提案し,ショートカット関連情報を特徴表現にエンコードすることを自動的に制限する。
この手法を用いることで、合成データに基づいて純粋に訓練された最先端のステレオマッチングネットワークを効果的に一般化し、以前には見つからなかった実際のデータシナリオを実現することができることを示す。
- 参考スコア(独自算出の注目度): 14.306250516592305
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: State-of-the-art stereo matching networks trained only on synthetic data
often fail to generalize to more challenging real data domains. In this paper,
we attempt to unfold an important factor that hinders the networks from
generalizing across domains: through the lens of shortcut learning. We
demonstrate that the learning of feature representations in stereo matching
networks is heavily influenced by synthetic data artefacts (shortcut
attributes). To mitigate this issue, we propose an Information-Theoretic
Shortcut Avoidance~(ITSA) approach to automatically restrict shortcut-related
information from being encoded into the feature representations. As a result,
our proposed method learns robust and shortcut-invariant features by minimizing
the sensitivity of latent features to input variations. To avoid the
prohibitive computational cost of direct input sensitivity optimization, we
propose an effective yet feasible algorithm to achieve robustness. We show that
using this method, state-of-the-art stereo matching networks that are trained
purely on synthetic data can effectively generalize to challenging and
previously unseen real data scenarios. Importantly, the proposed method
enhances the robustness of the synthetic trained networks to the point that
they outperform their fine-tuned counterparts (on real data) for challenging
out-of-domain stereo datasets.
- Abstract(参考訳): 合成データだけで訓練された最先端のステレオマッチングネットワークは、しばしばより困難な実際のデータドメインに一般化できない。
本稿では,ショートカット学習のレンズを通して,ドメイン間のネットワークの一般化を妨げる重要な要因を開拓しようと試みる。
ステレオマッチングネットワークにおける特徴表現の学習は,合成データアーティファクト(ショートカット属性)の影響を強く受けている。
この問題を軽減するために,情報理論的ショートカット回避(ITSA)アプローチを提案し,ショートカット関連情報を特徴表現にエンコードすることを自動的に制限する。
提案手法は,入力変動に対する潜在特徴の感度を最小化し,ロバストで近距離不変な特徴を学習する。
直接入力感度最適化の計算コストの禁止を回避するため,ロバスト性を実現するための有効なアルゴリズムを提案する。
この手法を用いることで,純粋に合成データに基づいてトレーニングされた最先端のステレオマッチングネットワークが,実データシナリオの挑戦的かつ未認識に効果的に一般化できることを示す。
提案手法は,合成学習ネットワークのロバスト性を向上し,ドメイン外のステレオデータセットに挑戦するために(実データ上で)微調整されたネットワークよりも優れた性能を発揮する。
関連論文リスト
- Provable Optimization for Adversarial Fair Self-supervised Contrastive Learning [49.417414031031264]
本稿では,自己教師型学習環境におけるフェアエンコーダの学習について検討する。
すべてのデータはラベル付けされておらず、そのごく一部だけが機密属性で注釈付けされている。
論文 参考訳(メタデータ) (2024-06-09T08:11:12Z) - Automatic Input Feature Relevance via Spectral Neural Networks [0.9236074230806581]
本稿では,ディープニューラルネットワークにおける入力成分の相対的重要性を推定する新しい手法を提案する。
これは最適化プロセスのスペクトル再パラメータ化を活用することで達成される。
この手法は、合成データと実データの両方に対してうまく挑戦されている。
論文 参考訳(メタデータ) (2024-06-03T10:39:12Z) - Synthetic-To-Real Video Person Re-ID [57.937189569211505]
人物再識別(Re-ID)は重要な課題であり、公衆の安全と情報法医学に重要な応用がある。
本稿では、Re-IDの新規かつ挑戦的な設定、すなわちドメイン間ビデオベースの人物Re-IDについて検討する。
我々は、テストのためのトレーニングや実世界のビデオのソースドメインとして、合成ビデオデータセットを使用します。
論文 参考訳(メタデータ) (2024-02-03T10:19:21Z) - Autosen: improving automatic wifi human sensing through cross-modal
autoencoder [56.44764266426344]
WiFiによる人間のセンシングは、人間の活動を認識する上での低コストでプライバシー上の利点として高く評価されている。
ラベル付きデータなしで自己教師付き学習を可能にすることを目的とした従来のクロスモーダル手法は、振幅-位相の組み合わせから意味のある特徴を抽出するのに苦労する。
我々は、従来のアプローチから外れた革新的な自動WiFiセンシングソリューションであるAutoSenを紹介する。
論文 参考訳(メタデータ) (2024-01-08T19:50:02Z) - A Discrepancy Aware Framework for Robust Anomaly Detection [51.710249807397695]
本稿では,DAF(Disdisrepancy Aware Framework)を提案する。
本手法は,デコーダの欠陥同定に外見に依存しないキューを利用して,その合成外観への依存を緩和する。
単純な合成戦略の下では,既存の手法を大きなマージンで上回り,また,最先端のローカライゼーション性能も達成している。
論文 参考訳(メタデータ) (2023-10-11T15:21:40Z) - Shortcut Detection with Variational Autoencoders [1.3174512123890016]
可変オートエンコーダ(VAE)を利用した画像および音声データセットのショートカット検出手法を提案する。
VAEの潜在空間における特徴の分散により、データセット内の特徴目標相関を発見し、MLショートカットに対して半自動評価することが可能になる。
本手法の適用性を実世界のいくつかのデータセットに適用し,これまで発見されていないショートカットを同定する。
論文 参考訳(メタデータ) (2023-02-08T18:26:10Z) - Localized Shortcut Removal [4.511561231517167]
保持されたテストデータのハイパフォーマンスは、モデルを一般化したり、意味のあるものを学ぶことを必ずしも示さない。
これはしばしば、機械学習のショートカットの存在が原因である。
我々は、逆向きに訓練されたレンズを用いて、画像中の非常に予測的だが意味的に無関係な手がかりを検出し、排除する。
論文 参考訳(メタデータ) (2022-11-24T13:05:33Z) - Achieving Domain Robustness in Stereo Matching Networks by Removing
Shortcut Learning [14.497880004212979]
合成領域における特徴の学習は,合成データに示される2つの「ショートカット」の影響を強く受けていることを示す。
このようなショートカットを取り除くことで、最先端のステレオマッチングフレームワークでドメインの堅牢性を実現できることを示す。
論文 参考訳(メタデータ) (2021-06-15T23:22:54Z) - Mixed-Privacy Forgetting in Deep Networks [114.3840147070712]
大規模画像分類タスクにおいてトレーニングされたネットワークの重みからトレーニングサンプルのサブセットの影響を除去できることを示す。
そこで本研究では,混合プライバシー設定における「忘れ」という新しい概念を導入する。
提案手法は,モデル精度のトレードオフを伴わずに忘れることができることを示す。
論文 参考訳(メタデータ) (2020-12-24T19:34:56Z) - Federated Self-Supervised Learning of Multi-Sensor Representations for
Embedded Intelligence [8.110949636804772]
スマートフォン、ウェアラブル、IoT(Internet of Things)デバイスは、教師付きモデルを学習するための集中リポジトリに蓄積できない豊富なデータを生成する。
本稿では,ウェーブレット変換に基づくテキストカルグラム・信号対応学習という自己教師付きアプローチを提案し,ラベルなしセンサ入力から有用な表現を学習する。
さまざまなパブリックデータセットのマルチビュー戦略を用いて,学習機能の品質を広範囲に評価し,すべての領域で高いパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-07-25T21:59:17Z) - Resolution Adaptive Networks for Efficient Inference [53.04907454606711]
本稿では,低分解能表現が「容易」な入力を分類するのに十分である,という直感に触発された新しいレゾリューション適応ネットワーク(RANet)を提案する。
RANetでは、入力画像はまず、低解像度表現を効率的に抽出する軽量サブネットワークにルーティングされる。
ネットワーク内の高解像度パスは、"ハード"サンプルを認識する能力を維持している。
論文 参考訳(メタデータ) (2020-03-16T16:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。