論文の概要: MIDAS: Modeling Ground-Truth Distributions with Dark Knowledge for Domain Generalized Stereo Matching
- arxiv url: http://arxiv.org/abs/2503.04376v1
- Date: Thu, 06 Mar 2025 12:27:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 15:59:27.309755
- Title: MIDAS: Modeling Ground-Truth Distributions with Dark Knowledge for Domain Generalized Stereo Matching
- Title(参考訳): MIDAS:ドメイン一般化ステレオマッチングのための暗知識を用いた地層構造分布のモデル化
- Authors: Peng Xu, Zhiyu Xiang, Jingyun Fu, Tianyu Pu, Hanzhi Zhong, Eryun Liu,
- Abstract要約: 提案手法を用いたPCWNetは,KITTI 2015 と 2012 のデータセット上での最先端の一般化性能を実現する。
提案手法は,4つの一般的な実世界のデータセットにまたがる包括的ランキングにおいて,既存の手法よりも優れる。
- 参考スコア(独自算出の注目度): 7.710350925846268
- License:
- Abstract: Despite the significant advances in domain generalized stereo matching, existing methods still exhibit domain-specific preferences when transferring from synthetic to real domains, hindering their practical applications in complex and diverse scenarios. The probability distributions predicted by the stereo network naturally encode rich similarity and uncertainty information. Inspired by this observation, we propose to extract these two types of dark knowledge from the pre-trained network to model intuitive multi-modal ground-truth distributions for both edge and non-edge regions. To mitigate the inherent domain preferences of a single network, we adopt network ensemble and further distinguish between objective and biased knowledge in the Laplace parameter space. Finally, the objective knowledge and the original disparity labels are jointly modeled as a mixture of Laplacians to provide fine-grained supervision for the stereo network training. Extensive experiments demonstrate that: 1) Our method is generic and effectively improves the generalization of existing networks. 2) PCWNet with our method achieves the state-of-the-art generalization performance on both KITTI 2015 and 2012 datasets. 3) Our method outperforms existing methods in comprehensive ranking across four popular real-world datasets.
- Abstract(参考訳): ドメイン一般化ステレオマッチングの大幅な進歩にもかかわらず、既存の手法は、合成ドメインから実際のドメインへの移動においてドメイン固有の嗜好を示し、複雑で多様なシナリオにおける実践的応用を妨げる。
ステレオネットワークによって予測される確率分布は、リッチな類似性と不確実性情報を自然に符号化する。
そこで本研究では,これらの2種類の暗黒知識を事前学習ネットワークから抽出し,エッジ領域と非エッジ領域の両方に対して直感的なマルチモーダル基底構造分布をモデル化することを提案する。
単一ネットワークのドメインの好みを緩和するため、ネットワークアンサンブルを採用し、Laplaceパラメータ空間における目的的知識と偏見的知識を更に区別する。
最後に、目的知識と元の相違ラベルは、ステレオネットワークトレーニングのためのきめ細かい監督を提供するラプラシアンの混合として、共同でモデル化される。
大規模な実験は以下のとおりである。
1)本手法は汎用的であり,既存のネットワークの一般化を効果的に改善する。
2) PCWNet は KITTI 2015 と 2012 の両データセット上で,最先端の一般化性能を実現する。
3)本手法は,4つの一般的な実世界のデータセットにまたがる包括的ランキングにおいて,既存の手法よりも優れる。
関連論文リスト
- Multisource Collaborative Domain Generalization for Cross-Scene Remote Sensing Image Classification [57.945437355714155]
クロスシーン画像分類は, 異なる分布領域のアノテート領域に, 地中物質の事前の知識を伝達することを目的としている。
既存のアプローチでは、未確認のターゲットドメインへの単一ソースドメインの一般化に重点を置いている。
マルチソースリモートセンシングデータの均一性と不均一性特性に基づく,新しいマルチソース協調型ドメイン一般化フレームワーク(MS-CDG)を提案する。
論文 参考訳(メタデータ) (2024-12-05T06:15:08Z) - Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - MADOD: Generalizing OOD Detection to Unseen Domains via G-Invariance Meta-Learning [10.38552112657656]
本稿では,メタ学習型Across Domain Out-of-Distribution Detection (MADOD)を紹介した。
タスク構築において重要な革新は、各メタ学習タスク内で、分散クラスを擬似OODとしてランダムに指定することである。
実世界のデータセットと合成データセットの実験により、MADODは目に見えない領域を横断するセマンティックOOD検出において優れた性能を示した。
論文 参考訳(メタデータ) (2024-11-02T17:46:23Z) - Uncertainty-guided Contrastive Learning for Single Source Domain Generalisation [15.907643838530655]
本稿では,Contrastive Uncertainty Domain Generalisation Network(CUDGNet)と呼ばれる新しいモデルを紹介する。
鍵となるアイデアは、架空のドメインジェネレータを通じて、入力空間とラベル空間の両方のソース容量を増大させることである。
また,提案手法は,1つのフォワードパスからジェネレータサブネットワークを経由した推論時間における効率的な不確実性推定も提供する。
論文 参考訳(メタデータ) (2024-03-12T10:47:45Z) - Improving Intrusion Detection with Domain-Invariant Representation Learning in Latent Space [4.871119861180455]
マルチタスク学習を用いた2相表現学習手法を提案する。
我々は、先行空間と潜時空間の間の相互情報の最小化により、潜時空間を解き放つ。
モデルの有効性を複数のサイバーセキュリティデータセットで評価する。
論文 参考訳(メタデータ) (2023-12-28T17:24:13Z) - TAL: Two-stream Adaptive Learning for Generalizable Person
Re-identification [115.31432027711202]
我々は、ドメイン固有性とドメイン不変性の両方が、re-idモデルの一般化能力の向上に不可欠であると主張する。
これら2種類の情報を同時にモデル化するために,2ストリーム適応学習 (TAL) を命名した。
我々のフレームワークは、単一ソースとマルチソースの両方のドメイン一般化タスクに適用できる。
論文 参考訳(メタデータ) (2021-11-29T01:27:42Z) - Coarse to Fine: Domain Adaptive Crowd Counting via Adversarial Scoring
Network [58.05473757538834]
本稿では,ドメイン間のギャップを粗い粒度から細かな粒度に埋める新しい逆スコアリングネットワーク (ASNet) を提案する。
3組のマイグレーション実験により,提案手法が最先端のカウント性能を実現することを示す。
論文 参考訳(メタデータ) (2021-07-27T14:47:24Z) - A Bit More Bayesian: Domain-Invariant Learning with Uncertainty [111.22588110362705]
ドメインの一般化は、ドメインシフトと、ターゲットドメインデータのアクセス不能に起因する不確実性のために困難である。
本稿では,変分ベイズ推定に基づく確率的枠組みを用いて,両課題に対処する。
2層ベイズ型ニューラルネットワークで共同で確立されたドメイン不変表現と分類器を導出する。
論文 参考訳(メタデータ) (2021-05-09T21:33:27Z) - A Multi-Semantic Metapath Model for Large Scale Heterogeneous Network
Representation Learning [52.83948119677194]
大規模不均一表現学習のためのマルチセマンティックメタパス(MSM)モデルを提案する。
具体的には,マルチセマンティックなメタパスに基づくランダムウォークを生成し,不均衡な分布を扱うヘテロジニアスな近傍を構築する。
提案するフレームワークに対して,AmazonとAlibabaの2つの挑戦的なデータセットに対して,体系的な評価を行う。
論文 参考訳(メタデータ) (2020-07-19T22:50:20Z) - Unsupervised Domain Adaptation with Multiple Domain Discriminators and
Adaptive Self-Training [22.366638308792734]
Unsupervised Domain Adaptation (UDA)は、ソースドメインでトレーニングされたモデルの一般化能力を改善し、ラベル付きデータが使用できないターゲットドメインでうまく機能することを目的としている。
本稿では、合成データに基づいて訓練されたディープニューラルネットワークを、2つの異なるデータ分布間のドメインシフトに対処する実シーンに適用するアプローチを提案する。
論文 参考訳(メタデータ) (2020-04-27T11:48:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。