論文の概要: Matching-space Stereo Networks for Cross-domain Generalization
- arxiv url: http://arxiv.org/abs/2010.07347v1
- Date: Wed, 14 Oct 2020 18:29:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 13:45:46.817878
- Title: Matching-space Stereo Networks for Cross-domain Generalization
- Title(参考訳): クロスドメイン一般化のためのマッチング空間ステレオネットワーク
- Authors: Changjiang Cai, Matteo Poggi, Stefano Mattoccia, Philippos Mordohai
- Abstract要約: 我々は新しいアーキテクチャ、すなわちMatching-Space Networks (MS-Nets)を紹介する。
提案手法は,従来のディープアーキテクチャよりも非表示環境に優れた一般化を実現し,ソース領域の精度をほとんど変更せずに維持する。
- 参考スコア(独自算出の注目度): 36.84459878867475
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end deep networks represent the state of the art for stereo matching.
While excelling on images framing environments similar to the training set,
major drops in accuracy occur in unseen domains (e.g., when moving from
synthetic to real scenes). In this paper we introduce a novel family of
architectures, namely Matching-Space Networks (MS-Nets), with improved
generalization properties. By replacing learning-based feature extraction from
image RGB values with matching functions and confidence measures from
conventional wisdom, we move the learning process from the color space to the
Matching Space, avoiding over-specialization to domain specific features.
Extensive experimental results on four real datasets highlight that our
proposal leads to superior generalization to unseen environments over
conventional deep architectures, keeping accuracy on the source domain almost
unaltered. Our code is available at https://github.com/ccj5351/MS-Nets.
- Abstract(参考訳): エンドツーエンドのディープネットワークはステレオマッチング技術の現状を表している。
トレーニングセットに類似したイメージフレーミング環境に優れる一方で、見えない領域(例えば合成から実際のシーンに移行する場合)では、精度が大幅に低下する。
本稿では,Matching-Space Networks (MS-Nets) と呼ばれる新しいアーキテクチャ群を紹介する。
画像RGB値からの学習に基づく特徴抽出を、従来の知恵と一致した関数に置き換えることで、学習プロセスを色空間からマッチング空間に移動させ、過剰特殊化を回避し、ドメイン固有の特徴へ移行する。
4つの実際のデータセットに対する大規模な実験結果から,提案手法が従来の深層アーキテクチャよりも見つからない環境に優れた一般化をもたらすことが示唆された。
私たちのコードはhttps://github.com/ccj5351/MS-Netsで利用可能です。
関連論文リスト
- United Domain Cognition Network for Salient Object Detection in Optical Remote Sensing Images [21.76732661032257]
周波数領域と空間領域のグローバルローカル情報を共同で探索する新しい統一ドメイン認知ネットワーク(UDCNet)を提案する。
実験結果から提案したUDCNetが24種類の最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-11-11T04:12:27Z) - Intra- & Extra-Source Exemplar-Based Style Synthesis for Improved Domain
Generalization [21.591831983223997]
セマンティックセグメンテーションにおけるドメインの一般化を改善するために,先進的なスタイル合成パイプラインを提案する。
提案手法は,StyleGAN2インバージョンのためのマスク付きノイズエンコーダに基づく。
データシフトの種類によって、ドライブシーンセマンティックセマンティックセグメンテーションの最大12.4%のmIoU改善を実現しています。
論文 参考訳(メタデータ) (2023-07-02T19:56:43Z) - Self-Training Guided Disentangled Adaptation for Cross-Domain Remote
Sensing Image Semantic Segmentation [20.07907723950031]
本稿では,クロスドメインRS画像セマンティックセグメンテーションタスクのための自己学習ガイド型不整合適応ネットワーク(ST-DASegNet)を提案する。
まず,ソースとターゲットの両方のイメージに対して,ソーススタイルとターゲットスタイルの特徴をそれぞれ抽出するために,ソース学生のバックボーンとターゲット学生のバックボーンを提案する。
次に、ユニバーサルな特徴を抽出し、ソーススタイルとターゲットスタイルの特徴の異なる特徴を浄化するために、ドメイン非絡み合いモジュールを提案する。
論文 参考訳(メタデータ) (2023-01-13T13:11:22Z) - Domain Decorrelation with Potential Energy Ranking [40.43902519672898]
textbfPotential textbfEnergy textbfRanking (PoER)を提案する。
PoERは、浅い層にドメイン情報を含むラベル関連機能をニューラルネットワークがキャプチャするのに役立つ。
ドメインベンチマークのパフォーマンスが向上し、既存の手法に比べて平均トップ1の精度が1.20%向上したと報告している。
論文 参考訳(メタデータ) (2022-07-25T13:33:53Z) - Surface Reconstruction from Point Clouds by Learning Predictive Context
Priors [68.12457459590921]
点雲からの表面の再構成は、3Dコンピュータビジョンにとって不可欠である。
推論時に各ポイントクラウドに対して予測的クエリを学習することで予測的コンテキスト優先を導入する。
一つの形状や複雑なシーンの表面再構成実験の結果, 広く使用されているベンチマークでは, 最先端のベンチマークよりも顕著な改善が見られた。
論文 参考訳(メタデータ) (2022-04-23T08:11:33Z) - GraftNet: Towards Domain Generalized Stereo Matching with a
Broad-Spectrum and Task-Oriented Feature [2.610470075814367]
ドメインシフトに対処するために、大規模データセットでトレーニングされたモデルの特徴を活用することを提案する。
コサインの類似性に基づくコストボリュームをブリッジとして、通常のコストアグリゲーションモジュールに移植する。
実験により、この広スペクトルおよびタスク指向機能によりモデル一般化能力を著しく改善できることが示されている。
論文 参考訳(メタデータ) (2022-04-01T03:10:04Z) - Low Light Image Enhancement via Global and Local Context Modeling [164.85287246243956]
低照度画像強調のためのコンテキスト認識ディープネットワークを導入。
まず、全空間領域上の補完的な手がかりを見つけるために空間相関をモデル化するグローバルコンテキストモジュールを特徴とする。
第二に、比較的大きな受容フィールドで局所的なコンテキストをキャプチャする密な残留ブロックを導入する。
論文 参考訳(メタデータ) (2021-01-04T09:40:54Z) - Improving Deep Stereo Network Generalization with Geometric Priors [93.09496073476275]
地上の真実が密集した多様な現実世界のシーンの大規模なデータセットを得ることは困難である。
多くのアルゴリズムは、似たようなシーンや合成データセットの小さな実世界のデータセットに依存している。
本稿では,シーン幾何学の事前知識をエンド・ツー・エンドのステレオネットワークに統合し,ネットワークの一般化を支援することを提案する。
論文 参考訳(メタデータ) (2020-08-25T15:24:02Z) - Spatial Attention Pyramid Network for Unsupervised Domain Adaptation [66.75008386980869]
教師なし領域適応は様々なコンピュータビジョンタスクにおいて重要である。
教師なし領域適応のための新しい空間注意ピラミッドネットワークを設計する。
我々の手法は最先端の手法に対して大きなマージンで好適に機能する。
論文 参考訳(メタデータ) (2020-03-29T09:03:23Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。