論文の概要: StereoFlowGAN: Co-training for Stereo and Flow with Unsupervised Domain
Adaptation
- arxiv url: http://arxiv.org/abs/2309.01842v1
- Date: Mon, 4 Sep 2023 22:34:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 17:01:12.778115
- Title: StereoFlowGAN: Co-training for Stereo and Flow with Unsupervised Domain
Adaptation
- Title(参考訳): stereoflowgan:非教師なしドメイン適応ステレオとフローのコトレーニング
- Authors: Zhexiao Xiong, Feng Qiao, Yu Zhang, Nathan Jacobs
- Abstract要約: 合成画像領域と実画像領域間の画像間変換を利用したステレオマッチングと光フロー推定のための新しいトレーニング手法を提案する。
提案手法は,合成画像からの地味情報のみを頼りながら,実画像のシナリオに優れるモデルの訓練を可能にする。
- 参考スコア(独自算出の注目度): 12.888776352711595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a novel training strategy for stereo matching and optical flow
estimation that utilizes image-to-image translation between synthetic and real
image domains. Our approach enables the training of models that excel in real
image scenarios while relying solely on ground-truth information from synthetic
images. To facilitate task-agnostic domain adaptation and the training of
task-specific components, we introduce a bidirectional feature warping module
that handles both left-right and forward-backward directions. Experimental
results show competitive performance over previous domain translation-based
methods, which substantiate the efficacy of our proposed framework, effectively
leveraging the benefits of unsupervised domain adaptation, stereo matching, and
optical flow estimation.
- Abstract(参考訳): 合成画像領域と実画像領域間の画像間変換を利用したステレオマッチングと光フロー推定のための新しいトレーニング手法を提案する。
本手法は,合成画像からの地中情報のみに頼りながら,実画像シナリオに優れたモデルのトレーニングを可能にする。
タスクに依存しないドメイン適応とタスク固有のコンポーネントのトレーニングを容易にするため,左右方向と前方方向の両方を処理できる双方向特徴整合モジュールを導入する。
実験の結果,提案手法の有効性を実証し,教師なし領域適応,ステレオマッチング,光フロー推定の利点を効果的に活用する従来のドメイン翻訳手法よりも優れた性能を示した。
関連論文リスト
- Layered Rendering Diffusion Model for Zero-Shot Guided Image Synthesis [60.260724486834164]
本稿では,テキストクエリに依存する拡散モデルにおける空間制御性向上のための革新的な手法を提案する。
視覚誘導(Vision Guidance)とレイヤーレンダリング拡散(Layered Rendering Diffusion)フレームワーク(Layered Diffusion)という2つの重要なイノベーションを提示します。
本稿では,ボックス・ツー・イメージ,セマンティック・マスク・ツー・イメージ,画像編集の3つの実践的応用に適用する。
論文 参考訳(メタデータ) (2023-11-30T10:36:19Z) - Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。
本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文 参考訳(メタデータ) (2022-04-14T22:58:30Z) - Mutual Learning for Domain Adaptation: Self-distillation Image Dehazing
Network with Sample-cycle [7.452382358080454]
ドメイン適応のための相互学習脱ハージングフレームワークを提案する。
具体的には、まず、合成ドメインの教師ネットワークと、実ドメインの学生ネットワークの2つのシアムネットワークを考案する。
この枠組みは, 主観的, 客観的評価の観点から, 最先端の脱ハージング技術より優れていることを示す。
論文 参考訳(メタデータ) (2022-03-17T16:32:14Z) - Neural Photometry-guided Visual Attribute Transfer [4.630419389180576]
本稿では,同じ又は類似の素材のより大きなサンプルに対して,視覚的特性を伝播する深層学習に基づく手法を提案する。
トレーニングには、複数のイルミネーションと専用データ拡張ポリシーの下で撮影された材料の画像を活用する。
我々のモデルは、教師付き画像から画像への変換フレームワークに依存しており、転送されたドメインに依存しない。
論文 参考訳(メタデータ) (2021-12-05T09:22:28Z) - Self-supervised Augmentation Consistency for Adapting Semantic
Segmentation [56.91850268635183]
本稿では,実用的かつ高精度な意味セグメンテーションのためのドメイン適応手法を提案する。
私たちは標準データ拡張技術である$-$フォトメトリックノイズ、フリップとスケーリング$-$を採用し、セマンティック予測の一貫性を保証する。
適応後の最先端セグメンテーション精度を大幅に改善し、バックボーンアーキテクチャと適応シナリオの異なる選択に整合性を持たせる。
論文 参考訳(メタデータ) (2021-04-30T21:32:40Z) - Optical Flow Estimation from a Single Motion-blurred Image [66.2061278123057]
画像内の動きのぼかしは、基本的なコンピュータビジョンの問題に実用的な関心を持つ可能性があります。
本研究では,単一動画像からの光流れをエンドツーエンドで推定する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-03-04T12:45:18Z) - Weakly supervised cross-domain alignment with optimal transport [102.8572398001639]
画像オブジェクトとテキストシーケンス間のクロスドメインアライメントは多くの視覚言語タスクの鍵となる。
本稿では,画像とテキスト間の微粒な意味的類似点の同定と最適化のための新しいアプローチについて検討する。
論文 参考訳(メタデータ) (2020-08-14T22:48:36Z) - Domain Adaptation for Image Dehazing [72.15994735131835]
既存のほとんどの方法は、合成ヘイズ画像のデハージングモデルを訓練するが、ドメインシフトによる実際のヘイズ画像の一般化は困難である。
画像変換モジュールと2つの画像デハージングモジュールからなるドメイン適応パラダイムを提案する。
実世界の合成画像と実世界の画像の両方で実験結果から,我々のモデルは最先端の脱ハージングアルゴリズムに対して好適に機能することが示された。
論文 参考訳(メタデータ) (2020-05-10T13:54:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。