論文の概要: GenStereo: Towards Open-World Generation of Stereo Images and Unsupervised Matching
- arxiv url: http://arxiv.org/abs/2503.12720v1
- Date: Mon, 17 Mar 2025 01:19:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:30:48.744075
- Title: GenStereo: Towards Open-World Generation of Stereo Images and Unsupervised Matching
- Title(参考訳): GenStereo: ステレオ画像のオープンワールド生成と教師なしマッチングを目指して
- Authors: Feng Qiao, Zhexiao Xiong, Eric Xing, Nathan Jacobs,
- Abstract要約: GenStereoは、ステレオ画像生成への拡散ベースのアプローチである。
視認の視覚的品質と整合の幾何学的精度を両立させる。
当社のフレームワークは,高品質なステレオ画像生成を実現しつつ,複雑なハードウェアセットアップの必要性を排除している。
- 参考スコア(独自算出の注目度): 9.322869042942504
- License:
- Abstract: Stereo images are fundamental to numerous applications, including extended reality (XR) devices, autonomous driving, and robotics. Unfortunately, acquiring high-quality stereo images remains challenging due to the precise calibration requirements of dual-camera setups and the complexity of obtaining accurate, dense disparity maps. Existing stereo image generation methods typically focus on either visual quality for viewing or geometric accuracy for matching, but not both. We introduce GenStereo, a diffusion-based approach, to bridge this gap. The method includes two primary innovations (1) conditioning the diffusion process on a disparity-aware coordinate embedding and a warped input image, allowing for more precise stereo alignment than previous methods, and (2) an adaptive fusion mechanism that intelligently combines the diffusion-generated image with a warped image, improving both realism and disparity consistency. Through extensive training on 11 diverse stereo datasets, GenStereo demonstrates strong generalization ability. GenStereo achieves state-of-the-art performance in both stereo image generation and unsupervised stereo matching tasks. Our framework eliminates the need for complex hardware setups while enabling high-quality stereo image generation, making it valuable for both real-world applications and unsupervised learning scenarios. Project page is available at https://qjizhi.github.io/genstereo
- Abstract(参考訳): ステレオ画像は、拡張現実(XR)デバイス、自律運転、ロボット工学など、多くのアプリケーションに基礎を置いている。
残念なことに、デュアルカメラの正確なキャリブレーション要件と、高精度で密度の低い地図を得る複雑さのため、高品質なステレオ画像の取得は依然として困難である。
既存のステレオ画像生成法は通常、視認の視覚的品質と整合の幾何学的精度に重点を置いているが、両方ではない。
我々は、このギャップを埋めるために拡散ベースのアプローチであるGenStereoを紹介します。
本発明の方法は、(1)拡散過程を不均一な座標埋め込みと歪んだ入力画像に条件付けし、従来の方法よりも正確なステレオアライメントを可能にし、(2)拡散生成画像と歪んだ画像とをインテリジェントに結合し、リアリズムと不均一性の両方を改善した適応融合機構を含む。
11の多様なステレオデータセットに関する広範なトレーニングを通じて、GenStereoは強力な一般化能力を示している。
GenStereoはステレオ画像生成と教師なしステレオマッチングタスクの両方で最先端のパフォーマンスを達成する。
本フレームワークは,高品質なステレオ画像生成を実現するとともに,複雑なハードウェアセットアップの必要性を排除し,実世界のアプリケーションと教師なし学習シナリオの両方に有用である。
プロジェクトページはhttps://qjizhi.github.io/genstereoで公開されている。
関連論文リスト
- ZeroStereo: Zero-shot Stereo Matching from Single Images [17.560148513475387]
ゼロショットステレオマッチングのための新しいステレオ画像生成パイプラインであるZeroStereoを提案する。
提案手法は, 単眼深度推定モデルにより生成された擬似格差を利用して, 高品質な右画像の合成を行う。
我々のパイプラインは、Scene Flowに匹敵するデータセットボリュームで複数のデータセットにまたがる最先端のゼロショット一般化を実現する。
論文 参考訳(メタデータ) (2025-01-15T08:43:48Z) - Single-View View Synthesis with Self-Rectified Pseudo-Stereo [49.946151180828465]
疑似ステレオ視点を生成する前に、信頼性と明示的なステレオを利用する。
本稿では,自己修正ステレオ合成法を提案する。
本手法は,最先端の単一ビュービュー合成法およびステレオ合成法より優れる。
論文 参考訳(メタデータ) (2023-04-19T09:36:13Z) - Stereo Image Rain Removal via Dual-View Mutual Attention [55.79448042969012]
本稿では,2つのビュー間の十分な相互作用により,新しいアンダーラインStereo underline Image underlineRain underlineRemoval法(StereoIRR)を提案する。
本稿では,StereoIRRが複数のデータセットにおいて,他のモノクラー・ステレオ画像雨除去法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-11-18T09:07:01Z) - Self-Supervised Intensity-Event Stereo Matching [24.851819610561517]
イベントカメラはバイオインスパイアされた新しい視覚センサーで、マイクロ秒の精度でピクセルレベルの強度変化を出力する。
イベントカメラは、高品質の強度とイベントを同時に得ることができないため、計算画像タスクに直接適用することはできない。
本稿では,スタンドアロンのイベントカメラと近代的な強度カメラを接続して,両センサを応用することを目的としている。
論文 参考訳(メタデータ) (2022-11-01T14:52:25Z) - Revisiting Domain Generalized Stereo Matching Networks from a Feature
Consistency Perspective [65.37571681370096]
両視点にまたがる単純な画素単位のコントラスト学習を提案する。
ドメイン間の立体的特徴一貫性をよりよく維持するために、立体選択的白化損失を導入する。
提案手法は,複数の最先端ネットワークよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-03-21T11:21:41Z) - Co-Teaching: An Ark to Unsupervised Stereo Matching [14.801038005597855]
CoT-Stereoは、新しい教師なしステレオマッチングアプローチである。
KITTI Stereoベンチマークの実験は、CoT-Stereoの優れた性能を示している。
論文 参考訳(メタデータ) (2021-07-17T05:33:39Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - Parallax Attention for Unsupervised Stereo Correspondence Learning [46.035892564279564]
ステレオ画像対は、3Dシーンキューを左画像と右画像のステレオ対応に符号化する。
近年のCNNベースの手法では,大域にわたるステレオ対応を捉えるために,コストボリューム技術が一般的である。
本稿では, 相違によらずステレオ対応を捉えるために, 汎用パララックスアテンション機構(PAM)を提案する。
論文 参考訳(メタデータ) (2020-09-16T01:30:13Z) - Reversing the cycle: self-supervised deep stereo through enhanced
monocular distillation [51.714092199995044]
多くの分野において、自己教師付き学習ソリューションは急速に進化し、教師付きアプローチでギャップを埋めている。
本稿では,両者の相互関係を逆転する自己教師型パラダイムを提案する。
深層ステレオネットワークを訓練するために,単分子完備ネットワークを通じて知識を抽出する。
論文 参考訳(メタデータ) (2020-08-17T07:40:22Z) - AdaStereo: A Simple and Efficient Approach for Adaptive Stereo Matching [50.06646151004375]
AdaStereoと呼ばれる新しいドメイン適応パイプラインは、ディープステレオマッチングネットワークにマルチレベル表現をアライメントすることを目的としている。
我々のAdaStereoモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のステレオベンチマークで最先端のクロスドメインパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-09T16:15:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。