論文の概要: StereoGenBench: A Synthetic Multi-Camera Benchmark for Stereo Generation under Controlled Baseline Regimes
- arxiv url: http://arxiv.org/abs/2605.23237v1
- Date: Fri, 22 May 2026 05:10:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.205179
- Title: StereoGenBench: A Synthetic Multi-Camera Benchmark for Stereo Generation under Controlled Baseline Regimes
- Title(参考訳): StereoGenBench: ベースラインレジーム制御によるステレオ生成のための合成マルチカメラベンチマーク
- Authors: Yangzhi Cui, Feng Qiao, Nathan Jacobs,
- Abstract要約: StereoGenBenchはステレオ生成評価のためのベンチマークである。
各シーンは堅い6カメラ横配列で描画される。
ビューはRGB、メートル法深度、内在性、ペア毎のベースライン、フレーム毎のポーズでリリースされる。
- 参考スコア(独自算出の注目度): 14.691582964882565
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stereo image and video generation, stereo geometry estimation, and condition-controlled view synthesis require paired data in which the variables that determine binocular geometry -- camera baseline, intrinsics, scene depth, and camera motion -- are known and controllable. Existing stereo resources provide subsets of these variables, but resources commonly used for stereo generation evaluation do not, to our knowledge, provide scene-paired, calibrated multi-baseline right-view ground truth with jointly recorded intrinsics, dense metric depth, and per-frame poses in a single controlled source. We introduce StereoGenBench, a synthetic Unreal Engine benchmark designed to make baseline-regime sensitivity and target-camera consistency measurable under matched scene content. Each scene is rendered with a rigid six-camera lateral array, yielding up to 15 calibrated view pairs; adjacent baselines are sampled from inter-pupillary to wide-baseline regimes; focal length is sampled independently; and every view is released with RGB, metric depth, intrinsics, per-pair baselines, and per-frame poses. The splits include two evaluation families for narrow and wide baseline regimes and a train-only family for broader all-pairs coverage. We release the dataset, evaluation code, reference results, Croissant metadata, and generation code/configuration for extension with compatible assets. The dataset is available at https://huggingface.co/datasets/stereo-dataset/stereo-dataset
- Abstract(参考訳): ステレオ画像とビデオ生成、ステレオ幾何推定、条件制御されたビュー合成は、双眼鏡幾何学を決定する変数(カメラベースライン、内在性、シーン深さ、カメラモーション)が知られ制御可能なペアデータを必要とする。
既存のステレオ・リソースはこれらの変数のサブセットを提供するが、ステレオ・ジェネレーション・アセスメントによく使われるリソースは、我々の知る限り、シーン・ペア化・校正されたマルチベースライン・右ビュー・グラウンド・真理を、連立記録された内在性、密度メートル法深さ、フレーム毎のポーズを単一の制御されたソースで提供するものではない。
我々は,ベースラインレジリエンスとターゲットカメラの一貫性を一致したシーンコンテンツで測定できるように設計された,合成Unreal EngineベンチマークであるStereoGenBenchを紹介する。
各シーンは硬い6カメラ横方向アレーでレンダリングされ、最大15のキャリブレーションされたビューペア、隣接するベースラインはピピラリー間からワイドベースラインレジームからサンプリングされ、焦点距離は独立してサンプリングされ、各ビューはRGB、メートル法深度、内在性、ペアあたりベースライン、フレーム毎のポーズで解放される。
この分割には、狭く広いベースライン体制のための2つの評価家族と、より広いオールペア範囲のための列車のみの家族が含まれる。
データセット、評価コード、参照結果、Croissantメタデータ、互換性のあるアセットの拡張のための生成コード/設定をリリースします。
データセットはhttps://huggingface.co/datasets/stereo-dataset/stereo-datasetで利用可能である。
関連論文リスト
- H-OmniStereo: Zero-Shot Omnidirectional Stereo Matching with Heading-Aligned Normal Priors [39.6437115448559]
H-OmniStereoはゼロショット全方位ステレオマッチングフレームワークである。
我々は280万以上のトップボトム等方形ステレオペアからなる高品質な合成データセットを構築した。
提案手法はドメイン外データセットの既存手法よりも精度が高い。
論文 参考訳(メタデータ) (2026-05-14T15:30:22Z) - Stereo World Model: Camera-Guided Stereo Video Generation [52.3922115596956]
本稿では、ステレオビデオ生成のための外観と両眼形状を共同で学習するカメラコンディショニングステレオワールドモデルであるStereoWorldを紹介する。
単分子RGBやRGBDのアプローチとは異なり、StereoWorldはRGBモードでのみ動作する。
論文 参考訳(メタデータ) (2026-03-18T05:42:22Z) - StereoWorld: Geometry-Aware Monocular-to-Stereo Video Generation [108.97993219426509]
StereoWorldは、高忠実なモノクル・ツー・ステレオビデオ生成のためのエンドツーエンドフレームワークである。
我々のフレームワークは、幾何学的に認識された正規化で生成を明示的に監視しながら、単眼ビデオ入力のモデルを規定する。
大規模なトレーニングと評価を可能にするため,高精細度ステレオビデオデータセットをキュレートする。
論文 参考訳(メタデータ) (2025-12-10T06:50:16Z) - StereoCarla: A High-Fidelity Driving Dataset for Generalizable Stereo [50.25671551131985]
ステレオマッチングは、自律走行とロボット工学の深度認識を可能にする上で重要な役割を担っている。
我々は、自律運転シナリオ用に設計された高忠実な合成ステレオデータセットであるStereoCarlaを提示する。
論文 参考訳(メタデータ) (2025-09-16T05:14:45Z) - Stereo Anything: Unifying Zero-shot Stereo Matching with Large-Scale Mixed Data [77.27700893908012]
ステレオマッチングは3次元視覚の基盤として機能し、深度回復のためのステレオ画像対間の画素ワイド対応を確立することを目的としている。
現在のモデルは、目に見えないドメインにデプロイすると、しばしば深刻なパフォーマンス劣化を示す。
データ中心のフレームワークであるStereoAnythingを導入し、既存のステレオモデルのゼロショット一般化能力を大幅に強化する。
論文 参考訳(メタデータ) (2024-11-21T11:59:04Z) - Match Stereo Videos via Bidirectional Alignment [15.876953256378224]
最近の学習に基づく手法は、独立ステレオペアのパフォーマンスの最適化に重点を置いており、ビデオの時間的矛盾につながる。
本稿では,新しいビデオ処理フレームワークBiDAStereoとプラグイン安定化ネットワークBiDAStabilizerを紹介する。
本稿では,自然景観に着目したリアルな合成データセットとベンチマークと,様々な都市景観のステレオカメラが捉えた実世界のデータセットを定性評価として提示する。
論文 参考訳(メタデータ) (2024-09-30T13:37:29Z) - Multi-View Photometric Stereo: A Robust Solution and Benchmark Dataset
for Spatially Varying Isotropic Materials [65.95928593628128]
多視点光度ステレオ技術を用いて3次元形状と空間的に異なる反射率の両方をキャプチャする手法を提案する。
我々のアルゴリズムは、遠近点光源と遠近点光源に適している。
論文 参考訳(メタデータ) (2020-01-18T12:26:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。