Fugu-MT 論文翻訳(概要): TSAR-MVS: Textureless-aware Segmentation and Correlative Refinement Guided Multi-View Stereo

論文の概要: TSAR-MVS: Textureless-aware Segmentation and Correlative Refinement Guided Multi-View Stereo

arxiv url: http://arxiv.org/abs/2308.09990v3
Date: Sun, 18 Aug 2024 08:06:43 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-21 04:26:45.166841
Title: TSAR-MVS: Textureless-aware Segmentation and Correlative Refinement Guided Multi-View Stereo
Title（参考訳）: TSAR-MVS: テクスチャレス認識セグメンテーションと相関リファインメントガイドによるマルチビューステレオ
Authors: Zhenlong Yuan, Jiakai Cao, Zhaoqi Wang, Zhaoxin Li,
Abstract要約: テクスチャレス・アンド・コリレーティブ・リファインメント・ガイド付きマルチビューステレオ (TSAR-MVS) 法を提案する。フィルター,精細化,セグメンテーションによる3次元再構成におけるテクスチャレス領域による課題を効果的に解決する。 ETH3D, Tanks & Temples および Strecha データセットの実験により,提案手法の優れた性能と強みが示された。
参考スコア（独自算出の注目度）: 3.6728185343140685
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The reconstruction of textureless areas has long been a challenging problem in MVS due to lack of reliable pixel correspondences between images. In this paper, we propose the Textureless-aware Segmentation And Correlative Refinement guided Multi-View Stereo (TSAR-MVS), a novel method that effectively tackles challenges posed by textureless areas in 3D reconstruction through filtering, refinement and segmentation. First, we implement the joint hypothesis filtering, a technique that merges a confidence estimator with a disparity discontinuity detector to eliminate incorrect depth estimations. Second, to spread the pixels with confident depth, we introduce an iterative correlation refinement strategy that leverages RANSAC to generate 3D planes based on superpixels, succeeded by a weighted median filter for broadening the influence of accurately determined pixels. Finally, we present a textureless-aware segmentation method that leverages edge detection and line detection for accurately identify large textureless regions for further depth completion. Experiments on ETH3D, Tanks & Temples and Strecha datasets demonstrate the superior performance and strong generalization capability of our proposed method.
Abstract（参考訳）: テクスチャレス領域の再構成は、画像間の信頼性の高い画素対応が欠如しているため、MVSでは長年、難しい問題であった。本稿では, テクスチャレス領域による3次元再構成の課題を, フィルタリング, 精細化, セグメンテーションにより効果的に解決する, マルチビューステレオ(TSAR-MVS)を提案する。まず,不均一不連続検出器と信頼度推定器を融合させて不正確な深度推定を除去する手法であるジョイント仮説フィルタリングを実装した。第2に、自信を持って画素を拡大するために、RANSACを利用してスーパーピクセルをベースとした3次元平面を生成する反復的相関補正戦略を導入し、重み付き中央フィルタにより、正確に決定された画素の影響を拡大する。最後に,エッジ検出と線検出を利用したテクスチャレス認識セグメンテーション手法を提案する。 ETH3D, Tanks & Temples および Strecha データセットの実験により,提案手法の優れた性能と強力な一般化能力が示された。

関連論文リスト

Mode-GS: Monocular Depth Guided Anchored 3D Gaussian Splatting for Robust Ground-View Scene Rendering [47.879695094904015]
そこで本研究では,地上ロボット軌道データセットのための新しいビューレンダリングアルゴリズムであるMode-GSを提案する。提案手法は,既存の3次元ガウススプラッティングアルゴリズムの限界を克服する目的で,アンカー付きガウススプラッターを用いている。提案手法は,PSNR,SSIM,LPIPSの計測値に基づいて,自由軌道パターンを持つ地上環境におけるレンダリング性能を向上する。
論文参考訳（メタデータ） (2024-10-06T23:01:57Z)
GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文参考訳（メタデータ） (2024-05-17T07:31:20Z)
Depth-aware Volume Attention for Texture-less Stereo Matching [67.46404479356896]
実用的な屋外シナリオにおけるテクスチャ劣化に対処する軽量なボリューム改善手法を提案する。画像テクスチャの相対的階層を抽出し,地中深度マップによって教師される深度体積を導入する。局所的な微細構造と文脈は、体積凝集時のあいまいさと冗長性を緩和するために強調される。
論文参考訳（メタデータ） (2024-02-14T04:07:44Z)
SD-MVS: Segmentation-Driven Deformation Multi-View Stereo with Spherical Refinement and EM optimization [6.886220026399106]
テクスチャレス領域の3次元再構成における課題を解決するために,多視点ステレオ (SD-MVS) を導入する。私たちは、シーン内のセグメンテーションインスタンスを区別するためにSAM(Segment Anything Model)を採用した最初の人です。球面座標と正規点の勾配勾配と深度の画素方向探索間隔を組み合わせた独自の精細化戦略を提案する。
論文参考訳（メタデータ） (2024-01-12T05:25:57Z)
Rethinking Disparity: A Depth Range Free Multi-View Stereo Based on Disparity [17.98608948955211]
既存の学習ベースのマルチビューステレオ(MVS)手法は、3Dコストボリュームを構築するために深さ範囲に依存している。本稿では,DipMVSと呼ばれるエピポーラ分散フロー(E-flow)に基づく分散型MVS法を提案する。本研究では、DipMVSは深さ範囲に敏感ではなく、GPUメモリを低くすることで最先端の結果が得られることを示す。
論文参考訳（メタデータ） (2022-11-30T11:05:02Z)
High-fidelity 3D GAN Inversion by Pseudo-multi-view Optimization [51.878078860524795]
フォトリアリスティック・ノベルビューを合成可能な高忠実度3次元生成対向ネットワーク(GAN)インバージョン・フレームワークを提案する。提案手法は,1枚の画像から高忠実度3Dレンダリングを可能にし,AI生成3Dコンテンツの様々な応用に期待できる。
論文参考訳（メタデータ） (2022-11-28T18:59:52Z)
On Robust Cross-View Consistency in Self-Supervised Monocular Depth Estimation [56.97699793236174]
本論文では,2種類の堅牢なクロスビュー整合性について検討する。深度特徴空間と3次元ボクセル空間の時間的コヒーレンスを自己教師付き単眼深度推定に利用した。いくつかのアウトドアベンチマークの実験結果から,本手法は最先端技術より優れていることが示された。
論文参考訳（メタデータ） (2022-09-19T03:46:13Z)
PatchMVSNet: Patch-wise Unsupervised Multi-View Stereo for Weakly-Textured Surface Reconstruction [2.9896482273918434]
本稿では,多視点画像の制約を活かしたロバストな損失関数を提案し,あいまいさを緩和する。我々の戦略は任意の深さ推定フレームワークで実装することができ、任意の大規模MVSデータセットでトレーニングすることができる。提案手法は,DTU,タンク・アンド・テンプル,ETH3Dなどの一般的なベンチマーク上での最先端手法の性能に達する。
論文参考訳（メタデータ） (2022-03-04T07:05:23Z)
IB-MVS: An Iterative Algorithm for Deep Multi-View Stereo based on Binary Decisions [0.0]
本稿では,マルチビューステレオのための新しいディープラーニング手法を提案する。提案手法は,各画素における実現可能な深度値の連続空間を2値決定方式でトラバースすることにより,高分解能かつ高精度な深度マップを反復的に推定する。提案手法をDTU, タンク, テンプル上の最先端のマルチビューステレオ手法と, 挑戦的なETH3Dベンチマークと比較し, 競争力のある結果を示した。
論文参考訳（メタデータ） (2021-11-29T10:04:24Z)
Shape Prior Non-Uniform Sampling Guided Real-time Stereo 3D Object Detection [59.765645791588454]
最近導入されたRTS3Dは、深度監督のないオブジェクトの中間表現のための効率的な4次元特徴整合埋め込み空間を構築している。本研究では, 内部領域で高密度サンプリングを行い, 内部領域でスパースサンプリングを行う非一様サンプリング方式を提案する。提案手法は,ネットワークパラメータをほとんど含まないAP3dに対して2.57%の改善を実現している。
論文参考訳（メタデータ） (2021-06-18T09:14:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。