論文の概要: Generalization of pixel-wise phase estimation by CNN and improvement of
phase-unwrapping by MRF optimization for one-shot 3D scan
- arxiv url: http://arxiv.org/abs/2309.14824v1
- Date: Tue, 26 Sep 2023 10:45:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 14:02:51.446559
- Title: Generalization of pixel-wise phase estimation by CNN and improvement of
phase-unwrapping by MRF optimization for one-shot 3D scan
- Title(参考訳): ワンショット3DスキャンにおけるCNNによる画素単位位相推定の一般化とMRF最適化による位相アンラッピングの改善
- Authors: Hiroto Harada, Michihiro Mikamo, Ryo Furukawa, Ryushuke Sagawa,
Hiroshi Kawasaki
- Abstract要約: シングルパターンプロジェクション(ワンショット3Dスキャン)を用いたアクティブステレオ技術は、産業や医療目的などから広く注目を集めている。
ワンショット3Dスキャンの深刻な欠点はスパース再構成である。
パターンが正規かつ周期的であれば,任意のタイプの静的パターンに適用可能なワンショットスキャンのための画素ワイズ手法を提案する。
- 参考スコア(独自算出の注目度): 0.621405559652172
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active stereo technique using single pattern projection, a.k.a. one-shot 3D
scan, have drawn a wide attention from industry, medical purposes, etc. One
severe drawback of one-shot 3D scan is sparse reconstruction. In addition,
since spatial pattern becomes complicated for the purpose of efficient
embedding, it is easily affected by noise, which results in unstable decoding.
To solve the problems, we propose a pixel-wise interpolation technique for
one-shot scan, which is applicable to any types of static pattern if the
pattern is regular and periodic. This is achieved by U-net which is pre-trained
by CG with efficient data augmentation algorithm. In the paper, to further
overcome the decoding instability, we propose a robust correspondence finding
algorithm based on Markov random field (MRF) optimization. We also propose a
shape refinement algorithm based on b-spline and Gaussian kernel interpolation
using explicitly detected laser curves. Experiments are conducted to show the
effectiveness of the proposed method using real data with strong noises and
textures.
- Abstract(参考訳): シングルパターンプロジェクション(ワンショット3Dスキャン)を用いたアクティブステレオ技術は、産業や医療目的などから広く注目を集めている。
ワンショット3Dスキャンの深刻な欠点はスパース再構成である。
また,効率のよい埋込みのために空間パターンが複雑になるため,ノイズの影響が容易となり,不安定な復号化が図られる。
そこで本研究では,このパターンが正規かつ周期的であれば,任意の静的パターンに適用可能な,ワンショットスキャンのための画素ワイズ補間手法を提案する。
これは、効率的なデータ拡張アルゴリズムでCGによって事前訓練されたU-netによって実現される。
本稿では,デコード不安定性をさらに克服するために,マルコフ確率場(MRF)最適化に基づくロバスト対応探索アルゴリズムを提案する。
また,b-spline と Gaussian のカーネル補間を明示的に検出したレーザ曲線を用いた形状改善アルゴリズムを提案する。
音やテクスチャの強い実データを用いて,提案手法の有効性を示す実験を行った。
関連論文リスト
- 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - R$^2$-Gaussian: Rectifying Radiative Gaussian Splatting for Tomographic Reconstruction [53.19869886963333]
3次元ガウススプラッティング(3DGS)は画像のレンダリングと表面再構成において有望な結果を示した。
本稿では,Sparse-viewトモグラフィ再構成のための3DGSベースのフレームワークであるR2$-Gaussianを紹介する。
論文 参考訳(メタデータ) (2024-05-31T08:39:02Z) - Linear Anchored Gaussian Mixture Model for Location and Width Computations of Objects in Thick Line Shape [1.7205106391379021]
3次元画像グレーレベル表現は、統計分布の有限混合モデルであると考えられている。
入力データとして元の画像を用いた期待最大化アルゴリズム(Algo1)を用いてモデルパラメータを推定する。
修正EMアルゴリズム(Algo2)について詳述する。
論文 参考訳(メタデータ) (2024-04-03T20:05:00Z) - GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。
提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z) - HiFA: High-fidelity Text-to-3D Generation with Advanced Diffusion
Guidance [19.252300247300145]
本研究は,高品質なテキスト・ツー・3D生成を実現するための全体的サンプリングと平滑化手法を提案する。
テキスト・画像拡散モデルの潜時空間と画像空間における復調スコアを計算する。
単一段最適化において高品質なレンダリングを生成するため,我々はNeRF線に沿ったz座標の分散の正則化を提案する。
論文 参考訳(メタデータ) (2023-05-30T05:56:58Z) - Poisson-Gaussian Holographic Phase Retrieval with Score-based Image
Prior [19.231581775644617]
本稿では,スコア関数を先行生成関数とする高速化されたWirtinger Flow (AWF) を用いた新しいアルゴリズム"AWFS"を提案する。
PRの対数様関数の勾配を計算し、リプシッツ定数を決定する。
本稿では,提案アルゴリズムの臨界点収束保証を確立する理論的解析を行う。
論文 参考訳(メタデータ) (2023-05-12T18:08:47Z) - $PC^2$: Projection-Conditioned Point Cloud Diffusion for Single-Image 3D
Reconstruction [97.06927852165464]
単一のRGB画像から物体の3次元形状を再構築することは、コンピュータビジョンにおける長年の課題である。
条件付き偏光拡散プロセスによりスパース点雲を生成する単一像3次元再構成法を提案する。
論文 参考訳(メタデータ) (2023-02-21T13:37:07Z) - Curvature regularization for Non-line-of-sight Imaging from
Under-sampled Data [5.591221518341613]
非視線イメージング(NLOS)は、視線で測定されたデータから3次元の隠れたシーンを再構築することを目的としている。
曲率正規化に基づく新しいNLOS再構成モデルを提案する。
提案したアルゴリズムを,合成データセットと実データセットの両方で評価する。
論文 参考訳(メタデータ) (2023-01-01T14:10:43Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Human Body Model Fitting by Learned Gradient Descent [48.79414884222403]
画像に3次元の人体形状を適合させる新しいアルゴリズムを提案する。
このアルゴリズムは高速(約120ms収束)で、データセットに頑健であり、公開評価データセットの最先端結果が得られることを示す。
論文 参考訳(メタデータ) (2020-08-19T14:26:47Z) - Real-time Dense Reconstruction of Tissue Surface from Stereo Optical
Video [10.181846237133167]
立体光学ビデオから組織表面の高密度3次元モデル(3次元)をリアルタイムに再構成する手法を提案する。
まずステレオマッチングを用いてビデオフレームから3D情報を抽出し,再構成した3Dモデルをモザイクする。
2mm未満の精度で高分解能テクスチャを有する復元3Dモデルについて, 生体内および生体内データによる実験結果を得た。
論文 参考訳(メタデータ) (2020-07-16T19:14:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。