論文の概要: Robust and Real-time Surface Normal Estimation from Stereo Disparities using Affine Transformations
- arxiv url: http://arxiv.org/abs/2504.15121v1
- Date: Mon, 21 Apr 2025 14:19:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-29 16:21:03.777591
- Title: Robust and Real-time Surface Normal Estimation from Stereo Disparities using Affine Transformations
- Title(参考訳): アフィン変換を用いたステレオ距離のロバストおよびリアルタイム表面正規化
- Authors: Csongor Csanad Kariko, Muhammad Rafi Faisal, Levente Hajder,
- Abstract要約: 本研究は,修正ステレオ画像対から表面正規分布推定を行う新しい手法を提案する。
我々は、分散データを効率的に処理するように設計された畳み込み操作にインスパイアされたカスタムアルゴリズムを開発する。
本手法は,ミドルベリーとシティスケープのデータセットから,シミュレーション環境と実世界のステレオ画像の両方を用いて検証した。
- 参考スコア(独自算出の注目度): 6.322193856514675
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work introduces a novel method for surface normal estimation from rectified stereo image pairs, leveraging affine transformations derived from disparity values to achieve fast and accurate results. We demonstrate how the rectification of stereo image pairs simplifies the process of surface normal estimation by reducing computational complexity. To address noise reduction, we develop a custom algorithm inspired by convolutional operations, tailored to process disparity data efficiently. We also introduce adaptive heuristic techniques for efficiently detecting connected surface components within the images, further improving the robustness of the method. By integrating these methods, we construct a surface normal estimator that is both fast and accurate, producing a dense, oriented point cloud as the final output. Our method is validated using both simulated environments and real-world stereo images from the Middlebury and Cityscapes datasets, demonstrating significant improvements in real-time performance and accuracy when implemented on a GPU. Upon acceptance, the shader source code will be made publicly available to facilitate further research and reproducibility.
- Abstract(参考訳): 本研究では,異なる値から導出されるアフィン変換を利用して,補正ステレオ画像対から表面正規化を行う新しい手法を提案する。
ステレオ画像ペアの補正は,計算複雑性を減らして表面正規化の過程を単純化する方法を実証する。
ノイズ低減に対処するため,差分データを効率的に処理するために,畳み込み操作にインスパイアされたカスタムアルゴリズムを開発した。
また,画像中の連結表面成分を効率的に検出する適応的ヒューリスティック手法を導入し,そのロバスト性を向上させる。
これらの手法を統合することにより、高速かつ高精度な表面正規分布推定器を構築し、最終的な出力として高密度で指向性のある点雲を生成する。
提案手法は,ミドルベリーとシティスケープのデータセットからのシミュレーション環境と実世界のステレオ画像の両方を用いて検証し,GPU上でのリアルタイム性能と精度の大幅な向上を実証した。
承認されると、シェーダーのソースコードが公開され、さらなる研究と再現性を促進する。
関連論文リスト
- Gaussian Primitives for Deformable Image Registration [9.184092856125067]
脳MRI、肺CT、心臓MRIのデータセットの実験結果から、GaussianDIRは既存のDIR法よりも精度と効率が優れていることが示されている。
トレーニングなしのアプローチとして、反復的手法は本質的に遅く、一般化不足の限界を超越しているというステレオタイプに挑戦する。
論文 参考訳(メタデータ) (2024-06-05T15:44:54Z) - IMU-Aided Event-based Stereo Visual Odometry [7.280676899773076]
我々は、精度と効率の点で、以前のダイレクトパイプラインの textitEvent ベースの Stereo Visual Odometry を改善しました。
マッピング操作を高速化するために,イベントの局所的ダイナミクスに応じたエッジピクセルサンプリングの効率的な戦略を提案する。
この分野での今後の研究のためのオープンソースソフトウェアとして、パイプラインをリリースします。
論文 参考訳(メタデータ) (2024-05-07T07:19:25Z) - Q-SLAM: Quadric Representations for Monocular SLAM [85.82697759049388]
四角形のレンズを通して体積表現を再現する。
我々は、RGB入力からノイズの深い深さ推定を正すために二次仮定を用いる。
本研究では,新たな二次分割変換器を導入し,二次情報を集約する。
論文 参考訳(メタデータ) (2024-03-12T23:27:30Z) - DNS SLAM: Dense Neural Semantic-Informed SLAM [92.39687553022605]
DNS SLAMは、ハイブリッド表現を備えた新しいRGB-DセマンティックSLAMアプローチである。
本手法は画像に基づく特徴抽出と多視点幾何制約を統合し,外観の細部を改良する。
実験により, 合成データと実世界のデータ追跡の両面において, 最先端の性能が得られた。
論文 参考訳(メタデータ) (2023-11-30T21:34:44Z) - GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。
提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - StereoVAE: A lightweight stereo matching system through embedded GPUs [13.338765413730743]
組込みGPUによるステレオマッチングのための軽量システムを提案する。
これにより、ステレオマッチングにおける精度と処理速度のトレードオフを解消し、組込みシステムはリアルタイム処理を確実にしながらマッチング精度をさらに向上させることができる。
論文 参考訳(メタデータ) (2023-05-19T10:08:39Z) - Curvature regularization for Non-line-of-sight Imaging from
Under-sampled Data [5.591221518341613]
非視線イメージング(NLOS)は、視線で測定されたデータから3次元の隠れたシーンを再構築することを目的としている。
曲率正規化に基づく新しいNLOS再構成モデルを提案する。
提案したアルゴリズムを,合成データセットと実データセットの両方で評価する。
論文 参考訳(メタデータ) (2023-01-01T14:10:43Z) - Leveraging Spatial and Photometric Context for Calibrated Non-Lambertian
Photometric Stereo [61.6260594326246]
空間と測光の両方を同時に活用できる効率的な完全畳み込みアーキテクチャを提案する。
分離可能な4D畳み込みと2D熱マップを使うことで、サイズが小さくなり、効率が向上する。
論文 参考訳(メタデータ) (2021-03-22T18:06:58Z) - Adaptive binarization based on fuzzy integrals [7.4836284046629995]
本論文は,ファジィ積分のための改良SATの効率的な設計により,ファジィ積分画像に基づく適応バイナライズ手法を提案する。
実験結果から,提案手法は従来のアルゴリズムやサリエンシニューラルネットワークよりも画像品質の閾値付けが優れていることがわかった。
論文 参考訳(メタデータ) (2020-03-04T18:30:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。