論文の概要: Depth-Aware Image and Video Orientation Estimation
- arxiv url: http://arxiv.org/abs/2604.13995v1
- Date: Wed, 15 Apr 2026 15:38:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.614235
- Title: Depth-Aware Image and Video Orientation Estimation
- Title(参考訳): 奥行き認識画像と映像配向推定
- Authors: Muhammad Z. Alam, Larry Stetsiuk, M. Umair Mukati, Zeeshan Kaleem,
- Abstract要約: 本稿では,自然画像の深度分布を利用した画像・映像方向推定手法を提案する。
提案手法は、画像の異なる四分体間の深さ分布に基づいて方向を推定する。
仮想現実(VR)、拡張現実(AR)、自律ナビゲーション、インタラクティブな監視システムなどのアプリケーションに適している。
- 参考スコア(独自算出の注目度): 0.09999629695552194
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: This paper introduces a novel approach for image and video orientation estimation by leveraging depth distribution in natural images. The proposed method estimates the orientation based on the depth distribution across different quadrants of the image, providing a robust framework for orientation estimation suited for applications such as virtual reality (VR), augmented reality (AR), autonomous navigation, and interactive surveillance systems. To further enhance fine-scale perceptual alignment, we incorporate depth gradient consistency (DGC) and horizontal symmetry analysis (HSA), enabling precise orientation correction. This hybrid strategy effectively exploits depth cues to support spatial coherence and perceptual stability in immersive visual content. Qualitative and quantitative evaluations demonstrate the robustness and accuracy of the proposed approach, outperforming existing techniques across diverse scenarios.
- Abstract(参考訳): 本稿では,自然画像の深度分布を利用した画像・映像方向推定手法を提案する。
提案手法は,VR,拡張現実(AR),自律ナビゲーション,対話型監視システムなどのアプリケーションに適した配向推定のための堅牢なフレームワークを提供する。
より微細な知覚アライメントを強化するため,深度勾配一貫性 (DGC) と水平対称性解析 (HSA) を統合し,正確な配向補正を可能にする。
このハイブリッド戦略は、没入型視覚コンテンツにおける空間的コヒーレンスと知覚的安定性を支援するために、奥行きの手がかりを効果的に活用する。
定性的かつ定量的な評価は、提案手法の堅牢性と正確性を示し、様々なシナリオにおいて既存の技術よりも優れている。
関連論文リスト
- Loc$^2$: Interpretable Cross-View Localization via Depth-Lifted Local Feature Matching [80.57282092735991]
本稿では,高精度かつ解釈可能なクロスビューローカライズ手法を提案する。
地上画像の3自由度(DoF)のポーズを、その局所的な特徴と基準空中画像とをマッチングすることによって推定する。
実験では、クロスエリアテストや未知の向きといった挑戦的なシナリオにおいて、最先端の精度を示す。
論文 参考訳(メタデータ) (2025-09-11T18:52:16Z) - Dense-depth map guided deep Lidar-Visual Odometry with Sparse Point Clouds and Images [4.320220844287486]
オドメトリは、自律システムにとって、自己ローカライゼーションとナビゲーションにとって重要なタスクである。
我々は,LiDARの点雲と画像を統合し,正確なポーズ推定を行う新しいLiDAR-Visual odometryフレームワークを提案する。
提案手法は,最先端のビジュアルおよびLiDARオドメトリー法と比較して,類似あるいは優れた精度とロバスト性を実現する。
論文 参考訳(メタデータ) (2025-07-21T10:58:10Z) - Boosting Omnidirectional Stereo Matching with a Pre-trained Depth Foundation Model [70.67610495024459]
カメラベースの設定は、立体深度推定を用いて高解像度の高解像度深度マップを生成することで、コスト効率のよい選択肢を提供する。
既存の全方位ステレオマッチング手法は、様々な環境において限られた深度精度しか達成できない。
DFI-OmniStereoは, 大規模事前学習基礎モデルを用いて, 相対的な単眼深度推定を行う新しい全方位ステレオマッチング法である。
論文 参考訳(メタデータ) (2025-03-30T16:24:22Z) - Keypoint-based Stereophotoclinometry for Characterizing and Navigating
Small Bodies: A Factor Graph Approach [15.863759076104104]
本稿では,ステレオフォトクリノメトリの技法をキーポイント・ベース・ストラクチャ・トゥ・モーションシステムに組み込むことを提案する。
提案された枠組みは、小惑星4ベスタのコーネリアクレーターの実際の画像に基づいて検証されている。
論文 参考訳(メタデータ) (2023-12-11T22:23:43Z) - MV-ROPE: Multi-view Constraints for Robust Category-level Object Pose and Size Estimation [23.615122326731115]
本稿では,RGBビデオストリームを利用した新しいソリューションを提案する。
本フレームワークは,スケール対応単分子高密度SLAMソリューション,軽量オブジェクトポーズ予測器,オブジェクトレベルのポーズグラフの3つのモジュールから構成される。
提案手法は,高精細度情報を用いた公開データセットを用いた場合,最先端のRGB-D手法に匹敵する性能を示す。
論文 参考訳(メタデータ) (2023-08-17T08:29:54Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - Robust Consistent Video Depth Estimation [65.53308117778361]
本稿では,単眼映像からカメラのカメラポーズと密集した深度マップを推定するアルゴリズムを提案する。
本手法は,(1)低周波大規模アライメントのためのフレキシブルな変形-スプラインと(2)細部奥行き詳細の高周波アライメントのための幾何認識深度フィルタリングとを組み合わせた手法である。
従来の手法とは対照的に, カメラのポーズを入力として必要とせず, かなりの音量, 揺動, 動きのぼやき, 転がりシャッター変形を含む携帯のハンドヘルドキャプチャに頑健な再構成を実現する。
論文 参考訳(メタデータ) (2020-12-10T18:59:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。