論文の概要: Monocular Depth Perception Enhancement Based on Joint Shading/Contrast Model and Motion Parallax (JSM)
- arxiv url: http://arxiv.org/abs/2605.17252v1
- Date: Sun, 17 May 2026 04:19:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.809657
- Title: Monocular Depth Perception Enhancement Based on Joint Shading/Contrast Model and Motion Parallax (JSM)
- Title(参考訳): ジョイントシェーディング/コントラストモデルとモーションパララックス(JSM)に基づく単眼深度知覚強調
- Authors: Seungchul Ryu, Hyunjin Yoo, Tara Akhavan,
- Abstract要約: 提案フレームワークは,従来の2次元表示装置の奥行き認識を向上するだけでなく,3次元表示装置にも適用可能である。
質的評価,アブレーション研究,主観的ユーザ評価は,提案フレームワークの利点と実践性を示した。
- 参考スコア(独自算出の注目度): 0.4588028371034407
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stereoscopic 3D displays adopt a binocular depth cue to provide depth perception. However, users should be equipped with expensive special devices to appreciate depth perception based on the binocular depth cues. Also, visual fatigue induced by the stereoscopic display is still a challenging open problem. In order to overcome this limitation, this paper proposes a novel framework, JSM, to enhance monocular depth perception, significantly improving both depth volume perception and depth range perception. The proposed framework can not only provide an enhanced depth perception on any conventional 2D display devices, but also it can be applicable to the 3D display devices since it is complementary to binocular depth cues. The qualitative evaluation, ablation study, and subjective user evaluation proved the advantages and practicability of the proposed framework.
- Abstract(参考訳): 立体3Dディスプレイは、深度知覚を提供するために両眼深度キューを採用している。
しかし、ユーザーは両眼深度に基づく深度知覚を享受するために高価な特殊装置を装備すべきである。
また、立体ディスプレイによって引き起こされる視覚疲労は、依然として困難なオープン問題である。
この制限を克服するため,本研究では,単眼深度知覚を向上し,深度量知覚と深度範囲知覚の両方を大幅に改善する新しいフレームワークであるJSMを提案する。
提案フレームワークは,従来の2次元表示装置の奥行き認識を向上するだけでなく,両眼深度キューと相補的な3次元表示装置にも適用可能である。
質的評価,アブレーション研究,主観的ユーザ評価は,提案手法の利点と実践性を示した。
関連論文リスト
- 3D Visual Illusion Depth Estimation [27.04093343308513]
本研究は, 単眼・両眼深度推定を含む3次元視覚錯覚によって, マシン・ヴィジュアライゼーション・システムが真面目に騙されていることを示す。
視覚言語モデルから共通感覚を用いて両眼の視差と単眼の視深度を適応的に融合する3次元視覚錯視深度推定フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-19T12:51:03Z) - Revisiting Monocular 3D Object Detection with Depth Thickness Field [44.4805861813093]
モノクロ3次元物体検出のためのシーン・ツー・インスタンス深度適応ネットワークであるMonoDTFを提案する。
このフレームワークは主にSDR(Scene-Level Depth Retargeting)モジュールとISR(Instance-Level Spatial Refinement)モジュールで構成される。
後者は、インスタンスの誘導によりボクセル空間を洗練し、深さ厚さ場の3Dインスタンス認識能力を向上する。
論文 参考訳(メタデータ) (2024-12-26T10:51:50Z) - GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z) - EA-LSS: Edge-aware Lift-splat-shot Framework for 3D BEV Object Detection [9.289537252177048]
本稿では,3次元物体検出のための新しいエッジ対応Lift-splat-shot (EA-LSS) フレームワークを提案する。
我々のEA-LSSフレームワークは、任意のLSSベースの3Dオブジェクト検出モデルと互換性がある。
論文 参考訳(メタデータ) (2023-03-31T08:56:29Z) - Depth Estimation Matters Most: Improving Per-Object Depth Estimation for
Monocular 3D Detection and Tracking [47.59619420444781]
検出・追跡を含む単眼的3D知覚へのアプローチは、LiDARベースの手法と比較して性能が劣ることが多い。
本稿では,オブジェクト(トラックレット)の複数のフレームに異なる表現(RGBと擬似LiDAR)と時間情報を組み合わせた多層融合手法を提案する。
論文 参考訳(メタデータ) (2022-06-08T03:37:59Z) - D3VO: Deep Depth, Deep Pose and Deep Uncertainty for Monocular Visual
Odometry [57.5549733585324]
D3VOは、深度、ポーズ、不確実性推定という3つのレベルでディープネットワークを利用する、単眼の視覚計測のための新しいフレームワークである。
まず,ステレオビデオを用いた自己監督型単眼深度推定ネットワークを提案する。
入力画像上の画素の光度不確かさをモデル化し、深度推定精度を向上させる。
論文 参考訳(メタデータ) (2020-03-02T17:47:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。