論文の概要: Extended monocular 3D imaging
- arxiv url: http://arxiv.org/abs/2502.07403v1
- Date: Tue, 11 Feb 2025 09:32:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-12 14:06:33.584060
- Title: Extended monocular 3D imaging
- Title(参考訳): 拡張単分子3次元イメージング
- Authors: Zicheng Shen, Feng Zhao, Yibo Ni, Yuanmu Yang,
- Abstract要約: 光のベクトル波特性を完全に活用する拡張単分子3次元イメージング(EM3D)フレームワークを提案する。
拡大シーンに対して,100万画素で正確な3Dポイントクラウドのスナップショット取得を実験的に実証した。
- 参考スコア(独自算出の注目度): 3.964710267993159
- License:
- Abstract: 3D vision is of paramount importance for numerous applications ranging from machine intelligence to precision metrology. Despite much recent progress, the majority of 3D imaging hardware remains bulky and complicated and provides much lower image resolution compared to their 2D counterparts. Moreover, there are many well-known scenarios that existing 3D imaging solutions frequently fail. Here, we introduce an extended monocular 3D imaging (EM3D) framework that fully exploits the vectorial wave nature of light. Via the multi-stage fusion of diffraction- and polarization-based depth cues, using a compact monocular camera equipped with a diffractive-refractive hybrid lens, we experimentally demonstrate the snapshot acquisition of a million-pixel and accurate 3D point cloud for extended scenes that are traditionally challenging, including those with low texture, being highly reflective, or nearly transparent, without a data prior. Furthermore, we discover that the combination of depth and polarization information can unlock unique new opportunities in material identification, which may further expand machine intelligence for applications like target recognition and face anti-spoofing. The straightforward yet powerful architecture thus opens up a new path for a higher-dimensional machine vision in a minimal form factor, facilitating the deployment of monocular cameras for applications in much more diverse scenarios.
- Abstract(参考訳): 3Dビジョンは、マシンインテリジェンスから精密気象学まで、数多くのアプリケーションにとって最重要課題である。
最近の進歩にもかかわらず、ほとんどの3D画像ハードウェアはばらばらで複雑であり、2D画像に比べて画像解像度がはるかに低い。
さらに、既存の3Dイメージングソリューションが頻繁に失敗する、よく知られたシナリオが数多く存在する。
本稿では,光のベクトル波特性を完全に活用する拡張単分子3次元イメージング(EM3D)フレームワークを提案する。
回折と偏光に基づく深度の多段融合を, 回折屈折型ハイブリッドレンズを備えた小型単眼カメラを用いて実施し, 従来は低テクスチャ, 反射率, ほぼ透明であった3D点雲のスナップショット取得を実験的に実証した。
さらに、深度情報と偏光情報を組み合わせることで、材料識別におけるユニークな新たな機会を解き放ち、ターゲット認識や顔の反偽造といった応用のためのマシンインテリジェンスをさらに拡大する可能性がある。
したがって、単純だが強力なアーキテクチャは、最小のフォームファクターで高次元のマシンビジョンのための新しいパスを開き、より多様なシナリオでアプリケーションにモノクロカメラを配置するのを容易にする。
関連論文リスト
- VFMM3D: Releasing the Potential of Image by Vision Foundation Model for Monocular 3D Object Detection [80.62052650370416]
モノクル3Dオブジェクト検出は、自律運転やロボティクスなど、さまざまなアプリケーションにおいて重要な役割を担っている。
本稿では,VFMM3Dを提案する。VFMM3Dは,ビジョンファウンデーションモデル(VFM)の機能を利用して,単一ビュー画像を正確にLiDARポイントクラウド表現に変換する,革新的なフレームワークである。
論文 参考訳(メタデータ) (2024-04-15T03:12:12Z) - Towards 3D Vision with Low-Cost Single-Photon Cameras [24.711165102559438]
小型で省エネで低コストな単光子カメラによる計測に基づいて,任意のランベルト物体の3次元形状を再構成する手法を提案する。
我々の研究は、画像ベースモデリングとアクティブレンジスキャンの関連性を引き合いに出し、単光子カメラによる3Dビジョンに向けた一歩である。
論文 参考訳(メタデータ) (2024-03-26T15:40:05Z) - Weakly Supervised Monocular 3D Detection with a Single-View Image [58.57978772009438]
モノクロ3D検出は、単一視点画像からの正確な3Dオブジェクトのローカライゼーションを目的としている。
SKD-WM3Dは弱い教師付き単分子3D検出フレームワークである。
我々は,SKD-WM3Dが最先端技術を超え,多くの完全教師付き手法と同等であることを示した。
論文 参考訳(メタデータ) (2024-02-29T13:26:47Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - A Flexible Multi-view Multi-modal Imaging System for Outdoor Scenes [37.5716419191546]
大規模な屋外シーンに適用可能な無線マルチビューマルチモーダル3Dイメージングシステムを提案する。
カメラとLiDARを備えた複数の空間分散スレーブノードが接続され、無線センサネットワークを形成する。
このシステムは、ミュートリビューRGBカメラとLiDARを大規模な屋外シーンで統合した最初の撮像システムである。
論文 参考訳(メタデータ) (2023-02-21T06:14:05Z) - Weakly Supervised 3D Multi-person Pose Estimation for Large-scale Scenes
based on Monocular Camera and Single LiDAR [41.39277657279448]
大規模シーンにおける3次元多人数ポーズ推定のためのモノクロカメラとLiDARによる単一手法を提案する。
具体的には,画像や点クラウドを含むマルチモーダル入力データを活用するための効果的な融合戦略を設計する。
本手法は, 点雲の固有な幾何学的制約を自己監督のために利用し, 画像上の2次元キーポイントを弱監督のために利用する。
論文 参考訳(メタデータ) (2022-11-30T12:50:40Z) - SGM3D: Stereo Guided Monocular 3D Object Detection [62.11858392862551]
SGM3Dと呼ばれるステレオ誘導単分子物体検出ネットワークを提案する。
ステレオ画像から抽出したロバストな3次元特徴を利用して、モノクル画像から得られた特徴を強化する。
本手法は,余分な計算コストを伴わずに性能を向上させるために,他の多くの単分子的手法に統合することができる。
論文 参考訳(メタデータ) (2021-12-03T13:57:14Z) - MetaPose: Fast 3D Pose from Multiple Views without 3D Supervision [72.5863451123577]
正確な3Dポーズとカメラ推定が可能なニューラルモデルをトレーニングする方法を示す。
本手法は,古典的バンドル調整と弱教師付き単分子3Dベースラインの両方に優れる。
論文 参考訳(メタデータ) (2021-08-10T18:39:56Z) - Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled
Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。
我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。
アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文 参考訳(メタデータ) (2020-04-05T12:52:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。