論文の概要: Nano-3D: Metasurface-Based Neural Depth Imaging
- arxiv url: http://arxiv.org/abs/2503.15770v1
- Date: Thu, 20 Mar 2025 01:06:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-21 22:26:54.304049
- Title: Nano-3D: Metasurface-Based Neural Depth Imaging
- Title(参考訳): Nano-3D: 準曲面型ニューラルディープスイメージング
- Authors: Bingxuan Li, Jiahao Wu, Yuan Xu, Yunxiang Zhang, Zezheng Zhu, Nanfang Yu, Qi Sun,
- Abstract要約: Nano-3Dは、超コンパクトなフットプリントを持つ、準曲面ベースの神経深度イメージングソリューションである。
シミュレーション実験と物理実験でNano-3Dの有効性を実証した。
- 参考スコア(独自算出の注目度): 18.17485524891623
- License:
- Abstract: Depth imaging is a foundational building block for broad applications, such as autonomous driving and virtual/augmented reality. Traditionally, depth cameras have relied on time-of-flight sensors or multi-lens systems to achieve physical depth measurements. However, these systems often face a trade-off between a bulky form factor and imprecise approximations, limiting their suitability for spatially constrained scenarios. Inspired by the emerging advancements of nano-optics, we present Nano-3D, a metasurface-based neural depth imaging solution with an ultra-compact footprint. Nano-3D integrates our custom-fabricated 700 nm thick TiO2 metasurface with a multi-module deep neural network to extract precise metric depth information from monocular metasurface-polarized imagery. We demonstrate the effectiveness of Nano-3D with both simulated and physical experiments. We hope the exhibited success paves the way for the community to bridge future graphics systems with emerging nanomaterial technologies through novel computational approaches.
- Abstract(参考訳): 深度イメージングは、自律運転やバーチャル/拡張現実といった幅広い応用のための基礎的なビルディングブロックである。
伝統的に、深度カメラは物理的深度測定を実現するために飛行時間センサーや多レンズシステムに依存してきた。
しかしながら、これらのシステムは、大きめのフォームファクタと不正確な近似の間のトレードオフに直面し、空間的に制約されたシナリオに対する適合性を制限している。
ナノ光学の進歩に触発されて,超コンパクトなフットプリントを持つ準曲面型ニューラルディープイメージングソリューションであるNano-3Dを提案する。
ナノ3Dは、700nmの厚みを持つTiO2超曲面を多モジュールディープニューラルネットワークと統合し、モノクラー準曲面偏光画像から精密な計量深度情報を抽出する。
シミュレーション実験と物理実験でNano-3Dの有効性を実証した。
コミュニティが新しい計算手法によって、未来のグラフィックシステムを新しいナノマテリアル技術で橋渡しする道を開くことを願っている。
関連論文リスト
- NeAT: Learning Neural Implicit Surfaces with Arbitrary Topologies from
Multi-view Images [17.637064969966847]
NeATは、多視点画像から任意のトポロジを持つ暗黙の曲面を学習する、新しいニューラルネットワークレンダリングフレームワークである。
NeATは、古典的なマーチングキューブアルゴリズムを用いて、フィールドからメッシュへの変換を容易にする。
我々のアプローチは、水密面と非水密面の両方を忠実に再構築することができる。
論文 参考訳(メタデータ) (2023-03-21T16:49:41Z) - MonoPGC: Monocular 3D Object Detection with Pixel Geometry Contexts [6.639648061168067]
我々は、リッチなPixel Geometry Contextsを備えた新しいエンドツーエンドのモノクロ3Dオブジェクト検出フレームワークであるMonoPGCを提案する。
我々は,局所的および大域的な深度幾何学的知識を視覚的特徴に注入するために,画素深度推定を補助タスクとして導入し,設計深度クロスアテンションピラミッドモジュール(DCPM)を設計する。
さらに,3次元空間位置と奥行き認識機能を効率よく統合するDSATを提案する。
論文 参考訳(メタデータ) (2023-02-21T09:21:58Z) - 3DVNet: Multi-View Depth Prediction and Volumetric Refinement [68.68537312256144]
3DVNetは、新しいマルチビューステレオ(MVS)深度予測法である。
私たちのキーとなるアイデアは、粗い深度予測を反復的に更新する3Dシーンモデリングネットワークを使用することです。
本手法は, 深度予測と3次元再構成の両指標において, 最先端の精度を超えることを示す。
論文 参考訳(メタデータ) (2021-12-01T00:52:42Z) - Neural Radiance Fields Approach to Deep Multi-View Photometric Stereo [103.08512487830669]
多視点測光ステレオ問題(MVPS)に対する現代的な解法を提案する。
我々は、光度ステレオ(PS)画像形成モデルを用いて表面配向を取得し、それを多視点のニューラルラディアンス場表現とブレンドして物体の表面形状を復元する。
本手法は,多視点画像のニューラルレンダリングを行い,深部光度ステレオネットワークによって推定される表面の正規性を活用している。
論文 参考訳(メタデータ) (2021-10-11T20:20:03Z) - Real-Time Tactile Grasp Force Sensing Using Fingernail Imaging via Deep
Neural Networks [3.42658286826597]
本稿では,人間の指先による視覚のみによる3次元触覚力のリアルタイム推定のための新しいアプローチを提案する。
導入されたアプローチは、完全に単眼で、物理的な力センサーを必要としない。
スケーラブルで非侵襲的で、ボディポーズ推定のような他の知覚システムと容易に融合する。
論文 参考訳(メタデータ) (2021-09-30T16:07:41Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - SelfDeco: Self-Supervised Monocular Depth Completion in Challenging
Indoor Environments [50.761917113239996]
自己教師付き単分子深度補完のための新しいアルゴリズムを提案する。
提案手法は,深度ラベルを含まない疎深度測定とそれに対応する単眼ビデオシーケンスのみを必要とするニューラルネットワークのトレーニングに基づく。
我々の自己監督アルゴリズムは、テクスチャのない領域、光沢のない透明な表面、非ランバートの表面、動く人々、より長く多様な深度範囲、複雑なエゴモーションによって捉えられたシーンを含む屋内環境に挑戦するために設計されている。
論文 参考訳(メタデータ) (2020-11-10T08:55:07Z) - On Deep Learning Techniques to Boost Monocular Depth Estimation for
Autonomous Navigation [1.9007546108571112]
画像の深さを推定することはコンピュータビジョンの分野における根本的な逆問題である。
本稿では,新しい特徴抽出モデルと組み合わせ,軽量で高速なCNNアーキテクチャを提案する。
また,SIDE問題を解くために,単純な幾何2.5D損失関数と組み合わせて効率的な表面正規化モジュールを導入する。
論文 参考訳(メタデータ) (2020-10-13T18:37:38Z) - DepthNet Nano: A Highly Compact Self-Normalizing Neural Network for
Monocular Depth Estimation [76.90627702089357]
DepthNet Nanoは、人間の機械の共同設計戦略を用いて設計された単眼深度推定のためのコンパクトなディープニューラルネットワークである。
提案したDepthNet Nanoは、最先端のネットワークで同等の性能を保ちながら、高い効率のネットワークアーキテクチャを持っている。
論文 参考訳(メタデータ) (2020-04-17T00:41:35Z) - Learning Depth With Very Sparse Supervision [57.911425589947314]
本稿では, 環境との相互作用を通じて, 知覚が世界の3次元特性と結合するという考えを考察する。
我々は、環境と対話するロボットが利用できるような、特殊なグローバルローカルネットワークアーキテクチャを訓練する。
いくつかのデータセットの実験では、画像ピクセルの1つでも基底真理が利用できる場合、提案されたネットワークは、最先端のアプローチよりも22.5%の精度でモノクロの深度推定を学習できることを示している。
論文 参考訳(メタデータ) (2020-03-02T10:44:13Z) - A Freeform Dielectric Metasurface Modeling Approach Based on Deep Neural
Networks [7.039798390237901]
本稿では, 深層学習に基づくメタサイト/メタ原子モデリング手法を導入し, キャラクタリゼーション時間を大幅に短縮する。
畳み込みニューラルネットワーク(CNN)の構造に基づいて、提案したディープラーニングネットワークは、自由な2Dパターンと異なる格子サイズを持つメタ原子をモデル化することができる。
提案手法は、ミリ秒の時間スケールで、メタ原子の広いスペクトル応答を予測する能力を備えている。
論文 参考訳(メタデータ) (2020-01-01T01:21:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。