Fugu-MT 論文翻訳(概要): FDCT: Fast Depth Completion for Transparent Objects

論文の概要: FDCT: Fast Depth Completion for Transparent Objects

arxiv url: http://arxiv.org/abs/2307.12274v1
Date: Sun, 23 Jul 2023 09:34:13 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-25 17:01:18.898413
Title: FDCT: Fast Depth Completion for Transparent Objects
Title（参考訳）: FDCT: 透明物体の高速深度補完
Authors: Tianan Li, Zhehan Chen, Huan Liu, Chen Wang
Abstract要約: 透過性オブジェクト(FDCT)のための高速深度補完フレームワークを提案する。 FDCTは、最先端の手法よりも高い精度で約70 FPSを動作させることができる。また、FDCTは、オブジェクト把握タスクにおけるポーズ推定を改善することができることを示した。
参考スコア（独自算出の注目度）: 24.314714760448407
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Depth completion is crucial for many robotic tasks such as autonomous driving, 3-D reconstruction, and manipulation. Despite the significant progress, existing methods remain computationally intensive and often fail to meet the real-time requirements of low-power robotic platforms. Additionally, most methods are designed for opaque objects and struggle with transparent objects due to the special properties of reflection and refraction. To address these challenges, we propose a Fast Depth Completion framework for Transparent objects (FDCT), which also benefits downstream tasks like object pose estimation. To leverage local information and avoid overfitting issues when integrating it with global information, we design a new fusion branch and shortcuts to exploit low-level features and a loss function to suppress overfitting. This results in an accurate and user-friendly depth rectification framework which can recover dense depth estimation from RGB-D images alone. Extensive experiments demonstrate that FDCT can run about 70 FPS with a higher accuracy than the state-of-the-art methods. We also demonstrate that FDCT can improve pose estimation in object grasping tasks. The source code is available at https://github.com/Nonmy/FDCT
Abstract（参考訳）: 深さの完成は、自律運転や3D再構築、操作といった多くのロボット作業にとって不可欠である。著しい進歩にもかかわらず、既存の手法は計算集約的であり、しばしば低消費電力ロボットプラットフォームのリアルタイム要求を満たさない。加えて、ほとんどのメソッドは不透明なオブジェクトのために設計されており、反射と屈折の特別な特性のために透明なオブジェクトに苦しむ。これらの課題に対処するため,我々は,オブジェクトポーズ推定などの下流タスクにも有効である透過的オブジェクト(fdct)のための高速深さ補完フレームワークを提案する。地域情報を活用し,グローバル情報と統合する際の過剰フィッティングを回避するために,新しい融合ブランチとショートカットを設計し,低レベル機能と損失関数を活用し、過剰フィッティングを抑制する。これにより,RGB-D画像のみからの深度推定を再現する,高精度でユーザフレンドリな深度補正フレームワークが実現される。広範な実験により、fdctは最先端の手法よりも高い精度で約70fpsで動作できることが示されている。また,fdctは対象把握タスクにおけるポーズ推定を改善できることを実証する。ソースコードはhttps://github.com/Nonmy/FDCTで入手できる。

関連論文リスト

Rethinking Transparent Object Grasping: Depth Completion with Monocular Depth Estimation and Instance Mask [10.472380465235629]
ReMakeは、インスタンスマスクと単眼深度推定によってガイドされる、新しい深度補完フレームワークである。提案手法は,ベンチマークデータセットと実世界のシナリオの両方において,既存の手法よりも優れている。
論文参考訳（メタデータ） (2025-08-04T15:14:47Z)
GAA-TSO: Geometry-Aware Assisted Depth Completion for Transparent and Specular Objects [5.227530976208222]
本稿では,透明かつ特異な物体に対する幾何学的支援深度補完法を提案する。具体的には、入力深度を点雲にバックプロジェクションし、3Dブランチを構築し、階層的なシーンレベルの3D構造特徴を抽出する。提案手法は,下流ロボットグルーピングタスクの性能を著しく向上させる。
論文参考訳（メタデータ） (2025-03-21T12:46:38Z)
TransDiff: Diffusion-Based Method for Manipulating Transparent Objects Using a Single RGB-D Image [9.242427101416226]
デスクトップ上での材料に依存しない物体の把握を実現するため,単一ビューのRGB-D-based depth completion frameworkであるTransDiffを提案する。我々は,RGB画像から抽出した特徴(セグメンテーション,エッジマップ,正規マップなど)を,深度マップ生成プロセスの条件として活用する。提案手法は,ランダムな深度分布を深度マップに変換する反復的復調過程を学習し,初期改良された深度情報を用いて導出する。
論文参考訳（メタデータ） (2025-03-17T03:29:37Z)
AuxDepthNet: Real-Time Monocular 3D Object Detection with Depth-Sensitive Features [13.48200434855076]
AuxDepthNetはリアルタイムなモノクロ3Dオブジェクト検出のための効率的なフレームワークである。外部の深度マップや事前訓練された深度モデルへの依存をなくす。スコアは34.11%(簡単)、25.18%(モデレート)、21.90%(ハード)で、IoU閾値は0.7である。
論文参考訳（メタデータ） (2025-01-07T11:07:32Z)
DepthLab: From Partial to Complete [80.58276388743306]
不足する値は、幅広いアプリケーションにわたる深度データにとって共通の課題である。この作業は、イメージ拡散プリエントを利用した基礎深度塗装モデルであるDepthLabと、このギャップを埋めるものだ。提案手法は,3Dシーンのインペイント,テキストから3Dシーン生成,DUST3Rによるスパースビュー再構成,LiDAR深度補完など,様々なダウンストリームタスクにおいて有用であることを示す。
論文参考訳（メタデータ） (2024-12-24T04:16:38Z)
SEMPose: A Single End-to-end Network for Multi-object Pose Estimation [13.131534219937533]
SEMPoseは、エンドツーエンドの多目的ポーズ推定ネットワークである。 RGB画像以外の入力を必要とせずに32FPSで推論を行うことができる。複数のオブジェクトのポーズをリアルタイムで正確に推定でき、対象オブジェクトの数の影響を受けない推論時間に影響を及ぼす。
論文参考訳（メタデータ） (2024-11-21T10:37:54Z)
SAID-NeRF: Segmentation-AIDed NeRF for Depth Completion of Transparent Objects [7.529049797077149]
市販のRGB-Dカメラを使って透明物体の正確な深度情報を取得することは、コンピュータビジョンとロボティクスにおいてよく知られた課題である。 NeRFは学習のないアプローチであり、新しいビューの合成と形状回復に広く成功している。提案したAID-NeRF法は,透明物体とロボットグルーピングのための深度補完データセットに有意な性能を示す。
論文参考訳（メタデータ） (2024-03-28T17:28:32Z)
Domain Randomization-Enhanced Depth Simulation and Restoration for Perceiving and Grasping Specular and Transparent Objects [28.84776177634971]
深度復元のための強力なRGBD融合ネットワークSwinDRNetを提案する。また,ドメインランダム化強化深度シミュレーション(DREDS)によるアクティブステレオ深度システムのシミュレーションも提案する。我々の深度復元は下流タスクの性能を効果的に向上させることを示す。
論文参考訳（メタデータ） (2022-08-07T19:17:16Z)
ZebraPose: Coarse to Fine Surface Encoding for 6DoF Object Pose Estimation [76.31125154523056]
物体表面を高密度に表現できる離散ディスクリプタを提案する。また,微粒化対応予測が可能な微粒化学習戦略を提案する。
論文参考訳（メタデータ） (2022-03-17T16:16:24Z)
Iterative Corresponding Geometry: Fusing Region and Depth for Highly Efficient 3D Tracking of Textureless Objects [25.448657318818764]
ICGは領域と深度情報を融合させる新しい確率的トラッカーであり、物体形状のみを必要とする。本手法では, 対応線を配置し, ポーズを反復的に洗練する。 YCB-Video、OPT、Choiデータセットの実験は、テクスチャ化されたオブジェクトであっても、我々のアプローチが現在の技術よりも優れていることを示した。
論文参考訳（メタデータ） (2022-03-10T12:30:50Z)
Joint Learning of Salient Object Detection, Depth Estimation and Contour Extraction [91.43066633305662]
RGB-D Salient Object Detection (SOD) のための新しいマルチタスク・マルチモーダルフィルタトランス (MMFT) ネットワークを提案する。具体的には、深度推定、健全な物体検出、輪郭推定の3つの相補的なタスクを統合する。マルチタスク機構は、タスク認識の特徴を補助タスクから学習するためのモデルを促進する。実験の結果、複数のデータセット上での深度に基づくRGB-D SOD法をはるかに上回るだけでなく、高品質の深度マップと塩分濃度を同時に正確に予測できることがわかった。
論文参考訳（メタデータ） (2022-03-09T17:20:18Z)
Objects are Different: Flexible Monocular 3D Object Detection [87.82253067302561]
そこで本研究では,乱れたオブジェクトを明示的に分離し,オブジェクト深度推定のための複数のアプローチを適応的に組み合わせたモノクル3次元オブジェクト検出のためのフレキシブルなフレームワークを提案する。実験の結果,本手法はkittiベンチマークテストセットにおいて,中等度レベルが27%,硬度が30%と,最先端法を27%上回った。
論文参考訳（メタデータ） (2021-04-06T07:01:28Z)
RGB-D Local Implicit Function for Depth Completion of Transparent Objects [43.238923881620494]
ロボット工学における認識方法の大部分は、RGB-Dカメラが提供する深度情報を必要とする。標準的な3Dセンサーは、屈折と光の吸収により透明な物体の深さを捉えられない。ノイズの多いRGB-D入力を考慮し,欠損深度を完備できる新しいフレームワークを提案する。
論文参考訳（メタデータ） (2021-04-01T17:00:04Z)
EDN: Salient Object Detection via Extremely-Downsampled Network [66.38046176176017]
画像全体のグローバルビューを効果的に学ぶために、極端なダウンサンプリング技術を使用するExtremely-Downsampled Network(EDN)を紹介します。実験は、ednがリアルタイム速度でsart性能を達成することを実証する。
論文参考訳（メタデータ） (2020-12-24T04:23:48Z)
Accurate RGB-D Salient Object Detection via Collaborative Learning [101.82654054191443]
RGB-Dサリエンシ検出は、いくつかの課題シナリオにおいて素晴らしい能力を示している。本稿では,エッジ,深度,塩分濃度をより効率的に活用する新しい協調学習フレームワークを提案する。
論文参考訳（メタデータ） (2020-07-23T04:33:36Z)
Deep Spatial Gradient and Temporal Depth Learning for Face Anti-spoofing [61.82466976737915]
深層学習は、顔の反偽造の最も効果的な方法の1つとして証明されている。 2つの洞察に基づいて,複数フレームからの提示攻撃を検出する新しい手法を提案する。提案手法は,5つのベンチマークデータセットの最先端結果を実現する。
論文参考訳（メタデータ） (2020-03-18T06:11:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。