論文の概要: Estimating Object Physical Properties from RGB-D Vision and Depth Robot Sensors Using Deep Learning
- arxiv url: http://arxiv.org/abs/2507.05029v1
- Date: Mon, 07 Jul 2025 14:11:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.453748
- Title: Estimating Object Physical Properties from RGB-D Vision and Depth Robot Sensors Using Deep Learning
- Title(参考訳): 深層学習を用いたRGB-Dビジョンと深度ロボットセンサによる物体物性の推定
- Authors: Ricardo Cardoso, Plinio Moreno,
- Abstract要約: 慣性質量は、物体の把握、操作、シミュレーションなどのロボット応用において重要な役割を果たす。
本稿では,深度画像とRGB画像との疎点クラウドデータを組み合わせて,物体の質量を推定する手法を提案する。
- 参考スコア(独自算出の注目度): 2.07180164747172
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Inertial mass plays a crucial role in robotic applications such as object grasping, manipulation, and simulation, providing a strong prior for planning and control. Accurately estimating an object's mass before interaction can significantly enhance the performance of various robotic tasks. However, mass estimation using only vision sensors is a relatively underexplored area. This paper proposes a novel approach combining sparse point-cloud data from depth images with RGB images to estimate the mass of objects. We evaluate a range of point-cloud processing architectures, alongside RGB-only methods. To overcome the limited availability of training data, we create a synthetic dataset using ShapeNetSem 3D models, simulating RGBD images via a Kinect camera. This synthetic data is used to train an image generation model for estimating dense depth maps, which we then use to augment an existing dataset of images paired with mass values. Our approach significantly outperforms existing benchmarks across all evaluated metrics. The data generation (https://github.com/RavineWindteer/ShapenetSem-to-RGBD) as well as the training of the depth estimator (https://github.com/RavineWindteer/GLPDepth-Edited) and the mass estimator (https://github.com/RavineWindteer/Depth-mass-estimator) are available online.
- Abstract(参考訳): 慣性質量は、物体の把握、操作、シミュレーションなどのロボット応用において重要な役割を担い、計画と制御の強い先駆けとなる。
相互作用する前に物体の質量を正確に推定することは、様々なロボットタスクの性能を大幅に向上させることができる。
しかし、視覚センサのみを用いた質量推定は、比較的未探索の分野である。
本稿では,深度画像とRGB画像との疎点クラウドデータを組み合わせて,物体の質量を推定する手法を提案する。
我々は、RGBのみの手法とともに、様々なポイントクラウド処理アーキテクチャを評価した。
トレーニングデータの限られた可用性を克服するため、Kinectカメラを介してRGBD画像をシミュレートし、ShapeNetSem 3Dモデルを用いた合成データセットを作成する。
この合成データは、高密度深度マップを推定するための画像生成モデルを訓練するために使用され、その後、質量値と組み合わせた既存の画像データセットを拡張するために使用される。
当社のアプローチは、すべての評価指標で既存のベンチマークを著しく上回っています。
データ生成(https://github.com/RavineWindteer/ShapenetSem-to-RGBD)と深さ推定器(https://github.com/RavineWindteer/GLPDepth-Edited)と質量推定器(https://github.com/RavineWindteer/Depth-mass-estimator)のトレーニングがオンラインで公開されている。
関連論文リスト
- CAP-Net: A Unified Network for 6D Pose and Size Estimation of Categorical Articulated Parts from a Single RGB-D Image [86.75098349480014]
本稿では,ロボット操作作業における調音物体のカテゴリーレベルのポーズ推定に取り組む。
そこで本研究では,Categorical Articulated Partsの6次元ポーズとサイズを推定するためのシングルステージネットワークCAP-Netを提案する。
我々は,RGB画像と実センサからシミュレーションした深度雑音を特徴とするRGB-D調音データセットであるRGBD-Artデータセットを紹介した。
論文 参考訳(メタデータ) (2025-04-15T14:30:26Z) - Scale Invariant Semantic Segmentation with RGB-D Fusion [12.650574326251023]
RGB-D画像を用いたスケール不変セマンティックセグメンテーションのためのニューラルネットワークアーキテクチャを提案する。
画素単位のセマンティックセグメンテーションのためのRGBデータに深度情報を組み込んで,屋外シーンにおける異なるスケールオブジェクトに対処する。
我々のモデルはコンパクトであり、他のRGBモデルにも容易に適用できる。
論文 参考訳(メタデータ) (2022-04-10T12:54:27Z) - Simple and Effective Synthesis of Indoor 3D Scenes [78.95697556834536]
1枚以上の画像から3D屋内シーンを没入する問題について検討する。
我々の狙いは、新しい視点から高解像度の画像とビデオを作成することである。
本稿では,不完全点雲の再投影から高解像度のRGB-D画像へ直接マップするイメージ・ツー・イメージのGANを提案する。
論文 参考訳(メタデータ) (2022-04-06T17:54:46Z) - Ground material classification and for UAV-based photogrammetric 3D data
A 2D-3D Hybrid Approach [1.3359609092684614]
近年,物理環境を表す3次元仮想データを作成するために,多くの領域でフォトグラム法が広く用いられている。
これらの最先端技術は、迅速な3D戦場再建、仮想訓練、シミュレーションを目的として、アメリカ陸軍と海軍の注意を引き付けている。
論文 参考訳(メタデータ) (2021-09-24T22:29:26Z) - Real-time RGBD-based Extended Body Pose Estimation [57.61868412206493]
3DヒトポーズのリアルタイムRGBDに基づく推定システムを提案する。
パラメトリック3次元変形可能なヒューマンメッシュモデル(SMPL-X)を表現として使用する。
身体のポーズと表情パラメータの推定子を訓練する。
論文 参考訳(メタデータ) (2021-03-05T13:37:50Z) - RGB-D Salient Object Detection: A Survey [195.83586883670358]
様々な観点からRGB-Dに基づくSODモデルを総合的に調査する。
また、このドメインからSODモデルと人気のあるベンチマークデータセットもレビューします。
今後の研究に向けたRGB-DベースのSODの課題と方向性について論じる。
論文 参考訳(メタデータ) (2020-08-01T10:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。