論文の概要: A Learned Stereo Depth System for Robotic Manipulation in Homes
- arxiv url: http://arxiv.org/abs/2109.11644v1
- Date: Thu, 23 Sep 2021 20:53:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-27 14:27:37.783908
- Title: A Learned Stereo Depth System for Robotic Manipulation in Homes
- Title(参考訳): 家庭におけるロボット操作のためのステレオ深度学習システム
- Authors: Krishna Shankar, Mark Tjersland, Jeremy Ma, Kevin Stone, Max
Bajracharya
- Abstract要約: 人間の環境に最適化された高密度で正確な点雲を生成する受動的ステレオ深度システムを提案する。
このシステムは、学習されたステレオマッチングとエンジニアリングされたフィルタリング、トレーニングとデータミキシングの方法論、センサーハードウェア設計を組み合わせたアルゴリズムで構成されている。
- 参考スコア(独自算出の注目度): 2.06216858680643
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present a passive stereo depth system that produces dense and accurate
point clouds optimized for human environments, including dark, textureless,
thin, reflective and specular surfaces and objects, at 2560x2048 resolution,
with 384 disparities, in 30 ms. The system consists of an algorithm combining
learned stereo matching with engineered filtering, a training and data-mixing
methodology, and a sensor hardware design. Our architecture is 15x faster than
approaches that perform similarly on the Middlebury and Flying Things Stereo
Benchmarks. To effectively supervise the training of this model, we combine
real data labelled using off-the-shelf depth sensors, as well as a number of
different rendered, simulated labeled datasets. We demonstrate the efficacy of
our system by presenting a large number of qualitative results in the form of
depth maps and point-clouds, experiments validating the metric accuracy of our
system and comparisons to other sensors on challenging objects and scenes. We
also show the competitiveness of our algorithm compared to state-of-the-art
learned models using the Middlebury and FlyingThings datasets.
- Abstract(参考訳): 本システムでは,2560×2048の解像度で,384の差がみられ,2560×2048の解像度で,暗さ,テクスチャレス,薄さ,反射面,鏡面,物体など,人間の環境に最適化された高密度で正確な点雲を30msで生成するパッシブステレオ深度システムを提案する。このシステムは,学習ステレオマッチングとエンジニアによるフィルタリング,トレーニングとデータ混合手法,センサハードウェア設計を組み合わせたアルゴリズムである。
私たちのアーキテクチャは、MiddleburyとFlying Things Stereo Benchmarksで同じように機能するアプローチよりも15倍高速です。
このモデルのトレーニングを効果的に監督するために,市販の奥行きセンサでラベル付けされた実データと,さまざまなレンダリングされたラベル付きデータセットを組み合わせる。
本システムの有効性を,深度マップとポイントクラウドの形式で多数の質的結果を示し,測定精度の検証実験を行い,挑戦対象やシーンにおける他のセンサとの比較を行った。
また, middlebury と flyingthings データセットを用いた最先端学習モデルと比較して,アルゴリズムの競争力を示す。
関連論文リスト
- ES-PTAM: Event-based Stereo Parallel Tracking and Mapping [11.801511288805225]
イベントカメラは、標準的なカメラの限界を克服する利点を提供する。
2つのアイデアを組み合わせたイベントベースステレオVOシステムを提案する。
実世界の5つのデータセットからシステムを評価する。
論文 参考訳(メタデータ) (2024-08-28T07:56:28Z) - On the Importance of Accurate Geometry Data for Dense 3D Vision Tasks [61.74608497496841]
不正確または破損したデータのトレーニングは、モデルバイアスとハマーズ一般化能力を誘導する。
本稿では,深度推定と再構成における高密度3次元視覚課題に対するセンサ誤差の影響について検討する。
論文 参考訳(メタデータ) (2023-03-26T22:32:44Z) - Towards Scale Consistent Monocular Visual Odometry by Learning from the
Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。
まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。
結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文 参考訳(メタデータ) (2022-03-11T01:51:54Z) - Metric-based multimodal meta-learning for human movement identification
via footstep recognition [3.300376360949452]
マルチモーダル・フレームワークを導入した新しいメトリック・ベース・ラーニング・アプローチについて述べる。
我々は,全方位センサシステムから得られた低感度データから汎用表現を学習する。
本研究は,マルチセンサデータに対するメトリクスに基づくコントラスト学習手法を用いて,データ不足の影響を緩和する。
論文 参考訳(メタデータ) (2021-11-15T18:46:14Z) - Self-Supervised Depth Completion for Active Stereo [55.79929735390945]
アクティブステレオシステムは、低コストで高品質な深度マップのため、ロボット産業で広く利用されている。
これらの深度センサーはステレオアーチファクトに悩まされており、密度の深い深度推定を提供していない。
本稿では, 高精度な深度マップを推定するアクティブステレオシステムのための, 自己監督型深度補完法を提案する。
論文 参考訳(メタデータ) (2021-10-07T07:33:52Z) - Dominant motion identification of multi-particle system using deep
learning from video [0.0]
本研究では,高度システムの実世界映像から関連情報を抽出するディープラーニングフレームワークを提案する。
本手法は,アリ,シロアリ,魚の閉じ込められた多エージェント/粒子系のビデオで実証する。
さらに,これらの多様なシステムがどのようにして基礎となる振る舞いを予測できるかを考察する。
論文 参考訳(メタデータ) (2021-04-26T17:10:56Z) - Stereo Matching by Self-supervision of Multiscopic Vision [65.38359887232025]
カメラ位置の整列で撮影した複数の画像を利用したステレオマッチングのための新しい自己監視フレームワークを提案する。
ネットワークを最適化するために、クロスフォトメトリックロス、不確実性を認識した相互監督損失、および新しい平滑性損失が導入されます。
我々のモデルは、KITTIデータセット上の以前の教師なし手法よりも、より良い不均一性マップを得る。
論文 参考訳(メタデータ) (2021-04-09T02:58:59Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - Physics-based Differentiable Depth Sensor Simulation [5.134435281973137]
リアルな2.5Dスキャンを生成するための新しいエンドツーエンドの微分可能なシミュレーションパイプラインを紹介します。
各モジュールはw.r.tセンサーとシーンパラメータを区別できる。
シミュレーションにより,実スキャンで得られたモデルの性能が大幅に向上する。
論文 参考訳(メタデータ) (2021-03-30T17:59:43Z) - OmniSLAM: Omnidirectional Localization and Dense Mapping for
Wide-baseline Multi-camera Systems [88.41004332322788]
超広視野魚眼カメラ(FOV)を用いた広視野多視点ステレオ構成のための全方向位置決めと高密度マッピングシステムを提案する。
より実用的で正確な再構築のために、全方向深度推定のための改良された軽量のディープニューラルネットワークを導入する。
我々は全方位深度推定をビジュアル・オドメトリー(VO)に統合し,大域的整合性のためのループ閉鎖モジュールを付加する。
論文 参考訳(メタデータ) (2020-03-18T05:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。