論文の概要: Geometry-Aware Instance Segmentation with Disparity Maps
- arxiv url: http://arxiv.org/abs/2006.07802v1
- Date: Sun, 14 Jun 2020 05:03:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 13:04:44.834938
- Title: Geometry-Aware Instance Segmentation with Disparity Maps
- Title(参考訳): 異種マップを用いた幾何型インスタンス分割
- Authors: Cho-Ying Wu, Xiaoyan Hu, Michael Happold, Qiangeng Xu, Ulrich Neumann
- Abstract要約: ステレオカメラを利用するセンサフュージョンの新しい方向を探究する。
格差から得られる幾何学的情報は、同じまたは異なるクラスの重複するオブジェクトを分離するのに役立ちます。
マスク回帰は擬似ライダーと画像ベース表現を用いた2D,2.5D,3DROIに基づく。
- 参考スコア(独自算出の注目度): 24.09310778846346
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most previous works of outdoor instance segmentation for images only use
color information. We explore a novel direction of sensor fusion to exploit
stereo cameras. Geometric information from disparities helps separate
overlapping objects of the same or different classes. Moreover, geometric
information penalizes region proposals with unlikely 3D shapes thus suppressing
false positive detections. Mask regression is based on 2D, 2.5D, and 3D ROI
using the pseudo-lidar and image-based representations. These mask predictions
are fused by a mask scoring process. However, public datasets only adopt stereo
systems with shorter baseline and focal legnth, which limit measuring ranges of
stereo cameras. We collect and utilize High-Quality Driving Stereo (HQDS)
dataset, using much longer baseline and focal length with higher resolution.
Our performance attains state of the art. Please refer to our project page. The
full paper is available here.
- Abstract(参考訳): イメージのアウトドアインスタンスセグメンテーションのほとんどの以前の作品は、カラー情報のみを使用する。
ステレオカメラを利用するためのセンサ融合の新たな方向を探る。
格差から得られる幾何学的情報は、同じまたは異なるクラスの重複するオブジェクトを分離するのに役立ちます。
さらに、幾何学的情報は3次元形状の可能性のある領域の提案を罰し、偽陽性検出を抑える。
マスク回帰は擬似ライダーと画像ベース表現を用いた2D,2.5D,3DROIに基づく。
これらのマスク予測はマスクスコアリングプロセスによって融合される。
しかし、パブリックデータセットは、ステレオカメラの計測範囲を制限する、ベースラインと焦点長の短いステレオシステムのみを採用する。
我々は,高解像度のベースラインと焦点長を用いて,HQDS(High-Quality Driving Stereo)データセットを収集し,活用する。
私たちの演技は芸術の状態に達する。
プロジェクトページを参照してください。
全文はここで入手できる。
関連論文リスト
- DoubleTake: Geometry Guided Depth Estimation [17.464549832122714]
RGB画像の列から深度を推定することは、基本的なコンピュータビジョンタスクである。
本稿では,現在のカメラ位置から深度マップとして描画された,ボリューム特徴と先行幾何学のヒントを組み合わせた再構成手法を提案する。
本手法は, オフライン・インクリメンタルな評価シナリオにおいて, 対話的な速度, 最先端の深度推定, および3次元シーンで動作可能であることを示す。
論文 参考訳(メタデータ) (2024-06-26T14:29:05Z) - Mask-Attention-Free Transformer for 3D Instance Segmentation [68.29828726317723]
トランスフォーマーベースの手法は、マスクの注意が一般的に関与する3Dインスタンスセグメンテーションを支配している。
我々は、低リコール問題を克服し、位置対応を前提としたクロスアテンションを実現するために、一連の位置認識設計を開発する。
実験の結果,既存の作業よりも4倍早く収束し,ScanNetv2 3Dインスタンスセグメンテーションベンチマークに新たな技術状態を設定し,さまざまなデータセットで優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-09-04T16:09:28Z) - Scatter Points in Space: 3D Detection from Multi-view Monocular Images [8.71944437852952]
単眼画像からの3次元物体検出は,コンピュータビジョンの課題であり,長年の課題である。
近年の手法では, 空間に密集した正規3次元格子をサンプリングすることにより, マルチビュー特性を集約する傾向にある。
そこで本研究では,データ空間に擬似曲面点を散布し,データの分散性を維持するための学習可能なキーポイントサンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-08-31T09:38:05Z) - Self-Supervised Depth Estimation in Laparoscopic Image using 3D
Geometric Consistency [7.902636435901286]
立体対に隠された3次元構造情報を利用する自己教師型深度推定器M3Depthを提案する。
提案手法は,公開データセットと新たに取得したデータセットの両方において,従来の自己教師型アプローチよりも大きなマージンで優れていた。
論文 参考訳(メタデータ) (2022-08-17T17:03:48Z) - Learning Pseudo Front Depth for 2D Forward-Looking Sonar-based
Multi-view Stereo [5.024813922014977]
水中ロボット工学の分野では,2次元前方ソナーから音響画像の欠落した次元情報を取得することがよく知られている。
本稿では,3次元情報を推定する新しい学習型多視点ステレオ手法を提案する。
論文 参考訳(メタデータ) (2022-07-30T14:35:21Z) - Layered Depth Refinement with Mask Guidance [61.10654666344419]
汎用マスクを用いてSIDEモデルの深度予測を洗練させるマスク誘導深度改善の新しい問題を定式化する。
本フレームワークは,奥行きマップをマスクと逆マスクで表される2つの別々の層に分解し,層状改質・塗装・塗装を行う。
本手法は,内面境界領域と外面境界領域の深度を正確に補正し,異なる種類のマスクや初期深度予測に対して堅牢であることを示す。
論文 参考訳(メタデータ) (2022-06-07T06:42:44Z) - Embracing Single Stride 3D Object Detector with Sparse Transformer [63.179720817019096]
自律走行のためのLiDARを用いた3次元物体検出では、物体サイズと入力シーンサイズとの比が2次元検出の場合に比べて有意に小さい。
多くの3D検出器は2D検出器の一般的な慣習に従っており、点雲の定量化後も特徴マップを分解する。
本稿では,SST(Single-stride Sparse Transformer)を提案する。
論文 参考訳(メタデータ) (2021-12-13T02:12:02Z) - Neural Radiance Fields Approach to Deep Multi-View Photometric Stereo [103.08512487830669]
多視点測光ステレオ問題(MVPS)に対する現代的な解法を提案する。
我々は、光度ステレオ(PS)画像形成モデルを用いて表面配向を取得し、それを多視点のニューラルラディアンス場表現とブレンドして物体の表面形状を復元する。
本手法は,多視点画像のニューラルレンダリングを行い,深部光度ステレオネットワークによって推定される表面の正規性を活用している。
論文 参考訳(メタデータ) (2021-10-11T20:20:03Z) - Stereo Object Matching Network [78.35697025102334]
本稿では,画像からの2次元コンテキスト情報と3次元オブジェクトレベル情報の両方を利用するステレオオブジェクトマッチング手法を提案する。
コストボリューム空間における3次元オブジェクト性を扱うための新しい方法として, 選択的サンプリング (RoISelect) と 2D-3D 融合がある。
論文 参考訳(メタデータ) (2021-03-23T12:54:43Z) - Stereo RGB and Deeper LIDAR Based Network for 3D Object Detection [40.34710686994996]
3Dオブジェクト検出は、自動運転のシナリオにおいて新たな課題となっている。
以前の作業では、プロジェクションベースまたはボクセルベースのモデルを使用して3Dポイントクラウドを処理していた。
本稿では,意味情報と空間情報の同時利用が可能なStereo RGBおよびDeeper LIDARフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-09T11:19:24Z) - DSGN: Deep Stereo Geometry Network for 3D Object Detection [79.16397166985706]
画像ベースとLiDARベースの3Dオブジェクト検出器の間には大きなパフォーマンスギャップがある。
我々の手法であるDeep Stereo Geometry Network (DSGN)は,このギャップを著しく低減する。
初めて、シンプルで効果的な1段ステレオベースの3D検出パイプラインを提供する。
論文 参考訳(メタデータ) (2020-01-10T11:44:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。