論文の概要: Unknown Object Segmentation from Stereo Images
- arxiv url: http://arxiv.org/abs/2103.06796v1
- Date: Thu, 11 Mar 2021 17:03:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-12 14:54:25.943877
- Title: Unknown Object Segmentation from Stereo Images
- Title(参考訳): ステレオ画像からの未知物体分割
- Authors: Maximilian Durner, Wout Boerdijk, Martin Sundermeyer, Werner Friedl,
Zoltan-Csaba Marton, Rudolph Triebel
- Abstract要約: 対象のセマンティック情報や幾何学的情報を予め必要としない,新しいオブジェクトインスタンス分割手法を提案する。
ステレオセンサの汎用性に着目し,入力画像のペアからオブジェクトインスタンスへ直接マップするトランスフォーマティブベースのアーキテクチャを採用している。
いくつかの異なるアプリケーションドメインでの実験では、Instance Stereo Transformer(INSTR)アルゴリズムが、深度マップに基づく現在の最新手法を上回ることを示しています。
- 参考スコア(独自算出の注目度): 18.344801596121997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although instance-aware perception is a key prerequisite for many autonomous
robotic applications, most of the methods only partially solve the problem by
focusing solely on known object categories. However, for robots interacting in
dynamic and cluttered environments, this is not realistic and severely limits
the range of potential applications. Therefore, we propose a novel object
instance segmentation approach that does not require any semantic or geometric
information of the objects beforehand. In contrast to existing works, we do not
explicitly use depth data as input, but rely on the insight that slight
viewpoint changes, which for example are provided by stereo image pairs, are
often sufficient to determine object boundaries and thus to segment objects.
Focusing on the versatility of stereo sensors, we employ a transformer-based
architecture that maps directly from the pair of input images to the object
instances. This has the major advantage that instead of a noisy, and
potentially incomplete depth map as an input, on which the segmentation is
computed, we use the original image pair to infer the object instances and a
dense depth map. In experiments in several different application domains, we
show that our Instance Stereo Transformer (INSTR) algorithm outperforms current
state-of-the-art methods that are based on depth maps. Training code and
pretrained models will be made available.
- Abstract(参考訳): インスタンス認識は、多くの自律型ロボットアプリケーションにとって重要な前提条件であるが、ほとんどの方法は、既知のオブジェクトカテゴリのみに焦点を合わせることによってのみ、問題を部分的に解決する。
しかし、動的で散らかった環境で対話するロボットにとって、これは現実的ではなく、潜在的な応用範囲を著しく制限する。
そこで本稿では,オブジェクトの意味的,幾何学的な情報を事前に必要としない,新しいオブジェクトインスタンス分割手法を提案する。
既存の作品とは対照的に、深度データを入力として明示的に使用するのではなく、例えばステレオ画像のペアによって提供されるわずかな視点の変化は、多くの場合、オブジェクトの境界を決定してセグメントオブジェクトに十分であるという洞察に依存します。
ステレオセンサの汎用性に着目し,入力画像のペアからオブジェクトインスタンスへ直接マップするトランスフォーマティブベースのアーキテクチャを採用している。
これは、セグメント化が計算される入力としてノイズや潜在的に不完全な深度マップの代わりに、元のイメージペアを使ってオブジェクトのインスタンスと深度マップを推論する、という大きな利点を持つ。
いくつかの異なるアプリケーションドメインでの実験では、Instance Stereo Transformer(INSTR)アルゴリズムが、深度マップに基づく現在の最新手法を上回ることを示しています。
トレーニングコードと事前トレーニングモデルが利用可能になります。
関連論文リスト
- Are These the Same Apple? Comparing Images Based on Object Intrinsics [27.43687450076182]
オブジェクトの同一性を定義する固有のオブジェクトプロパティに基づいて、純粋に画像の類似性を測定する。
この問題はコンピュータビジョン文学において再同定として研究されている。
そこで本研究では,オブジェクト固有性に基づく画像類似度尺度を探索し,一般対象カテゴリに拡張することを提案する。
論文 参考訳(メタデータ) (2023-11-01T18:00:03Z) - Variable Radiance Field for Real-Life Category-Specifc Reconstruction
from Single Image [27.290232027686237]
本稿では,カメラパラメータが未知の単一画像からカテゴリ固有のオブジェクトを再構成できる新しいフレームワークを提案する。
マルチスケールグローバル特徴抽出器を用いてオブジェクトの形状と外観をパラメータ化する。
また,特徴抽出器の改良のために,コントラスト学習に基づく事前学習戦略を提案する。
論文 参考訳(メタデータ) (2023-06-08T12:12:02Z) - A Generalist Framework for Panoptic Segmentation of Images and Videos [61.61453194912186]
我々は,タスクの帰納バイアスに頼ることなく,離散的なデータ生成問題としてパノプティクスセグメンテーションを定式化する。
単純な構造と一般的な損失関数を持つパノスコープマスクをモデル化するための拡散モデルを提案する。
本手法は,動画を(ストリーミング環境で)モデル化し,オブジェクトのインスタンスを自動的に追跡することを学ぶ。
論文 参考訳(メタデータ) (2022-10-12T16:18:25Z) - CASAPose: Class-Adaptive and Semantic-Aware Multi-Object Pose Estimation [2.861848675707602]
CASAPoseと呼ばれる新しい単一ステージアーキテクチャを提案する。
RGB画像中の複数の異なるオブジェクトのポーズ推定のための2D-3D対応を1パスで決定する。
高速でメモリ効率が高く、複数のオブジェクトに対して高い精度を実現する。
論文 参考訳(メタデータ) (2022-10-11T10:20:01Z) - Discovering Objects that Can Move [55.743225595012966]
手動ラベルなしでオブジェクトを背景から分離する、オブジェクト発見の問題について検討する。
既存のアプローチでは、色、テクスチャ、位置などの外観の手がかりを使用して、ピクセルをオブジェクトのような領域に分類する。
私たちは、動的オブジェクト -- 世界で独立して動くエンティティ -- にフォーカスすることを選びます。
論文 参考訳(メタデータ) (2022-03-18T21:13:56Z) - A Simple and Effective Use of Object-Centric Images for Long-Tailed
Object Detection [56.82077636126353]
シーン中心画像における物体検出を改善するために,物体中心画像を活用する。
私たちは、シンプルで驚くほど効果的なフレームワークを提示します。
我々の手法は、レアオブジェクトのオブジェクト検出(およびインスタンスセグメンテーション)の精度を相対的に50%(および33%)向上させることができる。
論文 参考訳(メタデータ) (2021-02-17T17:27:21Z) - Supervised Training of Dense Object Nets using Optimal Descriptors for
Industrial Robotic Applications [57.87136703404356]
Florence、Manuelli、TedrakeによるDense Object Nets(DON)は、ロボットコミュニティのための新しいビジュアルオブジェクト表現として高密度オブジェクト記述子を導入した。
本稿では, 物体の3次元モデルを考えると, 記述子空間画像を生成することができ, DON の教師付きトレーニングが可能であることを示す。
産業用物体の6次元グリップ生成のためのトレーニング手法を比較し,新しい教師付きトレーニング手法により,産業関連タスクのピック・アンド・プレイス性能が向上することを示す。
論文 参考訳(メタデータ) (2021-02-16T11:40:12Z) - Scale Normalized Image Pyramids with AutoFocus for Object Detection [75.71320993452372]
スケール正規化画像ピラミッド(SNIP)が生成され、人間の視覚と同様に、異なるスケールで固定されたサイズ範囲内のオブジェクトにのみ参加する。
本研究では,オブジェクトを含む可能性のある固定サイズのサブリージョンのみで動作する,効率的な空間サブサンプリング手法を提案する。
結果のアルゴリズムはAutoFocusと呼ばれ、SNIPを使用する場合の推論では2.5~5倍のスピードアップとなる。
論文 参考訳(メタデータ) (2021-02-10T18:57:53Z) - DyStaB: Unsupervised Object Segmentation via Dynamic-Static
Bootstrapping [72.84991726271024]
我々は,コヒーレントなシーン全体を移動しているように見えるシーンの画像の一部を検出し,分割するための教師なしの手法について述べる。
提案手法はまず,セグメント間の相互情報を最小化することにより,運動場を分割する。
セグメントを使用してオブジェクトモデルを学習し、静的なイメージの検出に使用することができる。
論文 参考訳(メタデータ) (2020-08-16T22:05:13Z) - Reinforced Coloring for End-to-End Instance Segmentation [10.73460247817528]
本稿では,複数の物体を並列に区別する方法を学習する,反復的深層強化学習エージェントを提案する。
トレーニング可能なエージェントに対する報酬関数は、グラフカラー化アルゴリズムを用いて、同じオブジェクトに属するピクセルをグループ化することを好んで設計する。
論文 参考訳(メタデータ) (2020-05-14T15:15:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。