論文の概要: RICE: Refining Instance Masks in Cluttered Environments with Graph
Neural Networks
- arxiv url: http://arxiv.org/abs/2106.15711v1
- Date: Tue, 29 Jun 2021 20:29:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-02 01:41:15.247899
- Title: RICE: Refining Instance Masks in Cluttered Environments with Graph
Neural Networks
- Title(参考訳): RICE: グラフニューラルネットワークによるクラッタ環境におけるインスタンスマスクの精製
- Authors: Christopher Xie, Arsalan Mousavian, Yu Xiang, Dieter Fox
- Abstract要約: 本稿では,インスタンスマスクのグラフベース表現を利用して,そのような手法の出力を改良する新しいフレームワークを提案する。
我々は、セグメンテーションにスマートな摂動をサンプリングできるディープネットワークと、オブジェクト間の関係をエンコード可能なグラフニューラルネットワークを訓練し、セグメンテーションを評価する。
本稿では,本手法によって生成された不確実性推定を用いてマニピュレータを誘導し,乱れたシーンを効率的に理解するアプリケーションについて紹介する。
- 参考スコア(独自算出の注目度): 53.15260967235835
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Segmenting unseen object instances in cluttered environments is an important
capability that robots need when functioning in unstructured environments.
While previous methods have exhibited promising results, they still tend to
provide incorrect results in highly cluttered scenes. We postulate that a
network architecture that encodes relations between objects at a high-level can
be beneficial. Thus, in this work, we propose a novel framework that refines
the output of such methods by utilizing a graph-based representation of
instance masks. We train deep networks capable of sampling smart perturbations
to the segmentations, and a graph neural network, which can encode relations
between objects, to evaluate the perturbed segmentations. Our proposed method
is orthogonal to previous works and achieves state-of-the-art performance when
combined with them. We demonstrate an application that uses uncertainty
estimates generated by our method to guide a manipulator, leading to efficient
understanding of cluttered scenes. Code, models, and video can be found at
https://github.com/chrisdxie/rice .
- Abstract(参考訳): 乱雑な環境でのオブジェクトインスタンスのセグメンテーションは、ロボットが非構造化環境で機能するのに必要な重要な機能である。
従来の手法は有望な結果を示してきたが、それでも非常に散らかったシーンで誤った結果を与える傾向にある。
我々は、オブジェクト間の関係を高いレベルでエンコードするネットワークアーキテクチャが有益であると仮定する。
そこで本研究では,インスタンスマスクのグラフベース表現を利用して,そのような手法の出力を改良する新しいフレームワークを提案する。
対象間の関係をエンコード可能なグラフニューラルネットワークを用いて,セグメント化に対するスマートな摂動をサンプリングする深層ネットワークを訓練し,摂動分節を評価する。
提案手法は,従来の作品と直交し,それらと組み合わせて最先端の性能を実現する。
本手法では,不確実性推定を用いてマニピュレータを誘導し,クラッタ化されたシーンを効率的に理解するアプリケーションを示す。
コード、モデル、ビデオはhttps://github.com/chrisdxie/rice で見ることができる。
関連論文リスト
- RISeg: Robot Interactive Object Segmentation via Body Frame-Invariant
Features [6.358423536732677]
本稿では,ロボットインタラクションとデザインされたボディーフレーム不変機能を用いて,不正確なセグメンテーションを補正する新しい手法を提案する。
オブジェクト分割精度を平均80.7%とすることで、散らばったシーンを正確にセグメント化するための対話型知覚パイプラインの有効性を実証する。
論文 参考訳(メタデータ) (2024-03-04T05:03:24Z) - ICGNet: A Unified Approach for Instance-Centric Grasping [44.75280244958735]
オブジェクト中心の把握のためのエンドツーエンドアーキテクチャを導入する。
提案手法の有効性を,合成データセット上での最先端手法に対して広範囲に評価することにより示す。
論文 参考訳(メタデータ) (2024-01-18T12:41:41Z) - ZoomNeXt: A Unified Collaborative Pyramid Network for Camouflaged Object
Detection [75.22007160699948]
本稿では,不明瞭な画像や映像を観察する際の人間の行動を模倣する,効果的な統合型ピラミッドネットワークを提案する。
具体的には、差別的な混合スケールのセマンティクスを学習するために、ズーム戦略を用いる。
我々のタスクフレンドリーなフレームワークは、画像とビデオのCODベンチマークにおいて、既存の最先端の手法よりも一貫して優れています。
論文 参考訳(メタデータ) (2023-10-31T06:11:23Z) - Dynamic Graph Message Passing Networks for Visual Recognition [112.49513303433606]
長距離依存のモデリングは、コンピュータビジョンにおけるシーン理解タスクに不可欠である。
完全連結グラフはそのようなモデリングには有益であるが、計算オーバーヘッドは禁じられている。
本稿では,計算複雑性を大幅に低減する動的グラフメッセージパッシングネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-20T14:41:37Z) - Spatiotemporal Graph Neural Network based Mask Reconstruction for Video
Object Segmentation [70.97625552643493]
本稿では,クラス非依存オブジェクトを半教師あり設定でセグメント化するタスクについて述べる。
提案手法のすべてを利用して局所的なコンテキストを捕捉する新しいグラフニューラルネットワーク(TG-Net)を提案する。
論文 参考訳(メタデータ) (2020-12-10T07:57:44Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z) - Instance Segmentation of Visible and Occluded Regions for Finding and
Picking Target from a Pile of Objects [25.836334764387498]
本研究では,対象物体の発見・把握が可能な物体の山から対象物を選択するロボットシステムを提案する。
既存のインスタンスセグメンテーションモデルを新しいリルックアーキテクチャで拡張し、モデルがインスタンス間の関係を明示的に学習する。
また、画像合成により、人間のアノテーションを使わずに新しいオブジェクトを処理できるシステムを構築する。
論文 参考訳(メタデータ) (2020-01-21T12:28:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。