論文の概要: Fusing RGBD Tracking and Segmentation Tree Sampling for Multi-Hypothesis
Volumetric Segmentation
- arxiv url: http://arxiv.org/abs/2104.00205v1
- Date: Thu, 1 Apr 2021 02:17:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-02 13:27:12.080783
- Title: Fusing RGBD Tracking and Segmentation Tree Sampling for Multi-Hypothesis
Volumetric Segmentation
- Title(参考訳): fusing rgbd tracking and segmentation tree sampling for multi-hypothesis volumetric segmentation
- Authors: Andrew Price, Kun Huang, Dmitry Berenson
- Abstract要約: マルチハイポテシストラッキング(MST)は,シーン変化におけるボリュームセグメンテーションの新しい手法である。
2つの主な革新により、この困難な問題に取り組むことができます。
本手法は, シミュレーションと現実のテーブルトップ環境において評価する。
- 参考スコア(独自算出の注目度): 6.853379171946806
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Despite rapid progress in scene segmentation in recent years, 3D segmentation
methods are still limited when there is severe occlusion. The key challenge is
estimating the segment boundaries of (partially) occluded objects, which are
inherently ambiguous when considering only a single frame. In this work, we
propose Multihypothesis Segmentation Tracking (MST), a novel method for
volumetric segmentation in changing scenes, which allows scene ambiguity to be
tracked and our estimates to be adjusted over time as we interact with the
scene. Two main innovations allow us to tackle this difficult problem: 1) A
novel way to sample possible segmentations from a segmentation tree; and 2) A
novel approach to fusing tracking results with multiple segmentation estimates.
These methods allow MST to track the segmentation state over time and
incorporate new information, such as new objects being revealed. We evaluate
our method on several cluttered tabletop environments in simulation and
reality. Our results show that MST outperforms baselines in all tested scenes.
- Abstract(参考訳): 近年のシーンセグメンテーションの急速な進歩にもかかわらず, 3次元セグメンテーション法は, 厳密な閉塞がある場合に限定されている。
鍵となる課題は、(部分的に)オクルードされたオブジェクトのセグメント境界を推定することである。
本研究では,シーンのあいまいさをトラッキングし,シーンと対話しながら推定値を時間とともに調整する,シーン変更におけるボリュームセグメンテーションの新しい手法であるMultihypothesis Segmentation Tracking (MST)を提案する。
1)セグメンテーションツリーから可能なセグメンテーションをサンプリングする新しい方法、2)複数のセグメンテーション推定で結果を追跡する新しいアプローチである。
これらの手法により、MSTは時間とともにセグメンテーション状態を追跡し、新しいオブジェクトなどの新しい情報を組み込むことができる。
本手法は,シミュレーションおよび現実におけるいくつかの乱雑なテーブルトップ環境において評価する。
以上の結果から,MSTは全テストシーンにおいてベースラインよりも優れていた。
関連論文リスト
- Image Segmentation in Foundation Model Era: A Survey [99.19456390358211]
イメージセグメンテーションにおける現在の研究は、これらの進歩に関連する特徴、課題、解決策の詳細な分析を欠いている。
本調査は、FM駆動画像セグメンテーションを中心とした最先端の研究を徹底的にレビューすることで、このギャップを埋めようとしている。
現在の研究成果の広さを包括する,300以上のセグメンテーションアプローチの概要を概観する。
論文 参考訳(メタデータ) (2024-08-23T10:07:59Z) - Temporal Segment Transformer for Action Segmentation [54.25103250496069]
本稿では,テキスト・セグメント・トランスフォーマ (textittemporal segment transformer) と呼ぶアテンション・ベース・アプローチを提案する。
主な考え方は、セグメントとフレームの間の注意を用いてセグメント表現を識別することであり、またセグメント間の時間的相関を捉えるためにセグメント間注意を用いる。
このアーキテクチャは,50Salads,GTEA,Breakfastのベンチマークにおいて,最先端の精度を実現していることを示す。
論文 参考訳(メタデータ) (2023-02-25T13:05:57Z) - A Closer Look at Temporal Ordering in the Segmentation of Instructional
Videos [17.712793578388126]
本稿では,PSS(Process and Summarization)を概観し,現在の手法に対する3つの根本的な改善を提案する。
セグメントの順序を考慮に入れた動的プログラミングに基づく新しいセグメンテーション指標を提案する。
本稿では,セグメントマッピングの時間的順序を制約するマッチングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-30T14:44:19Z) - SOLO: A Simple Framework for Instance Segmentation [84.00519148562606]
インスタンスカテゴリ"は、インスタンスの場所に応じて、インスタンス内の各ピクセルにカテゴリを割り当てる。
SOLO"は、強力なパフォーマンスを備えたインスタンスセグメンテーションのための、シンプルで、直接的で、高速なフレームワークです。
提案手法は, 高速化と精度の両面から, 実例分割の最先端結果を実現する。
論文 参考訳(メタデータ) (2021-06-30T09:56:54Z) - Prototypical Cross-Attention Networks for Multiple Object Tracking and
Segmentation [95.74244714914052]
複数のオブジェクトのトラッキングとセグメンテーションには、与えられたクラスのセットに属するオブジェクトを検出し、追跡し、セグメンテーションする必要がある。
オンライン上でリッチ・テンポラル情報を活用するプロトタイプ・クロス・アテンション・ネットワーク(PCAN)を提案する。
PCANは、Youtube-VISとBDD100Kデータセットで、現在のビデオインスタンス追跡とセグメンテーションコンテストの勝者を上回っている。
論文 参考訳(メタデータ) (2021-06-22T17:57:24Z) - Contextual Guided Segmentation Framework for Semi-supervised Video
Instance Segmentation [20.174393465900156]
ビデオインスタンスのセグメンテーションを3つのパスで行うためのContextual Guided (CGS) フレームワークを提案する。
最初のパス、すなわちプレビューセグメンテーションでは、各インスタンスの主特性を推定するためにインスタンス再識別フローを提案します。
第2のパス、すなわちコンテキストセグメンテーションでは、複数のコンテキストセグメンテーションスキームを導入する。
DAVIS Test-Challengeデータセットを用いて実験を行い,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2021-06-07T04:16:50Z) - Exposing Semantic Segmentation Failures via Maximum Discrepancy
Competition [102.75463782627791]
オープンビジュアルの世界において,既存の意味セグメンテーション手法の失敗を露呈することで,質問に答える。
モデル改ざんに関するこれまでの研究に触発され、任意に大きい画像セットから始まり、2つのセグメンテーション方法間の差分法(MAD)をMAximizingすることによって、小さな画像セットを自動的にサンプリングします。
選択された画像は、2つの方法のいずれか(または両方)を偽造する最大の可能性を持っている。
また,MADコンペティションにおいて,障害の露呈が困難であるセグメンテーション法について検討した。
論文 参考訳(メタデータ) (2021-02-27T16:06:25Z) - A Three-Stage Self-Training Framework for Semi-Supervised Semantic
Segmentation [0.9786690381850356]
本稿では,セマンティックセグメンテーションのための3段階の自己学習フレームワークとして,包括的解を提案する。
本手法の鍵となる考え方は擬似マスク統計情報の抽出である。
次に、一貫性を強制するマルチタスクモデルを用いて擬似マスクの不確実性を減少させる。
論文 参考訳(メタデータ) (2020-12-01T21:00:27Z) - MS-TCN++: Multi-Stage Temporal Convolutional Network for Action
Segmentation [87.16030562892537]
本稿では,時間的行動分割タスクのための多段階アーキテクチャを提案する。
第1段階は、次の段階によって洗練される初期予測を生成する。
我々のモデルは3つのデータセットで最先端の結果を得る。
論文 参考訳(メタデータ) (2020-06-16T14:50:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。