論文の概要: LevelSet R-CNN: A Deep Variational Method for Instance Segmentation
- arxiv url: http://arxiv.org/abs/2007.15629v1
- Date: Thu, 30 Jul 2020 17:52:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-05 14:23:58.549531
- Title: LevelSet R-CNN: A Deep Variational Method for Instance Segmentation
- Title(参考訳): LevelSet R-CNN: インスタンスセグメンテーションのための深部変分法
- Authors: Namdar Homayounfar, Yuwen Xiong, Justin Liang, Wei-Chiu Ma, Raquel
Urtasun
- Abstract要約: 現在、多くのアートモデルはMask R-CNNフレームワークに基づいている。
本稿では,両世界の長所を結合したR-CNNを提案する。
我々はCOCOおよびCityscapesデータセットに対するアプローチの有効性を示す。
- 参考スコア(独自算出の注目度): 79.20048372891935
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Obtaining precise instance segmentation masks is of high importance in many
modern applications such as robotic manipulation and autonomous driving.
Currently, many state of the art models are based on the Mask R-CNN framework
which, while very powerful, outputs masks at low resolutions which could result
in imprecise boundaries. On the other hand, classic variational methods for
segmentation impose desirable global and local data and geometry constraints on
the masks by optimizing an energy functional. While mathematically elegant,
their direct dependence on good initialization, non-robust image cues and
manual setting of hyperparameters renders them unsuitable for modern
applications. We propose LevelSet R-CNN, which combines the best of both worlds
by obtaining powerful feature representations that are combined in an
end-to-end manner with a variational segmentation framework. We demonstrate the
effectiveness of our approach on COCO and Cityscapes datasets.
- Abstract(参考訳): 精密なインスタンスセグメンテーションマスクの取得は、ロボット操作や自動運転など、現代の多くの応用において非常に重要である。
現在、多くの最先端技術モデルはMask R-CNNフレームワークに基づいており、これは非常に強力であるが、低解像度でマスクを出力し、不正確な境界をもたらす可能性がある。
一方,従来の分節法では,エネルギー汎関数を最適化することにより,大域的・局所的なデータや幾何的制約をマスクに課している。
数学的にはエレガントだが、良い初期化への直接的な依存、ロバストでない画像の手がかり、ハイパーパラメータの手動設定は、現代の用途には適さない。
本稿では,両世界の最善を両立させるレベルセットr-cnnを提案する。
我々はCOCOおよびCityscapesデータセットに対するアプローチの有効性を示す。
関連論文リスト
- Towards Compact 3D Representations via Point Feature Enhancement Masked
Autoencoders [52.66195794216989]
本稿では,コンパクトな3D表現を学習するために,ポイント特徴強調マスク付きオートエンコーダ(Point-FEMAE)を提案する。
Point-FEMAEはグローバルブランチとローカルブランチで構成され、潜在意味的特徴をキャプチャする。
本手法は, クロスモーダル方式と比較して, 事前学習効率を著しく向上させる。
論文 参考訳(メタデータ) (2023-12-17T14:17:05Z) - HAISTA-NET: Human Assisted Instance Segmentation Through Attention [3.073046540587735]
より正確な予測を可能にし,高品質なセグメンテーションマスクを生成する新しい手法を提案する。
我々の人間支援セグメンテーションモデルHAISTA-NETは、既存のStrong Mask R-CNNネットワークを拡張し、人間の特定部分境界を組み込む。
HAISTA-NETは,Mask R-CNN,Strong Mask R-CNN,Mask2Formerなどの最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-05-04T18:39:14Z) - DynaMask: Dynamic Mask Selection for Instance Segmentation [21.50329070835023]
我々は,各インスタンスに最適なマスク解像度を選択するために,計算コストを無視できるマスクスイッチモジュール(MSM)を開発した。
提案手法,すなわちDynaMaskは,高い計算オーバーヘッドで,他の最先端技術よりも一貫した,顕著なパフォーマンス向上を実現する。
論文 参考訳(メタデータ) (2023-03-14T13:01:25Z) - Exploiting Shape Cues for Weakly Supervised Semantic Segmentation [15.791415215216029]
弱教師付きセマンティックセマンティックセグメンテーション (WSSS) は、画像レベルのラベルのみをトレーニング用として、画素単位のクラス予測を生成することを目的としている。
畳み込みニューラルネットワーク(CNN)のテクスチャバイアス特性を補うために形状情報を活用することを提案する。
我々は、クラスと色親和性の両方を考慮した新しい改良手法により、オンライン方式で予測をさらに洗練する。
論文 参考訳(メタデータ) (2022-08-08T17:25:31Z) - MaskRange: A Mask-classification Model for Range-view based LiDAR
Segmentation [34.04740351544143]
本研究では,範囲ビューに基づくLiDARセマンティクスとパノプティックセグメンテーションのためのマスク分類モデルMaskRangeを提案する。
我々のMaskRangeは、セマンティックセグメンテーションにおける6.10ドルmIoUの最先端性能と、高い効率でパノプティクスセグメンテーションにおける53.10ドルPQの有望な結果を達成する。
論文 参考訳(メタデータ) (2022-06-24T04:39:49Z) - SODAR: Segmenting Objects by DynamicallyAggregating Neighboring Mask
Representations [90.8752454643737]
最近の最先端のワンステージインスタンスセグメンテーションモデルSOLOは、入力画像をグリッドに分割し、完全な畳み込みネットワークを備えたグリッドセルオブジェクトマスクを直接予測する。
我々は,SOLOが近傍の格子セルの物体に対して類似したマスクを生成するのを観察する。
観測されたギャップによってモチベーションを得た学習ベースのアグリゲーション手法を開発し,そのリッチな隣り合う情報を活用してSOLOを改善する。
論文 参考訳(メタデータ) (2022-02-15T13:53:03Z) - RICE: Refining Instance Masks in Cluttered Environments with Graph
Neural Networks [53.15260967235835]
本稿では,インスタンスマスクのグラフベース表現を利用して,そのような手法の出力を改良する新しいフレームワークを提案する。
我々は、セグメンテーションにスマートな摂動をサンプリングできるディープネットワークと、オブジェクト間の関係をエンコード可能なグラフニューラルネットワークを訓練し、セグメンテーションを評価する。
本稿では,本手法によって生成された不確実性推定を用いてマニピュレータを誘導し,乱れたシーンを効率的に理解するアプリケーションについて紹介する。
論文 参考訳(メタデータ) (2021-06-29T20:29:29Z) - The Devil is in the Boundary: Exploiting Boundary Representation for
Basis-based Instance Segmentation [85.153426159438]
本研究では,既存のグローバルマスクベースの手法を補完するグローバル境界表現を学習するために,Basisベースのインスタンス(B2Inst)を提案する。
私たちのB2Instは一貫した改善をもたらし、シーン内のインスタンス境界を正確に解析します。
論文 参考訳(メタデータ) (2020-11-26T11:26:06Z) - Effective Unsupervised Domain Adaptation with Adversarially Trained
Language Models [54.569004548170824]
注意的なマスキング戦略は、マスキングされた言語モデルの知識ギャップを橋渡しできることを示す。
本稿では,これらのトークンを逆さまにマスキングすることで効果的なトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2020-10-05T01:49:47Z) - Deep Convolutional Neural Networks with Spatial Regularization, Volume
and Star-shape Priori for Image Segmentation [6.282154392910916]
CNNの既存のネットワークアーキテクチャにおける分類機能は単純であり、重要な空間情報を扱う能力に欠ける。
我々は,多くの空間的先行情報をDCNNに簡単に統合できる,新しいソフト・スレッショルド・ダイナミクス(STD)フレームワークを提案する。
提案手法は一般的な数学的枠組みであり,どの意味的セグメンテーションDCNNにも適用可能である。
論文 参考訳(メタデータ) (2020-02-10T18:03:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。