論文の概要: LevelSet R-CNN: A Deep Variational Method for Instance Segmentation
- arxiv url: http://arxiv.org/abs/2007.15629v1
- Date: Thu, 30 Jul 2020 17:52:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-05 14:23:58.549531
- Title: LevelSet R-CNN: A Deep Variational Method for Instance Segmentation
- Title(参考訳): LevelSet R-CNN: インスタンスセグメンテーションのための深部変分法
- Authors: Namdar Homayounfar, Yuwen Xiong, Justin Liang, Wei-Chiu Ma, Raquel
Urtasun
- Abstract要約: 現在、多くのアートモデルはMask R-CNNフレームワークに基づいている。
本稿では,両世界の長所を結合したR-CNNを提案する。
我々はCOCOおよびCityscapesデータセットに対するアプローチの有効性を示す。
- 参考スコア(独自算出の注目度): 79.20048372891935
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Obtaining precise instance segmentation masks is of high importance in many
modern applications such as robotic manipulation and autonomous driving.
Currently, many state of the art models are based on the Mask R-CNN framework
which, while very powerful, outputs masks at low resolutions which could result
in imprecise boundaries. On the other hand, classic variational methods for
segmentation impose desirable global and local data and geometry constraints on
the masks by optimizing an energy functional. While mathematically elegant,
their direct dependence on good initialization, non-robust image cues and
manual setting of hyperparameters renders them unsuitable for modern
applications. We propose LevelSet R-CNN, which combines the best of both worlds
by obtaining powerful feature representations that are combined in an
end-to-end manner with a variational segmentation framework. We demonstrate the
effectiveness of our approach on COCO and Cityscapes datasets.
- Abstract(参考訳): 精密なインスタンスセグメンテーションマスクの取得は、ロボット操作や自動運転など、現代の多くの応用において非常に重要である。
現在、多くの最先端技術モデルはMask R-CNNフレームワークに基づいており、これは非常に強力であるが、低解像度でマスクを出力し、不正確な境界をもたらす可能性がある。
一方,従来の分節法では,エネルギー汎関数を最適化することにより,大域的・局所的なデータや幾何的制約をマスクに課している。
数学的にはエレガントだが、良い初期化への直接的な依存、ロバストでない画像の手がかり、ハイパーパラメータの手動設定は、現代の用途には適さない。
本稿では,両世界の最善を両立させるレベルセットr-cnnを提案する。
我々はCOCOおよびCityscapesデータセットに対するアプローチの有効性を示す。
関連論文リスト
- Segmenting objects with Bayesian fusion of active contour models and convnet priors [0.729597981661727]
本稿では,自然資源モニタリング(NRM)画像を対象とした新しい事例分割手法を提案する。
我々は、個々の物体の輪郭を学習する際に、形状、位置、位置の先行を組み込むベイズ最大値後部推論として問題を定式化する。
実験では、個々の枯木樹冠と正確な輪郭を分割する、挑戦的で現実的な問題に取り組む。
論文 参考訳(メタデータ) (2024-10-09T20:36:43Z) - Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - MaskUno: Switch-Split Block For Enhancing Instance Segmentation [0.0]
マスク予測を洗練されたROIを処理し、それらを分類し、特定のマスク予測者に割り当てるスイッチスプリットブロックに置き換えることを提案する。
平均平均精度(mAP)が2.03%上昇し,80クラスにおいて高い成績を示した。
論文 参考訳(メタデータ) (2024-07-31T10:12:14Z) - ColorMAE: Exploring data-independent masking strategies in Masked AutoEncoders [53.3185750528969]
Masked AutoEncoders (MAE)は、堅牢な自己管理フレームワークとして登場した。
データに依存しないColorMAEという手法を導入し、ランダムノイズをフィルタすることで異なる二元マスクパターンを生成する。
ランダムマスキングと比較して,下流タスクにおける戦略の優位性を示す。
論文 参考訳(メタデータ) (2024-07-17T22:04:00Z) - Towards Compact 3D Representations via Point Feature Enhancement Masked
Autoencoders [52.66195794216989]
本稿では,コンパクトな3D表現を学習するために,ポイント特徴強調マスク付きオートエンコーダ(Point-FEMAE)を提案する。
Point-FEMAEはグローバルブランチとローカルブランチで構成され、潜在意味的特徴をキャプチャする。
本手法は, クロスモーダル方式と比較して, 事前学習効率を著しく向上させる。
論文 参考訳(メタデータ) (2023-12-17T14:17:05Z) - HAISTA-NET: Human Assisted Instance Segmentation Through Attention [3.073046540587735]
より正確な予測を可能にし,高品質なセグメンテーションマスクを生成する新しい手法を提案する。
我々の人間支援セグメンテーションモデルHAISTA-NETは、既存のStrong Mask R-CNNネットワークを拡張し、人間の特定部分境界を組み込む。
HAISTA-NETは,Mask R-CNN,Strong Mask R-CNN,Mask2Formerなどの最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-05-04T18:39:14Z) - Exploiting Shape Cues for Weakly Supervised Semantic Segmentation [15.791415215216029]
弱教師付きセマンティックセマンティックセグメンテーション (WSSS) は、画像レベルのラベルのみをトレーニング用として、画素単位のクラス予測を生成することを目的としている。
畳み込みニューラルネットワーク(CNN)のテクスチャバイアス特性を補うために形状情報を活用することを提案する。
我々は、クラスと色親和性の両方を考慮した新しい改良手法により、オンライン方式で予測をさらに洗練する。
論文 参考訳(メタデータ) (2022-08-08T17:25:31Z) - MaskRange: A Mask-classification Model for Range-view based LiDAR
Segmentation [34.04740351544143]
本研究では,範囲ビューに基づくLiDARセマンティクスとパノプティックセグメンテーションのためのマスク分類モデルMaskRangeを提案する。
我々のMaskRangeは、セマンティックセグメンテーションにおける6.10ドルmIoUの最先端性能と、高い効率でパノプティクスセグメンテーションにおける53.10ドルPQの有望な結果を達成する。
論文 参考訳(メタデータ) (2022-06-24T04:39:49Z) - SODAR: Segmenting Objects by DynamicallyAggregating Neighboring Mask
Representations [90.8752454643737]
最近の最先端のワンステージインスタンスセグメンテーションモデルSOLOは、入力画像をグリッドに分割し、完全な畳み込みネットワークを備えたグリッドセルオブジェクトマスクを直接予測する。
我々は,SOLOが近傍の格子セルの物体に対して類似したマスクを生成するのを観察する。
観測されたギャップによってモチベーションを得た学習ベースのアグリゲーション手法を開発し,そのリッチな隣り合う情報を活用してSOLOを改善する。
論文 参考訳(メタデータ) (2022-02-15T13:53:03Z) - The Devil is in the Boundary: Exploiting Boundary Representation for
Basis-based Instance Segmentation [85.153426159438]
本研究では,既存のグローバルマスクベースの手法を補完するグローバル境界表現を学習するために,Basisベースのインスタンス(B2Inst)を提案する。
私たちのB2Instは一貫した改善をもたらし、シーン内のインスタンス境界を正確に解析します。
論文 参考訳(メタデータ) (2020-11-26T11:26:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。