論文の概要: End-to-End Instance Edge Detection
- arxiv url: http://arxiv.org/abs/2204.02898v1
- Date: Wed, 6 Apr 2022 15:32:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-07 14:00:50.282840
- Title: End-to-End Instance Edge Detection
- Title(参考訳): 終端端エッジ検出
- Authors: Xueyan Zou, Haotian Liu, Yong Jae Lee
- Abstract要約: エッジ検出は長い間、コンピュータビジョンの分野で重要な問題であった。
従来の研究は、カテゴリ非依存またはカテゴリ対応エッジ検出を探索してきた。
本稿では,オブジェクトインスタンスのコンテキストにおけるエッジ検出について検討する。
- 参考スコア(独自算出の注目度): 29.650295133113183
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge detection has long been an important problem in the field of computer
vision. Previous works have explored category-agnostic or category-aware edge
detection. In this paper, we explore edge detection in the context of object
instances. Although object boundaries could be easily derived from segmentation
masks, in practice, instance segmentation models are trained to maximize IoU to
the ground-truth mask, which means that segmentation boundaries are not
enforced to precisely align with ground-truth edge boundaries. Thus, the task
of instance edge detection itself is different and critical. Since precise edge
detection requires high resolution feature maps, we design a novel transformer
architecture that efficiently combines a FPN and a transformer decoder to
enable cross attention on multi-scale high resolution feature maps within a
reasonable computation budget. Further, we propose a light weight dense
prediction head that is applicable to both instance edge and mask detection.
Finally, we use a penalty reduced focal loss to effectively train the model
with point supervision on instance edges, which can reduce annotation costs. We
demonstrate highly competitive instance edge detection performance compared to
state-of-the-art baselines, and also show that the proposed task and loss are
complementary to instance segmentation and object detection.
- Abstract(参考訳): エッジ検出は長い間、コンピュータビジョンの分野で重要な問題であった。
従来の研究は、カテゴリ非依存またはカテゴリ対応エッジ検出を探索してきた。
本稿では,オブジェクトインスタンスのコンテキストにおけるエッジ検出について検討する。
物体の境界はセグメンテーションマスクから容易に導出できるが、実際には、インスタンスセグメンテーションモデルは、IoUを接地トラスマスクに最大化するために訓練されており、つまり、接地トラスエッジ境界と正確に整合するようにセグメンテーション境界を強制しないことを意味する。
したがって、インスタンスエッジ検出自体のタスクは異なり、クリティカルである。
高精度エッジ検出には高分解能特徴写像が必要であるため,FPNと変圧器デコーダを効率よく組み合わせた新しいトランスフォーマーアーキテクチャを設計し,マルチスケール高分解能特徴写像を合理的な計算予算内で実現している。
さらに,インスタンスエッジとマスク検出の両方に適用可能な軽量高密度予測ヘッドを提案する。
最後に、ペナルティを低減した焦点損失を用いて、インスタンスエッジの点監督でモデルを効果的に訓練し、アノテーションコストを削減できる。
最先端のベースラインと比較して,高い競合性を有するインスタンスエッジ検出性能を示すとともに,提案するタスクと損失がインスタンス分割とオブジェクト検出に相補的であることを示す。
関連論文リスト
- Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Edge-Aware Mirror Network for Camouflaged Object Detection [5.032585246295627]
エッジ検出と擬似オブジェクトセグメンテーションをモデル化する新しいエッジ対応ミラーネットワーク(EAMNet)を提案する。
EAMNetは2分岐アーキテクチャを持ち、セグメンテーションによるエッジアグリゲーションモジュールとエッジによる完全アグリゲーションモジュールがセグメンテーションブランチとエッジ検出ブランチをクロスガイドするように設計されている。
実験の結果,EAMNetは3つの広く使用されているCODデータセットにおいて,既存の最先端ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2023-07-08T08:14:49Z) - Linear Object Detection in Document Images using Multiple Object
Tracking [58.720142291102135]
線形オブジェクトは文書構造に関する実質的な情報を伝達する。
多くのアプローチはベクトル表現を復元できるが、1994年に導入された1つのクローズドソース技術のみである。
複数オブジェクト追跡を用いた文書画像中の線形オブジェクトの正確なインスタンスセグメンテーションのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-26T14:22:03Z) - Scribble-based Boundary-aware Network for Weakly Supervised Salient
Object Detection in Remote Sensing Images [10.628932392896374]
スパース・スクリブル・アノテーションからリモートセンシング画像の正当性を予測するために,弱教師付きサルエント・オブジェクト検出フレームワークを提案する。
具体的には,高信頼度オブジェクト境界 (擬似) ラベルによって明示的に制御されるオブジェクト境界意味論を探索する境界対応モジュール (BAM) を設計する。
次に,境界セマンティクスを高次特徴と統合し,スクリブルラベルの監督下での健全な物体検出を誘導する。
論文 参考訳(メタデータ) (2022-02-07T20:32:21Z) - Decoupled Adaptation for Cross-Domain Object Detection [69.5852335091519]
クロスドメインオブジェクト検出は、オブジェクト分類よりも難しい。
D-adaptは4つのクロスドメインオブジェクト検出タスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2021-10-06T08:43:59Z) - Reference-based Defect Detection Network [57.89399576743665]
最初の問題はテクスチャシフトであり、これはトレーニングされた欠陥検出モデルが目に見えないテクスチャの影響を受けやすいことを意味する。
第2の問題は部分的な視覚的混乱であり、部分的な欠陥ボックスが完全なボックスと視覚的に類似していることを示している。
本稿では,これら2つの問題に対処する参照型欠陥検出ネットワーク(RDDN)を提案する。
論文 参考訳(メタデータ) (2021-08-10T05:44:23Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Refined Plane Segmentation for Cuboid-Shaped Objects by Leveraging Edge
Detection [63.942632088208505]
本稿では,セグメント化された平面マスクを画像に検出されたエッジと整列するための後処理アルゴリズムを提案する。
これにより、立方体形状の物体に制限を加えながら、最先端のアプローチの精度を高めることができます。
論文 参考訳(メタデータ) (2020-03-28T18:51:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。