論文の概要: RINDNet: Edge Detection for Discontinuity in Reflectance, Illumination,
Normal and Depth
- arxiv url: http://arxiv.org/abs/2108.00616v1
- Date: Mon, 2 Aug 2021 03:30:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:16:38.692925
- Title: RINDNet: Edge Detection for Discontinuity in Reflectance, Illumination,
Normal and Depth
- Title(参考訳): rindnet: 反射、照明、正常、深さの不連続性のエッジ検出
- Authors: Mengyang Pu, Yaping Huang, Qingji Guan and Haibin Ling
- Abstract要約: 我々は、4種類のエッジを共同で検出する新しいニューラルネットワークソリューション RINDNet を提案する。
RINDNetはそれぞれの表現を効果的に学習し、3段階で動作する。
我々の実験では、RINDNetは最先端の手法と比較して有望な結果が得られる。
- 参考スコア(独自算出の注目度): 70.25160895688464
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a fundamental building block in computer vision, edges can be categorised
into four types according to the discontinuity in surface-Reflectance,
Illumination, surface-Normal or Depth. While great progress has been made in
detecting generic or individual types of edges, it remains under-explored to
comprehensively study all four edge types together. In this paper, we propose a
novel neural network solution, RINDNet, to jointly detect all four types of
edges. Taking into consideration the distinct attributes of each type of edges
and the relationship between them, RINDNet learns effective representations for
each of them and works in three stages. In stage I, RINDNet uses a common
backbone to extract features shared by all edges. Then in stage II it branches
to prepare discriminative features for each edge type by the corresponding
decoder. In stage III, an independent decision head for each type aggregates
the features from previous stages to predict the initial results. Additionally,
an attention module learns attention maps for all types to capture the
underlying relations between them, and these maps are combined with initial
results to generate the final edge detection results. For training and
evaluation, we construct the first public benchmark, BSDS-RIND, with all four
types of edges carefully annotated. In our experiments, RINDNet yields
promising results in comparison with state-of-the-art methods. Additional
analysis is presented in supplementary material.
- Abstract(参考訳): コンピュータビジョンの基本的な構成要素として、エッジは表面反射、照明、表面正常、深さの不連続性に応じて4つのタイプに分類できる。
汎用エッジや個別エッジの検出には大きな進歩があったが、これら4つのエッジタイプを総合的に研究することは未検討のままである。
本稿では,新しいニューラルネットワークソリューション RINDNet を提案し,これら4種類のエッジを共同で検出する。
各エッジの異なる属性とそれらの関係を考慮すると、RINDNetはそれぞれのエッジに対して効果的な表現を学び、3段階で機能する。
ステージIでは、RINDNetは共通のバックボーンを使用して、すべてのエッジで共有される特徴を抽出する。
そして、ステージIIでは、対応するデコーダによって、エッジタイプごとに識別機能を準備するように分岐する。
ステージIIIでは、各タイプの独立決定ヘッドが前のステージの特徴を集約し、初期結果を予測する。
さらに、アテンションモジュールは、すべてのタイプのアテンションマップを学習し、それらの関係をキャプチャし、これらのマップを初期結果と組み合わせて最終的なエッジ検出結果を生成する。
トレーニングと評価のために,4種類のエッジを注意深く注釈付けした最初の公開ベンチマークbsds-rindを構築した。
我々の実験では、RINDNetは最先端の手法と比較して有望な結果が得られる。
追加分析は補足資料で示される。
関連論文リスト
- Self-supervised 3D Point Cloud Completion via Multi-view Adversarial Learning [61.14132533712537]
我々は、オブジェクトレベルとカテゴリ固有の幾何学的類似性の両方を効果的に活用するフレームワークであるMAL-SPCを提案する。
私たちのMAL-SPCは3Dの完全な監視を一切必要とせず、各オブジェクトに1つの部分点クラウドを必要とするだけです。
論文 参考訳(メタデータ) (2024-07-13T06:53:39Z) - SegVG: Transferring Object Bounding Box to Segmentation for Visual Grounding [56.079013202051094]
ボックスレベルのアノテーションを信号として転送する新しい手法であるSegVGを提案する。
このアプローチでは,ボックスレベルのレグレッションとピクセルレベルのセグメンテーションの両方の信号としてアノテーションを反復的に利用することができる。
論文 参考訳(メタデータ) (2024-07-03T15:30:45Z) - ECT: Fine-grained Edge Detection with Learned Cause Tokens [19.271691951077617]
汎用エッジと細粒度エッジを逐次予測する2段階トランスフォーマーネットワークを提案する。
提案手法をBSDS-RINDおよび複数の新たに派生したベンチマーク上で評価し,新たな最先端結果を得た。
論文 参考訳(メタデータ) (2023-08-06T11:37:55Z) - Edge-Aware Mirror Network for Camouflaged Object Detection [5.032585246295627]
エッジ検出と擬似オブジェクトセグメンテーションをモデル化する新しいエッジ対応ミラーネットワーク(EAMNet)を提案する。
EAMNetは2分岐アーキテクチャを持ち、セグメンテーションによるエッジアグリゲーションモジュールとエッジによる完全アグリゲーションモジュールがセグメンテーションブランチとエッジ検出ブランチをクロスガイドするように設計されている。
実験の結果,EAMNetは3つの広く使用されているCODデータセットにおいて,既存の最先端ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2023-07-08T08:14:49Z) - Refined Edge Usage of Graph Neural Networks for Edge Prediction [51.06557652109059]
We propose a novel edge prediction paradigm named Edge-aware Message PassIng neuRal nEtworks (EMPIRE)。
まず,各エッジをトポロジや監督のためにのみ使用するエッジ分割手法を提案する。
監視エッジで接続されたペアと接続されていないペアの差を強調するために、さらにメッセージを重み付けして、その差を反映できる相対的なペアを強調します。
論文 参考訳(メタデータ) (2022-12-25T23:19:56Z) - Dense Extreme Inception Network for Edge Detection [0.0]
エッジ検出は多くのコンピュータビジョンアプリケーションの基礎となっている。
公開されているデータセットのほとんどは、エッジ検出タスクのためにキュレーションされていない。
エッジの新しいデータセットを提示する。
エッジ検出のためのDense Extreme Inception Network (DexiNed) と呼ばれる新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-04T05:38:50Z) - AttrE2vec: Unsupervised Attributed Edge Representation Learning [22.774159996012276]
本稿では,アトリビュートネットワークにおけるエッジの低次元ベクトル表現を学習する新しい非教師付き誘導法AttrE2Vecを提案する。
実験により,現代の手法と比較して,より強力なエッジベクトル表現を構築した。
論文 参考訳(メタデータ) (2020-12-29T12:20:49Z) - PIE-NET: Parametric Inference of Point Cloud Edges [40.27043782820615]
我々は3Dポイントクラウドデータの特徴エッジを堅牢に識別するエンドツーエンドの学習技術を紹介した。
私たちのディープニューラルネットワークは、PIE-NETと呼ばれ、エッジのパラメトリック推論のために訓練されています。
論文 参考訳(メタデータ) (2020-07-09T15:35:10Z) - Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。
これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。
SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文 参考訳(メタデータ) (2020-02-11T14:04:56Z) - Learning multiview 3D point cloud registration [74.39499501822682]
本稿では,エンドツーエンドで学習可能なマルチビュー3Dポイントクラウド登録アルゴリズムを提案する。
このアプローチは、エンドツーエンドのトレーニングが可能で、計算コストが小さく、最先端のマージンよりも優れています。
論文 参考訳(メタデータ) (2020-01-15T03:42:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。