論文の概要: MT-ORL: Multi-Task Occlusion Relationship Learning
- arxiv url: http://arxiv.org/abs/2108.05722v1
- Date: Thu, 12 Aug 2021 13:06:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-13 14:43:06.629871
- Title: MT-ORL: Multi-Task Occlusion Relationship Learning
- Title(参考訳): MT-ORL:マルチタスクオクルージョン関係学習
- Authors: Panhe Feng, Qi She, Lei Zhu, Jiaxin Li, Lin ZHANG, Zijian Feng,
Changhu Wang, Chunpeng Li, Xuejing Kang and Anlong Ming
- Abstract要約: 我々はOcclusion-shared and Path-separated Network (OPNet)と呼ばれる新しいアーキテクチャを提案する。
本手法は, PIOD/BSDSオーナシップデータセット上でのバウンダリーAPの6.1%/8.3%, オリエンテーションAPの6.5%/10%を超越する手法である。
- 参考スコア(独自算出の注目度): 38.21973582100365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrieving occlusion relation among objects in a single image is challenging
due to sparsity of boundaries in image. We observe two key issues in existing
works: firstly, lack of an architecture which can exploit the limited amount of
coupling in the decoder stage between the two subtasks, namely occlusion
boundary extraction and occlusion orientation prediction, and secondly,
improper representation of occlusion orientation. In this paper, we propose a
novel architecture called Occlusion-shared and Path-separated Network (OPNet),
which solves the first issue by exploiting rich occlusion cues in shared
high-level features and structured spatial information in task-specific
low-level features. We then design a simple but effective orthogonal occlusion
representation (OOR) to tackle the second issue. Our method surpasses the
state-of-the-art methods by 6.1%/8.3% Boundary-AP and 6.5%/10% Orientation-AP
on standard PIOD/BSDS ownership datasets. Code is available at
https://github.com/fengpanhe/MT-ORL.
- Abstract(参考訳): 一つの画像における物体間の咬合関係の検索は、画像の境界がずれているため困難である。
まず,2つのサブタスク間のデコーダ段階において,限定的な結合量を利用するアーキテクチャが欠如していること,すなわち,オクルージョン境界抽出とオクルージョン配向予測,および,オクルージョン配向の不適切な表現について考察する。
本稿では,共有された高レベル特徴量と,タスク固有の低レベル特徴量における構造化空間情報を用いて,リッチ・オクルージョン・キューを活用し,第1の課題を解決するオクルージョン・シェアド・パス分離ネットワーク(opnet)と呼ばれる新しいアーキテクチャを提案する。
次に,2つ目の問題に取り組むために,単純だが効果的な直交閉塞表現(OOR)を設計する。
本手法は,標準PIOD/BSDSオーナシップデータセット上でのバウンダリーAPの6.1%/8.3%,オリエンテーションAPの6.5%/10%を超越する手法である。
コードはhttps://github.com/fengpanhe/mt-orlで入手できる。
関連論文リスト
- Embracing Events and Frames with Hierarchical Feature Refinement Network for Object Detection [17.406051477690134]
イベントカメラはスパースと非同期のイベントを出力し、これらの問題を解決する潜在的な解決策を提供する。
イベントフレーム融合のための新しい階層的特徴改善ネットワークを提案する。
本手法は, フレーム画像に15種類の汚損タイプを導入する際に, 極めて優れたロバスト性を示す。
論文 参考訳(メタデータ) (2024-07-17T14:09:46Z) - X-PDNet: Accurate Joint Plane Instance Segmentation and Monocular Depth
Estimation with Cross-Task Distillation and Boundary Correction [9.215384107659665]
X-PDNetは平面インスタンス分割と深さ推定のマルチタスク学習のためのフレームワークである。
我々は、境界回帰損失を増大させるために、基底真理境界を用いることの現在の限界を強調した。
境界領域分割を支援するために深度情報を利用する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-09-15T14:27:54Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Learning to Estimate Hidden Motions with Global Motion Aggregation [71.12650817490318]
閉塞は、局所的な証拠に依存する光学フローアルゴリズムに重大な課題をもたらす。
最初の画像でピクセル間の長距離依存性を見つけるために,グローバルモーションアグリゲーションモジュールを導入する。
遮蔽領域における光流量推定が非遮蔽領域における性能を損なうことなく大幅に改善できることを実証した。
論文 参考訳(メタデータ) (2021-04-06T10:32:03Z) - Deep Occlusion-Aware Instance Segmentation with Overlapping BiLayers [72.38919601150175]
高オーバーラップオブジェクトをセグメント化するBilayer Convolutional Network (BCNet)を提案する。
BCNetはオクルージョンオブジェクト(Occluder)を検出し、ボトムGCN層は部分的にOccludedインスタンス(Occludee)を推論する
論文 参考訳(メタデータ) (2021-03-23T06:25:42Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。