論文の概要: Symmetry-Aware Transformer-based Mirror Detection
- arxiv url: http://arxiv.org/abs/2207.06332v1
- Date: Wed, 13 Jul 2022 16:40:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-14 15:02:47.073525
- Title: Symmetry-Aware Transformer-based Mirror Detection
- Title(参考訳): 対称アウェア変圧器を用いたミラー検出
- Authors: Tianyu Huang, Bowen Dong, Jiaying Lin, Xiaohui Liu, Rynson W.H. Lau,
Wangmeng Zuo
- Abstract要約: デュアルパス・シンメトリ・アウェア・トランスフォーマーを用いたミラー検出ネットワーク(SATNet)を提案する。
SATNetにはSymmetry-Aware Attention Module (SAAM)とContrastとFusion Decoder Module (CFDM)の2つの新しいモジュールが含まれている。
実験の結果,SATNet は RGB と RGB-D の両方のミラー検出法に優れることがわかった。
- 参考スコア(独自算出の注目度): 85.47570468668955
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Mirror detection aims to identify the mirror regions in the given input
image. Existing works mainly focus on integrating the semantic features and
structural features to mine the similarity and discontinuity between mirror and
non-mirror regions, or introducing depth information to help analyze the
existence of mirrors. In this work, we observe that a real object typically
forms a loose symmetry relationship with its corresponding reflection in the
mirror, which is beneficial in distinguishing mirrors from real objects. Based
on this observation, we propose a dual-path Symmetry-Aware Transformer-based
mirror detection Network (SATNet), which includes two novel modules:
Symmetry-Aware Attention Module (SAAM) and Contrast and Fusion Decoder Module
(CFDM). Specifically, we first introduce the transformer backbone to model
global information aggregation in images, extracting multi-scale features in
two paths. We then feed the high-level dual-path features to SAAMs to capture
the symmetry relations. Finally, we fuse the dual-path features and refine our
prediction maps progressively with CFDMs to obtain the final mirror mask.
Experimental results show that SATNet outperforms both RGB and RGB-D mirror
detection methods on all available mirror detection datasets.
- Abstract(参考訳): ミラー検出は、入力画像内のミラー領域を識別することを目的としている。
既存の作品は主に、鏡と非鏡領域の類似性と不連続性を掘り起こすために意味的特徴と構造的特徴を統合すること、鏡の存在を分析するのに役立つ深さ情報の導入に重点を置いている。
本研究では、実物体が鏡の中の対応する反射とゆるい対称性の関係を形成するのが一般的であり、これは実物体と鏡を区別するのに有用である。
そこで本研究では,Symmetry-Aware Attention Module (SAAM) と Contrast と Fusion Decoder Module (CFDM) の2つの新しいモジュールを含む,デュアルパスのSymmetry-Aware Transformer-based mirror detection Network (SATNet) を提案する。
具体的には、まずトランスフォーマーバックボーンを導入し、画像におけるグローバル情報集約をモデル化し、2つのパスでマルチスケールな特徴を抽出する。
次に、高レベルなデュアルパス特徴をSAAMに供給し、対称性の関係を捉える。
最後に、デュアルパス機能を融合し、cfdmsと漸進的に予測マップを洗練し、最終的なミラーマスクを得る。
実験の結果,SATNet は RGB と RGB-D の両方のミラー検出手法より優れていることがわかった。
関連論文リスト
- Meta-learning the mirror map in policy mirror descent [13.724491757145385]
Policy Mirror Descent (PMD) は強化学習の一般的なフレームワークである。
メタラーニング手法を適用することにより、より効率的なミラーマップを同定し、性能を向上させる。
その結果,ミラーマップは様々な環境に適応できる可能性が示唆された。
論文 参考訳(メタデータ) (2024-02-07T19:01:06Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Efficient Mirror Detection via Multi-level Heterogeneous Learning [39.091162729266294]
HetNetは高効率なミラー検出ネットワークである。
HetNetは、ミラーを検出するために異なる段階で特定の情報を取得する効果的なアーキテクチャに従う。
最先端の手法と比較して、HetNetは664$%より高速に動作し、MAEでは8.9$%、IoUでは3.1$%、F測定では2.0$%という平均的なパフォーマンス向上を示している。
論文 参考訳(メタデータ) (2022-11-28T18:51:11Z) - PSNet: Parallel Symmetric Network for Video Salient Object Detection [85.94443548452729]
我々は,PSNet という名前のアップ・ダウン・パラレル対称性を持つ VSOD ネットワークを提案する。
2つの並列ブランチが、ビデオの完全サリエンシ復号化を実現するために設定されている。
論文 参考訳(メタデータ) (2022-10-12T04:11:48Z) - Reflection and Rotation Symmetry Detection via Equivariant Learning [40.61825212385055]
我々は、EquiSymと呼ばれる対称性検出のためのグループ同変畳み込みネットワークを導入する。
DENse と Diverse symmetric (DENDI) という新しいデータセットを提案し、既存の反射・回転対称性検出のためのベンチマークの制限を緩和する。
実験により,LDRSおよびDENDIデータセットの対称性検出において,本手法が芸術の状態を達成できることが確認された。
論文 参考訳(メタデータ) (2022-03-31T04:18:33Z) - Mirror-Yolo: An attention-based instance segmentation and detection
model for mirrors [7.26389301409471]
YOLOv4は、物体検出精度と速度の両方で驚くべき結果が得られる。
ミラーヨーロはミラー検出を中心に提案されている。
論文 参考訳(メタデータ) (2022-02-17T08:03:48Z) - Transformer-based Network for RGB-D Saliency Detection [82.6665619584628]
RGB-Dサリエンシ検出の鍵は、2つのモードにわたる複数のスケールで情報を完全なマイニングとヒューズすることである。
コンバータは機能融合と機能拡張の両面において高い有効性を示す一様操作であることを示す。
提案するネットワークは,最先端のRGB-D値検出手法に対して良好に動作する。
論文 参考訳(メタデータ) (2021-12-01T15:53:58Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z) - Two-Stage Single Image Reflection Removal with Reflection-Aware Guidance [78.34235841168031]
シングルイメージリフレクション除去(SIRR)のためのリフレクション・アウェア・ガイダンス(RAGNet)を用いた新しい2段階ネットワークを提案する。
RAGは、(i)観測からの反射の効果を緩和するために、(ii)線形結合仮説から逸脱する効果を緩和するための部分畳み込みにおいてマスクを生成するために用いられる。
5つの一般的なデータセットの実験は、最先端のSIRR法と比較して、RAGNetの量的および質的な優位性を実証している。
論文 参考訳(メタデータ) (2020-12-02T03:14:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。