論文の概要: Symmetry-Aware Transformer-based Mirror Detection
- arxiv url: http://arxiv.org/abs/2207.06332v1
- Date: Wed, 13 Jul 2022 16:40:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-14 15:02:47.073525
- Title: Symmetry-Aware Transformer-based Mirror Detection
- Title(参考訳): 対称アウェア変圧器を用いたミラー検出
- Authors: Tianyu Huang, Bowen Dong, Jiaying Lin, Xiaohui Liu, Rynson W.H. Lau,
Wangmeng Zuo
- Abstract要約: デュアルパス・シンメトリ・アウェア・トランスフォーマーを用いたミラー検出ネットワーク(SATNet)を提案する。
SATNetにはSymmetry-Aware Attention Module (SAAM)とContrastとFusion Decoder Module (CFDM)の2つの新しいモジュールが含まれている。
実験の結果,SATNet は RGB と RGB-D の両方のミラー検出法に優れることがわかった。
- 参考スコア(独自算出の注目度): 85.47570468668955
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Mirror detection aims to identify the mirror regions in the given input
image. Existing works mainly focus on integrating the semantic features and
structural features to mine the similarity and discontinuity between mirror and
non-mirror regions, or introducing depth information to help analyze the
existence of mirrors. In this work, we observe that a real object typically
forms a loose symmetry relationship with its corresponding reflection in the
mirror, which is beneficial in distinguishing mirrors from real objects. Based
on this observation, we propose a dual-path Symmetry-Aware Transformer-based
mirror detection Network (SATNet), which includes two novel modules:
Symmetry-Aware Attention Module (SAAM) and Contrast and Fusion Decoder Module
(CFDM). Specifically, we first introduce the transformer backbone to model
global information aggregation in images, extracting multi-scale features in
two paths. We then feed the high-level dual-path features to SAAMs to capture
the symmetry relations. Finally, we fuse the dual-path features and refine our
prediction maps progressively with CFDMs to obtain the final mirror mask.
Experimental results show that SATNet outperforms both RGB and RGB-D mirror
detection methods on all available mirror detection datasets.
- Abstract(参考訳): ミラー検出は、入力画像内のミラー領域を識別することを目的としている。
既存の作品は主に、鏡と非鏡領域の類似性と不連続性を掘り起こすために意味的特徴と構造的特徴を統合すること、鏡の存在を分析するのに役立つ深さ情報の導入に重点を置いている。
本研究では、実物体が鏡の中の対応する反射とゆるい対称性の関係を形成するのが一般的であり、これは実物体と鏡を区別するのに有用である。
そこで本研究では,Symmetry-Aware Attention Module (SAAM) と Contrast と Fusion Decoder Module (CFDM) の2つの新しいモジュールを含む,デュアルパスのSymmetry-Aware Transformer-based mirror detection Network (SATNet) を提案する。
具体的には、まずトランスフォーマーバックボーンを導入し、画像におけるグローバル情報集約をモデル化し、2つのパスでマルチスケールな特徴を抽出する。
次に、高レベルなデュアルパス特徴をSAAMに供給し、対称性の関係を捉える。
最後に、デュアルパス機能を融合し、cfdmsと漸進的に予測マップを洗練し、最終的なミラーマスクを得る。
実験の結果,SATNet は RGB と RGB-D の両方のミラー検出手法より優れていることがわかった。
関連論文リスト
- Reflecting Reality: Enabling Diffusion Models to Produce Faithful Mirror Reflections [26.02117310176884]
拡散型生成モデルを用いて、高現実的で可視なミラー反射を生成する問題に取り組む。
これを可能にするために、鏡の前にオブジェクトが置かれた多様な合成シーンの大規模なデータセットであるSynMirrorを作成します。
本研究では,高品質な幾何整合性およびフォトリアリスティックミラー反射を生成するミラーフュージョン法を提案する。
論文 参考訳(メタデータ) (2024-09-23T02:59:07Z) - SBDet: A Symmetry-Breaking Object Detector via Relaxed Rotation-Equivariance [26.05910177212846]
Group Equivariant Convolution(GConv)は、モデルに視覚データに隠された対称性を探索させ、パフォーマンスを向上させる。
従来のGConv法は群空間の厳密な操作規則によって制限されており、対称性・ブレーキングや非剛体変換への適応が困難である。
本稿では,Relaxed Rotation-Equivariant Network(R2Net)をバックボーンとして提案し,その上に構築された2次元オブジェクト検出のためのSBDet(Symmetry-Breaking Object Detector)を開発した。
論文 参考訳(メタデータ) (2024-08-21T16:32:03Z) - MirrorGaussian: Reflecting 3D Gaussians for Reconstructing Mirror Reflections [58.003014868772254]
MirrorGaussian は 3D Gaussian Splatting に基づくリアルタイムレンダリングによるミラーシーン再構築手法である。
本稿では,現実の3Dガウスと鏡面の両面の微分を可能にする直感的なデュアルレンダリング戦略を提案する。
我々の手法は既存の手法よりも優れており、最先端の結果が得られている。
論文 参考訳(メタデータ) (2024-05-20T09:58:03Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Efficient Mirror Detection via Multi-level Heterogeneous Learning [39.091162729266294]
HetNetは高効率なミラー検出ネットワークである。
HetNetは、ミラーを検出するために異なる段階で特定の情報を取得する効果的なアーキテクチャに従う。
最先端の手法と比較して、HetNetは664$%より高速に動作し、MAEでは8.9$%、IoUでは3.1$%、F測定では2.0$%という平均的なパフォーマンス向上を示している。
論文 参考訳(メタデータ) (2022-11-28T18:51:11Z) - PSNet: Parallel Symmetric Network for Video Salient Object Detection [85.94443548452729]
我々は,PSNet という名前のアップ・ダウン・パラレル対称性を持つ VSOD ネットワークを提案する。
2つの並列ブランチが、ビデオの完全サリエンシ復号化を実現するために設定されている。
論文 参考訳(メタデータ) (2022-10-12T04:11:48Z) - Reflection and Rotation Symmetry Detection via Equivariant Learning [40.61825212385055]
我々は、EquiSymと呼ばれる対称性検出のためのグループ同変畳み込みネットワークを導入する。
DENse と Diverse symmetric (DENDI) という新しいデータセットを提案し、既存の反射・回転対称性検出のためのベンチマークの制限を緩和する。
実験により,LDRSおよびDENDIデータセットの対称性検出において,本手法が芸術の状態を達成できることが確認された。
論文 参考訳(メタデータ) (2022-03-31T04:18:33Z) - Mirror-Yolo: A Novel Attention Focus, Instance Segmentation and Mirror Detection Model [6.048747739825864]
YOLOv4は物体検出精度と速度の点で驚くべき結果を得るが、それでもミラーの検出には失敗する。
本稿では,ミラー検出を対象とするミラー・ヨロを提案する。
論文 参考訳(メタデータ) (2022-02-17T08:03:48Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z) - Two-Stage Single Image Reflection Removal with Reflection-Aware Guidance [78.34235841168031]
シングルイメージリフレクション除去(SIRR)のためのリフレクション・アウェア・ガイダンス(RAGNet)を用いた新しい2段階ネットワークを提案する。
RAGは、(i)観測からの反射の効果を緩和するために、(ii)線形結合仮説から逸脱する効果を緩和するための部分畳み込みにおいてマスクを生成するために用いられる。
5つの一般的なデータセットの実験は、最先端のSIRR法と比較して、RAGNetの量的および質的な優位性を実証している。
論文 参考訳(メタデータ) (2020-12-02T03:14:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。