論文の概要: Efficient Mirror Detection via Multi-level Heterogeneous Learning
- arxiv url: http://arxiv.org/abs/2211.15644v1
- Date: Mon, 28 Nov 2022 18:51:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 19:08:11.764198
- Title: Efficient Mirror Detection via Multi-level Heterogeneous Learning
- Title(参考訳): 多レベル不均質学習による効率的なミラー検出
- Authors: Ruozhen He and Jiaying Lin and Rynson W.H. Lau
- Abstract要約: HetNetは高効率なミラー検出ネットワークである。
HetNetは、ミラーを検出するために異なる段階で特定の情報を取得する効果的なアーキテクチャに従う。
最先端の手法と比較して、HetNetは664$%より高速に動作し、MAEでは8.9$%、IoUでは3.1$%、F測定では2.0$%という平均的なパフォーマンス向上を示している。
- 参考スコア(独自算出の注目度): 39.091162729266294
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present HetNet (Multi-level \textbf{Het}erogeneous \textbf{Net}work), a
highly efficient mirror detection network. Current mirror detection methods
focus more on performance than efficiency, limiting the real-time applications
(such as drones). Their lack of efficiency is aroused by the common design of
adopting homogeneous modules at different levels, which ignores the difference
between different levels of features. In contrast, HetNet detects potential
mirror regions initially through low-level understandings (\textit{e.g.},
intensity contrasts) and then combines with high-level understandings
(contextual discontinuity for instance) to finalize the predictions. To perform
accurate yet efficient mirror detection, HetNet follows an effective
architecture that obtains specific information at different stages to detect
mirrors. We further propose a multi-orientation intensity-based contrasted
module (MIC) and a reflection semantic logical module (RSL), equipped on
HetNet, to predict potential mirror regions by low-level understandings and
analyze semantic logic in scenarios by high-level understandings, respectively.
Compared to the state-of-the-art method, HetNet runs 664$\%$ faster and draws
an average performance gain of 8.9$\%$ on MAE, 3.1$\%$ on IoU, and 2.0$\%$ on
F-measure on two mirror detection benchmarks.
- Abstract(参考訳): 超効率的なミラー検出ネットワークであるhetnet (multi-level \textbf{het}erogeneous \textbf{net}work) を提案する。
現在のミラー検出手法は効率よりも性能に重点を置いており、リアルタイムアプリケーション(ドローンなど)を制限する。
それらの効率性の欠如は、異なるレベルの同質な加群を採用するという共通の設計によって引き起こされる。
対照的に、hetnetはまず低レベルの理解(例えば、強度コントラスト)を通じて潜在的なミラー領域を検出し、その後高レベルの理解(例えば、コンテキストの不連続)と組み合わせて予測を確定する。
正確かつ効率的なミラー検出を行うため、hetnetは鏡を検出するために異なる段階で特定の情報を取得する効果的なアーキテクチャに従う。
さらに,HetNetをベースとしたマルチオリエンテーション強度に基づくコントラスト付きモジュール (MIC) とリフレクションセマンティック論理モジュール (RSL) を提案し,低レベルの理解によるミラー領域の予測と,高レベルの理解によるシナリオにおけるセマンティックロジックの解析を行う。
最先端の手法と比較すると、hetnetは664$\%$高速で動作し、maeでは8.9$\%$、iouでは3.1$%$、ミラー検出ベンチマークでは2つのf-measureで2.0$$%$である。
関連論文リスト
- M$^3$Net: Multilevel, Mixed and Multistage Attention Network for Salient
Object Detection [22.60675416709486]
M$3$Netは、Salient Object Detectionのためのアテンションネットワークである。
マルチレベル特徴間の相互作用を実現するためのクロスアテンションアプローチ。
Mixed Attention Blockは、グローバルレベルとローカルレベルの両方でコンテキストをモデリングすることを目的としている。
集約された特徴をステージごとに最適化するためのマルチレベル監視戦略。
論文 参考訳(メタデータ) (2023-09-15T12:46:14Z) - Salient Object Detection in Optical Remote Sensing Images Driven by
Transformer [69.22039680783124]
光リモートセンシング画像(ORSI-SOD)のためのGlobal extract Local Exploration Network(GeleNet)を提案する。
具体的には、GeleNetはまずトランスフォーマーバックボーンを採用し、グローバルな長距離依存関係を持つ4レベルの機能埋め込みを生成する。
3つの公開データセットに関する大規模な実験は、提案されたGeleNetが関連する最先端メソッドより優れていることを示している。
論文 参考訳(メタデータ) (2023-09-15T07:14:43Z) - Boosting the Efficiency of Parametric Detection with Hierarchical Neural
Networks [4.1410005218338695]
高速検出のための新しい手法として階層型検出ネットワーク(HDN)を提案する。
ネットワークは、統計的精度と効率の目標を同時に符号化する新しい損失関数を用いて訓練される。
2層モデルを用いた3層HDNのトレーニングにより,精度と効率が向上することを示す。
論文 参考訳(メタデータ) (2022-07-23T19:23:00Z) - Symmetry-Aware Transformer-based Mirror Detection [85.47570468668955]
デュアルパス・シンメトリ・アウェア・トランスフォーマーを用いたミラー検出ネットワーク(SATNet)を提案する。
SATNetにはSymmetry-Aware Attention Module (SAAM)とContrastとFusion Decoder Module (CFDM)の2つの新しいモジュールが含まれている。
実験の結果,SATNet は RGB と RGB-D の両方のミラー検出法に優れることがわかった。
論文 参考訳(メタデータ) (2022-07-13T16:40:01Z) - Mirror-Yolo: A Novel Attention Focus, Instance Segmentation and Mirror Detection Model [6.048747739825864]
YOLOv4は物体検出精度と速度の点で驚くべき結果を得るが、それでもミラーの検出には失敗する。
本稿では,ミラー検出を対象とするミラー・ヨロを提案する。
論文 参考訳(メタデータ) (2022-02-17T08:03:48Z) - AttaNet: Attention-Augmented Network for Fast and Accurate Scene Parsing [12.409365458889082]
AttaNet(Attention-Augmented Network)と呼ばれる新しいモデルを提案し、グローバルコンテキストとマルチレベルセマンティクスの両方をキャプチャする。
AttaNet は Strip Attention Module (SAM) と Attention Fusion Module (AFM) の2つの主要なモジュールで構成されている。
論文 参考訳(メタデータ) (2021-03-10T08:38:29Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Hierarchical Dynamic Filtering Network for RGB-D Salient Object
Detection [91.43066633305662]
RGB-D Salient Object Detection (SOD) の主な目的は、相互融合情報をよりよく統合し活用する方法である。
本稿では,これらの問題を新たな視点から考察する。
我々は、より柔軟で効率的なマルチスケールのクロスモーダルな特徴処理を実装している。
論文 参考訳(メタデータ) (2020-07-13T07:59:55Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。