論文の概要: GlassNet: Label Decoupling-based Three-stream Neural Network for Robust
Image Glass Detection
- arxiv url: http://arxiv.org/abs/2108.11117v1
- Date: Wed, 25 Aug 2021 08:33:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-26 13:00:34.286395
- Title: GlassNet: Label Decoupling-based Three-stream Neural Network for Robust
Image Glass Detection
- Title(参考訳): GlassNet:ロバスト画像検出のためのラベルデカップリングに基づく3ストリームニューラルネットワーク
- Authors: C. Zheng, D. Shi, X. Yan, D. Liang, M. wei, X. Yang, Y. Guo, H. Xie
- Abstract要約: 我々はラベルデカップリングを利用してラベル付き接地トラス(GT)マップを内部拡散マップと境界拡散マップに分解する。
新たに生成された2つの地図と協調したGTマップは、オブジェクト境界の不均衡分布を破り、ガラス検出品質が向上する。
マルチモーダル情報を統合するために,アテンションベースの境界認識機能であるMosaicモジュールを開発した。
- 参考スコア(独自算出の注目度): 1.1825946875790057
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most of the existing object detection methods generate poor glass detection
results, due to the fact that the transparent glass shares the same appearance
with arbitrary objects behind it in an image. Different from traditional deep
learning-based wisdoms that simply use the object boundary as auxiliary
supervision, we exploit label decoupling to decompose the original labeled
ground-truth (GT) map into an interior-diffusion map and a boundary-diffusion
map. The GT map in collaboration with the two newly generated maps breaks the
imbalanced distribution of the object boundary, leading to improved glass
detection quality. We have three key contributions to solve the transparent
glass detection problem: (1) We propose a three-stream neural network (call
GlassNet for short) to fully absorb beneficial features in the three maps. (2)
We design a multi-scale interactive dilation module to explore a wider range of
contextual information. (3) We develop an attention-based boundary-aware
feature Mosaic module to integrate multi-modal information. Extensive
experiments on the benchmark dataset exhibit clear improvements of our method
over SOTAs, in terms of both the overall glass detection accuracy and boundary
clearness.
- Abstract(参考訳): 既存の物体検出手法のほとんどは、透明ガラスが画像中の任意の物体と同一の外観を共有するため、ガラス検出結果が不十分である。
従来の深層学習に基づく知恵とは違い,従来のラベル付き接地トラス(GT)マップを内部拡散マップと境界拡散マップに分解するためにラベル分離を利用する。
新たに生成された2つの地図と協調したGTマップは、オブジェクト境界の不均衡分布を破り、ガラス検出品質が向上する。
透明ガラス検出問題の解決には3つの重要な貢献がある: 1) 3つの地図の有用な特徴を完全に吸収する3ストリームニューラルネットワーク(GlassNetを略して呼び出す)を提案する。
2)より広い文脈情報を調べるために,マルチスケールのインタラクティブ拡張モジュールを設計した。
(3) マルチモーダル情報を統合するためのモザイクモジュールを開発した。
ベンチマークデータセットにおける広範囲な実験は, ガラス検出精度と境界クリア性の両方の観点から, sotaよりも明らかに改善されている。
関連論文リスト
- PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Fourier Boundary Features Network with Wider Catchers for Glass Segmentation [12.465008923418406]
反射面と透過ガラスのセグメンテーションを制約する新しい手法を提案する。
提案手法はガラス画像分割における最先端技術 (SOTA) 法と比較して, セグメンテーション性能が向上する。
論文 参考訳(メタデータ) (2024-05-15T15:52:27Z) - Glass Segmentation with Multi Scales and Primary Prediction Guiding [2.66512000865131]
ガラスのような物体は、日々の生活の中でどこにでも見えます。
本稿では,FineRescaling and Merging Module (FRM) から構成されるMGNetを提案する。
高信頼セグメンテーションマップを作成するために,不確実性を考慮した新たな損失関数を用いてモデルを監督する。
論文 参考訳(メタデータ) (2024-02-13T16:14:32Z) - A bioinspired three-stage model for camouflaged object detection [8.11866601771984]
本稿では,1回の繰り返しで粗い部分分割を可能にする3段階モデルを提案する。
本モデルでは, 3つのデコーダを用いて, サブサンプル特徴, 収穫特徴, および高解像度のオリジナル特徴を逐次処理する。
我々のネットワークは、不要な複雑さを伴わずに最先端のCNNベースのネットワークを上回る。
論文 参考訳(メタデータ) (2023-05-22T02:01:48Z) - Unleash the Potential of Image Branch for Cross-modal 3D Object
Detection [67.94357336206136]
画像分岐のポテンシャルを2つの側面から解き放つことを目的として,新しい3Dオブジェクト検出器UPIDetを提案する。
まず、UPIDetは正規化された局所座標写像推定と呼ばれる新しい2次元補助タスクを導入する。
第2に,イメージブランチのトレーニング目標から逆転する勾配によって,ポイントクラウドバックボーンの表現能力を向上できることを見出した。
論文 参考訳(メタデータ) (2023-01-22T08:26:58Z) - Paint and Distill: Boosting 3D Object Detection with Semantic Passing
Network [70.53093934205057]
ライダーやカメラセンサーからの3Dオブジェクト検出タスクは、自動運転に不可欠である。
本研究では,既存のライダーベース3D検出モデルの性能向上を図るために,SPNetという新しいセマンティックパスフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-12T12:35:34Z) - ORA3D: Overlap Region Aware Multi-view 3D Object Detection [11.58746596768273]
現在の多視点3Dオブジェクト検出法は、しばしば重なり合う領域のオブジェクトを適切に検出できない。
本稿では,(1)弱深度スーパービジョンのステレオ異方性推定と(2)適応オーバーラップ領域判別器の2つの主要なモジュールを提案する。
提案手法は,現在の最先端モデル,すなわちDETR3DとBEVDetより優れている。
論文 参考訳(メタデータ) (2022-07-02T15:28:44Z) - The Devil is in the Task: Exploiting Reciprocal Appearance-Localization
Features for Monocular 3D Object Detection [62.1185839286255]
低コストのモノクル3D物体検出は、自律運転において基本的な役割を果たす。
DFR-Netという動的特徴反射ネットワークを導入する。
我々は、KITTIテストセットの全ての単分子3D物体検出器の中で、第1位にランク付けする。
論文 参考訳(メタデータ) (2021-12-28T07:31:18Z) - Enhanced Boundary Learning for Glass-like Object Segmentation [55.45473926510806]
本稿では,拡張境界学習によるガラス状物体分割問題を解くことを目的とする。
特に,より微細な境界キューを生成するための改良された微分モジュールを最初に提案する。
境界に沿った大域的な形状表現をモデル化するために,エッジ対応のグラフ畳み込みネットワークモジュールを提案する。
論文 参考訳(メタデータ) (2021-03-29T16:18:57Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。