Fugu-MT 論文翻訳(概要): LC3Net: Ladder context correlation complementary network for salient object detection

論文の概要: LC3Net: Ladder context correlation complementary network for salient object detection

arxiv url: http://arxiv.org/abs/2110.10869v1
Date: Thu, 21 Oct 2021 03:12:32 GMT
ステータス: 翻訳完了
システム内更新日: 2021-10-22 17:14:44.348404
Title: LC3Net: Ladder context correlation complementary network for salient object detection
Title（参考訳）: LC3Net:有意物体検出のためのラダーコンテキスト相関補完ネットワーク
Authors: Xian Fang and Jinchao Zhu and Xiuli Shao and Hongpeng Wang
Abstract要約: 我々は,新しいラグコンテキスト相関補完ネットワーク (LC3Net) を提案する。 FCBはフィルタリング可能な畳み込みブロックであり、初期特徴の多様性に関する情報の自動収集を支援する。 DCMは、異なるレベルの特徴の密集を促進するための密接なクロスモジュールである。 BCDは双方向圧縮デコーダであり、マルチスケール機能の段階的縮小を支援する。
参考スコア（独自算出の注目度）: 0.32116198597240836
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Currently, existing salient object detection methods based on convolutional neural networks commonly resort to constructing discriminative networks to aggregate high level and low level features. However, contextual information is always not fully and reasonably utilized, which usually causes either the absence of useful features or contamination of redundant features. To address these issues, we propose a novel ladder context correlation complementary network (LC3Net) in this paper, which is equipped with three crucial components. At the beginning, we propose a filterable convolution block (FCB) to assist the automatic collection of information on the diversity of initial features, and it is simple yet practical. Besides, we propose a dense cross module (DCM) to facilitate the intimate aggregation of different levels of features by validly integrating semantic information and detailed information of both adjacent and non-adjacent layers. Furthermore, we propose a bidirectional compression decoder (BCD) to help the progressive shrinkage of multi-scale features from coarse to fine by leveraging multiple pairs of alternating top-down and bottom-up feature interaction flows. Extensive experiments demonstrate the superiority of our method against 16 state-of-the-art methods.
Abstract（参考訳）: 現在,畳み込みニューラルネットワークに基づく有能な物体検出手法では,高次・低次特徴を集約する識別ネットワークの構築が一般的である。しかし、コンテキスト情報は必ずしも完全かつ合理的に利用されないため、通常、有用な特徴の欠如や冗長な特徴の汚染を引き起こす。これらの課題に対処するために,3つの重要なコンポーネントを備えた新しいラダーコンテキスト相関補完ネットワーク (LC3Net) を提案する。まず,初期特徴の多様性に関する情報の自動収集を支援するため,フィルタ可能な畳み込みブロック(FCB)を提案する。さらに,隣接層と非隣接層の両方のセマンティック情報と詳細情報を有効に統合することにより,特徴量の密集化を容易にする密接なクロスモジュール(DCM)を提案する。さらに,複数対の交代型トップダウンおよびボトムアップ機能間相互作用フローを活用することで,マルチスケール特徴の粗大化から微細化の進行的縮小を支援する双方向圧縮デコーダ(BCD)を提案する。大規模実験により16種類の最先端手法に対する本手法の優位性を実証した。

関連論文リスト

LLHA-Net: A Hierarchical Attention Network for Two-View Correspondence Learning [33.76961965760301]
本稿では階層型アテンションネットワーク(Layer-by-Layer Hierarchical Attention Network)という新しい手法を提案する。コンピュータビジョンにおける特徴点マッチングの精度を向上させる。本手法は, ステージ融合, 階層抽出, ネットワークの表現能力向上のためのアテンション機構を含む。
論文参考訳（メタデータ） (2025-12-31T04:25:53Z)
TransBridge: Boost 3D Object Detection by Scene-Level Completion with Transformer Decoder [66.22997415145467]
本稿では,スパース領域における検出機能を改善する共同補完・検出フレームワークを提案する。具体的には,トランスブリッジ(TransBridge)を提案する。トランスブリッジ(TransBridge)はトランスフォーマーをベースとした新しいアップサンプリングブロックである。その結果,本フレームワークは,各手法の平均精度(mAP)が0.7から1.5の範囲で,エンドツーエンドの3Dオブジェクト検出を一貫して改善していることがわかった。
論文参考訳（メタデータ） (2025-12-12T00:08:03Z)
Prototype-Based Information Compensation Network for Multi-Source Remote Sensing Data Classification [56.065032039986725]
マルチソースリモートセンシングデータ共同分類は、土地被覆分類の精度と信頼性を提供することを目的としている。既存の手法では、周波数間マルチソース特徴結合と相補的な情報探索の不整合という2つの課題に直面している。 HSIとSAR/LiDARデータに基づく土地被覆分類のためのプロトタイプベース情報補償ネットワーク(PICNet)を提案する。
論文参考訳（メタデータ） (2025-05-06T22:30:23Z)
Dynamic Cross-Modal Feature Interaction Network for Hyperspectral and LiDAR Data Classification [66.59320112015556]
ハイパースペクトル画像(HSI)とLiDARデータ共同分類は難しい課題である。 DCMNet(Dynamic Cross-Modal Feature Interaction Network)を提案する。 BSAB(Bilinear Spatial Attention Block)、BCAB(Bilinear Channel Attention Block)、ICB(Integration Convolutional Block)の3つの機能相互作用ブロックを導入している。
論文参考訳（メタデータ） (2025-03-10T05:50:13Z)
PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。 PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。 PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文参考訳（メタデータ） (2024-08-26T19:43:01Z)
A Semantic-Aware and Multi-Guided Network for Infrared-Visible Image Fusion [41.34335755315773]
マルチモダリティ画像融合は、2つのソース画像から特定のモダリティ情報と共有モダリティ情報を融合することを目的としている。本稿では,3分岐エンコーダデコーダアーキテクチャと,それに対応する融合層を融合戦略として提案する。可視・近赤外画像融合および医用画像融合タスクにおける最先端手法と比較して,本手法は競争力のある結果を得た。
論文参考訳（メタデータ） (2024-06-11T09:32:40Z)
TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文参考訳（メタデータ） (2022-02-28T11:12:16Z)
DFC: Deep Feature Consistency for Robust Point Cloud Registration [0.4724825031148411]
複雑なアライメントシーンのための学習に基づくアライメントネットワークを提案する。我々は,3DMatchデータセットとKITTIオドメトリデータセットに対するアプローチを検証する。
論文参考訳（メタデータ） (2021-11-15T08:27:21Z)
Specificity-preserving RGB-D Saliency Detection [103.3722116992476]
本稿では,RGB-Dサリエンシ検出のための特異性保存ネットワーク(SP-Net)を提案する。 2つのモダリティ特化ネットワークと共有学習ネットワークを採用し、個別および共有唾液マップを生成する。 6つのベンチマークデータセットの実験では、SP-Netは他の最先端の手法よりも優れています。
論文参考訳（メタデータ） (2021-08-18T14:14:22Z)
Modal-Adaptive Gated Recoding Network for RGB-D Salient Object Detection [2.9153096940947796]
本稿では,2つのモードの情報の有効性を評価するために,GRNet(GRNet)を提案する。知覚エンコーダを用いてマルチレベル単一モード特徴を抽出する。無効な情報を抑制し、有効なモーダル特徴を復号ミキサとハイブリッド分岐復号器に転送するために、モーダル適応ゲートユニットを提案する。
論文参考訳（メタデータ） (2021-08-13T15:08:21Z)
PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文参考訳（メタデータ） (2020-12-18T18:06:43Z)
Hierarchical Bi-Directional Feature Perception Network for Person Re-Identification [12.259747100939078]
過去の人物再同定(Re-ID)モデルは、画像の最も識別性の高い領域に焦点を当てることを目的としている。本稿では,階層型双方向特徴知覚ネットワーク (HBFP-Net) という新しいモデルを提案する。 Market-1501, CUHK03, DukeMTMC-ReIDデータセットなどの主要な評価実験により, 提案手法が最近のSOTA Re-IDモデルより優れていることが示された。
論文参考訳（メタデータ） (2020-08-08T12:33:32Z)
Suppress and Balance: A Simple Gated Network for Salient Object Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文参考訳（メタデータ） (2020-07-16T02:00:53Z)
Global Context-Aware Progressive Aggregation Network for Salient Object Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2020-03-02T04:26:10Z)
Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文参考訳（メタデータ） (2020-02-25T14:06:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。