論文の概要: C$^{4}$Net: Contextual Compression and Complementary Combination Network
for Salient Object Detection
- arxiv url: http://arxiv.org/abs/2110.11887v1
- Date: Fri, 22 Oct 2021 16:14:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-25 15:36:16.571493
- Title: C$^{4}$Net: Contextual Compression and Complementary Combination Network
for Salient Object Detection
- Title(参考訳): C$^{4}$Net:Salient Object Detectionのためのコンテキスト圧縮と補完結合ネットワーク
- Authors: Hazarapet Tunanyan
- Abstract要約: 機能結合は、乗算や加算のような他の組み合わせ方法よりもうまく機能することを示す。
また、共同特徴学習は、処理中の情報共有のため、より良い結果をもたらす。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning solutions of the salient object detection problem have achieved
great results in recent years. The majority of these models are based on
encoders and decoders, with a different multi-feature combination. In this
paper, we show that feature concatenation works better than other combination
methods like multiplication or addition. Also, joint feature learning gives
better results, because of the information sharing during their processing. We
designed a Complementary Extraction Module (CEM) to extract necessary features
with edge preservation. Our proposed Excessiveness Loss (EL) function helps to
reduce false-positive predictions and purifies the edges with other weighted
loss functions. Our designed Pyramid-Semantic Module (PSM) with Global guiding
flow (G) makes the prediction more accurate by providing high-level
complementary information to shallower layers. Experimental results show that
the proposed model outperforms the state-of-the-art methods on all benchmark
datasets under three evaluation metrics.
- Abstract(参考訳): 健全な物体検出問題のディープラーニングソリューションは,近年,大きな成果を上げている。
これらのモデルの大部分はエンコーダとデコーダに基づいており、異なるマルチ機能の組み合わせがある。
本稿では,乗法や加算法といった他の組み合わせ法よりも特徴連結が有効であることを示す。
また、共同機能学習は、処理中の情報共有により、よりよい結果をもたらす。
エッジ保存で必要な特徴を抽出するための補完抽出モジュール(CEM)を設計した。
提案する過剰損失(el)関数は偽陽性の予測を減少させ,他の重み付き損失関数でエッジを純化する。
我々の設計したGlobal guiding Flow(G)を用いたピラミッド・セマンティック・モジュール(PSM)は,より浅い層に高レベルな補完情報を提供することにより,予測をより正確にする。
実験結果から,提案モデルでは,3つの評価基準の下で,すべてのベンチマークデータセット上で最先端の手法よりも優れた結果が得られた。
関連論文リスト
- RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。
CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文 参考訳(メタデータ) (2023-06-01T12:53:10Z) - Triplet Loss-less Center Loss Sampling Strategies in Facial Expression
Recognition Scenarios [5.672538282456803]
ディープ・ニューラルネットワーク(DNN)とディープ・メトリック・ラーニング(DML)技術は、モデルInFERアプリケーションの識別能力を高める。
我々は, 完全合成, 半合成, 予測に基づく負のサンプル選択戦略の3つの戦略を開発した。
より優れた結果を得るために、画素ワイドと素子ワイドのアテンション係数の組み合わせを提供する選択的アテンションモジュールを導入する。
論文 参考訳(メタデータ) (2023-02-08T15:03:36Z) - ScoreMix: A Scalable Augmentation Strategy for Training GANs with
Limited Data [93.06336507035486]
GAN(Generative Adversarial Networks)は通常、限られたトレーニングデータが利用できる場合、過度に適合する。
ScoreMixは、様々な画像合成タスクのための、新しくスケーラブルなデータ拡張手法である。
論文 参考訳(メタデータ) (2022-10-27T02:55:15Z) - Deep Reinforcement Learning of Graph Matching [63.469961545293756]
ノードとペアの制約下でのグラフマッチング(GM)は、最適化からコンピュータビジョンまでの領域におけるビルディングブロックである。
GMのための強化学習ソルバを提案する。
rgmはペアワイズグラフ間のノード対応を求める。
本手法は,フロントエンドの特徴抽出と親和性関数学習に焦点をあてるという意味において,従来のディープグラフマッチングモデルと異なる。
論文 参考訳(メタデータ) (2020-12-16T13:48:48Z) - MAGNeto: An Efficient Deep Learning Method for the Extractive Tags
Summarization Problem [0.0]
抽出タグ要約(ETS)と呼ばれる新しい画像アノテーションタスクについて検討する。
ゴールは、画像とその対応するタグに横たわるコンテキストから重要なタグを抽出することである。
提案手法は,畳み込み層や自己注意層など,広く使用されているブロックで構成されている。
論文 参考訳(メタデータ) (2020-11-09T11:34:21Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Hierarchical Dynamic Filtering Network for RGB-D Salient Object
Detection [91.43066633305662]
RGB-D Salient Object Detection (SOD) の主な目的は、相互融合情報をよりよく統合し活用する方法である。
本稿では,これらの問題を新たな視点から考察する。
我々は、より柔軟で効率的なマルチスケールのクロスモーダルな特徴処理を実装している。
論文 参考訳(メタデータ) (2020-07-13T07:59:55Z) - Multi-Person Pose Estimation with Enhanced Feature Aggregation and
Selection [33.15192824888279]
複数人物のポーズ推定のためのEFASNet(Enhanced Feature Aggregation and Selection Network)を提案する。
我々の手法は、混み合った、散らばった、ぎこちないシーンをうまく扱える。
総合的な実験により、提案手法は最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-03-20T08:33:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。