論文の概要: DCANet: Dense Context-Aware Network for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2104.02533v1
- Date: Tue, 6 Apr 2021 14:12:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 14:03:33.303523
- Title: DCANet: Dense Context-Aware Network for Semantic Segmentation
- Title(参考訳): DCANet:セマンティックセグメンテーションのためのDense Context-Aware Network
- Authors: Yifu Liu, Chenfeng Xu and Xinyu Jin
- Abstract要約: ローカル詳細情報をグローバルな依存関係と適応的に統合する新しいモジュールであるContext-Aware (DCA) モジュールを提案する。
コンテキスト関係によって駆動されるDCAモジュールは、コンテキスト情報の集約により、より強力な機能を生成することができる。
3つの挑戦的なデータセットに関する広範な実験により、私たちのアプローチの有望なパフォーマンスを実証しています。
- 参考スコア(独自算出の注目度): 4.960604671885823
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As the superiority of context information gradually manifests in advanced
semantic segmentation, learning to capture the compact context relationship can
help to understand the complex scenes. In contrast to some previous works
utilizing the multi-scale context fusion, we propose a novel module, named
Dense Context-Aware (DCA) module, to adaptively integrate local detail
information with global dependencies. Driven by the contextual relationship,
the DCA module can better achieve the aggregation of context information to
generate more powerful features. Furthermore, we deliberately design two
extended structures based on the DCA modules to further capture the long-range
contextual dependency information. By combining the DCA modules in cascade or
parallel, our networks use a progressive strategy to improve multi-scale
feature representations for robust segmentation. We empirically demonstrate the
promising performance of our approach (DCANet) with extensive experiments on
three challenging datasets, including PASCAL VOC 2012, Cityscapes, and ADE20K.
- Abstract(参考訳): 文脈情報の優位性は、高度なセマンティックセグメンテーションにおいて徐々に現れ、コンパクトなコンテキスト関係を捉える学習は、複雑な場面を理解するのに役立つ。
マルチスケール・コンテキスト・フュージョンを利用したいくつかの先行研究とは対照的に,dcaモジュールという新しいモジュールを提案し,局所的詳細情報をグローバル依存と適応的に統合する。
コンテキスト関係によって駆動されるDCAモジュールは、コンテキスト情報の集約により、より強力な機能を生成することができる。
さらに,dcaモジュールに基づく2つの拡張構造を故意に設計し,さらに長期の文脈依存情報を捉えた。
DCAモジュールをカスケードまたは並列に組み合わせることで、ネットワークはプログレッシブ戦略を用いて、堅牢なセグメンテーションのためのマルチスケール特徴表現を改善する。
PASCAL VOC 2012、Cityscapes、ADE20Kを含む3つの挑戦的データセットに対する広範な実験により、我々のアプローチ(DCANet)の有望なパフォーマンスを実証的に実証した。
関連論文リスト
- Cross-domain Multi-modal Few-shot Object Detection via Rich Text [21.36633828492347]
クロスモーダルな特徴抽出と統合は、数ショットの学習タスクで安定したパフォーマンス改善をもたらした。
MM-OD (CDMM-FSOD) のクロスドメイン数ショット一般化について検討し,メタラーニングに基づく多モード数ショット検出手法を提案する。
論文 参考訳(メタデータ) (2024-03-24T15:10:22Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - Context-Aware Interaction Network for RGB-T Semantic Segmentation [12.91377211747192]
RGB-Tセマンティックセグメンテーションは自律走行シーン理解の鍵となる手法である。
補助的なタスクとグローバルなコンテキストを活用するためのコンテキスト認識インタラクションネットワーク(CAINet)を提案する。
提案したCAINetは、ベンチマークデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-01-03T08:49:29Z) - Context-Enhanced Detector For Building Detection From Remote Sensing Images [41.3238458718635]
コンテキスト強化検出器(CEDet)と呼ばれる新しい手法を提案する。
提案手法では,3段階のカスケード構造を用いてコンテキスト情報の抽出を強化し,建物検出精度を向上させる。
提案手法は,CNBuilding-9P,CNBuilding-23P,SpaceNetを含む3つのビルディング検出ベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-11T16:33:30Z) - Multi-Grained Multimodal Interaction Network for Entity Linking [65.30260033700338]
マルチモーダルエンティティリンクタスクは、マルチモーダル知識グラフへの曖昧な言及を解決することを目的としている。
MELタスクを解決するための新しいMulti-Grained Multimodal InteraCtion Network $textbf(MIMIC)$ frameworkを提案する。
論文 参考訳(メタデータ) (2023-07-19T02:11:19Z) - RefSAM: Efficiently Adapting Segmenting Anything Model for Referring Video Object Segmentation [53.4319652364256]
本稿では,ビデオオブジェクトのセグメンテーションを参照するためのSAMの可能性を探るRefSAMモデルを提案する。
提案手法は,Cross-RValModalを用いることで,モダリティ学習を向上させるためにオリジナルのSAMモデルに適応する。
我々は、言語と視覚の特徴を効果的に調整し、融合させるために、パラメータ効率のチューニング戦略を採用している。
論文 参考訳(メタデータ) (2023-07-03T13:21:58Z) - Support-set based Multi-modal Representation Enhancement for Video
Captioning [121.70886789958799]
サンプル間で共有されるセマンティックサブ空間において、リッチな情報をマイニングするためのサポートセットベースのマルチモーダル表現拡張(SMRE)モデルを提案する。
具体的には、サンプル間の基礎となる関係を学習し、意味的関連視覚要素を得るためのサポートセットを構築するためのサポートセット構築(SC)モジュールを提案する。
本研究では,SST(Semantic Space Transformation)モジュールを設計し,相対距離を制約し,マルチモーダルインタラクションを自己管理的に管理する。
論文 参考訳(メタデータ) (2022-05-19T03:40:29Z) - CTNet: Context-based Tandem Network for Semantic Segmentation [77.4337867789772]
本研究では,空間コンテキスト情報とチャネルコンテキスト情報とを対話的に探索し,新しいコンテキストベースタンデムネットワーク(CTNet)を提案する。
セマンティックセグメンテーションのための学習表現の性能をさらに向上するため、2つのコンテキストモジュールの結果を適応的に統合する。
論文 参考訳(メタデータ) (2021-04-20T07:33:11Z) - Referring Image Segmentation via Cross-Modal Progressive Comprehension [94.70482302324704]
画像セグメンテーションの参照は、自然言語表現で与えられた記述によく一致するエンティティの前景マスクをセグメンテーションすることを目的としている。
従来のアプローチでは、暗黙的な特徴相互作用と視覚的モダリティと言語的モダリティの融合を用いてこの問題に対処していた。
本稿では,この課題に効果的に対応するために,Cross-Modal Progressive (CMPC) モジュールと Text-Guided Feature Exchange (TGFE) モジュールを提案する。
論文 参考訳(メタデータ) (2020-10-01T16:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。