論文の概要: Weight mechanism: adding a constant in concatenation of series connect
- arxiv url: http://arxiv.org/abs/2003.03500v2
- Date: Wed, 18 Nov 2020 13:47:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-25 19:48:53.062396
- Title: Weight mechanism: adding a constant in concatenation of series connect
- Title(参考訳): 重みのメカニズム:直列接続の連結における定数の追加
- Authors: Xiaojie Qi
- Abstract要約: 直列接続の連結における特徴写像間のギャップを低減するために,重み機構という手法を提案する。
具体的には、ウェイトメカニズムをテストするためにFused U-Netという新しいアーキテクチャを設計し、0.12% mIoUの改善ももたらした。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is a consensus that feature maps in the shallow layer are more related to
image attributes such as texture and shape, whereas abstract semantic
representation exists in the deep layer. Meanwhile, some image information will
be lost in the process of the convolution operation. Naturally, the direct
method is combining them together to gain lost detailed information through
concatenation or adding. In fact, the image representation flowed in feature
fusion can not match with the semantic representation completely, and the
semantic deviation in different layers also destroy the information
purification, that leads to useless information being mixed into the fusion
layers. Therefore, it is crucial to narrow the gap among the fused layers and
reduce the impact of noises during fusion. In this paper, we propose a method
named weight mechanism to reduce the gap between feature maps in concatenation
of series connection, and we get a better result of 0.80% mIoU improvement on
Massachusetts building dataset by changing the weight of the concatenation of
series connection in residual U-Net. Specifically, we design a new architecture
named fused U-Net to test weight mechanism, and it also gains 0.12% mIoU
improvement.
- Abstract(参考訳): 浅い層における特徴マップはテクスチャや形状のような画像属性とより関連があるのに対し、抽象的な意味表現は深い層に存在するというコンセンサスである。
一方、畳み込み操作の過程でいくつかの画像情報が失われる。
自然に、直接的に組み合わせて、結合や付加によって失われた詳細な情報を得る。
実際、機能融合で流れる画像表現は意味的表現と完全には一致せず、異なる層における意味的偏差も情報の浄化を損なうため、無用な情報が融合層に混在する。
したがって, 融合層間のギャップを狭め, 融合時の騒音の影響を低減することが重要である。
本稿では,級数接続の連結における特徴写像間のギャップを低減するためのウェイト機構を提案し,残りのU-Netにおける級数接続の連結の重みを変更することにより,マサチューセッツの建築データセットに対して0.80% mIoUの改善が得られた。
具体的には、ウェイトメカニズムをテストするためにFused U-Netという新しいアーキテクチャを設計し、0.12% mIoUの改善ももたらした。
関連論文リスト
- Fusion from Decomposition: A Self-Supervised Approach for Image Fusion and Beyond [74.96466744512992]
画像融合の本質は、ソース画像からの相補的な情報を統合することである。
DeFusion++は、画像融合の品質を高め、下流の高レベル視覚タスクの有効性を高める、汎用的な融合表現を生成する。
論文 参考訳(メタデータ) (2024-10-16T06:28:49Z) - Mutual-Guided Dynamic Network for Image Fusion [51.615598671899335]
画像融合のための新しい相互誘導動的ネットワーク(MGDN)を提案する。
5つのベンチマークデータセットによる実験結果から,提案手法は4つの画像融合タスクにおいて既存手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-24T03:50:37Z) - A Task-guided, Implicitly-searched and Meta-initialized Deep Model for
Image Fusion [69.10255211811007]
本稿では,課題の多い現実シナリオにおいて,画像融合問題に対処するためのタスク誘導,インプリシト検索,メタ一般化(TIM)深層モデルを提案する。
具体的には、画像融合の教師なし学習プロセスを導くために、下流タスクからの情報を組み込む制約付き戦略を提案する。
このフレームワーク内に暗黙の探索スキームを設計し、高速な融合モデルのためのコンパクトなアーキテクチャを自動で発見する。
論文 参考訳(メタデータ) (2023-05-25T08:54:08Z) - A Mountain-Shaped Single-Stage Network for Accurate Image Restoration [9.431709365739462]
画像復元においては、通常、空間的詳細と文脈情報の複雑なバランスを維持する必要がある。
不要な非線形活性化関数を除去または置換する,単純なU-Netアーキテクチャに基づく単一ステージ設計ベースを提案する。
我々のアプローチはM3SNetと呼ばれ、従来の最先端モデルよりも性能が優れており、計算コストの半分以下である。
論文 参考訳(メタデータ) (2023-05-09T03:18:35Z) - LRRNet: A Novel Representation Learning Guided Fusion Network for
Infrared and Visible Images [98.36300655482196]
我々は,融合タスクを数学的に定式化し,その最適解とそれを実装可能なネットワークアーキテクチャとの接続を確立する。
特に、融合タスクに学習可能な表現アプローチを採用し、融合ネットワークアーキテクチャの構築は学習可能なモデルを生成する最適化アルゴリズムによって導かれる。
この新しいネットワークアーキテクチャに基づいて、赤外線および可視光画像を融合するために、エンドツーエンドの軽量核融合ネットワークを構築する。
論文 参考訳(メタデータ) (2023-04-11T12:11:23Z) - CoCoNet: Coupled Contrastive Learning Network with Multi-level Feature
Ensemble for Multi-modality Image Fusion [72.8898811120795]
我々は、赤外線と可視画像の融合を実現するために、CoCoNetと呼ばれるコントラスト学習ネットワークを提案する。
本手法は,主観的評価と客観的評価の両面において,最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-11-20T12:02:07Z) - Integrative Feature and Cost Aggregation with Transformers for Dense
Correspondence [63.868905184847954]
現在の最先端はTransformerベースのアプローチで、機能記述子やコストボリュームアグリゲーションに重点を置いている。
本稿では,両形態のアグリゲーションを相互にインターリーブするトランスフォーマーネットワークを提案する。
提案手法が密マッチングタスクに与える影響を評価し,全ての主要なベンチマークで最先端性能を実現する。
論文 参考訳(メタデータ) (2022-09-19T03:33:35Z) - Semantic Image Fusion [2.4366811507669124]
本稿では,事前学習したCNNネットワークアーキテクチャを用いた視覚コンテンツの意味結合システムを提案する。
単純な "choose maximum" と "local majority" のフィルタベースの融合ルールは、特徴マップの融合に使用される。
開発手法は,最先端技術に同等の低レベル核融合性能を与えることができる。
論文 参考訳(メタデータ) (2021-10-13T13:15:16Z) - Image deblurring based on lightweight multi-information fusion network [6.848061582669787]
画像デブロアリングのための軽量多情報融合ネットワーク(LMFN)を提案する。
符号化段階では、画像特徴は、マルチスケール情報抽出および融合のための様々な小規模空間に還元される。
その後、デコード段階で蒸留ネットワークが使用され、ネットワークは残留学習から最も利益を得ます。
私たちのネットワークは、少ないパラメータで最新の画像破壊結果を達成し、モデルの複雑さで既存の方法を上回ることができます。
論文 参考訳(メタデータ) (2021-01-14T00:37:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。