論文の概要: Magnifier: A Multi-grained Neural Network-based Architecture for Burned Area Delineation
- arxiv url: http://arxiv.org/abs/2504.19589v1
- Date: Mon, 28 Apr 2025 08:51:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.365579
- Title: Magnifier: A Multi-grained Neural Network-based Architecture for Burned Area Delineation
- Title(参考訳): Magnifier: バーンドエリアのディライン化のためのマルチグラデーションニューラルネットワークベースのアーキテクチャ
- Authors: Daniele Rege Cambrin, Luca Colomba, Paolo Garza,
- Abstract要約: 危機管理とリモートセンシングでは、イメージセグメンテーションが重要な役割を担い、災害対応や緊急計画といったタスクを可能にする。
同社の開発における問題は、データ不足と広範なベンチマークデータセットの欠如であり、大規模なニューラルネットワークモデルをトレーニングする能力を制限している。
本稿では,データ可用性を制限したセグメンテーション性能向上のための新しい手法,Magnifierを提案する。
- 参考スコア(独自算出の注目度): 4.833815605196964
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In crisis management and remote sensing, image segmentation plays a crucial role, enabling tasks like disaster response and emergency planning by analyzing visual data. Neural networks are able to analyze satellite acquisitions and determine which areas were affected by a catastrophic event. The problem in their development in this context is the data scarcity and the lack of extensive benchmark datasets, limiting the capabilities of training large neural network models. In this paper, we propose a novel methodology, namely Magnifier, to improve segmentation performance with limited data availability. The Magnifier methodology is applicable to any existing encoder-decoder architecture, as it extends a model by merging information at different contextual levels through a dual-encoder approach: a local and global encoder. Magnifier analyzes the input data twice using the dual-encoder approach. In particular, the local and global encoders extract information from the same input at different granularities. This allows Magnifier to extract more information than the other approaches given the same set of input images. Magnifier improves the quality of the results of +2.65% on average IoU while leading to a restrained increase in terms of the number of trainable parameters compared to the original model. We evaluated our proposed approach with state-of-the-art burned area segmentation models, demonstrating, on average, comparable or better performances in less than half of the GFLOPs.
- Abstract(参考訳): 危機管理とリモートセンシングでは、画像セグメンテーションが重要な役割を担い、視覚データを分析して災害対応や緊急計画などのタスクを可能にする。
ニューラルネットワークは、衛星の取得を分析し、破滅的な出来事によって影響を受ける領域を決定することができる。
この文脈での彼らの開発における問題は、データ不足と広範なベンチマークデータセットの欠如であり、大規模なニューラルネットワークモデルをトレーニングする能力を制限することである。
本稿では,データ可用性を制限したセグメンテーション性能向上のための新しい手法であるMagnifierを提案する。
Magnifierの手法は既存のエンコーダ・デコーダアーキテクチャにも適用でき、ローカル・グローバル・エンコーダという2つのエンコーダアプローチを通じて異なるコンテキストレベルで情報をマージすることでモデルを拡張している。
Magnifierはデュアルエンコーダアプローチを用いて入力データを2回解析する。
特に、ローカルおよびグローバルエンコーダは、異なる粒度で同じ入力から情報を抽出する。
これにより、Magnifierは入力画像の同じセットが与えられた他のアプローチよりも多くの情報を抽出できる。
マグニファーは、平均的なIoUで+2.65%の結果の質を改善し、オリジナルのモデルと比較してトレーニング可能なパラメータの数が制限された。
提案手法を最先端の焼成領域分割モデルを用いて評価し,GFLOPの半数未満において,平均的,同等あるいはより良い性能を示す。
関連論文リスト
- Rethinking the Nested U-Net Approach: Enhancing Biomarker Segmentation with Attention Mechanisms and Multiscale Feature Fusion [2.0799865428691393]
マルチスケール・フィーチャー・フュージョンとアテンション・メカニズムを通じて、ローカルとグローバルの両方のコンテキストをキャプチャするネストされたUNetアーキテクチャを導入する。
この設計では、エンコーダからの機能統合を改善し、キーチャネルとリージョンを強調し、空間の詳細を復元してセグメンテーション性能を向上させる。
論文 参考訳(メタデータ) (2025-04-08T15:53:46Z) - Localized Gaussians as Self-Attention Weights for Point Clouds Correspondence [92.07601770031236]
本稿では,エンコーダのみのトランスフォーマーアーキテクチャのアテンションヘッドにおける意味的意味パターンについて検討する。
注意重みの修正はトレーニングプロセスの促進だけでなく,最適化の安定性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-09-20T07:41:47Z) - Multi-view Aggregation Network for Dichotomous Image Segmentation [76.75904424539543]
Dichotomous Image (DIS) は近年,高解像度自然画像からの高精度物体分割に向けて出現している。
既存の手法は、グローバルなローカライゼーションと局所的な洗練を徐々に完了させるために、退屈な複数のエンコーダ・デコーダストリームとステージに依存している。
これに触発されて、我々は多視点オブジェクト認識問題としてdisをモデル化し、擬似多視点アグリゲーションネットワーク(MVANet)を提供する。
一般的なdis-5Kデータセットの実験では、我々のMVANetは精度と速度の両方で最先端の手法を大きく上回っている。
論文 参考訳(メタデータ) (2024-04-11T03:00:00Z) - LiteNeXt: A Novel Lightweight ConvMixer-based Model with Self-embedding Representation Parallel for Medical Image Segmentation [2.0901574458380403]
医用画像分割のための軽量だが効率的な新しいモデル LiteNeXt を提案する。
このモデルは、少量のパラメータ (0.71M) とギガ浮動小数点演算 (0.42) でスクラッチから訓練されている。
Data Science Bowls、GlaS、ISIC2018、PH2、Sunnybrook、Lung X-rayといった公開データセットの実験は有望な結果を示している。
論文 参考訳(メタデータ) (2024-04-04T01:59:19Z) - Bilevel Fast Scene Adaptation for Low-Light Image Enhancement [50.639332885989255]
低照度シーンにおける画像の強調は、コンピュータビジョンにおいて難しいが、広く懸念されている課題である。
主な障害は、異なるシーンにまたがる分散の相違によるモデリングの混乱にある。
上述の潜在対応をモデル化するための双レベルパラダイムを導入する。
エンコーダのシーン非関連な一般化を多様なシーンにもたらすために、双方向学習フレームワークを構築した。
論文 参考訳(メタデータ) (2023-06-02T08:16:21Z) - Multiscale Graph Neural Network Autoencoders for Interpretable
Scientific Machine Learning [0.0]
この研究の目的は、オートエンコーダベースのモデルにおいて、潜在空間解釈可能性と非構造化メッシュとの互換性という2つの制限に対処することである。
これは、複雑な流体流れのアプリケーションのデモを含む、新しいグラフニューラルネットワーク(GNN)自動エンコーディングアーキテクチャの開発によって達成される。
論文 参考訳(メタデータ) (2023-02-13T08:47:11Z) - Exploring and Exploiting Multi-Granularity Representations for Machine
Reading Comprehension [13.191437539419681]
適応的双方向注意カプセルネットワーク(ABA-Net)という新しい手法を提案する。
ABA-Netは、異なるレベルのソース表現を予測子に適応的に活用する。
私たちはSQuAD 1.0データセットに新しい最先端パフォーマンスを設定しました。
論文 参考訳(メタデータ) (2022-08-18T10:14:32Z) - Multi-scale and Cross-scale Contrastive Learning for Semantic
Segmentation [5.281694565226513]
セグメンテーションネットワークによって抽出されたマルチスケール特徴の識別能力を高めるために,コントラスト学習を適用した。
まず、エンコーダのマルチスケール表現を共通の特徴空間にマッピングすることにより、教師付き局所言語制約の新しい形式をインスタンス化する。
論文 参考訳(メタデータ) (2022-03-25T01:24:24Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Rethinking and Improving Natural Language Generation with Layer-Wise
Multi-View Decoding [59.48857453699463]
シーケンシャル・ツー・シーケンス学習では、デコーダは注意機構に依存してエンコーダから情報を効率的に抽出する。
近年の研究では、異なるエンコーダ層からの表現を多様なレベルの情報に利用することが提案されている。
本稿では, 各デコーダ層に対して, グローバルビューとして機能する最後のエンコーダ層からの表現とともに, ソースシーケンスの立体視のために他のエンコーダ層からのデコーダ層からのデコーダ層を補足するレイヤワイド・マルチビューデコーダを提案する。
論文 参考訳(メタデータ) (2020-05-16T20:00:39Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。