Fugu-MT 論文翻訳(概要): Multi-Class Segmentation from Aerial Views using Recursive Noise Diffusion

論文の概要: Multi-Class Segmentation from Aerial Views using Recursive Noise Diffusion

arxiv url: http://arxiv.org/abs/2212.00787v1
Date: Thu, 1 Dec 2022 18:59:26 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-02 16:30:37.430944
Title: Multi-Class Segmentation from Aerial Views using Recursive Noise Diffusion
Title（参考訳）: 再帰的ノイズ拡散を用いた空中からのマルチクラスセグメンテーション
Authors: Benedikt Kolbeinsson, Krystian Mikolajczyk
Abstract要約: 本稿では,エンドツーエンドのセマンティックセマンティックセマンティクス拡散モデルを提案する。これを、拡散過程を補完する階層的マルチスケールアプローチと組み合わせる。提案手法は,UAVid および Vaihingen ビルのセグメンテーションベンチマーク上での最先端結果を実現する。
参考スコア（独自算出の注目度）: 22.539300644593936
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Semantic segmentation from aerial views is a vital task for autonomous drones as they require precise and accurate segmentation to traverse safely and efficiently. Segmenting images from aerial views is especially challenging as they include diverse view-points, extreme scale variation and high scene complexity. To address this problem, we propose an end-to-end multi-class semantic segmentation diffusion model. We introduce recursive denoising which allows predicted error to propagate through the denoising process. In addition, we combine this with a hierarchical multi-scale approach, complementary to the diffusion process. Our method achieves state-of-the-art results on UAVid and on the Vaihingen building segmentation benchmark.
Abstract（参考訳）: 航空ビューからのセマンティックセグメンテーションは、安全かつ効率的に横断するために正確かつ正確なセグメンテーションを必要とする自律ドローンにとって重要なタスクである。空中ビューからの画像分割は、さまざまなビューポイント、極端なスケールのバリエーション、高いシーンの複雑さを含むため、特に難しい。そこで本研究では,エンドツーエンドのセマンティックセマンティックセマンティクス拡散モデルを提案する。本稿では,予測誤差をデノナイジングプロセスを通じて伝播させる再帰的デノナイジングを提案する。さらに, 拡散過程を補完する階層的マルチスケールアプローチと組み合わせる。提案手法は,UAVid および Vaihingen ビルのセグメンテーションベンチマーク上での最先端結果を実現する。

関連論文リスト

A Gift from the Integration of Discriminative and Diffusion-based Generative Learning: Boundary Refinement Remote Sensing Semantic Segmentation [8.690665954055476]
本稿では,IDGBRフレームワークにおける識別学習と生成学習の統合を提案する。フレームワークはまず、識別バックボーンモデルを用いて粗いセグメンテーションマップを生成する。この地図と原画像とを条件付きガイダンスネットワークに入力し、ガイダンス表現を共同で学習する。
論文参考訳（メタデータ） (2025-07-02T10:47:59Z)
Multi-view Aggregation Network for Dichotomous Image Segmentation [76.75904424539543]
Dichotomous Image (DIS) は近年,高解像度自然画像からの高精度物体分割に向けて出現している。既存の手法は、グローバルなローカライゼーションと局所的な洗練を徐々に完了させるために、退屈な複数のエンコーダ・デコーダストリームとステージに依存している。これに触発されて、我々は多視点オブジェクト認識問題としてdisをモデル化し、擬似多視点アグリゲーションネットワーク(MVANet)を提供する。一般的なdis-5Kデータセットの実験では、我々のMVANetは精度と速度の両方で最先端の手法を大きく上回っている。
論文参考訳（メタデータ） (2024-04-11T03:00:00Z)
SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文参考訳（メタデータ） (2024-03-25T10:30:22Z)
DiffVein: A Unified Diffusion Network for Finger Vein Segmentation and Authentication [50.017055360261665]
DiffVeinは、静脈分割と認証タスクを同時に処理する統合拡散モデルベースのフレームワークである。これら2つのブランチ間の機能相互作用を改善するために,2つの特別なモジュールを導入する。このようにして、我々のフレームワークは拡散とセグメンテーションの埋め込みの間の動的相互作用を可能にする。
論文参考訳（メタデータ） (2024-02-03T06:49:42Z)
SegRefiner: Towards Model-Agnostic Segmentation Refinement with Discrete Diffusion Process [102.18226145874007]
そこで我々は,異なるセグメンテーションモデルによって生成されるオブジェクトマスクの品質を高めるために,SegRefinerと呼ばれるモデルに依存しないソリューションを提案する。 SegRefinerは粗いマスクを入力として取り、離散拡散プロセスを用いてそれらを洗練する。さまざまな種類の粗いマスクにわたるセグメンテーションメトリックとバウンダリメトリックの両方を一貫して改善する。
論文参考訳（メタデータ） (2023-12-19T18:53:47Z)
Denoising Diffusion Semantic Segmentation with Mask Prior Modeling [61.73352242029671]
本稿では,従来の識別的アプローチのセマンティックセグメンテーション品質を,デノナイズ拡散生成モデルでモデル化したマスクを用いて改善することを提案する。市販セグメンタを用いた先行モデルの評価を行い,ADE20KとCityscapesの実験結果から,本手法が競争力のある定量的性能を実現することを示す。
論文参考訳（メタデータ） (2023-06-02T17:47:01Z)
Semantics-Aware Dynamic Localization and Refinement for Referring Image Segmentation [102.25240608024063]
画像の参照は、言語表現からのイメージセグメントを参照する。そこで我々は,局所化中心からセグメンテーション言語へ移行するアルゴリズムを開発した。比較すると,本手法はより汎用的で有効である。
論文参考訳（メタデータ） (2023-03-11T08:42:40Z)
Label-Efficient Semantic Segmentation with Diffusion Models [27.01899943738203]
拡散モデルは意味的セグメンテーションの道具としても機能することを示した。特に、いくつかの事前訓練拡散モデルに対して、逆拡散過程のマルコフステップを実行するネットワークからの中間活性化について検討する。これらのアクティベーションは、入力画像から意味情報を効果的にキャプチャし、セグメンテーション問題に対して優れたピクセルレベルの表現であることを示す。
論文参考訳（メタデータ） (2021-12-06T15:55:30Z)
Contextual Pyramid Attention Network for Building Segmentation in Aerial Imagery [12.241693880896348]
航空画像からの抽出は、都市計画、変更検出、災害管理といった問題にいくつかの応用がある。コンテキストピラミッドアテンション(CPA)を用いた長距離依存関係のキャプチャにより,異なるサイズのセグメンテーションを改善することを提案する。提案手法は,現在の最先端手法よりも1.8点,既存のベースラインよりも12.6点高い1.8点を後処理なしで改善する。
論文参考訳（メタデータ） (2020-04-15T11:36:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。