論文の概要: Multi-Class Segmentation from Aerial Views using Recursive Noise
Diffusion
- arxiv url: http://arxiv.org/abs/2212.00787v2
- Date: Tue, 4 Apr 2023 19:59:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-06 15:57:21.175400
- Title: Multi-Class Segmentation from Aerial Views using Recursive Noise
Diffusion
- Title(参考訳): 再帰的ノイズ拡散を用いた空中からのマルチクラスセグメンテーション
- Authors: Benedikt Kolbeinsson, Krystian Mikolajczyk
- Abstract要約: 本稿では,エンドツーエンドのセマンティックセマンティックセマンティクス拡散モデルを提案する。
提案手法は,Vayhingen BuildingベンチマークにおけるUAVidデータセットと最先端性能の競合性を実現する。
- 参考スコア(独自算出の注目度): 22.539300644593936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation from aerial views is a crucial task for autonomous
drones, as they rely on precise and accurate segmentation to navigate safely
and efficiently. However, aerial images present unique challenges such as
diverse viewpoints, extreme scale variations, and high scene complexity. In
this paper, we propose an end-to-end multi-class semantic segmentation
diffusion model that addresses these challenges. We introduce recursive
denoising to allow information to propagate through the denoising process, as
well as a hierarchical multi-scale approach that complements the diffusion
process. Our method achieves competitive results on the UAVid dataset and
state-of-the-art performance on the Vaihingen Building segmentation benchmark.
Being the first iteration of this method, it shows great promise for future
improvements.
- Abstract(参考訳): 航空機からのセマンティックセグメンテーションは、安全かつ効率的に移動するために正確かつ正確なセグメンテーションに依存しているため、自律型ドローンにとって重要なタスクである。
しかし、空中画像には、多様な視点、極端なスケールのバリエーション、高いシーンの複雑さなど、独特の課題がある。
本稿では,これらの課題に対処するエンドツーエンドのセマンティックセマンティックセマンティクス拡散モデルを提案する。
本稿では,拡散過程を補完する階層的マルチスケールアプローチと同様に,情報伝達過程を通じて伝達する再帰的デノイジンを導入する。
本手法は,uavidデータセットの競合結果とvaihingenビルセグメンテーションベンチマークの最先端性能を実現する。
このメソッドの最初のイテレーションであるため、将来の改善には大いに期待できます。
関連論文リスト
- DiffVein: A Unified Diffusion Network for Finger Vein Segmentation and
Authentication [50.017055360261665]
DiffVeinは、静脈分割と認証タスクを同時に処理する統合拡散モデルベースのフレームワークである。
これら2つのブランチ間の機能相互作用を改善するために,2つの特別なモジュールを導入する。
このようにして、我々のフレームワークは拡散とセグメンテーションの埋め込みの間の動的相互作用を可能にする。
論文 参考訳(メタデータ) (2024-02-03T06:49:42Z) - SegRefiner: Towards Model-Agnostic Segmentation Refinement with Discrete
Diffusion Process [102.18226145874007]
そこで我々は,異なるセグメンテーションモデルによって生成されるオブジェクトマスクの品質を高めるために,SegRefinerと呼ばれるモデルに依存しないソリューションを提案する。
SegRefinerは粗いマスクを入力として取り、離散拡散プロセスを用いてそれらを洗練する。
さまざまな種類の粗いマスクにわたるセグメンテーションメトリックとバウンダリメトリックの両方を一貫して改善する。
論文 参考訳(メタデータ) (2023-12-19T18:53:47Z) - Single-Image based unsupervised joint segmentation and denoising [6.415833838592684]
単一画像の分割とデノナイズのための教師なし手法を開発した。
データ駆動の手法とは対照的に、我々のモデルはトレーニングデータベースを使わずに、画像を複数の意味のある領域に分割することができる。
論文 参考訳(メタデータ) (2023-09-19T10:47:32Z) - Prompting Diffusion Representations for Cross-Domain Semantic
Segmentation [101.04326113360342]
拡散事前学習は、セマンティックセグメンテーションのための並外れた領域一般化結果を達成する。
本研究では,シーンプロンプトとプロンプトランダム化戦略を導入し,セグメンテーションヘッドを訓練する際に,ドメイン不変情報をさらに混乱させる。
論文 参考訳(メタデータ) (2023-07-05T09:28:25Z) - AerialFormer: Multi-resolution Transformer for Aerial Image Segmentation [7.415370401064414]
AerialFormerは,契約経路におけるトランスフォーマーと,拡張経路における軽量なMD-CNN(Multi-Dilated Conal Neural Networks)を一体化する。
我々のAerialFormerは階層構造として設計されており、Transformerはマルチスケール機能を出力し、MD-CNNはマルチスケールから情報を集約する。
AerialFormerをiSAID、LoveDA、Potsdamの3つの一般的なデータセットでベンチマークしました。
論文 参考訳(メタデータ) (2023-06-12T03:28:18Z) - Denoising Diffusion Semantic Segmentation with Mask Prior Modeling [61.73352242029671]
本稿では,従来の識別的アプローチのセマンティックセグメンテーション品質を,デノナイズ拡散生成モデルでモデル化したマスクを用いて改善することを提案する。
市販セグメンタを用いた先行モデルの評価を行い,ADE20KとCityscapesの実験結果から,本手法が競争力のある定量的性能を実現することを示す。
論文 参考訳(メタデータ) (2023-06-02T17:47:01Z) - Semantics-Aware Dynamic Localization and Refinement for Referring Image
Segmentation [102.25240608024063]
画像の参照は、言語表現からのイメージセグメントを参照する。
そこで我々は,局所化中心からセグメンテーション言語へ移行するアルゴリズムを開発した。
比較すると,本手法はより汎用的で有効である。
論文 参考訳(メタデータ) (2023-03-11T08:42:40Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Label-Efficient Semantic Segmentation with Diffusion Models [27.01899943738203]
拡散モデルは意味的セグメンテーションの道具としても機能することを示した。
特に、いくつかの事前訓練拡散モデルに対して、逆拡散過程のマルコフステップを実行するネットワークからの中間活性化について検討する。
これらのアクティベーションは、入力画像から意味情報を効果的にキャプチャし、セグメンテーション問題に対して優れたピクセルレベルの表現であることを示す。
論文 参考訳(メタデータ) (2021-12-06T15:55:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。