論文の概要: Multi-Class Segmentation from Aerial Views using Recursive Noise
Diffusion
- arxiv url: http://arxiv.org/abs/2212.00787v1
- Date: Thu, 1 Dec 2022 18:59:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 16:30:37.430944
- Title: Multi-Class Segmentation from Aerial Views using Recursive Noise
Diffusion
- Title(参考訳): 再帰的ノイズ拡散を用いた空中からのマルチクラスセグメンテーション
- Authors: Benedikt Kolbeinsson, Krystian Mikolajczyk
- Abstract要約: 本稿では,エンドツーエンドのセマンティックセマンティックセマンティクス拡散モデルを提案する。
これを、拡散過程を補完する階層的マルチスケールアプローチと組み合わせる。
提案手法は,UAVid および Vaihingen ビルのセグメンテーションベンチマーク上での最先端結果を実現する。
- 参考スコア(独自算出の注目度): 22.539300644593936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation from aerial views is a vital task for autonomous drones
as they require precise and accurate segmentation to traverse safely and
efficiently. Segmenting images from aerial views is especially challenging as
they include diverse view-points, extreme scale variation and high scene
complexity. To address this problem, we propose an end-to-end multi-class
semantic segmentation diffusion model. We introduce recursive denoising which
allows predicted error to propagate through the denoising process. In addition,
we combine this with a hierarchical multi-scale approach, complementary to the
diffusion process. Our method achieves state-of-the-art results on UAVid and on
the Vaihingen building segmentation benchmark.
- Abstract(参考訳): 航空ビューからのセマンティックセグメンテーションは、安全かつ効率的に横断するために正確かつ正確なセグメンテーションを必要とする自律ドローンにとって重要なタスクである。
空中ビューからの画像分割は、さまざまなビューポイント、極端なスケールのバリエーション、高いシーンの複雑さを含むため、特に難しい。
そこで本研究では,エンドツーエンドのセマンティックセマンティックセマンティクス拡散モデルを提案する。
本稿では,予測誤差をデノナイジングプロセスを通じて伝播させる再帰的デノナイジングを提案する。
さらに, 拡散過程を補完する階層的マルチスケールアプローチと組み合わせる。
提案手法は,UAVid および Vaihingen ビルのセグメンテーションベンチマーク上での最先端結果を実現する。
関連論文リスト
- DiffVein: A Unified Diffusion Network for Finger Vein Segmentation and
Authentication [50.017055360261665]
DiffVeinは、静脈分割と認証タスクを同時に処理する統合拡散モデルベースのフレームワークである。
これら2つのブランチ間の機能相互作用を改善するために,2つの特別なモジュールを導入する。
このようにして、我々のフレームワークは拡散とセグメンテーションの埋め込みの間の動的相互作用を可能にする。
論文 参考訳(メタデータ) (2024-02-03T06:49:42Z) - SegRefiner: Towards Model-Agnostic Segmentation Refinement with Discrete
Diffusion Process [102.18226145874007]
そこで我々は,異なるセグメンテーションモデルによって生成されるオブジェクトマスクの品質を高めるために,SegRefinerと呼ばれるモデルに依存しないソリューションを提案する。
SegRefinerは粗いマスクを入力として取り、離散拡散プロセスを用いてそれらを洗練する。
さまざまな種類の粗いマスクにわたるセグメンテーションメトリックとバウンダリメトリックの両方を一貫して改善する。
論文 参考訳(メタデータ) (2023-12-19T18:53:47Z) - Single-Image based unsupervised joint segmentation and denoising [6.415833838592684]
単一画像の分割とデノナイズのための教師なし手法を開発した。
データ駆動の手法とは対照的に、我々のモデルはトレーニングデータベースを使わずに、画像を複数の意味のある領域に分割することができる。
論文 参考訳(メタデータ) (2023-09-19T10:47:32Z) - Prompting Diffusion Representations for Cross-Domain Semantic
Segmentation [101.04326113360342]
拡散事前学習は、セマンティックセグメンテーションのための並外れた領域一般化結果を達成する。
本研究では,シーンプロンプトとプロンプトランダム化戦略を導入し,セグメンテーションヘッドを訓練する際に,ドメイン不変情報をさらに混乱させる。
論文 参考訳(メタデータ) (2023-07-05T09:28:25Z) - AerialFormer: Multi-resolution Transformer for Aerial Image Segmentation [7.415370401064414]
AerialFormerは,契約経路におけるトランスフォーマーと,拡張経路における軽量なMD-CNN(Multi-Dilated Conal Neural Networks)を一体化する。
我々のAerialFormerは階層構造として設計されており、Transformerはマルチスケール機能を出力し、MD-CNNはマルチスケールから情報を集約する。
AerialFormerをiSAID、LoveDA、Potsdamの3つの一般的なデータセットでベンチマークしました。
論文 参考訳(メタデータ) (2023-06-12T03:28:18Z) - Denoising Diffusion Semantic Segmentation with Mask Prior Modeling [61.73352242029671]
本稿では,従来の識別的アプローチのセマンティックセグメンテーション品質を,デノナイズ拡散生成モデルでモデル化したマスクを用いて改善することを提案する。
市販セグメンタを用いた先行モデルの評価を行い,ADE20KとCityscapesの実験結果から,本手法が競争力のある定量的性能を実現することを示す。
論文 参考訳(メタデータ) (2023-06-02T17:47:01Z) - Semantics-Aware Dynamic Localization and Refinement for Referring Image
Segmentation [102.25240608024063]
画像の参照は、言語表現からのイメージセグメントを参照する。
そこで我々は,局所化中心からセグメンテーション言語へ移行するアルゴリズムを開発した。
比較すると,本手法はより汎用的で有効である。
論文 参考訳(メタデータ) (2023-03-11T08:42:40Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Label-Efficient Semantic Segmentation with Diffusion Models [27.01899943738203]
拡散モデルは意味的セグメンテーションの道具としても機能することを示した。
特に、いくつかの事前訓練拡散モデルに対して、逆拡散過程のマルコフステップを実行するネットワークからの中間活性化について検討する。
これらのアクティベーションは、入力画像から意味情報を効果的にキャプチャし、セグメンテーション問題に対して優れたピクセルレベルの表現であることを示す。
論文 参考訳(メタデータ) (2021-12-06T15:55:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。